0-LeSAM: Adapt Segment Anything Model for Medical Lesion Segmentation

LeSAM:将 Segment Anything 模型应用于医学损伤分割

LeSAM

IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS, VOL. 28, NO. 10, OCTOBER 2024

背景

病变分割在医学图像分析中至关重要,但由于医学图像的复杂性和多样性,准确分割具有挑战性。现有深度学习算法受限于训练数据和模型特异性,难以通用。SAM 在自然图像分割表现出色,但直接用于医学图像分割时,因医学与自然图像领域差异,对不规则形状和低对比度病变分割效果不佳。已有研究尝试将 SAM 应用于医学图像,主要集中于器官分割,对病变分割关注较少,且依赖大量标注数据,未充分利用浅层特征。

  • 提出 LeSAM,通过简单有效的策略将 SAM 适配于医学病变分割,提高其在不同成像模态下的病变分割性能。
  • 开发特定于医学的图像编码器和任务特定的掩码解码器,融入医学领域知识,改善病变边界描绘。
  • 通过全面实验验证方法在多种病变分割任务中的有效性和泛化能力。

实验方法

LeSAM 概述

LeSAM 保留 SAM 大部分结构,在原始图像编码器的每个变压器块中插入适配器模块,将提示编码器设为框模式,修改掩码解码器为 U 形结构。冻结原始图像编码器参数,使适配器模块、提示编码器和掩码解码器可训练。

LeSAM

提出的 LeSAM 的架构。将适配器模块整合到每个 transformer 模块中,以集成特定任务的知识,并修改掩码解码器以改善与病变边界的对齐。原始图像编码器的参数被冻结,而适配器模块、提示编码器和掩码解码器被设置为可调。掩码解码器的中间特征图直观地显示在底部。

特定医学图像编码器

在原始图像编码器的每个变压器块中加入适配器模块,由下投影线性层、GeLU 激活和上投影线性层组成,引入医学特定知识,优化图像特征。(a)

子块的架构

方法中采用的子块的架构。

任务特定掩码解码器

将掩码解码器设计为 U 形架构,利用卷积和上卷积操作处理不同分辨率的图像特征,通过融合和解码操作生成预测掩码,增强对不规则病变边界的描绘能力。(b)(c)(d)

渐进式训练策略

采用渐进式学习策略,先使用自监督预训练(MAE)结合无标签医学数据(RadImageNet)训练适配器模块,再用特定任务数据集训练适配器和其他可训练组件,使用 Dice 损失和交叉熵损失之和进行优化。

实验结果

image-20241130171925470

医学和自然的图像特征的流形。

在多个公共数据集上进行实验,涵盖不同模态和病变类型的医学图像。对图像强度值进行裁剪和归一化处理,将 3D 图像切片为 2D 图像,并生成框提示和随机扰动。

基于 Python、PyTorch 和 MONAI 库实现模型,使用 NVIDIA RTX 4090 GPU 训练。采用 AdamW 优化器和线性调度器,训练 50 个 epoch,初始学习率为 1e - 4。评估指标包括 DSC、IoU(用于 2D 图像)和 95HD、NSD(用于 3D 图像)。

分割性能

实验结果

在 MSD 的五个 CT 肿瘤数据集上训练评估 LeSAM,与多种方法对比,LeSAM 在四个数据集上达到 SOTA,平均结果最优,能更好地描绘病变边界,但在肝肿瘤分割中仍有提升空间。

泛化能力评估

在不同模态和病变的数据集上评估 LeSAM 的泛化能力,与其他方法对比,LeSAM 在 7 个分割任务中的 4 个达到 SOTA,在其余 3 个任务中排名第二,证明其作为通用病变分割方法的有效性。

定性结果

通过可视化比较,LeSAM 在准确描绘肿瘤边界方面优于其他方法,有效缓解了过分割问题,改进了分割效果。

消融实验

适配器模块显著提高了 DSC 和 NSD 值;修改后的掩码解码器进一步提升了分割性能,尤其在 NSD 值上提升明显,可视化结果也证明其对肿瘤边界描绘的改进。

消融实验

基于 KiTS19 的消融研究结果显示相应的平均 DSC 和 NSD 值。

总结

渐进式学习策略促进模型收敛;框提示的扰动会影响分割性能,大肿瘤相对更鲁棒,小肿瘤更敏感;模型在提示不足和低对比度病变情况下可能失败;LeSAM 性能依赖手动绘制框提示的准确性。

提出的 LeSAM 通过参数高效的适配技术和掩码解码器修改,显著提升了 SAM 在医学病变分割中的性能,在多种病变分割任务中取得优异结果,证明了适配 SAM 用于医学图像分割的临床意义。