0-Diffusion-empowered AutoPrompt MedSAM

扩散赋能的 AutoPrompt MedSAM

TITLE

arXiv:2502.06817v1 [eess.IV] 2025 年 2 月 5 日

Code is available at https://github.com/HP-ML/AutoPromptMedSAM.git.

背景

MedSAM 目前还存在两大挑战限制:一是依赖劳动密集型的人工提示;二是生成的器官或病变掩码缺乏语义标记,限制非专家用户的实用性。

为解决这些问题,本文作者提出 AutoMedSAM,一个基于 SAM 的端到端框架,提升可用性和分割性能。AutoMedSAM 保留 MedSAM 的图像编码器和掩码解码器,同时引入基于扩散的类提示编码器,其双解码器结构结合稀疏和密集提示协同生成提示嵌入,从而增强模型对临床图像的自主理解与处理能力。借助该编码器,AutoMedSAM 通过类提示将语义信息融入预测,使 MedSAM 的半自动管道转变为全自动化工作流程。

AutoMedSAM 采用不确定性感知联合优化策略,在继承 MedSAM 预训练知识的同时,集成多个损失函数以提升泛化能力。实验结果表明,AutoMedSAM 在不同数据集上表现卓越,并拓展了其在临床环境和非专家用户中的适用性。

实验方法

实验结果

总结