内镜下息肉分割模型

结合目标检测与多尺度息肉分隔的EMS-Net++,为早期结直肠癌筛查提供AI辅助诊断支持

项目背景

全球现状

结直肠癌是全球第大常见癌症,死亡人数高居第位。

中国现状

我国,结直肠癌每年新发病例接近60万,是仅次于肺癌的第二大癌症。

息肉与癌症关系

95%的结直肠癌是由结直肠腺瘤性息肉引起的。在内镜检查中,腺瘤检出率(ADR)每增加1%,间期结直肠癌的风险就降低3%

然而,目前腺瘤漏检率(AMR)高达26%

数据集

分割数据集

整合三个开源结直肠息肉分割数据集:

  • 总图像数:1762
  • 训练集:Kvasir-SEG (900张) + CVC-ClinicDB (550张)
  • 数据格式:512×512像素,EndoScene和CVC-ClinicDB为PNG格式,Kvasir-SEG为JSON格式

检测数据集

整合三个开源息肉检测数据集:

  • 总图像数:459
  • 训练集:CVC-ColonDB (386张) + ETIS-Larib (30张)
  • 数据格式:统一预处理为576×720像素,图像为JPG格式,标签为TXT格式

多尺度分割网络EMS-Net

EMS-Net采用创新的多尺度架构设计,包含以下核心特征:

五维多尺度信息融合

  • 多尺度训练图片输入
  • 多尺度跳跃连接结构
  • 多尺度残差结构的特征提取器

创新模块设计

  • 感受野模块(Receptive Field Block, RFB):增强特征提取能力
  • 局部上下文注意模块(Local Context Attention, LCA):优化特征表达

结合YOLOv5的EMS-Net++

为了提高息肉检测和分割的准确性,我们将YOLOv5目标检测与EMS-Net分割模型相结合,形成了更强大的EMS-Net++模型:

目标检测

  • 内镜图像传入YOLOv5进行目标检测,并获取识别框的坐标、目标数量
  • 使用1:1的裁剪框进行裁剪,将全部息肉预采集在内

图像裁取

  • 息肉数量=1:以识别框中心为裁取中心,将图像完整裁剪为1:1的正方形图像
  • 息肉数量>1:通过YOLOv5传过来的识别框坐标计算裁剪框坐标,将全部息肉预采集在内

多尺度分割

  • 预处理后的图像传入EMS-Net进行分割
  • 因息肉位置不确定,故不限制裁取框大小的上限!
  • 为保障下一步预处理效果,设置其下限为64×64

性能评估

各模型性能对比

模型 mDice mIoU wFm Sm maxEm MAE
U-Net 0.710 0.627 0.684 0.843 0.876 0.022
U-Net++ 0.707 0.624 0.687 0.839 0.898 0.018
SFA 0.467 0.329 0.341 0.640 0.817 0.065
PraNet 0.871 0.797 0.843 0.925 0.972 0.010
EMS-Net 0.900 0.834 0.885 0.943 0.969 0.006
EMS-Net++ 0.910 0.841 0.884 0.945 0.964 0.009