肠胃病是一种较为普遍的疾病,患者群体较为庞大。消化内镜检查是非常有效的肠胃病早期诊断方式。通过内窥镜的引导,医生可以直观地看见肠胃内部状况。息肉是胃肠道的常见病变,如果不及时治疗,有发展成癌症的风险。不仅需要判断镜下是否有异常情况,还需要通过观察息肉的形态来判断息肉的良恶性,如息肉的外形是否光滑、表面是否存在凹凸不平情况等,这些都是非常关键的信息。因此,对消化内镜图像进行息肉分割是很有必要的。尽管已有众多优秀的息肉分割模型,但分割相关的指标仍有提升空间。由于术区环境复杂,内镜下各组织的形状各异,并且息肉形态不规则,特征不明显,导致难以直观描述息肉的边缘细节,这些不利因素给分割任务带来极大挑战。
课题组提出了一种结合多尺度融合方法和Transformer Block的模型。设计了两种不同的特征图剪枝策略,减少拼接过程中的冗余及误分割的特征图。相关成果以“PPFormer: A Novel Model for Polyp Segmentation in Digestive Endoscopy”为题,发表在高水平学术期刊《IEEE Transactions on Medical Robotics and Bionics》。
本文针对息肉分割任务,采用深度学习方法,搭建了一种深度卷积神经网络PPFormer,该模型由三个核心模块组成:Transformer block、多层感知机和金字塔池化模块。下图展示了本模型的框架结构。首先利用Transformer block对输入进行四次特征提取,将每次特征提取的结果输入至多层感知机中,在非线性处理后恢复成二维数据。将不同层级的特征进行拼接操作,得到提取关键特征后的特征图。然后引入金字塔池化模块,通过对特征图进行金字塔池化,进一步提高模型对上下文信息的获取能力,最后使用双线性插值算法将图像恢复至输入尺寸。
不同分辨率的特征图包含的信息尺度不同,分辨率低的特征图关注图像的全局特征,分辨率高的特征图关注图像细节特征,如下图所示。
在融合特征图时,不同分辨率特征图的通道数相同时会导致特征图冗余现象发生。针对该问题,本文设计了两种特征图剪枝策略,通过合理丢弃低分辨率特征图达到提高分割效率的目的。通过在多个数据集进行消融实验,PPFormer及剪枝策略达到了更高的分割指标。通过对剪枝后的特征图进行热力图分析,可看出改进后的模型在息肉边缘部分产生了更好的分割效果,弥补了原模型的细节分割不佳的缺陷。