接上篇:
AAPM年会上举办的一届胸部肿瘤危及器官自动分割挑战赛(上)
3.结果
3.A、在分割中评估者间的变化
TableII总结了三个评估者在不同结构的三个训练案例上的评估者间差异。这些数字用作参考指标分数归一化。评估者之间的质量差异如Fig.2所示。
3.B、挑战赛结果
Fig.3总结了通过这7种方法获得的总分。通过对所有指标,所有结构和所有患者的标准化得分进行平均来计算总得分,如第2.B节“得分标准化”小节中所述。
Figs.4,5,6,7和TableIII总结了每个器官,度量标准和在线挑战方法的分割结果。通常,深度学习方法优于基于多图集的方法。不同的方法,即深度学习或基于图集的方法,对大型结构(如肺)的分割在生成方面的表现几乎没有差别;对于较窄、较长、软组织对比较差的结构,如食道,表现差异较大。有趣的是,这两种多图谱方法(方法4和方法6)略胜于方法5和方法7,5和7这两种方法都是用于分割食道的深度学习算法。图8显示了每种方法生成的分割示例。还显示了通过这些方法分割各种结构所获得的总体得分。从图8可以看出,根据评估的图像不同,方法的性能也不同。例如,在病例LCTSC-Test-S2-的情况下,右肺边缘存在大量肿瘤负担。在这种情况下,所有方法对于该器官的表现都异常差,突出了这种自动轮廓法对肿瘤治疗的影响。
这些方法的离线性能类似于其在线性能,其中深度学习方法优于基于多图集的方法(方法7中基于切片的U-net除外)。详细结果在补充文件(ChallengeResults.xlsx