西比尔这个名字起源于古希腊的神谕,也被称为西比尔:女性形象,被依赖来传递神对看不见的和无所不能的过去、现在和未来的知识。现在,这个名字被从古代挖掘出来,被赋予了一种用于肺癌风险评估的人工智能工具,该工具由麻省理工学院的阿卜杜勒·拉提夫·贾米尔健康机器学习诊所、马萨诸塞州综合癌症中心(MGCC)和长工纪念医院(CGMH)的研究人员开发。
肺癌是世界上最致命的癌症,在2020年导致全球170万人死亡,死亡人数超过了排在其后的三种最致命癌症的总和。
“这是最大的癌症杀手,因为它相对常见,而且相对难以治疗,尤其是当它达到晚期时。”MGCC胸外科介入放射科医生、这项新工作的合著者弗洛里安·芬特曼说。“在这种情况下,重要的是要知道,如果你早期发现肺癌,长期结果会明显更好。你的5年生存率接近70%,而如果你在晚期发现它,5年生存率略低于10%。”
尽管近年来针对肺癌的新疗法出现了激增,但大多数肺癌患者仍然死于这种疾病。目前,肺低剂量计算机断层扫描(LDCT)是筛查肺癌患者的最常用方法,希望在早期阶段发现肺癌,那时仍可以通过手术切除。Sybil将筛查进一步推进,在没有放射科医生协助的情况下分析LDCT图像数据,预测患者在六年内发展为肺癌的风险。
在他们发表在《临床肿瘤学杂志》上的新论文中,Jameel诊所、MGCC和CGMH的研究人员证明,Sybil在六年内分别从国家肺癌筛查试验(NLST)、麻省总医院(MGH)和CGMH的不同组肺LDCT扫描中获得了0.75、0.81和0.80的c指数——c指数得分超过0.7的模型被认为是良好的,超过0.8的模型被认为是强的。使用Sybil进行一年预测的roc - auc得分更高,从0.86到0.94,其中1.00是可能的最高分。
尽管取得了成功,但肺部CT扫描的3D特性使Sybil成为一个挑战。合著者Peter Mikhael是麻省理工学院电气工程和计算机科学的博士生,也是Jameel诊所和麻省理工学院计算机科学和人工智能实验室(CSAIL)的附属机构,他将这一过程比作“大海捞针”。用于训练西比尔的成像数据基本上没有任何癌症迹象,因为早期肺癌只占肺的一小部分——只是组成每次CT扫描的数十万像素的一小部分。肺组织较密集的部分被称为肺结节,虽然它们有癌变的可能,但大多数不是,可能是由愈合的感染或空气中的刺激物引起的。
为了确保Sybil能够准确地评估癌症风险,Fintelmann和他的团队在没有明显癌症迹象的CT扫描上测试模型之前,将数百个CT扫描标记为可见的癌性肿瘤,这些肿瘤将用于训练Sybil。
麻省理工学院电气工程和计算机科学博士生Jeremy Wohlwend是这篇论文的合著者,也是Jameel诊所和CSAIL附属机构的成员,他对茜比尔的分数如此之高感到惊讶,尽管她没有任何可见的癌症。他回忆道:“我们发现,虽然我们(作为人类)不能很好地看到癌症在哪里,但该模型仍然可以对哪种肺最终会发展成癌症具有一定的预测能力。”“知道(Sybil)能够突出哪一方是最有可能的一方,这对我们来说真的很有趣。”
联合作者Lecia V. Sequist是医学肿瘤学家、肺癌专家,也是MGH早期癌症检测创新中心的主任,他说,该团队用Sybil取得的结果很重要,“因为肺癌筛查在美国或全球尚未充分发挥其潜力,而Sybil可能能够帮助我们弥合这一差距。”
由于多种因素,在美国肺癌最严重的地区,肺癌筛查项目还不发达。这些因素包括对吸烟者的歧视,以及各州不同的医疗补助扩张等政治和政策因素。
此外,如今许多被诊断为肺癌的患者要么从不吸烟,要么是15年前戒烟的烟民——这两种特征使得这两组人都不适合在美国进行肺癌CT筛查。
米哈伊尔说:“我们的培训数据只包括吸烟者,因为这是参加NLST的必要标准。”“在台湾,他们筛查不吸烟的人,所以我们的验证数据预计会包含不吸烟的人,看到Sybil在这一人群中推广得很好,令人兴奋。”
Sequist说:“研究中令人兴奋的下一步将是在不吸烟或几十年前戒烟的肺癌风险人群中对Sybil进行前瞻性测试。”“我每天都在我的肺癌诊所治疗这样的病人,他们很难接受他们本来就不是接受筛查的候选人。也许将来这种情况会改变。”
有越来越多的肺癌患者被归类为非吸烟者。不吸烟的女性比不吸烟的男性更容易被诊断出肺癌。在全球范围内,被诊断患有肺癌的女性中,超过50%的人不吸烟,而男性中这一比例为15%至20%。
麻省理工学院教授Regina Barzilay是论文的合著者,也是Jameel诊所人工智能教师的负责人,也是科赫综合癌症研究所的成员,她将麻省理工学院和MGH在Sybil上的共同努力归功于西尔维娅,西尔维娅是Barzilay的一位密友的妹妹,也是Sequist的患者之一。“西尔维娅年轻、健康、爱运动——她从不吸烟,”巴兹莱回忆道。“当她开始咳嗽时,医生和家人最初都没有怀疑她可能是肺癌。当西尔维娅最终被诊断出来并见到塞奎斯特医生时,她的病情已经严重到无法恢复正常。在哀悼西尔维娅的去世时,我们不禁想到还有多少病人有着类似的轨迹。”
这项工作得到了桥梁项目的支持,该项目由麻省理工学院科赫研究所和达纳-法伯/哈佛癌症中心合作开展;麻省理工学院贾米尔诊所;广达电脑;勇敢面对癌症;MGH早期癌症检测创新中心;布拉劳尔家族和兰德里家族;晚期肺癌;以及麻省理工学院和哈佛大学布罗德研究所的埃里克和温迪·施密特中心。长庚医学基金会林口CGMH癌症中心提供数据收集协助,杨瑞阳、宋俊及其团队(广达计算机公司)为CGMH数据集分析提供技术和计算支持。作者感谢国家癌症研究所访问国家肺癌筛查试验收集的NCI数据,以及参与该试验的患者。
注:本文由院校官方新闻直译,仅供参考,不代表指南者留学态度观点。