《柳叶刀·数字健康》：何建行教授团队联合清华大学及多中心发表首个泛纵隔肿瘤人工智能诊断模型

2023-08-24 17:36:06来源：南山呼吸阅读：219次

研究亮点

1、联合国内24家医院，建立了目前最大的多中心纵隔肿瘤影像数据库，共计8000余例，超过40种（包括罕见类型）的各类纵隔肿瘤。

2、联合清华大学，构建了国际首个泛纵隔肿瘤检测诊断模型CAIMEN。模型检测正确的一致性（AUROC）超过97%。在CAIMEN的辅助下，人类专家对纵隔肿瘤的top-1 诊断准确率提高了 19·1%，top-3诊断准确率提高了13·0%。

3、医工结合，创新性地提出了“多视角融合的检测分割算法”、“ 二元决策树分类算法”、“增强CT迁移学习”等实体瘤影像数据训练方法，提高了肿瘤分割及分类模型的精确性，为实体瘤的AI诊断研究提供了创新方法。

近日，由广州医科大学附属第一医院国家呼吸医学中心主任何建行教授团队牵头，联合清华大学，天河二号超算中心及全国24家医院共同合作开发，运用跨学科多中心人工智能方法，在国际上首次构建了基于胸部CT的泛纵隔肿瘤检测及诊断模型。该研究成果“Pan-mediastinal neoplasm diagnosis via nationwide federated learning: a multicentre cohort study”已在国际顶级学术期刊The Lancet Digital Health （柳叶刀·数字健康，影响因子30.8)正式发表。主要共同完成单位及研究者为：

广州医科大学附属第一医院国家呼吸医学中心：何建行教授、梁恒瑞博士；清华大学脑与认知科学研究院：戴琼海院士、徐枫副教授、郭雨晨副研究员、唐瑞杰博士；上海交通大学附属胸科医院：李志刚教授、刘智超博士；浙江大学医学院附属第一医院：林旭博士。

图片1副本.png

图1 研究题目及作者

研究背景

纵隔肿瘤是典型的一组胸部疾病，近年来随着肺部CT筛查的普及，发病率不断增加，某些恶性纵隔肿瘤的预后极差，早发现及准确的诊断至关重要。但是在临床实践中，纵隔复杂的解剖结构，纵隔肿瘤繁多的病理类型，以及单中心相对较低的病例数严重阻碍了肿瘤的早期发现，准确诊断，以及大数据研究。

为了解决这些困难，团队在隐私保护的联邦学习的基础上组织全国多中心跨学科的合作，开发了基于胸部CT的高效人工智能（AI）泛纵隔肿瘤诊断系统CAIMEN。

研究设计

1、临床队列

研究者从国内15个省，共计24个中心回顾性收集了跨度2010年1月1日到2020年10月31日的7825例纵隔肿瘤以及796例健康对照。其中15个中心数据用于模型开发和内部测试，5个中心数据用于模型泛化性能的外部测试，另外4个中心数据用于比较CAIMEN 和人类专家的疾病诊断能力。

图片2副本.png

图2 研究人群及联邦学习设计

2、模型设计及开发

在具体的模型构建方面，研究者提出增强和平扫CT之间的迁移学习（Transfer Learning），通过将增强CT上训练的模型参数迁移至平扫CT，提升基于单纯平扫CT最终模型的检测分割效果，更加符合真实世界需求；同时，研究者设计了多视角融合的检测分割算法（Multiview fusion framework），从三个视角切面进行检测分割后融合结果，显著提高纵隔肿瘤病灶检测、分割的准确性；最后，研究者提出了数据驱动为导向的二元决策树分类算法（Binary classifification decision tree），有机地结合了医学影像信息以及既往获得的医学先验知识，增加图像分类的准确性。

图片3副本.png

图3 研究算法设计

研究结果

1、CAIMEN的纵隔肿瘤检测能力

CAIMEN 对于纵隔肿瘤检测准确度较高，在内部测试集中，对纵隔肿瘤的检测正确的一致性（AUROC）为0·988 (95% CI 0·983–0·993)，灵敏度为0·997 (0·989–1·000)，特异性为0·817（0·779–0·855）。在外部测试集上，CAIMEN 的平均AUROC为0·973 (0·969–0·977)。

图片4.png

图4 CAIMEN的纵隔肿瘤检测表现

值得一提的是，研究者使用了美国NLST队列的影像数据集用来评估CAIMEN的跨种族检测能力。在该数据集中，被诊断为“正常”的13例CT中，CAIMEN检测出了影像学专家确认存在的纵隔肿瘤。这一方面说明了即使在发达国家的真实世界诊疗过程中，纵隔肿瘤仍然存在“漏诊”情况，另一方面说明，CAIMEN可以潜在减少漏诊的可能性。

图片5副本.png

图5 CAIMEN检测出NLST数据集中漏诊的纵隔肿瘤

2、CAIMEN的纵隔肿瘤诊断能力

CAIMEN 对12 种常见的纵隔肿瘤具有良好的区分能力。在外部验证队列中，与人类专家相比，CAIMEN 诊断的平均 top-1 准确率相比人类专家提高了 44·9%（人类专家为0·345，而CAIMEN为 0·500），平均 top-3 准确率提高 46·8%（人类专家为0·545，而CAIMEN为0·800）。

在CAIMEN的辅助下，人类专家的平均 top-1 准确率提高了 19·1%（无辅助时为0·345，有辅助时为 0·411） top-3 准确率提高了13·0%（无辅助时为 0·545，有辅助时为 0·616）。对于良性肿块和恶性肿瘤分类，CAIMEN具有相当12.7年经验人类专家的区分能力。

图6 CAIMEN与人类专家的能力比较

总结

近年来，纵隔肿瘤诊断的挑战引起了医生和研究人员的更多关注。研究团队开发的CAIMEN，拥有高准确性和稳健性，可以为全球不同国家和地区的放射科医生和胸外科医生精确诊断纵隔肿瘤提供有用的帮助。

值得一提的是，跨学科合作研究在解决现代医学问题上显得越来越重要，尤其是今年来人工智能学科的爆发性突破，在改善人类健康方面可能起到巨大的作用。在这中间，临床医学科学家和数据科学家的精诚合作是推动相关研究的关键，何建行教授领衔的国家呼吸医学中心胸外科团队和戴琼海院士领衔的清华大学软件工程团队从2020年合作至今，在新冠防治、全肺疾病AI诊断、泛纵隔肿瘤AI诊断以及胸外科手术等多个领域产生多项创新的成果。两个专家团队各发挥所长，合作默契，在数字智能呼吸健康方面做出了一定的贡献。

参考文献：

Tang R, Liang H, Guo Y, et al. Pan-mediastinal neoplasm diagnosis via nationwide federated learning: a multicentre cohort study. Lancet Digit Health 2023; published online Aug 23.