语言 ▾
中文EN

利用鼻内窥镜和 T2 加权磁共振成像预测鼻窦倒置乳头状瘤相关鳞状细胞癌的深度学习:一项探索性研究

发布时间:  2025-08-04 14:52:34


2025年7月21日,任继良等人在《Eur Radiol Exp》杂志上发表了一篇题为《Deep learning using nasal endoscopy and T2-weighted MRI for prediction of sinonasal inverted papilloma-associated squamous cell carcinoma: an exploratory study》的文章。本研究旨在探索深度学习(DL)结合鼻内窥镜和T2加权磁共振成像(T2W-MRI)在自动分割肿瘤及区分鼻窦鼻倒状瘤(SIP)与其恶性转化的鳞状细胞癌(SIP-SCC)中的应用价值。





一、研究背景




SIP是鼻腔和鼻窦最常见的良性肿瘤,但有恶变为SIP-SCC的风险,后者治疗方式更复杂且预后较差。术前准确识别SIP-SCC对制定治疗方案至关重要,但目前的标准诊断方法——术前穿刺活检存在准确性低、采样误差及侵入性等缺点。鼻内窥镜和MRI是常用的诊断工具,分别提供肿瘤表面特征和内部结构的互补信息,但人工评估易受主观经验限制。尽管已有研究利用DL分析单一模态图像,但尚未有研究整合两种模态以实现SIP-SCC的自动化预测。因此,本研究通过开发一种双模态DL模型,旨在为临床提供一种高效、自动化的预测工具,辅助医生进行更准确的术前诊断和决策。





二、数据来源




本研究的数据来源于复旦大学附属眼耳鼻喉科医院2019年12月至2023年4月期间收治的SIP患者。经过纳排筛选后,最终纳入174例患者进行研究。所有入组患者均满足两个关键标准:一是经手术切除并获得病理确诊,二是在影像检查前未接受任何治疗。这些患者被随机分为训练队列(121例,含97例SIP和24例SIP-SCC)和测试队列(53例,含43例SIP和10例SIP-SCC),两组在年龄、性别和病理类型等基线特征上无显著差异。






三、研究方法




在数据预处理阶段,研究团队对MRI和鼻内窥镜图像分别进行了标注。MRI图像由两名头颈部影像诊断经验的放射科医师使ITK-SNAP软件逐层勾画肿瘤轮廓,若存在分歧则由资深放射科医师仲裁。鼻内窥镜图像由耳鼻喉科医师从每位患者的四张图像中选择最具代表性的一张(标准为肿瘤暴露最清晰、干扰因素最少),并使用Labelme软件进行标注,随后由另一名医师复核。此外,一名耳鼻喉科医师随机抽取40例患者的图像评估标注一致性(kappa值=0.886)。在模型构建方面,研究针对不同模态采用了不同的分割模型:鼻内窥镜图像使用UNet、DeepLabV3_ResNet101和FCN_ResNet101,T2W-MRI图像使用UNet、UNETR和VNet。训练时采用DiceCE混合损失函数,并通过在线数据增强提升泛化能力。MRI图像预处理包括归一化至RAS坐标系、重采样至1 mm³分辨率,以及强度标准化。分类阶段采用预训练的DenseNet121网络,输入为手动标注或自动分割的肿瘤区域(MRI仅分析最大层面,内窥镜图像保留肿瘤外扩5像素的最小外接矩形)。训练时使用合成少数类过采样技术(SMOTE)平衡数据,并通过Z-score标准化消除强度差异。最终,内窥镜和MRI的DL预测分数通过逻辑回归整合为双模态列线图,并采用梯度加权类激活映射(Grad-CAM)生成注意力热图以增强可解释性。性能评估方面,两名放射科医师独立诊断MRI图像,一周后在DL列线图辅助下重新评估。模型性能通过AUROC(受试者工作特征曲线下面积)等指标衡量,并与医师诊断结果对比(DeLong检验)。(图2)






四、结果




1. 基线特征


该研究涉及训练队列(n = 121)和测试队列(n = 53)。培训队列包括97次SIP和24个SIP-SCC,而测试队列由43个SIP和10个SIP-SCC组成。在队列之间没有发现年龄,性别或病理分类的统计学上显着差异(所有P≥0.230)。(表1)


2. 自动化细分的DL性能


对于内窥镜图像的自动分割,FCN_RESNET101模型的性能最高,在训练队列中达到0.94±0.05,MIOU为0.89±0.08,分别为0.95±0.03和0.95±0.03和0.90±0.06。在T2W-MRI图像分割中,VNET模型的表现优于其他模型,在训练队列中,DSC和MIOU值为0.91±0.10,0.86±0.10,在测试队列中为0.93±0.02和0.88±0.03。(表2)


3. DL的性能预测SIP-SCC


采用人工标注时,内窥镜模型和T2加权MRI模型在训练队列中的AUROC值分别为0.894和0.853,在测试队列中分别为0.628和0.820;而采用自动分割时,这两个模型在训练队列中的AUROC值分别为0.866和0.869,在测试队列中则为0.674和0.835。测试队列中,基于人工标注与自动分割的深度学习模型在AUROC值上均无显著差异(p值分别为0.369和0.841)。在评估两位耳鼻喉科医师对内窥镜图像选择的一致性时,发现两者具有几乎完美的一致性(K值为0.886)。内窥镜和T2加权MRI模型的性能数据汇总于表3,相应的曲线展示在图3中。(图3、表3)



4. DL模型在辅助诊断中的性能


基于自动分割,将来自内窥镜检查和T2W-MRI模型的DL评分组合起来构建双模式列线图(图4)。该列线图展示了最佳的预测性能,训练队列和测试队列的AUROC分别为0.938和0.865。放射科住院医师和主治放射科医生在培训队列中的AUROC分别为0.631和0.704,在测试队列中的AUROC分别为0.672和0.707。测试队列中,DL列线图与放射科住院医师和主治放射科医生之间的AUROC差异趋于显着(分别为p = 0.071和0.066),而当两位医生都使用DL列线图时,没有观察到显着差异(p = 0.218和0.476)。


在DL列线图的帮助下,两位放射科医生都提高了他们的诊断性能,培训队列中的AUROC分别为0.745和0.813,测试队列中的AUROC分别为0.734和0.834。值得注意的是,根据Delong测试,当将独立工作的放射科医生与使用DL辅助的放射科医生进行比较时,某些AUROC观察到显着差异。DL列线图图和两名放射科医生的表现详情见表4。DL列线图和两名放射科医生的ROC曲线如图5a、e所示,基于Delong测试结果的热图如图5 b、f所示。DL列线图表现出良好的校准,在两个队列中产生不显着的结果(p = 0.887和0.599)。(图5c,g)。



决策曲线分析表明,在两个队列中,在合理的阈值概率范围内,DL列线图提供了比两种单模式和两名放射科医生更高的总体净效益(图5d,h)。使用自动化DL框架准确诊断的代表性病例如图6所示。






五、总结




研究开发的DL框架整合了内窥镜和T2加权MRI,能够自动分割肿瘤并预测SIP-SCC。双模态DL列线图在训练和测试队列中均表现出较高的预测性能(AUROC分别为0.938和0.865),可辅助医师提高诊断准确性。这是首个整合内窥镜和MRI数据的全自动SIP-SCC预测研究,具有临床应用的潜力。未来需扩大样本量并优化模型以进一步提升性能。



上一篇:剖宫产止血效果研究 去甲肾上腺素表现优于苯肾上腺素

下一篇:07.28-08.03 临床预测模型研究顶刊快报



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号