语言 ▾
中文EN

应用机器学习预测老年患者结肠镜检查的肠道准备充分性:基于Web的预测工具的开发和验证

发布时间:  2025-03-27 10:04:24



2025年3月11日,Liu等人在《Ann Med》杂志上发表了一篇题为《Applying machine learning to predict bowel preparation adequacy in elderly patients for colonoscopy: development and validation of a web-based prediction tool》的文章。该文献旨在开发并验证了一个机器学习模型,用于预测老年患者在结肠镜检查前的肠道准备充分性。


研究背景

结直肠癌是全球第四大致死癌症,每年导致约90万人死亡,且发病率持续上升。结肠镜检查是早期筛查和肿瘤切除的关键手段,而肠道准备充分性直接影响检查效果。研究表明,10%-25%的患者存在肠道准备不足,老年患者比例更高达34.6%。准备不足可能导致腺瘤漏诊、诊断准确性下降、重复操作及医疗资源浪费。老年患者因生理变化和合并症更易出现肠道准备失败,但现有预测模型在老年群体中的准确性有限。因此,本研究旨在开发一种基于机器学习的预测工具,以识别高风险患者并指导早期干预。



数据来源

研究数据来自复旦大学附属中山医院厦门医院消化内科2023年2月至2023年12月接受结肠镜检查的老年患者471例,以及2024年3月至2024年6月的独立队列221例。纳入标准为:年龄≥60岁、接受结肠镜检查或结直肠手术、采用3L聚乙二醇溶液进行肠道准备。排除标准包括:未完成3L聚乙二醇摄入、因非准备因素(如肠道肿瘤或狭窄)导致检查不完整、合并严重心血管/肺/肾疾病或认知障碍。数据通过电子病历系统和护理评估系统收集,经双人核对后整合,无缺失值。



研究方法

对23年的数据集按7:3的比例随机划分为训练集与测试集。对训练集采用Boruta算法进行特征选择,筛选出7个关键预测因子,对其建立和比较逻辑回归(LR)、支持向量机(SVM)、决策树(DT)、随机森林(RF)、极端梯度提升(XGBoost)和轻量梯度提升机(LightGBM)等模型的性能。绘制相应的受试者作员特征(ROC)、曲线和精度-召回(PR)曲线,模型评估指标包括AUC、准确率、灵敏度、特异性、阳性预测值(PPV)、阴性预测值(NPV)和F1分数。最终确定出最佳模型并对其进行超参数调优,再对测试集通过1000次Boostrap进行内部验证。外部验证使用独立队列数据。SHAP算法用于解释模型特征重要性,并基于Streamlit框架开发了交互式网页应用,以提升临床实用性。



结果

1. 基线特征


471例患者中,中位年龄66岁(IQR:63-71),50.32%为男性,76.86%肠道准备充分。高血压(37.58%)和糖尿病(20.17%)是最常见的合并症,77.07%采用分剂量方案,63.69%在院内完成肠道准备。训练集(329例)与验证集(142例)在年龄、性别、BMI、合并症等基线特征上无显著差异(表1)。92.14%的患者末次排便为清液,81.95%日常活动频繁行走,44.80%教育水平为小学或以下(表1)。


2. 特征选择与重要性


通过Boruta算法筛选出7个关键预测因子:分剂量方案、院内准备、教育水平、钙通道阻滞剂(CCB)使用、排便状态、活动水平、末次排便为清液(图2)。特征赋值如表2所示,例如分剂量方案(是=1,否=0)和排便状态(正常=1,腹泻=2,便秘=3)。



3. 模型性能比较


在训练集中,决策树模型的AUC最高,为0.968(95%CI:0.948-0.988)。在测试集中,SVM模型的AUC最高,为0.895(95% CI: 0.822-0.969)(图3a)。在森林图中,SVM模型表现最好,AUC为0.895,标准误差为0.005(图3b)。决策曲线分析(DCA)表明,SVM在低决策阈值下净收益最高(图3c)。此外,SVM模型在训练集与测试集中都显示出高平均精度(AP分别为0.853和0.821)(图3d)。对于其他性能指标,如图3所示,XGB模型的灵敏度最高(0.766),而SVM模型的准确性最高(0.889)、特异性(0.932)和F1评分(0.752)。



为了评估特征选择对模型性能的影响,使用所有特征以及按Boruta特征重要性排名的前7、10、13、16和19个特征构建了多个模型。结果表明,SVM模型在所有特征集中始终保持最佳预测性能(图4)。值得注意的是,当使用Boruta选择的前7个特征时,SVM模型表现出强大的性能,仅次于由前13个特征构建的模型(ΔAUC= 0.018,p = 0.985)。


总之,尽管Delong检验显示SVM模型与其他模型之间的AUC没有统计学上的显著差异(表4),但SVM模型在不同特征集上始终表现出稳定和卓越的性能。值得注意的是,它在多个关键指标上的一致表现凸显了其在预测肠道准备失败方面的可靠性和实用价值。


4. 外部验证与稳健性


在独立外部验证队列(n=221)中,SVM模型AUC为0.889,与内部验证结果一致。排除“末次排便为清液”后,模型AUC仍为0.803,表明其适应性强,适用于未启动肠道准备的患者。

5. 模型选择和外部验证


为了平衡预测简单性和模型性能,使用Boruta算法确定的七个关键特征构建了老年患者肠道准备失败的最终预测模型,并使用SVM方法实现。在独立数据集上对该模型进行外部验证,AUC为0.889,表明具有出色的预测性能。研究结果表明,最终的SVM模型不仅在外部验证中表现良好,而且即使在排除关键特征后也能保持可靠的准确性,凸显了其对更广泛临床应用的适应性。

6. 模型解释


为了提高模型的透明度和可解释性,利用SHAP算法来阐明模型的输出。图5a和b说明了特征重要性的排名,反映了每个特征对模型输出的平均影响。很明显,“排便状态”和“最后一次排便是清澈液体”是影响预测的两个最有影响力的特征,紧随其后的是“活动水平”、“教育”和“CCB”(使用钙通道阻滞剂)。这些特征在模型的决策过程中起着至关重要的作用。局部解释侧重于特征对单个样品的影响,如图5c所示。在图中,红色条和蓝色条分别表示增加和减少预测值的特征。(图5)




总结

本研究成功开发了一个基于SVM可解释的机器学习模型,用于预测老年患者在结肠镜检查前肠道准备的充分性,并创建了相应的Web应用程序。通过将该模型应用于临床环境,有望准确识别准备失败风险高的患者并实现早期干预,从而大大提高老年患者肠道准备的成功率并降低医疗成本。




上一篇:03.17-03.23 临床预测模型研究顶刊快报

下一篇:基于中国CHARLS数据库的老年人跌倒风险预测模型



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号