发布时间: 2025-09-22 16:56:05
2025年9月5日,《J Multidiscip Healthc》杂志上发表了一篇题为《Predicting 28-Day Mortality in Critically Ill Patients Receiving Continuous Renal Replacement Therapy: A Novel Interpretable Machine Learning Approach》的文章。本研究旨在开发和验证一种可解释的机器学习(ML)模型,以预测接受连续肾脏替代治疗(CRRT)的危重患者28天全因死亡率,促进早期风险分层和临床决策。
▼▼▼▼▼▼▼▼
一、研究背景
CRRT是重症患者常用的挽救生命的治疗方式,不仅用于急性肾损伤(AKI),还广泛应用于中毒、脓毒症、急性胰腺炎等非肾脏疾病。尽管CRRT能显著改善患者预后,但其死亡率仍高达30%–70%,因此早期识别高危患者并实施干预至关重要。以往研究多局限于AKI患者,且缺乏外部验证和模型可解释性。随着人工智能技术的发展,机器学习在临床预测中展现出优势,但其“黑箱”特性限制了临床应用。本研究旨在构建一个可解释的ML模型,预测接受CRRT的所有重症患者28天全因死亡率,并通过SHAP方法提供模型解释,以辅助临床决策。
二、数据来源
训练队列的数据来源于来自美国MIMIC-IV数据库(v2.0)中2008–2019年间接受CRRT的1224例患者。纳入标准为接受CRRT的患者。排除标准为:1)年龄小于18岁或大于89岁;2)多次住院或ICU入院;3)住院时间少于48小时。训练队列按8:2比例划分为训练集和内部验证集,并采用5折交叉验证。外部验证队列来自河北医科大学第四医院重症医学科2020年1月至2021年12月期间收治138例CRRT患者。患者入组流程图见图1。
三、研究方法
本研究采用SQL语言通过Navicat软件从MIMIC数据库中提取数据。对缺失值超过30%的变量予以剔除,对缺失较少的变量采用K近邻(KNN)法插补。异常值采用封顶法处理,将低于1%分位数和高于99%分位数的值分别替换为相应分位数值,并剔除零方差或近零方差变量及处理多重共线性问题。特征工程采用三种机器学习算法:LASSO(最小绝对收缩和选择算子)回归用于线性稀疏和模型简化,SVM-RFE(支持向量机递归特征消除)用于捕捉非线性关系,Boruta算法通过比较真实特征与随机阴影变量以确定统计显著性,最终选取三种方法共同选定的特征。模型构建采用九种机器学习算法(包括GP(高斯过程)、GBM(梯度提升机)、XGBoost(极限梯度提升)等),通过网格搜索和10折交叉验证调优超参数,并以受试者工作特征曲线下面积(AUC)为主要指标在内部验证集中选择最佳模型,同时通过决策曲线分析(DCA)及其他性能指标(如准确率、敏感度等)评估模型临床效用。为提高模型可解释性,采用基于博弈论的SHAP方法进行全局和局部解释。为便于临床使用,最终模型将以网页计算器形式呈现。
四、结果
1.基线特征
单因素分析结果显示(表1),生存组与非生存组在多方面存在显著差异。非生存组患者年龄稍大,慢性肾脏病(CKD)、2型糖尿病、脓毒症、脓毒性休克、心脏骤停及急性肾损伤(AKI)的患病率更高。实验室指标如乳酸、pH、氧合指数、血小板计数、白细胞计数、国际标准化比值(INR)、凝血酶原时间(PT)、部分凝血活酶时间(PTT)、天门冬氨酸氨基转移酶(AST)和总胆红素也存在显著差异。此外,非生存组的序贯器官衰竭评估(SOFA)和急性生理学评估III(APIII)评分均显著高于生存组。
2.特征筛选
本研究采用三种机器学习方法进行特征筛选,并取其交集。LASSO回归筛选出40个显著特征(图2A、2B)。SVM-RFE选出前30个重要特征,Boruta算法筛选出22个显著特征(图2C)。通过维恩图取三者交集,共得15个特征(图2D)。鉴于最大红细胞分布宽度(RDW)比最小RDW更重要、凝血酶原时间(PT)比国际标准化比值(INR)更具显著性,最终剔除INR和最小RDW,保留13个特征用于建模。
3.模型性能比较
研究采用九种机器学习(ML)方法构建模型,并通过网格搜索优化超参数。基于受试者工作特征曲线下面积(AUC)比较,高斯过程(GP)模型在训练集(AUC=0.841)和内部验证集(AUC=0.794)中均表现最佳,优于其他ML模型及传统评分系统。其他评估指标(表2、表3)和决策曲线分析(DCA,图3C、D)同样显示GP模型具有最高的预测性能和临床净收益,尽管其在内部验证集中的收益略有下降。总体而言,GP模型展现出最优的预测效能。
4.可解释性分析
对GP模型进行了全局可解释性分析。结果显示,红细胞分布宽度(RDW)、年龄、乳酸、脓毒性休克和血管活性药物使用是影响CRRT患者28天全因死亡率的五个最重要预测因子(图4B)。SHAP摘要图(图4A)表明,较高的RDW、年龄、乳酸水平、存在脓毒性休克和使用血管活性药物与较高的死亡率相关。SHAP值大于零表示特征增加死亡风险,小于零则降低风险。此外,SHAP力力图(图4C、4D)提供了个体化预测的局部解释,通过显示各特征对特定患者预测结果的贡献方向和幅度,直观呈现模型如何基于特征值将预测结果从基线值调整至最终输出值。
5.外部验证
该外部验证队列基线特征如表4所示,生存组与非生存组在年龄、最大凝血酶原时间、肌酐峰值、脓毒性休克、血管活性药物使用及有创机械通气需求方面存在显著差异。GP模型在外部验证中AUC达0.78,图5展示了其ROC曲线、决策曲线(DCA)及其他评估指标,结果表明模型具有良好的预测性能和临床适用性。
五、总结
本研究成功构建了一个基于高斯过程(GP)的可解释机器学习模型,能够准确预测接受CRRT的重症患者28天全因死亡率,并在内部和外部验证中均表现出良好的预测性能和泛化能力。通过SHAP方法提供了全局和局部解释,明确了关键预测因子(如RDW、年龄、乳酸、脓毒性休克和血管活性药物使用),增强了模型的临床可信度和实用性。
上一篇:治疗≠预防:孕期生殖道感染管理新挑战——论协同感染与残余早产风险