2025年9月12日,Lichao Wei等人在《eClinicalMedicine》杂志上发表了一篇题为《Development and validation of a machine learning-based model for 90-day prognosis outcome in spontaneous intracerebral hemorrhage patients based on non-contrast computed tomography: a multicenter retrospective observational study》的文章。本研究旨在通过整合非增强计算机断层扫描(NCCT)特征和基本临床特征,利用机器学习算法开发一个临床有用的自发性脑出血(sICH)短期预后预测模型,以提供一个及时、便捷且实用的预测工具。
sICH是一种具有高死亡率和高致残率的疾病,NCCT是其诊断和治疗中最常用的影像学方法。尽管已有研究基于NCCT特征预测血肿扩大和功能预后,但这些研究并未全面分析NCCT特征,且主要关注血肿扩张的预测。此外,现有预测模型要么准确性有限,要么需要评估大量预测变量,限制了其临床实用性。机器学习(ML)作为一种先进的数据挖掘和分析方法,在多个医学领域表现出优异的预测性能,但其在sICH预后预测中的应用尚未充分探索。
数据来源于中国四个医疗中心的sICH患者:复旦大学附属华山医院神经外科(2018年1月至2024年3月,385例)、复旦大学附属金山医院神经外科(2022年3月至2024年1月,164例)、合肥市第二人民医院神经内科(2018年1月至2024年6月,542例)作为训练队列(总计1091例);安徽医科大学第一附属医院神经内科(2022年12月至2024年6月,102例)作为外部验证队列。数据包括患者的人口统计学信息、临床特征(如性别、年龄、NIHSS评分、GCS评分)、NCCT影像特征(如血肿体积、平均CT值、黑洞征等)以及90天改良Rankin量表(mRS)评分。
本研究是一项多中心回顾性观察性研究,遵循TRIPOD指南。研究纳入标准包括年龄≥18岁、符合sICH诊断标准、症状出现后48小时内接受初始NCCT扫描、首次急性sICH发作;排除标准包括创伤性出血、颅内血管畸形、肿瘤导致的继发性出血、单纯脑室内出血、失访或sICH前mRS评分≥3。研究使用训练队列(1091例)开发模型,并通过外部验证队列(102例)验证模型性能。特征选择采用递归特征消除(RFE),模型训练采用五折交叉验证结合网格搜索进行超参数优化,最终通过SHAP和SFS筛选核心预测因子,并构建在线预测平台。模型性能通过ROC曲线、AUC、准确率、敏感性、特异性等指标评估。SHAP用于解释特征重要性,SFS用于筛选核心变量。敏感性分析包括比较MICE和完整病例分析的效果,亚组分析基于手术干预与保守治疗分组评估模型性能。
研究队列、基线特征和结果
训练发展队列共纳入1091例患者,平均年龄(61.69±14.46)岁,其中男性760例(69.66%),女性331例(30.34%)。外部验证队列共纳入102例患者,平均年龄(62.17±14.33)岁,其中男性74例(72.55%),女性28例(27.45%)。训练组与外部验证组在吸烟、血肿体积、入院时NIHSS评分、血肿平均CT值、短径、血肿侧、岛征、漩涡征、低密度征、SAH及预后等方面均存在统计学差异(P < 0.05)。训练队列中预后较好与较差患者的亚组分析,性别、入院时 NIHSS 评分、入院时 GCS 评、血肿体积、长径、短径、高度切片数、血肿部位、IVH、岛征、卫星征、液面征、黑洞征、不规则形状征、漩涡征、低密度征、密度不均一征、中线移位和 SAH 等方面均存在统计学差异(P < 0.05)。
预测模型性能
对训练队列中的5个机器学习模型进行五折交叉验证,得到各模型的平均预测性能:LR(0.795±0.027)、SVM(0.802±0.018)、RF(0.806±0.014)、XGBoost(0.803±0.015)、LightGBM(0.813±0.012)(图2)。表1给出了不同机器学习预测模型的常见性能指标对比。基于以上结果,选择LightGBM模型(AUC=0.813)作为预测模型。在内部测试中,临床特征(AUC:0.822,95%CI(0.763-0.881)),NCCT特征(AUC:0.770,95%CI(0.704-0.835))和两者的融合(AUC:0.852,95%CI(0.797-0.906))(图3A)。虽然在外部验证中,三种模型的AUC略有下降,包括临床特征(AUC:0.792,95%CI(0.689~0.894))、NCCT特征(AUC:0.746,95%CI(0.637~0.855))以及两者融合(AUC:0.796,95%CI(0.694~0.897)),但融合特征模型仍然具有最佳的检测性能(图3B)(表2)。
图2 经过五重交叉验证的五个机器学习模型的平均 AUC 性能
图3 基于临床特征、NCCT特征、融合特征的LightGBM模型预测sICH患者短期预后的ROC曲线分析(A.内部测试;B.外部验证)
表1 对 5 种机器学习模型的性能结果进行比较分析
表2 不同特征组合的GBM模型在内部测试和外部验证上的表现
SHAP可解释模型
采用SHAP图可视化展示预测变量对模型结果的影响,分别列出入院GCS评分、入院NIHSS评分、IVH、平均CT值、血肿体积、黑洞征、岛征、漩涡征等多个因素对预测结果的贡献(图4)。进一步采用序贯前向选择法(SFS)进一步简化模型,并利用LightGBM模型中变量重要性和组合得到的预测数据,生成组合AUC和变量重要性折线图(图5) 。通过整合入院GCS评分、IVH、入院NIHSS评分、平均CT值、血肿体积、黑洞征,优化并提升了模型的预测能力。利用这六个关键指标,开发了一个基于网络的计算器,以促进对 sICH 患者的个体化预后风险评估,提高可访问性和便利性(https://surge-ustc.shinyapps.io/multi_para_sih_prognosis/)。
图4 LightGBM 模型的 SHAP 分析预测 sICH 患者预后不良
图5 基于变量重要性构建的不同变量组合的 LightGBM 模型性能比较
研究成功开发并验证了一个基于LightGBM算法的机器学习模型,用于预测sICH患者的90天功能预后。该模型整合了临床特征和NCCT影像特征,其中入院GCS评分、IVH、入院NIHSS评分、平均CT值、血肿体积和黑洞征被确定为核心预测因子。模型在内部和外部验证中均表现出色(AUC>0.79),具有良好的准确性和泛化能力。此外,研究还提供了一个便捷的在线预测平台(https://surge-ustc.shinyapps.io/multi_para_sih_prognosis/),可用于临床快速评估患者预后。该模型有望辅助医生进行风险分层、个性化治疗决策和资源优化,但未来仍需前瞻性研究和多族群验证以进一步推广其应用。
上一篇:不同脑小血管疾病负荷下与认知功能障碍相关的异常脑结构-功能连接偶联
下一篇:没有了!