发布时间: 2025-09-01 11:04:58
2025年8月4日,Jie Fu等人在《Front Neurol》杂志上发表了一篇题为《An interpretable machine learning approach for predicting drug-resistant epilepsy in children with tuberous sclerosis complex》的文章。本文旨在开发并验证一种可解释的机器学习(ML)算法,用于预测结节性硬化症(TSC)儿童发生耐药性癫痫(DRE)的风险。
一、研究背景
TSC是一种罕见的累及多器官系统的遗传性疾病,约70–90%的患者会出现癫痫发作,其中约60%最终发展为DRE,严重影响患者的神经认知发育和生活质量。尽管已有研究尝试使用机器学习预测癫痫治疗结局,但多数模型依赖于多序列磁共振成像(MRI)或复杂深度学习架构,且缺乏可解释性,限制了其临床适用性。因此,本研究致力于构建一个结构简单、可解释性强、基于常规临床特征的预测模型,以助力早期识别高风险患儿并指导个体化干预。
二、数据来源
数据来源于2018年1月至2024年3月期间在北京大学人民医院儿科住院的TSC患儿的回顾性临床资料。共纳入88例符合国际TSC共识组(2021年)诊断标准且经ILAE指南确诊为癫痫的儿童,所有患者均具备完整的病史、脑电图(EEG)及头颅MRI或CT影像资料,且随访时间不少于1年。收集的变量包括性别、发病年龄、家族史、基因变异类型、发作类型、婴儿痉挛症(IESS)病史、EEG表现、神经影像学表现、抗癫痫药物(ASM)使用数量、mTOR抑制剂使用情况以及发育迟缓等。
三、研究方法
研究使用递归特征消除(RFE)进行变量筛选,通过10次十折交叉验证评估特征子集性能;构建9种ML模型,包括随机森林(RF)、支持向量机(SVM)、梯度提升机(GBM)、极端梯度提升(XGB)、朴素贝叶斯(NB)、K近邻(KNN)、神经网络(NNET)、决策树(DT)、逻辑回归(LR),并采用重复10折交叉验证进行超参数调优;使用“caret”包实现模型训练与评估;模型性能通过AUC、阳性预测值(PPV)、阴性预测值(NPV)等指标进行系统评估;校准能力通过Hosmer-Lemeshow检验及校准曲线分析;临床效用通过决策曲线分析(DCA)评估;采用SHapley Additive exPlanations(SHAP)方法进行全局与局部模型解释。统计分析使用R 4.4.1,符合正态分布的连续变量以均数±标准差表示,非正态分布的以中位数(上下四分位数)表示;分类变量以频数(百分比)表示。
四、结果
1.基线特征
在88例TSC相关癫痫患儿中,50例(56.8%)发展为DRE,38例(43.2%)经药物治疗后实现无发作。DRE组癫痫发作中位年龄早于无发作组。两组在TSC1/TSC2基因突变分布上无显著差异。DRE组在IESS病史、癫痫性痉挛(ES)、局灶性发作合并ES、EEG多灶性放电、皮质结节数量≥3个及室管膜下结节(SEN)方面均显著高于无发作组,而mTOR抑制剂使用率较低,所有差异均具有统计学意义(p < 0.05)。表 1 描述了所有患者的人口统计学和临床特征。研究设计如图 1 所示。
本研究中,88例TSC患者的ASMs使用情况如图2所示。所有患者均接受了至少一种ASM治疗,最常用的五种药物分别为:氨己烯酸、丙戊酸、奥卡西平、左乙拉西坦和拉莫三嗪。
2.独立风险因素分析
基于全队列数据,单因素逻辑回归分析(p < 0.05)初步识别出8个与DRE可能相关的因素。进一步通过多因素逐步逻辑回归分析,最终确定4个具有统计学意义(p < 0.05)的独立危险因素:IESS病史、EEG发作间期多灶性放电、多发性皮质结节以及使用≥3种ASMs(表2)。
3.列线图的构建与性能评估
基于逻辑回归分析结果构建列线图(图3)。该模型原始AUC为0.897(图4A)。经1000次Bootstrap内部验证后,列线图的AUC为0.827(图4B),显示出良好的预测性能和稳定性。校准曲线显示预测与观察结果之间具有良好一致性,平均绝对误差(MAE)为0.052(图4C)。决策曲线分析(DCA)表明,当阈值概率超过0.2时,列线图相较于“全治疗”或“全不治疗”策略具有更高的临床净获益,支持其在预测DRE方面具备临床实用性(图4D)。
4.预测变量筛选
本研究采用递归特征消除(RFE)方法进行变量筛选,旨在识别对模型性能贡献最显著的变量子集。附图1展示了各机器学习模型基于RFE的特征选择过程,附图2以条形图形式呈现了所选特征的显著性评分,反映了其对模型预测的相对贡献度。
5.模型的构建和性能比较
本研究采用重复10折交叉验证构建了9种机器学习模型。图5A和5B分别展示了内部交叉验证前后各模型的ROC曲线,所有模型的详细性能指标见附表4。RF模型表现出最高的特异性和AUC,其AUC为0.862;GBM模型次之,AUC为0.847;SVM模型位列第三,AUC为0.818。(图5B,C)Hosmer-Lemeshow检验显示RF(p = 0.077)和SVM(p = 0.064)模型具有较优的拟合优度(附图3)。决策曲线分析(DCA)表明,RF模型在所有阈值概率(0–1.0)下均获得最高的临床净获益,其次为XGB和GBM模型(图5D)。所以RF模型展现出最佳的整体性能。
6.模型解释
基于验证结果,本研究选择预测性能最优的RF模型进行SHAP可解释性分析。SHAP摘要图(图6A)直观展示了各特征对预测结果的影响方向及程度,其中EEG表现对预测DRE的影响最大,特别是发作间期多灶性或全面性放电与更高的DRE风险相关。图6B展示了一名无发作TSC患者的预测结果中各变量的贡献度,图6C则显示了7个特征实际值与对应SHAP值的关系。SHAP值大于零的特征均提高了DRE的预测概率,表明其与DRE风险增加显著相关。
五、总结
基于随机森林的预测模型能够以较高准确度识别TSC患儿中DRE的高风险个体,且通过SHAP方法增强了模型的可解释性与临床适用性。该模型为早期干预和个体化治疗提供了科学依据,尤其适用于资源有限的环境下基于常规临床特征进行风险分层。