语言 ▾
中文EN

临床样本如此珍贵,还在使用倾向性评分匹配损失样本量?

发布时间:  2024-01-17 15:42:33


引子:在观察性研究中,由于观察组和对照组并不是随机分配,经常出现两组基线特征不可比的情况,目前常用倾向性评分匹配(PSM)来降低两组之间基线差异。但是PSM有一个较大的缺陷就是匹配不上就是失去这对样本,这可能会极大地减小样本量,导致统计效能降低。这篇文章使用了逆概率处理加权(IPTW)来处理三组的基线差异,在保证了样本量的同时进行严谨的统计推断,作者在进行回归时均考虑了IPTW校正前后参数的变化,得出稳定可靠的结论。


摘要与研究结果

1 摘要

背景:鲜有研究探讨自然流产(SA)次数与双相情感障碍和重度抑郁症(BDMD)之间的关系。本研究旨在探讨SABDMD之间的关系,以及两者之间潜在剂量-反应关系。

方法:我们进行了一项横断面研究,共纳入13200名英国生物银行的女性参与者。根据参与者的BDMD状态将其分为BDMD组和非BDMD组。根据SA次数分为非SA、偶发SA (OSA)和复发性SA (RSA)三组。使用基于倾向性评分的逆概率处理加权(IPTW)来平衡三组的基线特征。采用限制立方样条回归模型评估SA次数与BDMD之间的剂量-反应关系。

结果:经IPTW校正的多因素Logistic回归显示SABDMD的独立危险因素,OSA组和RSA组的校正OR分别为1.12 (95% CI: 1.07-1.19)1.32 (95% CI: 1.25-1.40)。这种关联的强度随着SA次数的增加而增强(趋势性P < 0.001)SA次数与BDMD风险呈非线性关系,近似倒L型曲线。

局限性:SA和BDMD状态的信息依赖于志愿者的自我报告,研究样本主要是欧洲血统。

结论:自我报告经历多次SA的女性更有可能患有BDMD。因此,对产后妇女进行心理护理和干预势在必行。

2 研究结果

2.1 参与者基线特征

共有13200名女性参与者参加了这项研究,其中38.5%为非SA组,55.2%OSA组,6.3%RSA组。倾向性评分调整前,与非SA组和OSA组相比,RSA组的肥胖(BMI30 kg/m2)、家庭年收入(31,000英镑)、每周体力活动时间(MET3000分钟)、糖尿病和高血压的风险显著增加(P < 0.05),初潮年龄(15)也明显更小。相比之下,与OSARSA组相比,非SA组可能有更高的汤森剥夺指数(TDI2.00),既往或近期吸烟率,就业或自雇率,终止妊娠率和口服避孕药率(P < 0.05)。然而,有活产史和双侧卵巢切除术的患病率较低。使用倾向评分进行加权调整后,三组之间的基线特征非常平衡(SMD < 0.1),但终止妊娠史除外,三组之间仍有统计学差异(P = 0.004)



2.2 自然流产数量与双相情感障碍和重度抑郁症之间的关系

BDMD的风险随着SA次数的增加而增加,在校正更多协变量后略有增加。分别调整后的4个模型均获得稳定OR值。因此,SA可被认为是BDMD的危险因素,且女性经历SA次数越多,其作用越强。与IPTW-多变量模型的结果相比,没有IPTW的模型中OSA组和RSA组的OR值更高。相比之下,在没有IPTW的原模型中,OSABDMD的保护因素,而RSABDMD的危险因素。



SA次数与BDMD风险之间存在非线性关系(非线性P = 0.002,图A),曲线近似呈倒L型。随着SA次数增加,BDMD的风险逐渐增加。相反,在非IPTW的模型中,SA次数与BDMD风险之间没有非线性关系(非线性P = 0.097,图B)


2.3 相对于非BDMD,自然流产次数与可能的BDMD之间的关系

IPTW-单因素多项回归结果显示,SABDMD的独立危险因素(P< 0.01),且相对危险比(RRRs)SA次数的增加而增加。随后,在对多个协变量进行调整后,RRRs稳定并略有上升。在所有协变量调整后的模型4中观察到相同的结果。


2.4 双相情感障碍和重度抑郁症与自然流产次数的亚组及交互作用分析

BMI = 25 ~ 30 kg/m2亚组和未终止妊娠亚组外,全变量调整模型结果显示SABDMD的危险因素(P<0.01),且随着SA次数的增加,其相关性更强(趋势性P<0.01)。交互作用结果发现,这些特征与SA次数与BDMD发生的交互作用项之间无统计学关联。


2.5 敏感性分析

为了证实SA次数与BDMD发生之间关联的稳健性,我们进行了多重敏感性分析,包括对8182个缺失数据进行了10次多重插补,并排除了患有癌症的参与者。分别使用IPTW -多变量调整模型和多变量调整模型观察到一致的结果。SABDMD发生的危险因素。同时,随着SA次数的增加,它们之间的相关性越强。

研究设计与统计学方法

1 研究设计

P:21382名有生育史和双相情感障碍和重度抑郁症信息记录的英国生物银行的女性

I:OSA组为偶发性自然流产发生1-2)RSA组为复发性流产(3)

C:非SA组为从未发生过自然流产

O:双相情感障碍和重度抑郁症

S:横断面研究

2 统计方法

使用基于倾向性评分(PS)的逆概率处理加权(IPTW)法来平衡三个暴露组(SAOSARSA)之间基线特征的差异。我们使用R软件“twang”包中的广义提升模型(GBM)来估计每个参与者的PS。它是一种基于机器学习的非参数模型,多次迭代用于寻找治疗组之间的最佳平衡,以达到随机化的作用。在一些研究中,GBM被用于平衡两个以上的治疗组。此外,我们使用了所有可能的混杂因素,包括社会人口统计学特征、生活方式因素和临床因素,来计算每个参与者的PS。使用标准化平均差(SMD)评估所有协变量的组间平衡。SMD越小,协变量组间差异越小,当SMD0.1时,平衡状态越好。

分别比较三个暴露组中IPTW加权前人群和加权后虚拟人群的基线特征。报告了非正态分布连续变量的中位数(四分位数范围,IQR)和分类变量的数量(百分比)。连续变量的比较采用Kruskal-Wallis检验,分类变量的比较采用卡方检验。趋势分析采用线性回归或Cochran-Armitage(CA)趋势检验。采用多变量Logistic回归模型估计优势比(OR)IPTW调整的具有置信区间(95% ci)OR,以探讨SA次数与BDMD之间的关系。采用无序多项式Logistic回归模型(Unordered Multinomial Logistic Regression Models)估计相对风险比(RRRs)IPTW校正的95%CI的相对风险比(RRRs),探讨SA次数与可能的MDBD之间的关系。构建4Logistic回归模型来评估效应值的稳定性。模型1没有对任何协变量进行调整。模型2在模型1的基础上对社会人口学特征进行了调整;模型3对生活方式因素进行了额外调整;模型4对临床因素进行了额外调整。所有模型的各自变量之间没有共线性(方差膨胀因子,VIF2)。我们利用限制性立方样条回归(RCS)模型评估了SA次数与BDMD之间的线性剂量-反应关系。以SA次数=0作为参考水平。

深度解析

这篇文章使用的逆概率处理加权(IPTW)是逆概率加权(IPW)方法的具体运用,IPTW是一种统计技术,用于观察研究和因果推断,以估计治疗效果。IPTW的目标是根据实际观察到的接受治疗组的逆概率为每个观察值分配权重,从而使治疗组和对照组具有可比性。IPTW实现主要分为以下三步:(1)估计倾向性评分(PS);(2)计算权重;(3)评估治疗效果。该文使用广义提升模型(GBM)来计算PS,除此之外twang::ps函数中还可以指定xgboost方法计算PS。在R语言中,WeightItSurvey包也可以用于实现IPTW方法。


WeightIt包演示IPTW在线性回归中的应用:

# 安装和加载包

install.packages("WeightIt")

library(WeightIt)


# 模拟数据集

set.seed(123)

n <- 500

treat <- rbinom(n, 1, 0.5)

covariate <- rnorm(n)

outcome <- 2 * treat + 3 * covariate + rnorm(n)


# 创建数据集

data_df <- data.frame(treat, covariate, outcome)


# 使用weightit函数估计倾向性评分

iptw_object <- weightit(

treat ~ covariate,

data = data_df,

method = "gbm", # 使用gbm函数计算倾向性评分

estimand = "ATE"

)


# 提取权重

iptw_weights <- iptw_object$weights


# 将权重代入到线性回归方程中

model1 <- glm(outcome ~ treat + covariate, weights = iptw_weights, data = data_df)

summary(model1)


# 直接进行线性回归,不考虑权重

model2 <- glm(outcome ~ treat + covariate, data = data_df)

summary(model2)


参考文献:Liu J, Dong Y, Wang X, Sun H, Huang J, Tang Z, Sun H. Association of spontaneous abortion with bipolar disorder and major depression based on inverse probability treatment weighting of multigroup propensity scores: Evidence from the UK Biobank. J Affect Disord. 2024 Feb 15;347:453-462. doi: 10.1016/j.jad.2023.12.003. Epub 2023 Dec 6. PMID: 38065472.





上一篇:没有了!

下一篇:什么是临床试验?|《Fundamentals of Clinical Trials》教材翻译



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号