发布时间: 2024-01-26 14:27:31
原文信息:Stephen Burgess, Simon G. Thompson.Mendelian RandomizationMethods for Causal Inference Using Genetic Variants. Chapman and Hall/CRC; 1st edition (March 6, 2015):2-7
翻译:重庆嘉舟生物科技有限公司
这本书关注的是根据使用遗传变异作为工具变量的观察数据来推断因果关系,这是一个被称为孟德尔随机化的概念。在本章中,我们将介绍孟德尔随机化的基本思想,并举例说明何时可以使用该方法以及为什么它可能有用。在这一章中,我们的目的只是对这种方法作一个粗略的介绍;有关其条件和要求的详细信息将在后面的章节中讨论。虽然本书中给出的例子主要是在流行病学的背景下,孟德尔随机化可以解决各种研究领域的问题,而且本书中的大部分材料同样与不同研究领域的问题相关。
1.1经典流行病学的不足
流行病学是在人口水平上研究健康和疾病模式的学科。我们使用“经典流行病学”这个术语,意思是不使用遗传学的流行病学,与遗传流行病学进行对比。流行病学研究的一个基本问题,与其他社会科学领域一样,区分相关性和因果关系。如果我们想要解决重要的医学问题,例如确定疾病病因(疾病的原因是什么?),评估医疗或公共卫生干预的影响(治疗的结果是什么?),为公共政策提供信息,优先考虑医疗资源,为临床实践提供建议,或就生活方式选择的影响提供咨询,那么我们必须回答因果问题。解决这些问题的最佳方法是通过适当的研究设计,例如使用前瞻性随机试验。
1.1.1随机试验和观察性研究
在临床研究中对科学假设进行实证检验的黄金标准是随机对照试验。此设计涉及将不同的治疗方案随机分配给群体中的实验单位(通常是个体)。最简单的形式是,将积极治疗(例如,对危险因素进行干预)与对照治疗(不干预)进行比较,并对比试验中每组的平均结果。我们通常将假定的因果风险因素称为“暴露”变量。我们试图评估暴露是否是导致结果的原因,并估计(如果合适的话)因果效应的大小。
虽然随机试验原则上是确定特定暴露因果关系的最佳方法,但它们也有一些局限性。随机试验既昂贵又耗时,特别是当结果罕见或需要长时间随访观察时。此外,在某些情况下,可能无法获得仅对感兴趣的暴露产生影响的靶向治疗。此外,由于实际或道德原因,许多暴露不能随机分配。例如,在评估喝红酒对冠心病风险的影响时,招募参与者在30年的时间里被随机分配喝红酒或不喝红酒,这是不可行的。需要其他方法来判断因果关系。
科学假设通常是用观测数据来评估的。通过比较干预暴露,而不是比较高水平和低水平暴露的个体。在许多情况下,两组平均结果之间的差异被解释为暴露因果作用的证据。然而,这样的结论混淆了相关性和因果关系。有很多原因可以解释为什么暴露水平高的个体可能有更高的平均结果水平,而暴露并不是一个因果因素。
将观察数据中的暴露与疾病结果之间的关联解释为因果关系,依赖于无法检验且通常不可信的假设,例如缺乏未测量的混杂因素(见第2章)和反向因果关系。这导致了一些引人注目的案例,其中暴露被广泛宣传为基于观察数据的疾病预防的重要因素,但后来当随机试验的证据不支持因果解释时,就不可信了。例如,观察性研究报告了维生素C与冠心病风险之间存在很强的负相关关系,这种关系在多种替代风险因素的调整后并未减弱。然而,从随机试验中获得的实验数据结果显示相反方向的不显著关联。观察性关联的置信区间不包括随机试验估计值。类似的故事也适用于β-胡萝卜素与吸烟相关癌症之间的观察和实验联系,维生素E与冠心病之间的关系。
1.2遗传流行病学的兴起
遗传流行病学是研究遗传因素在人群健康和疾病中的作用。我们概述了遗传流行病学的历史和发展,说明为什么它是流行病学和科学研究的一个重要领域。
1.2.1历史背景
虽然特征从一代遗传到下一代已经被观察了几千年,但遗传的机制却长期不为人知。当查尔斯·达尔文于1859年首次提出他的进化论时,其主要问题之一是缺乏遗传的潜在机制。格雷戈尔·孟德尔在1866年提出了两条遗传定律:一是分离定律,即当任何个体产生配子(性细胞)时,同源染色体上的两个等位基因分开,因此每个配子只得到一个等位基因;以及自由组合定律(独立分配定律),即“未连接或远连接的分离基因对在减数分裂(细胞分裂)时自由组合”(当具有两对(或更多对)相对性状的亲本进行杂交,在子一代产生配子时,在等位基因分离的同时,非同源染色体上的基因表现为自由组合)。这些规律被概括为“孟德尔遗传定律”,这也是孟德尔随机化得名的原因。在20世纪20年代和30年代,进化和孟德尔遗传这两个领域在“现代进化综合”中被结合在一起,这是由罗纳德·费舍尔(Ronald Fisher)等人提出的,他帮助发展了种群遗传学。1949年,Linus Pauling建立了遗传学与疾病之间的直接联系,他将镰状细胞贫血患者的特定基因突变与红细胞血红蛋白的变化联系起来。1953年脱氧核糖核酸(DNA)结构的发现促进了分子生物学的诞生,使人们对遗传密码有了更深入的了解。人类基因组计划于1990年建立,导致在21世纪初公布了整个人类遗传密码。最近,技术进步已经将DNA测序的成本降低到现在经济上可行的水平,可以测量大量个体的遗传信息。
1.2.2 遗传与疾病
随着人类基因组知识的发展,疾病遗传决定因素的研究已经从单基因疾病(由单个基因突变引起的疾病,如镰状细胞性贫血)扩大到多基因和多因素疾病,其中疾病风险的负担不是由单个基因造成的,而是由多种基因与生活方式和环境因素共同导致的。这些疾病,如癌症、糖尿病和冠心病,往往集中在家庭中,但也取决于可改变的风险因素,如饮食和血压。已经发现了与这些疾病有关的几个遗传因素,特别是通过增加使用全基因组关联研究(GWAS),其中测试了数十万甚至数百万种遗传变异与疾病结果的关联。在某些情况下,这些发现增加了对疾病过程的科学理解和预测个人疾病风险的能力。然而,从临床的角度来看,它们的直接利益是有限的,因为个人的基因组目前还不能改变。然而,遗传学的发现为孟德尔随机化提供了机会:孟德尔随机化是一种利用遗传数据来评估和估计基于观察数据的可修改的非遗传暴露的因果效应的技术。
上一篇:什么是临床试验?|《Fundamentals of Clinical Trials》教材翻译
下一篇:临床试验阶段和Ⅰ期试验 |《Fundamentals of Clinical Trials》教材翻译