借助“上帝的骰子”:研究人员开发出利用基因组学模拟临床试验的新方法

生物医学
借助“上帝的骰子”:研究人员开发出利用基因组学模拟临床试验的新方法
麻省理工科技评论 2018-09-10

2018-09-10

孟德尔随机化技术可能是制药公司等待已久的革命性工具。
生物
孟德尔随机化技术可能是制药公司等待已久的革命性工具。

孟德尔随机化技术可能是制药公司等待已久的革命性工具。

1977 年 1 月,著名 Framingham 心脏研究会发现一个惊人现象:高密度脂蛋白(HDL)胆固醇竟然是一种对身体有益的胆固醇。研究人员发现,人体血液中的 HDL 含量越高,心脏病发作的风险越低。而且这个结论适用于所有人,无关年龄和性别。事实上,在心衰高发人群——50 岁以上人群中,HDL 是唯一一个可靠的心脏病风险预测指标。

自此,大家都坚信 HDL 胆固醇与心脏健康有着密不可分的关系。本着 HDL 能够有效预防心脏病发作并挽救生命的美好构想,制药公司认为 HDL 能给公司带来巨大效益,因此众制药公司挤破头皮斥巨资开发促 HDL 药。

然而,所有促 HDL 药都失败了。正如 2016 年《纽约时报》头条中说的那样,“期望落空了,胆固醇药物对心脏健康没有任何影响。”但是为什么呢?一种可能是,HDL 胆固醇在心脏病中没有关键性的作用:简而言之,两者没有因果关系。也许高 HDL 不能保护我们免得心脏病。也许高 HDL 只是心脏健康的一个标志物。

1536568159746f4fda34243.gif

(来源:麻省理工科技评论)

经常关注健康类新闻消息的人可能会发现一个现象,即这周被报道对人身体有益的东西下周可能就说是无益的了。流行病学就是这样,目前大家认为这门以寻求病因为目的的一个医学分支在追随疾病病因上很难发挥重要作用。其实 HDL 不能保护我们免得心脏病的原因很简单: 相关性不是因果关系。两个现象或趋势在时间上相关的事实并不意味着其中一个现象会引起另一个现象的发生。可以说,医学和公共卫生中最重要的问题就是如何判断哪些相关性是存在因果关系的,而哪些则只是纯粹相关。

现在,研究人员正在使用一种新工具,这种新工具以基因组学为基础,有望用来确定慢性病的真正病因。研究人员表示,通过利用人之间的基因差异——例如,有的人千杯不倒,而有的人却滴酒不能沾,抑或有的人对动脉胆固醇水平很敏感,而有的人则不敏感——他们现在只需花少量的金钱和精力,就能模拟出大型临床试验的效果,例如确定促 HDL 药物是否真正有益。这个新技术,名为孟德尔随机法,已被许多制药公司用于决定药物临床试验需要进行与否。

那么它是如何工作的呢?下面将以 HDL 为例来简单阐述。在人群中,某些人携带可提高 HDL 水平的特定基因变体。如果 HDL 确实可以预防心脏病,那么携带特定基因变体的人应该具有较低的心脏病发病率,并且比其他人更长寿。如果真的是这样的话,那么通过药物或饮食提高 HDL 确实是一个很好的主意。在斥巨资进行促 HDL 药物的临床试验时,不应当简单地按照参试人员随机分配的原则,而应事先确定哪些人员携带提高 HDL 水平的特定基因。

在搞清楚相关性与因果关系的区别之前,一些科学家已经开展了诸多单纯随机分配的对照试验。英国布里斯托尔大学的流行病学家 George Davey Smith 说:“我们都被招募进了一个试验,但是在概念上,我们对这个试验其实还不清楚。”他是提出这种新技术可作为解决医学研究中因果关系和相关性的宝贵工具的先锋科学家。

该方法已经解决了关于心脏病的长期和关键问题,终于给 40 年来 HDL 与心脏病之间的不确定性画上了句号。2012 年,一项大型国际合作报告称,尽管 HDL 与心脏病之间存在令人印象深刻的相关性,但携带可提高 HDL 水平的特定基因变体的人群心脏病发作风险并不少于其他人群。简而言之,虽然 HDL 与心脏病呈负相关,但这之间不存在任何因果关系。这就是促 HDL 药物开发失败的原因。



相关性并不等同因果关系


Davey Smith 和他同事 Shah Ebrahim 可以说是制药和公共卫生界革命的主要推动者了。他们俩也是彼此真正的知音,两人最初在 90 年代因对摇滚乐的热衷而结识,后来到学术上对公共健康中流行病学未得到相应认可而一同感到失望。2000 年,他们俩为 International Journal of Epidemiology 杂志撰写了长篇社论,向流行病学界询问 21 世纪是否能成为流行病学的春天呢?

他们指出,流行病学曾在确定如艾滋病、寨卡病等传染病的原因方面起着至关重要的作用,其中部分原因是实验猜想可以在实验室进行验证,同时还可以很容易说服政府在实地中进行测试。但是,心脏病和癌症等慢性疾病则完全不同。流行病学只能用来提供饮食、生活方式和疾病之间的相关性。根据这些相关性,只能产生一些关于可能原因的假设。然而,Davey Smith 和 Ebrahim 关注的是其他流行病学家往往选择避开的一些东西:他们依据假设来对人们的上生活和饮食提供建议,而未严格地进行试验,试验可能决定他们是否正确,且非常昂贵。

在医学中,用来严格地检验假设的试验称为随机对照试验。受试者被随机分配(通常数千或数万)干预(药物或饮食)或对照(安慰剂),然后进行长期(如果需要,可达数年)试验,来确定效果。在这些试验中,随机分配是关键因素:它最大限度地弱化了受试者的包括行为、文化、教育以及社会经济能力等可能影响试验结果的其他特征。但是,这样的临床试验耗资巨大。而且,可能不符合伦理规范。就像任何科学实验一样,即使花费大量资金,即使再怎么精心设计,最终仍然可能得到错误的结论。

到 2000 年,Davey Smith 突然想到基因组学可能可以作为以上问题的解决方案。他一直在研究心脏病和同型半胱氨酸之间的关系。高水平的同型半胱氨酸,和低水平的 HDL 一样,往往与心脏病有关,但同型半胱氨酸和心脏病的发生仅仅是有相关性呢,还是有因果关系吗?研究人员进行了相关的临床试验,他们利用叶酸(B 族维生素)来降低血中同型半胱氨酸浓度。Davey Smith 意识到,如果能找到先天血液中同型半胱氨酸水平偏高或偏低的个体,就可以解决这两者之间的因果关系问题。如果这两种个体患心脏病的风险有显著性差异,那么这将有力地说明同型半胱氨酸和心脏病的发生具有因果关系。

令人兴奋的是,除了同型半胱氨酸水平以外,这两个试验组之间的其他所有特征都是随机的,就像普通的随机试验一样。不仅每个人出生后的行为,暴露源以及生活经历是随机的,从理论上讲,所有其他基因上的影响也是随机的。每个携带升高同型半胱氨酸或降低同型半胱氨酸基因变体的基因组都是随机组成的,因为我们从父母亲继承的基因是随机组合事件。

Davey Smith 知道,决定成败的关键将在于细节。造成孟德尔随机化失败可能有很多原因。其中有一个就是基因的多效性,即某些基因能控制着多种性状。试想,高半胱氨酸或 HDL 相关的变异也会对智力产生影响,后者可能会影响人们的社会经济地位和整体健康状况。也就是说,这种基因多效性通过引入新的因果关系因素来“混淆”同型半胱氨酸或 HDL 在心脏病中的作用。

2000 年,Davey Smith 和 Ebrahim 参加了印度北部的会议。在 4 小时的出租车程中,Davey Smith 向 Ebrahim 介绍了他的想法。“他向我解释了三次,我才真正理解他的意思。”Ebrahim 说。三年后,两位研究人员在 International Journal of Epidemiology 期刊上发表了一篇长达 22 页的论文,不仅解释了如何使用孟德尔随机化,还提到了他们想到的可能导致结论错误的不合理使用方式。



基因发现


在他们的想法可以投入实践之前,基因组学领域的科学家们意识到他们也需要“清理”一下旧想法和观念了。人类性状遗传基础的研究者一直在与自己的虚假联想进行斗争。最后,研究变得足够大(通常涉及成千上万的人),并且可以明确地检测出人类从身体特征和个性到疾病风险的任意遗传变异。Davey Smith 说,毫不夸张,目前已经有“成千上万的遗传变异”可以被用在科研工作中。

153656815993452c04b6de5.jpg

(来源:麻省理工科技评论)

到目前为止,孟德尔随机化法已经揭密许多因素与心脏病发病之间到底是否有因果关系,包括 HDL(非因果关系),同型半胱氨酸(非因果关系),携带“坏”胆固醇的低密度脂蛋白(因果关系),还包括炎症标记物 C 反应蛋白,之前作为心脏病的潜在原因,曾引起了媒体的广泛关注,但是现在,被证明似乎仅仅存在相关性。

现在,制药公司正与来自布里斯托尔大学或其他机构的研究人员合作,以实现临床试验完成前对药物进行预测,从而降低药物开发成本带来的巨大风险。这意味着这种新的工具不仅可以预测哪些药物可能起作用,还可以预测这些药物将带来多大的效果,以及预估试验的规模大小。

英国剑桥大学自然随机试验中心的介入心脏病专家和公共卫生研究员 Brian Ference 说:“公司需要投入巨额资金来测试药物的有效性。然而,如果这些公司选择错了药物分子,或试验没有得到很鼓舞人心的结果,那么他们不仅会失去投资资金,而且也会失去多年的工作。”“在心脏病领域的临床试验中 40 年来这种现象经常出现。”



太简单了


随着其他学科的研究人员意识到孟德尔随机化法有着揭露因果关系本质的潜力,他们把这种思想借鉴到了自己的领域,甚至包括社会科学,心理学和经济学等领域。现在,研究人员可以通过分析胖瘦不同个体的基因对酒精代谢的影响,可以用来预测他们是否有可能嗜酒。同样地,利用这个原理,他们可以使心理疾病患者和某些容易造成抑郁症、精神分裂或其他心理疾病的因素隔离,从而让患者能正常生活。

迄今为止,已经有超过 250 项相关的研究试着解决此类问题,有的利用了与所研究的特征相关的数百种基因变体:例如,是否身高更高会导致男性薪酬更高(研究发现答案显然是“是的”,身高每高 2 英寸,年薪高 1000 到 2000 美元),神经过敏是否会导致吸烟、反之是否也成立(目前尚不清楚),戴眼镜是否会使人变成书虫(显然相反,是学习才导致了近视发生),大麻的使用是否会导致精神分裂症(答案倾向于是)。

Davey Smith,Ebrahim 和其他孟德尔随机化法的先驱们在对该技术感到兴奋的同时,现在都有点担心不合理或错误使用的出现。Davey Smith 说,即使使用过程没有错误,很多人也很容易会过度解读实验结果。例如,孟德尔随机化法可以告诉研究人员,自受孕那一刻起,某基因变异是否会增加或降低疾病风险——即某基因对个体的终生影响。但这是一个不同的问题,Davey Smith 说,“即使到 60 岁,服用药物抑或是改变饮食对于疾病的发生都是有影响的。因此,要真正确定因果关系,仍然需要进行临床试验。”

Davey Smith 和其他人最担心的是,随着基因组数据库成倍增加,基因几乎可以与任何生物学甚至行为学变量联系起来,因此因果关系和相关性研究将变得几乎毫不费力。

布里斯托尔大学拥有一个名为 MR-Base 的平台,任何人都可以在此进行虚拟实验,但前提是不能从此采集任何数据。

“现在,坐在办公桌前,只用 10 分钟,你就可以进行这些研究。这太简单了,”费伦斯说。“大量的相关研究出现,很可能会引起该技术的众多争议。

麻省理工科技评论

From Tech to Deeptech