奕真生物联合创始人赵奕宁:我们做的就是让AI碰撞生物科学

生物医学
奕真生物联合创始人赵奕宁:我们做的就是让AI碰撞生物科学
麻省理工科技评论 2018-01-29

2018-01-29

“我在MIT的时候,当时就想我是不是可以对人类做出更多的贡献?”
医疗 Emtech China
“我在MIT的时候,当时就想我是不是可以对人类做出更多的贡献?”

1月29日上午,上海奕真生物 CEO,奕安济世生物 CEO,礼来亚洲基金投资合伙人赵奕宁在EmTech China峰会上发表了为时20分钟的演讲,以下为演讲内容全文:

赵奕宁进京.jpg

因为我不是生物学家,所以我在看待基因组学这种生物技术的时候,不会从一般生物学家的角度去看,我会把自己当成一个病人,而我的确也曾患过一种罕见的疾病。我们每个人都难以确保某种重大疾病会不会在某一天降临到我们头上,而这种对于未知灾患的恐惧恐怕是最令人绝望的事情了。

25年前,我发现当时我们能够做的诊断是非常少的,医院的手段也很有局限,不过还是有许多新的技术应用到了临床。近期,我的侄女诊断出了疾病,这种疾病其实可以很早就发现,甚至是在她出生前就被发现,但是不幸的是,直到13岁,她的这种病才被诊断出来。可又有谁能保证不会像我的侄女一样呢?我们在测绘人体基因组的时候,发现其中存在很多的变量,可能病人只要改变一下食物摄取的组合,病人的整个状况可能就会稳定下来。

我在MIT的时候,当时就想我是不是可以对人类做出更多的贡献?这种贡献不仅仅是在诊断方面,我想做的是建立一种全局观念,从诊断开始,然后收集大数据,从大数据再转换成数据挖掘和早期目标发现,甚至是早期疾病诊断以及早期临床实验。

赵奕宁.jpg

在校期间,我和我的同学提出了一些方案,我们在中美之间有一些合作项目,主要是基因组的公司。我发现这些公司手里有一些大数据是基于深度学习的,这些数据会被用于一些公司的具体目标。在我们和这些公司的合作中,我们收集他们病人的数据,用于我们的研究,我们通过这种实验的方法建立了一个完整的药物发现模型。

今天我想让大家了解一下,我们在个人基因组的发现所做出的一些科学贡献。我们的公司名叫奕真生物(Veritas Genetics),于2015年成立。自2017年开始,我们受到了《麻省理工科技评论》的关注和报道,我们在基因组方面做了出很多的成就,过去两年里,我们建立了基金会,在美国和中国建立了研发机构,也在逐渐向欧洲拓展。

我们公司的名字Veritas是取自于哈佛大学的校训,它的中文意思是“真理”,这种真理不仅是关于健康的真理,而且是关于人类、家庭、未来的真理,这种跨界的合作理念不仅能够帮我们取得技术上的进步,更能帮我们赢得全球广阔的市场。

我们整个的方案分三步走战略:

第一步:建立基金会,把它作为一个平台,通过这个平台来获取基金数据、临床数据和消费者数据;

第二步:做数据整合和数据挖掘。

第三步;做专有数据内容的发现以及健康管理。目前我们已经进入到了这一阶段。

我做过一些市场调查,中国正在快速地进入基因测序的市场,在过去几年中国已经成为了世界上最大的基因测序市场,但是当我们仔细地观察这个市场,发现大部分的公司只是做一些简单的分析,也就是说他们只是收集极少的基因信息来做分析(基因组测序),与此同时只有很少的公司是从事全基因组测序工作。

我们有30亿基因组的数据,DNA的数据只有在收集完成之后,才能够分为测序组和非测序组。如果今天观察中国市场的话,只要400块钱就可以做基因测序,可以获得这种简单的SMP的基因分型测序,但是用户不知道是测的哪些数据,且不要说他们收集到的基因分型甚至少于你身体内的0.1%,换句话说这种检测对于临床、家庭诊测以及家庭健康管理都是无效的,而我们可以百分百地覆盖到基因组数据,这些数据可以用于疾病诊疗。

我们不仅仅是做数据收集、基因测序,同时要和消费者对接,完成整个个体的病例解读,整个过程是从收集基因数据到最终生成报告。那对于大量的客户,如何转化为基因数据呢?毕竟他们提供的数据比SMP要丰富得多,这里就要借助机器学习和人工智能来建立基因组平台了。

赵奕宁远景.jpg

比如说我们读一份基因报告,可能有400到600页,基本上是无法妥善处理的。而我们所做的系统类似于亚马逊的智能机器人,会帮助你解读,我们将其与亚马逊的系统进行结合。用户可以问它,“我是否有患高血脂的潜在风险?”这样的问题。它可以和你实现实时互动。作为患者会去阅读更新的信息,这也是基于我们的技术支持。也是第一步。

第二步,现在有很多这样的机构,都不愿意提供给患者数据,所以我们可以说是世界上第一家公司,生成了分布式的生态系统,无论在那里,都可以了解你的个人信息。

第三步,举个例子一旦信息和数据生成之后,可能有成千上万的一些信息点,你怎么收集和处理。在中国人们说到大数据的时候,大家觉得只是收集全部信息,但其实是应该收集部分的患者组或者健康的人群组,来列队收集信息。

怎么选择更有效的靶向人群呢?比如基于他们的生物指标,抗体蛋白质或者用基因测序的方法。现在有很多这样的科学文章已经出来了,在一些跨国企业已获得更多的投资来用于人体基因。我们去年做了一项研究工作来了解是否在特定人群中有一些高胆固醇的倾向。出于当时的技术限制,差不多持续了12-13年了。如果放到现在,我可以非常负责任的说,我们可以减少这个研究持续时间。

我们还做了关于信息解读的工作,使这些信息真正被医学界所用。我们和一家公司合作,来解读靶向信息。未来这种解读过程会越来越有效,因为我们会进一步了解人类的基因信息,那么未来有什么样的趋势呢?除了新药研发之外,我们还着手婴幼儿的研究工作,中国应该比美国做的更好,因为中国的人口基数会比较大,但是问题是我们针对婴幼儿的研究非常有限,在美国有很多这样的法律法规,而且美国会非常关注婴幼儿的健康,但是在中国,我们不仅想去收集基因信息,我们还想收集这些染色体端粒、微生物组的信息及内源代谢、免疫组等。这些信息点不光可以检测一个人的健康情况,还可以为每个家庭提供一些早期干预措施。

去年我参加了中国商业新闻的一场峰会,我当时表达了这个观点,一些大城市应该为每一个婴幼儿做基因测试,这样可以为每个家庭提供准确的基因身份证,这不光是从健康角度出发,还是从每个家庭的早期健康管理出发。我们的基因信息是我们未来的征途,我希望在不久的将来,我家族的故事不会被重演,我想大家都可以治好这些早期的可发现的罕见病,我们也应该携手让未来的生命更加的健康。

麻省理工科技评论

From Tech to Deeptech