当基因联网,人类会怎样
发布日期:2021-08-30 16:00:35 浏览次数:21 分类:技术文章

本文共 3496 字,大约阅读时间需要 11 分钟。

0?wx_fmt=jpeg

华大基因总部位于深圳市盐田区北山工业区,是一栋由旧鞋厂改造而成的8层小楼。

这座普通的8层小楼辐射出来的研究分支机构目前已遍布世界60多个国家和地区,人员规模近5000人,且多次入选世界顶级学术期刊《自然》排名中国科研机构前5名,仅次于中国科学院、中国科技大学和清华、北大

这家公司的主业是普通人看起来很神秘的“基因”。基因检测技术是自疫苗问世以来疾病预防最重要的科技突破,它通过研究基因与生物表征之间的关系,不仅可以大大降低遗传相关的疾病发生率、减少出生缺陷,还有对复杂性疾病进行预测、预防、预警和个体化诊疗的巨大潜力。基因科技将推动生物产业成为中国未来重要的增长极。

“Follow(跟随)先进国家”是中国许多领域的核心技术的状态,华大在基因界却闯出了不一样的道路。在成立16年之后,华大基因成为全球最大的基因组学研发中心。虽然华大基因目前的年收入仅是10亿元级别,但是其背后蕴藏的却是千亿乃至万亿级的市场。有人认为,华大基因将成为中国的下一个华为、或者下一个腾讯。

基因的神秘和魔力在哪?基因和互联网结合,未来的生物产业将发生什么样的变革?创业16年,华大在基因的这条道路上摸索的核心竞争力是什么?7月初,华大基因CEO王俊在深圳华大基因总部接受了网易科技独家专访,解读基因的未来。

0?wx_fmt=jpeg

华大基因CEO 王俊

华大不是“基因界富士康”

提起华大基因,多数人的第一反应是“基因测序”。华大基因最初闯入公众视野,是2010年从美国基因测序仪器公司illumina购入128台高通量测序仪,这使得华大一举成为全球最大的基因测序机构,并从那之后被称为“测序工厂”、基因界的“富士康”。

王俊认为,给华大基因“测序工厂”的定位并不准确。

华大基因的历史是从“人类基因组计划”开始的。人类基因组计划于1990年启动,6个国家投入总计30亿美元,绘制出了人类基因图谱,试图破译人类遗传信息。它与“曼哈顿原子弹计划”和“阿波罗登月计划”并称为三大科学计划。

华大基因成立于1999年,承担了这个计划大约1%的工作。之后,华大基因又参与了水稻基因组、国际人类基因组单体型图计划、第一个亚洲人基因组图谱、大熊猫基因组计划等大型基因组项目。

王俊认为,华大的核心竞争力在于是全球唯一打通了基因产业的上中下游全产业链的一家机构。在国外,基因产业的整个流程更多是由上中下游各个环节合作完成。

王俊说,基因是一个完整的产业链。基因测序只是第一步,它能告诉我们人类基因携带了哪些信息。但是光知道这些信息是不够的,还要知道这些信息意味着什么。所以,还要弄懂这些信息,以了解基因信息和人类表征之间的关系。再往下一步就是应用,具体到人本身,就可以用作临床诊断。比如由人携带的基因就可以预测这个人以后得某些病的风险。

他解释华大基因之所以要打通全产业链,是随着华大的发展历程,一步步地搭建起来的。“我们最早做人类基因组测序,之后发现测序技术还得自己掌握,如果不能掌握的话,很多大型的科学计划是没有办法实施的,因为你的试剂和仪器、设备的这些东西不可控。最后就想,我们要在上游把它发展起来,然后可控。再走一走你发现你弄出来的这些科学产品如果不推向临床,又没有什么太大的意义,我们自己当时又找不着人能够做这样的事情,那我们就自己又往下游走又走到下面去了。”

同时,打通全产业链可以使基因测序服务的成本大幅降低,这将大大推动基因测序服务的广泛应用和普及。在完成对CG的收购之后,王俊曾表示,这有助于华大基因降低对Ilumina等上游公司的依赖,测序服务成本也有望大幅降低。“并购之后,能够做一些让大家都非常兴奋的大型研究计划。CG有上游,华大基因有中下游,两家合起来以后,可以更快地推动这些计划。”

对华大基因的未来,王俊认为,不仅仅是打通基因全产业链,从规模、市场和整个体量,华大基因也都可以做到全世界最大。但是,未来华大会有多大的体量,王俊表示还无法估量,他说:“因为华大其实是个全球性的机构,每一个有需求的人,都应该可以被基因检测,然后很多他所需要的重要信息,逐步地能够被科学所解释,能够逐步地享受到相关产品和服务。所以某种意义上来说,现在很难去规划未来的五年和十年的发展状况会怎么样。”

BT和IT从根上是一起的

那么,一般被认为属于生物科学的基因产业将如何与互联网发生联系?二者结合又将发生什么?

王俊告诉网易科技,从华大基因诞生的第一天开始就是和IT技术结合的。

他解释,生命科学最早是观察性的科学,就是观察动植物的样子,发现其中的联系,很长一段时间这是生命科学最主流的东西。之后就逐渐变成了实验科学,开始用实验的方法来尝试解释观察到的现象,这些实验越做就越到分子层面。现在的生命科学变成了一种大数据科学,比如要研究糖尿病跟基因之间的关系,需要采集大量糖尿病人的基因数据,同时采集大量健康人的基因数据,然后来做统计模型,发现到底哪些基因跟疾病有关。

“所以,你看,BT和IT的结合并不是从今天才开始的,而是现在他们从根儿上就是一起的。”王俊说。

1999年,华大基因成立并且承担了人类基因组1%的工作。王俊解释,基因解读是个非常复杂的计算和数学问题。基因数据量很大,这些数据需要经过分析、处理,才能搞明白基因和疾病的关系,而这需要大量计算和存储。此外,计算方法和整个科学研究理论都需要有新的突破。“所以从一开始它就有别于在实验室里面拿离心管、枪头来做科学实验,它更多的是一种计算机数学和生物学的交叉学科。”

王俊认为,互联网更是这样,因为你所有数据和样本的搜集、所有数据的发放、科学家的参与,实际上是全球化的。这种全球化的东西,需要借助互联网的力量。

王俊介绍,华大基因在国外很多云存储和云计算的行为是在亚马逊的云上面部署的。在国内,华大基因有一个大型的计算中心,并且在香港有一个计算中心的布局,华大基因本身有一个核心的计算网络,同时还与一些机构合作。“在国内,我们跟阿里、腾讯、华为都在进行沟通,都在设立一些计划,看看有没有可能再往前再走一步,像百度等,我们其实都有一些正在探讨的,或者有一些是已经在合作的一些计划。”他透露。

当基因组网络化人类会怎样

2014年8月26日,华大基因旗下互联网云平台Genebook基因谱在北京国际会议中心的“中国互联网大会”现场搭起展台。华大基因官网发布消息称,“这标志着全球最大的基因研究中心华大基因开始迈向互联网时代,华大基因将基因科技和互联网有机结合,让基因科技更好地造福人类。”

华大基因的工作人员介绍,比如华大基因应用最广泛的无创产前基因检测,原来都是通过医院的渠道,通过医生向孕妇推荐。现在,华大基因希望通过互联网平台,直接到达消费者。这样可以使得基因检测的普及面更广。“我们希望借助这个平台触达每个人。”王俊说。

王俊指出,如果把每个人的数据都连起来,形成基因组网络,其中的机会不可估量。

他向网易科技解释:“互联网是把一台一台的计算机连起来,互联网的历史是从超级计算机开始的,然后有个人电脑,然后个人电脑开始连起来,变成互联网。计算机是这样,基因组序列也是一样的。”

“什么意思呢?”他接着说,“最开始的时候我们测定了一个人类基因组,就像一个超级计算机一样,现在可以每个人都承担得起自己的基因测序。但事实上再往下做呢?是把这些每个人测定的基因组连起来,这叫基因组的互联网,就是基因组的网络。”

王俊解释,这些基因之所以能够连得起来,就是因为我们地球上的任何两个人往前追溯,到一个时间点上都有一个共同的祖先。全世界的所有的男人,到十万年前左右都可以追溯到一条Y染色体,全世界所有的女人到十几万年前可以追溯到一条线粒体序列,基因之间是有联系的,有很多相似性。

比如一些疾病的发病率非常低,但事实上在全球范围内,你也是能够找到它相对应的案例的。所以这种网络效应连接起来的时候,是更厉害的。很多时候基因的互联网,可能对于生命健康所产生的效应会更加大。”他举例说。

王俊曾指出:“如果把每个人数据都连起来,形成基因组网络,我们就可能有机会把这个基因和病之间的关系搞清楚,在上面会形成各种各样的机会,这些机会、信息和知识是以前我们在做一个个人基因组时不可想象的。”

华大基因正在打造基因网络的道路上奔跑。“我们目前最重要的工作是推出一些医学和科技服务的产品,能够用到广大老百姓那去,让老百姓能够真正享受到基因科技带来的一些益处。”王俊说。

原文发布时间为:2015-07-16

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

转载地址:https://blog.csdn.net/weixin_34038652/article/details/90569943 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:使用hadoop restful api实现对集群信息的统计
下一篇:2017GAITC| 通用AI之路:继续大数据驱动深度学习还是另寻他途

发表评论

最新留言

能坚持,总会有不一样的收获!
[***.219.124.196]2024年04月16日 01时42分51秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

AJAX教程 2019-04-26
git基础 2019-04-26
git基础-01 2019-04-26
mysql-总结 2019-04-26
IPv4地址 2019-04-26
正则表达式 2019-04-26
redis 2019-04-26
术语-维护中 2019-04-26
software 2019-04-26
idea-ide 2019-04-26
technology 2019-04-26
spider-02 2019-04-26
spider-03 2019-04-26
spider-04 2019-04-26
spider-05 2019-04-26
spider-06 2019-04-26
spider-07 2019-04-26
Ubuntu环境配置 2019-04-26
CSDN日报190910:程序员都秃头,商务个个是人精 2019-04-26
CSDN日报190911:Unity3D开发小游戏;常见的五种神经网络 2019-04-26