本文由贝壳社BioMan专栏作者罗奇斌原创,欢迎大家转载文章,但转载文章的微信公众号或个人公众号请注明出自:贝壳社(微信号:iBio4P)。
罗奇斌
基因大数据解读专家,奇云诺德创始人
慕尼黑工业大学生物信息学博士,曾从师华大基因及中科院基因研究所联合创始人于军教授,国内首批生物信息人才。曾多年担任中科院北京基因研究所生物信息分析骨干工作,并出任北京路思达生物信息科技有限公司生物信息学总监,目前担任易科学生物信息学顾问以及“和君医药医疗健康沙龙”专家委员会委员。曾为业内多家生物科技公司搭建生物信息业务。 9年国内外生物信息项目管理经验,10年海内外生物信息教学经验。在国内组织并翻译出版书籍《临床生物信息学》,致力于基因数据解读培训在国内的推广,2014年在全国各地开展巡回的基础和临床生物信息公益讲座,为广大的基因大数据分析爱好者提供培训教育平台。
互联网拥抱基因行业,已经不是技术创新问题,而是模式创新问题。互联网的成熟和基因行业的崛起,在两个行业都经历过风风雨雨的青春期以后,两者的碰面和邂逅,注定不是简单的恋爱关系。
国内互联网公司已经是进入如火如荼的入口争夺和资源部署阶段,但是基因行业这个小众市场还是一个神秘的领域。先不论这个领域有着太多高学历人才和高技术含量的科技成果,仅仅是众多基因行业的业务受到国家政策管制和干预的风险,就让许多互联网公司望而却步。互联网公司看上基因行业并不是因为这个小众市场,而是看到了背后生物数据的可挖掘价值,但是什么时候能够进入基因行业,从哪里开始进入,这还是一个未知数。笔者从四个方面来谈谈互联网拥抱基因行业的可能。
通过云端技术部署基因行业
云端技术已经成为互联网公司的专宠。巨头们通过解决三个问题,逐步地将基因数据资源归入囊中。
云端解决的第一个问题:数据存储。
最早通过云端技术部署基因行业的互联网巨头,是谷歌和亚马逊(后来加入的微软和IBM等众多巨头均为跟风部署)。
以谷歌为例,早在2013年3月,谷歌已经邀请了基因组学领域的科学家将DNA数据转移到谷歌的服务器上。谷歌将其服务器称为Google Genomics。谷歌通过自身占有的数据库搜索技术优势,将人类的基因数据进行备份和建立索引,同时开发了一系列的应用程序接口API。
亚马逊的AWS云服务和基因行业的合作可以一直追溯到NCBI提供的全球范围的基因信息比对搜索引擎。2012年,亚马逊的云服务已经接管了国际千人基因组计划的基因数据存储,当时这是世界上最大的人类遗传学数据库,并且数据是公开和免费的。
国内互联网公司必须要通过免费占据基因信息入口
谷歌和亚马逊针对DNA存储云端化服务在市场上交锋已经一年了,双方直接进行价格战的结果是,谷歌提供每个基因组的年存储费用只需要25美金。目前每个人的基因组原始数据在100G左右,谷歌提供压缩数据服务以后这个数据能压缩到1G以内,也是说每年一个人的基因组数据云存储只需要0.25美金!
笔者认为,国内互联网公司必须要通过免费占据基因信息入口。数据的价值在于挖掘和互动,如果这些价值超过了数据本身的产出和存储价值,免费是大势所趋。
云端解决的第二个问题:数据运算。
云存储的解决会衍生出一批生物信息创业公司。为什么呢?
道理很简单,云端技术门槛太高了,老百姓不能直接使用。看看我们手机里面安装的都是APP而不是云端服务器API软件就知道了。这里会衍生出一个很复杂的云计算产业,笔者不会展开这么复杂的结构图来讲解,那样我们就跑题了。
云服务提供商将服务器集中起来,不仅提供云端的存储,而且还提供云端的运算和资源的管理等服务。有了这个良好低价的生态环境,众多的互联网公司诞生了。在基因行业,催生了Tute Genomics, DNANexus, OneCodex, Seven Bridges Genomics和NextCode Health等生物信息公司。这些公司里面有使用谷歌的云存储和云计算服务的,也有基于亚马逊的AWS云端服务搭建的生物信息大数据平台。
云存储的解决会衍生出一批生物信息创业公司
2013年11月,谷歌投资的23andMe公司遭遇美国FDA(食品与药品监督管理局)的封杀,2014年1月4日,谷歌领头对DNANexus公司进行1500万美金的C轮投资,DNANexus是一家DNA数据管理和分析在线工具提供商。谷歌这些互联网巨头对数据应用端的企业进行投资,其目的在于打造一个对于自身有利的闭环生态环境。
云端解决的第三个问题:数据安全。
云端解决的数据安全归根结底集中在两个方面:一个是数据传输的安全性,另一个是检索的安全性。
这里有一个很有趣的商机。我们知道互联网巨头已经把数据应用开发放权给小公司来形成生态环境了,到了数据安全这一环,如何把权力回收呢?
答案还是进行放权。谷歌推行的做法是:制定规则。
谷歌推行的做法是:制定规则
数据安全是一块鸡肋,数据传输出问题了,你说责任谁来承担?客户操作、网络传输、加密服务商,保险公司、国家安全局、云服务提供商等等都逃不掉干涉。美国人没有解决这个问题,到今天还在整天吵着数据安全问题,我们国内目前肯定也拿不出一个好的解决方案。
笔者认为,这里的数据传输安全问题,需要联盟和行业协会来制定规则划清责权;数据检索的安全问题,交给检索公司来解决(美国是谷歌,国内是百度为代表)。如果解决方不是责任承担方的话,交给政府行业监督部门来仲裁。(笔者以后会针对这一方面出系列文章)
云端化的忧患
基因信息的云端化会引发隐私问题的出现,和数据安全性问题不同,基因信息和个人信息的绑定引发的社会问题,远远大于数据本身泄漏造成的安全问题。这句话如何理解呢?
比如我的密码泄露了,这是数据安全问题,我知道通过及时封锁账号和修改密码,我以后还是可以继续使用同一个账号的。但是基因信息具有无法修改遗传性,一旦和个人信息绑定,这里出现的隐私被侵犯问题是不可解决的,难道我们修改自己的遗传基因信息?还是修改我们在社会中已经形成的个人信息?显然,修改任何一方都是不可行的。
基因信息的云端化会引发隐私问题的出现
问题就来了:谁有资格管理消费者的基因信息呢?
在这样的环境下,会首先催生联盟的产生。美国最早成立了一个由医疗机构、研究型大学、生命科学公司组成的联盟组织:全球基因组学与健康联盟(Global Alliance for Genomics and Health)。这个联盟需要解决基因数据存储在哪,谁有访问权限,如何保护隐私等问题。目前,包括笔者创立的奇云诺德在内,众多与基因信息云计算相关的国内外企业、机构和大学都加入了该联盟。谷歌在2014年2月28日宣传加入该联盟,接下来会利用已经较为成熟的Google Genomics存储平台开发用户使用的API,方便大规模基因数据的导入、处理、存储和搜索。
联盟的推动,会让国家出台相关的政策。笔者预测最有可能出现的一个环节就是对云服务提供商进行监管,很有可能政府会以颁发牌照的方式逐步对云服务商进行管制。国内互联网公司中能找到和亚马逊类似的巨头是阿里巴巴,而能够和谷歌类比的是百度,不管这些类似的国内互联网巨头如何部署基因行业,在云端技术方面支持基因行业已经是势在必行。
2012年10月31日,中国政府网公布了《人类遗传资源管理条例(征求意见稿)》,如果我们仔细研究条例的内容,能够得到一个信息,国家开始对于人类遗传资源(含有人体基因组、基因及其产物的器官、组织、细胞、核酸、核酸制品等资源材料及其产生的信息资料)开始进行管制了。
从这些信息中我们可以看出来,国家不仅对于基因样本资源会有规范,对于基因信息资源也会逐步出台相关的政策。作为走在最前线的云端存储和运算服务商,能避免政府的管制吗?
通过互联网医疗整合基因行业
在谷歌如火如荼的占据了基因信息入口以后,作为美国另一名互联网巨头亚马逊也紧锣密鼓的从另一条小道后来居上。这一条小道,就是互联网医疗。
亚马逊高层和FDA高层曾秘密进行了一些会晤
去年美国《现代医学》披露了亚马逊高层和FDA高层曾秘密进行了一些会晤,这次双方接触表明上看来,只是FDA在斥责亚马逊需要清理一下交易平台的处方药信息。但是同样的和FDA高层接触的,可不仅仅只有亚马逊一家。
苹果高层在2013年就秘密接触过FDA,事隔两年以后,苹果高调宣布进军医疗健康市场,最近推出的苹果智能手表也作为部署互联网医疗的一个硬件终端直接切入到消费者市场。
最近推出的苹果智能手表是进入医疗健康行业的道具
从种种迹象来看,笔者预测2015亚马逊等弯道超车的互联网巨头会通过互联网医疗直接切入基因行业,利用物联网的入口优势来占据基因信息资源的源头—终端消费者。
德勤咨询在其《2020年健康医疗预测报告》中预测,到2020年在线病人将呈指数级增长。从医疗到健康,从医院到家庭,远程医疗和移动医疗的发展,最终会使家庭成为医护的主要场所。
基因检测和可穿戴设备的出现会是互联网医疗的主力军。从消费者角度来看,基因信息资源要实现从被动获取到主动获取,需要将基因测序和可穿戴设备结合起来。怎么理解这里的逻辑呢?
笔者认为,基因检测的数据在一个人的健康数据里面占有的比例不会超过10%。这里还包括其他数据的采集,包括人的行为数据和医疗记录数据等;以及周围生活的环境数据,包括空气质量,气候和微生物等。从这点来看,基因检测收集到的是人的遗传信息,可穿戴设备收集的是人的行为数据。这两部分需要整合在一起,同时通过传感器收集周围生活的环境数据,通过体检和医疗机构收集医疗记录数据,这些数据就构成了互联网医疗的整体数据集了。
国内的互联网巨头BAT,已经在互联网医疗市场上面直接交锋。今年1月份,百度已经正式成立移动医疗事业部,这个新成立的部门会直接整合百度原有的各项移动健康和移动医疗业务。从2月份百度与国家卫计委的合作发布会来看,政府推行的新医改政策会拉来互联网巨头们一起来玩,这样的趋势下,争夺医疗健康终端消费者的入口之战,会在2015年正式上演。
百度医疗大脑进军医疗健康行业
基因行业是一个小众市场,这场医疗健康互联网大战势必会带动基因行业的企业站队。阿里巴巴通过电商在不断的逼退药企,百度则拥抱了医院,腾讯抛出“智慧医疗”来对抗阿里的“未来医院”。。。这一系列的交锋,最后还是会落地到一处,那就是“以人为本”,所有的部署最终的目标都是抢占用户。基因行业的企业必须明白这一点,目前国内市场的主战不是基因行业而是医疗行业,基因测序注定只能屈居二位,甚至第三位第四位。能否摆正自己的位置,需要基因行业的企业冷静下来思考,而不是高调的抛出基因压倒一切的姿态。
腾讯抛出“智慧医疗”来对抗阿里的“未来医院”
在全球互联网医疗如火如荼进行的时候,中国移动医疗行业也进入了快速增长期。2014年我国移动医疗健康市场规模达到28.4亿元,预计到2017年,将突破125亿元,年复合增长率查过70%。这个行业会带动上下游产业的发展,整个市场规模预计在未来20年会突破万亿大关。无怪乎某些基因行业的领头企业在鼓吹这个万亿级的大市场,指的是整个健康产业而言。不是我们基因行业的企业在独占这个健康市场,而是全社会在分这块大蛋糕,别忘了,互联网巨头们都在盯着呢。
通过基因测序邂逅基因行业
互联网邂逅基因检测的结局,注定是要免费。
华大基因的王俊曾经说过,基因检测什么时候可以免费呢?免费实施的到来事实上在于基因本身的数据价值远远大于产生他的数据所需要的成本。对于华大来讲这样一个趋势延续我们认为在2019年左右,5年左右时间我们可以真正达到这样的结果。
从王俊的这个分析来看,他已经站在了互联网思维这个角度来看待基因检测产品了。因为互联网对于数据的价值追求是很高的,数据价值的体现不在于数据本身,而在于数据转化成为信息以后的价值,这个信息的价值需要用户的参与来实现。
互联网看上基因检测
那么互联网为什么会看上基因检测呢?我们可以从下面这个问题里面找到答案:消费者需要什么?
消费者需要的是基因检测吗?如果是,那么互联网的出现必须能够帮助解决这个需求出现的每个环节,比如检测在线的追踪,产品比价的平台,在线报告的易读,后续需求对接的便利,基因信息授权的可靠,数据和隐私的安全等等。
消费者需要的是互联网吗?如果是,基因检测只能作为互联网的一个卖点,简单的说,它就是一个新的瓶子,里面装的还是旧酒。所以这里有一个很重要的潜台词,是互联网需要基因检测,还是基因检测需要互联网呢?
互联网和基因检测有没有将来?
笔者认为,互联网和基因检测的邂逅,基因检测注定是小三。道理很简单,用户从哪里来?一定是从互联网引来的用户,而不是在基因检测入口引来的用户。基因检测入口的用户在现阶段只能从医疗机构和体检中心进入,从消费者市场进入还不太现实(只有一种情况例外,那就是闭环的终端产品,以后笔者会在另一个系列细讲)。从互联网入口引来的用户,带有天然的属性,那就是对收集数据的产品敏感度和抵触性很高,这样造成用户的获取成本不断地提高。互联网急需更多的花瓶来吸引用户。
基因检测是一个很好的花瓶,能够给互联网带来新鲜的血液吸引用户,增加用户粘性,但是不能成为正房。不以结婚为目的的恋爱都是耍流氓。互联网和基因检测谈恋爱,注定只是一场耍流氓的戏。醉翁之意不在酒,双方都是明白人,都是心照不宣。最后买单的,只能是政府和投资人了(笔者和读者们一起搬小板凳静观世纪佳缘基因配对产品的结局)。
通过投资孵化包养基因行业
投资孵化初创公司来抢占行业资源,这不是新的模式,而是资本运营的一种传统方式。
Google Ventures是Google在2009年3月成立的风险投资基金,总部位于旧金山。截止到2014年底,Google Ventures交出的成绩单里面,总共投资了282家公司,其中有16家已经上市或被收购。在管理着16亿美金的Google Ventures合伙人里面,Bill Maris负责投资生命科学和医疗技术领域,在所有投资里面,对生命科学领域的投资已经占总投资资金的36%。其中包括耳熟能详的Flatiron Health, DNANexus, One Medical等公司。
谷歌对生命科学领域的投资已经占总投资资金的36%
从互联网巨头对生命科学领域的投资部署来看,基因行业仅仅是作为投资的方向和重点之一,真正说到战略部署,还远远没有达到基因领域业内人士的期望。从笔者前面谈到的三个方面来看,通过投资孵化基因公司,对于国内互联网巨头来说,也许不是一笔好的买卖。为什么呢?
因为国内基因行业还在初期发展阶段,更多初创企业还没有真正进入到市场中验证其商业模式是否可行,同时市场中出现竞争的公司还没有达到一个饱和状态。在这个时候过早投注任何一家公司,风险都是极高的,除非真的是有钱任性和看好跑道。这样的投资注定是包养型的部署。
最后笔者需要指出的是,基因行业和互联网的邂逅,注定不是简单的恋爱关系,这里的博弈和较量,只能用时间证明。笔者在接下来的系列,会从两者可能产生闭环的产品上面做一个透彻的分析,也许从中我们能看到在健康产业风口的哪个环节能最早实现基因信息的价值落地。