生命科学领域的“辽宁号”:Revolocity测序系统
按惯例咱先扯点儿废话。最近“精准医学”(Precision Medicine)大家讨论的比较多,各种顶级学者们踩着西瓜皮粉墨登场:滑哪儿说哪儿。我的问题是:说的对呢,还是不对呢?或者说,你咋判断某人讲精准医学不是在跑火车?这里咱以一篇吴老师写的范文《“精确医学”须谨慎解读》来介绍如何判断讲精准医学的是否足够精准。
第一,精准医学这个概念不是空穴来风,其理论基础是人类基因组计划。所以谈精准医学,如果上来不先回顾基因组计划,那么肯定是忽悠。如果各位可以看到,吴老师这篇文章上来就先介绍了人类基因组计划;第二,“精准”并不是指医学的诊断、治疗和预后达到100%的准确,而是指医学的基础应该建立在分子生物学上。因此精准医学计划开篇就提出:基于分子生物学的人类疾病分类的新方法(a New Taxonomy of human disease based on molecular biology);第三,为什么基于分子生物学可以达到精准,或者说,可能达到精准?因为遗传物质的基本单元是碱基,而人类基因组计划实现了最高解析度的鉴定:单个碱基的测定;第四,精准医学计划的三大目标是:建立“疾病分类的新方法”(New Taxonomy of Disease),为达到这一目标需要建立“信息共享”(Information Commons),为建立信息共享又需要建立可融合多参数的“知识网络”(Knowledge Network)。第五,信息共享要做个啥?其实就是要做成生命科学与医学的“地理信息系统”(Geographic Information System, GIS)(图1)。前段时间看博客,有搞GIS的在吐槽说前途迷茫,咱当时看着就乐了:精准医学目标就是山寨出来个生命科学版的GIS;第六,老美玩超级大项目历来是玩上瘾的,原子弹、登月和基因组,这都绝对是老美拿得出手可以到处吹牛逼还不上税你还不能不服的大家伙,精准医学计划,很有可能是老美最后玩出来的第四个超级项目,有质疑老美在玩儿忽悠的,兄弟我劝你还是洗洗睡吧,我要说老美这事儿搞不定,您能相信不?第七,精准医学最精准的定义是什么?师弟说:生物信息学在生命科学与医学中的应用。你若觉得这个定义不够精准,兄弟我洗耳恭听?第八,你要问,你扯了这么多,我咋知道你是不是在忽悠?这个很简单:老美搞超级计划要忽悠国会掏钱,他就得有个谱来扯是不?老美是有的:
1. Mapping and Sequencing theHuman Genome. National Research Council (US) Committee on Mapping andSequencing the Human Genome. Washington (DC): National Academies Press (US);1988. ISBN-10: 0-309-03840-5.
2. Toward Precision Medicine: Buildinga Knowledge Network for Biomedical Research and a New Taxonomy of Disease. NationalResearch Council (US) Committee on A Framework for Developing a New Taxonomy ofDisease. Washington (DC): National Academies Press (US); 2011. ISBN-13:978-0-309-22222-8, ISBN-10: 0-309-22222-2.
你只需要简单的读一下第二份报告的摘要,五分钟之内相信你一定可以做一个正确的判断。所以前段时间给咱生信的本科生讲课,说生信有没有前途呢?后来课堂上思考了半天,说,呃,老美写人类基因组计划,问国家要钱,每年给两个亿刀给15年(…an annual budget of $200 million over the next 15 years),后来2003年完成,前后正好15年。所以精准医学搞不好要做个30年,所以大家不用担心30年内生信的前途。至于30年之后生信还有没有前途,咳,那时候哥们儿我也该退休了,咱就不操那闲心了。
结论:第一,当年在科大,吴老师是我的顶头上司,一般不写科普性文章,写了一般绝对够精准;第二,花五分钟时间读一下摘要可以免疫很多忽悠;第三,这两份报告对于生信领域的学者和学生,应该是必读;第四,老美忽悠超级计划很有意思,他不谈科学谈技术,他谈技术也只是含含糊糊给你画个大饼,具体你自己想办法解决。所以这种报告不限制人的思维,尤其是年轻人立即能够发现广阔的机会。
好,扯了这么多,讲正题。
==============================================
最近在写论文,所以睡得就不怎么好。大清早醒来一看新闻,乐了:《华大基因发布完全集成式“超级测序仪”》。一般来说,公开场合里大家对华大的评价一边倒:垃圾中的战斗机。鄙视、不屑、抗议、谩骂、看衰,从华大建立开始到今天一直如此,所以很多学者每天三件事:吃饭、睡觉、骂华大。对华大的各种指责中,其中一条最狠的是:你就知道花纳税人的钱买人家老美的测序仪然后做些垃圾分析跑NCS上灌水。这个指责看上去合理并且也被广泛接受,但事实上没有道理。因为,第一,再说一遍,华大是咱生信的剑宗,做测序仪那是生物医学工程的事情,要求一个生信公司做测序仪你不觉得搞笑?淘宝不造汽车,
京东不造飞机,小米也不产原子弹是不?第二,生信不发NCS你说没有Impact factor,生信发NCS你又说是在灌水,你究竟要哪样啊?你看不懂就叫灌水?相对论那公式你看懂了不?你看不懂人家老爱就是在灌水?第三,所以学者要培养独立思考的能力,不要人云亦云,你那些PCR仪、电泳仪、显微镜都哪儿来的?不是你造的吧?海尔的冰箱你也不想买对吧?你咋好意思拿这个来说华大?
所以华大很有意思,大家要是看好他,未必做得出来,但大家集体看衰他,一般肯定也都做出来了。因为大家从来没有看好他过,所以华大至今基本还是做啥啥成。当然华大不算特例,君不见洋诸葛们看衰我国几十年了,经济发展不挺好?由此可见“大家”们做的计算预测模型还是远不够准确。
所以虽然华大是家生信的公司,但不蒸馒头争了口气,13年收购了美国的CG公司,开始做自己的测序仪。当然喽,全国人民一致认为:华大搞不定。于是纷纷搬过小马扎,捧着爆米花准备看笑话。这里我很不好意思的问一句:看见了也拉上我一起哈。
打电话问了神童,华大这款测序仪叫Revolocity,自称是“超级测序仪”。为什么是“超级”?因为基本上实现了从样本的采集、处理、文库制备、测序以及初步的数据分析,一站式的服务。简而言之,有这玩意儿,你丢个样本进去,就可以去喝咖啡、享受生活,完了回来收收数据差不多也就可以写paper,或者设计进一步的实验方案了。所以这套系统可以称为“超级测序系统”,不是简单的测序仪。如果你认为测序仪是母舰,那么各种生物信息学工具就是战斗机。因为测序仪本身用的是CG的技术,所以称为“辽宁号”并不为过。当然讲到这里你要问:飞机呢?答:BGI Online(参见《华大基因有没有抄袭?》)。整合BGI Online以及华大之前开发的各种小玩具儿,辽宁号立马也就有战斗力了,分分钟的事情。
讲到这里,你会有疑问:(1) Revolocity这玩意儿能测得准吗?呃,这个吧,CG是基于二代测序的原理,这个原理的应用已经比较多,技术上的各种坑早就差不多给填平了,所以准确性相当的高。原理摆在这儿,你让华大做到测得不准还是有点儿困难,而且年轻人精力好,肯折腾,虽然说写个文档可能抄一抄,但技术上应该不含糊,而且也会继续改进,所以这事儿大家可以有期待;(2) 这“垃圾玩意儿”,有人买吗?答:有,澳大利亚和荷兰的两家单位已经买了,并且买的人肯定不能跟头头们汇报说我买了台垃圾是不?是吧,所以既然老外有信心,那咱是不是也可以有点儿信心?(3) 为啥华大要自己做测序仪?答:据说是跟Illumina公司闹翻了。至于怎么闹翻的,据说是两家的老总们一起吃饭,讨论美国的亚洲鲤鱼究竟是应该拿原子弹轰还是派中国人去吃,意见有分歧,吵急了大家就动上手了,老美仗着人高马大觉得拿下没问题,结果华大高管们好几个南少林的俗家弟子,大家和和气气的切磋了一下,老美也没占到便宜,一怒之下就不跟华大玩儿了,所以华大只好自己做测序仪。