0
下面转的这篇文章有点不符帖子标题,呵呵。不想开新帖了,存于此处。
第四个科学发现范式
同人于野
在你的第十二条染色体上有个叫做 LRRK2 的基因。我们假设,仅仅是假设,你的这个基因有一个小小的变异。这个变异的结果是使你有30%到75%的可能性在未来患上帕金森综合症。
帕金森综合症的原理大约是大脑出于某种原因降低了对多巴胺神经元的生产,而这些多巴胺神经元对控制身体运动至关重要,结果就是逐渐失去行动能力。很多名人,包括一些特别有学问的人得这个病。大脑为什么会出这种问题,怎么治疗,科学家并不知道。
不用说治疗,甚至连 LRRK2 基因与帕金森症的关系,都是直到2004年才被发现,此前人们甚至认为帕金森症不会遗传。
你怎么办呢?
好消息是并非所有LRRK2基因变异的人都会得帕金森症。这个事实暗示了一种思路。这个思路并不奇特甚至司空见惯,但由于当前技术的进步,它正在变成一个了不起的思路。微软公司对这个思路非常兴奋,称之为 “the fourth paradigm of science”,第四个科研范式。
这个思路是,那些同样有LRRK2基因变异的人,他们到底做了什么,以至于没有得病?也许我们不会知道其中的原理,但只要能找到这么一件事,做了这件事就不怕LRRK2基因变异,那就已经足够好了。就好像《午夜凶铃》中死的人多了以后,人们发现只要做把录像带传给别人看这件事就不会死一样。
这就是 Google 创始人之一,LRRK2基因变异者,Sergey Brin 要做的事。他的爸爸是数学家,他的妈妈是应用数学家,他自己本科在是数学系念的,所以他治病的办法是玩数据。
Brin 的老婆搞了个个人基因服务公司,23andMe。据最新一期《连线》杂志报道,借助这个公司,Brin 有一个系统的,或者说暴力的,解决帕金森综合症的办法。我理解这个办法是这样的:
1. 召集一万名帕金森症患者,彻查他们的基因,问卷调查他们的既往病史,生活环境和所有生活惯,从中发现共性。这些共性可能就是帕金森症的病因。
2. 再去找那些也有这些共性的人但是没有得帕金森症的人,看看他们做了什么,其中有什么共性。这个共性就是防治办法。
这的确是非常简单的思路,但是要做的话却是相当的难。一个显而易见的难点是数据量实在太大。进行这样海量的数据分析,非得有今天最强的计算机,尤其是极高的数据存储能力不可。这就是微软对此兴奋的原因。想法是容易的,技术条件是困难的。搞这样的科研对微软来说是非常好的机会(至少可以提升公司形象),以至于微软找了一帮人,整了一本书,The Fourth Paradigm: Data-Intensive Scientific Discovery,并大力推广。(微软提供全文免费下载)。
下面我来谈谈我的看法。
所谓科学发现的前三个范式,是第一,实验;第二,理论;第三,模拟。我认为从“硬度”角度讲,这三个范式的重要性一个比一个低。实验是最硬的科学发现,你理论说得再漂亮,宇宙加速膨胀就是加速膨胀,Higgs 粒子万一找不到就是找不到,这是实打实的东西。
而模拟则是实验不好做,理论计算又没法算的情况下一个没有办法的办法。如果你承认我用的方程都是对的,你大约也会承认我模拟的结果,但这个结果永远都需要实验的检验。
与这三个范式相比,这个“第四范式”的硬度更低一些。它既不能像理论和模拟那样在一定程度上告诉你“为什么”,更不能像实验那样明确地告诉你“是什么”。海量数据分析,只能告诉你“大概是什么”。比如数据分析可以告诉你喝咖啡对降低帕金森症发病率有好处,但是说不清到底是咖啡因的作用还是别的作用。它甚至说不清这种好处到底有多大。
历史上阿司匹林对很多病症有疗效,而科学家并不知道为什么会有这种疗效。这些疗效都是“统计”发现的。
实际上,科学家一直都在从以往数据中寻找规律,提出猜想,再做验证。这就是所谓 “empirical study”,或者物理学家有时候使用的“经验公式”。《连线》这篇文章提供的那个图示的证明 Gaucher’s disease 患者得帕金森症的可能性高五倍的例子,并没有说明白现在这个“第四范式”与此有什么不同,无非是海量数据分析的数据库更大而已。
我认为,其实“第四范式”的真正了不起之处在于“客观”这两个字。此前,模式识别主要是主观的。是人在经验中发现规律,提出一个主观的假设,再去搜集更多案例来验证这个假设。而现在这个第四范式,则是让计算机自己从海量的数据发现模式,也就是共性,是客观的。这样就允许我们有一些惊喜。
但是很多人并不看好这个做法,因为数据的噪音太大。
还有一个更根本的困难。以帕金森症为例,也许发病的原因和不发病的原因都是不可观测的,比如说纯粹的偶然因素,或者说是问卷调查问不出来的因素。一个人的基因和生活自由度实在是太多,程序永远都不可能确保把所有的变量都考察到。纯粹的客观其实是做不到的,在你设定问卷内容的同时,你已经主观地设定了你想要考察的范围。第四范式要想有所发现,还是需要一点运气的。
不过 Brin 显然有理由看好这个做法。从海量数据中发现趋势是 google 一直都在做的,比如说通过搜索关键词的趋势判断流感,google 比CDC要快得多。假设 google 有一个机制自动发现任何被突然大量搜索的词,这种模式识别显然就是真正客观而不是主观的。人的生活自由度几乎是无限的,但所有词汇的组合是有限的,可是我怀疑这种组合的数字之大,就连 google 也做不到实时监控每一个可能的搜索组合。更实际的做法也许还是大量地预先设定一些可能有意义的关键词。
所以我认为“更客观的模式识别”,是第四范例的关键。
-----------------------------------------------------------------------------
#4 by bai_qi on 六月 24, 2010 - 6:26 下午
这不就是数据挖掘嘛?
沃尔玛用数据挖掘技术无意中发现婴儿尿布与啤酒的销量呈现正相关的关系,进一步分析发现是年轻的爸爸经常会被妈妈叫去买尿布,有时就会顺手捎一支啤酒回来呷。
后面沃尔玛就把啤酒与尿布安排在同一个地方,结果,啤酒销量大涨!!
#14 by chili on 六月 27, 2010 - 4:49 上午
流行病学研究,大量病例统计是普通方法。
google们对医疗表现出极大兴趣是理所当然的。
比如美国的电子病历系统,遭到医院的强烈抵制,花费无数的钱才启动。
病历从纸张变成数据存储,看似简单的变化,也有极深的未来影响。一旦数百万数千万病历都存储起来后,google就可以从这些人的病历中挖掘各种相关性。一个人如果要检查身体,搜索引擎就可以根据你的年龄体重家庭背景,然后和数百万既往病历对比,找出最大可能性。
一句话,搜索引擎的诊断,要远远比任何内科医生都精准。
#15 by 同人于野 on 六月 27, 2010 - 2:12 下午
这样用数据分析方法搞出来的一个诊断软件叫做 Isabel,我记得好像是被微软收购了。我估计搜索引擎恐怕目前还没有碰专业的医疗数据库。Google 分析流感也只是看人们在其网站搜索的关键词而已。医疗数据库需要医院的配合,Isabel 这样的软件是跟医院关系密切的人整出来的。当然原理还是一样的,技术就那么几下子没什么了不起,有没有足够大的数据库才是关键。
0
http://www.taoguba.com.cn/Article/265443/1
据市场研究公司Forrester预测,2009年美国电子阅读器销售量为300万台,而2010年的销售量将会飙升至1000万。DisplaySearch最近一份报告则称,2010年中国的电子阅读器销量将从2009年的80万台跃升至300万台,
国内电子阅读器市场将启动,相关上市公司中的受益企业包括显示材料厂商莱宝高科(002106)、正在建立数字资源库的时代传媒(000504)以及终端制造商大唐电信(600198)。
------------------再加一个汉王科技002362
其实,上面这些都只能勉强算电子阅读概念股。
0
华为“跨界”切入电子阅读领域
文章来源:第一财经日报 日期:2010年01月22日
CBN记者 孙进
全球最大的网上图书零售商亚马逊对圣诞节当天的统计数据显示,该网站电子图书内容的销售量首次超过传统印刷书籍。2009年12月14日,该网站在全世界范围内卖出了950万本电子图书,相当于每秒钟就有110本书被买走
面对去年营收增长265%,2010年电子书阅读器销量将达百亿美元,未来电子书籍下载将达千亿美元级别的市场,中国最大的通信设备商华为也忍不住要“跨界”。
昨日,华为首次发布了其移动阅读集成解决方案和产品。可提供包括移动出版平台、内容分发、用户营销、手机客户端软件、手持阅读器等。
研究机构DisplaySearch预测,电子阅读器市场2009年营收增长265%,全球电子阅读器市场出货将在2013年达到2000万部,而中国数字出版产业将在未来几年保持年增长率50%以上。
新闻出版总署科技与数字出版司数字出版处处长王强表示,预计今年数字出版产业将超过750亿元。
华为软件公司副总裁黄冀透露,华为在2008年便启动了对电子阅读解决方案的研究,并一直与中国移动等保持着产业链上的合作。目前,由华为承建的中国移动手机阅读业务已经于2010年1月正式商用,华为首款带屏幕触摸功能的手持阅读器也同步面市。
黄冀预计,未来五年应该有超过30%的手机用户,通过手机和电子书来进行移动阅读,到2020年整个数字出版的销售额将占到整个出版业的一半左右,到2030年,90%的图书都将出版网络版本。国际上一些最著名的运营商都在往移动阅读和出版方向努力,例如新加坡电信等都在往这个方向转型,这是整个业界的趋势。
易观国际高级分析师张亚男表示,2010年中国手机阅读市场的活跃用户数将达到2亿人,而中国移动2009年3月建立移动阅读基地,12月份向市场推出G3的电子阅读器。中国电信、中国联通都会涌入这个市场。
整个移动阅读产业链由几个部分构成:一是电信运营商,提供网络支持;二是互联网和媒体提供商,提供阅读内容;三是技术支撑,包括华为这样的公司;四是终端厂商,提供各种各样差异化服务的企业。
中国移动数据部个人客户部高级项目经理刘宇星表示,95%手机上网用户愿意用碎片的时间进行手机阅读,由此可见,手机阅读的发展具有非常明显的市场用户需求。从用户来看,目前成人读书的阅读率是49%,61%的国民对阅读情况不太满意,这就需要不断地创新文化传播的方式和手段,不断提升全民阅读率。
全球最大的网上图书零售商亚马逊对圣诞节当天的统计数据显示,该网站电子图书内容的销售量首次超过传统印刷书籍。除2009年12月25日电子图书销量首次超过传统印刷书籍外,12月14日,该网站在全世界范围内卖出了950万本电子图书,相当于每秒钟就有110本书被买走。传统书籍读者向电子化过渡的速度,将比音乐或者电影用户从CD和DVD向MP3、MP4等移动设备迁移的速度更快。
目前,许多厂商都纷纷推出类似Kindle的电子书阅读器。美国最大连锁书店Barnes &Noble去年10月发布了Nook电子阅读器,希望与亚马逊Kindle竞争。苹果也正以一款新型平板电脑作准备,这种设备也可用作电子阅读器。索尼已开始用多款电子书阅读器与亚马逊展开了激烈的市场份额竞争。
三星以及中国的汉王等,都在大力发展这一细分市场。新闻集团、时代等五家传媒巨头也要成立一家合资企业,开发能应用于多种设备、支持显示彩色内容的电子阅读技术。
0
收购AdMob 谷歌切入苹果移动商业领域要害
2009-11-10 12:01:55 来源: 网易科技报道
网易科技讯 11月10日消息,据国外媒体报道,谷歌7.5亿美元收购手机广告公司AdMob表明谷歌与苹果在移动互联网领域的战争进入了新的阶段。此次并购让谷歌得到了这个增长最快的市场的最强大的合作伙伴。这是这场无声的战争中谷歌最新的一次出击。
周五,谷歌第一次把广告放在自己的首页上,这是一则摩托罗拉Droid智能手机的广告。Droid由无线运营商Verizon独家运营,基于谷歌Android移动操作系统。种种迹象表明,Droid将会成为苹果iPhone最强大的竞争对手。谷歌的登录主页的广告位置是无价之宝,这使得Verizon轻松地卖出了上百万部Droid,此外Droid在谷歌上搜索量也达到了上百万次。
除此之外,谷歌还与运营商AT&T商谈能否让谷歌的VoIP应用于苹果iPhone。看来这场两大巨头间的残酷的战争已经拉开序幕了。收购AdMob,谷歌就在一个高速发展的领域获取了广告收入来源。
此次收购与谷歌2007年收购Doubleclick颇为类似。谷歌的战略就是在移动互联网领域尽可能多得到消费者和广告收入。谷歌还希望能够向广告主销售他们所希望的任何形式的广告,包括移动互联网领域的文字广告、展示广告和植入广告。
从某些方面上讲,这非常有逻辑。几十年前,当电脑界面控制计算机领域时,苹果和微软都推出了图形用户界面(graphical user interfaces),他们相信这让每个用户更轻松地运用电脑。谁控制了用户界面谁就控制了最大价值空间。在计算机领域,微软很快超过了在硬件和软件领域发展的公司,微软从电脑界面例如核心运营系统以及应用软件上获取大量收入。在这方面,苹果只是维持很小的市场份额。
现在战争在手机领域又打响了。据估计,在未来的十几年里,手机将是互联网应用增长最快的领域。此前苹果推出的iPhone以及用户界面为苹果提供了大量消费数据。当然,在智能手机领域黑莓拥有更大的市场份额。但是在数据消费上黑莓远远不是iPhone的对手。苹果也正在快速占领黑莓的市场份额。
谷歌敏感地看到了这一趋势,并用不同方式拓展自己的战略。谷歌的第一件武器是自己的搜索。搜索是手机的一个重要功能应用,随着语音搜索逐渐替代文字输入搜索,谷歌和其他竞争对手一样希望手机搜索应用更广泛。谷歌在手机领域的搜索比电脑上的搜索占据更明显的领导地位。但是谷歌在苹果Safari浏览器上运行却存在缺陷,而Safari浏览器是iPhone手机使用的唯一一款浏览器。
即使用户在iPhone上使用苹果Safari浏览器,他们看到的界面也是谷歌的,这就是为什么我建议苹果应该进入手机搜索市场。
第二步,谷歌开始大力推广自己的Android操作系统。10月Android开始正式运用于手机设备,并将在2010年初,应用于大多数主要的第三方手机。推广Android操作系统,谷歌获取了另外一种用户界面控制权。当然,手机制造商和运营商拥有手机外观和运营的掌控权,但是操作系统拥有更强大的影响力。
谷歌快速建立起来的Android品牌效应,留给运营商的选择越来越少,只能在如何构建界面以及如何让其相似并能够通用方面跟随谷歌的步伐。运营商和手机制造商见证了消费者对于iPhone的狂热,现在他们很清楚自己从前的失败并认识到应在智能手机领域赢得消费者的忠诚度。他们看起来更倾向于让谷歌作为他们的领导者来打败苹果和黑莓。
就在谷歌的手机搜索和Android操作系统推广的风风火火的时候,谷歌还积极地拓展另一块能够带来收入的领域。谷歌的新导航软件的运行与搜索紧密联系,这也将会为其带来上百万新用户,这些用户从前惯使用Garmin或者TomTom的付费的GPS设备或者iPhone上的应用服务。谷歌的声音识别技术应用于iPhone成为一个重大新闻,此前,AOL 的子公司Mapquest长期提供类似的服务,并按月付费。
但是谷歌进入GPS领域的新闻只是谷歌品牌扩张迅猛的又一例证。谷歌还进入了音乐和视频内容领域。谷歌的YouTube具有在不同平台上运行的手机应用功能。在音乐领域,谷歌的音乐搜索迅速进入领先位置,有一天可能成为苹果iTunes的强劲对手。
现在,谷歌的广告形式不仅包括搜索广告、内容广告、展示广告、视频广告,现在收购AdMob,还扩展到手机广告。真正的一站式广告服务。
所以,与微软在过去十几年里的控制不同,谷歌不仅计划拥有手机上的主要用户界面还要与广告主进行深入接触。
苹果知道只是叫喊“我的比你的好”不是什么成功的战略。所以苹果在寻找一种大的突破,要知道苹果CEO史蒂夫乔布斯掌管280亿美元现金,他可以进行各种形式的收购。鉴于苹果在智能手机领域市场份额继续增长,苹果还有时间去实施更广泛的战略计划,但是谷歌正在奋力追赶。(Sherry)
0
产业链利益新博弈
文章来源:第一财经日报 日期:2009年11月26日
CBN记者 马晓芳
实际上,自从互联网出现,就有专家提出过这样的畅想:纸质图书将被电子书所代替,但直到今天为止,这仍然只是个畅想。
互联网上的电子书浩如烟海,比比皆是,但丝毫没有取代传统出版行业的苗头。最关键的问题就是版权问题未能得到解决。
当当等电子书城的出现,只是为图书发行找到了一个作为补充的渠道,它对传统出版行业的改变是非常有限的,而电子书城则是对产业链的重塑,关键是找到一个满足产业链各方的利益分成模式,特别是版权保护和分成模式。否则这个新的产业链是无法长久发展的。
谷歌图书馆的版权分成模式如果能得到文化产业的认可,那将是电子书或者说数字版权行业的一个重大进展。但这也可能只是未来解决电子书数字版权的一种方式而已。
亚马逊推出的Kindle阅读器是探索电子书数字版权的另一种途径。其商业模式有点类似于苹果的iTunes商店或者APP Store,作者和出版社们以及报业巨头们将内容在Kindle上以电子版的形式出售,亚马逊将获得65%的分成,作者、出版社或者报社获得35%。
正如谷歌图书馆模式遭到世界各国版权组织的抗议一样,亚马逊的Kindle模式也被传媒界比如传媒大亨默多克所指责,出版社也对此表示不满。实际上,如果没有让产业链各方都得到满意的利益分成,整个产业链模式就不会稳固。
而微软也开始联合默多克共同对谷歌开战,微软希望默多克能组织谷歌免费搜索新闻集团旗下报刊的文字内容,而微软将通过支付一定补偿金额的方式获得搜索权。
看起来,数字版权也应该付费已经引起各方关注。
仍存疑问的是,传统出版行业深恶痛绝却又无力解决的盗版问题,能在电子书时代根本杜绝吗?否则所谓的利益分成和产业链共赢又将从何谈起?