下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

未来一个新的概念板块 《大数据:应用跑到了科研前头》

12-11-08 22:51 4991次浏览
jutyifei
+关注
博主要求身份验证
登录用户ID:
一直在用手机上的 “鲜果联播” 看新闻,首先要说这个手机应用真的不错,由其筛选的新闻质量都很高,各个门类里面都有新闻都有,包括 新闻、 财经、 时尚、 生活 、人文、体育、 娱乐、 创意 、 汽车、 英文资讯等等,每个里面又有好多可以关注的。 有同用的进来顺手顶一下。

在看科技和互联网新闻的时候,这几天不是看到 大数据 的字眼,看了几篇,觉得为了也许真的是大有可为,至少是个很好的炒作噱头,就想之前的移动互联板块一样,会是一个长期持续的炒作,毕竟这个牵涉的股票数量会有一定的规模,包裹硬件,数据中心建设,数据挖掘,数据服务等等。 在这里抛砖引玉转一篇文章,起个头,已经关注的可以转写资料来,大家共同布局一下。

下面是转帖

在刚刚结束的“2012年中国计算机大会”上,“大数据”是出现频率最高的一个词,几乎每个主讲者、每场论坛都涉及这几个字。同时,中国计算机学会也在大会举行期间,正式成立了大数据专家委员会,中国工程院院士李国杰担任主任。

什么是大数据?按照维基百科的说法,大数据指在一定时间内无法用常规软件对其内容进行抓取、管理和处理的数据集合。

2011年,《自然》杂志(Nature)出版专刊指出,倘若能够更有效地组织和使用大数据,人类将得到更多的机会发挥科学技术对社会发展的巨大推动作用。

美国政府把大数据看成是“未来的新石油”。2012年3月,美国奥巴马政府公布了“大数据研发计划”,旨在提高和改进人们从海量和复杂的数据中获取知识的能力,进而加速美国在科学与工程领域发明的步伐,增强国家安全。这是美国1993年宣布“信息高速公路”之后的又一重大科技发展部署。美国国家科学基金会、国防部、能源部等6个政府部门和机构宣布投资两亿美元。

其实,大数据早就在我们身边。我们每天通过互联网上传或者下载大量视频、图片、文字,都在产生大量数据,各种购物、社交网站更是大数据的集中之地。国际数据公司(IDC)的研究表明,全世界的社交网络每天有2.5亿张照片上传。

2011年,全球数据总量为1.8ZB(10的21次方字节),其中75%来自个人。有人形象地计算了一下,这些数据如果用9GB的DVD光盘保存,叠起来的厚度是26万公里,大约是地球到月球距离的三分之二。

不过,企业应用还是大数据的主要推动者。生物、医学、天文、环境、物理、工程、经济、互联网等诸多领域涉及大数据的处理和应用。李国杰院士对IBM、甲骨文、微软、谷歌、亚马逊、Facebook等企业进行了分析。他发现,自2005年以来,IBM投资160亿美元进行了30次与大数据有关的收购,促使其业绩稳定高速增长。2012年,IBM股价突破200美元大关,3年之内翻了3倍。华尔街早就开始招聘精通数据分析的天文学家和理论数学家来设计金融产品。IBM现在是全球数学博士的最大雇主,数学家正在将其数据分析的才能应用于石油勘探、医疗健康等各个领域。eBay通过数据挖掘可以精确计算出广告中的每一个关键字为公司带来的回报。

大数据应用也早已在商业领域大显身手。金蝶国际软件集团首席科学家张良杰介绍,他们参与搭建的全国中小企业信息平台,汇集了4000万家企业,通过对这些企业海量数据的挖掘和分析,能够对经济运行状况作出准确的预警,有助于国家相关部门作出应对决策。

此外,张良杰还举例说,在微观经济领域,“大数据”的作用也越发凸显。“美国一家公司把天气预报的信息和数据在亚马逊的云平台上进行处理,可以帮助农业的种植者在特定季节中避免遭受气象灾害,很好地保障他们的收益。在企业管理上,大数据可以为企业管理创新带来活力。对前一段时间的业绩情况分析,来决策下一步的投资、战略部署、产品研发。”

国内的淘宝、腾迅QQ、新浪微博既是大数据的产生者、应用者,也是研究者。正是由于这些应用,李国杰认为:“大数据的工程技术研究已经走在了科学前面。”

但是当技术解决不了的问题越来越多时,就需要科学家找出共性的问题。可是科学家并不了解每个领域的特点和问题,目前各个领域中“数据界”的共性还不太清楚,所以李国杰提出来:“我觉得我们搞科学,要放下身段、甘当配角。在条件还不成熟的时候,计算机科学家应虚心地当一段时期的‘助手’。”

在科学家如何与企业界相结合、共同解决大数据问题上,香港中文大学教授华云生认为:“现在情况复杂,不像以前,一个方案可以解决许多问题。大数据的研究要结合实际用户问题,把问题、数据、平台集中起来解决。但现在还是不清晰、不明确。”

李国杰则认为大数据的研究对于科学家来说,具有“颠覆性”的意义:“长期以来,许多领域都是在用小数据做科学实验,找出一个模型和规律。现在越来越复杂,有一堆数据看上去没有规律。科学家要找到新的研究方法,这种模式和方法的改变需要探索。要研究大数据的问题在哪儿,在应用中发现什么技术难题,这些有针对性的问题,不是凭空想出来的,是需要实践总结出来的。”

对于大数据的研究进展,李国杰很乐观:“中国人多,互联网用户多,对大数据的需要大,需求旺盛,这对科学界是挑战也是机遇。”但是李国杰同时提出,目前中国许多数据掌握在不同的政府部门手中。“有些部门把一些数据当成自己的,放那里既不使用,也不提供给研究者。大数据需要共享,数据开放,平台利用,这是我国大数据研究的软肋和需要解决的大问题。”
打开淘股吧APP
1
评论(11)
收藏
展开
热门 最新
jutyifei

12-11-08 22:53

0
这个是  百度百科的介绍

大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
  简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。
  大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。
  物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式
刷新 首页 上一页 下一页末页
提交