我们为什么要大数据?

当我端起一杯茶,喝上一口,我知道自己所品味的清香是实在的物,不是数据;我喝茶这个过程是客观的动作事实,也不是数据。以此类推,人的工作和生活,都由各种实事实物构成,本身并不是数据。那,我们要数据何干?我们还要追捧“大数据”何干?

人类为什么要数据?

1、人追求自我实现。

所有生物体都有一个本能:汲取更多的外部能量,实现无休止的自我繁延。在漫长的自然竞争中,生物与非生物及各种生物之间在各自本能驱动和外部约束下建立起动态平衡。任何生物体对外部的适应和改造,都要基于一个共同的过程:“接收-内部处理-外部反馈”.这个过程中,既改造世界,也改变自身。

人类无疑是生物群落中卓有成效的一支。我们自祖先起逐步发明了一套独特的“刺激-反应”系统。这套系统突破了每个个体自身能力的局限,而意图将各个个体联合起来。为此,最成功的努力是:对个体遇到的外部信息进行编码,进而对个体成功的经验进行编码,以便不同个体之间展开交流和协同,甚至隔代传承。

最初的编码,是散见于各古文明遗址的图腾或符号。这些符号复杂化之后,演绎出三种功能化的应用:一是数字,用于计数,发展为数学;二是文字,用于表意,发展为文学;三是图像,用于渲染,发展为艺术。

在一个相当长的时期内,三类应用被逐步强化,进化了符号的表达式、印刷术、绘图工具和计算器,由此,人类群体的知识、技术及艺术的持续创新和积累呈加速度发展,人类的经济和社会生活也走向了全面协同和繁荣。

这种繁荣已经经历了二个大时代,一是以中国唐宋时代为代表的农业文明,二是以20世纪欧美为主体的500强企业为代表的工业文明。两个大时代的背后,都是导由于人类对世界认识和改造能力的二次飞跃。21世纪开始,第三次飞跃发生了。

2、数据化让人类能力突飞猛进

第三次飞跃,就是大数据应用的出现。它让人类对世界的编码实践进入了全新的历史阶段。

首先是范围大拓展。

1、环境数据化:建筑体、地表、地下全息化的堪测和描述;逐步加深的对大气、月球、外太空的探测和描述。

2、物质数据化:各种物质元素的分析表述;各种生物(包括人)基因的分析表述;各种人工产品的计算和纪录。

3、行为数据化:全部生物(包括人类)个体行为的采集和纪录,社会性行动的采集和纪录。

4、知识数据化:概念、经验、技能、用例、程序、标准等的归集和纪录。

5、关系数据化:身份、信用(包括支付凭证)、权益、义务、荣誉、形象等虚似化并形成共同合约化机制。

其次是结构大突破。

目前所知的数据,呈现出多种不同的结构形态比如:数字、文本、声音、图像、视频。不同结构之间的互译互通,不但使人们对特定对象的认识实现直正的全息全程,而且令人类文明起步时数字、文字和艺术的分裂重归溶合。这种对数据结构的突破表现在:

同源异构:即使来源于同一学校:有文本化的教案资料,有视频化的学生活动,有图片化的建筑设计,还有校园网络门户、学习群组贴吧…即使都来自一家公司:有产品设计原型,有设备传感信息,有资产财务档案,有市场客户活动,有工作会议与项目进程…异构信息的解读和互译是各种私有云应用的前提。

同构异源:即使都是数字化的信息,可能是消费纪录,也可能是体检记录,或者是考试成绩,甚至是绩效测评…这些信息如何在一个人身上整合运算?即使都是视频化的信息:有网络对话的,有交通监测的,有新闻采访的,有编导制作的…这些信息如何围绕一个目标整合分析?异源信息的整合关键在于目标与价值设定之后的关联信息甑别、赋权和转化的算法。

异源异构:不同对象,不同结构,不同来源。这是立体社区或数字城市的命题。各种公有云的解决方案正在对此展开相像并转为争先恐后的实践。

再次是计算大超越

计算能力分为集中计算和分布计算两条战线。集中计算实验机的竞争一直未见厌倦。最近一则中国领先的消息让部分国人一时振奋。从电子计算到量子计算到生物计算,工艺材料变革和计算模式创新交替发挥推动力。直到相比之下,大脑自身的计算能力可以忽略不计。

更具革命性的是分布式计算,即云计算的应用。这种联络全世界计算能力的构想,就是联络全人类心智的上帝,它将人类久远的梦想推向可以触摸的现实。云计算在联结计算能力的同时,也联通了分布式的数据和行为,“地球村”从概念进入了实践。

公有云和私有云至今没有一致的分区认定。也许可以将基于云计算之上的公共性质的应用归为公有云,与此相对,任何围绕特定利益主体的专属性应用都是私有云。比如:穿戴式或便携式设备与个人数据中心的互联可能构成“个人云”,而智能家居与成员信息的互联则构成“家庭云”,以此类推,则有企业云、学校云、医院云…

最后是存储大升级

大数据需要大储存。解决大储存有三种思路:

一是硬盘加大。这是开始时的努力。很多的提供云储存服务的巨头,不可避免地上马宏大的数据中心工程项目,但这种既不经济又不环保的方式恐怕是不可持续的。

二是算法革新。存储虚拟化:通过合并孤立的存储池,按整个网络的需求而不是按每种应用的需求确定存储空间的大小,即使跨多个文件服务器或SAN也可以灵活应用。生物储存:人类基因组序列中,1克的重量可以包含几十亿GB的数据量,在少数科学家那里,新的DNA归档系统正在替代传统的1到0的编码规则。光储存的优化:光量子数据存储技术、三维体存储技术、近场光学技术、光学集成技术的发展,光存储技术也将是广泛应用之一。

三是管理创新。数据管理包括摄入、记录、传播、加工、储存、安全,而同样重要一环是“删除”.对无效和低效数据的识别和删除,是未来技术应用的热区。

3、大数据让个体与群体共同再造。

大数据让外在环境在人类面前无所无所遁形,也让貌似混乱的社会化行动开始有迹有循,大数据让不同产业之间拆除了隔墙,也让各不个体的专业化分工走向了协同。

这样个体和群体同时受益的创新,在工业时代并不多见。

大数据如何提升了个人能力?

识别能力:你可以更全面地了解一个关系紧密的人,当然也可能因此而发现了对方隐藏的缺点而导致分手。你可以轻易区分肉眼无法看清的物件或者事理,虽然有些人由此心存侥幸去搏彩或抄股。

记忆能力:记忆可以安心地借助外部设备来实现,心智的重点可能会倾向当期的体验。中国人最想做的第一件事,也许是学外语的压力可以交给可穿戴的即时交流设备。

运算能力:从掰手指,到用心算,到算盘计算器,到软件和云计算,运算的加快不只是制造产品上,更体现在创作作品上,包括为大家寄予厚望的天体物理学家、生物药学家或者心理学家们加速证明那一个个影响深远假说和治病救人的良方。

大数据如何提升了团队的能力:

知识共享。维基百科也许原始得像大数据时代的“甲骨文”,但它启示了知识共享的新方式。每一个团队,每一个企业,每一个开放平台,都会产生自己的维基百科。

协同反馈。书信消失之后,电子邮件也正在消失,即时通信正在变换着身法,以延口残喘。暂不能预见即时通信之后是什么,相信不再需要一个共同的端口,不管是QQ、微信或者宜信、来住…

合作创新。个人发明不再可能,合作而不创新也不同可能,产品即是用品,合作即是服务。

大数据是大众的,但对大数据的欢迎却从商家先开始,这预示着另一种战场的另一场杀戮吗?这是下一篇的话题了。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2013-12-24
我们为什么要大数据?
当我端起一杯茶,喝上一口,我知道自己所品味的清香是实在的物,不是数据;我喝茶这个过程是客观的动作事实,也不是数据。以此类推,人的工

长按扫码 阅读全文

Baidu
map