很多人都在说,现在已经进入大数据时代,大数据已经在影响着社会以及个体生活的方方面面,正如作者的观点,大数据是不容忽视的。书中提到,“大数据”这个概念,最早是由天文学和基因学等学科创造的,这表明在计算机领域以外,在网络得到发展之前,人们就已经看到数据的重要性,并重视对数据的分析和利用。
在计算机领域,大数据的价值得到突显。计算机的发展、网络的优化,以及在背后起推动作用的存储技术、数据处理技术等技术的进步,无疑形成了大数据茁壮成长的肥沃土壤。在这样的条件下,大数据快速积累。一些公司或机构主动增加数据,比如谷歌的全球定位系统,收集了大量的位置和地理信息;而更多的数据是来源于被动的收集,每一位上网的用户,他们的浏览记录和发布的信息,都将被积累保存到数据库。
越来越庞大的数据量、不断升级的存储技术,和大量的大数据应用实例,都在显示,现在已经是大数据时代。
大数据不仅仅是字面上的意义,指大量,或者说是超大规模的数据。现在更多的是指利用相关的技术,来对这些主动或被动收集来的数据,进行存储、分析和处理,让它们为某项公益的或商业的研究服务。
书中提到了很多利用大数据的例子,“大数据的核心是预测”。利用收集到的大量数据,对其进行分析,可以预测流感爆发的大致时间和地点,可以预测个人的犯罪倾向,可以帮助企业判断客户的状态和需求,以便准确地向他们推荐产品。
这些具体的例子,都在证明大数据给这个社会带来的好处。除了推动技术的进步,它还让很多难以解决的社会问题,变得简单和清晰。对于个人来说,我们也不得不承认,大数据给我们的生活带来了便利。我们可以通过网络查找我们想要的信息,某些新闻客户端会推送我们感兴趣的新闻,大大节省了我们的时间。
但是,没有什么是完美无缺的,大数据优势突出,缺陷也同样明显。为了更好地利用大数据,作者希望我们能改变思维,要更看重“是什么”,而不是为什么,不需要追求精确性,要接受混杂性。这在一定程度上,也是由大数据的局限性决定的,因为数据库避免不了会混进一些错误的数据,这样就得不到精确的结果,而在大数据的现有条件下,想要知道现象背后的原因,也几乎是不可能。
另外,数据可以从很多不可能的地方提取,甚至可以说,世间万物都可以数据化。面对大数据带来的种种好处,有些人会变得过于依赖数据,而数据远没有我们所想的那么可靠。过度地依赖大数据,单纯地为了“数据”而“数据”,而不去考虑其他的因素,可能会得到事与愿违的结果。这是在大数据产生之前就存在的问题,只是数据增多,问题也就随之升级了。因此,只有得到了合理地利用,大数据才会发挥出它强大的能量。
最令人担忧的,应该是大数据对用户隐私的威胁,这在技术上几乎是难以解决的。提到大数据时代的隐私泄露,有人会用奥威尔的《1984》作类比,虽然过于夸张,但这也表明了人们的担心。作为一个普通的网络用户,最直观的感受,就是一打开电脑,便被各种购物网站支配的恐惧。你近期在某购物网站搜过什么,各种广告弹窗就会出现什么。一些企业,尤其是电子商务公司,热衷于使用大数据分析,他们可以根据用户的检索习惯、消费习惯和其他信息的收集,对用户的状态进行判断,比较准确的为他们推荐可能需要的产品。除此之外,越来越多的个人信息,在网络上都能够找得到,你根本没有办法去防止你的信息不会被利用,就算发现被利用,你可能也不会知道是从什么地方泄露的。
“大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的将来”。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。