汹涌的数字瀑布闪烁着神秘的光彩,密密麻麻地排满了整个屏幕,作为影史经典之作《黑客帝国》的片头,这一幕早已深入人心。而正如这一片头所显示的,今天的世界已然变成了一个数据的世界。阿里研究院甚至提出了从IT(信息科技)转向DT(数据科学)的战略方向。大数据(Big Data)也和人工智能(AI)、云计算(Cloud Computing)、区块链(DLT,分布式记账技术)合称为了ABCD四大新锐技术。
为什么会产生数据科学呢?首先,随着社会的发展,人类的社会实践、生产实践和科学实验产生了大量的数据。近年来,由于移动互联网的快速发展,数据产生的速度也随之激增。技术的进步,也使得数据的记录和整理变得越来越便利。在这一背景下,数据的海量增加,使得人们对于数据采集、清洗、过滤、分析、建模和表达的需求也越来越殷切。人们的聚焦点也从如何生产数据、收集数据和管理数据,转向如何更好地建立模型和分析数据方向发展。由此,数据科学应运而生。
其实,如今在互联网行业里,也有很多从事与数据相关工作的人,包括最基础的数据库管理员(DBA)、维护大数据技术基础(Hadoop/Spark)的系统管理员、研发分布式数据处理程序的程序员、从事数据结构分析与管理的数据架构师、聚焦数据建模的工程师以及负责以可视化手段展示数据的工程师等等。虽然这些人的工作都与数据相关,但是有些人是数据的搬运工,有些人是数据的处理工,有些人是数据仓库的管理员,但是他们都不能称为数据领域的王者。这就像铁匠,他们每天都在与铁打交道,但是我们从来不把铁匠称为金属学家;农民每天都在和土地打交道,但是我们从来不称农民为土壤学家,我们每个人天天都在做各种计算,但是我们从来不把自己称为数学家。
那么,在数据的王国里,究竟谁是数据之王?我认为只有那些真正掌握数据科学项目的过程,知道如何探索数据、深入分析数据、用数据解决现实中问题的人才是数据世界里真正的王者,即数据科学家。
那么,如何从搬砖的数据民工变成一个指点江山的数据科学家呢?这需要行业的积淀,个人的努力,还有科学的指导。
《数据即未来:数据王者之道》一书,作者布瑞恩・戈德西德结合自己的亲身经历,讲诉了数据科学中从项目准备、解决方案构建到项目交付的全部过程,系统地论述了数据科学的完整过程。特别是作者结合自己的成长过程以及工作经历,以案例的形式深入浅出地讲解了在开展数据科学项目的过程中可能遇到的各种问题,是有志于从事数据科学的新人们最好的入门指南,并对已经拥有数据科学项目经验的人来说,也非常实用和有借鉴价值。
数据科学作为一门独立的科学仅仅是近两三年的事情,因此,这个领域是神秘的,引人向往的,这里充满了荆棘,也蕴含着无数的机会,需要大批有志从事数据科学探索的人加入其中。如果你也想了解数据科学,走进数据科学,甚至成为该领域的王者,那么这本《数据即未来:数据王者之道》将是你最好的敲门砖。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。