“数据是企业业务决策流程的中心,更是数字化转型的基石。”亚马逊云科技大中华区产品部总经理陈晓建近日在国内媒体沟通会上如是说。
在刚刚结束的2022 re:Invent全球大会上,亚马逊云科技发布了涵盖计算、数据库、数据分析、安全等一系列新的服务和功能。毫无疑问,数据成为本届大会当仁不让的主角,多款与数据相关的重量级功能得以亮相,说明云服务巨头对于数据及其价值异常重视。
众所周知,近年来业界有“云数智”闭环的提法。随着企业上云步入主流,越来越多企业将业务应用和数据部署到云端,意味着“云数智”闭环有望形成。像亚马逊云科技这样的云巨头,意识到此时数据对于云端用户的重要性。
因此,亚马逊云科技正式带来了端到端数据战略,意图帮助更多云上用户把数据存好、管好和用好,为越来越多的智能化应用提供更好支撑。
端到端数据战略价值几何
陈晓建强调,亚马逊云科技端到端数据战略有三大核心:一是面向未来的数据基础设施;二是跨组织的数据链接;三是数据普惠化。最终目标是帮助企业将数据转化为对业务有意义的见解和行动,驱动企业借助数据进行下一波创新。
数据要想用好绝非易事。首先就是基础设施层面,数据基础设施关系到数据能否存好和用好的第一步。在数据爆炸性增长的大趋势下,数据量、数据类型和数据实时性大幅提升,使得数据基础设施必须走向现代化。
在陈晓建看来,面向未来的数据基础设施应具备四个要素:需要有正确的数据库工具来应对所有类型的工作负载;可以在大规模的情况下进行高性能运行;不需要做非常多的重复工作;以及高可靠性和高伸缩性。
数据应用遇到的第二个典型难题就是数据如何高效、安全以及合规的流动与共享。当下,很多企业并不缺乏数据,恰恰最缺的是数据有效联接,各种部门墙、数据墙林立,使得数据的流动与共享遇到极大阻碍。
陈晓建认为,企业应该利用一个合作系统来连接孤立的团队,为重要资源创造快捷安全的访问途径,使用正确数据治理系统,借助高质量的工具和数据来推动未来的增长。
最后则是数据普惠化的难题。随着数据驱动成为企业数字化转型的核心重点,数据驱动型应用场景正在迅速增长。过去,仅仅是管理层等少数人群是数据的消费者和使用者;如今,除了管理层之外,越来越多基层员工在日常业务中也在大量使用数据。数据消费者的迅速增加,无疑为数据普惠化提出的挑战。
为此,陈晓建介绍,亚马逊云科技预计到2029年,人工智能劳动力将增加100万个工作岗位,但培育合适的技能和人选来填补这些空缺将是一项重大挑战。
事实上,当前到了“用数”的关键阶段,而云服务商凭借先进的基础设施、丰富的数据产品服务以及强大的整合能力,的确能够为用户率先提供“云数智”的闭环。大数据在线认为,亚马逊云科技作为全球云服务的领导者,其端到端数据战略的最大价值在于:在企业们上云之后,解决过去“用数”所面临的各种挑战,满足了接下来的“用数”需求;同时,为之后构建基于数据的智能应用夯实了牢固的基础。
用丰富的服务与功能支撑数据战略
众所周知,围绕如何把数据用好和实现数据价值,近年来业界诞生了无数概念,从互联网巨头的数据中台,到后来的湖仓一体,甚至近年来流行的数据编织(Data Fabric),但要想持续帮助用户实现数据价值,绝非一两款产品或者技术就能够实现的,而是需要不断完善和全面的产品。
就如亚马逊云科技,其端到端数据战略的背后,离不开其强大、全面且 融合的产品和服务。2022 re:Invent全球大会上,亚马逊云科技再次发布多款与数据相关的服务与功能,为端到端数据战略提供了强有力的支撑。
首先,亚马逊云科技通过不断推出新的服务与功能,来持续优化其数据基础设施。例如,在本次 re:Invent全球大会上,亚马逊云科技宣布推出适用于 Apache Spark 的 Amazon Athena、针对 Apache Spark 的新 Amazon Redshift 集成预览、Amazon DocumentDB Elastic Clusters、Amazon RDS读写优化等,在数据基础设施层面持续构建合适的数据库工具帮助用户应对所有类型的工作负载。
据悉,当前亚马逊云科技拥有业界完整的数据库,包括关系数据库(如 Amazon Aurora)和 8 个专用数据库为客户的应用程序提供数据工作负载支持。
其次,在数据如何高效、安全以及合规的流动与共享方面,从自动化数据路径到数据治理工具,亚马逊云科技正在帮助企业们实现高效、跨组织的数据一体化融合。
众所周知,ETL是过去数据分析的关键所在。很多企业非常依赖ETL工程师将分散、零乱、标准不统一的数据整合,然后抽取、清洗转换之后,为数据分析和建模做好数据准备;一旦数据规模不断增加、数据复杂性不断提升,ETL的弊端就迅速显现,让很多企业陷入数据供给侧和数据应用侧不能有效协同的境地。
为此,亚马逊云科技在本次 re:Invent全球大会上提出“零ETL”的未来,用户无需再次手动构建数据管道,亚马逊云科技通过Amazon Redshift流式注入功能、Amazon Redshift auto-copy from S3和Amazon Aurora zero-ETL to Amazon Redshift等一系列新功能,简化复杂的ETL链路,实现敏捷数据洞察和高效一致的数据协作。
此外,亚马逊云科技针对数据治理的挑战,正式推出了Amazon DataZone,用于分类、发现、共享和管理数据的数据管理服务,可以集成 Redshift、Athena 和 QuickSight,以及对第三方数据源提供 API 接口,可实现细粒度数据管理,其中包含由机器学习填充的数据目录,易于使用业务术语进行搜索。
最后,亚马逊云科技针对数据惠普化,一方面,通过Amazon QuickSight Q、低代码机器学习:Amazon SageMaker Data Wrangler、Amazon SageMaker Canvas等,进一步降低数据使用难度;另一方面,利用成熟的培训和认证体系,让从业者更好地掌握数据工具和相关技能。
总体来看,海量数据是未来所有企业数字化转型中都必须面临的挑战。从数据到数据价值,链路长、复杂性高、涉及技术与产品众多,绝大部分用户很难驾驭整个链路。而亚马逊云科技通过端到端数据战略,持续推动数据相关的服务、功能的 整合与优化,正在降低数据“用起来”的门槛。面向未来,数据是最重要的生产要素,而亚马逊云科技正在构建最为趁手的生产工具,帮助企业在数字化转型中行稳致远。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。