一年一度的亚马逊云科技re:Invent大会即将在下周开幕。作为云计算行业的顶级盛事,亚马逊云科技re:Invent大会看出云计算领域创新的风向标,也是业界人士每年都翘首期待的盛会。
回顾历年re:Invent大会,从云上数据仓库、云原生数据库到处理器、机器学习,亚马逊云科技总能在re:Invent大会上带来一系列重磅发布,并且给云计算行业带来深远影响。
对于即将开幕的2022 re:Invent大会,亚马逊云科技又会带来哪些重磅发布和创新?近日,亚马逊云科技CEO Adam Selipsky接受了媒体采访,透露了今年大会的创新方向。
创新永无止境
首先,Adam表示,尽管亚马逊云科技目前已经提供了超过200项云服务,但创新还远没有结束。
“我不知道什么时候会是终点。”他说,“我们不断发布新服务,因为客户需要,他们希望我们提供这些服务。同时,我们也付出了巨大的努力在现有服务中不断增加新功能。这两个方面都很重要。”
在亚马逊云科技,一项新服务的发布向来不是终点,而是一个起点,亚马逊云科技会不断为其增加新功能,其中一个方向就是帮助客户连接和集成不同的亚马逊云科技服务。
Adam说,亚马逊云科技会在三个方面不断投入:构建新服务;深化现有服务的功能;整合不同的服务。
建立端到端的数据之旅,获取数据洞察
Adam从2005年开始参与亚马逊云科技的创建,2016从亚马逊云科技首席运营官的职位离开,加入可视化业务分析软件公司Tableau担任首席执行官, 2021年再次回归亚马逊云科技,担任首席执行官。
在Tableau的经历,让Adam有五年时间沉浸在数据、数据分析和商业智能的世界。回归亚马逊云科技,他带来了数据世界的深刻印记。他认为,数据世界的方向是数据、数据分析、数据库、机器学习的结合,需要从端到端的视角认识数据。不能停留在数据库或数据分析服务这样单点的解决方案,要真正了解数据流的全过程,从数据进入组织,到后面如何利用数据协作、共享、做决策。亚马逊云科技在这些方面投入了巨大的资源。
Adam认为,数据库、数据分析能力和机器学习之间的关系,就像小学数学课本中学习的文氏图(也叫维恩图),三个圆圈有重叠的部分。每个领域仍然相互独立,但三者之间有非常大、非常强的交集。也因此,亚马逊云科技专门任命了一位负责人管理这三个领域,让它们能真正的融合在一起。
当前,数据爆炸式增长,一方面带来了巨大的机会,另一方面也带来了巨大的挑战。被淹没在数据中,不知道如何使用数据做出决策。也有一些机构找到已经找到了解决办法,利用强大的技术,快速地从数据获得洞察。
亚马逊云科技在正努力研究端到端的数据之旅,并在数据之旅的每一站都构建强大的功能和服务,然后将这些功能和服务利用数据治理这样强大的概念结合在一起。明确谁有权访问哪些数据,哪些数据需要设置保护,通过良好的数据治理,人们就可以自由发挥创造力,探索可用的所有数据。
底层创新和应用解决方案双轮驱动
亚马逊云科技在全球有几百万客户,客户类型包罗万象。没有一种放之四海而皆准的解决方案。
技术能力特别强的客户希望自己“掌握方向盘”,通常使用最底层的服务,例如Amazon EC2用于计算,Amazon S3用于存储,他们希望直接与这些服务进行交互。
Adam认为,即使这些底层的服务,依然很大的创新空间,主要在两个方面:一是性能,二是性价比。Adam表示,15年前,很难想象到了2022年还会围绕计算单元的性能和性价比有这么多前沿创新,很难想象计算单元的创新到了今天依然如此重要。之所以如此,一个原因是今天的数据集非常大,并且要构建机器学习,需要巨量的计算。如果不能显著提高性价比,就无法负担如此巨量的计算。
除了底层不断创新,Adam还谈到,越来越多的客户希望在更高的层次——即在应用层和解决方案层面使用亚马逊云科技。因此亚马逊云科技正在不断将大量资源投入到一系列高层级的解决方案中。Amazon Connect全渠道云联络中心是一个例子,这个解决方案可以让客户在几分钟、几小时或几天内在云中启动并运行呼叫中心。
新冠疫情之初,巴克莱银行所有客服座席都居家了。10天时间里,他们就利用Amazon Connect启动运行了6000个客服座席,可以继续为客户提供服务。
Amazon Connect集成了许多了机器学习功能,例如电话呼叫转文字的功能,这有助于主管培训座席,可以从呼叫中提取语意和主题。针对这样的服务,客户不关心后台的支撑技术,只关心文字转录、提取语意这样的功能。
对拥有几百万客户的亚马逊云科技来说,向客户提供各个层级的解决方案至关重要。
除了Amazon Connect这种通用的解决方案,亚马逊云科技还提供针对汽车、医疗、金融等行业垂直行业解决方案,例如医疗数据湖Amazon HealthLake,例如在工业物联网服务方面有监控工业设备、进行预测性维护的服务等。原亚马逊负责实体零售和技术的副总裁 Dilip Kumar于今年8月成为亚马逊云科技应用副总裁,他将利用其整合多个团队的能力,专注行业应用领域。亚马逊云科技将在这些领域进行大量投资,并推出一些令人兴奋的创新。
精彩盘点:亚马逊云科技re:Invent大会历届重磅创新
2012年:发布业界首个云上数据仓库Amazon Redshift,实现并发扩展的过程中持续稳定的查询性能,且按用量付费,数据仓库不再只是超大型企业的专利。
在此之前,数据仓库是一项重资产的技术,只有大企业才负担得起,而且效果很不理想。Amazon Redshift直接在云上部署,规避了软件在本地安装时要考虑的兼容存储、计算能力以及最小安装等问题。云计算与生俱来的弹性优势,让Amazon Redshift带给客户低成本起步、简化运维和接近无限的扩展能力,实现并发扩展的过程中持续稳定的查询性能,且按用量付费。Amazon Redshift一经推出迅速成为亚马逊云科技有史以来发展最快的服务,这个记录一直保持到后来亚马逊云科技推出云原生关系数据库Amazon Aurora。
在亚马逊云科技,产品发布不是终点而是起点,在发布之后会一直不断创新迭代。Amazon Redshift也不例外,尤其值得大书特书的是2017年发布的Amazon Redshift Spectrum,它让Amazon Redshift具备了打通数据仓库和数据湖的能力,支持企业进行跨数据仓库、数据湖和运营数据库的数据查询,形成此后亚马逊云科技推出的智能湖仓架构的雏形。
2013年:发布实时流式数据服务Amazon Kinesis,为移动互联网时代的流式数据实时分析处理奠定基础。
当年正值移动互联网、物联网兴起,产生了海量的互联网日志数据、设备数据、视频数据。数据源头多,实时产生,源源不断奔涌而来,传统的数据管理技术难以招架。Amazon Kinesis以云上托管的形式,开启了云上实时接收及处理流式数据的先河,为移动互联网时代的流式数据实时分析处理奠定了基础,如今它已广泛用于监控、作弊检测和实时排行榜等实时应用程序,消费电器、嵌入式传感器、电视机顶盒等 IoT 设备的流数据处理,家庭、办公室、工厂和公共场所的安全监控数据流处理,以及应用程序之间的数据共享、流式抽取-转换-加载和实时分析。
2014年:发布云原生关系数据库Amazon Aurora,兼具性能和成本效益,它在日后成为亚马逊云科技历史上用户数量增速最快的云服务;发布业界首个Serverless函数计算服务Amazon Lambda,颠覆应用运营模式,免除运维烦恼,让开发者更专注于业务。
Amazon Aurora云原生关系数据库截至目前仍是亚马逊云科技历史上用户数量增速最快的云服务。 Amazon Aurora全面兼容开源数据库MySQL及PostgreSQL,它的速度最高可以达到标准MySQL的5倍、标准PostgreSQL的3倍,成本却只有传统商业级数据的十分之一。Amazon Aurora还提供高可用性和持久性,可跨 3 个可用区(AZ)复制 6 个数据副本,从而可以容忍AZ+1 的故障,即,在1个AZ瘫痪的情况下仍然可以写入数据;在1个AZ瘫痪并且再发生1个存储节点故障的情况下,不会丢失数据。
Amazon Lambda是业界首个Serverless函数计算服务,它让开发者可以运行几乎任何类型的应用程序或后端服务代码,无需预置或管理服务器,从而更专注自己的业务。Amazon Lambda的推出开阔了整个云计算业界的视野,今天,Serverless这种全新的应用程序架构,正成为整个软件架构世界的一大核心议题。
2015年:发布首个按会话付费的商业智能(BI)服务Amazon QuickSight,强势解决大数据应用“最后一公里”问题;发布亚马逊云科技首个硬件服务Amazon Snowball,海量数据可以快速安全的迁移上云。
跟数据仓库的情况类似,在Amazon QuickSight之前,商业智能(BI)也是一项重资产的IT投入。Amazon QuickSight让用户按会话付费,基础设施由亚马逊云科技全托管,极大地降低了 BI 的门槛。Amazon QuickSight是整个亚马逊云科技整个云服务体系中离商业决策最近的服务之一,帮助客户解决大数据应用的“最后一公里”问题。
Amazon Snowball是亚马逊云科技首个硬件服务,以租用的方式提供给客户,开创了海量数据快速安全迁移上云新模式。今天,亚马逊云科技已经发展出完整的Amazon Snow 系列服务,规模从小到大,包括 Amazon Snowcone、Amazon Snowball 和Amazon Snowmobile,具备边缘计算、PB级数据传输、边缘存储等多方面的功能,不断将云计算的能力推送到世界每一个角落。
2016年:发布Serverless的交互式查询服务Amazon Athena和数据集成服务Amazon Glue,为云上数据湖解决方案迈出重要一步。
Amazon Athena和Amazon Glue的发布是亚马逊云科技迈向数据湖的重要一步,因为数据不需要预处理,可以源源不断地直接存入Amazon Simple Storage Service(Amazon S3,一种简单、持久、可大规模扩展的对象存储服务),成为数据湖的核心。
2017年:发布Amazon Nitro系统,重构云计算的基础。Nitro架构充分释放服务器性能,摆脱虚拟化损耗。用户可获取更多算力,上百种EC2实例创新都以此为基石。发布首个机器学习集成开发环境Amazon SageMaker,破除软硬件环境限制及资金门槛,释放数据科学家的生产力。
Amazon Nitro架构是Amazon EC2计算实例实现高性能、高安全性和快速创新的秘密武器。传统云计算都是基于软件虚拟化的计算,服务器既要运行提供给客户的虚拟机,也要运行网络、存储、安全、监控等各项功能,服务器管理虚拟机大约要占去30%的服务器性能开销,导致服务器只有约七成的资源能够提供给用户。Amazon Nitro架构在业界首次使用专用芯片,采用板卡+专用软件的方式,把服务器性能完全通过全新虚拟化技术解放出来,消除服务器虚拟化性能损耗,用户可获取全部物理服务器资源。如今,Amazon Nitro架构已经成为亚马逊弹性计算服务Amazon Elastic Cloud Compute(Amazon EC2)一代一代新实例的公共基础平台,它让亚马逊云科技可以利用处理器技术的不断创新,快速推出新一代Amazon EC2实例,超过400种EC2实例创新都以此为基石。
以往,开展机器学习需要搭建硬件环境并适配其兼容性、配置机器学习框架、分别部署多种工具,用于准备数据、训练模型、测试模型、部署模型等等,繁琐的流程给数据科学家带来很高的上手门槛。Amazon SageMaker以全托管的方式,消除了基础设施管理的繁琐工作,并且将各种工具部署在一个平台上,让数据科学家不需要花时间构建机器学习的基础架构,直接利用开箱即用的集成环境,专注于机器学习本身。在2019年的re:Invent上,亚马逊云科技进一步推出了Amazon SageMaker Studio,这是首个全集成的机器学习开发环境,对用户更友好,进一步提高数据科学家的工作效率。
2018年:首次发布Amazon Outposts,真正将云能力延伸到本地,成为亚马逊云科技重塑混合云的关键一环;首次发布Amazon DeepRacer,一个人人都能玩转且趣味无穷的自动驾驶赛车,极大地降低机器学习门槛。
Amazon Outposts采用租用的模式,利用亚马逊云科技相同的基础设施,首次把Amazon EC2、
Amazon Elastic Block Store(Amazon EBS,一种易于使用、适用于任意规模的高性能数据块存储)、Amazon S3等服务引入客户本地的数据中心,把云延展到了客户现场,为客户提供云端和本地一致的体验。AmazonOutposts的推出重塑了混合云的概念。
机器学习的一个重要分支是强化学习。Amazon DeepRacer是一款由强化学习、3D 赛车模拟器驱动,真车 1/18 大小的全自动驾驶赛车。DeepRacer内置了强化学习框架,使用者通过简单设置模型训练参数就可以在线上 DeepRacer 模拟器中直接训练、评估和调整驱动赛车的强化学习模型,然后将自己的模型部署到 Amazon DeepRacer 上,从而获得堪比现实世界的自动驾驶经验,中学生也能上手,寓教于乐体验机器学习。亚马逊云科技还推出了Amazon DeepRacer 联赛(包括线上模拟赛和线下实体赛),无论经验丰富的专业人士,还是第一次开发模型的新手,都可以通过 Amazon DeepRacer 设备和 3D 虚拟赛车模拟器参加Amazon DeepRacer月度联赛,在比赛中表现优异的选手还有机会参与re:Invent全球大会上举行的Amazon DeepRacer冠军杯赛。
2019年:发布基于Arm架构的自研云原生处理器Amazon Graviton2,开创了企业级应用大规模使用云端Arm架构服务的局面,同规格实例相较x86架构性价比提升可达40%;发布首个全托管量子计算服务Amazon Braket,让企业通过熟悉的云计算模式轻松地开始体验量子计算。
Amazon Graviton2的推出,标志着亚马逊的Arm架构自研处理器进入规模化应用阶段。相比X86处理器,Arm处理器架构更精简、更节能,但此前一直没能在企业级应用领域取得突破。Amazon Graviton2的规模应用树立了Arm处理器在企业级应用的标杆。对比x86处理器,基于Amazon Graviton2的同规格实例性价比提升可达40%。基于Amazon Gravition2处理器,亚马逊云科技推出了Amazon EC2 M6g、C6g 、R6g等实例。
Amazon Braket让量子计算首次走出尖端实验室,让广大的科研机构和企业也可以加入量子计算的应用探索。Amazon Braket托管了3个供应商的量子计算机,通过集成,亚马逊云科技把这些量子计算机的计算资源以云服务的方式提供给客户,让任何有需求的客户都可以探索量子计算的潜力。
2020年:发布云上首个Mac实例Amazon EC2 Mac,首次实现在云上按需运行macOS工作负载;发布Serverless数据库Amazon Aurora Serverless v2,实时自动容量伸缩,摆脱繁琐复杂的数据库容量预置管理,恰到好处的精细化资源配置,仅为实际用量付费。
Amazon EC2 Mac实例基于Mac mini构建,使客户首次能够在亚马逊云科技云端按需运行macOS工作负载,为iPhone、iPad、Mac、Apple Watch、Apple TV和Safari开发应用的开发人员,可以通过使用EC2 Mac实例,在几秒钟内配置和访问macOS环境,根据需求动态扩展容量。
作为Serverless关系数据库,Amazon Aurora从Serverless v1进化到v2,是一个质的飞跃。v2可以做到实时自动容量伸缩,只需不到一秒的时间,即可瞬间将处理能力从数百个事务扩展到数十万个事务。开发者不需要按峰值负载来预置容量,从而节省高达90%的成本。Amazon Aurora Serverless v2在整个行业推动了数据库服务的演进。
2021年:发布新一代基于 Arm 的自研 CPU 处理器 Amazon Graviton3,性能提高25%,能效提高60%;大数据迈向 Serverless 时代,推出四个新的大数据分析无服务器选项;发布了面向纵向行业的服务Amazon IoT TwinMaker和Amazon IoT FleetWise。
基于Graviton3的实例跟由 Graviton2 处理器支持的前一代 C6g 实例相比,可将计算密集型工作负载性能提高多达25%;在相同性能下,与同类型EC2实例对比,可节省高达60%的能源消耗。
新推出的四个大数据分析无服务器选项,包括云原生数据仓库 Amazon Redshift Serverless, 云上大数据分析 Amazon EMR Serverless, 流式数据管道 Amazon MSK Serverless 和实时数据处理 Amazon Kinesis on-demand,可以大幅缩减企业大数据分析旅程,让用户不再担心硬件资源问题。
Amazon IoT TwinMaker可以开发人员更加轻松、快捷地创建楼宇、工厂、工业设备和生产线等现实世界的数字孪生,帮助更多客户构建应用提高运营效率和减少停机时间。Amazon IoT FleetWise让汽车制造商可以轻松、经济地收集汽车数据,近乎实时地上传到云端,以便构建应用程序并利用数据分析和机器学习服务提高汽车的质量、安全性和自动驾驶能力。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。