出品 | 何玺 排版 | 叶媛
未来的云计算是什么样的?在本月的的2022阿里云峰会上,阿里云用全新的“飞天+CIPU体系”,对这个问题给出了充满想象力的回答。
阿里云智能总裁张建锋表示,云计算进入了一个关键的突破期,“如果我们定义好下一代的云,中国云计算就有超车机会。”
01
阿里云飞天+CIPU体系成型
在2022阿里云峰会上,阿里云发布了一款云数据中心专用处理器CIPU(Cloud Infrastructure Processing Units 云基础设施处理器)。这是一款阿里云自研的新架构处理器,它能够向下云化管理数据中心硬件,并对计算、存储和网络资源进行加速,向上则接入飞天云操作系统,把上百万台服务器整合为超级运算单元,为各行业用户提供高性能云计算服务。在阿里云的规划中,CIPU是下一代云计算的硬件基础,也是阿里云、实现“超车”的关键所在。
CIPU作为阿里云为新型云数据中心设计的专用处理器,其最大的优势在于能够替代传统的CPU,对计算资源进行高效的加速和管控。从原理和架构上看,CIPU具备三大特性:首先,CIPU具备对高带宽物理网络进行“超级”加速的能力。云数据中心可以CIPU为基础,建设大规模的eRDMA分布式高性能网络,让连接服务器的物理网络实现传输能力的倍增,充分发挥服务器的性能;其次,它还对存储设备的读写吞吐能力具备硬件加速能力。在CIPU加持下,存算分离架构的数据中心可提供空前高速的云盘访问能力;第三,它对于不同类型资源的神龙计算平台,具有快速接入能力,并能够通过高效整合,将算力的损耗整合降至接近“0”的水平。
张建锋表示,CIPU的正式发布,标志着“阿里云飞天+CIPU体系”已经正式成型。这个体系是阿里在长期的云计算实践中,洞察到“以CPU为核心”的旧有体系的多重瓶颈后,在“做深基础”战略的引领下,强化自研的重大成果。阿里云认为,云计算领域长期使用的、构建在CPU基础上的传统云计算体系,在多年发展后,已经面临着计算和网络传输的时延大、数据中心内部数据迁移量过多,导致带宽难以提升、以及超大规模服务器群管理难度大等技术瓶颈。
而阿里云飞天+CIPU体系的推出,针对性地解决了这些痛点。首先,该体系通过全硬件虚拟化和转发加速,将存储时延降至最低30us(PLX),IOPS高达300万,存储带宽可达200 Gbps,全面超越市面上所有云产品;同时,该体系还将数据中心内的基础带宽从100G升级至200G,VPC的PPS转发性能从2000万提升至4000万,网络时延从22us降低至16us,RDMA协议下更可低至5.5us。在计算能力方面,新体系实现了单容器虚拟化消耗减少50%,虚拟化容器启动速度快350%。主流通用计算场景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。
总体来说,用阿里云飞天+CIPU体系取代基于CPU的传统体系后,云计算不但能够实现业界领先的高可用SLA,而且可在云端提供比本地更安全、更可靠的高性能存储能力。企业应用在它的支撑下实现“上云”后,数据吞吐量能够比自建物理机的集群模式提升30%,业务高峰期延迟下降90%,而且对超大规模服务器群的管理复杂度也成倍降低,其价值不可估量。
02
飞天+CIPU体系下,阿里云新发展路线图浮现
说阿里云飞天+CIPU体系的价值不可估量,不在于它对软硬件效能的提升,更重要的是飞天+CIPU体系解决的问题,是当下云计算厂商普遍面临的“瓶颈”问题。
或者说,这是一种全新的云计算发展思路。
“过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。
这两个阶段的演进推动了云计算发展,但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,已经触及瓶颈。近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。
也就是说,从用户需求和来看,当前的云计算无论是架构方法还论还是实际应用情况来看,它都已经无法适应市场发展的需要。
在这种背景之下,云厂商要么创新突破,寻找新路,成为新的引领者,要么圄于原地,最终成为发展的牺牲品。
从阿里云对飞天+CIPU体系的打造来看,阿里云选择了前者,去寻找新路,做市场的领路人。
阿里云寻新路,是一条软硬融合,更符合未来云计算发展的新路。所以我们看到,当前阿里云在“做深基础”的战略引领下,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。
2021年9月,阿里云在云栖大会上发布了首款通用芯片倚天710。从倚天710开始,阿里云也正式拉开了“一云多芯”的自研步伐。作为一款为云而生的芯片,倚天710针对云计算特点做了大量优化,性能超过业界标杆20%,能效比提升50%以上。目前,倚天710已在阿里云数据中心内部规模化部署,并顺利支撑2021年双11等多个核心业务。今年4月,基于倚天710的公共云 ECS实例已上线邀测。
2021年9月,阿里云发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升50%。
当前,阿里云已经建立了一套从芯片研发、自研服务器&操作系统、虚拟化、分布式存储系统到数据库自研体系。
阿里云飞天+CIPU体系的成型,则宣告了阿里云未来新的发展路线,那就是走一条自己的新路,超越竞争者,成为未来云计算的引路人。
03
阿里云飞天+CIPU为元宇宙带来更大想象空间
当前,元宇宙已成为数字经济发展的重要风口。但元宇宙的实现,却有赖算力更为强大的云计算基础设施。构成元宇宙的虚拟内容、区块链网络、人工智能技术都离不开算力的支撑。例如元宇宙里建筑的建模、显示就需要大量的算力来进行渲染,及时的信息反馈也需要强大的运算能力。因此越高的算力可以构建出体验感越真实的元宇宙。从历史上看,与元宇宙密切相关的游戏产业,每一次重大的飞跃,也都源于计算能力和视频处理技术的更新与进步。
事实上,如今元宇宙与云计算已经形成了相辅相成的关系。一方面,元宇宙虚拟世界的运行离不开强大的算力,另一方面,云计算本身也会因为人们持续建设元宇宙而得到发展。
从产业界的角度来看,2021年被称为“元宇宙元年”,见证了大批顶尖企业和资本对元宇宙相关领域的重磅投入。进入2022年后,元宇宙相关概念和项目更是如雨后春笋般蓬勃发展。作为元宇宙算力支撑基础的云计算体系,也更加受到各方重视。
从元宇宙的实际发展来看,AI算力生态是构建元宇宙的重要基础,算力越强,元宇宙的体验感越好。换句话说,谁具备更强的AI算力,谁才能为用户构建体验感超强的元宇宙环境,而AI算力又直接取决于云计算基础。因此,率先选择正确的云厂商和云计算技术体系的企业,才能在元宇宙未来的激烈竞争中占得先机。
朝远一些看,未来元宇宙的发展,其数据量的爆发必然导致整个社会对算力的需求激增。而元宇宙庞大的代码运算需求,已经无法依靠当前普通计算机设备来满足。
刚刚登场的阿里云“飞天+CIPU”新体系,让我们看到了阿里云在通用计算、大数据、还是AI人工智能等核心场景的计算实践中远超传统云计算的性能。
说阿里云飞天+CIPU为元宇宙带来更大想象空间,不仅是因为阿里云飞天+CIPU解决了当前AI算力瓶颈问题,还在于这种全新的架构体系无论在分布式应用还是人工智能场景中都有着优异的表现。对元宇宙来说,阿里云飞天+CIPU的出现,不但解决了未来发展的算力问题,以为其未来发展带来了更大的想象空间。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。