原标题:让数据分析极速统一!阿里云和StarRocks一起干了件大事
“过去,仅仅是管理层少数人定期查看各种数据报表;如今,哪怕基层员工都是数据消费者,日常业务中随时需要使用历史数据和实时数据做决策,这种趋势将不可阻挡。”去年一家银行数据部负责人对大数据在线如是说。
的确,这就是当下各行各业的现状。随着企业数字化转型的深入,数据分析不仅越来越依赖历史数据,也越来越需要利用实时数据进行决策。随着数据分析模式发生巨大变化,如何对历史数据和实时数据进行极速统一的分析,将成为每一个企业在未来几年要重点攻克的问题。
然而,哪怕是Snowflake和Databricks这两大数据分析领域的明星企业,当前也无法对实时数据进行有效分析。如何对历史数据和实时数据进行极速统一的分析,是新一代数据架构创新者需要重点攻克的难题。
StarRocks成立两年多来,一直致力于打造“极速统一”的全新数据架构,可以对历史数据和实时数据进行极速统一分析,从而为数据分析和数据洞察带来革命性改变。当前,腾讯、顺丰、Airbnb、携程、京东、众安保险等不少行业头部公司正借助StarRocks构建统一的OLAP平台,数据分析体验获得全面提升。
StarRocks和阿里云近日共同发布了阿里云EMR StarRocks云服务。一个是全球云计算Top 3、中国第一的云服务商,一个是近年来迅速崛起的专注打造下一代“极速统一”数据架构的公司,二者合作打造出了低门槛、低成本的极速统一分析服务,真正开启了数据分析的新范式。
“全面分析数据”-数字化转型的关键能力
人们常言:数据即21世纪的石油。与石油需要开采、存储和提炼才能使用类似,数据也需要经过采集存储和挖掘分析,才能将价值体现出来。
在越来越多的企业中,比如互联网,银行、保险、物流,大型零售等,一线业务人员都需要对业务实时变化进行分析,及时调整业务决策,让业务获得最大的成果。双十一促销策略、物流配送策略、用户推荐策略、金融投资组合等等,都需要实时调整。
在未来三到五年,实时数据分析将和历史数据分析一样,成为企业数字化经营的核心能力。能不能对历史数据和实时数据进行极速统一的全面分析,将成为每一个企业数字化转型的关键能力。
当前,企业的历史数据都存储在数据湖中,实时数据存储在OLTP数据库中。为了帮助企业打造极速统一的数据架构,StarRocks和阿里云EMR团队联合打造了数据湖极速分析能力,基于StarRocks可以对数据湖的历史数据进行极速分析。另外,双方也打造了Flink+StarRocks的联合方案,可以简单快速地构建实时链路,实现对实时数据的极速分析。
走向“极速统一”的数据分析新范式
StarRocks和阿里云双方一直致力于帮助用户打造极速统一的新架构,让用户可以同时对历史数据和实时数据进行极速统一分析。
近期推出的阿里云EMR StarRocks可以非常出色地分析存储在Hive、Iceberg和Hudi等数据湖里的数据,当前性能已经可以达到世界顶级同类产品(比如Presto/Trino)的3-5倍以上。
另外,在实时数据分析方面,阿里云EMR StarRocks可以非常好地支持业务数据变更,对业务变更数据的查询性能比ClickHouse等世界顶级同类产品快3-5倍以上。
在StarRocks社区和阿里云的共同努力下,在支持历史数据和实时数据的极速统一分析方面,StarRocks在世界范围内已经达到了非常领先的水平。
当前,StarRocks产品已经在多个行业的诸多头部客户的业务场景中得到验证,并且获得了用户的广泛认可。以众安保险为例,为了更好地支持业务数字化运营,众安保险基于StarRocks构建了全新的数据分析平台,可以一站式地对历史数据和实时数据进行极速的复杂分析,实现了零代码拖拽式分析与秒级响应。公司多个部门超过3000 ⼈在日常中广泛使用,提升超过 50% 的数据分析效率,降低了众安 40% 的⼈⼒成本。
StarRocks,新一代计算引擎的创新者
在按列存储技术取代按行存储以后,计算技术已经从按行计算转为按列做向量化计算。当前,Databricks、BigQuery等行业领头羊,都在开始大力打造全面向量化的计算引擎。
StarRocks在两年半前投入到向量化计算引擎的攻坚克难中,通过数千个优化,当前其计算引擎在世界范围达到了非常领先的水平,比传统计算引擎快3倍以上。极速的向量化计算引擎就像电动汽车的发动机,拥有了世界顶尖的计算引擎,StarRocks有望成为新一代极速统一数据架构的引领者。
基于StarRocks构建的新架构,企业就能够对历史数据和实时数据进行极速统一的分析,满足各种业务场景的需求。
StarRocks为何值得用户持续关注
数据库被誉为“根技术”,乃基础软件皇冠上的明珠。进入到数智化时代,历久弥新的数据库迎来前所未有的变革期。
数据分析能力正在成为企业数字化转型的重点。StarRocks等新一代数据库公司之所以值得持续关注,在于它们身处一条极有前途的赛道。
以StarRocks为例,面世以来两年多的时间里,已被超过110家市值或估值在10亿美金以上的大型用户用于生产环境,生产环境中稳定运行的 StarRocks 服务器数目达数千台,成长速度惊人。
如今,随着阿里云EMR StarRocks服务的推出,双方有望将极速统一的数据分析能力赋能给更多行业用户。
面向未来,StarRocks还将持续投入到技术产品和社区生态建设上,吸纳更多开发者和用户,从而达成更多的世界领先。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。