分布式数据库有多重要?
据IDC调研,目前约26.8%的企业级市场用户部署了分布式数据库,超过90%的企业认可分布式数据库部署后的效果。
Gartner发布的白皮书《原生分布式数据库引领数据管理技术发展趋势》中指出,原生分布式数据库以其诸多特性,正引领数据库管理技术发展趋势。以OceanBase为代表的国产原生分布式数据库已经深入各行各业,成为企业核心系统升级的首选。
以当前的趋势观察,各大数据库厂商均将“分布式数据库”当做未来的重点方向,纷纷展开自研并发布了重要的产品。但是,分布式数据库至少有3条不同的技术路线,涉及到软硬件协同、多租户、数据迁移、安全合规等问题,还需要解决金融、消费等新兴业务场景的问题。
哪类厂商能在这一条路上走的更快更稳?
01
分布式数据库的三条路线
都知道分布式数据库重要,但做好并不容易。
分布式数据库所具有的跨区域提供一致且可信的数据、改善业务连续性等特性,是集中式数据库所不具备的,也是当前业内的一致看法。
但业内厂商对 “分布式”的理解不同。国家工业信息安全发展研究中心和中国电子学会、北京国家金融科技认证中心发布的《分布式数据库发展趋势研究报告》(下简称报告)中,披露了业内主流的三种路线。
第一种路线是,分布式中间件+单机数据库。这条路线是在单机数据库系统上进行改造,主要解决了扩展性的问题。优势是,兼容性好,学习成本低;劣势是业务建模需要重新规划,业务代码也要相应修改,改造成本高。
第二类技术路线是通过构建分布式共享存储实现扩展,采用非对称计算节点,大部分公有云数据库走的这条路线。优势是兼容性好,应用不需要改造。劣势是,扩展性有限,对底座有比较重的依赖。
第三条技术路线是原生分布式数据库,各计算节点提供对等的读写服务,该路线根据分布式一致性协议做底层设计,与传统数据库有着本质的区别,也被业内众多专业人士称为“真正意义上的分布式数据库”。优势是,系统无需改造、可对应用无感弹性伸缩、更强的数据一致性保障与高可用保障。劣势是目前业界类似这样的成熟产品较少(仅有以OceanBase为代表的少数几家),且上下游生态有待完善。
相比较而言,第三条技术路线的优势更为明显,挑战更大,更需要厂商具备技术能力、以及大规模部署、运维和真实场景验证的能力,还有基于技术的号召能力,这样才能立足生态,让用户不但用起来,而且用得好。
国内也有几家原生分布式数据库公司,基于不同的开源产品研发。纯粹自研的只有OceanBase一家,支持HTAP混合负载,具备高可用、高扩展、部署灵活等特点,重要的是能够实现对应用透明的水平扩展。
02
新场景需要分布式
不管哪种路线,分布式数据库都需要解决在新技术、新场景下挑战。
新场景带来的新技术问题是,如何解决高频数据的查询和交易问题,不仅仅涉及存储空间、效率和成本,还涉及到业务本身,最典型的如金融和电信核心业务的应用场景。
比如,在新场景、高频数据查询和交易下,如何解决分布式事务的一致性保证问题?传统的单机版数据库很容易实现,分布式则需要拆分事务,再部署到不同的服务器上处理。但分库分表在意外情况下出现问题。再比如,架构尤其是对中间件的压力过大,并发和低延时还有提升的空间;数据分片的智能化,如何确保高效、高质量的分片,还需要探索等等。
具体到金融行业。数据量急剧增长,对数据存储和管理提出了更高要求,同时面临高并发业务和大用户量带来的系统压力,这就要求移动应用响应速度更快;而电信在5G趋势之下,需要处理的数据业务呈指数级增长,像电信公司的核心计费业务系统,日处理各类详单数据百亿条,数据处理性能和准确性至关重要。
而原生分布式架构则为分布式数据库提供了新的思路,这是一个全新的设计,具备集群的扩展和收缩对应用透明,并可以按需扩展,没有数量和规模限制;这种架构能够在普通服务器上实现无限水平扩展,帮助客户省去了定制改造的步骤,减少大量人工成本。
以OceanBase为例,正在朝着一体化方向发展,能力将向混合负载发展、场景将向云化发展等,与报告中对未来分布式数据库的趋势判断相吻合。同时,报告认为,未来分布式数据库的趋势还在高可用能力、对数据一致性、生态建设、异构芯片等方面持续创新。
03
OceanBase新版本有啥新突破?
OceanBase采用自研的好处是,能够掌握核心技术能力,每个新版本都在小步快跑。
脱胎于蚂蚁集团,支撑支付宝核心交易系统,并且连续9 年稳定支撑阿里双 11;自研一体化架构,一套引擎同时支持OLTP和OLAP的混合负载,在多项TPC-C和TPC-H测试中刷新了世界纪录,这就是OceanBase在数据库领域的过人之处。
在最新发布的4.0版本中,OceanBase再次获得技术突破,那就是成为业内首个单机分布式一体化架构数据库,可在全球最小的电脑树莓派中运行。这意味着,在单机部署下实现分布式部署的完整功能,从技术上首次突破了分布式数据库的单机性能瓶颈。
无论企业规模大小,无论采用单机部署还是水平扩展部署,一套数据库系统均能满足。而且在单机一体化架构中,性能远超同类产品,可以满足金融、电信等行业对核心系统的要求。这也代表着OceanBase可以伴随着企业不断成长,大大减少了企业的压力,让企业具备技术上的连续性。
这就是OceanBase“小就是大”的核心:更小的数据库产品,满足更多的应用场景,减少更复杂运营成本,打通单机和分布式之间的隔阂,让企业用户使用和运营“更简单”。
此次发布的新版本,能够把故障恢复时间(RTO),从30秒降低到8秒以内,这是中国数据库的第一次,也是全球数据库的第一次。
OceanBase继续朝着开放的道路上前进,本次宣布全球开服OceanBase Cloud,支持阿里云以外更多的云厂商,助力企业出海等。
在开源方面,OceanBase将发布后续社区版,MySQL兼容能力全部开源,社区版将享受企业版同等性能。OceanBase 4.0 社区版将实现小型化,未来最小将支持4核8G小规格,让更多开发者更低门槛应用。
单纯对比功能,OceanBase正在将分布式数据库的的性能提到另一个层次。
04
如何评论OceanBase新版本?
OceanBase作为中国完全自研的分布式数据库,自独立运营以来,备受业内关注。核心在于,它的方向某种程度代表了技术趋势,间接反映了客户的需求,尤其是金融、电信等数据量大、隐私安全等级高的行业。
如何评论此次4.0新版本的发布呢?
1. 创新无止境。本次技术层面无论是支持单机分布式一体化架构还是开服OceanBase Cloud,无论是 RTO<8s还是单机部署性能超越MySQL,技术的创新永远没有止境,永远在路上。而这一切都来源于“自研”而不是“开源创新”。立足于“自研”,一旦有了基础,就会呈现“后发优势”,牢牢把握主动权,创新的技术点也会越走越远,走出自己的一条道路。
2. 小就是大,以产品力探索商业化之路。不盲目自大,以支持淘宝和支付宝为积淀之后,积极走上服务金融、电信等大型企业之路。同时,注重中小企业的需求。据悉,现在两者的收入比例已经对半开,这意味着,4.0小鱼打破分布式数据库只能用在大型客户/大型场景的局限,OceanBase的产品能力终于从大B(大型客户)走向更广阔的小B(中小企业),通过技术降低用户使用数据库门槛。
3. 开源再升级。MySQL兼容全面开放,社区版企业版同等性能,这是今年OceanBase开源最重磅的信息,也透传出OceanBase在开源的路线上笃定的方向。开源能“公开透明”,来自技术自信,共筑生态圈。开放能促进开源,生态繁荣。受益的不仅仅是OceanBase,还有广大的用户以及数据库产业。
4. 创新的一小步,分布式数据库的一大步。这次发布会现场,我们看到国产数据库已经从开始时的非核心/创新业务的探索尝试,走到核心系统全栈替换,这是国产数据库的重要里程碑。希望国产数据库的每一小步,都能成为数据库行业的重要一步。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。