美国时间3月25-28日,全球著名的大数据会议StrataDataConference在美国旧金山Moscone中心召开,柏睿数据隆重展示全内存分布式数据库RapidsDB v4.0、内存流数据库Rapids StreamDB、大数据存储Rapids Hadoop、库内人工智能并行算法库Rapids ParallelR四款产品,其中全内存分布式数据RapidsDB v4.0引起了笔者的关注。
据悉,这是一款由中国完全自主研发且拥有自主知识产权的TB级分析型数据库软件产品。此产品最大的亮点是支持TB级数据毫秒级响应,实现1秒内在3000亿条数据中匹配唯一的1行记录,将国际主流数据库(Oracle/IBM DB2)执行效率提升上百倍;同时,数据与内存空间的占用比例为1:1.4,远低于国际主流数据库(Oracle/SAP)内存空间1:4的占用比,可为客户节省60%以上的内存采购成本。
众所周知,数据库作为基础软件三大核心壁垒之一,我国在数据库的开发上苦下功夫,对于研制有一款拥有自主知识产权的TB级分析数据库软件产品,且性能已经赶超国外主流数据库产品,需要的扎实的研发与坚定的理想信念,才能实现中国科技的重大突破。
“我们创业团队底层的基因是一个纯技术团队,对于数据库核心在内的所有组件(执行引擎和存储引擎)及整体架构均是自主设计和自主研发可控:即从数据应用层、解析层、优化层、执行层到存储引擎的五层均是完全自主,在代码编写和数据保护层面都具有完全自主可控权。”柏睿数据董事长兼CTO刘睿民强调。
他表示,能够实现国产数据库自主研发离不开柏睿数据核心团队在这个领域的深耕与探索,并积累了大量的技术和服务经验。柏睿数据的技术团队来源于惠普实验室,其核心技术架构师均师从数据库鼻祖图灵奖获得者Jim Gray。未来,他希望能够带领柏睿数据走向世界,成为一个响当当的有核心技术、靠技术驱动的企业级数据库服务商。
核心技术作为经济发展的最大‘命门’,一直制约着各行业生产力的驱动,加快关键核心技术自主创新,才能为经济社会发展打造新引擎。在大数据领域,尤其是数据仓库领域必须要有革命性的变化,否则整个大数据行业就无法发生根本性的突破。
刘睿民认为,传统大数据分析解决数据孤岛问题的做法更多用到的是数据迁移,在数据分析前先将所用到的数据同步到新建的数据仓库或者数据湖当中,这样的做法不仅不便于管理而且耗时大。柏睿数据跨源异构查询连接器Rapids Federation像管道一样,联合多种数据源,实现不同类型的数据统一连接,方便政府或企业用户随时对多源异构数据进行统一查询、更新、关联分析及 挖掘,帮助用户打破因部门多、数据存储分散带来的信息孤岛问题,完成多源异构数据的汇聚融合。
大数据实时分析不如自动驾驶汽车或其他外重在形式表现的人工智能酷炫,却是充分利用大数据,实现数据价值变现,辅助科学决策的关键技术,是信息技术产业链条中不可或缺的一环。对于企业而言,大数据实时分析的作用则主要体现在三大领域:一是对业务的改进优化;二是帮助业务第一时间发现机会;三是创造新的商业价值。目前,市场上主流的大数据公司大部分是数据应用,更多偏向于行业的应用及提供相应的解决方案,对于底层数据库的研发较少涉足,其主要原因也是底层基础软件的技术壁垒较高,研发周期长,研发投入大,投资回报交慢等因素。
柏睿数据的大数据实时分析平台Rapids Data Platform可以让各种规模的企业从数据中获取更多的价值,尤其是RapidsDB v4.0拥有超高的性能,通过Rapids Federation可以将多源异构数据的统一接入,并避免连接时可能带来的风险。比如,政府有民政、司法、审计、税务、农业等多个部门不同的数据库的数据源,Rapids Data Platform都能即时对各个数据源进行查询,无需要数据迁移,更不会改变用户原有的数据库架构,带来极大的适用性和便利性。
与此同时为了保持企业的持续创新能力,柏睿数据先后成立了人民大学统计实验室、国家信息中心数字中国研究院人工智能与数据库研究实验室,形成了以国内顶尖的统计与数据建模能力研究为抓手,促进产、学、研、用一体化,共享研究成果,助力政府机构和企业实现智能计算和知识服务。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。