在科技业,数据库是一个整体规模不大但专业度极高的领域,传统数据库时代还诞生了像Oracle这样的行业巨头;但在新一波数字技术革命下,大数据、人工智能应用的兴起,人们对于数据库的期待已经不再是数据的分类、存储和查询等,而是如何洞察数据内在的联系。
传统的数据库虽然在名称上被称为“关系型数据库”,但在处理数据关系上并不擅长。在大数据、人工智能大行其道的今天,一种新型的数据库开始崛起——图数据库。据了解,图数据库源起欧拉图理论,也可称为面向/基于图的数据库,它是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。相比较传统的数据库,图数据库的数据模型主要是以节点和关系(边)来体现,可以快速解决复杂的关系问题。
创立于2012年的TigerGraph是一家专注于图数据库研发和服务的企业,在创始人许昱博士的带领下,TigerGraph初创的五年里一直专注于产品的打磨,而不是急于推向市场。直到去年年底,TigerGraph正式完成A轮融资,正式向业界推出实时图分析平台。
TigerGraph创始人兼CEO许昱博士
许昱博士表示,经过过去六年的精心打磨,TigerGraph的产品无论从技术指标上,还是在客户反馈上都是业界领先的;随着越来越多的企业和用户进入到图数据库市场,市场的教育将会日趋成熟,这对我们来说也是一大利好。
从传统数据库到图数据库 技术进化从未停止
回顾科技的发展路径,我们可以清晰看出,任何技术的发展和演进都遵循一定的轨迹。比如,在数据库市场,传统的关系型数据库只是那个特定时代的产物,当时用户对于数据库的应用更多集中在数据的存储、备份和管理等方面,对于纷繁复杂的数据背后的关系了解并不清晰。
但到了大数据、人工智能时代,一切都不一样了。一方面,数据的积累正在呈现出爆炸式增长的态势,数据的分析和管理变得原来越复杂;另一方面,用户对于数据挖掘和分析的要求也越来越高,他们希望洞察数据背后的内涵,真正释放出数据的价值。
在许昱博士看来,传统的关系型数据库和图数据库有以下三大区别:
第一,存储模型不一样。关系型数据库的数学模型是表格,但这并不是表示关系的最好方法。比如,一个人拥有很多的个人信息,身份证号、学校、住址等等,但这些信息往往又被存到不同的表格中,真正想全面得到一个人的信息就必须将不同表中的信息拼凑起来;但图数据库并非如此,身份证号和学校等都是一个个节点,这些节点是天然连接在一起的。
第二,计算模型不一样。关系型数据库的计算模型是扫描、拼凑,这就导致数据的计算量很大,但效率很低;而图数据库不同,它从节点出发,只寻找与节点相关的数据,这样的效率更好。
第三,数据的查询方式不同。在关系型数据库中,数据的查询指标往往比较单一,但在人工智能、机器学习时代,人们要挖掘数据更深层次的关系,并实现动态、实时的查询,图数据库所表达出的数据之间的关系则更为全面。
事实上,数据库技术的进化很大程度上也源于算法、算力的提升。过去,大数据算法并不成熟,计算机的性能也不够强大,没有多核、没有并行能力,这些限制在很大程度上制约了图数据库的发展,但今天,这样的基础已经具备。
潜心研发 TigerGraph图数据库强调“原生”和“并行”
尽管算力和算法技术在进步,但图数据库毕竟是一个新领域,任何一个新进入者都面临着许多未知的困难。TigerGraph也不例外,这也正是公司产品在去年正式发布前整整研发了5年时间的关键。
为了实现最优化的体系结构,TigerGraph在研发图数据库之初就选择了从零开始。当时已经有了Hadoop、分布式存储系统等,因此很多的图数据库都是在原有平台的基础上开发的,这样一来开发的量虽然小了很多,但是图数据库自身的性能、分析能力等都比较差。
为此,TigerGraph用C++从头到尾做了一套基于对图的存储引擎,并在上面构建了一个大规模并行的图计算引擎;同时,TigerGraph还做了针对图的高级开发语言GSQL,以及可视化界面和可视化开发环境GraphStudio,可以实现对图数据库的可视化探索、挖掘。
“可以说,我们专门做了一套针对图数据库的系统。”许昱博士表示,为此,TigerGraph称之为基于“原生”“并行”图(Native Parallel Graph,NPG)技术的全球首个实时图分析平台,相比较而言,该平台的技术优势体现在以下几个方面:
首先,实时计算,不超过1亿个节点和边关联的查询一般不到1秒钟一个服务器就可以完成;其次,支持数据库的实时增删改查,是可以上线的数据库;第三, 关联,用户可以使用TigerGraph针对图的高级开发语言,自己做图模型、做数据录入、做二次开发等。
图数据库市场方兴未艾 TigerGraph要做新领域的引领者
数据库技术发展到今天,已经到了变革的前夜,众多业界分析师表示,2018年将是图数据的元年。包括IBM、亚马逊等都在推出相应的产品,这对整个图数据库市场的教育非常重要,此外,用户端对数据分析的需求也在不断增强,他们希望从更深层次了解数据与数据之间的 关联,以及这种关联能够带来哪些商业价值。
TigerGraph中国区总经理乌明捷表示,图数据库从数据模型角度是包含传统的关系型数据库的,只是软硬件的发展限制了图数据库的发展,未来图数据库的市场会不断扩大。目前,TigerGraph 的已经与金融、银行、运营商和电力等等众多大型公司达成合作,未来也将在中国市场继续进行市场拓展,扩大图数据库的应用。
比如,在金融行业,金融企业可以借助TigerGraph系统在企业数据全景图上快速部署复杂有效的反欺诈和反洗钱业务,利用实时数据和实时 链接分析应对金融犯罪;在零售行业,零售商能够通过实时功能允许快速合成和理解消费者的行为和活动,高效地聚类产品,并提出个性化的推荐。
乌明捷透露,接下来,TigerGraph首先将在中国进一步推广图数据库技术,让更多的用户接触到这一新技术;其次,TigerGraph将致力推动整个生态的发展,通过开放合作的方式与行业合作伙伴进行合作,落地图数据库的应用;第三,TigerGraph也将在中国挖掘更多的技术研发人才,参与到公司的图数据库产品和技术的研发中来,对产品进行优化,并快速响应用户需求。
如今,图数据库市场的发展才刚刚开始,但对于TigerGraph来说,公司早已经在这一领域深耕多年。接下来,对于拥有先发优势的TigerGraph来说,如何在图数据库市场全面爆发之时做好引领者,将十分关键。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )