Zilliz 在第三届稀土开发者大会 (XDC 2023)上的分享可以解答一二。近日,由稀土掘金技术社区主办的 XDC 2023 成功开幕。Zilliz 受邀参与并和业界同仁一起围绕开源生态与产业发展,探索和发现产业中最具价值的新技术,探讨在技术变革中的应对策略,期望携手万千技术开发者在激荡的环境中,共同探寻前行的方向。
在大模型与 AIGC 论坛上,Zilliz 开发者关系及市场运营负责人、客户成功与生态发展负责人李晨进行了名为《向量数据库:面向 AIGC 的海量记忆体》的主题演讲。
李晨指出,当前大模型面临的主要问题之一是“AI 幻觉”,而构建知识库是解决该问题的有效方法。向量数据库可以作为知识库的扩展插件,为大模型提供知识增强的能力。
向量数据库是为人工智能而生的数据库。作为全球第一款开源的向量数据库,Milvus 具备云原生分布式、超高性能、可插拔引擎以及云端一体化的特点。通过与 NVIDIA Rapids 的合作,Milvus 成为全球首个支持 GPU 的向量数据库,查询性能提升了 3 倍;而与 OpenAI 的合作,则使得 ChatGPT 的插件具备了向量检索的条件。
当然,向量数据库的玩法远不止于此,在配合大模型的基础上叠加如今火热的 LangChain、LlamaIndex、Semantic Kernel 等框架项目,向量数据库可以将记忆体的效果发挥到极致,帮助开发者实现 12 小时写出一个 AI 程序的梦想。
这种搭配也为大语言模型时代构建数据应用提供了一种新的范式,称为 CVP Stack。其中,C 代表以 ChatGPT 为代表的大模型,V 代表向量数据库,P 代表 Prompt 工程。C 作为运算单元,提供逻辑分析和自然语言对接的能力;V 作为存储单元,提供稳定准确、高容量的知识;P 在前两者的基础上,提供面向具体业务的适配能力。
例如,Zilliz 的工程师就曾用两天的时间做出了 CVP Stack 的 OSSChat(https://osschat.io),用于解决开源项目文档冗长、不易查找等问题,目前已经支持几十个主流的开源项目,访问量巨大,用户甚至可以去生成开源项目的代码。
目前,Milvus 不仅具备百亿级向量的扩展能力,还集成了 OpenAI、Langchain、Huggingface、Pytorch 等人工智能生态系统,成为大语言模型落地应用的重要组成部分。
当然,为了提供开箱即用的全托管向量检索服务,Zilliz 还推出了全托管的 Milvus 向量数据库产品——Zilliz Cloud。它具备维护成本低、使用门槛低、丰富的企业级特性以及安全可靠的特点。Zilliz Cloud 已经支持了 AWS 和 GCP,即将支持阿里云、百度智能云、腾讯云、金山云等云平台。
可以说,Zilliz 致力于构建开源+云的非结构化数据处理方案。而随着 AIGC 浪潮的兴起,Zilliz 必将披荆斩棘,带领向量数据库行业成为AIGC时代架构的重要组成部分。未来,在 AIGC 领域的推动下,向量数据库将朝着更大、更快、更稳的方向发展,降低使用成本,更好地服务于开发者和企业。
总的来说,向量数据库作为大模型时代备受关注的细分领域,在 AI 时代具有重要意义。作为赛道的奠基者和领先者,Milvus 和 Zilliz Cloud 通过 CVP Stack 为大模型场景的落地提供了典型的范例。回到AI时代,对于广大开发者和相关企业来说,探索开箱即用的向量数据库产品是必然趋势。
值得欣喜的是,据 Zilliz 官方透露,全托管的 Milvus SaaS/PaaS 将于下周上线,由 Zilliz 原厂打造!将覆盖阿里云、百度智能云、腾讯云、金山云等云平台。目前已经支持试用申请,企业用户可以申请 PoC 或其他商务合作,请联系 business@zilliz.com。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )