11月19日消息,阿里云百炼推出全新RAG框架,全面提升大模型的准确性和可靠性,可解决90%以上幻觉问题,更好地满足企业级大模型应用场景的需求。
RAG是大模型落地的重要技术,它可以将检索到的知识和大模型结合,以此优化大模型的生成效果。然而传统RAG方案容易检索到与问题相似,但与问题描述不符的难负样本,从而导致大模型易出现幻觉,例如面对“iPhone 16的参数规格”与“iPhone 16Pro的参数规格”这类极为相似的问题时,大模型容易给出错误答案。
为此,阿里云百炼在传统RAG框架之上,在业界首创双层幻觉信息过滤框架。在这一全新框架下,大模型在生成回答前,能先对候选信息进行一次全面的 分析和判断,自动识别并剔除“难负样本”,确保所有用于生成的信息高度相关且可靠。具体来说,该框架可通过重排序模型进行第一轮过滤,可过滤70%的通用难负样本,第二层大模型会进一步过滤剩余30%涵盖更复杂业务定制规则的样本。通过双层幻觉信息过滤框架,可解决90%以上大模型幻觉问题,并且相比单层信息过滤方案,效率大幅提升。
阿里云百炼通过双层幻觉信息过滤框架,可解决90%以上大模型幻觉问题
阿里云百炼资深算法专家谢朋峻表示:“全新的RAG框架极大地提升了大模型的生成效果,为大模型在复杂场景下的应用开辟了新的可能性,我们希望这一新方案能进一步推动了人工智能技术的发展和应用。”
目前,阿里云百炼可为企业和开发者提供三种模型服务:用户可直接调用大模型进行推理,例如Qwen、Llama、ChatGLM等主流开源和闭源模型;用户还可对大模型进行微调和训练,阿里云百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力,无需关心底层架构;此外,阿里云百炼还支持企业打造RAG应用,用户可在百炼上轻松创建知识库,并一键开启RAG,通过Assistant API联合输出。
据介绍,阿里云百炼已上线超100款国内外主流大模型,已服务一汽、金山、哈啰集团、国家天文台等超30万企业客户。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )