近日,山海大模型再迭新,各项性能持续增强的同时,新增实时检索功能,处理动态、实时信息更得心应手,一问一答更精准高效,极大提升了用户使用体验。
技术升级,性能全面提升
相较于上一代,山海大模型在语义理解、逻辑推理以及指令遵循性能、对齐能力性能等方面显著提升。
此次大模型升级中,云知声引入自我演进偏好学习技术,使得大模型能够通过自我对弈微调(SPIN)实现自我提升。
在基础设施方面,云知声升级自研Uniscale训练推理一体化框架,以支持千亿级模型的偏好对齐训练。这一升级使得山海能够处理更大规模的数据集,从而提高训练效率和模型性能。
在数据生成方面,云知声采用指令自我迭代算法,生成了更加复杂和多样的指令数据。为了降低高质量人工偏好数据的高昂成本,其结合了RLHF(强化学习人类反馈)和RLAIF(强化学习人工智能反馈)方法,生成大量偏好数据。同时,借鉴课程学习的思路,对偏好数据进行重排,使模型能够从简单任务逐步过渡到复杂任务,有效提升了学习效率和效果。
在算法创新方面,SPIN技术通过自我对弈机制,让LLM在迭代过程中自我生成训练数据,并通过比较自生成响应和人类标注响应来优化其策略。这种方法不仅提升了大模型性能,也充分释放了人工标注数据在监督微调(SFT)中的潜力。
新增实时检索,让答案触手可及
为进一步提升用户体验,此次升级,山海大模型引入实时检索功能,无论是最新资讯、热点事件还是专业查询,用户的每一问,都将得到更精准及时的回应。
为了实现这一流程,云知声自研Agent框架,充分释放大模型推理和交互潜力,确保了用户意图的精准理解、信息的高效获取与总结,以及生成高质量回应的可靠性。
应用先进的意图理解和高效的实时信息获取能力,山海能够在极短的时间里对用户的交互进行意图判断,并依托对自身知识库的深刻理解,精准决策对话过程中是否需要额外信息的支持。这一过程不仅避免了无效的检索,还显著提升了对话生成的速度和准确性。
当山海判断用户的交互超出了自己的认知时,能够迅速启动信息搜索机制,从互联网的海量数据中迅速定位并提取相关话题内容。通过高效的信息处理和总结,为用户提供准确、及时且详尽的答复。
目前,实时检索功能已在山海小程序同步上线,欢迎大家体验试用,让山海真正成为你工作生活中的随身智能助手。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )