阿里研发了一种新的大语言模型情境学习框架

7月6日消息,据报道,阿里巴巴研究团队研发出一款名为 Deep-Thinking 的大语言模型情境学习框架。

这个框架是一种迭代式的前向训练框架,旨在让大模型能够 思考和快速定制专属模型。它摒弃了传统的模型训练方法,通过情境学习(In-context Learning)使该模型功能更为强大。

情境学习框架是在大模型时代的背景下提出的新兴框架。

大模型具有思维链、情景学习等涌现能力,能够执行人类的指令,并可以直接与人类进行对话。其核心作用是突破数据标注的困境,通过学习海量无标注的数据来进行预训练,从而提升大模型的知识水平,并在后续的下游任务中应用。

这个框架的提出将有助于大模型更好地理解和适应不同的情境,为人工智能的发展带来新的可能性,有望在语言处理和人工智能领域发挥重要作用。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-07-06
阿里研发了一种新的大语言模型情境学习框架
大模型时代的背景下提出的新兴框架。

长按扫码 阅读全文

Baidu
map