生成式AI带来的是脑力革命,全球各个机构、厂商竞相发布大模型,大模型已经成为了人工智能领域的热门话题。在这个领域中,最强大的一些模型已经被广泛使用,它们可以帮助企业和个人解放劳动力,进一步提升工作效率,但究竟目前哪些模型的能力水平如何,似乎并没有客观的评价。
本次测试国内外7款大模型,涵盖巨头、互联网大厂、AI企业、创业公司。经过实测,发现GPT-4仍然是全球大模型的“大哥”,而在国内,文心一言、云从从容和清华的开源模型ChatGLM可以称为TOP3。
本次测试题库分为事实与常识、语义理解、文本生成、逻辑推理4大板块,总题量在573道,虽然在特殊任务处理上无法考量,但大致能反映出大模型的基本能力。
以下是8款大模型的介绍:
GPT-3.5与GPT-4
GPT系列是OpenAI开发的基于Transformer架构的自然语言生成模型,其规模分别为1750亿及1.76万亿。
文心一言
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,规模在2600亿,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨 学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。
云从从容
从容系列大模型是云从科技开发的AI助手,规模在数百亿,目的是帮助人们更加高效地完成各种任务,例如回答问题、提供建议、生成代码等。从容的功能主要集中在知识问答、创意文案、逻辑推理、文章撰写、常识问答、代码编写、语言理解、日常生活、专业知识九大维度。
Claude
Claude是Anthropic公司开发的大语言模型(LLM),主要特点是有用与可信(helpful and trustworthy)。Anthropic成立于2021年,是一家人工智能安全和研究公司,致力于建立可靠的、可解释的、可操纵的人工智能系统,公司的创始团队来自于OpenAI。
ChatGLM
ChatGLM是清华大学智谱AI开发的一个开源的、支持中英双语的对话语言模型,具备问答和对话功能的语言模型,并针对中文进行了优化。该模型基于 General Language Model(GLM)架构,具有 62 亿参数。
讯飞星火
“讯飞星火认知大模型”是科大讯飞发布的产品,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
7.MiniMax
MiniMax是国内大模型初创企业,产品包括Glow和Inspo。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )