年内三次升级时间点，讯飞星火在科学评测体系下行稳致远

最近ChatGPT在“朋友圈”很火，甚至连不关注AI的圈外人都知道它，但由于ChatGPT没有开放中国大陆注册，身边根本没几个人用过。询问专业朋友后才知道，ChatGPT因技术许可限制、语言差异和隐私安全问题，在中国可能会引发不必要的争议。各大国产巨头抢抓时机，纷纷推出自己的类ChatGPT产品，其中“AI国家队”科大讯飞在5月6日发布的星火认知大模型，现场全程采用中文语音交互演示，被网友称为“更懂中国人的AI大模型”。

最让笔者激动的，是科大讯飞董事长刘庆峰在现场喊出了“10月底整体赶超ChatGPT”的口号。在如此正式的场合，能够掷地有声的隔空喊话，想必讯飞有备而来。刘庆峰表示：“认识大模型已成为通用人工智能的曙光，我们有信心实现‘智慧涌现’，首先需要一套科学系统的评测体系”。原来，讯飞在星火立项之初，其与中国科技大学共同承建的认知智能全国重点实验室，牵头设计了适用于通用认知智能大模型的评测体系，并梳理出7大类目和481个具体任务。

这七个类目分别是文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力和多模态。在发布会现场，在讯飞研究院院长刘聪的真机、真人、语音交互演示下，星火认知大模型展现出优秀的逻辑推理、创意答复和数学计算等能力。据悉，在文本生成和数学能力上，星火认知大模型已经国内显著领先，且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平，处于国内领先水平。

与此同时，星火认知大模型依托国家级平台预训练快速迭代，将逐步缩短与ChatGPT的差距。在发布会尾声，刘庆峰喊出了10月底整体超越ChatGPT的豪言壮语。一方面在人才力量上，讯飞拥有两位《麻省理工科技评论》35岁以下科技创新35人榜顶尖科学家领衔的建制化博士队伍，核心成员超200人，并且多以85后、90后骨干力量为主。刘庆峰认为他们年富力强，是创造奇迹的主力部队，一定会代表行业甚至代表中国，不断地创造令人欣喜的成果。

另一方面在技术迭代上，讯飞拥有大量具有优势壁垒的技术成果。包括在常识推理挑战赛CommonsenseQA 2.0中刷新机器常识推理水平世界纪录，在科学常识推理挑战赛OpenBookQA中以准确率94.2%的绝对优势夺冠，在常识推理挑战赛QASC中以多模型准确率93.48%、单模型准确率92.07%夺冠。围绕认知智能技术，讯飞实现了基于语义图网络的开放场景理解，基于事理图谱的对话管理，基于知识学习的可控对话生成。

认知智能的世界不能野蛮生长，也不能蒙眼狂奔。随着我国对信息安全愈加重视，讯飞星火也提出了“在保护伦理和安全的前提下健康发展”的目标。刘庆峰明确强调，星火认知大模型会兼顾自主可控、信息安全和论文人理，严格遵循我国法律法规要求，借助通用人工智能帮助人类成为更好的自己。

可以肯定的说，讯飞星火认知大模型出师告捷，打出了漂亮的第一枪，更让人们对10月整体超越ChatGPT充满了期待。大家也可以前往星火官网注册体验，或购买已经搭载讯飞星火的讯飞AI学习机T20系列、讯飞听见或讯飞智能办公本X2，通过亲身使用，深入感受与持续关注产品迭代情况，或许科大讯飞这把“星火”真的可以燎原!

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）