7月26日一条大模型上榜的消息首先刷爆了AI从业者的朋友圈。
上面AI从业者说的就是,在榜单上发现了一家且唯一一家大湾区团队,而且一上榜即杀入前八。同属大湾区的其它团队,诸如华为的盘古、腾讯混元模型等均未进入到榜单,可以说这次是大湾区首家大模型团队进入了该权威榜单,并且从评分上超过了ChatGPT 和 Claude-V1.3等实力选手。
GS-LLM-Alpha的开发者为共生矩阵科技(深圳)有限公司。从工商注册信息来看,该公司是2023年5月10日注册的新公司,且无公开融资信息。主创技术团队是前深圳IDEA大模型技术成员,具备全要素大模型自主研发能力。相较于大厂和融资数亿的明星大模型团队,该团队的突然出现成为AI大模型赛道的一个强劲黑马,为本以为格局既定的大模型市场带来更多变数。
到此,值得让人思考的是,为什么这样的团队可以突出重围?实现这样前沿的技术需要什么?
新一代人工智能核心三要素是人、数据与算力。核心中的核心是人:有实际训练与模型研发经验的人。国内进入大模型赛道的玩家主要是两拨人:互联网大厂和具备大模型开发经验的创业团队。前者优势是资本,后者像共生矩阵科技这样的,优势是足够强势的技术人员。
大模型繁荣之下,其实是各种野蛮生长,具备自研能力团队少之又少。就在年初ChatGPT出圈之前,国内仅仅几个团队具备这样的条件专注大模型研发:清华智源/智谱团队、复旦大学Moss团队、深圳IDEA大模型团队,掌握大模型研发技术的核心成员少于100人。在GPT大火之后,互联网大厂快速跟进,但最难解决的是人才。大厂习惯的怼人和怼资源的模式,在研发大模型上体现了超出预期的成本,同时又面临着开源模型和更强的模型出现,那么竞争的意义何在?
以共生矩阵这样初创团队为例,在资源有限的情况下,通过短短数周的准备和训练,就能实现高性能大模型,刷新小规模模型在C-Eval的评分。这足以说明新一代人工智能的竞争将是技术代差的竞争。
同时也简单介绍一下市面上最权威的大模型测评:C-Eval ,覆盖内容广泛,包括STEM、社会科学、人文能力、和其它一些学科,成为大模型全球公认的客观评分标准。
这些指标主要用在以下场景:
1.评估大型语言模型(LLMs)的知识和推理能力:通过这些指标,可以全面评估LLMs在各个学科领域和不同难度级别的问题上的表现。
2.分析大模型的优缺点:通过这些指标,可以帮助研究人员了解基础模型在哪些领域和问题上表现良好,以及在哪些方面还有待提高。
新一代人工智能将覆盖日常生活与生产全过程,形成一个生态系统。每个智能模型都像森林中的一棵树,互相影响,构成了一个多层次的和谐共生系统。希望共生矩阵科技这样的行业推动者,让人工智能融入日常生活与生产,带来解放、提升幸福。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )