2024年5月17日,智源研究院举办大模型评测发布会,推出科学、权威、公正、开放的智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。作为一家非营利性科研机构,智源研究院有着行业内稀缺的中立视角,公正客观地评价了当下“百花齐放”的大模型阵列。
其中,文生视频模型评测结果显示,爱诗科技旗下产品 PixVerse 位列全球TOP3,在国内同类型产品中表现最佳。
智源研究院智能评测组负责人杨熙博士讲到:“2024年2月Sora出现后引起了广泛讨论,也对国内文生视频模型能力提出了挑战。智源研究院与中国传媒大学联合,基于双方在大模型评测领域及视频质量评价领域丰富的科研成果和实践经验,对20余个文生视频大模型进行了测试。在提供公开服务的模型中,Runway和爱诗科技的PixVerse处于第一梯队,水平相当。”
随后,中国传媒大学智能媒体计算实验室负责人史萍教授,对本次文生视频模型评测体系进行了全面细致的解读。
本次测评共设图文一致性、真实性、视频质量和美学质量4个一级维度和26个细分二级维度,经专业、严谨的评测流程,得到最终结果:Sora模型目前处于全行业领先地位,Runway Gen2 和 爱诗科技的 PixVerse 模型整体表现优异,具备较强的竞争力。在视频生成的真实性方面,PixVerse 排名第一。
在由智源研究院副院长林咏华主持的圆桌对话环节中,中国信息通信研究院人工智能研究所副所长魏凯表示,本次智源大模型评测结果不仅是科学研究的指南针,也是用户选型及社会对人工智能认知的标尺,对大模型发展具有极重要的价值和意义。
爱诗科技创始人&CEO王长虎谈到,在大模型评测的历程中,语言模型曾是焦点所在。如今我们非常高兴地看到,智源的评测也高度关注多模态大模型,尤其是视频生成大模型,这与行业发展趋势一致。智源本次评测为大模型行业提供了宝贵的参考,也对所有参与评测的模型,包括我们爱诗,都提出了更高的要求。讨论大模型成功与否,应在技术层面之上,更多地关注其对用户和行业的实际贡献,比如是否真正满足了用户需求、推动了行业创新。我们期待与智源及其他行业伙伴一起,共同促进视频大模型及应用的持续发展和进步。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )