Sora爆火后,掀起了全球竞逐AI视频生成的热潮。近日,国内一支AI生成的视频短片引发关注。该视频来自生数科技联合清华大学最新发布的视频大模型Vidu。
根据官方介绍,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
比如,输入“画室里的一艘船驶向镜头”这样一句简单的指令,Vidu就可以生成效果逼真、镜头连贯的一段视频。视频的整体质感可以与Sora相媲美。
除了可以生成复杂、细节丰富的场景,Vidu还可以虚构场景以及想象超现实主义的画面,具有多镜头语言,更好地理解生成熊猫、龙等富有中国文化特色的形象等。
据证券时报报道,基于在机器学习和多模态大模型的长期积累,生数科技团队在两个月时间里突破了长视频表示与处理的多项关键技术,成功研发推出Vidu视频大模型。
公开资料显示,生数科技成立于2023年3月,核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。截至2024年3月,生数科技员工总数超70人,其中近90%为研发人员。
生数科技由清华系AI公司瑞莱智慧RealAI、蚂蚁集团和百度发起的BV百度风投联合孵化创立,致力于打造可控多模态通用大模型。去年3月,生数科技开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser。
去年6月,生数科技获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资;8月,完成了数千万元天使 轮融资,本轮融资由锦秋基金独家投资。
2024年3月,生数科技完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。
证券时报报道称,在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。(周小白)
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。