OpenAI今日(2月16日)发布了一款新的AI产品Sora,用户只需输入文本,即可生成一段极其逼真且富有想象力的视频,从而将战事正酣的AI竞赛引向好莱坞。
OpenAI旗下的ChatGPT可以在不上法学院的情况下通过律师考试,而Sora则希望在不上电影学院的情况下拍摄电影。OpenAI称,Sora能够根据文本指令生成一段60秒的视频,同时保持视觉质量。
它对语言有深刻的理解,能够准确领会提示,生成令人信服的角色。Sora可生成具有多个角色、特定类型运动、精确主题和背景细节的复杂场景。还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。
OpenAI今日还分享了几个样本视频,证明了通过文本生成视频的可能性。分析人士称,这是一个新的研究方向,也是2024年值得关注的一个趋势。OpenAI科学家Tim Brooks表示:“建立一套大模型,能够理解视频,理解我们世界中所有这些非常复杂的交互,是未来所有AI系统的重要一步。”
动画场景中有一个短小的毛茸茸的怪物蹲在融化的红色蜡烛旁的特写镜头。艺术风格是3D和逼真的,重点是照明和纹理。这幅画的气氛是一种惊奇和好奇,因为怪物睁大眼睛和张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真无邪和嬉戏的感觉,仿佛它是第一次探索周围的世界。暖色和戏剧性灯光的使用进一步增强了图像的舒适氛围。
一个渲染精美的纸制珊瑚礁世界,到处都是五颜六色的鱼和海洋生物。
几只巨大的毛茸茸的猛犸象在白雪覆盖的草地上走近,它们长长的毛茸茸的皮毛在风中轻轻飘动,远处是白雪覆盖的树木和山脉。下午三点左右的光线,远处的一缕云彩和高处的太阳,创造了温暖的光芒。
美丽、白雪皑皑的东京市热闹非凡。镜头穿过熙熙攘攘的城市街道,跟踪几个人享受美丽的下雪天气,并在附近的摊位购物。绚丽的樱花花瓣和雪花随风飘扬。
尽管这些视频已经足够惊艳,但Sora还有一个没有展示的功能,OpenAI团队可能在很长一段时间内也不会发布,那就是从单个图像或一系列帧生成视频的能力。Brooks说:“这将是提高讲故事能力的另一种很酷的方式。”
它可以准确地画出你脑海中的东西,然后让它栩栩如生。OpenAI意识到这一功能有可能产生 假冒和错误信息。Sora项目的研究人员Bill Peebles称:“对于这方面的影响我们非常小心。”
预计与Dall-E 3一样, OpenAI将在暴力和色情等方面对Sora的内容进行限制。还有一个潜在的问题是,Sora制作的视频内容是否会侵犯他人的版权作品。
从“文字生成视频”要威胁到实际的电影制作,可能还需要很长一段时间。尽管OpenAI所展示的视频令人印象深刻,但它们无疑都是精心挑选的,展示了Sora最好的一面。在没有更多信息的情况下,很难知道它们对模型的典型输出有多大的代表性。
而且,也不能简单地将120个一分钟长的Sora片段拼接在一起来制作连贯的电影,因为模型不会以完全相同的方式对提示做出反应,连续性难以保持。
但不管怎样,Sora已经开启了新的征程,并且势必将对娱乐和内容创作行业带来冲击。市场研究公司ABI research高级分析师Reece Hayden称,像Sora这类AI模型将对数字娱乐市场产生重大影响,新的个性化内容将在各个渠道传播。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )