多模态能力再升级 讯飞智作2.0让视频生成更高效

2023年8月15日,讯飞星火认知大模型V2.0升级发布会如约而至,科大讯飞董事长刘庆峰、研究院院长刘聪重磅发布代码能力和多模态能力升级版本,同时发布搭载升级讯飞星火认知大模型V2.0能力的多项应用和产品。同时现场展示了讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面的全新表现。

多模态能力的升级也将为AIGC带来前所未有的产业机会,发布会上多模态能力升级后的产品——讯飞智作2.0也正式发布,无论是视频的后期处理还是创意视频生产,搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定,内容创作的想象空间正在被无限放大。

深耕人工智能领域24年,科大讯飞依托在语言及语音、图像、自然语言理解等底层技术的深厚积累,自2022年正式推出讯飞智作AIGC音视频内容创作平台以来,目前已有300多万的用户使用AI辅助音视频内容生产,平台提供多场景、多情感、多语种的AI主播,用户还可以通过录制5分钟的视频,构建虚拟分身,快速进行视频生产。

集成了科大讯飞最新SMART TTS效果的讯飞智作,可以提供各种场景的AI配音,多种音色可选,包括20多种方言、30多种语种,覆盖纪录片、新闻、短视频等各类场景的配音需求。以泾县桃花潭的风景视频为例,该视频描写了在初秋清晨桃花潭的美丽景色,通过讯飞智作2.0给视频配上专属文案解读。

在市场推广过程中,视频宣传成为不可或缺的手段,为了保障时效性和推广的广度,视频制作量也越来越大,需要更高效的生产力。发布会现场,科大讯飞研究院院长刘聪使用讯飞智作2.0进行虚拟人短视频生成、视频创作,“写一段黄山毛峰宣传文案,包括茶叶的产地、包装、色泽等特点”,刘聪又设定一位徽州古风女主播呈现,几分钟后,一个推介黄山毛峰的短视频就马上生成。

讯飞智作2.0可以进一步降低短视频制作的门槛,满足更多元的视频制作需求,推动AIGC产业的发展。

目前通过讯飞智作AIGC创作的视频配音、新闻视频、培训视频、广告视频已经广泛应用于媒体、金融、智慧文旅、企业数字化、智慧政务、IP运营多个领域,并与学习强国、新华社、WAIC、中信银行、中国平安等单位建立合作。未来讯飞智作仍将致力于用AI更好地拓展内容创作方式,持续让AIGC助力各行各业的内容生产。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-08-17
多模态能力再升级 讯飞智作2.0让视频生成更高效
多模态能力再升级讯飞智作2.0让视频生成更高效

长按扫码 阅读全文

Baidu
map