4月21日消息(南山)快节奏、碎片化的现代生活,发达的互联网技术,使得听有声书成为读书的一种流行形式。更令人意想不到的是,有声书还可以用AI技术创作。
4.23世界读书日前夕,喜马拉雅上线了AI超拟真有声书《智能交通》。这套有声书共86集,每集时长10-20分钟,首日上线21集,后续每天更新2集。据了解,用户在百度搜索“智能交通有声书”,可直接收听。
《智能交通》是百度董事长兼CEO李彦宏出版的一本著作,去年12月发行。百度语音合成团队基于《智能交通》一书20万字文本,使用李彦宏约1小时音频素材,通过AIGC(人工智能创作内容)技术生成了《智能交通》有声书。其音频合成效果还原度极高,普通用户听到的,几乎就是“原声”,难以分辨,也无需分辨。
“原声创作”展示了百度强悍的AI语音合成能力,也从一个侧面反映出AI技术正在加速渗透且改变人类社会。以《智能交通》有声书为例,一方面是AIGC(人工智能创作内容)的兴起,另一方面其本身蕴含的内容,是李彦宏对AI 变革交通出行行业的解读:自动驾驶不是梦,交通拥堵不再怕,交通事故不断下降……
互联网上近年有一句话很流行:“你要悄悄努力,然后惊艳所有人。”AI,从最开始的挣扎,悄然间已遍布各行各业,很快将惊艳所有人。
Part1:AI超拟真有声书《智能交通》是如何创作的?
《智能交通》顾名思义,是一本讲述交通行业智能化现状与未来的专业书籍,涉及不同的表达语境、相当多的中英文专业词汇。据了解,百度语音合成团队只采用了李彦宏约1小时公开音频,可用数据约300句且口语化,场景单一且没有英文词汇。以常用语言为基础,创作专业版的有声书,这种极致的对比,可以直观凸显“地狱级”的难度。
您的浏览器不支持本音频元素,请更新浏览器。
▲《智能交通》有声书音频片段
挑战主要有四点:如何只利用300句数据,高度还原说话风格;如何只利用中文数据,合成出音色、风格一致的中、英文混合播报效果;如何只利用单一的访谈口语化数据,合成出专业和叙述等其它语境下内容,保证其流畅性和自然度;如何利用发音不标准的数据,合成出高音质、高还原度,发音准确稳定的效果。
团队一一提供了针对性解决方案:率先研发的端到端细粒度建模技术,从300个整句的学习,进化到300句乘以每句20个字的学习方式,更好的挖掘了字与字之间的相互关系,更加高效的利用了数据。基于该技术,个性化合成只9句即可实现普通效果,300句已达到专业水准。
独创的解耦式建模技术,可以对说话的内容、风格、音色进行区分,并独立建模;通过大数据的学习,将学习到的三个维度能力进行迁移。从而达到让一个不会说英文的人,也可以正确的读出英文。此外也可以将风格能力迁移到特定人身上,例如讲故事。
此外,前后端联合建模技术,依托百度在语言处理的优势,结合文本处理与发音合成两大模块,联合学习了大量不同文本语境下的发音方式,实现跨语境合成;独创的通用声码器合成技术,结合了传统参数声码器的可控以及神经网络声码器的高还原度优势,修复错误发音和提升音频质量,有效解决口语环境下存在的发音不标准的问题。
目前,只需9句话素材、5分钟等待,百度语音合成技术即可实现对用户声音的复刻,300句话即可生成媲美专业音库的音频内容。作为业内唯一能提供10句话以内大规模产品级个性化语音合成服务的公司,百度相关技术早已应用于各类产品中,如在百度地图吸引超过600位明星红人入驻语音广场,实现个性化定制语音包,每日播放次数达2亿。
通过《智能交通》的创作,可以看到AIGC技术的进化,已经能够解决一些看似无法解决的难题,从而在技术层面扫除障碍。创作者基于AI技术平台,可以将精力聚焦于内容本身,从而大大解放了生产力,为行业发展带来了光明前景。百度的各类“率先”、“独创”技术,则证明了其在AI语音合成领域的江湖地位。
Part2:《智能交通》讲述了什么?
如果说AI有声书反映了AI技术在新兴领域的创造力,那么智能交通就是AI技术深刻变革传统行业的代表。《智能交通》这本书中,李彦宏从关注自动驾驶解决安全问题开始,一点一点深入,也一点一点放大关注的尺度——关注人类司机危险驾驶的问题以及自动驾驶、智能交通、智慧城市等问题。
比如,将交通事故率降低90%;根据国际公路安全协会发布的数据,每年约有135万人死于交通事故,降低90%就可以减少百万人死亡。再如,助力国家“3060”双碳目标达成,交通是非常重要的一环。建设未来的智慧城市,智能交通也是重要组成部分。李彦宏认为,智能交通系统可以提高通行效率,节约能源,降低空气污染的水平,帮助碳达峰和碳中和,惠及每一个有出行需求的人。
如果说这是《智能交通》一书创作的初衷,那么其中探讨的内容,更是全景式展现了人工智能技术的价值。聪明的车、智慧的路,构筑完整的车路协同系统,李彦宏判断,智能交通将是影响未来10-40年的重大变革,10年之内,依托交通效率提升,城市拥堵问题将基本解决。
C114留意到,《智能交通》出版上市,受到了众多知名人士和知名媒体的好评。例如中国工程院院士、国家新一代人工智能战略咨询委员会主任潘云鹤作序表示,“智能交通是一个兼具 和广度的智能大系统,书中相关创新研究和实践,一定能推动和引领国内外智能交通的新发展。”
用AI技术基于本书创作的有声书,值得一听。对行业人士来说,堪称“双倍智能”的体验。
Part3:颠覆AIGC,颠覆智能交通
百度在AI领域拥有宏伟的布局,仅从这套AI有声书,就可以窥见其在两个垂直领域的雄心:颠覆AIGC、颠覆智能交通。
从AIGC来看,当前市面流行的内容,无论是从制作方式还是内容本身都较为粗浅,仅仅是人工制作内容的补充,远远称不上主流。AI有声书《智能交通》由于内容的专业性,很难成为爆款产品,但其采用AI技术制作的精英级水准,显示出AIGC产业具有巨大潜力和可兑现能力,百度将扮演重要角色。
智能交通领域更加能够全方位考验一家人工智能公司的全栈式能力、 学习水平、行业解决方案的价值与综合社会效益。百度作为一家人工智能公司,在智能交通领域起步早、投资大、态度坚决,早已处于领军者地位。
一方面,百度是全球领先的自动驾驶技术开发商,不仅推出自动驾驶开放平台Apollo,还推出了自动驾驶出行服务平台萝卜快跑;另一方面,百度深入参与到全国智能交通的建设中,支持多个国家级车联网先导区和各省市先导区的高质量发展,从自动驾驶,走向自动驾驶和车路协同的全面发展。
百度在智能交通领域的 实践,正推动人工智能技术的产业化进行一次高级别的、高价值的、高技术含量的验证。而在AIGC领域的小试牛刀,也为行业注入了一股技术创新力,将搅动这一池春水,等待着内容创作者的热情回应。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- GTI 5G-A×AI融通发展项目 “智网慧城”计划全球招募正式启动
- 华为提出“四新”战略,助力运营商实现数智时代商业成功
- 华为王雷:星河AI网络全面商用,加速运营商新增长
- 华为提出构建以AI为中心的F5G-A全光网,助力运营商新增长
- 华为汪涛:AI加速超宽带产业创新,共赢商业新增长
- 移远通信:国内业务持续复苏 利润逐步修复
- 韩国《量子科技和量子产业促进法》正式生效
- 中国移动启动5G专网 定制产品短名单第一次增补采购:总预算13.5亿元
- 十二部门:探索核技术在量子计算等未来产业中的交叉应用
- 报告称2024Q3智能手机Top10:三星苹果前2,中国厂商占8席
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。