一直以来,语音素材和书面材料的转化都有着一道深深的鸿沟。每一次会议不仅要做纪要,还需录音留档“双重保险”,把采访录音整理成书面材料再精心提取重点,更是需要花费大量的时间。近日,随着百度输入法v8.0登陆安卓应用商店,新上线的语音速记功能,为这困扰人们多年的问题增加了一种更加便捷的解决方案。
功能入口 语音速记的两个模式
2017年初,为改变完全依赖人工的速记行业现状,百度就曾推出过一款能将音频转化为文字的SwiftScribe网页应用,上传wav或mp3格式的文件,时长在1小时内的语音内容皆可转换。转化效率比专业人工速记还要快上1.67倍,缩短40%的工作时间。这一次随着百度输入法v8.0上线的语音速记功能,依托于长语音等强大的智能语音技术,实现了语音实时转文字、录音并自动识别成文本的目标,省去语音文件转录的时间。更值得一提的是首次登陆输入法的声纹识别这一“黑科技”,可通过声纹区分用户,让多人语音同时转录也变成现实。会场级的语音识别准确率达到95%,完全可以用“住在手机里的速记员”来形容。
百度输入法v8.0中的语音速记功能,分为单人模式和多人模式两种。单人模式将成为日常生活中记录灵感和日记的更优选择,支持长时间、不间断的语音识别,可自动识别成文本并保存原始录音,识别结果出现误差时通过回听录音即可修正。多人模式凭借百度AI技术优势,在语音输入领域再次取得新突破,首次推出“声纹识别”系统,在2-3人的小型会议中,语音识别结果会根据声纹自动区分发言人。对于记者、作家、秘书等文字工作者们而言,两种模式兼备的语音速记功能无疑是一个省时省力的超级神器,轻松搞定多种工作场景。
据了解,最新版本的推出,又一次通过AI技术的应用实现了工作、生活方式的革新,为用户带来更加便利、高效的智能输入体验。除此之外,作为本次新版本两大核心亮点中的另一个特色,“AR表情”也为年轻用户创造了更具乐趣的交流方式,在产品诞生8周年之际,针对不同需求的用户打造更加丰富的输入体验。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 东南大学鲲鹏昇腾科教创新孵化中心正式成立 助力科研创新与人才培养
- 多地发布低空政策 | 欢迎报名“2025中国eVTOL创新发展大会”
- 2025中国国际锁具安防门业产品展
- 2025中国国际厨卫家居博览会 2025亚洲潮电博览会
- 锚定中东乘势出海,侨交会迪拜展吹响集结号
- 华为助力深圳荣获2024年“世界智慧城市大奖”
- 完美收官 | 2024CCLE教育后勤展·成都圆满落幕!明年4月上海,精彩继续!
- 南京大学 鲲鹏昇腾科教创新孵化中心揭牌,引领高校科研生态新模式
- 走进智能工厂,见证卓越智造的力量
- 铁木牛以机器人产品与技术推动数智化变革 引领物流搬运新生态
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。