3月24日消息,据科技博客TechCrunch报道,谷歌计划向第三方开发者开放其语音识别API,与Nuance及其它的语音识别公司竞争。为了吸引开发者,该API一开始将免费提供。
有关该服务的消息已经传了好几周。该公司今天在NEXT云用户大会上正式公布了该项服务。
谷歌表示,谷歌云语音API(Google Cloud Speech API)将覆盖超过80种语言,兼容任何实时串流或者批处理模式的应用,它将为应用程序提供一整套API,给它们带来“看、听与翻译”方面的功能。它基于目前驱动谷歌应用的语音搜索和谷歌键盘的语音输入的神经网络技术。它还有一些其它有趣的功能,如可在嘈杂的环境运行,支持实时运行。
谷歌的这一举措将会对整个行业产生不小的影响--尤其是对Nuance.长期以来,Nuance一直被认为是业界最好的语音识别技术提供商,它也是该领域最大的一家公司。鉴于谷歌提供的体验比现有提供商要好,而且定价较低,包括创业公司在内的众多Nuance客户有可能会转投谷歌技术的怀抱。
为了引起开发者的兴趣,谷歌的语音识别API一开始将完全免费提供。未来它将要收费,但价格很可能会比较低。谷歌可能会在成为该行业的主导者之后再上调服务价格。
截至目前为止,谷歌在其产品中提供的语音技术访问权限十分有限。该公司在去年的I/O大会上发布了一款语音交互API,让Android开发者可以为他们的应用加入语音交互功能。不过,谷歌尚未直接开放它的语音识别API.
而语音识别API的推出,将不仅仅影响到Nuance和其它的语音识别技术提供商,也将会对苹果造成冲击。苹果虚拟助手Siri的语音识别功能并不如谷歌的。苹果目前也没有通过提供API让开发者在他们的应用中使用Siri技术。
种种迹象显示,谷歌似乎变得更加注重语音技术和众多的使用案例。例如,该公司在2月宣布将允许Google Docs用户通过语音来编辑和设计文档。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 华为举办原生鸿蒙之夜暨全场景新品发布会,推出HarmonyOS NEXT和多款新品
- HarmonyOS NEXT正式发布:原生应用超15000个,开启更多机型公测
- Gartner发布2025年十大战略技术趋势 代理型AI与AI治理入选
- 多项数据成果重磅发布,2024全球数商大会数据空间创新发展论坛在沪顺利举办!
- 被欧盟重罚170亿美元后,特朗普爆料苹果CEO库克打电话向自己求助
- 2024全球数商大会在上海盛大开幕,共绘数字经济新蓝图
- 2024全球数商大会开幕:数“聚”上海,“链”接数字经济新未来
- 大疆正式起诉美国国防部,就错误列入CMC制裁清单提出抗议
- 揭秘Neuralink脑机接口的“主刀人” 他是马斯克野心的幕后操盘手
- 京东发言人证实:刘强东章泽天夫妇遭有组织造谣,警方已介入调查
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。