12月13日,由安创科技举办的安创成长营二期Demo Day在深圳丽思卡尔顿酒店火热上演。来自上海的问之科技,也有幸参与其中,为大家展示了智能语音交互一些独创的科技创新成果。
上海问之信息科技有限公司成立于2015年9月,是一家从事产品自主研发的高科技企业。核心团队为来自阿里、盛大等知名互联网公司的语音技术专家,创始人曾创立阿里巴巴语音团队。
他们致力于该领域的产品和技术开发,目标是打造中国机器人的最强大脑。以语音、语义技术为核心服务于机器人及智能家居领域,一切旨在为拓展智能交互新体验,用声音传递简易生活方式!
由于他们的专注和坚持不懈,使得他们已经能够提供国内体验优越的、技术领先的语音交互一站式解决方案。
这次的Demo Day他们的创新设计,给在场的导师们,评委们交出了一份令人信服,为人感叹的满意答卷。那现在我们来看看问之科技在智能交互方面的创新之举吧!
我们要了解,智能语音交互需要有三个方面的要点:
首先要对语音,语义有精准的理解。
问之科技为了更好的解决这个首要的问题,特别提出了语音DNA的概念!
什么是语音DNA?
它是指交互机器人对限定的人群,如最亲近的,最长提供服务的使用者,做到语音+语义越来越理解,交互越来越精准,接近于完美。
为此,问之科技提出了三个解决的办法:
针对用户个性化,可以做到记忆和适配个性用户信息。
针对开发者个性化,可以使用一个引擎支持多个开发者模型。
针对产品场景个性化,可以提供语义场景指导语言训练+语义修正识别结果。
其次,人与机器人之间必须有十分流畅的语音交互。
针对研发过程中常见的交互问题,如对话反应慢,语义理解错误,说话被打断,回答文不对题等等,问之科技的工程师们通过深入的分析,找出相关原因,通过加强静音检测多模块协作,Oneshot功能的设计与完善,一次请求完成交互,离线唤醒等功能的开发,几近完美的解决了这类问题。
普通芯片无法支持较大规模 神经网络计算,而GPU这样的并行计算芯片又非常昂贵。问之科技研发成功了首款基于语音神经网络(DNN)芯片加速的离线语音识别,让家居控制更加精准稳定简单。
问之科技团队通过创新设计,理念导向等成功的解决了智能语音交互的三个要点。紧接着面对的就是形形色色的使用者,商家,个人,开发者等等,又会面对各式各样的使用场景:如在家,在公司,在公共场所等。那怎么更好的解决这类个性化需求的问题呢?
问之科技的资深工程师们又特别提出了另一个可靠的做法:
那就是为了场景而生的:Aison文法!
这个Aison文法吸收了各类文法的优势,并加以改进,它拥有强大的功能:
- 多轮对话(短时记忆/遗忘曲线/话题转换)
- 长时记忆用户信息
- 主动引导用户提供关键信息
- 知识点跨领域复用
- 单条描述支持模糊匹配
- 内建命名实体知识点:时间、地点、歌名、酒店等
而自由问答和实时增量索引,这两项功能为Aison文法提供了更有利的支撑,使得Aison文法十分强大!
自由问答:就是基于句式嵌入和神经网络、多问多答、最优答案选择
实时增量索引:即建即得,边做边试
更令人惊喜的是,问之的工程师们不是仅仅说出想法,提出方案而已。他们已经先一步落实到了行动,这Demo Day的来宾都可以看到他们带来的最新的两款产品实例展示!
这两款产品分别是:
1. 离线语音识别芯片,一个强大的全球领先的离线神经网络芯片。
主要功能是可同时自定义上千命令词;并且支持最多10米的远程拾音。
2. 机器人解决方案。
主要功能是:它可以支持远场拾音,5米的识别率可达90%;是基于DNN-CTC的语音唤醒的算法,并且支持自定义唤醒词;能够在线语音识别和语义理解,支持多轮对话随意打断;支持语义理解个性化定制。
这两个功能强大的产品的研发成果,使得国内人工智能技术,特别是语音交互领域,有了较为明显的进步。
问之团队在智能交互语音的大胆创新,已经给这个领域注入了无穷的生机与活力,这匹行业黑马还会开拓出什么样的新世界呢?我们拭目以待!
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。