2018年10月23日,由中广联合会技术委员会、美国有线电视实验室(CableLabs)、华数集团共同发起的第二届全球有线创新峰会在杭州召开,声智科技联合创始人兼首席知识官常乐受邀展示最新研发的智能机顶盒远场语音交互解决方案。
目前,中国的机顶盒市场,主要有广电运营商的传统数字机顶盒、电信运营商的 IPTV 机顶盒和互联网运营商的OTT TV机顶盒,以IPTV和OTT TV为典型代表的网络机顶盒,凭借海量的互联网内容优势,并能满足用户个性化观看与互动的需求,发展势头强劲,市场占有率不断攀升。传统数字机顶盒行业进入转型期,以满足终端用户对数字电视网络智能化的需求。据中国广电与格兰研究联合发布的《2017年第四季度有线电视行业发展公报》数据显示,截止2017年底,全年IPTV用户总量达1.22亿,同比增长40.88%,OTT TV用户总量达1.1亿,同比增长52.22%。
声智科技联合创始人兼首席知识官常乐表示:“移动互联网和多元智能设备的日趋普及正在塑造新一代用户的交互习惯,用户时间呈现碎片化、分散化趋势,以语音交互为入口的智能设备正吸引着越来越多的用户。语音交互与智能化升级正带给传统机顶盒厂商历史性的发展机遇。基于真实场景环境的声学信号处理与人工智能算法的有机融合,才能打造符合终端用户需求的智能机顶盒产品。”
声智科技联合创始人兼首席知识官 常乐
机顶盒通常在家居环境中的客厅使用,而客厅是家庭成员日常互动交流与娱乐休闲的主要场所,噪音源较多,交互空间较大且交互角度广,同时,不同家庭成员的用户特点和需求不同。鉴于此,声智科技推出了基于远场语音交互技术的一站式智能机顶盒解决方案,可实现3-5米远场交互360度无死角,有效抑制多种噪声源,支持多人交互、多轮对话,同时,对接丰富的内容和服务平台,满足用户的个性化需求。
用“芯”驱动,“听”其所言
声智科技推出的国内首款低功耗麦克风阵列芯片SAI101C,专为以智能机顶盒为代表的智能硬件打造,最大功耗不超过0.8W且高度集成,CPU计算能力达到500MIPS,具备32x32的MAC指令能力,内置256KB内存和1MB闪存,完全兼容USB2.0规范。
同时,在适配低功耗、高度集成的语音芯片架构的基础之上,声智科技拥有核心自主知识产权的麦克风阵列,支持2麦、3麦、4麦、6麦,线型、环型、菱型等多种阵型,经过量产验证且成本可控,可匹配各种体积大小、形状结构的机顶盒产品,赋予机顶盒 “听”的感知能力,为5米范围内任意角度的交互提供硬件基石。
算法智能,“知”其所想
在硬件基础架构之上,声智科技研发了全链条智能语音交互开发系统SoundAI Voice Kit(SVK),集成声波配网、波束形成、声源测向、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话等核心算法,并设置开放式后端内容接口,对接任意第三方平台。
其中,为了解决不同品牌、机型电视产品的喇叭、音效对智能机顶盒的信号处理的阻碍,以及因电视机回传给机顶盒的音频参考信号的不准确性而造成的弱参考信号或者无参考信号条件下的回声抵消(自噪声抑制)问题,SVK OpenAEC算法,可实现智能机顶盒全方向的精准唤醒,减少无序唤醒干扰,同时兼顾误唤醒率。针对噪声源(例:电视、音响)、语音源、手机在一条直线上的情形,SVK AKS垂直抗强噪算法,可在电视音量强干扰下,大幅提高机顶盒的识别精准度。
SVK SSP空间感知算法,能让机顶盒知道自己的位置,比如离电视近,或者离茶几更近,进行音量大小的自适应,通过自主学习,无需用户主动调节,就能为用户带来最佳的环境音量体验;当空间内有多台语音智能设备时,SVK SSA空间认知算法,可让机顶盒具备用户指令的判断力,识别与自身功能相符合的指令,在正确的时机作出智能响应,为用户带来有序的智能交互体验。
搭载声智科技软硬件一体化的远场语音交互解决方案的智能机顶盒,用户可以抛开遥控器,用简单的语音指令解锁海量数字电视的功能和内容服务,尽享流畅智能的语音交互带来的品质生活。
关于声智科技
声智科技是全球领先的声学语音技术和语言智能服务科技创新公司,专注于声学前沿技术和人工智能交互,秉持“听你所言,知你所想”的技术理念,致力于通过不断引领真实环境下的人机交互体验,实现“声音连接智能未来”的使命,“更自由的人机互联”愿景。
声智科技主要提供从端到云的智能语音交互技术和服务方案,以及从芯片、模组、开发板到完整产品的智能语音应用方案。目前与百度、阿里、腾讯、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企业 合作,深耕智能家居、智能汽车、智能安防、智能金融、智能教育、智能医疗和机器人等行业,服务小米、百度、阿里、华为、腾讯、联想、锤子、创维、金蝶、浪潮、中国移动、奇虎360、中央人民广播电台等客户,是国内服务用户最多、应用场景最全和覆盖地域最广的远场语音交互技术供应商。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。