在人工智能领域,场景应用、平台建设是并行的,如何打通多项AI能力,提供融合的智能服务,对国内AI企业提出了挑战。捷通华声作为国内人工智能产业的开拓者与领导者,早在2011年就推出了全球首个全方位人工智能平台——灵云(AIcloud.com)。
该平台融合智能语音、智能图像、生物特征识别、智能语义等12项人工智能技术,并面向产业全面开放。为此,作为中国软件网策划的“2018中国AI应用、平台与生态”系列专访第二期,我们采访了捷通华声总经理武卫东,跟他聊一聊人智能应用和人工智能开放平台的发展逻辑,以及捷通华声的一些实践经验。
深化应用、构建平台,是人工智能厂商的未来
根据中国软件网《2018中国人工智能应用与生态研究报告》中调研数据显示,38%的人认为我国人工智能产业目前处于应用扩展、平台建设阶段;33%的人认为我国人工智能产业已经进入平台竞争、生态建设阶段。可见,大部分人都认为我国正在进行AI平台和生态建设。
值得提出的是,应用落地和平台、生态建设是同步并举,人工智能厂商之间的竞争将在多个维度同时进行。要建成完善的AI平台和生态,预计还有5~10年时间。
武卫东认为,通过构建人工智能开放平台的方式,深化行业应用、聚集合作伙伴,进而构建人工智能产业生态是捷通华声重要的战略布局。捷通华声在这方面很早就进行了积极的探索,2011年,捷通华声的灵云平台就面向产业全面开放,并以“云 + 端”方式,为产业界提供语音合成(TTS)、语音识别(ASR)、麦克风阵列(SMA)、语音唤醒(VW)、手写识别(HWR)、光学字符识别(OCR)、人脸识别(AFR)、声纹识别(VPR)、指纹识别(FPR)、自然语言理解(NLU)、数据挖掘(DM)、机器翻译(MT)等全方位人工智能能力。通过将其积累的人工智能技术开放出来,捷通华声积累了众多的合作伙伴,并服务大量的行业客户。
融合多项智能应用,打通整个智能产业链条
武卫东指出,目前人工智能厂商大多提供单一的智能服务,比如语音识别、图像识别等,多项智能应用的融合度不高。但是就市场需求来看,用户想要的往往是多项智能服务,并且这些不同领域的智能应用要很好的融合,形成完善的解决方案。
捷通华声作为在智能语音领域领先的厂商,其能力不仅局限于语音领域,已经扩展到智能图像、智能语义、生物特征识别等领域。具体来看,捷通华声提供的智能服务包括:
智能语音领域,捷通华声能具备正确率为97%以上的语音识别能力,并能实现21种语言的语音合成服务,以及语义理解能力。另外,捷通华声还提供独具特色的声纹识别应用,可以根据说话人的语音特征,提供声纹鉴别和声纹确认,并作为生物特征识别的重要手段;
智能图像领域,捷通华声提供的OCR服务,除了支持识别汉语、英语之外,还支持维语、蒙语、藏语、朝鲜语、哈萨克、彝族等多种少数民族语言的识别。更进一步的,捷通华声具备手写识别能力,能将手写字迹转化成文本,识别准确率在99.9%以上。此外,捷通华声还支持人脸识别和指纹识别应用。
值得提出的是,捷通华声通过灵云平台来提供这些智能应用,致力于实现不同种类智能服务的融合,而不是简单的产品堆砌。在武卫东看来,单项智能的局限性较大,未来必然是多项智能的高度融合。为此,捷通华声突出全方位人工智能的能力建设,并以灵云平台为载体,向开发者、合作伙伴开放出来,共同赋能整个智能生态的发展。
融合生物特征识别,提供个性化智能服务
构建人工智能平台,不是单纯的将各项AI能力放上去就可以,要发挥作用必然要理顺内部的业务逻辑。在与武总的交流中,给我启发比较大的是捷通华声基于生物特征识别打通智能服务链条的构想和实践。
在捷通华声看来,人工智能应用的一个重要价值,就是对不同用户提供高度符合其需求的相关服务。在以前,针对特定个体提供定制化服务只在很有限的范围内实现,比如对VIP客户的服务。现在,由于数据的积累和智能化技术的发展,基于数据分析的用户画像和定制化服务,无论从技术难度还是经济效益上来说,都具备了实现的可能。而要实现对不同个体的定制化服务,关键的第一步就是对实现特定个体的识别。在互联网时代,人们大多通过各类账户来实现用户识别;在智能时代,基于生物特征的用户识别将成为常态,比较典型的就是人脸识别和指纹识别。另外,捷通华声还提供独具特色的声纹识别服务,可以根据一个人声音特点来进行身份识别和验证。
通过人脸、声纹、指纹等生物特征识别技术,加上数据分析和用户画像,就可以打通整个智能服务链条,给用户带来实时、智能的服务体验。为此,他描述了这样一个场景:一个银行用户进入银行,通过人脸识别、声纹识别技术,系统可以根据对用户面部和声音的识别知道他的身份,再通过对系统内该用户记录和用户画像的分析,推测出该用户的需求,并提供不同的服务。比如根据系统分析,如果一个用户属于风险厌恶型的,在推荐理财产品时就会选取低风险产品;如果分析出该用户是激进型的,则推荐高风险、高收益的理财产品。这样,可以大大提升用户体验,提升用户粘性。这样一套系统充分体现了人工智能相对于人的优越性,在上述场景中,银行大堂经理是不可能对进入银行的每个用户都能全面了解的。通过人工智能与大数据技术,以及多项AI能力的融合,构建的这套系统能实现基于身份认证的个性化智能服务,这也是灵云平台的优势所在。
携手合作伙伴,共铸智能生态
作为成立于2000年并一直全面发展人工智能云服务的高新技术企业,捷通华声不仅提供智能语音、智能图像、生物特征识别、智能语义等全方位人工智能技术研究与应用,也与众多伙伴一起,推展更丰富的应用领域,搭建互利共赢得智能生态。
基于灵云平台,捷通华声致力于用AI技术促进产品产业升级,巩固合作伙伴行业地位,帮助合作伙伴落地AI业务场景,共同构建AI全链条的行业生态。为了最大化支持合作伙伴,捷通华声可提供公有云、私有云服务及综合智能解决方案,并针对不同产品灵活变换合作模式。此外还提供全套的技术培训支持,包括灵云AI产品课程培训、业务分享沙龙、在线视频技术学习等,并在联合推广营销方面给予合作伙伴大量的支持。
在人工智能的各个领域,平台化、生态化趋势日益明显,其平台和生态建设路径一般是:通过AI技术赋能各个行业,找到一些适合AI应用的领域快速商业化和规模化;加快应用领域拓展、行业深耕和客户资源的积累;搭建人工智能平台,实现生态化发展。总体来看,捷通华声也基本遵循了这一发展路径,在发展出众多AI能力之后,构建人工智能平台,携手合作伙伴共建智能生态,未来必将取得更大的成绩。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。