2018世界人工智能创新大赛夺魁 深思考如何攻克AI最强堡垒?

当前人工智能遍地开花,机器和人的关系正在发生本质性的变化,人机交互也正在步入新的时代。近日,2018世界人工智能创新大赛落下帷幕,作为多模态 语义理解与人机交互的技术引领者,深思考人工智能在超400家报名团队的激烈竞争中,摘得“人机交互创新应用赛”的桂冠。

2018世界人工智能创新大赛夺魁 深思考如何攻克AI最强堡垒?

2018世界人工智能创新大赛(2018 AI-WIN,AI World Innovation)作为2018世界人工智能大会的重要组成部分,是由国家相关部委、中国科学院、中国工程院、上海市人民政府共同举办,上海市经信委、上海市经济和信息化发展研究中心等承办的一场高规格的国际性人工智能创新大赛。大赛分为“人机交互创新应用赛”、“WAIAC无人驾驶大赛”、“人工智能卓医创新挑战赛”、“智能机器人创新挑战赛”四大分赛道。人机交互创新应用赛由上海经济和信息化委员会联合科大讯飞共同打造。

据了解,参与本次大赛评审专业委员包括来自中国工程院、中科院上海分院、中国人工智能学会、谷歌等在人工智能产学研领域的顶级专家,以及红杉资本、IDG资本、经纬中国等人工智能领域主要投资机构的顶级投资人,他们将共同评选出全球在技术或应用模式上做出方向性突破、正在或将要改变未来生活的优质人工智能项目,并表彰其最具有影响力和风向标意义的荣誉奖项。

如今,人机交互已不再陌生。呼唤手机自动接通朋友电话,让音响按指令播放音乐,安排亲子机器人给孩子讲故事等等。这些场景的发生,就是依靠人工智能 “语义理解”这项技术实现的。然而,在实际操作中,人机交互虽然提供了便利,但词不达意、理解不到位现象时有发生。尤其是中文,因其内涵博大精深、语意千变万化,成为人工智能领域最难攻克的堡垒。

“深思考在多模态 语义理解与人机交互方面有突出优势,其能使人机之间进行多轮交互,能够理解上下文,最厉害的是在人机交互的过程中实现会话意图的自由切换与准确识别,将人工智能从识别感知推进至 语义理解阶段。其语义理解是多模态的,相较于一般技术仅理解文本、仅理解语音,深思考的多模态 语义理解能够同时理解文本、语音和视觉图像背后的 语义。”深思考CEO兼AI算法科学家杨志明博士表示。

在人工智能人机交互方面,杨志明博士还透露了他们目前在人机交互创新方面的五大突破:

一,突破“单模态”语义理解,向“多模态” 语义理解迈进;

二,摒弃传统“单轮”人机交互,完成向“多轮上下文”语义理解交互的过渡;

三,由人与“智能终端”的交互转变为人与“虚拟人物” 交互;

四,“实际按钮”交互升级为“虚拟按钮”交互;

五,打破“无个性化”交互僵局,引领“个性化懂用户特征”交互。

据悉,深思考人工智能的核心团队由中科院自动化所、软件所、计算所、微电子所等中科院院所、清华大学一线青年AI科学家与领域顶级专家、营销专家组成。目前主要面向的场景为智慧医疗大健康和智能汽车。

杨志明讲到,“我们和一些初创AI企业的区别在于,核心团队已经在AI行业做了十多年,积累的技术基础比较深。多次的创业经历令我们意识到创业要更多的关注技术到产品的落地,所以我们也着重关注产品落地与行业痛点,把自己的技术积累和和领域业务相结合去创业,形成刚需的产品。”

解决刚需痛点 赋能智慧医疗大健康

在深思考看来,AI技术的不断推陈出新,为的是解决刚需痛点。因此,深思考在走向智慧医疗大健康的商业布局时,将多模态 语义理解赋能于健康咨询和健康筛查两方面服务的应用。

在健康咨询方面,深思考采用云模式接入的方式,与九阳、小米等上市公司进行合作。在智能音箱、电饭煲等产品中接入健康咨询服务,为消费者提供饮食建议、营养咨询、膳食制作等健康管理服务。此外,当智能音箱、手机等接入云服务后,也可以提供妇婴领域、慢性病、肿瘤等诊前诊后健康咨询。

杨志明提到:“现在的人工智能已经从识别感知推进至 语义理解阶段。深思考在健康筛查方面一直致力于通过“多模态 语义理解”技术,打造AI病理细胞学筛查平台,形成医疗大健康重大疾病AI筛查入口与医疗大健康筛查人群大数据入口。”

在重大疾病健康筛查方面,针对国内医疗资源匮乏和不平衡,基层宫颈癌筛查技术难度大,筛查率低的情况,深思考总结出一套“云”和“端”两种形态的商业模式。当病理扫描仪接入“C6云”后,AI就会批量帮助医生进行筛片;“端”模式则是基于深思考的“算法+芯片”整体解决方案——医疗影像专用AI芯片M-DPU,其具有尺寸小、低功耗、性能高等优势,可大大降低应用成本。当M-DPU嵌入到病理扫描设备中时,便可进行宫颈癌的筛查,实现基层医疗筛查的大规模落地。

据反馈,深思考人工智能宫颈癌辅助筛查系统 iDeepWise 已与大部分第三方检测机构和全国几十家顶级三甲医院进行 合作。

内外强强结合 提高智能汽车交互体验

在深思考的多模态 语义理解中,最重要的便是融合了语音文本和图像的 语义理解。基于此,杨志明说到,利用自身在多模态 语义理解与人机交互的技术积累,深思考在智能汽车领域打造了车外、车内两套模组,共同发挥作用,提供更好的人机交互体验。这便是 “深义”系列多模态智慧车载 语义理解机器人(iDeepWise.ai bot 4.0)。

在车外模组上,深思考应用计算机视觉技术,对汽车的360°环视影像进行拼合,再对图像进行识别分析,通过对图像的语义理解来服务车辆与驾驶者的人机交互。而在车内模组上,深思考主要应用的是自然语言的语义理解技术。在中文人机交互领域,深思考拥有具备自由跨域上下文理解的AI技术,这使车载系统在与用户交互时拥有上下文记忆 ,能够在用户中途切换话题的情况下,无需再度重复也能回到刚刚讨论的内容中。

杨博士说明到,通过车内外两套模组强强结合,车辆的人机交互模块可以弄清楚当前车辆所处的场景,从而将交互模式调整为适应当前场景的状态。比如识别为高速场景,交互的内容会与之对应;而识别为城区、拥堵道路时,车辆的交互可能会增加轻松的内容以舒缓驾驶者的焦虑。他还举例称,假设现在车辆行驶在风景优美的大草原,传统的车载系统并不会有任何额外的反映,但深思考的多模态 语义理解机器人会根据对场景的理解以及此前对用户的学习,来主动推荐相关的内容,比如问你“要不要来看首腾格尔的歌?”。

目前,深思考已完成近五千万融资,即将完成A+轮近亿融资。公司“多模态 语义理解与人机交互”技术产品在落地领域已签署上亿订单。未来,相信深思考在中文语义理解领域会不断取得突破,继续领跑人机交互与多模态 语义理解。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-11-20
2018世界人工智能创新大赛夺魁 深思考如何攻克AI最强堡垒?
当前人工智能遍地开花,机器和人的关系正在发生本质性的变化,人机交互也正在步入新的时代。

长按扫码 阅读全文

Baidu
map