近日,神经信息处理系统大会 NeurIPS 2020(Conference and Workshop on Neural Information Processing Systems)于线上举行。在官方公布的论文入选名单中,云知声与 CMU (卡内基梅隆大学)张坤教授团队等合作的针对机器学习典型的无监督领域自适应问题论文《Domain Adaptation As a Problem of Inference on Graphical Models》,凭借基于数据驱动的图模型框架解决方案的创新研究成功入选,彰显了云知声在人工智能与机器学习原创技术领域的持续创新能力。
近几年,得益于越来越多真实场景数据和充足的算力,现有技术在领域匹配或者数据覆盖到的场景效果表现不错,但是在跨领域场景,尤其是目标领域没有标注(无监督)的情况下性能还有进一步提升空间,如何利用无监督领域自适应技术解决跨领域场景问题是目前人工智能技术发展的热点研究领域,也是未来人工智能技术实现跨代发展和更加智能化绕不过去的技术门槛。
在本论文中,针对目前机器学习典型的无监督领域自适应问题,提出了一种基于数据驱动的图模型框架下的解决方案。典型的无监督领域自适应问题是指利用源领域的数据,如何在新的目标领域准确做出预测。一般来说,源和目标领域之间的数据分布是不同的。我们假设不同领域的数据是独立同分布的,为了利用已知源数据对目标领域的数据分布进行建模,引入隐变量 θ 表示领域相关的变化因子,同时利用增强有向无环图(DAG)来描述领域之间联合分布,通过将在目标领域的预测问题转化为增强图模型框架下的贝叶斯推断问题,实现基于数据自动驱动的无监督领域自适应。在模拟数据和三个真实数据集上的实验结果均表明利用图模型解决无监督领域自适应问题的有效性。
本文提出的全自动的端到端的无监督领域自适应技术方案除了为学术界提供新的研究思路外,对于工业界更具有重要的现实意义。在实际的应用场景中,这些大量异构未标注的数据如果能够通过此项技术得到有效利用,将会极大的提高目前人工智能技术的鲁棒性和跨场景下的性能。
美国计算机科学家和哲学家 Judea Pearl(图灵奖获得者、贝叶斯网络之父)在社交网站上推荐本论文的研究成果,表示本文的基于因果思维的方案提供了有别于传统机器学习方式的、新的、有保障的迁移学习方式。
NeurIPS 是人工智能、机器学习和计算神经科学领域顶级学术会议之一,也是 CCF 推荐的A 类国际学术会议。本届 NeurIPS 会议共收到投稿 9454 篇,创下投稿数量历史新高。其中录用论文 1900 篇,接收率约 20.1%,为历年难度最高的一届。作为学术界、工业界公认的人工智能领域国际顶级会议的翘楚,NeurIPS 代表着当今人工智能研究的最高水平和技术发展趋势,在谷歌发布的 2020 年最新版学术指标(Google Scholar Metrics, GSM)榜单中, NeurIPS 在人工智能领域学术影响力排名全球第一。
此次入选 NeurIPS 论文集,是云知声全栈和硬核技术的一次新突破,也是继吴文俊人工智能科技进步奖、北京市科学技术进步一等奖,CHIP2019 临床术语标准化任务评测冠军、CCKS 2020 医疗命名实体识别评测冠军、BC 2020语音合成技术评测冠军,以及多篇论文入选 NLP 国际顶会 ACL、语音 AI 顶会 InterSpeech 等诸多技术成果之后,在前沿技术上的又一次新突破。
在人工智能底层技术方面的深厚积累,也将不断促进云知声人工智能系统的“智力”提升,推动其更好地应用于智慧生活、智慧城市以及出行、教育、医疗等千行百业,为用户创造更好的智能体验。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )