下一个十年,哪些技术将带来革命性的改变?
在一个新技术层出不穷的时代,对于这个问题,恐怕大部分企业与组织都在积极思考。
百分点技术副总裁兼首席架构师刘译璟博士认为,在产业数字化逐步深入的趋势下,以自然语言处理(NLP)、知识图谱为代表的认知智能技术将会以场景为切入点,通过以点带面、从局部到整体、层层推进的方式实现突破,从而为数字世界的交互与决策带来颠覆性改变。
百分点技术副总裁兼首席架构师刘译璟博士
为什么认知智能技术得到业界如此重视呢?这一切还得从数据开始说起……
//
数据信仰正在加速形成
//
尤瓦尔赫拉利曾在《未来简史》中预言:数据将成为人们未来的信仰。
现实情况中,企业与组织对于数据及其价值的认可度也在迅速提升。业界普遍认为,数据正在成为一种新型的生产资料,是未来企业/组织业务运转中不可或缺的要素。一位制造业企业CIO在向笔者谈到数据驱动业务时表示:“随着研发、制造、仓储、物流、服务等业务环节的数据全方位打通,为大数据、物联网、人工智能等技术的应用奠定了重要基础,智能制造已经不再是空想,未来将是数据进驱动业务。”
事实上,类似这样的企业不占少数。产业数字化和企业数字化转型的大浪潮下,基于数据的能力正在加速显现,并且得到越来越多用户的认可。就如IDG《2018中国企业数字化发展报告》中提到,企业在数字化转型过程中将逐步形成变革能力、敏捷能力、利用生态的能力、数字化产品与服务、数据资产化能力、经验数据化能力,这一切的基础就是数据。
刘译璟博士直言,用数据的角度去看待业务和现实,在观念上是一个巨大的转变,随着数字化程度越来越高,一个与物理世界相对于的数字世界在加速形成,并且物理世界与数字世界之间的交互会愈发频繁。因此,感知智能、认知智能等人工智能技术将会有巨大的用武之地,用户对于数据的信仰也将会加速形成。
//
从感知到认知:靠 学习不够
//
众所周知,得益于算力大幅提升、数据愈发丰富以及以 学习为代表的算法突破,以图像识别、语音识别为代表的感知智能技术近年来取得了突飞猛进的进步,并且在金融、零售、教育、安防、智慧城市等多行业与领域得到了应用。
不过,这还远远不够。
从技术发展的角度来看,从感知智能向认知智能是必然趋势,因为无论是图像中事物关系,还是语言中语义,都需要进行识别、理解,这恰恰正是认知智能技术正在努力解决的事情;从现实的角度来看,认知智能技术可以从海量数据中不断挖掘、提炼和汇聚知识,人们渴望有更深层次的认知,从而更好地了解客观世界。
在刘译璟看来,感知智能技术很快会在实际业务中遇到瓶颈,比如在语音识别中,如果只做文字层面的转换,而不能从认知层面去理解文本/文字的含义,那么对于用户的价值其实并不高;未来一定需要从认知层面去理解视觉中动作的含义、文字中语义与含义,从而了解业务变化并为决策提供支撑。“从数据到信息,再到知识,认知智能技术将发挥至关重要的作用。”
对于 学习,刘译璟博士认为, 学习技术的确是推动了感知智能技术的快速发展,但是仅仅依靠 学习技术是远远不够的, 学习是纯粹基于数据的方法,属于归纳的范畴,并不具有可解释性,在一定阶段后具有明显的瓶颈,从感知智能走向认知智能,仅仅依靠 学习是远远不够的,还需要有更多突破。
//
认知智能:到底应该如何突破?
//
某种程度而言,认知智能技术的发展并没有像感知智能那样快速,依然有着众多挑战等待突破。
虽然近年来很多大公司在努力推动包括云计算、大数据、人工智能技术的发展,构建出系列技术平台,希望屏蔽掉底层技术的复杂性,推动包括认知智能技术在内的应用发展,但在实际业务场景中应用并未取得令人满意。
刘译璟直言,人工智能的变革需要场景应用来驱动。正所谓是,独立存在不是技术追求的目标,依托场景应用才是技术存在的真实意义。刘译璟认为,以知识图谱、自然语言处理为代表认知智能技术的确还有很多需要突破的地方,长期在行业场景实践中实现突破是最佳的方式。
对于任何一项新技术都不能在一开始就抱有不切实际的幻想。“不能过分夸大人工智能技术现阶段的能力,以自动驾驶位列,L5级别的自动驾驶现阶段的确是非常难实现,因为它要求机器在任何时候都比人做的好。但是我们可以先从一些特定场景中实现突破,继而逐步实现更多场景的应用。像自动驾驶在目前城市出租车、园区接驳车这些场景中就已经得到实现和突破。”刘译璟补充道。
“未来3-5年,认知智能一定会取得更多突破。”刘译璟表示,人工智能进入到中期之后,将会更多的下沉到各个行业之中,将会更多更加具体的业务场景,意味着专业化程度会更高,可用的数据也将更少,专家和方法的重要性会大幅提高。“像知识工程、语义分析这些认知智能层面的技术将再次兴起。”
在众多认知智能技术中,自然语言处理被认为是人工智能皇冠上的明珠,而知识图谱则被认为人工智能的基石,那么对于这两项重要的认知智能技术,未来又会有哪些具体挑战?
//
如何让自然语言处理绽放光芒?
//
物理世界与数字世界之间的交互与交流,自然语言处理技术是必不可少。
笔者认为自然语言处理一定会在未来得到更多发展和应用。某种程度而言,自然语言处理正在重新定义人与机器,物理世界与数字世界之间的交互方式,过去依靠屏幕、键盘的交互方式,会越来越多被语音、动作所取代,这时就需要自然语言处理来理解、判断和推理。
事实上,自然语言处理技术已经在不同行业的多项业务中得到了初步的使用,比如智能客服、智能翻译、智能机器人等。但是,从目前来看,大部分的应用的效果其实没有符合大众的期望值。业界也普遍认为,自然语言处理依然存在着很大的挑战。
百分点首席算法科学家苏海波博士认为,自然语言处理技术的突破的确是目前业界的巨大挑战。在他看来,挑战主要包括:带标识数据严重不足、文本迁移、文本推理、多模态融合的文本理解等等。“现阶段,没有通用的自然语言处理技术。自然语言处理四个层面主要为:形式、语义、推理和语用,现阶段自然语言处理在从语义到推理的阶段发展。”
苏海波博士介绍:“在语料足够丰富的场景下,比如智能问答、智能客服等, 学习借助足够的场景标注语料,自然语言处理是可以达到不错的效果。但是百分点在大量实际客户场景中发现,用户面临最实际的问题就是如何在标注样本比较少的情况下,也能运用好 学习技术,实现更佳的效果。”
根据苏海波介绍,业界目前的趋势是融合,希望利用融合来实现自然语言处理技术的突破,比如Google提出的BERT预训练语言模型,先去预先训练和学习很多知识,然后融入到语言模型中,再结合用户的具体场景,达到预想效果。“这种方式虽然标注样本较少,但是同样可以达到非常好的效果。”
百分点首席算法科学家苏海波博士
苏海波博士介绍,百分点目前也积极在一些客户的场景中采用这种思路去提升NLP效果,并且取得了非常不错的效果。“预训练语言模型类似迁移学习的思想,把之前的学习迁移到不同的场景中,这将在本质上突破NLP。”
“自然语言处理的突破指日可待,未来它的黄金时代即将到来。”苏海波博士表示。
//
知识图谱:认知智能的基石
//
如果说人工智能面临两大难题,一是人机交互,那另外一个就是行业知识、专家资源的匮乏。
这也是知识图谱的价值所在。所谓知识图谱,就是通过知识的关联性形成一个网状的知识结构,形成知识图谱的过程本质是在建立认知,理解世界、应用或业务。机器通过知识图谱可以更智能地从客观世界中获得知识,从而更加智能。
尤其是人工智能技术越往行业中下沉,越会面临着专业数据、知识匮乏的难题,缺乏相关训练的数据来源。刘译璟博士直言,传统机器学习都是归纳的方法。如果在一个新的领域,缺乏足够的数据将会面临冷启动的问题,这时候就必须需要人的经验和知识,将对业务的理解和认知告诉机器,这种对话就是知识图谱,当机器形成一定规模之后,就可以实现知识的共享。
“没有人工,就没有智能。”目前,通用性知识图谱已经逐渐构建成熟,而行业知识图谱则刚刚兴起。如何构建一套适合这个行业比较有使用价值的知识图谱,则必须借助业务专家。刘译璟表示:“在一个具体行业中,不可能像通用知识图谱那样去实现,必须借助业务专家,有了本体之后去对接数据和应用。”
去年,百分点提出了动态知识图谱的概念。刘译璟强调,动态知识图谱核心价值在于动态,即人对于业务的理解不是一层不变的,这种理解随时随刻都可能发生改变,动态知识图谱就是可以快速反应出人的这种认知变化。
//
下一个十年:从这场发布会开始!
//
作为国内企业级大数据+人工智能技术与应用服务商,百分点一直走在人工智能应用的最前沿,多年以来专注于大数据操作系统、智能认知产品以及智能决策应用场景的落地,并致力于大数据、人工智能技术在行业中的落地与应用,在大数据、认知智能技术积累了丰富的实践经验。
11月29日,百分点将发布基于大数据+认知智能技术的最新产品、成立认知智能实验室。此次新品的发布,这将会是百分点在大数据+人工智能领域的又一次沉淀。
对于认知智能,一直走在实践最前沿的百分点会给我们带来什么惊喜,敬请期待!
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。