人脸识别技术再刷记录!AIG如何让百度AI基石越来越稳?

摘要:最近,百度凭借自主研发的人脸检测 学习算法PyramidBox,在世界最权威的人脸检测公开评测集WIDERFACE的“Easy”、“Medium”和“Hard”三项评测子集中均获得冠军,也打破了历史

最近,百度凭借自主研发的人脸检测 学习算法PyramidBox,在世界最权威的人脸检测公开评测集WIDER FACE的“Easy”、“Medium”和“Hard”三项评测子集中均获得冠军,也打破了历史记录。这个结果,不让人意外。在AI基础技术上,百度一直都在不断证明自己,已不是第一次拿奖。

百度AI技术已成“屠榜”高手

就拿人脸检测技术来说,百度早在2015年就通过DenseBox算法,刷新了FDDB和LFW两个公开数据集的记录,保持世界第一并保持了一年。人脸识别技术是机器视觉与生物识别的交叉技术,人脸检测是人脸识别的第一步——在图片或者视频中找到人脸并精确定位。如果是自拍照自然很容易,目前美图软件、智能手机都可以做到,不过很多照片或者视频中有大量的人像,而且可能有姿态、遮挡、光线、环境、模糊、失焦等不利因素,因此人脸检测并不容易,要机器达到人眼水平很难。

目前,在所有AI技术中,人脸识别应用最为广泛。自拍、解锁、实名制校验,甚至支付,都能用人脸识别来完成,治安、零售、教育、公益等行业也在大量应用人脸识别技术。百度在人脸检测上的不断打破记录,体现的是百度AI技术的实力,人脸技术只是百度AI技术的一部分(当然,也是很重要的一个技术),百度在自然语言处理、机器视觉、语音交互、知识图谱、机器翻译等AI技术上都有布局,且成绩斐然。

今年2月,美国《麻省理工科技评论》揭晓的2018年“全球十大突破性技术”(10 Breakthrough Technologies 2018)中,百度成为唯一入选的中国公司,被列为实时语音翻译领域的关键玩家,百度也是唯一一家连续三年入选该榜单的中国公司。

同样是在2月,百度自然语言处理(NLP)团队研发的V-Net模型以46.15的Rouge-L得分登上微软的MS MARCO(Microsoft MAchine Reading COmprehension)机器阅读理解测试排行榜首。机器阅读理解可以让机器更好地理解一段文字。比如百度可以通过这个技术来理解用户的搜索内容或者问题,从一个页面定位答案并经过总结、提炼、归纳后进行展示。这个赛事更大的意义在于,其运用的训练数据是微软在产品实践中收集来的问题和答案,直接从互联网文本与产品实践问题中训练出的模型,应用价值更强。

这些成绩,都证明了百度AI技术的实力。而所有这些技术都出自于百度AIG。去年3月,百度宣布整合包括NLP、KG、IDL、Speech、Big Data等在内的百度核心技术,组成百度AI技术平台体系(AIG),任命百度副总裁王海峰为AI技术平台体系(AIG)总负责人。现在看来,百度整合多个技术到一个体系,的确让人才的聚集,技术的管理,以及技术的进步更集中。

然而“屠榜”并不是AIG的目的

算法或者技术拿到奖项,打破记录,或者登陆榜单,是百度大力支持AI技术的结果,也是百度AI技术实力的证明,但它不是百度AIG存在的唯一目的。AIG不是一个只会研发底层技术来拿奖的实验室,而是支撑百度业务,特别是AI相关业务的技术平台。

王海峰曾阐述过他对技术的理解:

“AI的发展最终还是要回到‘服务用户需求’的本质,这是我们每一位人工智能的从业者都需要铭记在心的。利用好人工智能来服务好我们的用户和客户,以及更好地打磨AI能力来推动各行各业的效率提升,是每一位人工智能领域从业者的期望。”

具体来说,百度AIG在大力研发基础AI技术的同时,还强调AI技术的应用和开放。

首先,在应用层面重视技术的实用性。比如百度人脸技术,就被百度金融应用到与泰康保险、中国农业银行的合作项目用于人脸核身;乌镇、武夷山等旅游景区、北京首都机场、南方航空在广州白云机场的贵宾休息室,应用人脸识别来提升旅客游客的体验。自然语言处理技术的应用广泛性无需赘言,语音已是DuerOS的基础,百度已经与TCL、创维、海尔、海信等诸多家电巨头,以及华为、小米等手机巨头战略合作,知识图谱也成为百度搜索结果中的重要内容。

抓基础技术的同时,也在强化对应用技术的投入。今年1月,百度研究院在硅谷成立了两个新实验室,一个是商业智能,另一个是机器人与自动驾驶,不再是此前IDL这样的纯技术实验室,不再只做 学习、大数据这样的底层技术研发。从名字就可以看出,百度AIG对应用技术的重视。

百度去年在AI开发者大会上就已经提出要Bring AI to Life,让AI落地到生活场景中的口号,将AI技术落地到实际业务成为未来的大方向,也与AIG重视“技术驱动产品,产品牵引技术”的策略符合。

其次,在开放层面重视前沿技术的共享。百度AI技术很强大,但不独享,而是开放给行业。百度目前已经开放了包括语音、图像、自然语言处理、视频、增强现实、知识图谱、智能数据七个方向,共计90余项AI技术能力,成为国内最大的AI开放平台。百度还将其 学习框架PaddlePaddle全面开源,让开发者可以拥抱AI。3月23日,百度在北京举办了第一期AI加速器DEMO DAY,百度AI加速器旨在帮助创业者拥抱AI,是百度AI开放的一个举措。

可以看出,百度AIG的技术路线图是很清晰,也是很有前瞻性的。一方面,作为百度的基础技术,AI底层技术不能依赖任何第三方,要自力更生,因此百度AIG在基础技术上大力投入,不断在技术上突破、获奖也证明了这一策略的效果。另一方面,AIG将技术落地到业务中,让业务牵引技术发展,开放的核心目的也会要促进AI技术在各行各业的落地。当然,反过来,应用和开放也可以巩固百度AI技术的领先地位。

AIG如何一年内成为百度基座?

百度的基石是什么?相信很多人的答案都是:技术。而技术是由什么构成的?一行行抽象的代码后面是工程师等技术人的投入,正是因为此,负责百度核心技术的AIG可以说是百度的基座。当百度将多个分散在各个部门的技术部门,以及百度研究院整合到一起时,许多人都看不清百度为什么要这样做,现在看来好处已经很明显,让百度的AI技术沿着更实用的方向研发,加速AI技术落地。AIG在短时间内稳步成长,原因是多方面的。

综合各种信息来看,目前百度AIG的技术研究部门大致可以划分成百度研究院和应用技术部门,其中百度研究院的目标很单一,就是要做AI底层技术的研发——不过与谷歌X实验室等不同的是,它的探索性更低,实用性更高。应用技术部门,则负责技术的应用与落地。今年百度研究院又增加了两大实验室,目前已有五大实验室,实现了对AI基础和主要应用技术的全覆盖。

AIG不断庞大的背后是百度在研发上的坚决投入,李彦宏去年曾表示,百度每年在研发上投入上百亿 ,占总收入15%,这个占比位列行业第一。

在人才引进层面,李彦宏对于技术人才一直有“周公吐哺天下归心”的广纳良才的策略,除了给很好的待遇外,更重要的是很有吸引力的研发环境。百度AIG也在不断吸纳世界顶尖人才,比如百度研究院目前拥有六位世界级科学家。同时百度拥有广泛的AI应用场景,比如搜索、信息流、DuerOS、无人车,都是AI强相关业务。顶尖的技术团队和作为技术落地沃土的产品和业务,相互作用下形成了一个良性的的正向循环链条,让百度AI能够持续“进化”。

在产业环境层面,AI爆发已是不争事实,2018年AI正在落地到各行各业,但AI技术研发却需要持续进行,机器在大多数时候还是不如人类,技术进步空间很大。不过,在AI产业爆发后,行业对AI人才的急缺已经让更多技术人才开始重视学习AI,前不久南京大学甚至成立了AI学院,培养AI专业人才。在这样的环境下, 百度AIG基于本身的吸引力,要获取优秀人才会越来越容易。而此前百度在AI技术上多年已久的布局,也让它有了厚积薄发的能力。

不难看出,百度“先技术后场景”的思路正在改变,逐渐成为技术研发与场景应用双管齐下,保持技术优势的同时,推动AI技术商业化。而高速运转状态的AIG,正在给百度源源不断地提供前沿、实用和有竞争力的技术,同时帮助百度AI技术落地和开放。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-03-30
人脸识别技术再刷记录!AIG如何让百度AI基石越来越稳?
摘要:最近,百度凭借自主研发的人脸检测 学习算法PyramidBox,在世界最权威的人脸检测公开评测集WIDERFACE的“Easy”、“Medium”和“Hard”三项评测子集中均获得冠军,也打破

长按扫码 阅读全文

Baidu
map