搜狗王小川:搜索的下一步如何走?

2016年1月17日,搜狗CEO王小川参加了由极客公园举办的GIF2016大会,并发表了题为《技术人总要做点有胆有趣的事》的主题演讲。王小川从无人驾驶出发,讲到了人类对于人工智能(AI)的向往,总结了目前人工智能取得的突破及遇到的瓶颈,并揭示了搜索下一步的发展方向——社交搜索。

AI的发展——有突破也有瓶颈

在王小川看来,目前中国的互联网已经实现了基础的连接。但是互联网并不能激起技术人内心的波澜,从技术本源出发,才能找到最令人兴奋的事情。一方面,技术的体外进化使得对人自身的改造不仅局限于DNA;另一方面,智慧的体外进化使得人和技术的关系得到重新审视,产品会变得更加聪明和个性——人工智能将成为未来人类科学技术发展的重要方向。

王小川坦言,目前的人工智能技术虽然获得了前所未有的发展,包括跨场景抽象,直觉概念理解,创造性抽象思维,虚构画面,以及敏捷和灵巧精细动作技能等突破,但学习能力还不及3岁儿童。而人工智能面对的主要瓶颈则来自于机器与人本身巨大的区别:人的DNA中天然有一些下意识的反应和学习能力,机器没有;人可以分离多层背景,但机器需要复杂运算,且错误率高;人是有目的的,而机器没有。

王小川从Google“找猫”的案例出发,阐释了搜索引擎与人脑在辨认事物中的差异。一个儿童只需要看到一张照片认识猫,即可在今后的图片以及实物中对猫进行辨认,而谷歌的神经网络,需要在图库里面找200万张图片,用16000个节点让机器做计算,每张标记上这张图片里面有猫或者没有猫,训练之后这个系统才能达到75%的准确性。

搜索的下一步——连接人脑做社交搜索

王小川表示一直在对机器与人的结合而思考,如何让机器的努力和人的努力结合在一起,让机器作为辅助,以人为核心,搜狗搜索也是希望把人脑里的智慧搜索出来。

“今天搜索不是简单的抓取网页和信息,搜索原来的做法是输入一个关键词给你无数的链接,以后一方面是给你提供答案,另一方面是给你提供服务。”——王小川预言。

基于此,王小川也揭示了搜索下一步的方向——社交搜索,他以搜狗战略投资知乎、与腾讯合作作为案例,表示搜狗下一步将依托微信、知乎的独家资源,延续差异化搜索策略。

他表示,搜狗搜索的思路是做更多连接,通过建设社群关系,把大脑里的智慧表达出来。“我们去跟踪这个文章是谁写的,这个人的背景是怎么样的,他是大V,还是行业专家。这是我们对人工智能探讨之后,认为在接下来的5年里面需要发力的核心点,不在于人工智能本身,而是在于让机器找到人。”

以下为演讲实录

每次我来极客公园分享的内容,后来都会成为行业热点。我记得以前分享的一个内容是号码通靠众包方式能够过滤短信垃圾电话,而今天所有的手机里面都开始内置这样的功能;也分享过儿童智能手表,在2016年我们看到儿童智能手表变成一个新的风口所在;也讲过关于人工智能的话题。其实我们主业是搜索,我们这几年在想怎么把搜索做得更好。

作为一个技术人,我们应该怎样面对技术?面对互联网的创业?今天我给大家分享的东西,代表我内心中最柔软的这部分。前几天参加完CES大会,回来坐飞机时候我做了一个梦——我梦到我坐在无人驾驶的汽车里,从建国门坐这辆无人驾驶车回到五道口。

梦里我最大的感受是一种惊喜、一种期待,我很好奇这辆车是否能完成它的使命,我知道北京的交通状况很有可能有事故,很有可能迷路,或者遇到红绿灯不知道怎么办,但是我要体验无人驾驶,享受无人驾驶的过程。当我醒过来的时候我发现其实我还在飞机上。但是我最大的感知是,面对一个司机和面对一个无人驾驶车,我对无人驾驶车充满了热爱,这种内心的情感应该跟在座大多数人一样是极客的情感,内心热切期待技术本身给我们创造更好的生活。

为什么喜欢写程序?从小学就开始接触写代码,写了很多年,因为我在想写代码有点类似创造一个生命,当它运行的时候这个程序就好像把你的思想注入进去,让程序自己去做判断、做选择,就像人一样。所以极客都有AI的情结,向往让机器陪伴我们,让生活更好,这是我坐飞机时对自己一个新的感悟,我把这个体验先分享给大家。

在这种感悟里面我们来看看未来的趋势是什么,之前我们讲了很多年互联网,技术背后我前几年提了“从连接到智慧”,因为这几年我们看到从PC机到手机,今天的连接已经基本完成了。IOT在连接万物,也进行到了一个新的高度。但是互联网并不激发起我内心的惊喜。有两个我认为是从技术本源最能够让自己兴奋的事情。

最近半年提到“技术的体外进化”,当我们拥有技术能力的时候,人对自己的改造不局限于对DNA的改进,我们希望通过技术使这种进化走到体外去。以前的人冷了会加衣服,或者长出脂肪来,今天我们懂得开空调,我们有汽车,有很多科技产品为我们服务。我认为有两个大的趋势,我们今天提到的AR或者VR,听觉和视觉的体外进化,眼睛和耳朵开始得到新的延伸。人跟机器走到一块之后,我们不要说使用设备,是我们自己的能力得到巨大的拓展,这是一个进化的原动力。

第二个进化是智慧的体外进化,我们开始接触一个现实是虚拟的IO能够影响我们,之前大家并不认同“人的智力被机器所驱动”这个概念,因为人很聪明,机器做不到这样的事情,但是最近两年 学习的发展带来了颠覆性的效果。所以在人和技术的关系上,我提到视觉和听觉的体外进化和智慧的体外进化是两件让我兴奋的事情,由于有了AI之后产品会变得更加聪明和个性,一种观点认为机器很可怕,但我个人观点是认为未来世界我们更享受与机器融为一体的方式,也许离开了机器我们的生活非常不自在,但跟机器在一块的时候未来是美好的。

今天搜索不是简单的抓取网页和信息,搜索原来的做法是输入一个关键词给你无数的链接,以后AR时代到来之后搜索会变形,一方面是给你提供答案,另一方面是给你提供服务。今天上午提到了Ticwatch的个人助理,跟搜索未来的路径是一样的,它会变成你的个人助理,像你的老师一样给你答案,也给你这个服务。这里面对机器的要求很高,对人工智能要求会像人一样思考,甚至比我们想的更多。最近几年人工智能已经在 学习方法下有很多演化,做了很多突破,包括语音、图像、文字识别等很多工作。所以是不是机器已经开始能够取代人?我自己看到很多技术前沿的进展,同时我们公司做了很多人工智能工作之后,我相对处于谨慎的状态,AI在今天有很多瓶颈。

给大家讲个有趣的故事,就是人脑跟Google神经网络的关系,“找猫”的实验是在前几年时候,Google做人脸识别或者动物识别的时候做的,做法是要求工程师或者研究人员对图像做特征提取,就是靠人指引这个机器:什么地方是眼睛、什么地方是耳朵、或者眼睛、耳朵多大、有没有胡子,通过人对机器指引,使得机器具有这个识别能力。Google后来做了实验,当时它的做法是在图库里面找200万张图片,用16000个节点让机器做计算,每张标记上这张图片里面有猫,这张图片里面没有猫,训练之后这个系统达到75%的准确性,也就是说没有经过人工的对具体特征的干预,使得机器开始基于原始大数据产生了简单的智能,能够做到基础的判断。今天的语音、图像等等通常是在这样的指引下做识别的。

有一个故事很震撼,我在香港时候有个同学,他们家小孩大概1岁,可以说简单的词汇,“爸爸”“妈妈”,但是“猫猫”“狗狗”还不会说,这个小孩具有很好的学习能力,为什么这么说?在公园时候看到一个猫形状的气球,然后他爸爸跟他说“这个是猫”,通过一个气球这个小孩就学会了认识猫。这个小孩在之后看到的画册里面、实物里面就都知道这是猫了,一张图片就做到了。所以从这个要点上来讲,发现我们今天讲的人工智能,跟一个1岁孩子的智力水平还是有巨大的差距。

2015年有篇论文讲怎么用一张图片理解字体,我们用的方法是通过大量的数据去标记,而从一张图片就可以搞定了。后来我们让这个小孩来识别狗,所以我给他看了一张哈士奇狗的图片,后来我就给他报纸、给他其他动物,发现这个小孩能够通过一张图片认识什么是狗,这是今天机器远远到不了的。所以不管今天机器的速度多快,机器和人的智力水平还有巨大的差距。所以所谓的“机器有3岁的儿童智力”目前还远远达不到,我认为对技术本身的认知还不够。今天我花很多时间给大家讲,人在识别猫的时候一张图片就能搞定,但是Google用200万张图片才做到75%的准确性。

2015年在人工智能里面有很多新的突破,我列了几个重点方向,包括跨场景的,在特定领域训练的结果能够在另一个领域里面使用这个事情。大家希望人工智能在比如造梦、让机器构想梦想时候的突破。但人工智能像人一样思考还有瓶颈,第一个事情,人的DNA里面写入很多人工智能,所以我们生下来就知道去找母乳,或者是天然懂得害怕一些事情,但机器里面完全没有这样的能力。第二个事情,人能够建立概念,在概念基础上我们能够做推理,机器在这里面做得是非常不够的,我们更多是靠数据驱动,是功能性的和机械性的去做。Google在2015年的时候希望95%的搜索里面能给到答案,背后充分使用的是像类似知识图谱这样的方式,知识图谱它是个三元组,比如一个人或者一个物体跟另一个物体是什么样的关系,是父子关系还是包含关系,是靠人在里面做标记建立这个概念。今天让机器自动化建立概念还没有突破,所以机器今天只能做一些简单的重复性的事情,而不能从复杂的环境里面学习到一个事物跟另一个事物之间的关系。无论哪个搜索引擎,做图像搜索的时候,因为它没有概念,我们需要用手圈一下,告诉它识别这个部分的图像。而不像人一样,人站在这个讲台上时候,非常容易能够把人和背景抽离开。我看到别人是怎么找出租车的,我一招手就能够学会。所以人有概念之后一次性能够建立推理能力,今天机器还不具有这个能力。

最后一个要点,人本身有目的性,我们知道我们的生存意义是什么,每个人的目的有不同,而机器这方面是定义的。我们在之前VC投资里面不断提到让算法起作用,我们做了很多的努力,但是我们还在想怎么让机器人的努力和人的努力结合在一起,让机器作为辅助,以人为核心,包括我们自己做搜索引擎也是希望把人脑里面的搜索出来。所以我们的思路是做更多连接,把大脑里的智慧表达出来,我们去跟踪这个文章是谁写的,这个人的背景是怎么样的,他是个大V,是个行业专家。因此,引导我们做搜索时候,这里的case是去年简单的成果,是我们投资知乎、跟腾讯的合作,建立社群关系,今年的产品我们会跟其他搜索引擎产品差异化,把人引进去。这是我们对人工智能探讨之后,认为在接下来的5年里面需要发力的核心点,不在于人工智能本身,而是在于让机器找到人。这是我给大家分享的第二点,从找猫图片里得到的启示。

最后,介绍两位我心中的男神。一位叫StephenWolfram,是个英国犹太人,15岁时候开始上大学,19岁博士毕业,写了一本著作叫《新科学》,我从三个完全不同的环境里面接触到这个人。他创造了叫做wolframalpha的搜索引擎,是具有推理能力的引擎。另外,他以生命为基础理解宇宙的领域非常深入,他是横跨技术、工程,从理论上去突破的人。

第二位叫蒋勋,是我心中另一尊大神,台湾国宝级的人,他本身对美术、历史有非常多研究,我非常期待有机会能够见面,以前读过他的很多书,但一直不敢见,因为我觉得在他面前都会发抖,他的知识非常渊博。后来我怎么见到他?2015年时候我用了一年时间听完了蒋勋讲《红楼梦》的音频,共160集,一年我听完了,而这个老兄一共讲了4年,他不是在大学里面讲了4年,他是在集市里面给当地没有工作的老头、老奶奶们每周讲一次,是免费的讲,是佛一般的人。

我跟他沟通一些我的感受,我们面对一些人,看到在当今公司也好,在当今社会里面也好,有一些我们不耻的现象,我们看到了更多谎言的东西,所以向往自由的个性的社会形态,该怎么相处?

我跟他聊这样一个话题,他说得很简单,他说历史当中就像季节有春夏秋冬,有冬天,有夏天,一个朝代也是一样的。这句话讲完后我顿时悟到了,如果别人跟我讲同样的话我可能听不进去,但是他跟我讲完后我开始产生了放下的情怀,我知道面对这些看不上的邪恶的谎言的东西,能够接受这个现实,就把自己的定位找到了,让我不一块去随波逐流,而是更好地做自己的技术和产品。

2015年我对自己的提升是做更纯粹技术产品的人,到底是什么样的变化?就是接纳“负数”。我的人生系统当中有正数的东西,但是2015年我敢于面对负面的现象和人的欲望,使我自己做更纯粹的人,面对负数时候我的系统更加完整,让我做技术和产品,这作为我今天的结尾,谢谢大家。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

Baidu
map