像FIFA一样踢球的AI,比打游戏更强吗?

原标题:像FIFA一样踢球的AI,比打游戏更强吗?

还记得被阿尔法狗支配的恐惧吗?最新的“AI恐怖故事”,是谷歌教AI踢足球,打造“AI版贝克汉姆”。

其实,这个足球人工智慧研究专案Google Research Football,早在今年6月就出现在了谷歌报告上,而更早一些时间,就在Github上以开源的形式发布了足球环境游戏的测试版代码。

以谷歌“AI界顶流”的咖位,加上当今的资讯效率,现在才突然一波走红,反射弧委实有点过长了。难道是媒体们集体不蹭热点,改成冷饭热炒了?

答案或许处在“下一代AI”这个充满遐想的泛滥标题里,用一个上古时期的互联网话术来说,就是听起来很性感。

此前在《星际争霸》《DOTA2》里超越人类电竞队伍的AI,都没能获此殊荣,踢个足球就引领未来,AI和AI的差别咋就这么大呢?

这一代AI的上升空间还有多大?

大众已经越来越明白,AI不能变魔术了。然而将时间倒回到2016年,相信绝大部分人都不会否认,担心工作被AI替代,被机器人网红索菲亚吓得瑟瑟发抖,觉得《终结者》《黑客帝国》《西部世界》早晚要来,都是切身体会过的心路历程。

传统的“AI恐怖故事”宣告破产,一方面得益于各路技术大牛日积月累地科(怼)普(人),同时也跟建立在 学习基础上的技术上限有关。

比如建立在庞大的数据运算基础上,训练AI玩电子游戏往往就需要花费数十万美元;比如黑箱性,没有一个 学习结构(卷积、RNN、LSTM、GAN 等)可以解释自己的决策,暗搓搓地搞歧视、骂人、发明新语种之类的事情层出不穷;再比如只会做“填空题”,面对需要引用常识、共识、推理等问题的时候就会表现的像个智障,容易被糊弄,比如将打印的人脸识别成真的,要么就是智商不及预期,医疗诊断、机器人、自动驾驶等始终进展缓慢……一贯反骨的马斯克,前不久就推出了基于计算机视觉感知的无人驾驶新方案。

总体来说, 学习真正能成功做到的,还是在给定大量人为标注数据的情况下,实现两个空间事物之间的映射。距离人们预想中的AGI强人工智能真是“事倍功半”,极其遥远。

所以,著名的“唱衰AI”专家 Filip Piekniewski声称将“AI寒冬”的锅甩给了 学习,虽然有些耸人听闻,也未尝不是指出了一个切实而严峻的问题——如果以 学习为基础的AI应用不再继续提升,那么相关产业走到“穷途末路”(尤其是那些to VC项目),也是早晚的事~

DL不是终极算法,不妨继续沉迷游戏

既然都这样了,那还怎么做AI?理论上有两个角度:一是 学习的自我进化,在原有的基础上引入新技术弥补一些先天不足;另一个则是寻找“备胎”,扶持AI领域的其他流派上位。

目前看来,科技企业也确实都极其渴盼变量出现,不过他们更青睐于做温和的“改良派”,毕竟“彻底推翻腐朽政权”还需要一个漫长的培养接班人的过程。

以谷歌Football Engine为例,就让智能体借助奖励机制来自己get动态策略,从而学会规则与踢球技能(强化学习)。

不过,要称之为“下一代AI”未免有点拔苗助长。

首先,“可玩性足球”(Gameplay Football)并没有完全摆脱 学习的窠臼。系统根据对手的实力不同,提出了简单、终极、困难这三个版本的基准问题,其中简单级别的比赛应用单一机器算法,而困难级别则是由分布式 学习算法来处理的。

而且,系统所采用的训练方式(即强化学习),与OpenAI Five在游戏Dota 2中击败了世界级电子竞技队OG,deepmind在《魔兽争霸》人机对战中获胜时所采用的训练方式,并没有本质上的区别,都是让智能体在复杂的即时战略游戏中学会与环境交互,并解决复杂的任务。

同时,作为机器学习的一个分支,强化学习之于AGI依然遥远。 学习三巨头的Yann LeCun 和Hinton都认为,当前用来实现“人工智能效果”的技术,对实现(真正的)人工智能是行不通的。就像怎么优化马车的核心技术,也无法造出汽车一样。

更何况,类似的弥补 学习不足的机器学习方法还有很多。

比如小样本学习、无监督学习就摆脱了对大规模数据集和人类专家监督的需求,提升自主训练效率;元学习解决了 学习训练出的智能体技能单一、缺乏常识的问题。 学习大神Hinton在2015年还提出了一个黑科技——知识蒸馏(Knowledge Distillation),通过迁移知识,借助训练好的大模型得到更加适合推理的小模型,从而提升 学习在大规模计算集群上的训练表现。

总而言之,所谓的“下一代AI”,核心还是弥补 学习在理解能力、多模态仿生、应用性价比等方面的不足。作为过渡型方案,这种“ 学习+”估计还会持续很长时间。不过距离真正实现AGI的预期,依然相去甚远。

追寻下一代AI,或许要走向更宽广的技术海域

今日我们看到的大多数AI产品思路,都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起来的。也就是将 学习与其他算法相结合,让“AI”走向千行万业。

不过也有不少科学家是彻底的“革命派”,想了不少帮助AI的新办法,其中或许也隐藏着破局的可行性。

比如Hinton就试图通过胶囊网络Capsule Networks来颠覆传统的 学习算法,用神经元向量代替传统神经网络的单个神经元节点,让不同的神经元携带不同属性的信息传导到下一层运算,已经证明可以像人类的视觉系统一样,自动将学到的知识推广到不同的新场景中,这被认为是未来让AI被赋予常识推理的关键技术。

还有的专家坚持基于逻辑规则的符号系统能够实现AI推理,一些学者和创业公司就正在用Prolog(一种基于符号学的编程语言)开发新工具。理论上可以通过非常少的数据来进行训练,自己处理事实和概念,然后自动生成事实推论。

但总体而言,其他分支的AI流派想要撼动“ 学习2.0”的主流地位,仍然比较困难。除了产业端正在大举投入对 学习及衍生技术的应用之外,美国国防高级研究计划局DARPA甚至筹备了一个名为“机器常识(Machine Common Sense)”的计划,旨在推进和分享模拟人类常识性推理的技术创意,总投资预计约为6000万美元。

作为标杆的 学习及延伸技术,其商业化潜力,即使“靠山吃山”,也有数年的好光景可以期待。但必须承认,面对其自身的瓶颈,大众的肾上腺素与技术期待也开始回归正常值,甚至有点审美疲劳。技术专家们再不搞个 ,热爱“AI鬼故事”的科技编辑们都要被逼秃头了……

值得探索的下一代产业AI方向会在哪里,恐怕与我们的现有认知都相去甚远。毕竟世界上每一次巨大的变革,总是开始于某一些被忽视的技术角落。除了继续挑战技术的穹顶,谷歌们似乎别无选择。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-08-24
像FIFA一样踢球的AI,比打游戏更强吗?
学习大神Hinton在2015年还提出了一个黑科技——知识蒸馏(Knowledge Distillation),通过迁移知识,借助训练好的大模型得到更加适合推理的小模型,从而提升 学习在大规模计

长按扫码 阅读全文

Baidu
map