相比AlphaGo 冷扑大师发明人称有大挑战

冷扑大师发明人：相比AlphaGo 冷扑大师有大挑战

昨日，由新智元主办的AI World 2017在北京举行，会上，卡内基梅隆大学教授、冷扑大师发明人Tuomas Sandholm发表了演讲，阐述了冷扑大师的研发过程及未来应用。

Tuomas Sandholm称，冷扑大师是利用人工智能研发的策略选择（博弈理论）程序，冷扑大师的战略是结果导向的。

据Tuomas Sandholm表述，研发一款玩德州扑克的AI程序有两大挑战，也就是两大未知，一是德州扑克游戏中每位玩家拿什么牌要看机遇，“另一个未知是，我们不知道其他玩家的相关信息，但是对手也不知道我们的信息。”Tuomas Sandholm说到，当冷扑大师有了自己的牌之后，需要考虑对手的行为带来什么样的暗示，反之亦然。在这个时候冷扑大师会考虑均衡的实时运算。

Tuomas Sandholm过去的13年里一直致力于冷扑大师算法的研究，希望能够研发出一款打败人类的德扑AI程序。在今年年初，冷扑大师在匹兹堡的Rivers赌场，与世界上最好的4位不限注人类职业玩家进行了比赛，最终将4位人类职业玩家挑落马下，并夺走了共计176万美元筹码的奖金。

那么，冷扑大师到底是如何工作的呢？Tuomas Sandholm说，首先为冷扑大师输入游戏规则，但是与AlphaGo不同的是，冷扑大师不会去学习过去的德州扑克历史，因为德扑的游戏没有完整的信息。在输入游戏规则之后，采用抽象化算法，做成一个抽象化的游戏，采用了博弈理论，使用超级计算机和大量的GPU进行运算。另外，还要设立安全的子博弈，一旦发现错误，就要及时修正，这样让冷扑大师有了更大的安全性。但是，Tuomas Sandholm也承认，博弈理论无法将所有的情况都囊括其中，“包括小赌注、大赌注、All in，我们后续还会做补丁，不断完善冷扑大师。”Tuomas Sandholm。

对于冷扑大师未来的应用，Tuomas Sandholm说，对于学习探索，我们会持开放程度，未来冷扑大师也会在德扑之外更多的进行人机互动。冷扑大师未来可以用在很多战略推理方面，比如在金融方面，进行战略性资产组合；在企业战略中也有自己的玩法；还有在拍卖、虚拟安全、竞选、自动驾驶策略、军事、预防疾病感染、培训、娱乐等等方面，都有很大的应用前景。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

相比AlphaGo 冷扑大师发明人称有大挑战

下一篇