AI版《超级马力欧兄弟》试玩：Claude 3.7操作惊艳，推理模型表现堪忧！

人阅读

2025-03-04 16:46:43

作者：极客AI
相关关键词

标题：AI版《超级马力欧兄弟》：Claude 3.7操作惊艳，推理模型表现堪忧！

随着人工智能（AI）技术的飞速发展，越来越多的领域开始探索其应用潜力。近日，加利福尼亚大学圣地亚哥分校的Hao人工智能实验室将AI引入经典游戏《超级马力欧兄弟》中，进行了一项独特的研究，以测试其性能表现。实验结果显示，Anthropic的Claude 3.7在参与测试的AI模型中表现最为出色，而Claude 3.5紧随其后。相比之下，谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o则表现不佳。

首先，我们需要明确一点，此次实验所使用的并非1985年最初发布的《超级马力欧兄弟》版本。实验室通过一个模拟器进行游戏运行，并通过一个名为GamingAgent的框架与AI进行连接，从而让AI能够控制马力欧。GamingAgent由实验室自主研发，它向AI提供基本指令，例如“如果附近有障碍物或敌人，向左移动或跳跃以躲避”。同时，它还提供游戏内的截图，为AI提供实时的反馈信息。随后，AI通过生成Python代码的形式来操控马力欧。

这个实验环境可谓是极具挑战性，它迫使每个AI模型“学习”如何规划复杂的操作并制定游戏策略。实验结果反映出，非推理模型在实时游戏中表现更佳。这主要是因为推理模型在决定行动时通常需要花费数秒时间，而在《超级马力欧兄弟》中，时机至关重要，一秒钟的差别可能意味着安全跳过和坠落死亡的不同结果。

数十年来，游戏一直是衡量AI性能的重要工具。然而，一些专家对将AI在游戏中的表现与技术进步直接挂钩的做法提出了质疑。与现实世界相比，游戏往往是抽象且相对简单的，因此AI在游戏中的表现并不能完全代表其在现实世界中的应用能力。

尽管如此，我们仍可以从AI版《超级马力欧兄弟》中获得许多乐趣和启示。观看AI玩马力欧本身就是一种有趣的体验，尤其是当Claude 3.7等表现优异的模型操控马力欧时，其操作更是让人惊艳。相比之下，推理模型在游戏中的表现就显得有些堪忧。这并非是因为它们能力不足，而是因为游戏环境的特殊性质所致。

此外，这项研究还为我们提供了对未来AI发展的思考。随着更多像Claude 3.7这样的模型被研发出来，我们是否可以期待更多的创新和突破？毫无疑问，AI在游戏领域的应用前景是广阔的。无论是从娱乐的角度，还是从技术的角度，我们都期待着更多的探索和创新。

总的来说，AI版《超级马力欧兄弟》的试玩活动为我们提供了一个有趣的视角，让我们看到了AI技术在游戏中的应用潜力。尽管存在一些质疑和挑战，但不可否认的是，AI正在逐渐改变我们的生活，为我们带来更多的可能性和机遇。让我们期待着未来的发展，期待着更多令人惊奇的AI应用出现。

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）