作弊玩游戏,AI 也学坏了?

AI 的游戏方式大大出乎研究人员的意料。

▲ 在《恶魔城:月下》里研究各种各样的出城 Bug 一直是我乐此不疲的一件事

但是现在,关于 「利用 Bug 快速完成游戏目标」 这件事情上,AI 似乎比我还要擅长。

今年四月,曾经开发出击败 Dota2 职业选手的 OpenAI 公司,举办了首届针对 AI 的强化学习竞赛。这个比赛的目标,旨在评估强化学习算法从以往经验中泛化的能力。这听起来很拗口,具体地说,就是让 AI 来玩单机游戏,而且玩的是 NES 平台上的《刺猬索尼克》。

另一个研究人员试图让 AI 玩一款经典的像素游戏《Q 伯特》,同样,AI 在游戏里找到了一个无限刷分的严重 Bug 并在时间结束之前达到了最高分。不仅如此,当它发现敌人会跟着 Q 伯特一起掉下悬崖后,AI 甚至采取了自杀的方式来获得更高的分数。

就连《俄罗斯方块》这样的游戏,AI 也能找到自己的另类玩法。由于每增加一个掉落的方块都会使 AI 的评分略微升高,所以它采取了完全错误的游戏方式——尽可能快的落下每一个方块并在快要 Game Over 时暂停游戏以确保自己不会输。

好像听上去还蛮智能的……

2 年前,AlphaGo 带给人类关于围棋的新理解,也许再过不久,AI 也能用全新的战术体系来颠覆人类在星际争霸上的统治。

当然就算失败了,当一个专门找 Bug 的游戏测试员也是个不错的选择嘛。

本文来自微信公众号游戏研究社(ID:yysaag),作者为 嘤肉卫星,爱范儿经授权发布,文章为作者观点,不代表爱范儿立场。