程序员

注册

 

发新话题 回复该主题

吃豆人游戏诞生40周年,英伟达用AI [复制链接]

1#

记者

彭新1

“吃豆人”(PAC-MAN)角色近年来依然不时活跃在电影银幕和游戏主机上,不时触发人们的怀旧感:这个“缺了一角的黄色披萨饼”在迷宫中吃豆子、躲避鬼魂的设计成为游戏史上不灭的经典。如今,它已经40岁了。

热衷于用AI讲故事的英伟达也不愿意错过这个热点,在刚刚的技术发表中,英伟达宣布使用5万局游戏训练出的人工智能模型重建了这个40年前的经典游戏——不用写代码、不用构建游戏引擎渲染图像,仅仅通过神经网络“看”原版《吃豆人》的运行状况,自行理解游戏规则,最终完成了游戏制作。

复刻《吃豆人》的程序被称为GameGAN,这是一个利用生成对抗网络(GenerativeAdversarialNetwork,GAN)模仿计算机游戏引擎的神经网络模型,它由一个生成器和一个鉴别器组成,生成器尝试输入数据,而鉴别器将其与原版游戏数据源进行比较。如果它们不匹配,则生成的数据将被拒绝,之后生成器将调整其工作并重新提交新数据。这两个神经网络会相互竞争,并学习建立出全新内容。

同时,GameGAN通过动态引擎、渲染引擎和存储模块三个部分生成游戏实际运行画面,其中动态引擎用于根据玩家行为变化更新当前的状态,存储模块则来记住游戏地图,使游戏画面更加一致化和稳定。最后,渲染引擎根据动态引擎的状态,对输出图像的进行解码和输出。

用AI制作的《吃豆人》图像有点糊,但游戏已经包含原版游戏的所有的规则。英伟达模拟技术副总裁RevLebaredian在媒体发布会中告诉现场记者:“它通过观看就能了解所有东西。这种方法类似于人类程序员在YouTube上看《吃豆人》视频,就能推断出游戏规则并重新构建它们。”

为了制作这个复刻版的《吃豆人》,英伟达共计准备了5万局游戏视频,这些视频共有上百万帧玩家操作吃豆人的游戏画面,而GameGAN就观看这些影片,从中学习游戏规则,比如蓝色墙不可穿越、吃豆获得分数、吃豆人吃到大豆子时,幽灵会变色逃开等。

用AI来复刻《吃豆人》的工作是英伟达在8个月前开始准备的。实际上,类似《吃豆人》这样采用固定、有规律的玩法,同时可在短时间内结束、操作过程包含大量决策判断的游戏,非常适合用于人工智能系统训练需求。

最终,通过和万代南梦宫(《吃豆人》的游戏开发商)的合作,使用英伟达的TeslaV的GPU计算系统训练后的GameGAN,仅花四天的时间即从无到有完成了游戏制作。

通过GPU系统训练GameGAN,观看5万局游戏后,仅四天时间就产生了重制版的《吃豆人》。英伟达称,《吃豆人》的复刻工作指明了未来人工智能在游戏设计上的方向,开发人员可以将游戏规则输入到AI中,并使用AI来创建游戏的变体版本或设计新关卡。英伟达多伦多研究实验室主任SanjaFidler对记者说:“使用人工智能将不同的游戏玩法融合在一起,给游戏开发人员提供了更多的选择。”

不过,这次AI复刻的《吃豆人》并非完美,研究团队表示,目前还无法在复刻版游戏中完全还原原版《吃豆人》的音乐音效。

有趣的是,英伟达的研究还找到了用AI还原《吃豆人》的一个小“BUG”:由于短时间生成大量游戏视频不大现实,因此团队使用计算机来玩《吃豆人》生成画面。但是,用于模拟玩游戏的AI在游戏中太出色了,这使GameGAN难以理解游戏中“死亡”的概念,所以最初产生的《吃豆人》,游戏中几乎都不会输。这显示了AI训练中,训练数据的重要性。

GameGAN可用于训练机器人理解现实规则。当然,GameGAN的作用不只是游戏用途而已。英伟达介绍,这种通过观察环境互动、理解规则、最终实现模仿还原的模式,在未来的机器人模拟用途中有相当大的作用。

在过去,开发人员通常使用仿真器来训练机器人的AI,由于仿真器必须编写大量互动规则,相当费时费力。“仿真器是训练机器人系统的核心,但开发仿真器非常耗时。”SanjaFidler解释,在仓库机器人、自动驾驶汽车、送货机器人等应用中,机器人需要学习现实世界的物理定律,因此开发者要写许多规则来打造仿真器,比如学习物体互动等。而GameGAN的出现意味着未来可能通过简单的神经网络训练,就可以取代复杂的编程工作。

英伟达计划今年下半年在自家的NVIDIAAIPlayground平台,向外开放这个完全由AI制作的《吃豆人》游戏。

分享 转发
TOP
发新话题 回复该主题