您的位置: 人工智能 >文章正文

10:1!DeepMind人工智能在《星际争霸2》人机对战中完胜职业玩家

【TechWeb】1月25日消息,据国外媒体报道,在人机围棋大战中打败柯洁、李世石等一众围棋高手之后,谷歌旗下人工智能公司DeepMind又将人机大战转向了电脑游戏,而在《星际争霸2》的人机大战中,谷歌DeepMind的人工智能程序以10:1的成绩完胜人类职业选手。

谷歌DeepMind研发的用于人机对战的人工智能程序名为AlphaStar,其挑战的是两位《星际争霸2》的职业玩家“TLO”和“MaNa”,比赛在去年的12月进行,《星际争霸2》的开发商暴雪和谷歌DeepMind已公布了当时比赛的视频。

在AlphaStar 与“TLO”和“MaNa”去年的对战中,使用的是略微过时的《星际争霸2》版本,这一版本在设计上便于人工智能程序进行相关的研究。

“TLO”和“MaNa”与AlphaStar各进行了五局比赛,但“TLO”和“MaNa”在比赛中并未占据优势,最后的结果都是AlphaStar全胜,对决结果定格在了尴尬的10:0。

在所公布的比赛视频中,谷歌DeepMind推出了一个新版本的AlphaStar,与“MaNa”进行比赛,新推出的AlphaStar对视野进行了限制,“MaNa”也得以发现的AlphaStar的部分不足并最终也战胜了它,用一局胜利为人类职业玩家挽回了一丝颜面,AlphaStar也在与职业玩家的对战中首尝败绩。

在与AlphaStar进行对战的视频中,“TLO”曾表示他有信心战胜AlphaStar,但不曾想后者在五局中全部获胜,而且每次都采用了完全不同的策略。

“TLO”之后的“MaNa”,在比赛中也拼尽全力,但并未摆脱与“TLO”相同的命运,他在与AlphaStar的五局比赛中也均已失败告终。

外媒在报道中表示,人工智能程序在电脑游戏方面存在较多的优势,包括“TLO”和“MaNa”在内的职业玩家,玩电脑游戏时每分钟的鼠标点击量方面存在理论上的限制,而人工智能程序则没有这方面的限制。

其次,外媒在报道中表示,人工智能程序的反应时间约为350毫秒,AlphaStar在反应速度方面比大多数的职业玩家要慢一些,但在通过大量的训练之后,人工智能程序变得更聪明,更有效率的决定弥补了反应时间方面的不足,这也是人工智能程序在游戏中的一大优势。

其三,虽然古语有“眼观六路耳听八方”,历史上也不乏视野开阔的高手的传说,但在游戏中,这一点对职业玩家并不太适用,反而更适用于人工智能程序,相关的技术使其对游戏全部区域有更好的掌控,人类玩家则需要花费时间关注不同的区域。

AlphaStar对游戏全部区域有更好的掌控能力这一点,在其与“MaNa”的最后一局中也得到了印证,在那一局中,谷歌DeepMind对新推出的AlphaStar进行了视角方面的限制,在对所进行游戏的全部区域的注意力方面就不再有明显的优势,“MaNa”也就有时间发现AlphaStar的缺点并最终战胜它。

AlphaStar在《星际争霸2》方面的技能,来自于开发商DeepMind对其进行的深度训练,DeepMind回放了大量人类玩家游戏时的视频,也是基于相关的数据训练神经网络,在持续一周的时间里,AlphaStar玩了相当于200年的《星际争霸2》。

AlphaStar目前在游戏方面的水平及超快的学习能力,对《星际争霸》方面的职业玩家来说并不是个好消息,但也不全是坏消息,职业玩家也能从中学到部分有用的策略,毕竟AlphaStar通过训练所积累的游戏经验远高于职业玩家。

(免责声明:本网站内容主要来自原创、合作媒体供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

相关阅读

网站简介 - 网站声明 - 合作伙伴 - 联系我们

中文科技视界网    www.ctechw.com

Copyright © 2016-2020 中文科技视界网

网站备案号:鄂ICP备18014829号-1