dota imba ai地图下载(dota1)
OpenAI Five完全通过自我战斗学习打Dota2,每天的战斗量据说相当于人类180年。而惊人的硬件消耗也应该是创纪录的:256个GPU,12.8万个CPU………
所以人类又彻底堕落了?显然,Dota2战队打AI打败人类一点都不简单。
这是一波AI争夺高地的浪潮。当时人类队伍的装备和水平更高。而且,五个人类玩家都聚在一起,准备强行拆塔。
双方一接触,AI只有一个23级英雄可以打,人类战队24级巫妖先发制人,用“阿托斯之杖”把AI这边的23级巫妖固定到位。
随后,艾巫妖释放了“EUL圣杖”给他自己。这个技能可以让自己卷入龙卷风,暂时无敌。通过这一招,AI的意图是拖住人类队伍,给队友时间。
之后,AI冰女率先用“闪光匕首”对付被人类队伍拖延的狙击手,然后用“挡冰禁令”冻结狙击手,接着是“黑皇杖”,最后在“极寒场”上施法召唤冰晶轰炸。
AI冰女释放的“极寒场”和AI蝰蛇释放的“鬼毒”迫使人类队伍分散。因此,AI火枪可以在安全距离内发起远程攻击。
在高伤害和群控的攻击下,人类火枪和冰女想要撤退,只能被杀。然后在没有视力的情况下,艾冰女用“冰霜新星”杀死了人类巫妖。
后来艾冰女不肯放弃,闪到了人类最后的英雄Necrophos之后。但冻住对方后,艾冰女已无技能可用,只好放弃追击。
当你打不过它的时候,一个人类英雄躲在树林里想办法躲避也没用。即使AI英雄失去了视力,他也会一路追到森林里找到它,然后杀死它。
看到AI的残血,人类玩家想要追击,所以要小心,因为其他AI英雄要来抓人了。玩家不仅掉脑袋,还会死。
尤其是AI还学会了“先抓贼”,不惜使用很多重大招数,只为保证能以最高等级击杀敌方英雄。
事实上,按照官方的说法,目前OpenAI Five在攻击目标的选择上已经达到了专业水平,但是补充兵力的能力还是不足。
在回答这个问题之前,我们首先要明确一点,OpenAI Five目前已经战胜的对手并不是顶尖的人类。
双方的战斗大约从两个月前开始。目前OpenAI Five已经和5支人类队伍交手过:
4月23日,OpenAI Five首次击败脚本基线版本。5月15日与1队1:1。6月6日,他们战胜了第一、第二和第三队。
可以看到OpenAI Five一直在进步。这个人工智能与第四和第五队进行了一场非正式的比赛。虽然未能取胜,但赢了前三局中的两局。
Open还总结了OpenAI Five的几个特点:
屡次牺牲自己的优势路(夜魇军团的上路,天辉军团的下路),以压制敌人的优势路,迫使战斗转移到对手更难防御的一边。比赛初期到中期的转换比对手更快。方法:(1) 多次成功gank人类玩家 (2) 赶在对手集结之前,组队推塔。也有一些非主流打法。例如前期把钱和经验让给辅助英雄。OpenAI Five的优先级使其伤害值能更快攀升,进而赢得团战等。
但是,这么强大的队伍,当然不是和业余人类玩的。
OpenAI表示,他们计划在8月份去参加DotA 2的顶级比赛TI,找顶级职业战队PK,7月底进行职业战队的直播。
当然所有英雄,OpenAI Five暂时做不到,和职业选手对战只能从有限的英雄中选择。
到时候会有多少“限定英雄”还是个未知数。不过这也说明了一个很重要的问题:OpenAI Five的能力不足以玩人类版DotA 2。
那么,AI现在玩的DotA 2和人类版相比简化了多少?
在博客的最后,AI列举了DotA对于AI的局限性:
双方英雄阵容是固定的:死灵法师、火枪、毒龙、冰女、巫妖(他们的学名叫瘟疫法师、矮人狙击手、冥界亚龙、水晶室女、巫妖);不插眼;没有肉山;没有隐身装备;没有召唤单位、没有幻像;少了一些物品:圣剑、瓶子、补刀斧、飞鞋、经验书、凝魂之泪;有5个无敌信使(鸡),但是不能用来侦查或者防御;没有扫描。
有了这些限制,AI玩的DotA就比人类版简单多了,这也说明这个AI还有一些自己没有掌握的技能。
比如英雄的选择,阵容的搭配。双方只有五个固定的英雄,不需要掌握英雄之间的配合和克制,游戏的变化也少很多。
AI还是不知道怎么控制视野。AI玩的版本没有隐身装备,没有插眼操作,没有扫描,双方只能在游戏原本设定的视野内战斗。他们凭自己的能力改变不了自己的视野,也不需要调查。
游戏中,如果不考虑信使,AI控制的单位只能是5个,这也是召唤单位和幻术不能出现的原因。
另外,没有游戏区最强大的怪物肉山,就没有玩肉山可以获得的复活盾。在职业比赛中,复活盾带来的原地全状态复活能力可以说是翻盘利器。
人类职业选手打这样的DotA没有任何优势;如果让现在的OpenAI Five玩人类版DotA,这支没学过选英雄,做视野,偷鸡等技能,少学了很多装备的队伍,也会无所适从。
不过OpenAI也表示,这些限制大多是因为游戏的某些部分没有被整合。他们会尽快在职业比赛中加入插眼、肉山等关键元素。
虽然还有各种限制,但不可否认的是,AI的进步还是令人恐惧的。
OpenAI的解释是,这个AI是通过自战斗提升的,从随机参数开始,不是人类玩家的方法引导,也不是人类玩家的方法搜索。
他们还特别提到,在训练1v1模式的时候,专门为卡兵的操作设置了奖励。但是OpenAI Five模式没有这个奖励,只是这个新模式学会了自己卡壳。
AI每天的训练量相当于打180年游戏。可谓是真正的勤奋苦练,人类玩家的一生训练不到半天。
这些每天训练180年的玩家是什么样的怪物?
不要被结构图吓到。简单来说,每一个玩家,也就是每一个代理,就是一个1024个单元的单层LSTM(长短记忆网络)。它可以通过Valve的Bot API观察当前游戏状态,控制他的英雄接下来选择哪个操作,释放XY坐标系中的哪个点。
特工能观察到的信息和人类差不多,包括自己、队友、敌人的情况,比如位置、血量、攻击力、护甲、携带物品、能力等等。可能有一点细微的区别,就是特工大概比人类更清楚的记得过去12帧的历史信息,比如血量,攻击,攻击。
这些信息,对于代理人来说,是20000个值的列表,其判断后发出的动作命令是8个值的列表。
球员采用近端策略优化(PPO)方法的扩展版进行训练,这是OpenAI now默认的强化学习训练方法。这些代理的目标是最大化未来回报的指数衰减和。
AI球员在训练中吃得出奇的多,需要256个P100 GPU和128000个CPU核心来承载。
与1v1版本相比,上述5v5版本有一个可喜的结果:OpenAI Five所需的CPU和GPU计算能力并不是去年击败Dendi的1v1版本的5倍。
五名特工接受训练。他们是如何相互配合的?你不能像我们人类一样总是对彼此大喊大叫,对吧?
答案是他们之间没有人类能理解的沟通渠道,而是被一个“团队精神”的超级参数所控制。这个超级参数的范围在0到1之间,决定了玩家对自己奖励函数和队友平均奖励函数的注意力分布。
OpenAI表示,他们计划在7月28日与顶级选手比赛,给他们留下了整整一个月的时间。8月,他们将在TI上与顶级人类职业选手一决高下。如果这次大赛以AI结束,那么AI还有两个月的时间。
按照“世界一天,AI世界180年”的算法,加上肉山、插眼等关键要素,只要你能给AI半个月的时间与自己对抗,就可以说你在它的世界里修炼了“千年”。
这场战斗也被直播了,等着和人类观众见面。
OpenAI博客详细讲解(包括AI在各种场景下的观察和动作的交互图):
量子正在招聘营销实习生,策划实施AI明星公司CEO、高管参与的线上线下活动,有机会直接与AI行业大牛交流。丰富的实习经历等你解锁~
工作地点是北京中关村。欢迎将您的简历发送到quxin@qbitai.com