人类一败涂地!OpenAI战胜Dota2半职业选手
ninehua 2024-11-23 20:24 23 浏览
智东西(公众号:zhidxcom)文 | 伟宏
导语:Dota2半职业选手不敌人工智能!AI将参加下一届DOTA2世界锦标赛。
此前曾在竞技游戏Dota 2中击败业余选手的人工智能机器人OpenAI Five刚刚进行了另一项“基准”测试——与一个由职业和半职业选手组成的Dota2战队进行对战。出乎所有人意料的是,这个强劲的半职业战队在OpenAI Five的攻势下毫无还手之力。在比赛规则公平的情况下,战队内的职业选手、专业解说、教练竟无一能对AI造成威胁,AI展现了不弱于职业选手的精细操作和战术素养,“分路、补刀、抓人、推进”这些曾被认为只有人类才能完美执行的动作被OpenAI Five以更高效、更出色的方式展现出来。
最终,OpenAI Five摧枯拉朽地赢下了三局比赛的前两局,比赛进行时,被称为Dota数据权威的“dota plus大数据”平台分析的AI胜率一度达到了99%。直到最后一局,已经获得比赛胜利的AI有了一个更苛刻的限制——所用英雄由现场观众选出。在这样的情况下,选手终于获得了第三局游戏的胜利,为人类挽回了一点颜面。尽管如此,所有人都不能否认一个事实,OpenAI Five已经能在Dota2领域达到人类职业选手的水平。
为什么AI在一款游戏中的胜利能引起如此大的震动?首先我们要知道,Dota2是一款非常复杂的实时战略游戏,其中,英雄、技能、装备的不同使得游戏比国际象棋还要复杂百倍,细微的决策差别往往会引发截然不同的结果,因此,想要让AI在Dota2中击败人类,需要比围棋更复杂的程序和更庞大的计算量。
早在今年6月份,OpenAI Five已经了击败业余的Dota2玩家,人们惊叹于OpenAI Five如此快的成长速度,短短两个月,它已经能够和半职业选手对抗并取胜。开发人员解释道:“OpenAI Five通过自我学习技术,每天都要和自己进行共计180年的游戏对局,同时,它使用多达256个GPU和128000个CPU核心进行训练。”通过不断地自我学习,而不是单纯的模仿,OpenAI已经能研究出自己的战术策略。OpenAI团队在过去的一个月里对他们的AI还做了一些小小的调整,如增加了它的反应时间,并用新的、额外的策略来测试它。OpenAI的研究人员大卫·法尔希(David Farhi)说:“当出现AI计算范围之外的事情时,它总能想出更快、更准确的应对方式。”
OpenAI Five的技术特点
1.模型结构
OpenAI five的每一个网络都包含一个单层、1024个单元的LSTM模型,它可以看到当前的游戏状态,并在几个备选动作中选择一个。每个备选动作都有自己的具体含义,例如,确定单位的坐标,计算技能的时间等。
2.侦查
OpenAI Five从自我对战中学习(从随机权重开始),从而掌握侦查地图的方法。为了避免“策略崩溃”,研究者将其80%的时间用在与自身进行训练,而另外20%的时间则与过去AI进行训练。在第一场比赛中,英雄们漫无目的地绕着地图走,经过几个小时的训练后,已经出现了一些基本概念。几天之后,AI已经学会了人类基本的战术策略。
3.团队合作
OpenAI Five控制的英雄并没有一个确定的渠道来进行信息的互换,而是通过被研究人员称为“团队精神”的超参数控制来达到团队合作的目的。“团队精神”的范围从0到1,对OpenAI Five的每个英雄应该权衡多少个人利益与团队利益之间提供了平均值,以此来训练英雄什么时候独自战斗,什么时候一起战斗。
4.训练速度
OpenAI的训练系统是一种通用的RL训练系统,名为Rapid,可以应用于任何的训练环境。我们已经解决了OpenAI包括竞争性的自我对战(Competitive Self-Play)在内的许多复杂问题。训练系统分为运行游戏副本和代理收集经验的rollout worker和执行跨GPU组同步的optimizer nodes。
在电子游戏中测试AI的原因
去年,当谷歌旗下的DeepMind打败了人类最优秀的围棋选手时,谷歌也宣布他们下一步将进军游戏领域,试图让AI在著名的即时战略游戏《星际争霸2》中击败人类选手。《星际争霸2》拥有比DOTA2更复杂的游戏和单位设定,因此它所衍生出来的战术也浩如烟海,难以穷尽。让AI在《星际争霸2》中战胜职业选手将更具挑战性。
电子游戏拥有比传统的棋牌游戏更多的战术选择和不确定因素,在不同的英雄和装备组合的条件下,AI需要处理更多的信息和突发状况。另外,由于是“即时战略”,则需要AI更快,更准确的反映速度,这都是回合制的棋牌游戏所没有的。还有非常重要的一点是,由于游戏中“战争迷雾”的设定,AI无法准确知道人类的战术和动向,这就需要它进行和人类一样的思考和推理,如何识破人类的“战术欺骗”将成为需要重点攻克的领域。
以上原因让各大AI开发者纷纷瞄准了电子游戏作为下一个“主战场”,OpenAI的下一个目标是今年8月下旬在加拿大温哥华举行的顶级Dota 2赛事TI8,届时它将会与人类最顶级的职业选手角逐冠军。作为Team Human的一员,威廉说道:“我对OpenAI Five有信心,我认为它会击败真正的职业战队。”当人类在围棋领域沦陷后,能否守住“电子游戏”这一道防线,AI是否会彻底打破人类对它垄断?还需要时间的检验。但我相信,不论结局如何,都代表着人类在AI领域的又一次重大突破,这场战役,胜利的一方依旧是人类。
原文来自:OpenAI、CNET
相关推荐
- Origin将普通双Y轴柱状图升级为高级的3D倒影柱状图
-
双Y轴柱状图可以在同一张图表中展示两组具有不同量纲或数量级的数据。3D倒影柱状图是一种通过三维立体及倒影形式展示多个数据的图表,它通过柱子的高度和颜色来表示不同的数据类别和数值大小,以及通过不同平面展...
- Origin 2021 安装教程(附安装包下载)
-
Origin2021软件介绍广泛用于科研、工程和数据分析领域。它支持多种数据格式,包括Excel、ASCII、CSV等,可以方便地导入和分析各种类型的数据。Origin提供了丰富的数据分析工具,包括...
- VIVO origin os系统关闭广告教程(IQOO同理)
-
以下是我使用期间发现的,如有其他未发现的,欢迎大家评论补充。1设置-安全-更多安全设置-广告与隐私-个性化广告推荐关闭2设置-安全-更多安全设置-应用安装-应用推荐关闭3设置-系统管理-全局搜索-首页...
- Origin 2019 安装教程(附安装包下载)
-
Origin2019软件介绍广泛用于科研、工程和数据分析领域。它支持多种数据格式,包括Excel、ASCII、CSV等,可以方便地导入和分析各种类型的数据。Origin提供了丰富的数据分析工具,包括...
- vivo开启Origin OS3系统公测,并且公布首批至第四批可升级名单
-
vivo在本月初发布了OriginOS3.0操作系统,11月25日开启了首批机型的公测招募活动,首批公测机型包括vivo和iQOO,共计14款机型。首批公测招募的机型有:vivoxfold+、v...
- Origin将普通热图升级为高级的3D堆叠热图
-
3D堆叠热图是一种将多个热图组合在一起展示的图表可视化形式。每个热图代表一个数据集,通过比较不同数据集在不同条件(分组)下的颜色深浅变化来挖掘数据的大小差异或者相关性,能够直观地比较多组数据的相对强度...
- 最新最详细的Origin2021安装教程(保姆级)
-
直入正题,下面是Origin2021的安装过程安装包(复制到浏览器打开):%74%2E%63%6E/%41%36%4E%67%6D%54%74%4A安装步骤1、下载得到安装包后,请先解压!一定要先解压...
- vivo和iQOO抓紧更新 OriginOS5末班车 12月最后一波升级
-
进入12月底了,很多老旧机型也已经开始更新各家的新系统了,所以大家一定要注意查看系统版本更新。那么就拿今年国内销量第一的vivo和iQOO来说,OriginOS5都已经推出两个月了,根据之前公布的适...
- Origin将普通点线图转换为高级的3D堆叠点线图
-
点线图用于显示数据随时间或其他连续变量的变化趋势;点线图主要功能是展示数据随时间或连续变量的变化趋势,强调变化幅度,比较多个变量,描述周期性变化,识别异常值,并帮助分析趋势和预测未来趋势。当具有多组数...
- 蓝厂Origin OS 2.0首批适配机型曝光!有没有你的手机型号?
-
2020年11月18日蓝厂新系统OriginOS正式发布,并由后来的X60系列首发,新系统发布后网上就有言论:蓝厂补足了最后一块短板!发布至今大概已经有11月的时间了,网上也是褒贬不一,Origin...
- Origin2018软件安装包以及安装教程
-
安装步骤:1.鼠标右击软件压缩包,选择“解压到Origin2018”2.打开“Origin2018\Origin2018”文件夹,鼠标右击“setup”,选择“以管理员身份运行”3.软件正在准备...
- Origin这样操作,轻松绘制漂亮的雷达图
-
背景介绍雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。轴的相对位置和角度通常没有信息。雷达图也称为网络图、蜘蛛图、星图、星图、蜘蛛网、不规则多边形...
- 曝OriginOS新版本在“玩命打磨底层”流畅性比肩鸿蒙
-
日前,vivo正式官宣了2022年vivo开发者大会的举办时间:11月8日-11月9日。OriginOS全新版本届时将正式登场。时隔一年,这次全新OriginOS又将给我们带来什么样的全新体验? ...
- Dify工具使用全场景:1.0.1发布了,升级(功能篇·第8期)
-
上一篇:Dify工具使用全场景:API扩展(功能篇·第7期)一、Dify1.0.1版本升级特性Dify1.0.1版本在稳定性、性能和用户体验方面进行了全面升级,修复了之前版本中的一些已知问题,带来...
- vivo 新系统originOS 升级公测后增加手机内存
-
vivo新系统originOS,通过内存融合、进程优化、应用预载三种技术,一方面调用部分闲置的闪存空间,另一方面低系统对内存的占用,从而可以让原硬件内存增加2-3GB内存使用。vivo新系统ori...