1.77+15


谷歌旗下,开发出AlphaGo的人工智能前沿公司,DeepMind官方博客今天宣布其开发的人工智能已经解锁新成就--在暴雪娱乐游戏《星际争霸II》中称霸。

这家隶属于谷歌的人工智能实验室开发出了升级版AlphaStar,拥有更加复杂的算法,在这款实时策略游戏上已经达到登峰造极的大师级别,可以击败99.8%的人类玩家。

相关研究结果发表在科学杂志《Nature》上。

年初,由DeepMind构建的另一算法AlphaStar以总比分2:0分别战胜《星际争霸Ⅱ》的顶级人类选手MaNa和TLO。

这或许是自2017年AlphaGo在围棋上战胜人类后,再次让人类刷新AI认知的人机大战。

不同于围棋,《星际争霸Ⅱ》是一款即时战略而非回合制的游戏,玩家的信息隐蔽性和移动自由性较围棋更高。

之后,Deepmind设立了更宏伟的目标:在不设限制的情况下,以Grandmaster级别玩一场完整游戏。

AlphaStar天梯排名达到所有活跃玩家的前0.15%(在九万名玩家中相当于前150名以内)。

这样的水准直接参加星际2天梯比赛可谓是“炸鱼”般的存在。

Deepmind称,使用通用的机器学习技术(包括神经网络,通过自己与自己游戏进行强化学习,多智能体学习和模仿学习)。

从《自然》杂志中发表的论文可以看到,AlphaStar在Battle.net平台上排名高于99.8%的活跃玩家,并且在星际争霸II的神族、人族和虫族都达到了宗师级水平。

学习人的策略,并确保智能体在整个游戏过程中不断学习这些策略,这是提升AlphaStar能力的关键。

为此,Deepmind使用了模仿学习,再加上基于语言建模的高级神经网络的体系结构和技术,来制定初始策略,使智能体把游戏玩得比84%的活跃玩家更好。

另外deepmind还使用了一个潜在变量,该变量确定了策略并对人类游戏的开局动作分布进行编码,这有助于保留一些开局的高级策略。

然后,AlphaStar在整个自我游戏过程中使用一种distillation手段,这种方法使AlphaStar可以在单个神经网络中展现许多策略(每个种族一个)。

在评估过程中,神经网络不以任何特定的开局动作为条件。

总体而言,Deepmind称,用于开发AlphaStar的技术将有助于进一步提高AI系统的安全性并且可能有助于推进在现实世界中的研究。

比如,五角大楼中负责开发商业技术的国防创新部主任MichaelBrown表示,利用AI实现“战略推理”是他们的重点研究方向之一。

从AlphaGo跟李世石围棋博弈技惊四座,到最新出现的AlphaStar,包括GoogleHome、谷歌助理和云计算硬件等,谷歌正式确立了以人工智能优先的公司战略。

AI业务涵盖了从硬件到软件、搜索算法、翻译、语音和图像识别、无人车技术以及医疗药品研究等方面。

这些业务充分展示了谷歌不断在人工智能(ArtificialIntelligence)里的机器学习(MachineLearning)以及自然语言处理(NaturalLanguageProcessing,NLP)上的精益求精。

根据《关于开展幼儿园优秀游戏活动案例征集的通知》要求,经幼儿园申报、地方推荐、专家独立评审、结果公示等程序,共有130个案例为全国幼儿园优秀游戏活动案例。

其中贵州省共有5个案例入选。

全国幼儿园优秀游戏活动案例名单(贵州)教育部将组织专家开展多种形式的优秀游戏活动案例培训推广工作,各地要利用好这些优秀游戏案例资源,开展教研指导和师资培训,不断提高幼儿园教师专业素质和教育实践能力。