1.77+15

谷歌旗下，开发出AlphaGo的人工智能前沿公司，DeepMind官方博客今天宣布其开发的人工智能已经解锁新成就--在暴雪娱乐游戏《星际争霸II》中称霸。

这家隶属于谷歌的人工智能实验室开发出了升级版AlphaStar，拥有更加复杂的算法，在这款实时策略游戏上已经达到登峰造极的大师级别，可以击败99.8%的人类玩家。

相关研究结果发表在科学杂志《Nature》上。

年初，由DeepMind构建的另一算法AlphaStar以总比分2:0分别战胜《星际争霸Ⅱ》的顶级人类选手MaNa和TLO。

这或许是自2017年AlphaGo在围棋上战胜人类后，再次让人类刷新AI认知的人机大战。

不同于围棋，《星际争霸Ⅱ》是一款即时战略而非回合制的游戏，玩家的信息隐蔽性和移动自由性较围棋更高。

之后，Deepmind设立了更宏伟的目标：在不设限制的情况下，以Grandmaster级别玩一场完整游戏。

AlphaStar天梯排名达到所有活跃玩家的前0.15%（在九万名玩家中相当于前150名以内）。

这样的水准直接参加星际2天梯比赛可谓是“炸鱼”般的存在。

Deepmind称，使用通用的机器学习技术（包括神经网络，通过自己与自己游戏进行强化学习，多智能体学习和模仿学习）。

从《自然》杂志中发表的论文可以看到，AlphaStar在Battle.net平台上排名高于99.8%的活跃玩家，并且在星际争霸II的神族、人族和虫族都达到了宗师级水平。

学习人的策略，并确保智能体在整个游戏过程中不断学习这些策略，这是提升AlphaStar能力的关键。

为此，Deepmind使用了模仿学习，再加上基于语言建模的高级神经网络的体系结构和技术，来制定初始策略，使智能体把游戏玩得比84%的活跃玩家更好。

另外deepmind还使用了一个潜在变量，该变量确定了策略并对人类游戏的开局动作分布进行编码，这有助于保留一些开局的高级策略。

然后，AlphaStar在整个自我游戏过程中使用一种distillation手段，这种方法使AlphaStar可以在单个神经网络中展现许多策略（每个种族一个）。

在评估过程中，神经网络不以任何特定的开局动作为条件。

总体而言，Deepmind称，用于开发AlphaStar的技术将有助于进一步提高AI系统的安全性并且可能有助于推进在现实世界中的研究。

比如，五角大楼中负责开发商业技术的国防创新部主任MichaelBrown表示，利用AI实现“战略推理”是他们的重点研究方向之一。

从AlphaGo跟李世石围棋博弈技惊四座，到最新出现的AlphaStar，包括GoogleHome、谷歌助理和云计算硬件等，谷歌正式确立了以人工智能优先的公司战略。

AI业务涵盖了从硬件到软件、搜索算法、翻译、语音和图像识别、无人车技术以及医疗药品研究等方面。

这些业务充分展示了谷歌不断在人工智能(ArtificialIntelligence)里的机器学习(MachineLearning)以及自然语言处理(NaturalLanguageProcessing,NLP)上的精益求精。

根据《关于开展幼儿园优秀游戏活动案例征集的通知》要求，经幼儿园申报、地方推荐、专家独立评审、结果公示等程序，共有130个案例为全国幼儿园优秀游戏活动案例。

其中贵州省共有5个案例入选。

全国幼儿园优秀游戏活动案例名单（贵州）教育部将组织专家开展多种形式的优秀游戏活动案例培训推广工作，各地要利用好这些优秀游戏案例资源，开展教研指导和师资培训，不断提高幼儿园教师专业素质和教育实践能力。