""

澳门太阳城网站-最新注册

  • deeprole,配备了澳门太阳城最新网站发明了游戏机器人“演绎推理”,可以在在线多人游戏整蛊当玩家的角色和动机都秘而不宣击败人类玩家。

    deeprole,配备了澳门太阳城最新网站发明了游戏机器人“演绎推理”,可以在在线多人游戏整蛊当玩家的角色和动机都秘而不宣击败人类玩家。

    全屏

机器人可以击败人类在多人游戏中的隐藏角色

deeprole,配备了澳门太阳城最新网站发明了游戏机器人“演绎推理”,可以在在线多人游戏整蛊当玩家的角色和动机都秘而不宣击败人类玩家。

用演绎推理,机器人标识朋友或敌人,可以确保在某些网游人类的胜利。


记者联系

艾比abaz要么ius
电子邮件: abbya@mit.edu
电话:617-253-2709
澳门太阳城最新网站新闻办公室

有无澳门太阳城最新网站的研究人员开发配备了一个机器人的人工智能能够打败人类玩家在多人在线游戏整蛊当玩家的角色和动机都秘而不宣。

许多游戏机器人已建成跟上人类玩家。此前ESTA年,卡内基梅隆大学的团队开发了世界上第一个机器人可以击败扑克职业玩家在多人。 deepmind的alphago在2016年做了标题为击败一个专业棋手。几个机器人也被内置专业棋手击败或合作游戏在线联手:如夺旗。在这些游戏中,但是,机器人知道它的对手从一开始队友。

在下个月的神经信息处理系统的会议,会出现研究者deeprole,第一游戏机器人,可以赢得在线多人游戏中,参与者队伍的忠诚都不清楚最初。随着机器人设计新颖的“演绎推理”加入人工智能算法通常用于打扑克。关于这有助于它部分可观察的行为的原因,以确定给定的球员是队友还是对手的概率。在这样做,学得很快,并与谁结盟哪些动作采取以确保其团队的胜利。

研究人员对进站人类玩家的deeprole 4000个多回合网游“反抗军:阿瓦隆”的在这个游戏中,玩家试图推断他们的同龄人秘密角色,随着游戏的进行,而同时隐藏自己的角色。双方作为队友和对手,deeprole的表现一直超过人类玩家。

“如果你有一个机器人代替人类的队友,你可以期望更高的胜率为您的团队。机器人是更好的合作伙伴,阿瓦隆“玩家“的第一作者杰克Serrino '18,WHO在电气工程和计算机科学专业在澳门太阳城最新网站,是一个热衷于网上说”。

这项工作是一个更广泛的项目,以更好地模拟人类如何让社会知情决策的一部分。这样做有利于建立的机器人,可以更好地理解,从和工作学会与人。

“人类学习和与他人合作,并且能够让我们实现共同的东西我们没有人可以单独实现的,”合着者说Max克莱曼 - 韦纳,在该中心的大脑,心灵和机器的博士后和部门在澳门太阳城最新网站和哈佛大学脑与认知科学。 “游戏像‘阿瓦隆’更好地模拟动态社会环境人类在日常生活中的经验。你必须弄清楚谁是你的团队,将与您一起,无论是你的幼儿园的第一天或另一天在你的办公室。“

在纸张上加入Serrino和克莱曼 - 韦纳是大卫℃。哈佛和约书亚乙帕克斯。特南鲍姆,计算认知科学教授,澳门太阳城最新网站计算机科学和人工智能实验室和中心的大脑,心灵和机器中的一员。

演绎机器人

在“阿瓦隆”三名球员是随机偷偷分配到“性”的团队和两名球员的“间谍”的团队。这两名球员都知道间谍球员的角色。在每一轮中,一名球员提出了两个或三个球员的一个子集来执行任务。同时所有玩家投票批准并公开或否决的子集。如果大多数同意,该子集偷偷确定是否任务将成功或失败。如果两个则“成功”被选择,任务成功;如果一个“失败”时,任务失败。玩家必须总是选择阻力成功,但玩家可以窥探选择任何一种结果。阻力队经过三个成功的使命胜;在特务队后,三次失败使命胜。

赢得比赛基本上可以归结为是谁演绎电阻或间谍,并为您的合作者投票。但是这是卫生组织的计算量比玩棋牌复杂。 “这是不完全信息游戏,”克莱曼 - 韦纳说。 “你甚至不知道你是一个当你开始反对,因此没有找到与谁合作的一个额外的发现阶段。”

deeprole使用所谓的“反事实的遗憾最小化”(CFR)游戏规划算法 - 哪些学习到反复播放对自己玩一个游戏 - 演绎推理与增强。在一个游戏中的每个点,CFR展望创建线路和节点描述每个球员的潜力未来行动的决定“博弈树”。代表游戏树所有可能的行动(行)每个玩家可以在每一个未来的决策点。在玩了游戏模拟,哪些动作或ADH增加获胜的机会减少ITS参见笔记,并反复ITS战略潜在的数十亿美元,包括您查看更明智的决定。最终,它计划的最佳策略,在最坏情况下,对任何对手的关系。

CFR行之有效的游戏,如扑克,公共行动 - 如投注金钱和折叠手 - 但它的斗争,当行动是秘密。研究人员的CFR相结合的公共行为和私人行为的后果,以确定球员阻力或间谍。

机器人被打对自身的抵抗力和间谍都训练有素。当玩网络游戏,它利用其博弈树估计了每个球员要做的事情。代表树游戏中每个玩家政略可能性最高,赢得了分配的作用。树的节点包含“反价值”,这基本上是根据某个球员接受回报,如果他们扮演的战略考虑。

在每个任务中,机器人着眼于每个人相比,博弈树怎么打。如果,在整场比赛,这让足够的决定是与机器人的期望不一致的球员,那么球员可能是扮演其他角色。最终,机器人分配一个高概率为每个玩家的角色。这些概率用于更新机器人的战略,以提高胜利ITS的机会。

同时,它采用ESTA同样的方法来估计第三人称观察者会如何解释自己的行动。这有助于评估它的其他球员如何REACT五月,帮助其做出更明智的决策。 “如果这是在一个失败的两个玩家的任务,其他队员知道一个球员是一个间谍。机器人可能不会提出同一个团队在未来的任务,因为它知道其他球员认为这是坏的,“Serrino说。

语言:下一个前沿

有趣的是,机器人并不需要与其他玩家,这通常是游戏的重要组成部分进行通信。 “阿瓦隆”让玩家文本模块在游戏聊天。 “但事实证明,我们的机器人能够与团队其他人的工作也同时观察唯一的球员的行动,”克莱曼 - 韦纳说。 “这很有趣,因为人们可能会认为这样的比赛需要复杂的传播策略。”

接下来,研究人员可以使机器人用简单的文本奥运会期间进行交流,如说一个球员是好还是坏。这将涉及到分配的文本的概率相关,一个球员是电阻或间谍,它使用机器人做它的已经决定。除此之外,未来的机器人可能配备更复杂功能的沟通,使其能够发挥语言沉重的社会扣除游戏 - 比如流行的游戏“狼人” - 这涉及到争论和说服其他球员关于谁上的几分钟好的和坏的团队。

“语言绝对是下一个前沿领域,” Serrino说。 “有很多挑战,但在这些比赛中,如果沟通是如此关键的攻击。”


主题: 研究, 计算机科学与技术, 算法, 视频游戏, 人工智能, 机器学习, 语言, 计算机科学和人工智能实验室(CSAIL), 脑与认知科学, Electrical Engineering & Computer Science (eecs), 工程学院

回到顶部