谷歌 AI 宣布,在多任务学习上取得了巨大进展:他们搞出一个会玩 41 款雅达利游戏的 AI,而且采用的新训练方法比起其他算法,训练效率大大提升!此前会玩星际争霸的 CherryPi 和火出圈的 AlphaGo 都属于单游戏智能体(Agent),也就是说,一个 AI 只会玩一种游戏。多游戏智能体这边,现有的训练算法屈指可数:主要包括时间差分学习算法(Temporal Difference Learning,TD)和行为克隆(Behavioral Cloning,BC)等。不过为了让一个智能体同时学会玩多款游戏,之前的这些方法的训练过程都很漫长。现在,谷歌采用了一个新决策 Transformer 架构来训练智能体,能够在少量的新游戏数据上迅速进行微调,使训练速度变得更快,而且训练效果也是杠杠的 —— 该多游戏智能体玩 41 款游戏的表现综合得分,是 DQN 等其他多游戏智能体的 2 倍左右,甚至可以和只在单个游戏上训练的智能体媲美
一个 AI 玩 41 个游戏,谷歌最新多游戏决策 Transformer 综合表现分是 DQN 的两倍
2022-07-23 15:13:59来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 暴雪《魔兽世界》游戏 2025 年更新路线图公布2024-11-14 03:22:58
- 魔兽宇宙 30 周年,已有超 2.54 亿游戏玩家2024-11-14 03:30:59
- 苹果因 AirPods Pro 耳机杂音问题在美国遭遇集体诉讼2024-11-14 03:38:23
- 2024Q3 苹果 iPad 在美国销售稳健:Pro 以 45% 主导、基础款占 33%、Air 占 13%、mini …2024-11-14 06:30:53
- 苹果更新 Mac / iPad 版 Final Cut Pro 视频编辑应用:引入 AI 功能、可编辑空间视频2024-11-14 07:19:07
- AI 开始“卷”智能体:OpenAI 被曝明年将推 Operator,可控制电脑、独立执行任务2024-11-14 07:35:17
- 索尼 11 月 PS+ 二三档会免游戏:《GTA5》《消逝的光芒 2》《人中之龙:维新极》《模拟人生 4》等等2024-11-14 07:46:04
- 广汽传祺 S7 更多官图公布:配备 AI 情绪大灯,明日广州车展亮相2024-11-14 08:15:29
- 英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍2024-11-14 08:33:16
- Red Hat 收购 Neural Magic 并开源其技术:优化通用设备 AI 性能,可媲美专用芯片2024-11-14 09:15:26
- 1红魔 10 Pro 系列手机发布:骁龙 8 至尊版、1.5K 144Hz“悟空屏”,4999 元起
- 2GGA电竞学院携手延世大学培养游戏行业人才
- 3全球顶级足球俱乐部齐聚卡塔尔沙漠之星参加卡塔尔精英学院第10届全球峰会
- 4宜鼎专为边缘服务器应用推出E1.S固态硬盘
- 5点亮你的四季生活 解锁中国大陆地区8家四季酒店会籍专属礼遇
- 6AI如何赋能可持续发展?IBM 最新调研揭秘现状:企业投资热情不减,但行动尚未跟上
- 7SGS携手京东养车共推机油鉴真服务
- 8玩家多年要求下,《魔兽世界》下一个资料片 12.0 版本将迎来家宅系统
- 9微软庆祝 Windows 预览体验计划 10 周年,纪念壁纸开放下载
- 102024年度「邵逸夫奖」颁奖典礼 庆祝科研成就二十一载