微比恩 > 信息聚合 > 模仿并超越,KL 正则化搜索让 AI 下围棋更像人类,Meta&CMU 出品

模仿并超越,KL 正则化搜索让 AI 下围棋更像人类,Meta&CMU 出品

2021-12-17 15:21:02来源: IT之家

如果非要问 AlphaGo 有什么缺点,那就是下棋不像人类。和 AlphaGo 对弈过的顶级棋手都有这种感受,他们觉得 AI 落子经常让人捉摸不透。这不仅是 AlphaGo 的问题,许多 AI 系统无法解释,且难以学习。如果想让 AI 与人类协作,就不得不解决这个问题。现在,来自 Meta AI 等机构的研究者们打造出一个能战胜人类顶级棋手、且更容易复盘棋谱的 AI。他们用人类棋谱训练 AI 模仿,并让后者超越了人类。上图分别展示了该方法在国际象棋(左)、围棋(右)的表现。纵轴为 AI 与原始模型对弈的胜率,横轴为 AI 预测人类落子位置的 Top-1 准确度。可以看出新的算法(绿色)在两方面都已经超过了 SOTA 结果(蓝色)。像人类,还能打败人类正所谓“鱼与熊掌难以兼得”。AlphaGo 使用的自我博弈与蒙特卡洛树搜索(MCTS),虽然练就了无比强大的 AI,但它的下棋更像凭直觉,而非策略。如果要让 AI 更像人类,更应当使

关注公众号
标签: AI Meta