微比恩 > 信息聚合 > 通用强化学习用算法发现算法：DeepMind 数据驱动「价值函数」自我更新，14款A…

通用强化学习用算法发现算法：DeepMind 数据驱动「价值函数」自我更新，14款A…

2020-07-27 13:24:05来源: 新浪科技

通用强化学习用算法发现算法：DeepMind 数据驱动「价值函数」自我更新，14款A…

图片地址：https://n.sinaimg.cn/sinakd20200727s/482/w900h382/20200727/0581-iwxpesx2504546.jpg

「深蓝」并非以智取胜，而是一个劳动密集型选手当「深蓝」在1997年击败国际象棋世界冠军卡斯帕罗夫时，人工智能似乎要来了。一台电脑击败了有史以来最聪明的国际象棋选手之一，很多人惊呼，电脑要超越人类了。然而事实并非如此，虽然「深蓝」是一段精心编制的程序，但这种方法过于劳动密集，过于依赖清晰的规则和有限的可能性，无法迁移到更复杂的游戏中，更不用说现实世界了。深度学习成功的关键在于算法基本上是自己编写的，给定数据集，他们从中学习到一些表征，所谓的算法就是这么出来的。而DeepMind 正在开发一种新的元学习算法来进一步实现自动化，这种算法能够从零开始发现自己的价值函数--深度强化学习中的一个关键编程规则。近日该论文发表在了arxiv上

关注公众号

提示：支持键盘“← →”键翻页

上一篇 80亿美元收购两年后，SAP启动Qualtrics IPO计划

下一篇 Nature封面撤稿：邢立达等人的「史上最小恐龙」假说存疑

赞

你的鼓励是对作者的最大支持

相关阅读

每天88万人在线找房，撑起贝壳IPO：一年进账460亿2020-07-27 13:24:05
全新的中国自主安全电脑智造生产基地扎根天津2020-07-27 13:24:05
台积电获得Intel 6nm芯片订单为自家独显量产准备？2020-07-27 13:24:05
ARM寻求买家？三星、苹果、nVIDIA会接手吗？2020-07-27 13:24:05
支持5G的 iPhone 12系列泄密！窄刘海，6.7英寸巨无霸，9月8号发布2020-07-27 13:24:05
Gartner预测2020年全球公有云营收增长6.3% DaaS增速最快2020-07-27 13:24:05
Gartner：预计2020年全球公有云营收增长6.3%，DaaS增速最快2020-07-27 13:03:48
工信部：多措并举提振消费，全面实施内外销产品“同线同标同质”2020-07-27 13:17:45
L-com诺通扩展防水USB 3.0线缆组件，以解决恶劣环境下的连接应用2020-07-27 13:00:00
最前线 | 大疆应用疑似监视用户，随后发声明一一“对峙”2020-07-27 11:54:59

热门排行榜

1日1周1月

免费发布分类信息

最新图片