「深蓝」并非以智取胜,而是一个劳动密集型选手当「深蓝」在1997年击败国际象棋世界冠军卡斯帕罗夫时,人工智能似乎要来了。一台电脑击败了有史以来最聪明的国际象棋选手之一,很多人惊呼,电脑要超越人类了。然而事实并非如此,虽然「深蓝」是一段精心编制的程序,但这种方法过于劳动密集,过于依赖清晰的规则和有限的可能性,无法迁移到更复杂的游戏中,更不用说现实世界了。深度学习成功的关键在于算法基本上是自己编写的,给定数据集,他们从中学习到一些表征,所谓的算法就是这么出来的。而DeepMind 正在开发一种新的元学习算法来进一步实现自动化,这种算法能够从零开始发现自己的价值函数--深度强化学习中的一个关键编程规则。近日该论文发表在了arxiv上
通用强化学习用算法发现算法:DeepMind 数据驱动「价值函数」自我更新,14款A…
2020-07-27 13:24:05来源: 新浪科技
关注公众号
赞
你的鼓励是对作者的最大支持
- 每天88万人在线找房,撑起贝壳IPO:一年进账460亿2020-07-27 13:24:05
- 全新的中国自主安全电脑智造生产基地扎根天津2020-07-27 13:24:05
- 台积电获得Intel 6nm芯片订单 为自家独显量产准备?2020-07-27 13:24:05
- ARM寻求买家?三星、苹果、nVIDIA会接手吗?2020-07-27 13:24:05
- 支持5G的 iPhone 12系列泄密!窄刘海,6.7英寸巨无霸,9月8号发布2020-07-27 13:24:05
- Gartner预测2020年全球公有云营收增长6.3% DaaS增速最快2020-07-27 13:24:05
- Gartner:预计2020年全球公有云营收增长6.3%,DaaS增速最快2020-07-27 13:03:48
- 工信部:多措并举提振消费,全面实施内外销产品“同线同标同质”2020-07-27 13:17:45
- L-com诺通扩展防水USB 3.0线缆组件,以解决恶劣环境下的连接应用2020-07-27 13:00:00
- 最前线 | 大疆应用疑似监视用户,随后发声明一一“对峙”2020-07-27 11:54:59