微比恩 > 信息聚合 > 淘金AI时代的“卖水人”,数据标注为何没站上风口?

淘金AI时代的“卖水人”,数据标注为何没站上风口?

2021-07-26 10:00:00来源: 钛媒体

图片来源@视觉中国文丨光锥智能,作者丨罗宁人工智能领域专家李飞飞曾分享过一个故事:在开启备受关注的ImageNet项目后,为了让机器理解图片内容,他们需要对10亿张图片进行标注,这项工作难度不大,但浩如烟海的数据量却不是一个小团队能够完成的,即便她和博士生不吃不喝不睡,也需要20年时间才能做完。最终,图片的标注被作为众包项目分配给了全球167个国家的5万名参与者,所有人耗时三年时间才将项目完成,而据李飞飞描述,这些互联网上参与标注的人中,很多人并不知道自己亲身参与了如此重要的科研项目。这个故事至少说明了两个重要事实:其一,在人工智能领域,有多少人工就有多少智能,数据标注是让机器理解世界的前提;其二,数据标注的工作并不复杂,但耗费大量的人力和时间,因此众包成为一种有效手段加速算法进化。数据有多重要?前百度首席科学家,人工智能领域专家吴恩达曾说:“AI系统就是代码+数据,绝大多数学术型竞争对手都不会去碰数据,只是让团队在

关注公众号
标签: AI