微比恩 > 信息聚合 > 大数据究竟有多“大”:谷歌搜索规模为 62 PB,在知名大数据源中排名倒数

大数据究竟有多“大”:谷歌搜索规模为 62 PB,在知名大数据源中排名倒数

2022-03-07 11:52:22来源: IT之家

众所周知,算法、算力与数据是人工智能(AI)发展的“三驾马车”,吴恩达等学者也常说:以数据为中心的 AI,或数据驱动的 AI。由此可见,近年来激增的数据量是 AI 腾飞的源动力之一,数据在 AI 中扮演重要角色。那么,人们口中常说的“大数据”,规模究竟有多大呢?出于好奇心,一位意大利物理研究者 Luca Clissa 调查了 2021 年几个知名大数据源(谷歌搜索、Facebook、Netflix、亚马逊等等)的规模大小,并将它们与大型强子对撞机(LHC)的电子设备所检测到的数据做了对比。地址:https://arxiv.org/ pdf / 2202.07659.pdf毫无疑问,LHC 的数据量是惊人的,高达 40k EB。但商业公司的数据量也不容小觑,比如,亚马逊 S3 存储的数据量也达到了大约 500 EB,大致相当于谷歌搜索(62 PB)的 7530 倍。此外,流数据在大数据市场中也占有一席之地。Netflix 和电子通

关注公众号
标签: 大数据