If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

大数据时代

数字世界正在不断地收集越来越多的数据。无论何时使用在线服务,您都在为用户行为的数据集做出贡献。即使只是简单地在家里用电和用水,你也在为公用事业使用的数据集做贡献。
随着连接到互联网的人数和城市的增加,数据集的规模也越来越大。 一份报告估计,到2025年,数字数据的总大小将为 175 泽字节 1
显示数据大小随时间增长的柱状图。x 轴表示年份,从2010年到2025年。y 轴表示从0到180 ZB。2010年的第一列接近于0,2025年的最后一列是175 ZB。
175 ZB到底有多少数据呢?一个ZB是一万亿GB。现代智能手机的存储空间约为32GB。要存储175 ZB,我们将需要6万亿部智能手机(每个人1000部智能手机!)
唷,那太多了! 但是单个数据集有多大呢?
这些统计数据可以给我们一个基本概念……
  • 一次核磁共振成像扫描可获得20,000张图像1
  • 谷歌每天处理 35亿个搜索查询2
  • Instagram用户每分钟发布 5.4万张照片3
  • 自动驾驶汽车每天产生 11 TB的数据4
  • 推特用户每秒发布 3000条推文5
大数据集是如此之大,以至于我们传统的存储和处理方式已不再适用,这给计算机科学家和数据工程师带来了挑战。从好的方面来说,它们是如此之大,大到为分析提供了新的机会,这在一个小数据集上是不可能的。
在这节课中,我们将探索大数据的来源,以及我们使用它的令人兴奋的方式。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.