第1个回答 2021-10-22
大数据是一种规模大到在获取、管理、分析方面大大超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。如果将大数据比作一个产业,那么这种产业实现盈利的关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上来看,大数据和云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
云时代的来临,大数据的关注度也越来越高,分析师团队认为大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模的并行处理数据库、数据挖掘、分布式文件系统、分布式数据可、云计算平台、互联网和可扩展的存储系统。
现在已经进入了大数据时代,哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
物联网的发展离不开大数据,依靠大数据可以提供可靠的资源,同时大数据也推动了物联网的发展。举个例子:在汽车内连接传感器,并结合大数据和分析来预测,当一辆汽车有可能出故障之前,实际上已经发生。这一过程不仅会通知司机,而且他们的车辆可能在服务之前出故障,这可以支持汽车制造商调查潜在的缺陷,并改进未来的车型。