hadoop主要解决什么问题

如题所述

推荐答案 2019-11-19

Hadoop实现了一个分布式文件系统，设计用来部署在低廉的硬件上；而且提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集的应用程序。

Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构，将大数据处理引擎尽可能的靠近存储，对例如像ETL这样的批处理操作相对合适，因为类似这样操作的批处理结果可以直接走向存储。

Hadoop的MapReduce功能实现了将单个任务打碎，并将碎片任务(Map)发送到多个节点上，之后再以单个数据集的形式加载(Reduce)到数据仓库里。

扩展资料

Hadoop 由许多元素构成。其最底部是 HDFS，存储 Hadoop 集群中所有存储节点上的文件。HDFS的上一层是MapReduce 引擎，该引擎由 JobTrackers 和 TaskTrackers 组成。

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

对外部客户机而言，HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件，等等。但是 HDFS 的架构是基于一组特定的节点构建的，这是由它自身的特点决定的。

这些节点包括 NameNode（仅一个），它在 HDFS 内部提供元数据服务；DataNode，它为 HDFS 提供存储块。

参考资料来源：百度百科-Hadoop

温馨提示：答案为网友推荐，仅供参考

当前网址：http://11.wendadaohang.com/zd/SPSF7PFM7.html

其他回答

第1个回答推荐于2018-03-14

主要解决了海量数据的存储、分析和学习问题，因为随着数据的爆炸式增长，一味地靠硬件提高数据处理效率及增加存储量，不仅成本高，处理高维数据的效率也不会提高很多，遇到了瓶颈了，hadoop的搭建只需要普通的pc机，它的hdfs提供了分布式文件系统，mapreduce是一个并行编程模型，为程序员提供了编程接口，两者都屏蔽了分布式及并行底层的细节问题，用户使用起来简单方便。本回答被网友采纳

相似回答

hadoop是用来解决什么样的问题的?答：Hadoop是一个开源的分布式计算框架，主要用于处理和存储大规模数据集的问题，特别是在传统数据处理应用软件无法应对的情况下。Hadoop最初是为了解决网络搜索引擎产生的海量数据的存储和计算问题而设计的。随着大数据时代的到来，企业和研究机构面临着处理PB级别数据的挑战。这样的数据量远远超出了传统关系型数据库...

大家正在搜

hadoop能解决什么问题 hadoop做什么 hadoop大数据分析技术谈谈对hadoop的认识 hadoop技术是什么 hadoop的概述 hadoop吗 hadoop生态系统中的Hive构架 hadoop主要用于什么