2分钟读懂大数据框架Hadoop和Spark的异同

如题所述

推荐答案 2017-08-08

Hadoop和Spark都是集群并行计算框架，都可以做分布式计算，它们都基于MapReduce并行模型。

Hadoop基于磁盘计算，只有map和reduce两种算子，它在计算过程中会有大量中间结果文件落地磁盘，这会显著降低运行效率。

而Spark基于内存计算（一个task会在一个分片上以流水线的形式执行，中间不会再分配内存，避免内存被快速用完），非常适合做机器学习中的迭代计算（可以通过将RDD缓存在内存中）；同时它提供非常多的算子（flatMap、reduceByKey、join等等），方便我们开发；另外，Spark提供一站式的数据分析工具，包括流计算的Streaming，图计算的GraghX，数据仓库的Spark SQL和机器学习的MlLib。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/IRGGcQcIIc44cLIQRF4.html

相似回答

2分钟读懂大数据框架Hadoop和Spark的异同答：Hadoop和Spark都是集群并行计算框架，都可以做分布式计算，它们都基于MapReduce并行模型。Hadoop基于磁盘计算，只有map和reduce两种算子，它在计算过程中会有大量中间结果文件落地磁盘，这会显著降低运行效率。而Spark基于内存计算（一个task会在一个分片上以流水线的形式执行，中间不会再分配内存，避免内存被快...

2分钟读懂大数据框架Hadoop和Spark的异同答：虽 Spark 与 Hadoop 相似处提供具用差异新集群计算框架首先Spark 集群计算特定类型工作负载设计即些并行操作间重用工作数据集（比机器习算）工作负载优化些类型工作负载Spark 引进内存集群计算概念内存集群计算数据集缓存内存缩短访问延迟.数据处理面相信家hadoop已经耳熟能详基于GoogleMap/Reduce实现Hadoop发者提...

2分钟读懂大数据框架Hadoop和Spark的异同答：首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施:它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储，意味着您不需要购买和维护昂贵的服务器硬件。同时，Hadoop还会索引和跟踪这些数据，让大数据处理和分析效率达到前...

2分钟读懂Hadoop和Spark的异同答：解决问题的层面不一样 首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储，意味着您不需要购买和维护昂贵的服务器硬件。同时，Hadoop还会索引和跟踪这些数据，让...

大家正在搜

hadoop大数据框架大数据5大框架大数据分析框架 java大数据框架 golang 大数据框架 python 大数据处理框架大数据基本分析框架主要包括大数据的三种数据结构大数据框架是什么