“大数据架构”用哪种框架更为合适？

如题所述

推荐答案 2022-12-14

个完整的大数据平台应该提供离线计算、即席查询、实时计算、实时查询这几个方面的功能。
hadoop、spark、storm无论哪一个，单独不可能完成上面的所有功能。

hadoop+spark+hive是一个很不错的选择.hadoop的HDFS毋庸置疑是分布式文件系统的解决方案，解决存储问题；hadoopmapreduce、hive、sparkapplication、sparkSQL解决的是离线计算和即席查询的问题；sparkstreaming解决的是实时计算问题；另外，还需要HBase或者Redis等NOSQL技术来解决实时查询的问题。

除了这些，大数据平台中必不可少的需要任务调度系统和数据交换工具；
任务调度系统解决所有大数据平台中的任务调度与监控；数据交换工具解决其他数据源与HDFS之间的数据传输，比如：数据库到HDFS、HDFS到数据库等等。关于大数据平台的架构技术文章，可搜索"lxw的大数据田地"，里面有很多。

大数据是什么意思：

麦肯锡全球研究所给出的定义是：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

大数据技术的战略意义不在于掌握庞大的数据信息，而在于对这些含有意义的数据进行专业化处理。换而言之，如果把大数据比作一种产业，那么这种产业实现盈利的关键，在于提高对数据的“加工能力”，通过“加工”实现数据的“增值”。从技术上看，大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理，必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

随着云时代的来临，大数据（Bigdata）也吸引了越来越多的关注。大数据（Bigdata）通常用来形容一个公司创造的大量非结构化数据和半结构化数据，这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起，因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理（MPP）数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/GFRcGI4e4RFL8eFILG.html

相似回答

大数据开发框架有哪些答：1. Hadoop Hadoop是一个开源的大数据处理框架，主要用于处理和分析大规模数据集。它提供了分布式文件系统和MapReduce编程模型，可以处理海量数据的存储和计算需求。Hadoop的分布式架构使得它能够处理数千个节点的集群环境，广泛应用于大数据处理和分析领域。2. Spark Apache Spark是另一个流行的大数据处理框架。...

大数据开发必用的分布式框架有哪些答：HDFS具有高容错性，并设计用来部署在低廉硬件上。它提供高传输速率以访问应用程序的数据，适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求，以支持流式访问文件系统中的数据。3. Dubbo Dubbo是阿里巴巴开源的一个分布式服务框架，致力于提供高性能、透明化的RPC远程服务调用方案，以及SOA服务治理方...

五种大数据处理架构答：3. 混合框架：Apache Spark - 特点：同时支持批处理和流处理，提供内存计算和优化机制。- 优势：速度快，支持多种任务类型，生态系统完善。- 局限：流处理采用微批架构，对延迟要求高的场景可能不适用。4. 仅批处理框架：Apache Samza - 特点：与Apache Kafka紧密集成，适用于流处理工作负载。- 优势：...

大数据框架有哪些答：大数据框架主要有以下几种：Hadoop Hadoop是Apache软件基金会所开发的一个开源大数据框架，它提供了一个分布式系统基础架构，允许开发者在集群上处理大规模数据。其核心组件包括分布式文件系统HDFS、MapReduce编程模型和HBase数据库等。Hadoop主要用于数据存储和处理，解决了大数据的存储和管理问题。Spark Apache ...

大数据架构究竟用哪种框架更为合适答：大数据架构究竟用哪种框架更为合适 以现在的趋势,hadoop,spark,storm,哪个更适合未来的大数据架构,尽量详细的说明,请不要从网上复制粘贴,谢谢从网上还有的是学习hadoop+spark,不知道这三个究竟怎么学我的方向是... 以现在的趋势,hadoop,spark,storm,哪个更适合未来的大数据架构,尽量详细的说明,请不要从网上复制...

大家正在搜

数据架构技术架构应用架构哪个大数据架构好架构和构架哪个正确大数据架构技术大数据架构前端大数据中心架构架构与构架框架还是框架数据架构