在大数据分析/挖掘领域,哪些编程语言应用最多

如题所述

在大数据分析/挖掘领域,编程语言目前应用最多的应该是Python。Python并不简单,除了数据分析及挖掘,Python还被广泛运用到数据爬取、产品开发等领域。

那么,Python究竟有什么样的优势,能受到这么多人的追捧呢?在我看来,主要有三大优势:

1、强大的第三方库支持

Python可以支持包括Numpy、Pandas、Matplotlib及Sklearn等第三方库。这些库能极大的提高你的数据清洗及处理能力,尤其是Pandas。

利用Pandas,你可以极其方便的完成数据读取、重复值处理、数据哑变量化等操作,此外利用Sklearn,还可以简单的完成看似很高大上的机器学习算法。

2、支持数据全流程的操作

其实这点和第一点是相互呼应的,恰恰是因为强大的第三方库的支持,使得Python可以支持全流程的数据工作,具体包括数据的采集、数据的导入、数据的清洗与可视化操作等。让你使用一种语言,就完成这些操作,是不是非常心动呢?

3、相对大体量的处理能力

Python相对于Excel有着非常庞大的数据处理能力,Excel由于自身限制,只能处理105万行的数据,而另外风头很盛的R,数据量级上也逊色于Python。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-08-19
一般来详说做数据分析挖掘每种编程语言基本都能做。
做分析方面R语言是强项。
数据可视化是Matlab。
但是挖数据要做爬虫,这个又会用到Java和Python
Python是个全能,在分析方面有Numpy,Scipy等数据分析库,又有很多爬虫库,还有matplotlib的库把数据可视化。本回答被提问者采纳
相似回答