数据分析的时代已经到来 。从国家,政府 , 企业到个人,大数据和数据分析已成为每个人都熟悉的趋势 。但是您可能没有数据分析和编程的专业知识,或者您已经学习了很多关于数据分析的理论,但您仍然无法实践它 。在这里,我将比较最受数据分析师欢迎的四种工具 , Excel , R,Python和BI,作为开始数据分析的基础 。

1. Excel
1.1使用场景
- 一般办公室要求下的数据处理工作 。
- 中小型企业的数据管理和存储 。
- 对学生或教师进行简单的统计分析(如方差分析,回归分析等) 。
- 结合Word和PowerPoint来创建数据分析报告 。
- 数据分析师的助手工具 。
- 为一些商业杂志和报纸制作图表(数据可视化) 。
- 使用Excel很容易 。
- 学习资源非常丰富 。
- 您可以使用Excel做很多事情:建模 , 可视化,报告,动态图表等 。
- 在进一步学习其他工具(如Python和R)之前,它可以帮助您理解许多操作的含义 。
- 要完全掌握Excel,你需要学习VBA,所以难度仍然很高 。
- 当数据量很大时,就会出现口吃的情况 。
- Excel数据文件本身在没有其他工具的帮助下只能容纳108万行,并且它不适合处理大规模数据集 。
- 内置的统计分析过于简单 , 几乎没有实用价值 。
- 与Python,R和其他开源软件不同,真正的Excel需要付费 。
2.1使用场景
R的功能几乎覆盖了需要数据的任何区域 。就我们的一般数据分析或学术数据分析工作而言,R可以做的事情主要包括以下几个方面 。
- 数据清理和数据缩减 。
- 网页抓取 。
- 数据可视化 。
- 统计假设检验(t检验 , 方差分析,卡方检验等) 。
- 统计建模(线性回归,逻辑回归 , 树模型,神经网络等) 。
- 数据分析报告输出(R降价) 。
从我的角度来看,开始使用R非常简单 。10天的集中学习足以掌握基本用途,基本数据结构,数据导入和导出以及简单的数据可视化 。有了这些基?。蹦龅绞导饰侍馐保?您可以找到您需要使用的R包 。通过阅读R的帮助文件和网络上的信息,您可以相对快速地解决特定问题 。
3. Python
3.1使用场景
- 数据抓取 。
- 数据清理 。
- 数据建模 。
- 根据业务场景和实际问题构建数据分析算法 。
- 数据可视化 。
- 数据挖掘和分析的高级领域,例如机器学习和文本挖掘 。
R和Python都是需要编程的数据分析工具 。不同之处在于R仅用于数据分析领域,而科学计算和数据分析只是Python的应用程序分支 。Python还可用于开发网页,开发游戏,开发系统后端以及执行一些操作和维护工作 。
目前的趋势是Python正在赶上数据分析领域的R. 在某些方面 , 它已超过R,例如机器学习和文本挖掘 。但R仍然在统计领域保持优势 。Python在数据分析中的开发已经在很多地方模拟了R的一些特性 。所以,如果你还是新手,还没有开始学习,我建议你从Python开始 。
Python和R都很容易学习 。但是如果你同时学习两者,那将会非常混乱,因为它们在许多地方非常相似 。所以建议不要同时学习它们 。等到你掌握了其中一个,然后开始学习另一个 。
3.3选择R还是Python?
如果由于时间有限而只能选择其中一个来学习,我建议使用Python 。但我仍然建议你看看两者 。在某些地方你可能会听到Python在工作中更常用 , 但解决问题是最重要的 。如果你可以使用R有效地解决问题,那么使用R.实际上,Python模仿了R的许多功能 , 例如Pandas库中的DataFrames 。正在开发的可视化软件包ggplot模仿了R中非常着名的ggplot2 。
BI
数据分析中有一种说法:文本不如表格好 , 表格不如图表好 。数据可视化是数据分析的主要方向之一 。Excel的图表可以满足基本的图形要求,但这只是基础 。高级可视化需要编程 。除了学习R和Python等编程语言之外,您还可以选择简单易用的BI工具 。有关BI的介绍,您可以阅读我的另一篇文章 , 我应该学习哪些数据分析工具作为数据分析师开始职业生涯?
商业智能诞生于数据分析,它诞生于一个非常高的起点 。目标是缩短从业务数据到业务决策的时间 。它是关于如何使用数据来影响决策 。
【数据分析工具的比较:Excel,R,Python和BI工具】BI的优势在于它在交互和报告方面更胜一筹 。它擅长解释历史数据和实时数据 。它可以极大地解放数据分析师的工作,提升整个公司的数据意识 , 并提高导入数据的效率 。市场上有很多BI产品 。他们的原则是通过连接和钻孔尺寸来构建仪表板,以获得可视化分析 。
