Excel数据透视表:怎样的数据源才是优质数据源?


Excel数据透视表:怎样的数据源才是优质数据源?

【Excel数据透视表:怎样的数据源才是优质数据源?】一份条理清楚,简洁明快的数据报告的背后,都有一份干净整洁数据源作为支持 。如何定义一份数据源为好数据源?应该有以下几个标准:
  • 没有合并单元格:Excel高手们最痛恨的就是合并单元格 。有没有因为学会了合并单元格而觉得Excel非常神奇的同学,做“表格”可以使用合并单元格,但是做数据源表 , 合并单元格是第一大忌;
  • 没有不可见字符:很多系统导出表会额外添加空格补齐字符串长度;手工输入数据,有时也会多一个或几个单元格的情况;或者是其他数据源导入到Excel时,会有些莫名其妙的不可见字符 。这些不可见字符 , 会导致看起来相同的两个字符串,在查询时就是出错查不到 , 或者透视表时会显示成两个项目,导致合计数据出错;
  • 数据格式一致:最常见的格式不一致情况,文本型数值,千奇百怪的非标准日期(例如:小数点分割的),由于格式的不一致,会导致计算结果出错 。
  • 分组一致:举个例子,性别,如果不做严格规定,大家会随意输入,勤快的会输入男性、女性 , 或者男、女,还有用英文简写的M、F , 这就叫做分组不一致,都没错,错在没有统一 。这样的数据源透视时 , 性别会出现六个,结果肯定是有问题的;

Excel数据透视表:怎样的数据源才是优质数据源?


实际情况是 , 我们能够收集到的数据,往往不会完全符合这个标准,或多或少都会有些问题 , 当我们遇到这些问题时,该如何去处理:
  • 合并单元格的处理:其实也挺简单,打散合并 , 定位空白格,填充 。
  • 不可见字符处理:情况就比较复杂,方法也多种多样,有分列法 , 函数法,PQ法,记事本等等,根据难度不同来选择,可以简单先了解 。
  • 数据格式:分列的功能还是很多的 , 其中之一就是用来统一数据格式,当然还有很多其他的统一格式的方法,比如 , *1法,--法等等 。
  • 分组:最常用的就是LOOKUP和VLOOKUP函数,可以建立辅助表,使用函数统一分组 。

Excel数据透视表:怎样的数据源才是优质数据源?


以上可以认为是对数据做了4S整理(整理、整顿、清扫、清洁),得到了相对规整的数据源,但还是会有问题,维度上的问题,应该归纳为一个维度的数据 , 却分成了多个维度(多列),这时候我们需要做降维处理:
  • Power Query降维:强烈推荐使用PQ处理 , 操作简单方便 。
  • 操作法:ALT D P
  • VBA法:不建议使用,也写过代码处理过,但是有更方便的方法 , 就不再用这个方法了 。

Excel数据透视表:怎样的数据源才是优质数据源?


最后要说的是分组,这里的分组,与上面的统一分组讲不是一回事,上面是已经有了分组,分组的名称不统一,要统一名称 。这里讲的分组是创造分组 , 对于已有的维度进行创造分组:
  • 数值分组:因为数值范围很大,我们希望分段统计 , 进行数据分析,这时候 , 我们就要使用LOOKUP函数,对数值进行分段 。
  • 文本分组:同样是城市维度,我们希望按照东北区、华北区进行分组 , 要用到的函数是VLOOKUP 。
  • 日期分组:对于日期维度,天然带有分组,年、月、日,或许你还希望用季度来统计,或者按周统计,需要用到相关的日期函数 , TEXT函数,还有INT、MOD等数学函数 。

Excel数据透视表:怎样的数据源才是优质数据源?


经过上面这些步骤,你就可以开始进行数据透视操作了 , 数据透视操作,比公式法统计的有点在于,公式法是在固定的框架下统计 , 而数据透视,是对数据的一种探索统计,通过不同维度的组合,能出现各种可能的结果,可以对数据从各个维度进行充分的分析 。

相关经验推荐