关注后回复“资料” , 即可免费获取Excel相关学习和实战资料 。如果你也对数据分析感兴趣,并且想在这方面有所发展,无论是方法还是技术,例如Excel、VBA、SQL、Python,特别是Excel相关,欢迎与我交流 。如果有这方面的问题或者困惑,也欢迎与我探讨 。

对于任何一个数据统计和分析者来说,数据的来源有很多,例如公司的数据库(包括使用SQL等语句查询的数据或者公司业务数据平台的数据等)、同事提供的数据、网站爬取的数据、从外部购买的数据等等 。
对于任何数据源的准确性 , 都要保持一定的怀疑态度,因为数据源的准确性是后续一切工作的基石,包括后续的数据处理、模型构建、关键决策都是建立在最初的数据源之上的 。如果说数据源本身有问题,那么后续的一切都是有待商榷的,或者都是错误的 。
数据源出问题的原因有很多,针对不同渠道的数据,出问题的原因也不尽相同,例如零售新旧业务系统升级的时候 , 系统与系统之间没有衔接好 , 对于终端实际的使用人员没有进行及时和全面的培训,都有可能会造成数据的重复和缺失 。同事在汇总数据时,将同一份数据进行了重复汇总,或者在复制粘贴的时候行列错位,例如将实际成交价格和原始吊牌价格颠倒 。
所以在数据处理之前,要对收到的数据做核查,而核查就要确定核查优先级和核查标准 。数据可能有很多,核查的优先级就是优先对核心指标进行核查,例如零售中的单日流水、折扣、成交笔数、客单价等 。再有就是找到核查标准 , 能够去检验当前的数据准确性,这个核查标准主要就是历史数据和业务认知 。历史数据 , 例如同期的数据、上周或者上月的数据,也可以直接查看同比和环比的结果来观察数据波动 。业务认知,在不看数据之前已经知晓已有的业务决策,例如同样是节假日,两年的活动不同,一年是打折促销,一年是赠送礼品,或者同期过季产品很多,做了大量过季产品的处理,导致核心指标变化较大 。
将已有的业务认知和历史数据相结合,才能对数据做出更精准的判断 。再有就是一些细节上的观察,例如文字描述和图片数据不符 。同样,我们在为他人提供数据之前,也要为提供的数据把好关 , 因为那不止会影响后续的一些列工作,还有我们自身的价值体现以及他人对我们的信任感 。
推荐阅读:
VBA 代码繁杂 , 如何一招化繁为简
【数据分析的基石】同事又发来了图片数据,如何提取汇总?
