Preface 前言

为什么写这本书

在多年数据分析从业经历和微信公众号创作经历中,我接触过很多对数据分析感兴趣的朋友,他们有的想要入门但还没有行动,有的跟着教程开始自学,有的已经有了一定的经验。我发现,大家在数据分析的学习与实践过程中会遇到一些共性问题。这些问题,有与数据分析技能和思维相关的,例如:

❑Excel已经无法处理现有的数据量了,我应该换什么工具?

❑我学习了一大堆Pandas资料,可为什么到实际处理数据时仍然无从下手?

❑我跟着公开数据分析案例练了很久,为什么当自己面对数据需求时还是没有分析思路?

❑我学了对比、细分、聚类分析,也会用PEST、波特五力和杜邦这类分析方法,为什么面试的时候总被认为思路过于简单?

也有与业务场景相关的,例如指标波动归因分析、市场行业机会分析、用户分层研究、购物篮关联分析等。

这些问题对于我来说可谓既“痛”又“痒”:“痛”在于我也曾受相关问题困扰,深知要解决它们需要投入大量的精力,也可能会走很多弯路;“痒”是因为我基于多年的实战和分享经验,经过许多个日日夜夜,总结了一套技能+思维、理论+实践的数据分析学习方法,不分享出来心痒难耐。

我希望通过本书,把我对于Python数据分析的所知、所思、所感,结合电商实际案例系统地分享给大家。特别要说明的是,之所以选择电商场景,主要有两个原因:

❑基于自身多年的电商从业经验,我可以从最熟悉的场景出发,提供最贴近实战的数据,让Pandas更加契合具体业务场景,把案例讲通讲透,解决数据分析技能与分析脱节、分析案例不够深入的问题。

❑电商是一个很容易理解且十分常见的商业模式,其中人、货、场分析大框架非常具有代表性,尤其是“人”的维度,追本溯源,就是解决如何选择用户,如何评估拉新、留存效果,如何对用户进行分类等常见问题。可见,电商的本质分析方法论适用的行业和场景广阔。

我相信,Python数据分析与电商相结合一定会闪烁出更为耀眼的光芒,帮助读者在数据分析的道路上走得更远。

本书读者对象

本书适用于每一位想要提升Python数据分析和实战能力的读者,读完本书并跟着案例练习后,读者将能够熟练运用Pandas进行数据分析,大大提升数据处理和分析的效率。本书同样适用于想要了解电商行业和想进一步熟悉电商实战案例的读者,书中详尽的案例和代码可以帮助读者更好地解决实际业务问题。

本书特色

以实用为纲,聚焦重点。实际上,大部分Excel高手使用的高频功能不到Excel全部功能的20%,Python数据分析领域也是如此。本书基于一线实践经验,去繁就简,专注于那些能够解决绝大部分问题的重点模块。

层层递进,实战案例丰富。本书基础内容只有6章,旨在帮助大家快速熟悉Pandas操作。核心内容是8章实战案例,从报表自动化到行业机会分析,再到用户分层分析、用户分群分析、用户偏好分析、指标波动归因分析等,最后到一个完整的品牌分析案例。这些案例由浅入深,都是从实战中萃取的,涵盖Pandas数据处理和分析的大部分场景,跟着操作一遍,你的Pandas技能和分析思维都会大大提升。

本书主要内容

为了实现技能与思维、理论与实践相结合的目标,我选择了以Python数据分析中最常用的Pandas为切入点,围绕电商场景,用一个个详尽的案例把技能和思维抽丝剥茧般地完整呈现出来。

本书共15章,主要内容如下。

第1~6章 数据分析基础

主要帮助读者快速熟悉Pandas,内容包括Python数据分析基础知识、Pandas入门操作,以及实际分析工作中最常用的增、删、选、改操作和可视化等技巧,覆盖了80%以上的应用场景。

第7~15章 数据分析实战

聚焦于Pandas在电商场景中的应用。第7章讲解电商基础知识,包括电商的商业逻辑、常用指标体系和经典的分析模型。第8~15章用8个实战案例详细讲解报表自动化、行业机会分析、用户分层分析、用户分群分析、用户偏好分析、同期群分析、指标波动归因分析以及一份全面的品牌分析报告的产生过程。每一章都既有案例背景,也有脱敏的实战数据源,更有详细的操作代码和分析思路。

本书配套资源

关注我的微信公众号“数据不吹牛”并回复“配套资料”即可获取我为本书精心准备的以下配套资源。

❑书中所有练习和案例的相关数据集。

❑所有项目的完整案例代码。

❑拓展学习资源(Python基础教程、分析方法论等)。

❑社群学习答疑和勘误信息。

致谢

感谢我的父母,是他们给了我生命和受教育的机会。

感谢韩冬冬在我创作过程中给了我莫大的鼓舞。

感谢朱婉文、蔡勇辉、郭琳依、陈小妹、朱小五、张俊红、黄佳、纪明轩、张小莉等朋友在我创作过程中给了我宝贵的建议。

最后,感谢我的粉丝和读者,是他们的陪伴与支持让我有了持续创作和分享的动力。