《Python数据分析与数据化运营第2版》第一部分(第1~4章)介绍了Python数据分析和挖掘的基本知识,包括Python数据获取、预处理、分析和挖掘的关键技术和经验。其中包含11条数据预处理经验、39个数据预处理知识点和14个数据分析和挖掘的建模主题。该书还提供了PDF+源代码数据,共570页,内容可复制。作者是宋天龙,配套代码和数据。
《Python数据分析与数据化运营第2版》第二部分(第5~9章)详细讲解了会员运营、商品运营、流量运营和内容运营四大主题,以及提升数据化运营价值的方法。每个运营主题都包含了基本知识、评估指标、应用场景、数据分析模型、数据分析小技巧、数据分析大实话以及两个综合性的应用案例。此外,该书还介绍了在分析挖掘时用到的KMeans聚类的自动K均值确立方法、基于软方法的多分类模型组合评估模型的应用、基于自动下探(下钻、细分)的应用以及基于增量学习的多项式贝叶斯分类等重要且实用的方法。
关于如何选择分类算法,书中提到了一些常见的分类算法,如:防止决策树过拟合的SVM L2正则最小化,准确性高的向量机、随机森林和神经网络,以及可解释性强的决策树。