本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。
第2版中的主要更新包括:
• 所有的代码,包括把Python的教程更新到了Python 3.6版本(第1版中使用的是Python 2.7)
• 更新了Python第三方发布版Anaconda和其他所需Python包的安装指引
• 更新pandas库到2017年的新版
• 新增一章,关于更多高级pandas工具和一些使用提示
• 新增statsmodels和scikit-learn的简明使用介绍
目录
第1章 准备工作7
第2章 Python语言基础、IPython及Jupyter notebook20
第3章 内建数据结构、函数及文件54
第4章 NumPy基础:数组与向量化计算87
第5章 pandas入门123
第6章 数据载入、存储及文件格式165
第7章 数据清洗与准备188
第8章 数据规整:连接、联合与重塑216
第9章 绘图与可视化245
第10章 数据聚合与分组操作274
第11章 时间序列303
第12章 高阶pandas346
第13章 Python建模库介绍364
第14章 数据分析示例382