图书介绍

Python数据分析实战PDF|Epub|txt|kindle电子书版本下载

Python数据分析实战
  • 吕云翔,李伊琳,张雅素等编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302518389
  • 出版时间:2019
  • 标注页数:186页
  • 文件大小:16MB
  • 文件页数:196页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python数据分析实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据分析是什么1

1.1海量数据背后蕴藏的知识1

1.2数据分析与数据挖掘的关系2

1.3机器学习与数据分析的关系2

1.4数据分析的基本步骤2

1.5 Python和数据分析3

第2章 Python——从了解Python开始5

2.1 Python的发展史5

2.2 Python及Pandas、scikit-learn、Matplotlib的安装6

2.2.1 Windows环境下Python的安装6

2.2.2 Mac环境下Python的安装6

2.2.3 Pandas、scikit-learn和Matplotlib的安装7

2.2.4使用科学计算发行版Python进行快速安装7

2.3 Python基础知识8

2.3.1缩进很重要9

2.3.2模块化的系统9

2.3.3注释10

2.3.4语法10

2.4重要的Python库11

2.4.1 Pandas11

2.4.2 scikit-learn11

2.4.3 Matplotlib11

2.4.4其他11

2.5 Jupyter12

第3章 数据预处理——不了解数据一切都是空谈14

3.1了解数据15

3.2数据质量17

3.2.1完整性18

3.2.2一致性18

3.2.3准确性19

3.2.4及时性20

3.3数据清洗20

3.4特征工程22

3.4.1特征选择22

3.4.2特征构建23

3.4.3特征提取23

第4章 NumPy——数据分析基础工具25

4.1多维数组对象ndarray26

4.1.1 ndarray的创建26

4.1.2 ndarray的数据类型29

4.2 ndarray的索引、切片和迭代29

4.3 ndarray的shape的操作32

4.4 ndarray的基础操作32

第5章 Pandas——处理结构化数据35

5.1基本数据结构36

5.1.1 Series36

5.1.2 DataFrame38

5.2基于Pandas的Index对象的访问操作45

5.2.1 Pandas的Index对象45

5.2.2索引的不同访问方式48

5.3数学统计和计算工具52

5.3.1统计函数:协方差、相关系数、排序52

5.3.2窗口函数54

5.4数学聚合和分组运算60

5.4.1 agg()函数的聚合操作63

5.4.2 transform()函数的转换操作64

5.4.3使用apply()函数实现一般的操作65

第6章 数据分析与知识发现——一些常用的方法67

6.1分类分析67

6.1.1逻辑回归68

6.1.2线性判别分析68

6.1.3支持向量机69

6.1.4决策树70

6.1.5 K近邻71

6.1.6朴素贝叶斯72

6.2关联分析72

6.2.1基本概念72

6.2.2典型算法74

6.3聚类分析80

6.3.1 K均值算法80

6.3.2 DBSCAN81

6.4回归分析82

6.4.1线性回归分析83

6.4.2支持向量回归84

6.4.3 K近邻回归84

第7章 scikit-learn——实现数据的分析85

7.1分类方法85

7.1.1 Logistic回归85

7.1.2 SVM87

7.1.3 Nearest neighbors88

7.1.4 Decision Tree89

7.1.5随机梯度下降90

7.1.6高斯过程分类91

7.1.7神经网络分类(多层感知器)91

7.1.8朴素贝叶斯示例92

7.2回归方法93

7.2.1最小二乘法93

7.2.2岭回归94

7.2.3 Lasso94

7.2.4贝叶斯岭回归95

7.2.5决策树回归96

7.2.6高斯过程回归96

7.2.7最近邻回归97

7.3聚类方法98

7.3.1 K-means98

7.3.2 Affinity propagation100

7.3.3 Mean-shift101

7.3.4 Spectral clustering101

7.3.5 Hierarchical clustering102

7.3.6 DBSCAN103

7.3.7 Birch104

第8章 Matplotlib——交互式图表绘制106

8.1基本布局对象106

8.2图表样式的修改以及装饰项接口111

8.3基础图表的绘制116

8.3.1直方图116

8.3.2散点图118

8.3.3饼图119

8.3.4柱状图120

8.3.5折线图125

8.3.6表格126

8.3.7不同坐标系下的图像127

8.4 matplot3D128

8.5 Matplotlib与Jupyter结合130

第9章 实例:科比职业生涯进球分析134

9.1预处理134

9.2分析科比的命中率138

9.3分析科比的投篮习惯155

第10章 实例:世界杯162

10.1数据说明162

10.2世界杯观众164

10.3世界杯冠军170

10.4世界杯参赛队伍与比赛173

10.5世界杯进球180

参考文献185

热门推荐