图书介绍

scikit learn机器学习 常用算法原理及编程实战PDF|Epub|txt|kindle电子书版本下载

scikit learn机器学习 常用算法原理及编程实战
  • 黄永昌编著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111590249
  • 出版时间:2018
  • 标注页数:208页
  • 文件大小:85MB
  • 文件页数:221页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

scikit learn机器学习 常用算法原理及编程实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 机器学习介绍1

1.1什么是机器学习1

1.2机器学习有什么用2

1.3机器学习的分类3

1.4机器学习应用开发的典型步骤4

1.4.1数据采集和标记4

1.4.2数据清洗5

1.4.3特征选择5

1.4.4模型选择5

1.4.5模型训练和测试5

1.4.6模型性能评估和优化5

1.4.7模型使用6

1.5复习题6

第2章 Python机器学习软件包7

2.1开发环境搭建7

2.2 IPython简介8

2.2.1 IPython基础8

2.2.2 IPython图形界面13

2.3 Numpy简介15

2.3.1 Numpy数组15

2.3.2 Numpy运算19

2.4 Pandas简介32

2.4.1基本数据结构32

2.4.2数据排序34

2.4.3数据访问34

2.4.4时间序列36

2.4.5数据可视化36

2.4.6文件读写38

2.5 Matplotlib简介38

2.5.1图形样式38

2.5.2图形对象40

2.5.3画图操作46

2.6 scikit-learn简介51

2.6.1 scikit-learn示例51

2.6.2 scikit-learn一般性原理和通用规则55

2.7复习题56

2.8拓展学习资源57

第3章 机器学习理论基础58

3.1过拟合和欠拟合58

3.2成本函数59

3.3模型准确性60

3.3.1模型性能的不同表述方式61

3.3.2交叉验证数据集61

3.4学习曲线62

3.4.1实例:画出学习曲线62

3.4.2过拟合和欠拟合的特征65

3.5算法模型性能优化65

3.6查准率和召回率66

3.7 F1 Score67

3.8复习题67

第4章 k-近邻算法69

4.1算法原理69

4.1.1算法优缺点69

4.1.2算法参数70

4.1.3算法的变种70

4.2示例:使用k-近邻算法进行分类70

4.3示例:使用k-近邻算法进行回归拟合72

4.4实例:糖尿病预测74

4.4.1加载数据74

4.4.2模型比较75

4.4.3模型训练及分析77

4.4.4特征选择及数据可视化78

4.5拓展阅读80

4.5.1如何提高k-近邻算法的运算效率80

4.5.2相关性测试80

4.6复习题81

第5章 线性回归算法83

5.1算法原理83

5.1.1预测函数83

5.1.2成本函数84

5.1.3梯度下降算法84

5.2多变量线性回归算法86

5.2.1预测函数86

5.2.2成本函数87

5.2.3梯度下降算法88

5.3模型优化89

5.3.1多项式与线性回归89

5.3.2数据归一化89

5.4示例:使用线性回归算法拟合正弦函数90

5.5示例:测算房价92

5.5.1输入特征92

5.5.2模型训练93

5.5.3模型优化94

5.5.4学习曲线95

5.6拓展阅读96

5.6.1梯度下降迭代公式推导96

5.6.2随机梯度下降算法96

5.6.3标准方程97

5.7复习题97

第6章 逻辑回归算法98

6.1算法原理98

6.1.1预测函数98

6.1.2判定边界99

6.1.3成本函数100

6.1.4梯度下降算法102

6.2多元分类102

6.3正则化103

6.3.1线性回归模型正则化103

6.3.2逻辑回归模型正则化104

6.4算法参数104

6.5实例:乳腺癌检测106

6.5.1数据采集及特征提取106

6.5.2模型训练108

6.5.3模型优化110

6.5.4学习曲线111

6.6拓展阅读113

6.7复习题114

第7章 决策树115

7.1算法原理115

7.1.1信息增益116

7.1.2决策树的创建119

7.1.3剪枝算法120

7.2算法参数121

7.3实例:预测泰坦尼克号幸存者122

7.3.1数据分析122

7.3.2模型训练123

7.3.3优化模型参数124

7.3.4模型参数选择工具包127

7.4拓展阅读130

7.4.1熵和条件熵130

7.4.2决策树的构建算法130

7.5集合算法131

7.5.1自助聚合算法Bagging131

7.5.2正向激励算法boosting131

7.5.3随机森林132

7.5.4 ExtraTrees算法133

7.6复习题133

第8章 支持向量机134

8.1算法原理134

8.1.1大间距分类算法134

8.1.2松弛系数136

8.2核函数138

8.2.1最简单的核函数138

8.2.2相似性函数140

8.2.3常用的核函数141

8.2.4核函数的对比142

8.3 scikit-learn里的SVM144

8.4实例:乳腺癌检测146

8.5复习题149

第9章 朴素贝叶斯算法151

9.1算法原理151

9.1.1贝叶斯定理151

9.1.2朴素贝叶斯分类法152

9.2一个简单的例子153

9.3概率分布154

9.3.1概率统计的基本概念154

9.3.2多项式分布155

9.3.3高斯分布158

9.4连续值的处理159

9.5实例:文档分类160

9.5.1获取数据集160

9.5.2文档的数学表达161

9.5.3模型训练163

9.5.4模型评价165

9.6复习题167

第10章 PCA算法168

10.1算法原理168

10.1.1数据归一化和缩放169

10.1.2计算协方差矩阵的特征向量169

10.1.3数据降维和恢复170

10.2 PCA算法示例171

10.2.1使用Numpy模拟PCA计算过程171

10.2.2使用skleam进行PCA降维运算173

10.2.3 PCA的物理含义174

10.3 PCA的数据还原率及应用175

10.3.1数据还原率175

10.3.2加快监督机器学习算法的运算速度176

10.4实例:人脸识别176

10.4.1加载数据集176

10.4.2一次失败的尝试179

10.4.3使用PCA来处理数据集182

10.4.4最终结果185

10.5拓展阅读189

10.6复习题189

第11章 k-均值算法190

11.1算法原理190

11.1.1 k-均值算法成本函数191

11.1.2随机初始化聚类中心点191

11.1.3选择聚类的个数192

11.2 scikit-learn里的k-均值算法192

11.3使用k-均值对文档进行聚类分析195

11.3.1准备数据集195

11.3.2加载数据集196

11.3.3文本聚类分析197

11.4聚类算法性能评估200

11.4.1 Adjust Rand Index200

11.4.2齐次性和完整性201

11.4.3轮廓系数203

11.5复习题204

后记205

热门推荐