图书介绍
scikit learn机器学习 常用算法原理及编程实战PDF|Epub|txt|kindle电子书版本下载
![scikit learn机器学习 常用算法原理及编程实战](https://www.shukui.net/cover/77/34574387.jpg)
- 黄永昌编著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111590249
- 出版时间:2018
- 标注页数:208页
- 文件大小:85MB
- 文件页数:221页
- 主题词:
PDF下载
下载说明
scikit learn机器学习 常用算法原理及编程实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 机器学习介绍1
1.1什么是机器学习1
1.2机器学习有什么用2
1.3机器学习的分类3
1.4机器学习应用开发的典型步骤4
1.4.1数据采集和标记4
1.4.2数据清洗5
1.4.3特征选择5
1.4.4模型选择5
1.4.5模型训练和测试5
1.4.6模型性能评估和优化5
1.4.7模型使用6
1.5复习题6
第2章 Python机器学习软件包7
2.1开发环境搭建7
2.2 IPython简介8
2.2.1 IPython基础8
2.2.2 IPython图形界面13
2.3 Numpy简介15
2.3.1 Numpy数组15
2.3.2 Numpy运算19
2.4 Pandas简介32
2.4.1基本数据结构32
2.4.2数据排序34
2.4.3数据访问34
2.4.4时间序列36
2.4.5数据可视化36
2.4.6文件读写38
2.5 Matplotlib简介38
2.5.1图形样式38
2.5.2图形对象40
2.5.3画图操作46
2.6 scikit-learn简介51
2.6.1 scikit-learn示例51
2.6.2 scikit-learn一般性原理和通用规则55
2.7复习题56
2.8拓展学习资源57
第3章 机器学习理论基础58
3.1过拟合和欠拟合58
3.2成本函数59
3.3模型准确性60
3.3.1模型性能的不同表述方式61
3.3.2交叉验证数据集61
3.4学习曲线62
3.4.1实例:画出学习曲线62
3.4.2过拟合和欠拟合的特征65
3.5算法模型性能优化65
3.6查准率和召回率66
3.7 F1 Score67
3.8复习题67
第4章 k-近邻算法69
4.1算法原理69
4.1.1算法优缺点69
4.1.2算法参数70
4.1.3算法的变种70
4.2示例:使用k-近邻算法进行分类70
4.3示例:使用k-近邻算法进行回归拟合72
4.4实例:糖尿病预测74
4.4.1加载数据74
4.4.2模型比较75
4.4.3模型训练及分析77
4.4.4特征选择及数据可视化78
4.5拓展阅读80
4.5.1如何提高k-近邻算法的运算效率80
4.5.2相关性测试80
4.6复习题81
第5章 线性回归算法83
5.1算法原理83
5.1.1预测函数83
5.1.2成本函数84
5.1.3梯度下降算法84
5.2多变量线性回归算法86
5.2.1预测函数86
5.2.2成本函数87
5.2.3梯度下降算法88
5.3模型优化89
5.3.1多项式与线性回归89
5.3.2数据归一化89
5.4示例:使用线性回归算法拟合正弦函数90
5.5示例:测算房价92
5.5.1输入特征92
5.5.2模型训练93
5.5.3模型优化94
5.5.4学习曲线95
5.6拓展阅读96
5.6.1梯度下降迭代公式推导96
5.6.2随机梯度下降算法96
5.6.3标准方程97
5.7复习题97
第6章 逻辑回归算法98
6.1算法原理98
6.1.1预测函数98
6.1.2判定边界99
6.1.3成本函数100
6.1.4梯度下降算法102
6.2多元分类102
6.3正则化103
6.3.1线性回归模型正则化103
6.3.2逻辑回归模型正则化104
6.4算法参数104
6.5实例:乳腺癌检测106
6.5.1数据采集及特征提取106
6.5.2模型训练108
6.5.3模型优化110
6.5.4学习曲线111
6.6拓展阅读113
6.7复习题114
第7章 决策树115
7.1算法原理115
7.1.1信息增益116
7.1.2决策树的创建119
7.1.3剪枝算法120
7.2算法参数121
7.3实例:预测泰坦尼克号幸存者122
7.3.1数据分析122
7.3.2模型训练123
7.3.3优化模型参数124
7.3.4模型参数选择工具包127
7.4拓展阅读130
7.4.1熵和条件熵130
7.4.2决策树的构建算法130
7.5集合算法131
7.5.1自助聚合算法Bagging131
7.5.2正向激励算法boosting131
7.5.3随机森林132
7.5.4 ExtraTrees算法133
7.6复习题133
第8章 支持向量机134
8.1算法原理134
8.1.1大间距分类算法134
8.1.2松弛系数136
8.2核函数138
8.2.1最简单的核函数138
8.2.2相似性函数140
8.2.3常用的核函数141
8.2.4核函数的对比142
8.3 scikit-learn里的SVM144
8.4实例:乳腺癌检测146
8.5复习题149
第9章 朴素贝叶斯算法151
9.1算法原理151
9.1.1贝叶斯定理151
9.1.2朴素贝叶斯分类法152
9.2一个简单的例子153
9.3概率分布154
9.3.1概率统计的基本概念154
9.3.2多项式分布155
9.3.3高斯分布158
9.4连续值的处理159
9.5实例:文档分类160
9.5.1获取数据集160
9.5.2文档的数学表达161
9.5.3模型训练163
9.5.4模型评价165
9.6复习题167
第10章 PCA算法168
10.1算法原理168
10.1.1数据归一化和缩放169
10.1.2计算协方差矩阵的特征向量169
10.1.3数据降维和恢复170
10.2 PCA算法示例171
10.2.1使用Numpy模拟PCA计算过程171
10.2.2使用skleam进行PCA降维运算173
10.2.3 PCA的物理含义174
10.3 PCA的数据还原率及应用175
10.3.1数据还原率175
10.3.2加快监督机器学习算法的运算速度176
10.4实例:人脸识别176
10.4.1加载数据集176
10.4.2一次失败的尝试179
10.4.3使用PCA来处理数据集182
10.4.4最终结果185
10.5拓展阅读189
10.6复习题189
第11章 k-均值算法190
11.1算法原理190
11.1.1 k-均值算法成本函数191
11.1.2随机初始化聚类中心点191
11.1.3选择聚类的个数192
11.2 scikit-learn里的k-均值算法192
11.3使用k-均值对文档进行聚类分析195
11.3.1准备数据集195
11.3.2加载数据集196
11.3.3文本聚类分析197
11.4聚类算法性能评估200
11.4.1 Adjust Rand Index200
11.4.2齐次性和完整性201
11.4.3轮廓系数203
11.5复习题204
后记205