图书介绍
Python机器学习 5个数据科学家案例解析PDF|Epub|txt|kindle电子书版本下载
![Python机器学习 5个数据科学家案例解析](https://www.shukui.net/cover/16/31385794.jpg)
- (美)达西·哈龙著;潘海为,张春新译 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302508915
- 出版时间:2018
- 标注页数:183页
- 文件大小:18MB
- 文件页数:202页
- 主题词:软件工具-程序设计
PDF下载
下载说明
Python机器学习 5个数据科学家案例解析PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 统计与概率1
1.1 案例研究:自行车共享计划——确定品牌角色1
1.2 进行探索性数据分析3
1.2.1 特征探索4
1.2.2 变量的类型5
1.2.3 单变量分析8
1.2.4 多变量分析12
1.2.5 时间序列成分15
1.3 度量测度中心17
1.3.1 平均数17
1.3.2 中位数18
1.3.3 众数19
1.3.4 方差19
1.3.5 标准差19
1.3.6 由于常量的存在而导致中心统计度量的变化20
1.3.7 正态分布22
1.4 相关性29
1.4.1 Pearson R相关29
1.4.2 Kendall秩相关29
1.4.3 Spearman秩相关30
1.5 假设检验:比较两组31
1.5.1 t-统计量32
1.5.2 t-分布和样本容量32
1.6 中心极限定理34
1.7 案例研究发现35
1.8 统计和概率的应用36
1.8.1 精算科学36
1.8.2 生物统计学36
1.8.3 天文统计学36
1.8.4 商业分析37
1.8.5 计量经济学37
1.8.6 机器学习37
1.8.7 统计信号处理37
1.8.8 选举37
第2章 回归39
2.1 案例研究:消除混凝土抗压强度的不一致性39
2.2 回归的概念42
2.2.1 内插和外推42
2.2.2 线性回归42
2.2.3 y在x上的最小二乘回归线43
2.2.4 多重回归44
2.2.5 逐步回归45
2.2.6 多项式回归46
2.3 回归的假设47
2.3.1 案例数量47
2.3.2 缺失数据47
2.3.3 多重共线性与奇异性48
2.4 特征探索49
2.5 过拟合和欠拟合55
2.6 回归度量的评估58
2.6.1 解释方差得分58
2.6.2 平均绝对误差58
2.6.3 均方误差59
2.6.4 R259
2.6.5 残差60
2.6.6 残差图60
2.6.7 残差平方和60
2.7 回归的类型61
2.7.1 线性回归61
2.7.2 网格搜索65
2.7.3 岭回归65
2.7.4 套索回归68
2.7.5 ElasticNet70
2.7.6 梯度boosting回归71
2.7.7 支持向量机74
2.8 回归的应用78
2.8.1 预测销售额78
2.8.2 预测债券价值78
2.8.3 通货膨胀率78
2.8.4 保险公司79
2.8.5 呼叫中心79
2.8.6 农业79
2.8.7 预测薪水79
2.8.8 房地产行业80
第3章 时间序列83
3.1 案例研究:预测雅虎的每日调整的收盘价83
3.2 特征探索85
3.3 评估时间序列对象的平稳性86
3.3.1 具有平稳本质的时间序列的性质87
3.3.2 测试以确定时间序列是否平稳87
3.3.3 制作时间序列对象的方法90
3.4 测试以确定时间序列是否具有自相关性100
3.4.1 自相关函数100
3.4.2 偏自相关函数100
3.4.3 度量自相关101
3.4.4 Durbin Watson统计101
3.5 建模时间序列102
3.5.1 验证预测序列的实验102
3.5.2 确定建模参数103
3.6 自回归综合移动平均105
3.6.1 自回归移动平均105
3.6.2 自回归106
3.6.3 移动平均线107
3.6.4 组合模型108
3.7 缩减预测规模109
3.8 时间序列分析应用113
3.8.1 销售预测113
3.8.2 天气预测113
3.8.3 失业率估计113
3.8.4 疾病爆发113
3.8.5 股市预测114
第4章 聚类115
4.1 案例研究:确定营销短尾关键词115
4.2 特征的探索117
4.3 有监督学习与无监督学习118
4.3.1 有监督学习119
4.3.2 无监督学习119
4.4 聚类分析120
4.5 为建模作数据转换120
4.6 聚类模型124
4.6.1 k-means聚类124
4.6.2 将k-means聚类应用于簇的最优数量129
4.6.3 主成分分析130
4.6.4 高斯混合模型137
4.6.5 贝叶斯高斯混合模型142
4.7 聚类的应用144
4.7.1 疾病识别144
4.7.2 搜索引擎中的文档聚类144
4.7.3 基于人口统计的客户划分145
第5章 分类147
5.1 案例研究:俄亥俄州诊所——满足供求147
5.2 特征探究149
5.3 实施数据整理154
5.4 实施探索性数据分析157
5.5 特征的生成162
5.6 分类164
5.6.1 模型评估技术164
5.6.2 二元分类器:受试者工作特征165
5.6.3 决策树分类168
5.7 核近似169
5.7.1 SGD分类器169
5.7.2 集成方法172
5.8 随机森林分类173
5.9 分类应用178
5.9.1 图像分类178
5.9.2 音乐分类178
5.9.3 E-mail的垃圾邮件过滤178
5.9.4 保险179
附录A 图表类型以及何时使用它们181