图书介绍

机器学习 实用技术指南PDF|Epub|txt|kindle电子书版本下载

机器学习 实用技术指南
  • (美)詹森·贝尔(Jason Bell) 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111593379
  • 出版时间:2018
  • 标注页数:302页
  • 文件大小:40MB
  • 文件页数:322页
  • 主题词:机器学习

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

机器学习 实用技术指南PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 什么是机器学习1

1.1 机器学习的历史1

1.1.1 阿兰·图灵1

1.1.2 亚瑟·塞缪尔2

1.1.3 汤姆M.米切尔2

1.1.4 总结定义2

1.2 机器学习的算法类型2

1.2.1 监督学习3

1.2.2 无监督学习3

1.3 人的作用3

1.4 机器学习的用途4

1.4.1 软件4

1.4.2 股票交易4

1.4.3 机器人学5

1.4.4 医学和医疗5

1.4.5 广告业5

1.4.6 零售和电子商务6

1.4.7 游戏分析7

1.4.8 物联网7

1.5 机器学习语言8

1.5.1 Python8

1.5.2 R8

1.5.3 Matlab8

1.5.4 Scala8

1.5.5 Clojure9

1.5.6 Ruby9

1.6 本书使用的软件9

1.6.1 检查Java版本9

1.6.2 Weka工具包9

1.6.3 Mahout10

1.6.4 Spring XD10

1.6.5 Hadoop11

1.6.6 使用集成开发环境11

1.7 数据库11

1.7.1 加州大学欧文分校机器学习库12

1.7.2 Infochimps12

1.7.3 Kaggle12

1.8 总结12

第2章 筹备机器学习13

2.1 机器学习周期13

2.2 以问题为先导13

2.3 缺少数据14

2.3.1 从身边做起14

2.3.2 比赛14

2.4 一劳永逸的解决方案15

2.5 界定机器学习过程15

2.5.1 规划15

2.5.2 开发16

2.5.3 测试16

2.5.4 报告16

2.5.5 精炼16

2.5.6 产品16

2.6 建立数据团队17

2.6.1 数学和统计学17

2.6.2 编程17

2.6.3 图形设计17

2.6.4 行业知识17

2.7 数据处理18

2.7.1 使用个人计算机18

2.7.2 计算机集群18

2.7.3 云服务18

2.8 数据存储19

2.8.1 物理磁盘19

2.8.2 云存储19

2.9 数据隐私19

2.9.1 文化规范19

2.9.2 普遍的期望20

2.9.3 用户数据匿名20

2.9.4 不要穿过“底线”21

2.10 数据质量和清洗21

2.10.1 完整性检测22

2.10.2 类型检测22

2.10.3 长度检测22

2.10.4 范围检测22

2.10.5 格式检测23

2.10.6 进退两难23

2.10.7 国家名内包含的内容26

2.10.8 数值和日期27

2.10.9 有关数据清洗的最后看法28

2.11 思考输入数据28

2.11.1 原始文本28

2.11.2 逗号分隔变量28

2.11.3 JSON29

2.11.4 YAML30

2.11.5 XML31

2.11.6 电子表格32

2.11.7 数据库32

2.11.8 图像33

2.12 考虑输出数据33

2.13 不要害怕实验33

2.14 总结34

第3章 决策树35

3.1 决策树基础35

3.1.1 决策树的用途35

3.1.2 决策树的优点36

3.1.3 决策树的局限36

3.1.4 相关算法类型36

3.1.5 决策树工作原理37

3.2 Weka中的决策树40

3.2.1 需求40

3.2.2 训练数据41

3.2.3 使用Weka创建决策树42

3.2.4 为分类器生成Java代码46

3.2.5 测试分类器代码49

3.2.6 进一步的思考51

3.3 总结51

第4章 贝叶斯网络52

4.1 从飞行员到回形针52

4.2 图论53

4.3 概率论54

4.3.1 投掷硬币54

4.3.2 条件概率54

4.3.3 赌博中获胜54

4.4 贝叶斯定理55

4.5 贝叶斯网络原理57

4.5.1 赋值57

4.5.2 计算结果58

4.6 节点的个数59

4.7 利用领域专家的信息59

4.8 贝叶斯网络演练59

4.8.1 贝叶斯网络中的Java API60

4.8.2 设计网络60

4.8.3 编程61

4.9 总结69

第5章 人工神经网络70

5.1 什么是神经网络70

5.2 人工神经网络的应用71

5.2.1 高频交易71

5.2.2 信用分析71

5.2.3 数据中心管理71

5.2.4 机器人72

5.2.5 药效监控72

5.3 人工神经网络分解72

5.3.1 感知机72

5.3.2 激活函数73

5.3.3 多层感知机74

5.3.4 后向传播算法75

5.4 人工神经网络的数据准备76

5.5 Weka中的人工神经网络76

5.5.1 新建数据集76

5.5.2 将数据载入Weka中78

5.5.3 配置多层感知机79

5.5.4 训练网络81

5.5.5 调整网络83

5.5.6 增加测试数据规模83

5.6 利用Java实现神经网络84

5.6.1 创建项目84

5.6.2 实现代码86

5.6.3 CSV与Arff文件转换88

5.6.4 运行神经网络88

5.7 总结89

第6章 关联规则学习90

6.1 关联规则学习的应用90

6.1.1 Web使用挖掘90

6.1.2 啤酒和尿布91

6.2 关联规则学习工作原理92

6.2.1 支持度92

6.2.2 置信度93

6.2.3 提升度93

6.2.4 确信度93

6.2.5 计算步骤94

6.3 算法94

6.3.1 Apiori94

6.3.2 FP-Growth95

6.4 基于购物篮分析的实战95

6.4.1 下载原始数据95

6.4.2 在Eclipse中搭建工程96

6.4.3 建立项目的数据文件97

6.4.4 设置数据99

6.4.5 运行Mahout101

6.4.6 检查结果103

6.4.7 结果整合105

6.4.8 进一步开发106

6.5 总结106

第7章 支持向量机107

7.1 什么是支持向量机107

7.2 何处使用支持向量机107

7.3 基本分类原则108

7.3.1 二分类和多分类108

7.3.2 线性分类器109

7.3.3 置信度109

7.3.4 最大化或最小化寻找直线110

7.4 支持向量机如何实现分类110

7.4.1 使用线性分类110

7.4.2 使用非线性分类112

7.5 在Weka中使用支持向量机112

7.5.1 安装LibSVM112

7.5.2 分类演示113

7.5.3 用Java实现LibSVM117

7.6 总结122

第8章 聚类123

8.1 什么是聚类123

8.2 聚类应用123

8.2.1 因特网124

8.2.2 商业和零售业124

8.2.3 执法部门124

8.2.4 计算124

8.3 聚类模型125

8.3.1 k-均值的工作原理125

8.3.2 计算一个数据集中聚类的数量126

8.4 使用Weka做k-均值聚类127

8.4.1 准备数据128

8.4.2 工作台方法129

8.4.3 命令行方法133

8.4.4 编程方法135

8.5 总结143

第9章 实时机器学习——使用Spring XD框架144

9.1 获取消防水管式的数据144

9.1.1 使用实时数据的注意事项144

9.1.2 实时系统的使用范围145

9.2 使用Spring XD146

9.2.1 Spring XD数据流146

9.2.2 输入源、输出、处理单元147

9.3 从Twitter数据中进行学习148

9.3.1 开发计划149

9.3.2 配置Twitter API开发者应用环境150

9.4 配置Spring XD152

9.4.1 启动Spring XD服务器152

9.4.2 创建样本数据153

9.4.3 Spring XD shell153

9.4.4 数据流入门154

9.5 Spring XD和Twitter156

9.5.1 设置Twitter访问认证156

9.5.2 创建第一个Twitter数据流157

9.5.3 我们所在的位置159

9.6 处理单元介绍159

9.6.1 处理单元是如何工作的160

9.6.2 创建自己的处理单元160

9.7 实时情感分析167

9.7.1 基本的分析如何工作168

9.7.2 创建情感分析的处理单元169

9.7.3 Spring XD Taps172

9.8 总结173

第10章 批处理系统的机器学习174

10.1 这个是大数据吗174

10.2 对批处理数据的若干考虑175

10.2.1 量级和频率175

10.2.2 需要多少数据175

10.2.3 用何种处理方法176

10.3 批处理实例176

10.3.1 Hadoop176

10.3.2 Sqoop176

10.3.3 Pig177

10.3.4 Mahout177

10.3.5 基于云的Elastic Map Reduce177

10.3.6 关于教程的提示177

10.4 使用Hadoop框架178

10.4.1 Hadoop架构178

10.4.2 建立单一节点集群179

10.5 MapReduce是如何工作的183

10.6 挖掘标签184

10.6.1 Hadoop支持Spring XD184

10.6.2 本书的目标185

10.6.3 什么是标签185

10.6.4 建立MapReduce类186

10.6.5 在现有数据上运行ETL195

10.6.6 使用Mahout生成推荐198

10.7 挖掘销售数据204

10.7.1 欢迎来到我的咖啡店204

10.7.2 小规模(数据)尝试205

10.7.3 编写核心方法205

10.7.4 使用Hadoop和MapReduce207

10.7.5 使用Pig挖掘销售数据210

10.8 规划批处理任务218

10.9 总结219

第11章 Apache Spark221

11.1 Spark是不是Hadoop的替代品221

11.2 Java、Scala还是Python222

11.3 Scala速成222

11.3.1 安装Scala222

11.3.2 包222

11.3.3 数据类型223

11.3.4 类223

11.3.5 调用函数224

11.3.6 操作符224

11.3.7 控制结构224

11.4 下载和安装Spark225

11.5 Spark简介225

11.5.1 启动命令行终端226

11.5.2 数据源227

11.5.3 Spark初体验227

11.5.4 Spark监控229

11.6 Spark与Hadoop MapReduce229

11.7 在Spark下编写独立运行的程序232

11.7.1 用Scala编写Spark程序232

11.7.2 安装SBT232

11.7.3 用Java编写Spark程序235

11.7.4 Spark程序小结238

11.8 Spark SQL238

11.8.1 基本概念238

11.8.2 在RDD中使用SparkSQL239

11.9 Spark流处理框架247

11.9.1 基本概念247

11.9.2 用Scala编写第一个流处理程序248

11.9.3 用Java编写第一个流处理程序250

11.10 MLib:机器学习算法库252

11.10.1 依赖253

11.10.2 决策树253

11.10.3 聚类254

11.11 总结254

第12章 基于R语言的机器学习255

12.1 安装R255

12.1.1 Mac OS X255

12.1.2 Windows255

12.1.3 Linux256

12.2 第一次运行R256

12.3 安装RStudio257

12.4 R基础258

12.4.1 变量和向量258

12.4.2 矩阵258

12.4.3 列表259

12.4.4 数据框260

12.4.5 安装包261

12.4.6 加载数据262

12.4.7 绘制数据263

12.5 简单统计266

12.6 简单线性回归267

12.6.1 构建数据267

12.6.2 初始图267

12.6.3 线性回归模型268

12.6.4 预测268

12.7 基本情感分析269

12.7.1 加载词汇表的函数269

12.7.2 编写函数给情感打分269

12.7.3 函数测试270

12.8 Apriori关联规则271

12.8.1 安装arules包271

12.8.2 训练数据271

12.8.3 导入事务数据272

12.8.4 运行Apriori算法273

12.8.5 查看结果273

12.9 从Java中访问R273

12.9.1 安装rJava包274

12.9.2 R中的第一段Java代码274

12.9.3 创建一个Eclipse项目275

12.9.4 创建Java/R类276

12.9.5 运行示例276

12.9.6 扩展R实现278

12.10 R与Hadoop278

12.10.1 RHadoop项目278

12.10.2 在RHadoop上的Map Reduce任务示例279

12.10.3 用R连接社交媒体280

12.11 总结282

附录A Spring XD快速入门284

附录B Hadoop 1.x快速入门286

附录C 常用UNIX命令289

附录D 进一步阅读299

热门推荐