图书介绍
Storm技术内幕与大数据实践PDF|Epub|txt|kindle电子书版本下载
![Storm技术内幕与大数据实践](https://www.shukui.net/cover/8/30988558.jpg)
- 陈敏敏,王新春,黄奉线著 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115388537
- 出版时间:2015
- 标注页数:192页
- 文件大小:30MB
- 文件页数:203页
- 主题词:数据处理软件
PDF下载
下载说明
Storm技术内幕与大数据实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 Storm的基本组件2
1.1.1 集群组成2
1.1.2 核心概念3
1.1.3 Storm的可靠性5
1.1.4 Storm的特性6
1.2 其他流式处理框架6
1.2.1 Apache S46
1.2.2 Spark Streaming6
1.2.3 流计算和Storm的应用7
第2章 实时平台介绍11
2.1 实时平台架构介绍11
2.2 Kafka架构13
2.2.1 Katka的基本术语和概念13
2.2.2 Kafka在实时平台中的应用14
2.2.3 消息的持久化和顺序读写15
2.2.4 sendfile系统调用和零复制15
2.2.5 Kafka的客户端17
2.2.6 Kafka的扩展17
2.3 大众点评实时平台17
2.3.1 相关数据18
2.3.2 实时平台简介18
2.3.3 Blackhole19
2.4 1号店实时平台20
第3章 Storm集群部署和配置23
3.1 Storm的依赖组件23
3.2 Storm的部署环境24
3.3 部署Storm服务24
3.3.1 部署ZooKeeper24
3.3.2 部署Storm25
3.3.3 配置Storm25
3.4 启动Storm28
3.5 Storm的守护进程28
3.6 部署Storm的其他节点30
3.7 提交Topology30
第4章 Storm内部剖析33
4.1 Storm客户端33
4.2 Nimbus36
4.2.1 启动Nimbus服务36
4.2.2 Nimbus服务的执行过程38
4.2.3 分配Executor44
4.2.4 调度器46
4.2.5 默认调度器DefaultScheduler47
4.2.6 均衡调度器EvenScheduler50
4.3 Supervisor53
4.3.1 ISupervisor接口54
4.3.2 Supervisor的共享数据54
4.3.3 Supervisor的执行过程56
4.4 Worker61
4.4.1 Worker中的数据流61
4.4.2 创建Worker的过程62
4.5 Executor65
4.5.1 Executor的创建66
4.5.2 创建Spout的Executor69
4.5.3 创建Bolt的Executor74
4.6 Task76
4.6.1 Task的上下文对象77
4.6.2 Task的创建82
4.7 Storm中的统计84
4.7.1 stats框架85
4.7.2 metric框架90
4.8 Ack框架91
4.8.1 Ack的原理92
4.8.2 Acker Bolt94
4.9 Storm总体架构95
第5章 Storm运维和监控97
5.1 主机信息监控97
5.2 日志和监控98
5.3 Storm UI和NimbusClient99
5.4 Storm Metric的使用100
5.5 Storm ZooKeeper的目录102
5.6 Storm Hook的使用104
第6章 Storm的扩展107
6.1 Storm UI的扩展107
6.1.1 Storm UI原生功能108
6.1.2 Storm UI新功能需求108
6.1.3 Storm的Thrift接口109
6.2 资源隔离110
6.2.1 CGroup测试111
6.2.2 基于CGroup的资源隔离的实现119
第7章 Storm开发121
7.1 简单示例121
7.2 调试和日志122
7.3 Storm Trident124
7.4 Strom DRPC128
第8章 基于Storm的实时数据平台129
8.1 Hadoop到Storm的代码迁移经验129
8.2 实时用户画像130
8.2.1 简单实时画像130
8.2.2 实时画像优化131
8.2.3 实时画像的毫秒级更新133
8.3 其他场景画像135
8.4 画像的兴趣度模型构建136
8.5 外部画像融合经验分享138
8.6 交互式查询和分析用户画像142
8.7 实时产品和店铺信息更新143
第9章 大数据应用案例145
9.1 实时DAU计算145
9.2 实时推荐系统150
9.2.1 推荐系统介绍150
9.2.2 实时推荐系统的方法153
9.2.3 基于Storm的实时推荐系统156
9.3 广告投放的精准化158
9.3.1 点击率预测158
9.3.2 搜索引擎营销161
9.3.3 精准化营销与千人千面161
9.4 实时意图和搜索165
9.4.1 用户意图预测166
9.4.2 搜索比价168
9.4.3 搜索排序169
第10章 Storm使用经验和性能优化170
10.1 使用经验170
10.1.1 使用rebalance命令动态调整并发度170
10.1.2 使用tick消息做定时器172
10.1.3 使用组件的并行度代替线程池174
10.1.4 不要用DRPC批量处理大数据174
10.1.5 不要在Spout中处理耗时的操作174
10.1.6 log4j的使用技巧175
10.1.7 注意fieldsGrouping的数据均衡性176
10.1.8 优先使用localorShuffleGrouping176
10.1.9 设置合理的MaxSpoutPending值177
10.1.10 设置合理的Worker数177
10.1.11 平衡吞吐量和时效性178
10.2 性能优化179
10.2.1 找到Topology的性能瓶颈179
10.2.2 GC参数优化181
10.3 性能优化原则181
附录A Kafka原理183
附录B 将Storm源码导入Eclipse191