图书介绍
Web知识挖掘 理论、方法与应用PDF|Epub|txt|kindle电子书版本下载
![Web知识挖掘 理论、方法与应用](https://www.shukui.net/cover/13/30282951.jpg)
- 郑庆华,刘均,田锋等著 著
- 出版社: 北京:科学出版社
- ISBN:9787030274991
- 出版时间:2010
- 标注页数:336页
- 文件大小:36MB
- 文件页数:348页
- 主题词:计算机网络-情报检索
PDF下载
下载说明
Web知识挖掘 理论、方法与应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 Web挖掘概述1
1.1 Web发展历史与现状1
1.1.1 Web技术发展1
1.1.2 Web上的信息爆炸2
1.2 Web挖掘的概念3
1.2.1 典型的Web挖掘定义4
1.2.2 Web挖掘与数据挖掘、信息检索、信息抽取的区别4
1.3 Web挖掘面临的挑战5
1.3.1 Web数据的高度复杂性5
1.3.2 Web数据检索的局限性6
1.4 Web挖掘的研究方向8
1.5 小结9
第2章 Web挖掘的基础知识10
2.1 Web挖掘的主要预备知识10
2.1.1 数据挖掘10
2.1.2 文本挖掘12
2.1.3 信息检索15
2.2 Web挖掘分类17
2.2.1 Web数据的分类体系17
2.2.2 Web挖掘分类17
2.3 Web挖掘的主要应用20
2.4 Web挖掘的基本流程21
2.4.1 数据采集22
2.4.2 数据预处理22
2.4.3 模式挖掘23
2.4.4 模式评估23
2.5 Web挖掘领域的重要文献、国际期刊与会议、标准规范24
2.5.1 Web挖掘领域的重要文献24
2.5.2 Web挖掘相关的国际期刊与国际会议26
2.5.3 Web挖掘相关的标准、规范及语言28
2.6 小结33
第3章 Web爬取与页面组织管理34
3.1 Web爬取概述34
3.1.1 Web爬取的分类34
3.1.2 Web爬取的基本原理36
3.1.3 Web爬取面临的挑战39
3.2 Web爬取中的主要技术问题40
3.2.1 爬取次序40
3.2.2 爬取性能问题42
3.2.3 爬取礼貌性问题48
3.3 隐含Web爬取50
3.3.1 隐含Web爬虫框架及工作机理51
3.3.2 表单分析与提交52
3.3.3 隐含Web爬虫实例HiWE57
3.4 面向主题的Web爬取60
3.4.1 主题相关度分析61
3.4.2 确定下个访问URL62
3.4.3 面向主题爬取的爬虫实例66
3.5 爬取页面的存储与管理67
3.5.1 爬取文档的特点67
3.5.2 爬取文档的存储方法68
3.5.3 爬取文档的管理72
3.6 小结73
第4章 Web结构挖掘74
4.1 Web结构挖掘概述74
4.1.1 Web结构挖掘的分类74
4.1.2 Web结构挖掘的应用76
4.2 PageRank算法78
4.2.1 超链接分析的假设78
4.2.2 随机冲浪(random surfing)模型79
4.2.3 PageRank值的计算82
4.2.4 PageRank算法的改进85
4.2.5 PageRank算法在Google中的应用89
4.3 HITS算法90
4.3.1 HITS算法的基本思想91
4.3.2 HITS算法具体过程91
4.3.3 HITS算法与PageRank算法的对比96
4.3.4 HITS算法改进97
4.4 Hilltop算法99
4.4.1 Hilltop算法基本思想100
4.4.2 专家页面选取及分值计算100
4.4.3 目标页面选取及分值计算101
4.4.4 PageRank算法和Hilltop算法区别102
4.4.5 Hilltop算法的缺陷102
4.5 Web宏观结构特性分析102
4.5.1 Web的无尺度特性103
4.5.2 Web的小世界(small world)特性105
4.5.3 “蝴蝶结”和“日冕”现象106
4.5.4 Web宏观结构特性的主要应用109
4.6 小结110
第5章 Web内容挖掘111
5.1 Web页面的特征表示111
5.1.1 特征表示的基本原理112
5.1.2 特征的离散化113
5.1.3 Web页面特征分析114
5.1.4 页面文本建模116
5.2 Web页面分类121
5.2.1 分类方法综述121
5.2.2 基于内容的网页分类125
5.3 Web页面聚类128
5.3.1 聚类方法综述129
5.3.2 基于内容的页面聚类133
5.4 面向Web的信息抽取136
5.4.1 信息抽取概述136
5.4.2 命名实体识别140
5.4.3 实体关系检测143
5.4.4 页面元数据抽取145
5.5 面向Web的本体学习162
5.5.1 面向文本的本体学习概述162
5.5.2 概念获取170
5.5.3 概念关系获取187
5.5.4 试验结果与分析196
5.6 面向Web的知识元及其关联抽取203
5.6.1 知识元及其关联抽取概述204
5.6.2 知识元抽取205
5.6.3 知识元前序关系抽取211
5.7 多媒体数据挖掘219
5.7.1 图像数据的挖掘220
5.7.2 视频数据的挖掘223
5.7.3 音频数据的挖掘224
5.8 Web内容挖掘的未来研究方向225
5.9 小结226
第6章 Web日志挖掘227
6.1 Web日志挖掘概述227
6.1.1 Web日志挖掘的分类229
6.1.2 Web日志挖掘的典型应用231
6.1.3 Web日志挖掘的流程234
6.2 Web日志预处理237
6.2.1 Web日志数据的格式238
6.2.2 Web日志数据清洗240
6.2.3 用户识别和会话识别241
6.2.4 访问路径填充244
6.2.5 事务识别245
6.3 序列模式挖掘248
6.3.1 序列模式的定义248
6.3.2 GSP算法250
6.3.3 PrefixSpan算法255
6.4 Web用户行为模式挖掘261
6.4.1 研究现状261
6.4.2 相关概念262
6.4.3 用户行为模式挖掘工作机理262
6.5 Web用户个性挖掘270
6.5.1 个性挖掘的基本概念270
6.5.2 个性属性归并271
6.5.3 用户个性聚类273
6.5.4 个性特征与行为的关联规则分析276
6.5.5 个性特征的获取277
6.5.6 实例277
6.6 Web用户兴趣感知279
6.6.1 研究现状279
6.6.2 基于建构主义的学习兴趣感知280
6.6.3 用户兴趣模型的表示和更新281
6.6.4 用户兴趣感知举例281
6.7 Web日志挖掘的未来研究方向283
6.8 小结284
第7章 Web挖掘的应用实例285
7.1 应用1:面向网络学习的学习者个性挖掘285
7.1.1 学习者模型和数据收集286
7.1.2 学习者个性挖掘机理289
7.1.3 PELDIS工作流程290
7.1.4 个性挖掘实例292
7.2 应用2:海量Web资源中的知识处理与服务295
7.2.1 体系结构与工作机理296
7.2.2 基于主题图的Web资源组织与管理299
7.2.3 主题图的自动生成302
7.2.4 多维关联索引构建与检索结果的个性化排序309
7.2.5 个性化资源推荐与导航311
7.2.6 基于SOA的Yotta系统实现317
7.3 小结318
参考文献320