图书介绍

中文文本信息处理的原理与应用PDF|Epub|txt|kindle电子书版本下载

中文文本信息处理的原理与应用
  • 苗夺谦,卫志华编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:7302154988
  • 出版时间:2007
  • 标注页数:321页
  • 文件大小:21MB
  • 文件页数:337页
  • 主题词:汉字信息处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

中文文本信息处理的原理与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 概论1

1.1 自然语言处理与中文信息处理1

1.1.1 自然语言处理1

1.1.2 自然语言处理研究的历史、现状及应用3

1.1.3 中文信息处理9

1.2 自然语言处理的新趋势11

1.3 本书内容组织15

第一部分 词法分析18

第2章 自动分词18

2.1 关于自动分词18

2.1.1 分词规范18

2.1.2 自动分词的研究内容及意义19

2.2 分词词典19

2.2.1 关于分词词典的构造19

2.2.2 基于词属性的分词词典20

2.3 机械分词方法22

2.3.1 正向最大匹配算法22

2.3.2 逆向最大匹配算法23

2.3.3 邻近匹配算法24

2.3.4 最短路径匹配算法26

2.3.5 基于统计的最短路径分词算法27

第3章 分词歧义消解29

3.1 关于分词歧义29

3.1.1 分词歧义的类型29

3.1.2 歧义字段的发现34

3.2 基于规则的分词消歧34

3.2.1 分词预处理中的规则34

3.2.2 分词规则35

3.3 基于统计方法的分词消歧37

3.3.1 基于词频的消歧方法37

3.3.2 基于互信息和t-测试差的歧义切分方法37

第4章 未登录词获取41

4.1 关于未登录词41

4.2 基于统计学的未登录词获取方法42

4.2.1 基于频率的方法42

4.2.2 基于均值和方差的方法45

4.2.3 基于假设检验的方法46

4.2.4 基于互信息的方法52

4.3 中文姓名的自动辨识54

4.3.1 辨识姓名中的当用资源54

4.3.2 同源对表、互斥对表及其操作57

4.3.3 姓名左右边界的确定57

4.3.4 屏蔽与恢复58

4.3.5 同源对表、互斥对表的规则校正58

4.3.6 概率再筛选59

4.3.7 中文姓名辨识系统59

4.4 中文统计词汇获取60

4.5 无词典分词方法62

4.5.1 分词模型62

4.5.2 无词典分词算法63

第5章 语料库的构建66

5.1 关于语料库66

5.1.1 国外语料库概况66

5.1.2 中文语料库建设状况68

5.2 汉语语料库的基本加工规范69

5.2.1 生语料与熟语料69

5.2.2 汉语语料库加工思路71

5.2.3 汉语语料库加工规范72

5.2.4 汉语文本词性标注标记集74

5.3 建设语料库的其他问题76

5.3.1 建设语料库的软硬件基础76

5.3.2 通用标记语言SGML77

第一部分习题78

第二部分 语法处理81

第6章 自动标注81

6.1 关于自动标注81

6.1.1 自动标注81

6.1.2 歧义的消除82

6.1.3 模型的训练84

6.1.4 词典85

6.2 马尔可夫模型和隐马尔可夫模型86

6.2.1 离散马尔可夫过程86

6.2.2 隐马尔可夫模型88

6.2.3 HMM的三个基本问题89

6.2.4 问题1的解法90

6.2.5 问题2的解法92

6.2.6 问题3的解法93

6.3 马尔可夫模型标注器94

6.3.1 概率模型94

6.3.2 Viterbi算法97

6.4 隐马尔可夫模型标注器98

6.4.1 隐马尔可夫模型标注算法98

6.4.2 隐马尔可夫模型训练中的初始化的作用100

第7章 语法表示101

7.1 关于语法表示101

7.2 形式语法描述101

7.3 短语结构语法104

7.4 转移网络105

7.5 短语结构与句法树107

第8章 语法分析109

8.1 关于语法分析109

8.2 基于符号串的句法分析110

8.3 自底向上的图句法分析115

8.4 自顶向下的图句法分析123

8.5 基于转移网络的句法分析125

8.6 移进归约句法分析器129

8.6.1 确定句法分析器的状态129

8.6.2 移进归约句法分析器131

8.6.3 移进归约句法分析器与歧义性134

8.6.4 词汇的歧义性134

8.6.5 有歧义的句法分析状态135

8.7 概率上下文无关文法分析136

8.7.1 概率上下文无关文法的一些特征138

8.7.2 概率上下文无关文法的问题139

8.7.3 词串概率的计算141

8.7.4 内部-外部算法的问题147

第二部分习题148

第三部分 语义分析153

第9章 语义表示153

9.1 关于语义表示153

9.2 语义的逻辑表示方法155

9.2.1 一阶谓词演算155

9.2.2 基本逻辑形式语言156

9.2.3 逻辑形式中的歧义表示158

9.3 论旨角色159

9.4 语义网络表示法161

9.5 框架表示法162

9.6 量词的处理165

第10章 语义分析167

10.1 关于语义分析167

10.2 组合理论与语义解释168

10.2.1 组合理论168

10.2.2 λ表达式与语义解释169

10.3 基于语义特征的解释方法171

10.3.1 带语义解释的简单语法和词典171

10.3.2 语义角色175

10.3.3 特征合一的语义解释176

10.4 基于语法关系的语义分析179

10.5 语义语法182

10.6 模板匹配184

10.7 语义驱动的分析技术188

第11章 语义消歧192

11.1 关于语义歧义192

11.2 选择限制法消歧192

11.2.1 选择限制192

11.2.2 选择限制与句法分析结合的消歧方法197

11.3 语义网络200

11.4 统计词义消歧203

11.5 统计语义优选205

第三部分习题208

第四部分 应用与技术214

第12章 文本分类214

12.1 关于文本分类214

12.1.1 自动文本分类定义214

12.1.2 文本分类任务的特点215

12.1.3 文本分类基本实现途径215

12.1.4 文本分类的组成216

12.1.5 文本分类的应用领域217

12.1.6 国内外研究现状219

12.2 文本分类方法219

12.2.1 文本表示与文本特征选择219

12.2.2 分类器设计224

12.2.3 分类器的阈值选择228

12.3 文本分类的评测228

12.3.1 单类赋值229

12.3.2 多类排序230

第13章 信息检索231

13.1 关于信息检索231

13.1.1 信息检索的对象和任务231

13.1.2 信息检索的评测232

13.1.3 信息检索模型及其设计233

13.1.4 应用领域234

13.1.5 中文信息检索的特点235

13.2 基于统计学的信息检索模型235

13.2.1 布尔模型235

13.2.2 向量空间模型238

13.2.3 概率模型246

13.3 基于语义的信息检索254

13.3.1 基于NLP的方法254

13.3.2 潜在语义索引256

13.3.3 神经网络262

13.4 典型信息检索系统263

13.5 信息检索技术前沿264

13.5.1 基于Web的信息检索264

13.5.2 搜索引擎266

第14章 信息抽取279

14.1 关于信息抽取279

14.2 半结构化文本的信息抽取技术287

14.2.1 基于隐马尔可夫模型的信息提取287

14.2.2 基于规则的信息抽取方法291

14.3 典型信息抽取系统294

14.3.1 AutoSlog信息抽取系统294

14.3.2 PALKA297

14.4 Web信息抽取299

14.4.1 包装器方式的信息抽取300

14.4.2 基于本体方式的信息抽取301

14.4.3 基于Web查询的信息抽取302

第15章 自动文摘304

15.1 关于自动文摘304

15.1.1 文摘的定义304

15.1.2 文摘的分类305

15.1.3 自动文摘的意义308

15.2 自动文摘的方法308

15.2.1 基于统计的自动文摘309

15.2.2 基于理解的自动文摘310

15.2.3 基于信息抽取的自动文摘方法311

15.2.4 基于结构的自动文摘311

15.3 自动文摘系统的评测312

15.3.1 内部评价313

15.3.2 自动文摘的外部评价314

15.3.3 评测方法的研究现状314

15.4 自动文摘系统315

第四部分习题317

参考文献319

热门推荐