图书介绍
语料库翻译学文库 语料库与Python应用【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 管新潮 著
- 出版社: 上海:上海交通大学出版社
- ISBN:9787313197481
- 出版时间:2018
- 标注页数:211页
- 文件大小:25MB
- 文件页数:223页
- 主题词:软件工具-程序设计-应用-语料库-研究
PDF下载
下载说明
语料库翻译学文库 语料库与Python应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 语料库与Python1
1.1.1 语料库的若干维度1
1.1.2 语料库的技术实现2
1.2 本书概要3
上篇 语料文本的基础性代码7
第2章 语料文本的读取及其运行结果的输出7
2.1 概述7
2.2 语料文本的读取8
2.2.1 读取NLTK固有语料库8
2.2.2 读取自制语料库10
2.2.3 读取非独立存储的语料文本15
2.2.4 读取docx格式的语料文本16
2.2.5 读取xlsx格式的语料文本19
2.3 语料文本运行结果的输出20
2.3.1 操作界面直接输出结果20
2.3.2 输出txt文件格式22
2.3.3 输出xlsx文件格式25
2.4 中文语料文本的读取和结果输出26
2.4.1 自制语料库26
2.4.2 非独立存储的语料文本29
第3章 语料库应用的基础性代码30
3.1 概述30
3.2 停用词的使用31
3.2.1 不同语种的停用词31
3.2.2 自有停用词的设置32
3.3 文本降噪代码34
3.3.1 具体代码的功用35
3.3.2 组合使用代码的功用38
3.3.3 降噪与文本计数39
3.4 语料文本的语言学处理代码40
3.4.1 字母大小写转换40
3.4.2 词形还原42
3.4.3 文本分句或分词44
3.4.4 词性标注47
3.5 语料库词频排序51
3.5.1 简单词频排序51
3.5.2 降噪处理后词频排序53
3.5.3 清除停用词后排序54
3.6 语料库检索与统计55
3.6.1 上下文关键词检索55
3.6.2 类符形符比57
3.6.3 N连词提取62
3.6.4 指定词检索与统计66
3.7 中文语料文本的处理方法68
3.7.1 上下文关键词检索69
3.7.2 中文停用词70
第4章 数据可视化74
4.1 概述74
4.2 表格绘制74
4.3 图形绘制78
4.3.1 词频图形绘制78
4.3.2 柱状图和点状图绘制80
4.4 词云图绘制81
4.4.1 英文文本词云图82
4.4.2 中文文本词云图83
第5章 代码运行错误分析89
5.1 概述89
5.2 错误分析案例90
5.2.1 输入输出错误(IOError)90
5.2.2 对象属性错误(AttributeError)92
5.2.3 数据类型错误(TypeError)94
5.2.4 变量名称错误(NameError)96
5.2.5 索引错误(IndexError)98
5.2.6 缩进错误(IndentationError)100
5.2.7 参数类型错误(ValueError)102
5.2.8 语法错误(SyntaxError)104
5.2.9 Unicode解码错误(UnicodeDecodeError)105
5.2.10 关键字错误(KeyError)106
中篇 基础性代码的组合使用111
第6章 算法、代码与编程111
6.1 篇章结构111
6.2 算法和代码112
6.2.1 算法112
6.2.2 代码113
6.3 选择不同代码的影响115
6.3.1 分词处理方式对后续文本分析的影响115
6.3.2 不同的降噪效果117
6.3.3 链表、字符串、元组和字典对比118
6.3.4 停用词的功用121
6.4 Python与既有语料库工具的关系122
第7章 基础性代码的语料库组合应用125
7.1 以Excel文件格式输出术语(类符)125
7.1.1 简单输出术语125
7.1.2 按词频输出术语128
7.2 以Excel文件格式输出表格132
7.3 语篇词汇密度的计算135
7.4 语篇词汇复杂性的计算139
7.5 语篇词长分布的计算142
7.6 NLTK固有语料库146
7.6.1 总统就职演说语料库147
7.6.2 华尔街杂志语料库149
7.6.3 其他相关语料库介绍152
下篇 Python探索路径159
第8章 Python的语料库拓展应用159
8.1 概述159
8.2 单语语料导入Excel工作簿160
8.3 KWIC检索功能的拓展166
8.4 语篇词形还原170
8.5 术语提取效果的改进174
8.6 语篇段落对齐180
8.7 应用语言学文献计量研究的数据提取182
8.8 专业通用词的提取路径探索185
附录1 与本书相关的加载模块与函数命令对应表194
附录2 Python2和Python3部分代码对比197
附录3 部分NLTK固有语料库200
附录4 汉英对照术语表203
索引207
热门推荐
- 2603857.html
- 2117556.html
- 2324566.html
- 638621.html
- 3400445.html
- 3419886.html
- 2147062.html
- 3901404.html
- 2578551.html
- 2653973.html
- http://www.ickdjs.cc/book_101487.html
- http://www.ickdjs.cc/book_2972099.html
- http://www.ickdjs.cc/book_2916489.html
- http://www.ickdjs.cc/book_2408352.html
- http://www.ickdjs.cc/book_3605182.html
- http://www.ickdjs.cc/book_2361969.html
- http://www.ickdjs.cc/book_2621886.html
- http://www.ickdjs.cc/book_3845212.html
- http://www.ickdjs.cc/book_1277411.html
- http://www.ickdjs.cc/book_2831903.html