Python自然语言处理实战
2推荐 收藏
3.9K阅读
图灵程序设计丛书

Python自然语言处理实战 [预售]

Rajesh Arumugam , Rajalingappaa Shanmugamani (作者) 杨航 (译者)
本书介绍自然语言处理和深度学习的核心概念,例如CNN、RNN、语义嵌入和Word2vec等。读者将学习如何使用神经网络执行自然语言处理任务,以及如何在自然语言处理应用程序中训练和部署神经网络。读者会在各种应用领域中使用RNN和CNN,例如文本分类和序列标记,这对于情绪分析、客服聊天机器人和异常检测的应用至关重要。读者还将掌握使用Python流行的深度学习库TensorFlow在语言应用程序中实现深度学习的实用知识。
纸质书
¥48.38 ¥59.00

出版信息

  • 书  名Python自然语言处理实战
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 杨琳
  • 书  号978-7-115-54926-6
  • 定  价59.00 元
  • 页  数213
  • 印刷方式单色
  • 开  本16开
  • 出版状态正在印刷
  • 原书名Hands-on Natural Language Processing with Python
  • 原书号9781789139495

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

本书特色

自然语言处理(NLP)已在Web搜索、广告和客户服务等各个领域中得到广泛应用。借助深度学习,我们可以增强NLP在这些领域的性能。使用Python,可以利用深度学习模型执行各种NLP任务,以及应对当今的各种NLP挑战。

阅读本书后,你将学会将神经网络融入各种跨平台的语言应用程序中,使用NLTK和TensorFlow执行NLP任务并训练模型,以及通过强大的深度学习架构(例如CNN和RNN)增强NLP模型。

* 进行词语的语义嵌入以对实体进行分类和查找
* 通过训练将词语转换为向量,以执行算术运算
* 训练深度学习模型以检测推文和新闻的分类
* 使用搜索和RNN模型实现问答模型
* 使用CNN为各种文本分类数据集训练模型
* 实现深层生成模型WaveNet,以产生自然语音
* 将语音转换为文本并将文本转换为语音
* 使用DeepSpeech训练模型,将语音转换为文本

目录

第 1章 起步  1
1.1 NLP中的基本概念和术语 1
1.1.1 文本语料库 1
1.1.2 段落 2
1.1.3 句子 2
1.1.4 短语和单词 2
1.1.5 n元语法 2
1.1.6 词袋 2
1.2 NLP技术的应用 3
1.2.1 情感分析 3
1.2.2 命名实体识别 4
1.2.3 实体链接 5
1.2.4 文本翻译 6
1.2.5 自然语言推理 6
1.2.6 语义角色标记 6
1.2.7 关系提取 7
1.2.8 SQL查询生成或语义解析 8
1.2.9 机器阅读理解 8
1.2.10 文字蕴含 10
1.2.11 指代消解 10
1.2.12 搜索 11
1.2.13 问答和聊天机器人 11
1.2.14 文本转语音 12
1.2.15 语音转文本 13
1.2.16 说话人识别 14
1.2.17 口语对话系统 14
1.2.18 其他应用 14
1.3 小结 15
第 2章 使用NLTK进行文本分类和词性标注 16
2.1 安装NLTK 及其模块 16
2.2 文本预处理及探索性分析 18
2.2.1 分词 18
2.2.2 词干提取 19
2.2.3 去除停用词 20
2.2.4 探索性分析 20
2.3 词性标注 24
2.3.1 词性标注定义 24
2.3.2 词性标注的应用 25
2.3.3 训练词性标注器 25
2.4 训练影评情感分类器 29
2.5 训练词袋分类器 32
2.6 小结 34
第3章 深度学习和TensorFlow 35
3.1 深度学习 35
3.1.1 感知器 35
3.1.2 激活函数 36
3.1.3 神经网络 38
3.1.4 训练神经网络 40
3.1.5 卷积神经网络 43
3.1.6 递归神经网络 44
3.2 TensorFlow 45
3.2.1 通用图形处理单元 45
3.2.2 安装 46
3.2.3 Hello world ! 47
3.2.4 两数相加 47
3.2.5 TensorBoard 48
3.2.6 Keras库 49
3.3 小结 49
第4章 使用浅层模型进行语义嵌入 50
4.1 词向量 50
4.1.1 经典方法 50
4.1.2 Word2vec 51
4.1.3 连续词袋模型 52
4.1.4 跳字模型 53
4.2 从单词到文档嵌入 59
4.3 Sentence2vec 59
4.4 Doc2vec 60
4.5 小结 63
第5章 使用LSTM进行文本分类 64
5.1 文本分类数据 64
5.2 主题建模 65
5.3 用于文本分类的深度学习元架构 68
5.3.1 嵌入层 68
5.3.2 深层表示 68
5.3.3 全连接部分 68
5.4 使用RNN识别YouTube视频垃圾评论 69
5.5 使用CNN对新闻主题分类 73
5.6 使用GloVe嵌入进行迁移学习 76
5.7 多标签分类 79
5.7.1 二元关联 80
5.7.2 用于多标签分类的深度学习 80
5.7.3 用于文档分类的attention网络 81
5.8 小结 83
第6章 使用CNN进行搜索和去重 84
6.1 数据 84
6.2 模型训练 85
6.2.1 文本编码 86
6.2.2 建立CNN模型 87
6.2.3 训练 89
6.2.4 推理 91
6.3 小结 92
第7章 使用字符级LSTM进行命名实体识别 93
7.1 使用深度学习实现NER 93
7.1.1 数据 94
7.1.2 模型 95
7.1.3 代码详解 96
7.1.4 不同预训练词嵌入的影响 98
7.1.5 改进空间 105
7.2 小结 105
第8章 使用GRU 进行文本生成和文本摘要 106
8.1 使用RNN进行文本生成 106
8.2 文本摘要 112
8.2.1 提取式摘要 112
8.2.2 抽象式摘要 114
8.2.3 最新抽象式文本摘要 123
8.3 小结 125
第9章 使用记忆网络完成问答任务和编写聊天机器人 127
9.1 QA任务 127
9.2 用于QA任务的记忆网络 128
9.2.1 记忆网络管道概述 128
9.2.2 使用TensorFlow写一个记忆网络 129
9.3 拓展记忆网络以进行对话建模 134
9.3.1 对话数据集 134
9.3.2 使用TensorFlow编写一个聊天机器人 137
9.3.3 记忆网络相关文献 146
9.4 小结 146
第 10章 使用基于attention的模型进行机器翻译 147
10.1 机器翻译概述 147
10.1.1 统计机器翻译 147
10.1.2 神经机器翻译 150
10.2 小结 163
第 11章 使用DeepSpeech进行语音识别 164
11.1 语音识别概述 164
11.2 建立用于语音识别的RNN模型 165
11.2.1 语音信号表示 165
11.2.2 用于语音数字识别的LSTM模型 167
11.2.3 TensorBoard可视化 168
11.2.4 使用DeepSpeech架构的语音转文本模型 169
11.2.5 语音识别最新技术 178
11.3 小结 179
第 12章 使用Tacotron进行文本转语音 180
12.1 TTS领域概述 181
12.1.1 自然性与可懂性 181
12.1.2 TTS系统表现的评估方式 181
12.1.3 传统技术——级联模型和参数模型 182
12.1.4 关于频谱图和梅尔标度的一些提醒 182
12.2 深度学习中的TTS 185
12.2.1 WaveNet简介 186
12.2.2 Tacotron 186
12.3 利用Keras的Tacotron实现 191
12.3.1 数据集 192
12.3.2 数据准备 192
12.3.3 架构实现 196
12.3.4 训练与测试 200
12.4 小结 201
第 13章 部署训练好的模型 202
13.1 性能提升 202
13.1.1 量化权重 202
13.1.2 MobileNets 203
13.2 TensorFlow Serving 205
13.2.1 导出训练好的模型 206
13.2.2 把导出模型投入服务 207
13.3 在云上部署 207
13.3.1 Amazon Web Services 207
13.3.2 Google Cloud Platform 210
13.4 在移动设备上部署 213
13.4.1 iPhone 213
13.4.2 Android 213
13.5 小结 213

作者介绍

拉杰什·阿鲁姆甘(Rajesh Arumugam)

目前在新加坡SAP公司负责机器学习开发工作,此前曾与日立亚洲(新加坡)社会创新中心合作,为智慧城市的多个领域开发过机器学习解决方案。毕业于南洋理工大学,获计算机工程博士学位,曾在多个会议上发表过论文,并在存储和机器学习方面拥有专利。

拉贾林加帕·尚穆加马尼(Rajalingappaa Shanmugamani)

目前在Kairos担任技术经理,此前作为数据学习专家在新加坡SAP公司创新中心工作,并在开发计算机视觉产品的许多创业公司负责过开发和咨询工作。毕业于印度理工学院马德拉斯分校,获硕士学位,学位论文主题基于产业中计算机视觉的应用程序。他还在该领域发表了若干论文。

大家也喜欢

  • 深度学习搜索引擎开发:Java实现

    [意]托马索•泰奥菲利(Tommaso Teofili)   李军   天舒   译

    本书是市面上少见的将搜索与深度学习相结合的书,讨论了使用(深度)神经网络来帮助建立有效的搜索引擎的方法。阅读本...

  • 用Python实现深度学习框架

    张觉非   陈震  

    本书带领读者用原生Python语言和Numpy线性代数库实现一个基于计算图的深度学习框架MatrixSlow(...

  • 深入浅出神经网络与深度学习

    Michael Nielsen   朱小虎   译

    本书深入讲解神经网络和深度学习技术,侧重于阐释深度学习的核心概念。作者以技术原理为导向,辅以贯穿全书的MNIS...

  • 机器学习基础:建模与问题求解

    本书作者曾就职美国谷歌公司和日本乐天集团,有着多年的机器学习开发经验。本书理论与实践相结合,通过直观具体、易于...

  • Keras深度学习:基于Python

    在众多深度学习框架中,最容易上手的就是Keras,其简单、可扩展、可重复使用的特征使得非深度学习者也能轻松驾驭...

  • 如果翻译这本书,有期限不?
    PKUCATer  发表于 2018-11-23 09:34:54
    推荐
    • 您好,这本书不到300页,翻译时间一般在4个月以内。

      杨琳  发表于 2018-11-23 13:58:19
  • 目前这本书还缺少翻译者么,我对此很感兴趣
    星空  发表于 2018-12-17 16:30:06
    推荐
    • 抱歉,本书已经在翻译中了,请您看看是否有其他感兴趣的待译图书。

      杨琳  发表于 2018-12-18 11:17:32
    • @杨琳 貌似待译图书都挺抢手,基本没有什么图书没人翻译的了,尴尬

      星空  发表于 2018-12-20 00:32:33
  • 翻译了一年太尴尬了!@杨琳
    binbjz  发表于 2019-12-04 13:20:56
    推荐
  • 申请试译
    honghui_xiao@yeah.net
    hhx  发表于 2020-02-11 12:51:10
    推荐
  • 申请试译
    727988245@qq.com
    yang_hang  发表于 2020-02-11 19:13:03
    推荐