前言

前言

本书面向想要掌握基于深度学习的计算机视觉技术的读者,帮助他们实现诸多应用。本书将为读者研发基于计算机视觉的产品提供相应的工具和技术。为此,全书采取理论讲解和实例介绍相结合的写作方式。

读者对象

本书适合有意探究如何将深度学习应用于计算机视觉问题(如分类、检测、检索、分割、生成、题注和视频分类)的读者,以及希望了解如何在各种限制条件(如较少的数据、不平衡的类别、噪声)下实现较高准确性的读者。本书还适合想知道如何在各种平台(AWS、Google Cloud、Raspberry Pi和手机)上部署经过训练的模型的读者。通过学习本书,读者应该能够针对人物检测、人脸识别、产品搜索、医学图像分割、图像生成、图像题注、视频分类等问题开发相应的代码。

本书内容

第1章“入门”,介绍深度学习的基础知识以及相关术语。这一章将指导读者安装必要的软件包,为学习后续章节做准备。

第2章“图像分类”,讨论图像分类问题,即如何将图像作为一个整体打标签。我们将学习图像分类技术,并训练一个用于宠物分类的深度学习模型。此外还会学习提高图像分类准确性的方法,并深入探究各种先进的图像分类架构。

第3章“图像检索”,介绍图像深层特征和图像检索。我们将学习获取模型可视化、视觉特征以及使用TensorFlow Serving进行推断的各种方法,并且使用视觉特征进行产品检索。

第4章“目标检测”,讨论如何检测图像中的目标对象。我们将学习目标检测的各种技术,并将其应用于行人检测。这一章将使用与物体检测相关的TensorFlow API。

第5章“语义分割”,介绍像素级图像分割。我们将学习图像分割技术,并训练一个医学图像分割模型。

第6章“相似性学习”,讲述相似性学习。我们将学习相似性匹配以及如何训练人脸识别模型。这一章将展示一个训练人脸关键点的模型。

第7章“图像题注”,介绍如何为图像生成或选择题注。我们将学习自然语言处理技术以及如何使用这些技术为图像生成题注。

第8章“生成模型”,讨论如何为各种目的生成合成图像。我们将学习什么是生成模型并将其用于图像生成应用程序,如风格迁移、训练数据等。

第9章“视频分类”,介绍面向视频数据的计算机视觉分类技术。我们将了解解决视频问题与图像问题的主要区别以及如何实现视频分类技术。

第10章“部署”,讨论深度学习模型的部署步骤。我们将学习如何部署训练好的模型并针对各种平台优化执行速度。

如何充分利用本书

本书中的例子可以在Windows、Ubuntu或Mac上运行,所有安装说明都包含在内。Python和机器学习的基础知识是必需的。读者最好有GPU硬件,但这不是必需的。

下载示例代码文件

你可以从www.packtpub.com上的账户下载本书的示例代码文件。如果你在其他地方购买了本书,可以访问www.packtpub.com/support并注册,文件会直接通过电子邮件发送给你。

你可以按照以下步骤下载代码文件:

(1) 登录或注册www.packtpub.com

(2) 选择SUPPORT选项卡;

(3) 点击Code Downloads & Errata

(4) 在Search框中输入书名,然后按照屏幕上的说明进行操作。

下载文件后,确保使用最新版本的软件来解压缩:

  • 适用于Windows的WinRAR/7-Zip
  • 适用于Mac的Zipeg/iZip/UnRarX
  • 适用于Linux的7-Zip/PeaZip

本书的代码包也托管在GitHub上:https://github.com/PacktPublishing/Deep-Learning-for-Computer-Vision。我们在https://github.com/PacktPublishing/上还提供了许多其他图书和视频的代码包。去看一下吧!

排版约定

本书使用了不同的文本样式来区分不同种类的信息。

正文中的代码采用以下样式:“请注意,图形是使用summary_writer写入的。”

代码块的样式如下:

merged_summary_operation = tf.summary.merge_all()
train_summary_writer = tf.summary.FileWriter('/tmp/train', session.graph)
test_summary_writer = tf.summary.FileWriter('/tmp/test')

命令行输入或输出的样式如下:

wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/images.tar.gz
wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/annotations.tar.gz

黑体字:表示本书中出现的新术语或重要的词语。屏幕菜单或对话框中的文字按照如下样式显示:“完成后,点击Actions|Instance State|Terminate终止实例。”

 警告或重要说明如此图标所示。

 提示和技巧如此图标所示。

保持联系

我们欢迎读者反馈。

一般反馈:发送电子邮件到feedback@packtpub.com并在消息主题中提及书名。如果你对本书的任何方面有疑问,请发送电子邮件至questions@packtpub.com

勘误:尽管我们已经尽全力确保内容的准确性,但错误在所难免。如果你在本书中发现错误,请将此报告给我们,我们将不胜感激。请访问www.packtpub.com/submit-errata,选择你的图书,单击勘误提交表单链接,然后输入详细信息。1

1本书中文版勘误请关注图灵社区公众号-底部菜单栏进入图灵社区-搜索本书——编者注

反盗版:如果你在互联网上以任何形式发现我们作品的任何非法复制品,请将网址或网站名称提供给我们,我们将不胜感激。请通过copyright@packtpub.com与我们联系并提供材料的链接。

成为作者:如果你有专业知识并且对撰写图书感兴趣,请访问authors.packtpub.com

评论

请留下评论。既然你阅读并使用了本书,为什么不在购买的网站上留下评论呢?这样,潜在读者就可以看到并根据你的客观意见做出购买决定,我们可以了解你对我们产品的看法,作者也可以看到你的反馈。谢谢!

有关Packt的更多信息,请访问packtpub.com

电子书

扫描如下二维码,即可购买本书中文电子版。

目录

  • 版权声明
  • 译者序
  • 前言
  • 第 1 章 入门
  • 第 2 章 图像分类
  • 第 3 章 图像检索
  • 第 4 章 目标检测
  • 第 5 章 语义分割
  • 第 6 章 相似性学习
  • 第 7 章 图像题注
  • 第 8 章 生成模型
  • 第 9 章 视频分类
  • 第 10 章 部署