计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络
3推荐 收藏
9.8K阅读
图灵程序设计丛书

计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络

[英]拉贾林加帕 • 尚穆加马尼(Rajalingappaa Shanmugamani) (作者) 白勇 (译者)
上市销售
●快速入门计算机视觉应用开发,涉及多种深度学习算法及其实现
●以真实数据集为例,结合流行技术框架
本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。
电子书
¥17.70 ¥29.50
格式
mobi   pdf

纸质书
¥46.61 ¥59.00

出版信息

  • 书  名计算机视觉之深度学习:使用TensorFlow和Keras训练高级神经网络
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 张海艳
  • 出版日期2020-03-14
  • 书  号978-7-115-53158-2
  • 定  价59.00 元
  • 页  数201
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Deep Learning for Computer Vision
  • 原书号9781788295628

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

本书特色

深度学习已在人工智能的多个应用领域(尤其是计算机视觉)中展示了其强大功能。计算机视觉是理解和处理图像的科学,并且在机器人技术、自动化等领域有广泛的应用。

本书通过实例展示了如何利用深度学习的力量来开发计算机视觉应用程序,介绍了与图像分类、图像检索、目标检测、语义分割、图像题注、生成模型等有关的各种技术。你将使用流行的Python库(例如TensorFlow和Keras)探索计算机视觉应用程序,从而掌握各种深度学习算法及其实现。

●使用TensorFlow和Keras设置深度学习的环境
●探索图像分类方法并训练一个深度学习模型
●使用预训练的卷积神经网络模型进行图像检索
●了解检测方法并实施行人检测
●了解图像题注中的各种问题及其实现
●训练一个使用生成对抗网络生成图像的模型
●了解视频分类的方法及其实现
●部署深度学习模型并进行优化

目录

版权声明 阅读
译者序 阅读
阅读
前言 阅读
第 1 章 入门 阅读
第 2 章 图像分类
第 3 章 图像检索
第 4 章 目标检测
第 5 章 语义分割
第 6 章 相似性学习
第 7 章 图像题注
第 8 章 生成模型
第 9 章 视频分类
第 10 章 部署

作者介绍

拉贾林加帕•尚穆加马尼(Rajalingappaa Shanmugamani),目前在Kairos担任技术经理。在此之前,曾在新加坡SAP公司担任深度学习主管,也在创业公司从事过计算机视觉产品的开发和咨询工作。在同行评审的期刊和会议上多次发表文章,并在机器学习领域申请了专利。与他人合著出版了Hands-On Natural Language Processing with Python、Python Reinforcement Learning、Python: Advanced Guide to Artificial Intelligence、TensorFlow Deep Learning Projects等书。

【译者介绍】

白勇,海南大学信息科学技术学院教授、博士生导师、美国归国博士。长期从事物联网、人工智能方面的研究。已承担国家级和省部级项目10多项,发表学术论文100多篇,授权中国和美国发明专利10多项。

相关文章

  • 请问这个是tensorflow哪个版本?
    ghost2006bj  发表于 2020-02-10 18:18:39
    推荐
    • 看github上是两年前上传的了,应该是tf1.x的代码。

      爱吃素的武士  发表于 2020-03-25 13:25:25
  • 申请翻译
    reyne  发表于 2018-02-28 22:20:21
    推荐
  • 申请翻译
    Elegant_LIN  发表于 2018-04-28 00:25:59
    推荐
  • 正在编辑,说明快完成了吧?
    loveliufudan  发表于 2019-03-15 08:22:43
    推荐
  • 代码是python还是c++
    Boogaloo_xt  发表于 2019-07-17 16:09:23
    推荐
    • 您好,本书代码是用Python编写的。

      杨琳  发表于 2019-07-19 16:44:38
    • @杨琳 中文版啥时候出,好想看

      Boogaloo_xt  发表于 2019-07-23 10:47:11
  • 这本书真的不建议买。
    tf1的问题暂且不提,首先,文中的代码是充斥着各种小问题的,我估计作者连自己试着执行下都没试过。当然,只要肯学,认真来回花时间看,小问题还好修。但我读到第三章,代码就已经完全没法跑了。根据作者的意思,应该是将3.1.2中新给出的代码,与之前2.1的代码合并,然后跑一下。我努力合并了,但还是给我抛出个完全无法理解的报错。
    其次,章节顺序对新手极其不友好,总归我是没搞懂为什么按这个鬼顺序来。一上来先给你各种高大上的词汇,以及极其简单的解释。之后教你怎么安装tf,占据了大量篇幅,接着开始正文。这时候你对概念不理解的话,你要翻半天,才能找到之前的名词解释。
    其三,内容晦涩难懂,很多时候我都是先尝试跑通了,然后不断读代码,谷歌搜函数,最后才搞懂的。比如我随便摘抄一段3.1.2的内容:
    “通过设置上述代码中所示的参数,可以使嵌入变量不可训练。接下来,必须定义投影器配置: 包括一个嵌入变量名称 tensor_name、元数据文件的路径和一个精灵图像(sprite image)。精灵 图像是一个具有一些小图像的图像,用于表示用嵌入来可视化的标签。如下是定义嵌入的投影的 代码”
    这里,投影器用全文搜索,可以查到整本书就两次提到,第一次是在第一章里,释义:“帮助在三维空间中可视化数据”。
    接下来你有两个选择:1、把一个动不动报错的代码跑通;2、把这段拆开能看懂,放一起看不懂的天书看懂

    另外,这本书在美亚的评价也不高。

    综上,个人非常不建议以此书入门
    arthasgxy  发表于 2020-07-24 17:55:34
    推荐
    • 持续diss

      3.1.2两个片段代码,作为入门者根本无法使用。这也就罢了,3.1.3,直接给了一段完全不知所云的,书中:
      这些值适用于此处显示的示例。对于其他图像,需要根据其大小调整这些值。可以选择一个层用于“做梦”,该层的平均值将成为目标函数,如下所示:
      score = tf.reduce_mean(objective_fn)
      gradients = tf.gradients(score, input_placeholder)[0]

      这里的objective_fn 全书只出现一次。我的理解就是,这里的objective_fn是让读者自行去取代某个层。然而很抱歉,我觉得这作者太高估读者了,为了理解这些晦涩难懂的东西,消耗的时间实在实在太不值了。
      感觉不是在学习,感觉是在修真

      arthasgxy  发表于 2020-07-27 16:59:04
    • 补充一下上面的。
      网上搜到一个解决方案
      layer = 'mixed4d_3x3_bottleneck_pre_relu'
      channel = 139
      objective_fn = graph.get_tensor_by_name("import/%s:0"%layer)[:,:,:,channel]

      来自博客
      https://computer-choco.tistory.com/111

      arthasgxy  发表于 2020-07-30 11:47:17