译者序

译者序

计算机视觉:电脑和智能手机的眼睛

人们经常将电脑与人脑作对比。电脑能够处理信息,并且速度非常快,但是电脑和人脑仍有很多本质上的差别,其中之一就是获取信息的方式。人类的信息超过80%是通过视觉获得的,而电脑的信息几乎全部是通过键盘鼠标录入的。你也许会说电脑中有很多多媒体信息,如图像、视频等,但严格来说这些还不能算是“信息”,因为电脑只是存储了它们,并不“认识”它们。电脑存储了大量的照片和视频,但不认识照片上的人是谁,不知道照片中的风景是在哪里拍摄的。

经常看到这样的新闻:某地为了破案,组织几十位警察、花几十个小时查看各路口的监控录像,查找嫌疑人的行踪。为什么这么麻烦?就是因为电脑只是录下视频并存储起来,并没有“认出”视频中的人。否则,只要一条数据库查询语句就解决问题了:“select 时间,视频监控点 from 监控记录 where 视频中的人脸 = 嫌疑人的脸 order by 时间。”

为解决这些问题,人们开始发展计算机视觉这门学科。计算机视觉相当于给电脑装上了真正的眼睛,使它能理解所看到的内容。它的应用非常广泛,从扫描二维码、指纹考勤,到人脸识别、车牌识别、基于内容的图像搜索、根据拍摄的景物自动定位、用手势控制游戏机、根据多幅平面图像还原3D现场、眼球活动操作电脑(科学家霍金)、无人驾驶汽车,等等。

本书特色

OpenCV是计算机视觉领域使用最广泛的开源程序库。本书并不是简单地列出各种函数和类,而是由浅入深地介绍OpenCV及有关算法,让读者从零开始学习计算机视觉和OpenCV,真正掌握相关程序的开发方法。

通过阅读本书,你将了解计算机视觉的基础知识,知道有关算法的来龙去脉,学会OpenCV的总体架构和常用功能,掌握用OpenCV解决具体问题的方法。本书将带你进入图像和视频分析的世界,揭开图像识别、图像配准、视觉跟踪、三维重建等技术的神秘面纱。

翻译过程中的一些体会

说实话,本书的翻译任务还是比较有挑战性的。这主要是因为和纯粹的软件开发类书籍相比,本书所包含的专业术语比较多,并且很多术语并没有统一和规范的中文译法。部分专业术语有多种中文译法,却没有某一种是权威的并且被大家接受的,有的甚至几乎还没有对应的中文术语。而作为一本正式的出版物,如果书中有太多的中英文混杂,不仅不够严谨,而且会让读者产生视觉疲劳,不利于阅读和沟通。因此我在翻译过程中查阅了大量的资料,尽可能在书中使用规范和权威的中文术语,如果确实没有,就选择较为常用的译法。

不过从另一个角度看,这也正好说明国内该领域的开发和应用还处于起步阶段,有相当大的发展前景。随着计算机视觉和OpenCV方面国内开发人员和中文技术资料的增加,该领域将逐步建成统一和规范的中文术语库,专业术语翻译问题很快会得到解决。

致谢

在本书的翻译过程中,我得到了图灵公司李松峰和毛倩倩老师的支持和帮助,在此表示感谢。由于本人水平有限,书中难免有疏忽和错误,恳请读者朋友们批评指正。

2014年12月于深圳

目录

  • 版权声明
  • 译者序
  • 前言
  • 第 1 章 图像编程入门
  • 第 2 章 操作像素
  • 第 3 章 用类处理彩色图像
  • 第 4 章 用直方图统计像素
  • 第 5 章 用形态学运算变换图像
  • 第 6 章 图像滤波
  • 第 7 章 提取直线、轮廓和区域
  • 第 8 章 检测兴趣点
  • 第 9 章 描述和匹配兴趣点
  • 第 10 章 估算图像之间的投影关系
  • 第 11 章 处理视频序列