前 言

近年来,我们在媒体上到处可见人工智能(AI)这个词,而深度学习是人工智能的一种实现方法。下面我们就来简单地看一下深度学习具有怎样划时代的意义。

下面是三张花的图片,它们都具有同一个名字,那究竟是什么呢?

图像说明文字

答案是玫瑰。虽然大小和形状都不一样,但这些的确都是玫瑰花的图片。看到玫瑰花的图片,我们理所当然就能辨别出“这是玫瑰花”。

在计算机和数学的世界中,这个玫瑰花的例子属于模式识别问题。人类每天都在进行着模式识别。比如,我们在逛街的时候就会无意识地进行着物体的辨别:“那是电影院”“信号灯是红灯”,等等。换言之,这就是在进行模式识别。

然而,像这样的人类认为很自然的事情,一旦想让机器来做,就变得非常困难。例如,现在让你编写一个模式识别的计算机程序,使其从大量花的图片中单独提取出玫瑰花的图片,你可能就束手无策了。

实际上,关于模式识别的理论创建一直在碰壁。例如,对于玫瑰花的模式识别,以前的逻辑是将“玫瑰是具有这样特征的东西”教给机器,然而效果甚微。因为玫瑰花的形状实在是太多了,即使是相同品种的玫瑰花,其颜色和形状每时每刻也都在发生变化,不同品种的玫瑰花则会有更大的差异。要从如此多样的特征之中得出“玫瑰”这样一个概念,的确是太难了。

后来,一种被称为神经网络的数学方法被研究出来。具体来说,就是将模拟动物的神经细胞的神经元聚集起来形成网络,然后让这个网络去观察大量的玫瑰花的图片,进行“自学习”。相比之前的模式识别逻辑,该方法取得了很大的成功。特别是利用称为卷积神经网络的多层结构的神经网络,甚至可以从图片和视频中识别出人和猫。深度学习就是用具有这种结构的神经网络实现的人工智能。

虽然“自学习”听起来很难,但神经网络运用的数学理论是非常简单的,基本上是比较基础的数学知识。然而,很多文献大量使用公式和专业术语,令人难以看透神经网络的本质,这对于今后人工智能的发展是莫大的不幸和障碍。本书作为人工智能的入门书,目的就是要破除这种障碍,让所有人都能够体会到神经网络的趣味性。本书的目标是用初级的数学知识详细地讲解深度学习的思想。

只要从本质上理解了基础知识,就可以在应用中大展身手。但愿本书能够对 21 世纪人工智能的发展有所贡献。

最后,本书从策划到最终出版,得到了技术评论社渡边悦司先生的大力支持,我们借此向他表达深深的谢意。

2017 年春

笔者

目录