The information

香农在伟大的《通信的数学原理》论文开篇对通信的定义是「在一点精确地或近似地复现在另一点所选取的讯息」,其中的「点」是个「精心选择的措辞」,它抽象了时间和空间。另一方面,「讯息」也是个挺有意思的说法,我查了原始论文,香农在这里使用的是 message 而非 information ,message 是各种具有实际意义的事物的总称,我们可以说一部小说、一张照片或一段音乐是 message,它与抽象的信息(informatioin)区分开,如此一来,这篇论文开启的信息论便具有了非常广泛的实用意义。

这使得我们可以用超级酷炫的公式和逻辑解释一条时间线上的微博、一张朋友圈里的照片或一段发给女神的短信。从这里开始,书中的所有内容不再只是一群死宅科学家在演算纸上的脑力游戏,而是与你我息息相关。

第一个启示来自第一章「会说话的鼓」,说的是喜庆的非洲人民用鼓来通信,鼓语源于口语单词,丢弃其中的辅音和元音,用简单的音调和音高来表达。这会导致不同的词语有相同的发音。比如,书中的一个例子提到,「月亮」和「鸡」的在鼓语中的表达都是「在高音的一端敲两下」。那么听鼓的人如何辨别这两下到底是月亮还是鸡呢?

奥秘就在于「引入冗余」,比如在鼓语中月亮不说月亮,而是「那俯览大地的月亮」,鸡不是鸡,而是「那啾啾叫的小鸡」,这些充满文艺气息的修辞的真正目的在于克服歧义,使得听鼓的人可以通过这些补充说明做出准确的分辨和理解。哈哈,这应该可以算得上是修辞学骨子里的骄傲,柏拉图当年要是知道信息论,应该也不会对修辞学那么冷嘲热讽了吧(注1)。

这让我想起之前特别流行的一个关于王家卫的段子,传说王家卫让他的演员翻译 I love you,演员说是我爱你,王导说怎么可以讲这样的话,应该是「我已经很久没有坐过摩托车了,也很久未试过这么接近一个人,虽然我知道这条路不是很远。我知道不久我就会下车。可是,这一分钟,我觉得好暖。」你们看,后一句传递的感情显然更丰富一些。

可是,当我们谈论冗余,忘情地添加细节时,势必会触发一个名叫「啰嗦」的警报。我们经常感慨某些新闻「信息量小」,或者觉得某些文学作品「空洞无物」,衡量的标尺是什么呢?

答案是「信息熵」—— 在热力学熵之后,香农提出了信息熵的概念。书中通过梳理熵的来龙去脉给出了非常漂亮的解释。香农给出的信息熵公式工整而易懂(注2)

我们可以将信息熵理解为一段文字、一段音乐中的「意义量」,熵度量的是「出乎意料的程度」(注3)。你发短信问自己老婆「你爱我吗?」,她回「爱」,信息量很小,若她回「不爱」…嗯,对,信息量太大了。

既然我们已经可以度量信息量,那么想在讯息中提高信息量,该怎么做呢?

又是香农——香农提出的香农公式,通俗的解释是信息传递速度与信道带宽与信噪比相关。我们不妨把这两个概念演化到我们写作中去看,信道的带宽是信道中能承载信息的「载体数」,我们可以把它想象成我们自己的词汇量或信息传递的方式,信噪比则是信道中有价值的金句与废话之间的比例。(注4)

香农公式的第一个意义便是告诉我们,带宽和信噪比是可以互相交换的,也就是在传输速度不变的情况下,提高带宽可以容忍更低的信噪比,反之亦然。带宽和信噪比的互换是扩频通信的理论基石,通过增加带宽,我们甚至可以轻松应对小于0的信噪比(也就是噪声功率高于信号功率——想象一下,打开音箱,沙沙的噪声比音乐还响我们还能把音乐还原出来)。

如果类比我们的写作,我们能做的事情便是「增加词汇量」或「少写废话」,增加词汇量无需赘言(注5)。除此之外,减少无事生非的文艺腔便是「少写废话」了,丘吉尔说「总而言之,短句子好,老格言更好」便是此理。

香农公式的第二个意义在于给出了信息传递的上限,也就是俗称的香农限。香农限定义之后,总是动不动就听说什么技术又突破香农限了之类的(注6)。事实上迄今为止没有任何一种通信或编码技术突破了香农限,人们利用新科技和智慧不断逼近香农限,这是一个非常动人的故事,一位老人画了一条优雅的线(公式非常漂亮)说,极限在这里,接着后人废寝忘食地向这条线逼近,在我看来,过程中的每一篇文献,每一个进步都是在向香农致敬。

当我们学会冗余和简化之后,最难的部分就到来了,那就是「精简」——恰当的冗余,恰当的简化。必须承认,到了这里,便不再是公式,而是一个迷。

作者对分子生物学以及道金斯和他在《自私的基因》中首次提出的模因(注7)做了介绍和评述。提到「没有某个基因对应某个属性的说法,而是众多基因共同决定了表现型上的差异」,还提到复杂而「有生命力的」模因拥有的多样化的载体。

在我看来这便是这个问题的答案,若对A的描述需要的冗余可以携带B的信息,则可以理解为我们所写的文字「没有冗余地充满了信息」。这也便是我们评价文章或故事时说到的「环环相扣」「前后呼应」的意思。

如同破击基因密码一般,这是个庞大而复杂的过程,我想更多的是靠写作者的直觉和天赋吧(说到这里让我有点儿无奈,哈哈…),司汤达说「爱情所能提供的最大幸福正是两人初次牵手时的触觉」,我想写作者的成功便是能用文字牵住读者的小手儿,用一个精简的「触觉」传递最大的意义吧。

通篇书评我一直在用「写文章」在类比信息论中的观点,可事实上「信息」其实是万事万物背后的本质,书中名言「It from bit」一指戳破,我们可以通过这本书了解信息论,从而用信息论作为框架来思考很多事情,甚至人生。

比如书中描述的巴贝奇传奇一生,他造出来的「计算机器」直到多年之后才被理解价值,他做了跟所有人不同的事情,他让所有人出乎意料。还记得我们说信息熵衡量的是出乎意料吗?我们可以说他的一生是「信息量很大的一生」。

如果我们一生只是重复其他人的老路,按部就班,没有任何出乎意料,我们的一生便是没有信息量的,或者说「没有价值的」。 ​ 就像蚁群中不跟随同伴留下的信息素前行的蚂蚁一般,他们所探索的路多半会被遗忘,但却是整个蚁群找到更短路径的唯一希望。也像并无主观意识的基因,当他们变异时,其实是在用九死一生的机率给整个物种带来适应明天的希望。

所以不要去重复,要去尝试,要去出乎意料。成败你无从选择,但活一辈子是否有价值却在你自己手里。

与大家共勉,新年快乐!

:)

——————————————

注1. 柏拉图指责修辞学是危险的把戏,使无知的笨蛋显得充满智慧,认为在真理面前不应该使用修辞。他的学生亚里士多德则指出修辞其实很适合「传播真理」,柏拉图虽然对修辞学冷嘲热讽,但还是给后世留下了许多精彩的修辞框架。(来自维基百科)

注2. 跟热力学熵简直就是一样的,霍金告诫我们文中放任何数学公式都会导致销量锐减,那我也不放公式了……

注3. 说个八卦,九几年的时候有几个学者基于中文平均熵高于英文的前提爆发了中文好还是英文好的论辩,出了不少像「就语言文字来说,整体效率不是用民族主义来衡量的,而是用信息熵来衡量的。」之类的金句,还挺有趣的,百度这句话应该就可以找到,感兴趣可以去看看,哈哈。

注4. 作为光通讯专业的学生,为了保住专业清誉,我必须自己指出这里的类比并非十分精准,权当是个隐喻吧,若希望对信道和信噪比有更深入的理解,不妨读一下这本书,或者去找本信息学的书看看。

注5. 多嘴一句,其实所谓的「一图抵千言」也是另一种用图来增加词汇量的方法。

注6. 其中比较著名的是高通部分披露 CDMA 的一些技术参数后引起的争论,有教授指出 CDMA 算法突破了香农限,后来这个教授看到所有技术细节(并没有突破香农限)后还写了好多关于 CDMA 的文章。

注7. 原文是 Meme,这个单词有着近十种翻译方法,我个人偏爱张莹译本的《自私的基因》中「觅母」的译法,但也认同「模因」是最准确的翻译方法,也与「基因」一脉相承。

—————————— from 微信公众账号 二爷鉴书(findbook) findbookqr