前言

谨以此书献给 Randolph。

前言

劣质图表随处可见

在工作中,我时常看到未臻完美的图表(在生活中也是如此——只要你独具慧眼,这些图表随处可见)。没有人有意制作劣质图表,但它们却反复出现,出自任何行业、任何公司、任何人,甚至可能出自媒体,出自你认为的专业人士之手。这是为什么呢?

{%}

图 0-1 劣质图表示例

我们没有用数据讲故事的天赋

我们在学校学习语言和数学,学会了遣词造句和讲故事,学会了理解数字。但两者并用的情况却很少见:没有人教过我们如何用数字讲故事,更何况几乎没有人天生擅长此道。

因此我们在面对这个日渐重要的需求时手足无措。科技进步让我们积累了越来越多的数据,理解这些数据的需求也随之增加。将这些数据转化为信息并驱动作出更好的决策,关键就在于将它们可视化并用它们讲故事。

由于缺乏先天技能和后天训练,我们往往最终依赖工具来处理和理解数据。随着技术的发展,不仅数据量和获取数据的渠道与日俱增,而且用来处理数据的工具也如雨后春笋般出现。回顾历史,制作图表曾是科学家或者高级技术人员的专利,而现在几乎任何人都能用制图工具(例如 Excel)将数据制作成图表,这太不可思议了。但这同时也令人担忧,若没有遵循清晰的路径,我们的想法和努力(加上往往值得商榷的默认工具)可能会最终走上歧途:使用花哨的 3D 图表、无意义的颜色和泛滥的饼图。

熟练运用 Microsoft Office?每个人都能做到!

能熟练运用文字处理应用、电子表格、演示软件——过去具备这样能力的人能够在简历中和求职市场上脱颖而出——已经成为大多数雇主最基本的要求。一位招聘人员告诉我,现在在简历上写“熟练使用 Microsoft Office”是远远不够的——这在雇主看来是基本的技能,只有具备其他技能才能让你脱颖而出。能够有效地用数据讲故事会成为你的优势,并能让你在职场上无往不利。

尽管借助科技能够获取并使用工具熟练处理数据,但使用者之间仍然存在着能力上的差距。你可以将数据存储在 Excel 中并制作出图表。对于很多人而言,数据可视化的过程到此为止。这会使最有趣的故事落于平庸,甚至更糟,让人难以或者根本无法理解。默认工具和一般实践常常令数据和讲述的故事枯燥无味。

数据的背后存在一个故事,但工具是不会理解的。这就是为什么需要你——分析师或者信息沟通者——用可视化和情境化的方式使故事生动有趣。本书会专注于这个过程。以下是一些前后对照的示例,可以让你直观地了解即将学到的内容。具体的细节将在后文中详细展开。

本书讲述的课程能够让你从简单地展示数据成长到用数据讲故事

{%}

图 0-2 示例 1(前):展示数据

{%}

图 0-3 示例 1(后):用数据讲故事

{%}

图 0-4 示例 2(前):展示数据

{%}

图 0-5 示例 2(后):用数据讲故事

{%}

图 0-6 示例 3(前):展示数据

{%}

图 0-7 示例 3(后):用数据讲故事

谁应该读这本书

如果你需要用数据跟别人沟通,包括(但绝不限于):分析师分享工作成果、学生可视化论文数据、管理者用数据驱动的方式沟通、慈善家证明自己的影响力、主管向董事会汇报,那么这本书就是为你而写的。我相信本书可以帮助你提升使用数据高效沟通的能力。用数据讲故事令许多人望而却步,而你却可以脱颖而出。

当你要“展示数据”时,有什么感受?

或许你会无所适从,不知从何处着手;或许你觉得需要做得很复杂、详尽,要能够回答所有可能的问题,因而觉得任务艰巨;又或许你有坚实的基础,但还在寻找能够让你的图表和故事更上一层楼的秘诀。在这些情况下,本书都能给你答案。

“当要展示数据的时候,我感觉……”

我在Twitter发布过一项非正式的问卷调查,结果显示:当人们要“展示数据”时,会有以下复杂的感觉。

担心无法胜任而感到沮丧。

要让对方理解数据而倍感压力。

信心不足。老板问:你能再深度探讨一下细节吗?从 xyz 三个方面来分析。

我们积累了越来越多的数据,需要以数据驱动决策,因此用数据讲故事变得比以往更为重要。无论是展示研究成果、为非盈利组织募集资金,还是向董事会汇报,甚至仅仅是为了让受众能够理解你的意思,有效的数据可视化都能够助你成功。

经验告诉我,大部分人都面临这样一个挑战:他们认识到数据可视化的必要性,但缺乏这方面的专业技能。现实中很难聘请到拥有数据可视化技能的人。部分原因在于数据可视化只是数据分析过程中的一个环节。分析师通常都有量化分析的背景,但很少受过设计方面的专业训练,这使得他们虽然能够胜任数据分析的其他环节(获取数据、清洗整理数据、分析数据、建立模型),但在最终的展示沟通上力不从心,而展示恰恰是整个数据分析流程中最终受众能够接触到的唯一环节。另一方面,数据驱动让更多的非技术人员走上分析师的岗位并用数据进行沟通。

鉴于传统教学中不会涉及有效地用数据沟通,你觉得这是一项挑战是很正常的。优秀的人才通过漫长而单调的试错来积累经验,而我希望通过本书为你指出一条捷径。

我是如何学习用数据讲故事的

我一直对数学与商业的交叉领域深感兴趣。由于接受过这两方面的教育,我能够跨越两者之间的鸿沟,帮助两者进一步了解彼此——鉴于两者一般不在一个频道上。我热爱以数据之道促成更好的商业决策。随着时间的推移,我发现成功的关键之一便是用数据进行有效的可视化沟通。

我最初意识到掌握该领域技能的重要性是在毕业后的第一份工作中——作为一名信用风险管理分析师(在次贷危机之前,即所有人真正认识到信用风险管理是什么之前)。我的工作是建立和评估统计模型,并以此预测信用犯罪和潜在损失。这意味着将复杂的数据最终转化为一些简单的结论:我们是否为预估的损失储备了足够的资金,何种场景下我们会遭遇风险,等等。我很快发现,在外观上花些时间——我的同事通常不会这么做——我的工作成果就会吸引老板们更多的注意。我开始意识到在数据可视化沟通上花时间是有价值的。

在辗转从事了信用风险管理、反欺诈、运营管理、私募等行业后,我决定在银行和金融业之外继续扩展自己的职业生涯。我停下来反思在之前工作中掌握的技能,希望能将它们用在日常工作中:从本质上讲,就是用数据影响商业决策。

我来到 Google 的人力分析团队。Google 是一家数据驱动的公司,他们甚至罕见地在人力资源方面使用了数据分析。人力分析团队是根植于 Google 人力资源部门(人称“人力运营”)的一个分析团队。团队的口头禅是确保 Google 的人力决策——面向雇员甚至未来雇员的——是数据驱动的。他们在定向招聘、吸引和激励雇员、建立高效团队、留住人才等方面用数据和分析理解并驱动决策,对我继续磨练用数据讲故事的技能是一个绝佳的场所。Google 人力分析团队非常前沿,走出了一条其他公司纷纷效仿的道路。参与建立和发展这样的团队是一段不可思议的经历。

用数据讲故事之如何做一个好的管理者

Google 公司针对如何做一名出色的管理者举办过一个引人瞩目的“氧气”项目。该项目的成果现已刊登在《纽约时报》上,在此基础上总结出的案例研究也已发表在《哈佛商业评论》上。当时的挑战之一正是如何将项目的成果展示给读者,因为读者中既有对于方法论和研究细节很挑剔的工程师,也有只注重全局概念和实际应用的管理者。我对这个项目的贡献便是寻找一个折中的沟通展示方式,一方面可以很好地将复杂的细节展现出来,从而满足工程师对于细节的执着,另一方面又能够对各个层次的管理者都显得直观易懂。本书也会对我当时工作的细节进行讨论。

当我用数据可视化方式为 Google 的人力资源部门设计一套内部培训计划时,一切都峰回路转了。我借着这个机会研究并总结出了高效的数据可视化背后的原理,也更好地理解了多年试错总结出的经验。通过这次研究,我设计了一套数据可视化课程,最终对 Google 的所有员工开放。

这套课程在 Google 公司内外都引起了反响。由于偶然的机遇,我受邀在一些慈善集会上演讲,分享数据可视化方面的经验。就这样口口相传,从慈善界到商界,人们纷纷上门向我咨询如何用数据进行高效沟通。很显然,不仅仅是 Google 才有数据可视化的需求,几乎所有的组织和企业都能因此扩大影响。我又在工作之余到各个会议和组织进行演讲,并最终选择离开 Google 去追求自己的人生目标——让更多的人学会如何用数据讲故事。

在过去的几年中,我为美国和欧洲的一百多个组织举办过数据可视化方面的研讨会,受众遍布咨询、消费品、教育、金融服务、政府、医疗、零售、科技、创业公司和非盈利组织等各行各业。受众当中既有整天处理数据的分析师,也有只需偶尔和数据打交道的职员,有需要对图表提供指导和反馈意见的主管,也有定期向董事会汇报的执行团队。我乐于看到各种行业、各种角色的人渴求这项技能。

在此过程中,我遇到了各种各样的挑战,后续也一直收到反馈和建议。我渐渐意识到数据可视化的基础才是最重要的,这些技能易于学习,又不仅限于某一特定的行业或者角色。最终我把研讨会的内容编成了课程,并在本书中与你分享。

6 节课学会用数据讲故事

我在研讨会上主要教授 5 节关键的课程。比起研讨会,本书最大的优势在于没有时间限制(研讨会往往有课时限制),因此我加入了一节附加课程(即像设计师一样思考)。关于数据的可视化设计,我还加入了很多前后对比的示例、详细的分步指导以及思维过程的剖析。这些都是我一直希望与大家分享的。

本书提供的指导都非常实用,称得上立竿见影,内容主要包括以下 6 节课程:

(1) 读懂上下文

(2) 选择合适的图表

(3) 消除杂乱

(4) 聚焦受众的视线

(5) 像设计师一样思考

(6) 用数据讲故事

横跨各行各业的例证

在本书中,我加入了一系列佐证观点的案例研究,它们分别来自科技、教育、消费品、非盈利组织等各行各业,都是我在实际工作中碰到的真实案例。我们的课程并不仅限于某一行业或角色,而是更多地着眼于有效的数据沟通相关的基础概念和最佳实践。

本书中的案例大多源自我的研讨会,为了不泄露商业机密,我对部分数据进行了修改,对场景进行了泛化。

或许有些例子与你并不密切相关,但我建议你停下来想一想,是否可以从中有所借鉴并解决你实际遇到的问题。每个例子都是一块璞玉,值得你静下心来细细打磨。

工具不限

本书中的课程着眼于最佳实践,不局限于任何制图工具和展示软件。用数据讲故事可以使用的工具很多,但不管工具多么优秀,理解数据的还是你自己。花时间学好工具的用法,让它在实际使用中成为助力而非绊脚石。

用 Excel 如何实现?

尽管我不会将讨论的重点放在具体的工具上,但本书中的示例图表均用 Excel 创建。想深入了解如何用 Excel 实现相似图表的读者,请到我的博客storytellingwithdata.com下载文章对应的 Excel 文件。

本书的结构

本书分解为一系列重点课程,每章以一节课程为核心,并讨论一些相关概念。书中会涉及一点有助于理解的理论,但会重点通过具体而现实的示例强调理论的实际应用。读完每一章,你都能立刻将课程内容付诸实践。

本书中的课程按时间顺序组织,这与我思考用数据讲故事的过程是一致的。而且后续章节在前文的基础上开展,因此我建议从头到尾阅读本书。在此之后,你可以根据面临的数据可视化挑战,回顾相关的具体兴趣点或示例。

为了让你对本书的脉络有更具体的认识,每章内容总结如下。

第 1 章:上下文的重要性

在走上数据可视化之路之前,你应该能简洁地回答以下两个问题:谁是你的受众?你需要他们了解什么或者做什么?本章会描述理解情境上下文的重要性,包括受众、沟通机制和期望的语气,还会介绍一些概念,并用示例进行阐释以帮助你充分理解上下文。对情境上下文的充分理解能够帮助你在创建图表时少走弯路,直达成功。

第 2 章:选择有效的图表

对于你想要沟通的数据,什么才是最佳展示方式?我分析了我在工作中最常用的图表。本章会介绍商业环境中最常用于数据沟通的图表类型,讨论每种图表类型的合适的用例,并通过现实示例进行阐释。具体涵盖的图表类型包括简单文字、表格、热力图、折线图、斜率图、直方图、堆叠直方图、瀑布图、横条图、堆叠横条图、方形面积图。本章还囊括了应该避免使用的图表类型,例如饼图和甜甜圈图,并讨论了避免使用 3D 图表的原因。

第 3 章:杂乱是你的敌人

想象一张空白的页面或者屏幕:你添加的每一个元素都占用了受众的部分精力。这意味着我们需要一双慧眼选出允许出现的元素,并尽力识别和去除占用脑力的多余元素。本章的重点在于识别并消除杂乱。在讨论中,我会介绍视觉感知的格式塔原则,以及如何将其应用到表格或是图形这类信息的展示上。本章还会讨论对齐、留白以及对比等组成深思熟虑的设计的重要元素。本章同样用一些示例进行阐释。

第 4 章:聚焦受众的视线

本章继续探讨人们如何看图表以及你要如何相应地设计图表,其中简单讨论了视觉和记忆,从而引出大小、颜色、位置等前注意属性的重要性。我们会探讨如何有策略地通过前注意属性引导受众注意你期望的地方,并建立图形化的层级帮助引导受众按你期望的顺序处理信息。本章对颜色这种策略工具进行了深入的讨论。相关概念通过示例进行阐释。

第 5 章:像设计师一样思考

形式服从功能。这句产品设计的箴言在数据沟通中有明确的应用。谈到数据可视化的形式和功能,我们首先想到的是我们希望受众用数据做什么(功能),然后才是创建图表(形式)以简化该过程。本章会讨论传统的设计概念如何应用在数据沟通上,利用前文介绍的一些概念,从不同的视角探讨可供性、无障碍和美观。本章还会讨论一些为图表设计提高受众接受度的策略。

第 6 章:剖析样例图表

有效的图形展示值得仔细研究,从中可以学到很多。在本章中,我们会用已经学到的知识分析五幅典型的图表,揣摩其背后的思维过程,感受其设计上的选择。我们会研究如何决定图表的类型和数据的顺序,也会关注如何通过颜色选用、线条粗细和相对大小来强调或者弱化数据。我们还会研究图表中元素的摆放和对齐,以及如何合理使用标题、标签和注释。

第 7 章:讲故事的课程

故事与我们共鸣、相伴,这是数据所无法企及的。本章会介绍可用于数据沟通的讲故事的概念,考虑能跟故事大师学到什么经验。故事都有明确的开头、中间和结尾,我们会讨论如何在商业演讲中应用这套框架。我们还会涉及有效讲故事的策略,包括重复、叙述速度以及口语和书面表达的考虑等,确保故事在沟通中清晰地呈现出来。

第 8 章:综合所有课程

前面的章节中用零碎的示例阐释了各章内容的应用。本章中我们通过一个真实的示例,从头到尾全面回顾用数据讲故事的流程:理解上下文、选择合适的图表、识别和消除杂乱、引导受众的注意、像设计师一样思考,然后讲述一个完整的故事。这些课程以及图表、叙述等成果一同展示如何从简单地展示数据到用数据讲故事。

第 9 章:案例研究

本章通过一系列案例研究来探讨解决数据沟通常见挑战的具体策略,具体话题包括深色背景上的颜色选用、演讲中的动画和循环使用的平衡、建立顺序的逻辑、避免意大利面图表的策略以及饼图的替代品。

第 10 章:最后的思考

数据可视化——或者泛化的数据沟通——是科学与艺术的结晶。它显然有科学的一面,可以遵循最佳实践和指导,同样也有艺术的成分。用我们教授的课程打造你的数据可视化之路,利用你的艺术思维简化受众理解信息的过程。在这最后一章中,我们会给出继续深入学习的建议,以及在团队和组织中培养用数据讲故事的能力的策略,最后会回顾一下所学的课程。

总而言之,我们教授的课程能够让你学会用数据讲故事。让我们开始吧!

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录