enter image description here FlowingData的作者Nathan Yau最近受邀去美国国家统计局指导帮助他们做数据可视化。这段经历让他感慨颇多,于是在FlowingData上发文讨论了他在和统计局的专家们讨论时 注意到的可视化的五大误区。我们看了也心有戚戚焉。于是决定把原文大致翻译一些,分享给大家,一起讨论讨论。

可视化让数据更炫 这个恐怕是最常见的误解了。在看了众多可视化和信息图后,绝大多数人都很自然的想要让自己的数据也变成那样。于是人们最常问我的问题就是:”我有怎么样怎么 样的数据,有什么好的可视化方法可以让他们看起来更炫呢?“ 不管你花多少时间让图标更好看,让图更精致,如果你只有五个数据点,就别想了。一个可视化之所以有意思,是因为背后的数据有意思。

比如,大家都非常喜欢我制作的可视化:沃尔玛的扩张。这个可视化充分展现了沃尔玛的扩张策略:在一个地方落地生根,然后迅速向附近地区蔓延。尽管我花了不少时间美化这个可视化,但是Toby Segaran的原始版本一样展示了类似的信息,也很有意思。再来看看另一个可视化:Taget的扩张。它用了一模一样的可视化,但是就不那么有意思了。因为Target的扩张并没有象沃尔玛那样有策略。

对于可视化来说,首要的一定是数据。可视化之所以有趣是因为它能展现简单的数据列表所不能表现的信息。

软件和工具无所不能 有各种各样的可视化工具。至于哪个最好,还得是具体问题具体分析。我最常用的是R和Illustrator。最近,我开始学习使用JavaScript。工 具的灵活性对我来说非常重要。我想要能最大限度的定制最后生成的可视化和用户交互。我的可视化通常是为一般读者设计的。但如果我是一个处理海量数据的分析 师,可能会选择不同的方法。我要说的是,并没有一款万能的工具可以包办一切。有些工具适合用来做数据分析,有的则适合来描述一个故事。

一个图里信息越多越好 人们最常犯的错误就是在他们的可视化里面堆砌了太多的信息。我完全赞成在可视化中提供足够的背景信息,并且标注出有意思的数据点。但是凡事总有限度,必要的时候不如把一个复杂的图一分为二。 有 人尝试在通过加多个坐标轴,或者用大量的视觉线索(visual cues)让一个图表能包含更多的信息。有时候是可以的。但是更多的时候,这并不可行。通常,一个简单清楚的图更有效。我最常做的事就是给一个既不了解这 个数据,也不懂可视化的路人看我的可视化。问问他们从中得到了什么信息。

可视化是主观片面的,所以沒有用。 可视化的过程中不可避免的总是有设计师的主观意识。比如选择显示哪部分数据,选择用什么样的方式可视化。但是如果你理解你处理的数据,诚实的对待信息,就能 避免犯主观片面的错误。其实,哪怕数学统计某种程度上也是主观的。因为你选择了要分析的数据和分析方法,最后写报告的时候也选择了要说的结论。 新闻媒体每天都在面对这样的问题。他们要理解数据,进行选题。建议看看纽约时报的可视化,看看他们是怎样客观的描述数据的。

可视化一定要精确 如果你在可视化中显示了每一个数据的精确值和标准误差,这个可视化恐怕不怎么样。准确是重要的。但是可视化并不是关于某一个孤立的数据的。更多的是展现数据 在时间和空间上的分布和变化。我们要展现的是数据中潜在的特征。所以我们在可视化的时候真正要做的是比较和抽象。如果你需要看到每个数据点,那把所有数字 放在一个列表里显然更合适。

想听Nathan Yau侃数据可视化知识,就读《数据之美:一本书学会可视化设计》,当当网、京东网、亚马逊等网上书城及书店热卖中!

《数据之美:一本书学会可视化设计》(Data Points: Visualization That Means Something) 《鲜活的数据》(Flowing Data)作者最新力作,《大数据时代》作者、《经济学人》大数据主编肯尼思·库克耶倾情推荐,中国人民大学出版社2014年3月出版,敬请关注!