前言

前言

谚语说:“一图胜千言。”有时,一张图也胜过很多数据。相比口头描述细微差别或者辨别成列数字间的关系,通过观察图片或图表更容易把握数据间的复杂关系。本书主要介绍如何使用图形化方法来理解复杂的数据,该方法强调重要的关系和趋势,简化数据形式,并且使大量数据一目了然。

目标读者

任何需要分析数据和可视化数据的人,都能从本书中受益。然而,我的主要目的是使更广泛的人群理解图形数据分析,特别是那些没有太多(或任何)R 相关经验,但又需要或想要创建各种类型的图表来理解重要数据的人。这些人可能来自商业、媒体、平面艺术、社会科学或者健康科学领域,真的需要分析数据,但可能并没有高等数学和计算机编程的背景。虽然本书专为自学设计,但也可作为初中级统计课程或研究的补充材料。

本书使用的工具是 R。这不是一本关于 R 的内容全面的教材。许多计算机课程和图书都试图告诉你借助一种语言或工具可能做的每一件事。对于曾经想按此方式学习的大多数人来说,这种方式令人感到十分烦恼和无聊。本书将把重点放在理解数据分析的图形元素和如何使用 R 生成本书讨论的各种图形,也将展示如何使用 R 的一些内置资源来获得帮助,很多其他内容则留给你继续探究。你应该有台可用的计算机,用它可轻松完成一些工作,如发送电子邮件、浏览互联网,或者使用文字处理软件、电子表格等应用程序。熟悉基本的统计知识有利于理解本书的一些主题,但对于大多数主题,这并不是必需的。

为什么选择R

小数据量的图表可以手工制作,但是利用计算机技术会更高效、准确地分析数据,生成有吸引力的图形。对于大批量数据来说,手工处理实际上是不可能的。而运用计算机软件,即使是针对非常大的数据量,也可以生成复杂的图形。

实际上,开源软件已经实现了该技术,只要拥有一台计算机。“开源”指的是所有人均可获取项目的源代码,可检查、使用、自由修改或增加源代码。

开源软件产品可提供免费下载给任何有需要的人。或许你会怀疑免费的东西质量不高,但我向你保证,一些自由软件遵循了最高的专业标准。

本书选用的 R 语言是一种编程语言,是一个统计、数学和绘图程序集合,已经被世界各地数百万人使用,包括科学、商业和媒体等领域的许多专业人士。在网站、主要报纸和其他出版物上,你可能见过由 R 制作的图形。你也将能够制作出这种专业的数据图表,因为 R 可运行在 Windows、Mac 或 Linux 操作系统上,而现在的 PC 和笔记本无非就这几类系统!

如何使用本书

要想从本书获益,你需要动手制作大量图表。为此,阅读本书时,你最好坐在计算机前操作书中给出的所有命令。而且为帮助你提升水平,许多章节除示例以外还提供了练习,比如优化示例代码或将不同的数据集制成另外一张图。最好先做完这些练习再进入下一主题。

排版约定

本书使用了下列排版约定。

  • 楷体

    表示新术语。

  • 等宽字体(constant width

    表示程序片段,以及正文中出现的变量、函数名、数据库、数据类型、环境变量、语句和关键字等。

  • 加粗等宽字体(constant width bold

    表示应该由用户输入的命令或其他文本。

  • 斜体等宽字体(constant width italic

    表示应该由用户输入的值或根据上下文确定的值替换的文本。

 该图标表示一般注释。

代码示例的使用

本书会帮你完成工作。一般来说,如果本书提供了示例代码,你可以把它用在你的程序或文档中。除非你使用了很大一部分代码,否则无需联系我们获得许可。比如,用本书的几个代码片段写一个程序就无需获得许可,而销售或分发 O'Reilly 图书的示例光盘则需要获得许可;引用本书中的示例代码回答问题无需获得许可,而将书中大量的代码放到你的产品文档中则需要获得许可。

我们很希望但并不强制要求你在引用本书内容时加上引用说明。引用说明一般包括书名、作者、出版社和 ISBN。比如:“Graphing Data with R by John Jay Hilfiger (O'Reilly). Copyright 2016 John Jay Hilfiger, 978-1-491-92261-3.”

如果你觉得自己对示例代码的用法超出了上述许可的范围,欢迎你通过 permissions@oreilly.com 与我们联系。

Safari® Books Online

Safari Books Online(http://www.safaribooksonline.com)是应运而生的数字图书馆。它同时以图书和视频的形式出版世界顶级技术和商务作家的专业作品。技术专家、软件开发人员、Web 设计师、商务人士和创意专家等,在开展调研、解决问题、学习和认证培训时,都将 Safari Books Online 视作获取资料的首选渠道。

对于组织团体、政府机构和个人,Safari Books Online 提供各种产品组合和灵活的定价策略。用户可通过一个功能完备的数据库检索系统访问 O'Reilly Media、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Focal Press、Cisco Press、John Wiley & Sons、Syngress、Morgan Kaufmann、IBM Redbooks、Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones & Bartlett、Course Technology 以及其他几十家出版社的上千种图书、培训视频和正式出版之前的书稿。要了解 Safari Books Online 的更多信息,我们网上见。

联系我们

请把对本书的评价和问题发给出版社。

美国:

  O'Reilly Media, Inc.

  1005 Gravenstein Highway North

  Sebastopol, CA 95472

中国:

  北京市西城区西直门南大街 2 号成铭大厦 C 座 807 室(100035)

  奥莱利技术咨询(北京)有限公司

你还可以发送电子邮件到 bookquestions@oreilly.com。

勘误、示例和其他信息可到 http://www.oreilly.com/catalog/0636920038382.do 上获取。

欲了解本社图书、课程、会议和新闻等更多信息,请访问我们的网站 http://www.oreilly.com

我们在 Facebook 的地址如下:http://facebook.com/oreilly

请关注我们的 Twitter 动态:http://twitter.com/oreillymedia

我们的 YouTube 视频地址如下:http://www.youtube.com/oreillymedia

致谢

在很多人的帮助下,我完成了这本书。首先,妻子 Karen 在我整个写作过程中给予的耐心、理解和鼓励,对我完成本书至关重要。我们的儿子 Eric 和女儿 Kristen 读了第 1 章后,给出了相当直接的评价,使我感到羞愧但很有帮助。担纲技术审校的 Dr. Peter Bajorski、Sarah Boslaugh 和 Philipp K. Janert 的见解、纠正和建议是很宝贵的。本书编辑 Shannon Cutt 非常积极能干,不仅在写作上提供帮助,而且在准备手稿的所有技术和操作细节上提供帮助。我不知道竟有这么多工作需要做!最后,O'Reilly 团队做了所有你看得到和看不到的事情,这一切对于生产高质量的图书至关重要,他们是如此令人尊敬。感谢所有人。

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录

  • 版权声明
  • O'Reilly Media, Inc. 介绍
  • 前言
  • 第一部分 开始使用 R
  • 第 1 章 R 基础
  • 第 2 章 R 图概述
  • 第二部分 单变量图
  • 第 3 章 带状图
  • 第 4 章 点图
  • 第 5 章 箱线图
  • 第 6 章 茎叶图
  • 第 7 章 直方图
  • 第 8 章 核密度图
  • 第 9 章 条形图
  • 第 10 章 饼图
  • 第 11 章 地毯图
  • 第三部分 双变量图
  • 第 12 章 散点图和折线图
  • 第 13 章 高密度图
  • 第 14 章 Bland-Altman 图
  • 第 15 章 QQ 图
  • 第四部分 多变量图
  • 第 16 章 散点图矩阵和相关性分析图
  • 第 17 章 三维图
  • 第 18 章 协同图
  • 第 19 章 聚类分析:树状图和热图
  • 第 20 章 马赛克图
  • 第五部分 现在该做些什么
  • 第 21 章 拓展图形化知识和 R 技能的资源
  • 附录 A 参考文献
  • 附录 B R 的颜色
  • 附录 C R Commander 图形用户界面
  • 附录 D 使用 / 引用的包
  • 附录 E 从 R 的外部导入数据
  • 附录 F 章节练习解答
  • 附录 G 故障排查:为什么我的代码不工作
  • 附录 H 本书介绍的 R 函数
  • 关于作者
  • 关于封面