前言

前言

本书所面向的读者是那些在一定程度上熟悉 R 编程语言,并具有一些统计学知识(即便是碎片化的知识,或是短期接触过统计学)的数据科学家。作为本书的作者,我们都是从统计学领域迈入数据科学领域的,因此对统计学在数据科学中可做的贡献有所了解。同时,我们也十分清楚传统的统计学教学的局限所在,即统计学作为一门学科已经有 150 多年的历史了,大多数统计学课本和课程都表现出远洋轮船般的动量和惯性,很难有所改变。

本书有两大目标:

  • 以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;
  • 解释各个统计学概念在数据科学中的重要性和有用程度,并给出原因。

本书的独到之处

主要术语

数据科学融合了多门学科,包括统计学、计算机科学、信息技术和一些特定领域的研究。因此,同一个概念可能会使用多个不同的术语表述。本书将使用类似此处的格式,突出显示各个主要术语及其同义词。

排版约定

本书将使用如下排版约定。

  • 黑体字

    用于标识新的术语。

  • 等宽字体(constant width

    用于标识程序清单,以及段落内引用的程序元素,例如变量、函数名称、数据库、数据类型、环境变量、程序语句和程序语言关键字等。

  • 等宽粗体(constant width bold

    表示应由用户逐字输入的命令或其他一些文本内容。

  • 等宽斜体(constant width italic

    表示文本应被替换,替换内容由用户提供,或取决于上下文。

 此图标表示一个知识点或一条建议。

 此图标表示一处通用注解。

 此图标表示一条警告或警示。

使用代码示例

本书的补充材料(即示例代码、练习等)可从 https://github.com/andrewgbruce/statistics-for-data-scientists 下载。

本书旨在帮助你更好地完成工作。一般来说,只要是本书提供的示例代码,你都可以用于自己的程序和文档。除非你需要大规模地使用本书的代码,否则无须联系作者以获得许可。例如,你在编写代码时使用了书中的几处代码是不需要获得许可的,但销售或分发 O'Reilly 图书中的 CD-ROM 则需要获得许可。在回答问题时引用本书内容和示例代码不需要获得许可,但在产品文档中整合本书中的大量示例代码需要获得许可。

我们很希望但并不强制要求你在引用本书内容时加上引用说明。引用说明通常包括书名、作者、出版商和 ISBN。例如:“Practical Statistics for Data Scientists by Peter Bruce and Andrew Bruce (O'Reilly). Copyright 2017 Peter Bruce and Andrew Bruce, 978-1-491-95296-2.”

如果你认为自己对示例代码的使用超出了合理使用的范围或是上面介绍的许可范围,可随时通过电子邮件 permissions@oreilly.com 联系我们。

Safari® Books Online

Safari Books Online 是一个按需提供服务的数字图书馆,所提供的图书和视频来自于在技术和商业上处于世界领先地位的作者。

Safari Books Online 已被专业技术人员、软件开发人员、Web 设计师以及商业和专业创意人员使用,成为科学研究、解决问题、学习与认证培训的主要资源。

Safari Books Online 为企业、政府、教育机构和个人提供了一系列的计划和定价。

会员访问一个功能完备的数据库检索系统,就可以获得上百家出版商的上千种图书、培训视频和预发行手稿,其中包括 O'Reilly Media、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Focal Press、Cisco Press、John Wiley & Sons、Syngress、Morgan Kaufmann、IBM Redbooks、Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones & Bartlett、Course Technology 等。有关 Safari Books Online 的更多信息,可在线访问。

联系我们

请把对本书的评价和问题发给出版社。

美国:

  O'Reilly Media, Inc.

  1005 Gravenstein Highway North

  Sebastopol, CA 95472

中国:

  北京市西城区西直门南大街 2 号成铭大厦 C 座 807 室(100035)

  奥莱利技术咨询(北京)有限公司

本书页面提供了本书的勘误表、例子及其他信息,网址为 http://shop.oreilly.com/product/0636920048992.do1

1本书中文版的勘误请到 http://www.ituring.com.cn/book/2066 查看和提交。——编者注

对 O'Reilly 图书的评论和技术问题,可以发送电子邮件到 bookquestions@oreilly.com

关于 O'Reilly 图书、课程、会议和新闻等更多内容,参见网站 http://www.oreilly.com

在 Facebook 上关注我们:http://facebook.com/oreilly

在 Twitter 上关注我们:http://twitter.com/oreillymedia

在 YouTube 上关注我们:http://www.youtube.com/oreillymedia

致谢

作为本书的作者,我们希望在此感谢对本书出版提供过帮助的许多人。

数据挖掘公司 Elder Research 的首席执行官 Gerhard Pilcher 审读了本书的初稿,并做出了详细而有用的修正和评论。同样,SAS 的统计学家 Anya McGuirk 和 Wei Xiao,以及同是 O'Reilly 作者的 Jay Hilfiger,也对初稿提出了有益的反馈。

在 O'Reilly 出版社方面,Shannon Cutt 给予我们鼓励并适当地敦促我们,还在出版流程上提供了指导。Kristen Brown 使本书得以顺利地推进到生产制作阶段。Rachel Monaghan 和 Eliahu Sussman 耐心而又细致地修改了本书的书稿。Ellen Troutman-Zaig 为本书做了索引。我们还要感谢 O'Reilly 发起本书项目的 Marie Beaugureau,以及 statistics.com 讲师兼 O'Reilly 作者 Ben Bengfort,正是他将我们介绍给了 O'Reilly。

Galit Shmueli 曾与 Peter 合著过其他图书,并且多年来一直与 Peter 保持交流。这种交流使我们乃至本书都受益匪浅。

最后,我们要特别感谢 Elizabeth Bruce 和 Deborah Donnell,没有她们的耐心和支持,就不会有这本书。

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录