R数据科学
14推荐 收藏
8.1K阅读
图灵程序设计丛书

R数据科学

[新西兰]哈德利•威克姆 [美]加勒特•格罗勒芒德 (作者) 陈光欣 (译者)
上市销售
摒弃其他R语言工具书从头到尾讲统计的陋习
从实用的R包出发,带你重新认识R和数据科学
本书的目标是教会读者使用最重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。
电子书
¥69.99
格式
mobi   pdf

纸质书
¥118.15 ¥139.00

出版信息

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

R社区领军人物作品,从典型数据科学项目所需工具模型着手,带领读者掌握R语言精华,学会熟练使用多种工具解决各种数据科学难题。

●探索——以可视化作为R编程起点,再进行重要变量选取、筛选关键观测等重要数据操 作,并对数据提出问题且找到答案。
●处理——导入、整理并转换数据。
●编程——管道操作的工作原理和替代方式,函数使用规则,如何实现迭代。
●模型——深刻理解模型背后的数学理论和数据,直观认识统计模型工作原理。
●沟通——学会R Markdown,让人们快速轻松理解你的工作。

目录

版权声明 阅读
O'Reilly Media, Inc. 介绍 阅读
前言 阅读
第一部分 探索 阅读
第 1 章 使用 ggplot2 进行数据可视化 阅读
第 2 章 工作流:基础
第 3 章 使用 dplyr 进行数据转换
第 4 章 工作流:脚本
第 5 章 探索性数据分析
第 6 章 工作流:项目
第二部分 数据处理
第 7 章 使用 tibble 实现简单数据框
第 8 章 使用 readr 进行数据导入
第 9 章 使用 dplyr 处理关系数据
第 10 章 使用 stringr 处理字符串
第 11 章 使用 forcats 处理因子
第 12 章 使用 lubridate 处理日期和时间
第三部分 编程
第 13 章 使用 magrittr 进行管道操作
第 14 章 函数
第 15 章 向量
第 16 章 使用 purrr 实现迭代
第四部分 模型
第 17 章 使用 modelr 实现基础模型
第 18 章 模型构建
第 19 章 使用 purrr 和 broom 处理多个模型
第五部分 沟通
第 20 章 R Markdown
第 21 章 使用 ggplot2 进行图形化沟通
第 22 章 R Markdown 输出类型
第 23 章 R Markdown 工作流
作者简介 阅读
封面简介 阅读

作者介绍

哈德利•威克姆(Hadley Wickham), RStudio首席科学家,统计学家,斯坦福大学、奥克兰大学、莱斯大学兼职统计学教授。已被下载数百万次的ggplot2等多款知名R包的开发者,一直致力于让普罗大众更容易上手数据分析,被R社区誉为“改变了R的人”。另著有《R包开发》等书。

加勒特•格罗勒芒德(Garrett Grolemund),RStudio数据科学家,知名R培训师,曾受邀在Google、eBay等诸多公司讲授R语言和数据科学,在DataCamp开授的R相关课程备受R开发者喜爱。另著有《R语言入门与实践》。

译者简介

陈光欣,毕业于清华大学并留校工作,主要兴趣为数据分析与数据挖掘。
  • 您好,中文翻译版和英文原版比较,缺少了英文原版的一章(9.Tidy Data with tidyr)和一节(12.4 Modifying Factor Order)。
    Ding_zhaohai  发表于 2018-08-15 07:42:43
    推荐
    • 以及12.5 Modifying Factor Levels大半内容。

      pucaloo  发表于 2018-11-09 13:55:34
  • 第19章也少了挺多内容的(如第二节关于Gapminder数据集的示例),不应该啊!:(
    pucaloo  发表于 2018-10-11 16:13:07
    推荐
  • @张海艳,书友说少了第9章和第12.4节,是真的吗?有什么解释吗?今后修订会补上吗?
    zztt168  发表于 2018-10-27 09:16:18
    推荐
    • 您好,抱歉迟复。因为这些章节有些内容不符合中国国情,所以做了相应删减。后期修订应该也不会添加了,对给您带来的不便感到抱歉!

      张海艳  发表于 2018-10-30 08:49:19
    • @张海艳 “12.5 Modifying Factor Levels中”关于fct_lump()函数的讲述以及“12.4 Modifying Factor Order”我个人看不出任何不符合中国国情之处,不应该删减的。

      pucaloo  发表于 2018-11-09 13:59:17
    • @pucaloo 感谢你热心指点,看来即使买了中文版,还得买一个英文版的才行。

      zztt168  发表于 2018-11-11 12:05:47
  • 大神的经典!一直在等!
    不知道有没有电子版?
    淡之又淡  发表于 2018-07-25 12:03:42
    推荐
    • 您好,有电子版。

      张海艳  发表于 2018-07-25 12:11:59
  • 等了好久了,什么时候能买电子版?
    Dr_Zhao  发表于 2018-07-27 15:33:04
    推荐
  • 什么时候出电子版,纸质版现在来不及了
    清半夏  发表于 2018-07-28 22:31:29
    推荐
  • 源代码下载下来打不开呢?
    leeson89  发表于 2018-08-03 14:40:42
    推荐
    • 应该是能打开的,麻烦您看一下是否未安装相应软件。

      张海艳  发表于 2018-08-03 15:06:41
    • @张海艳 已解决,谢谢

      leeson89  发表于 2018-08-03 15:14:48
    • @张海艳 电子书没有刮刮卡吗?

      leeson89  发表于 2018-08-03 16:09:56
    • @leeson89 只有纸质书才有刮刮卡,电子书没有。

      张海艳  发表于 2018-08-03 16:21:31
  • 有没有PDF版的啊,买了只发给我mobi版的,电脑上看不了啊
    doctor_xc  发表于 2018-08-22 18:49:35
    推荐
    • 可以将问题email至电子书客服邮箱:ebook@turingbook.com

      张海艳  发表于 2018-08-23 08:41:03
  • 勘误:第23页最上面两张图用错了,即第22页的 position = “identity”参数说明对应的两段代码
    阿汤  发表于 2018-08-29 14:13:32
    推荐
  • 请问下,每节的练习有答案吗?
    行走天下  发表于 2018-09-22 20:32:52
    推荐
    • 您好,实在抱歉,没有练习答案。

      张海艳  发表于 2018-09-27 08:57:46