数据科学入门
16推荐 收藏
23.0K阅读

数据科学入门

Joel Grus (作者) 高蓉 , 韩波 (译者)
2016年最受欢迎电子书 技术类TOP10,全榜单:http://www.ituring.com.cn/article/273709
本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

电子书
¥34.99
格式
mobi   pdf

纸质书
¥62.10 ¥69.00

出版信息

所属分类

本书特色

介绍数据科学基本知识的重量级读本,Google数据科学家作品。

数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。

作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。

* 简单介绍Python
* 回顾一下线性几何、统计和概率知识,了解搞数据科学的时候怎么使用它们
* 收集、探索、清理、转换和操作数据
* 了解机器学习的基本知识
* 实现K近邻、朴素贝叶斯、线性及逻辑回归、决策树、神经网络及聚类等模型
* 探索推荐系统、自然语言处理、网络分析、MapReduce,还有数据库

目录

版权声明 阅读
O'Reilly Media, Inc. 介绍 阅读
前言 阅读
第 1 章 导论 阅读
第 2 章 Python速成
第 3 章 可视化数据
第 4 章 线性代数
第 5 章 统计学
第 6 章 概率
第 7 章 假设与推断
第 8 章 梯度下降
第 9 章 获取数据
第 10 章 数据工作
第 11 章 机器学习
第 12 章 k近邻法
第 13 章 朴素贝叶斯算法
第 14 章 简单线性回归
第 15 章 多重回归分析
第 16 章 逻辑回归
第 17 章 决策树
第 18 章 神经网络
第 19 章 聚类分析
第 20 章 自然语言处理
第 21 章 网络分析
第 22 章 推荐系统
第 23 章 数据库与SQL
第 24 章 MapReduce
第 25 章 数据科学前瞻
作者简介
关于封面

作者介绍

Joel Grus是Google的一位软件工程师,曾于数家创业公司担任数据科学家。目前住在西雅图,专注于数据科学工作并乐此不疲。偶尔在joelgrus.com发表博客,长期活跃于Twitter @joelgrus。

大家也喜欢

  • 数据挖掘与分析:概念与算法

    Mohammed J. Zaki   Wagner Meira Jr.   吴诚堃   译

    【内容摘要】 本书是专注于数据挖掘与分析的基本算法的入门图书,内容分为数据分析基础、频繁模式挖掘、聚类和分类...

  • R图形化数据分析

    John Jay Hilfiger   王洋洋   译

    【主要内容】 本书介绍如何使用图形化的方法来分析和理解复杂的数据,该方法突出数据中重要的关联和分布趋势,...

  • 数据分析实战

    [日]酒卷隆治 里洋平   肖峰   译

    本书由实战经验丰富的两位数据分析师执笔,书中首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真...

  • 菜鸟侦探挑战数据分析

    石田基广   支鹏浩   译

    本书以小说的形式展开,讲述了主人公俵太从大学文科专业毕业后进入征信所,从零开始学习数据分析的故事。书中以主人公...

  • R语言与数据分析实战

    徐珉久   武传海   译

    R语言是面向统计和机器学习的编程语言,本书以R语言的“编程属性”为中心,介绍了熟练使用R语言的方法和关于数据可...

  • 304页能讲这么多东西吗?
    SCICN  发表于 2016-03-06 14:57:31
    推荐
    • 找本英文电子版看看

      simonclickk  发表于 2016-03-15 11:21:02
  • 本书的Python版本是2还是3,还是说本书的实例代码是两者兼容容的?
    arscoder  发表于 2016-03-23 18:18:48
    推荐
    • 美亚上有人说英文版用的是python 2

      SCICN  发表于 2016-03-23 18:57:41
    • 那我要考虑下了要不要买了。

      arscoder  发表于 2016-03-24 11:18:20
    • Data Science这方面基本上都是Python 2,这有什么纠结的。

      Allanz  发表于 2016-03-24 12:10:34
    • 我目前所有的Python书都是基于Python3的,这意味着我可能不得已要再学下Python2.7的相关内容。

      arscoder  发表于 2016-03-24 15:13:51
    • 别这样,平时用着差别没你想的那么大...

      舒克贝塔  发表于 2016-03-27 20:25:56
    • 我看了书了,说的很清楚,是Python 2

      Xwoder  发表于 2016-04-04 19:48:39
    • 我指的是python3和python2差没那么大,不影响你学习东西

      舒克贝塔  发表于 2016-04-08 10:06:49
    • 书中提供的 github 上提供了 python3的源代码

      石维康  发表于 2016-04-23 15:42:59
  • 希望有电子版
    Taipa  发表于 2016-02-22 00:46:34
    推荐
    • 是的希望有电子版

      simonclickk  发表于 2016-03-11 14:29:36
  • 什么时候可以买?
    XiaoKuiKui  发表于 2016-03-07 14:59:01
    推荐
    • +1 +1 +1

      hsorra  发表于 2016-03-10 10:39:58
  • 这本书的翻译排版上有很多明显的错误。。
    freetstar  发表于 2016-09-12 09:36:33
    推荐
    • 有错误就提勘误嘛,还有积分赚。

      bnuwangly  发表于 2016-10-25 18:55:41
    • 呵呵,已经提了

      freetstar  发表于 2016-10-27 19:26:24
  • 这个网站上的图书都是正版的吗???有朋友了解的可是说说吗?已经买了一本,希望作者能拿到收入。
    leroy520  发表于 2017-03-07 19:47:52
    推荐
    • 这个可是图灵的官网啊:实在不放心,可以去查一下备案号。http://www.beianbeian.com/search/ituring.com.cn

      alberthao  发表于 2017-03-13 15:35:03
  • 太幸福了阿,这几本新书电子版都是直接就能买!!!
    Taipa  发表于 2016-03-23 12:58:18
    推荐
  • 原版电子书是彩色的  这个怎么不是彩色啊   
    RealRain  发表于 2016-06-21 20:39:29
    推荐
  • 已经在看了 是本不错的书 讲得很实用
    简杨君  发表于 2016-08-31 09:46:04
    推荐
  • 不知道在这里评论会不会有人解答:书上 153 页下边写着“各个单词的概率相乘即可”,为什么是相乘呢?相乘的结果不就是所有单词同时出现吗?垃圾邮件应该是某个单词出现吧?
    求解答,谢谢谢谢!
    zphhhhh  发表于 2016-10-14 22:24:59
    推荐
  • pdf怎么下不了?
    Prime_007  发表于 2017-03-30 16:37:48
    推荐