命令行中的数据科学
10推荐 收藏
17.8K阅读
图灵程序设计丛书

命令行中的数据科学

Jeroen Janssens (作者) 王晓伟 , 刘峰 (译者)
暂时缺货
为此,作者开发了数据科学工具箱,一个包含80多个命令行工具的安装简单的虚拟环境,能在Windows、OS X和Linux操作系统上运行。你将学会如何结合使用这些小而强大的命令行工具,快速地获取、清洗、探索和建模数据。

通过阅读本书,你会明白为什么命令行是一种灵活、可伸缩、易扩展的技术。即使你已经能够使用Python或R得心应手地处理数据,利用命令行也将大大改进你的数据科学工作流。

通过本书你将学会:

从网站、API、数据库和电子表格中获取数据
对纯文本、CSV、HTML/XML和JSON格式数据进行清洗
探索数据,计算描述性统计信息,进行可视化呈现
管理数据科学工作流
使用单行命令和已有的Python或R代码创建可重用的命令行工具
实现数据密集管道的并行化和分布化
使用降维、聚类、回归和分类算法对数据进行建模

“命令行体现了Unix‘简单工具’的理念,即每个工具完成一项工作,然后巧妙地连接在一起。Jeroen很专业地讨论了怎样将这个理念引入数据科学工作,展示了为什么命令行不仅能够进行简单的文件输入/输出,还是数据操作、探索,甚至建模的利器。”——Chris H. Wiggins,《纽约时报》首席数据科学家,哥伦比亚大学应用物理学与应用数学系副教授

“这本书讲解了如何将常见的数据科学任务集成到一个连贯的工作流,涵盖了分解问题和组合方案的策略。”——John D. Cook,知名应用数学、统计及软件开发咨询顾问

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

电子书
¥24.99
格式
mobi   pdf

纸质书
¥38.71 ¥49.00

出版信息

  • 书  名命令行中的数据科学
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2015-05-27
  • 书  号978-7-115-39168-1
  • 定  价49.00 元
  • 页  数188
  • 印刷方式黑白
  • 开  本16开
  • 出版状态暂时缺货
  • 原书名Data Science at the Command Line
  • 原书号978-1491947852

所属分类

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

大数据时代,数据科学研究与分析日益重要。本书独树一帜,教你利用灵活的命令行工具成为高效多产的数据科学家。

目录

版权声明 阅读
O'Reilly Media, Inc.介绍 阅读
献词 阅读
前言 阅读
第1章 简介 阅读
第2章 入门指南 阅读
第3章 数据获取
第4章 创建可重用的命令行工具
第5章 数据清洗
第6章 管理数据工作流
第7章 数据探索
第8章 并行管道
第9章 数据建模
第10章 总结
附录A 命令行工具列表
附录B 参考文献
关于作者和封面

作者介绍

Jeroen Janssens是爱思唯尔(世界领先的科技及医学出版公司)首席数据科学家,曾是纽约YPlan公司高级数据科学家。专门从事机器学习、异常检测和数据可视化。在荷兰马斯特里赫特大学获得人工智能硕士学位,在荷兰蒂尔堡大学获得机器学习博士学位。他热衷于创建数据科学的开源工具,个人网站是http://jeroenjanssens.com/。

大家也喜欢

  • Python数据挖掘入门与实践(第2版)

    罗伯特·莱顿   亦念   译

    本书以实践为宗旨,对数据挖掘进行了详细地入门引导。本书囊括了比赛结果预测、电影推荐、特征提取、好友推荐、破解验...

  • Java数据科学实战

    [美] 迈克尔 • R. 布茹斯托维奇   姜建锦   赵绪营   张岩   译

    本书基于清晰的、面向对象的Java代码,讨论了数据科学研究的一些基本原理。考虑到项目所需的可伸缩性、稳健性以及...

  • Python数据分析:活用Pandas库

    丹尼尔·陈   武传海   译

    本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python...

  • 商战数据挖掘:你需要了解的数据科学与分析思维

    汤姆·福西特   福斯特·普罗沃斯特   郭鹏程   管晨   译

    数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书进行了深入解读...

  • Python数据分析实战(第2版)

    法比奥·内利   杜春晓   译

    Python简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python语言的强大功能,以最小...

相关文章

  • 对数据科学这个内容很感兴趣,只是不知道这本书翻译得怎么样,有看过的说下感受么
    小洋葱  发表于 2015-09-07 21:18:59
    推荐
    • 看到了第四章,感觉翻译质量挺一般的,有些句子没有翻译出英文版中原文的意思

      cdarling  发表于 2017-03-01 15:19:42
  • 请教一下,在一开始安装的时候 有一条命令 :

    By running the following command, the Data Science Toolbox will be downloaded and booted.

    $ vagrant up

    If everything went well, then you now have a Data Science Toolbox running on your local machine.

    但是这条命令是从ASW下载一个.box文件,由于大陆网络问题,命令行无法访问,所以我用别的工具下载了这个文件,然后我应该怎么使用这个文件呢,我再次在终端输入 vagrant up ,此命令依旧再一次尝试从AWS下载,而不是我应该把已经下载好的放置到哪个目录?
    YUHANG  发表于 2016-02-28 10:00:35
    推荐
    • 参考以下链接中的命令:https://ruby-china.org/topics/12487

      cdarling  发表于 2017-03-01 15:21:11
  • 太高深
    mars007qx  发表于 2015-05-15 15:03:08
    推荐
  • 前几章就是我们经常干的
    lt  发表于 2015-06-03 00:51:08
    推荐