数据预处理从入门到实战:基于SQL、R、Python
5推荐 收藏
2.9K阅读
图灵程序设计丛书

数据预处理从入门到实战:基于SQL、R、Python [预售]

[日]本桥智光 (作者) 陈涛 (译者)
正在印刷
请至“随书下载”下载本书的示例程序和试读样章。
在大数据、人工智能时代,数据分析必不可少。本书以数据分析中至关重要的数据预处理为主题,通过54道例题具体介绍了基于SQL、R、Python的处理方法和相关技巧。全书共4个部分:第1部分介绍预处理的基础知识;第2部分介绍以数据结构为对象的预处理,包括数据提取、数据聚合、数据连接、数据拆分、数据生成和数据扩展;第3部分介绍以数据内容为对象的预处理,涉及数值型、分类型、日期时间型、字符型和位置信息型;第4部分为预处理实战,介绍与实际业务相同的预处理流程。
本书适合新手数据科学家、系统工程师、具备编程及数理基础的技术人才,以及对数据挖掘和数据分析等感兴趣的人阅读。
纸质书
¥72.98 ¥89.00

出版信息

  • 书  名数据预处理从入门到实战:基于SQL、R、Python
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 杜晓静
  • 书  号978-7-115-55232-7
  • 定  价89.00 元
  • 页  数272
  • 印刷方式双色
  • 开  本16开
  • 出版状态正在印刷
  • 原书名前処理大全データ分析のためのSQL/R/Python実践テクニック
  • 原书号9784774196473

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

本书特色

KDD CUP 2015亚军得主多行业实战经验总结
54道例题,涵盖常见数据预处理技术
3个实战案例,快速提升应用能力
3种语言实现对比,代码优化关键点一目了然
配套数据+源码可下载

数据提取/数据聚合/数据连接/数据拆分/数据生成/数据扩展
数值型/分类型/日期时间型/字符型/位置信息型

一本书掌握大数据、人工智能时代需要的数据预处理技术

1.习题式结构,带着问题思考、学习,效果更好
本书采用问题驱动式,先抛出常见预处理任务,引导读者思考如何实现。像这样带着问题学习,可以大大提高学习效果,让理解更深入。
2.对比3种不同语言的实现,把握每种语言的特长
用SQL、R、Python对比解决相同的案例问题,可以让读者了解各语言在处理各种预处理问题时有哪些优缺点,从而根据情况选择合适的语言,提升预处理效率。
3.同时给出一般代码与理想代码,优化处理的关键一目了然
对于每道例题,都同时给出一般代码与理想代码,读者不仅可以边阅读边思考如何修改一般代码,还可以通过与理想代码的对比明白如何优化代码。

目录

正在加工……

作者介绍

本桥智光(作者)
先后在系统开发公司担任研究员,在互联网企业担任数据科学家,目前在数字医疗初创公司SUSMED株式会社担任CTO,同时就职于HOXO-M株式会社,并以自由职业者的身份从事量子退火计算机的验证工作,拥有制造业、零售业、金融业、运输业、休闲业和互联网等多个行业的数据分析经验。曾在KDD CUP 2015中赢得亚军。爱好是开发马里奥AI。
Twitter:@tomomoto_LV3
陈涛(译者)
运筹学硕士毕业,主要从事数据库、数据分析工作,对机器学习、深度学习领域相关的理论和技术较为熟悉。因兴趣自学日语,一直致力于追求兴趣和工作的完美结合。
邮箱:victory123_456@163.com
  • 申请翻译
    CT  发表于 2018-09-18 13:08:16
    推荐
  • 期待!
    datadt  发表于 2018-11-01 22:18:32
    推荐
  • 终于预售了!期待的搓搓手
    GISGOGOGO  发表于 2021-01-12 15:21:46
    推荐
  • 这本书内涵好,而实际上面环境搭配(会成为好多限制)需要有变通,不只能翻译,还要能应用到中国国内的环境(这一块,请教一下译者陈涛先生有没有考虑到呢?谢谢耐心回复,给你加大了N倍的工作量^V^
    故事经济学  发表于 2021-01-16 14:42:41
    推荐