精通特征工程
10推荐 收藏
9.4K阅读
图灵程序设计丛书

精通特征工程

爱丽丝·郑 , 阿曼达·卡萨丽 (作者) 陈光欣 (译者)
上市销售
通过Python示例掌握特征工程基本原则和实际应用,增强机器学习算法效果
本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中
的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

PS:也会在图灵社区电报频道更新

电子书
¥29.99
格式
mobi   pdf

纸质书
¥48.38 ¥59.00

出版信息

  • 书  名精通特征工程
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2019-04-15
  • 书  号978-7-115-50968-0
  • 定  价59.00 元
  • 页  数156
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists
  • 原书号9781491953242

所属分类

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

特征工程是机器学习流程中至关重要的一个环节,然而专门讨论这个话题的著作却寥寥无几。本书旨在填补这一空白,着重阐明特征工程的基本原则,介绍大量特征工程技术,教你从原始数据中提取出正确的特征并将其转换为适合机器学习模型的格式,从而轻松构建模型,增强机器学习算法的效果。

然而,本书并非单纯地讲述特征工程的基本原则,而是通过大量示例和练习将重点放在了实际应用上。每一章都集中研究一个数据问题:如何表示文本数据或图像数据,如何为自动生成的特征降低维度,何时以及如何对特征进行标准化,等等。最后一章通过一个完整的例子演示了多种特征工程技术的实际应用。书中所有代码示例均是用Python编写的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。

- 数值型数据的特征工程:过滤、分箱、缩放、对数变换和指数变换
- 自然文本技术:词袋、n元词与短语检测
- 基于频率的过滤和特征缩放
- 分类变量编码技术:特征散列化与分箱计数
- 使用主成分分析的基于模型的特征工程
- 模型堆叠与k-均值特征化
- 图像特征提取:人工提取与深度学习

目录

版权声明 阅读
O'Reilly Media, Inc. 介绍 阅读
前言 阅读
第 1 章 机器学习流程 阅读
第 2 章 简单而又奇妙的数值
第 3 章 文本数据:扁平化、过滤和分块
第 4 章 特征缩放的效果:从词袋到 tf-idf
第 5 章 分类变量:自动化时代的数据计数
第 6 章  数据降维:使用 PCA 挤压数据
第 7 章 非线性特征化与 k-均值模型堆叠
第 8 章 自动特征生成:图像特征提取和深度学习
第 9 章 回到特征:建立学术论文推荐器
附录 A 线性建模与线性代数基础
作者简介 阅读
封面简介 阅读

作者介绍

爱丽丝·郑(Alice Zheng) 亚马逊广告平台建模和优化团队负责人,应用机器学习、生成算法和平台开发领域的技术领导者,前微软研究院机器学习研究员。

阿曼达·卡萨丽(Amanda Casari) 谷歌云开发者关系工程经理,曾是Concur Labs的产品经理和数据科学家,在数据科学、机器学习、复杂系统和机器人等多个领域都有丰富经验。

大家也喜欢

  • Feature Engineering一般应该翻译为特征工程吧
    fantasma  发表于 2018-05-08 23:11:37
    推荐
  • 这本书啥时候能出来啊?有电子版不?
    郝林  发表于 2018-12-12 16:14:16
    推荐
  • 电子书啥时候出来
    机器小白  发表于 2019-03-20 11:04:33
    推荐
  • 这本书什么时候出来啊
    abing  发表于 2019-04-01 15:57:29
    推荐
    • 即将开始印刷,预计4月中旬会出版:)

      岳新欣  发表于 2019-04-01 17:34:33
  • 电子版购买之后就会发送吗?
    美的热水壶  发表于 2019-04-08 17:13:46
    推荐
    • 您好,电子书的相关说明请见http://www.ituring.com.cn/article/497743

      岳新欣  发表于 2019-04-09 08:53:59
    • @岳新欣 同问,这本书的电子书购买了会发货吗?因为显示“预售”,不知道购买了是否还是要跟纸质书一样需要等? 您发送的这个链接中没有针对该问题有用的信息

      kidzying  发表于 2019-04-09 18:32:32
    • @kidzying 直接可以下载pdf文件

      coderzc  发表于 2019-04-09 22:16:29
    • 购买之后就可以下载的。

      岳新欣  发表于 2019-04-10 09:01:10
  • 附带的源代码只有代码文件,没有对应的数据文件,导致代码没有办法运行。这个问题如何解决。
    coderzc  发表于 2019-04-09 22:15:46
    推荐
    • “随书下载”中新增了几个数据集的下载链接,请看看能否解决您的问题。

      岳新欣  发表于 2019-04-10 08:57:35
    • @岳新欣 谢谢回复。不过有些链接的数据集对不上。在3.1.2节使用的数据集是challenge 6的,但是链接中只有challenge 13。

      coderzc  发表于 2019-04-10 11:55:11
    • 我也有同感,而且数据集找起来好麻烦,我都没有找到。

      送你一匹马  发表于 2019-07-05 21:17:14
    • @coderzc数据集的下载链接在哪里?我怎么一直没找到呢?

      送你一匹马  发表于 2019-07-05 21:24:09
  • 请问 第 9 章 回到特征:建立学术论文推荐器 中的数据集要在哪里找呢 随书下载的文档里也没提
    Hendyzone  发表于 2019-04-15 17:33:45
    推荐
    • 请试试https://www.openacademic.ai/oag/

      岳新欣  发表于 2019-04-16 08:53:07
    • @岳新欣 找到了 感谢

      Hendyzone  发表于 2019-04-17 09:25:55
  • 已购电子版,特征工程一起学习交流可加微信yulianghao809
    奔跑的海盗会笑  发表于 2019-04-22 16:19:34
    推荐
  • 第8页 ——“在百万歌曲数据集中,原始的收听次数并不是衡量用户喜好的强壮指标。”“强壮”不应该是鲁棒吗
    caroline_123  发表于 2019-05-03 19:29:31
    推荐
  • 本书应该配套数据集,而不是提供下载地址自行下载,因为下载的数据集很多不符合原代码的要求
    ranranV  发表于 2019-05-19 15:19:33
    推荐
  • 很好的书,另外第六章标题多了一个空格,能否去除
    樊睡懒觉  发表于 2019-05-24 20:10:20
    推荐
  • 理解错了标题,本来以为第8章讲了图像的前处理技术。结果讲的是DNN各层对图像的处理。。。
    vpoint  发表于 2019-06-21 16:22:48
    推荐
  • 可惜正文内容没有预览,不能先试读一下看需不需要买。
    zwang  发表于 2019-06-28 11:06:02
    推荐