数据科学与商业分析:用机器学习与统计学优化商业决策
3推荐 收藏
1.3K阅读
图灵程序设计丛书

数据科学与商业分析:用机器学习与统计学优化商业决策

马特 • 塔迪(Matt Taddy) (作者) 陈光欣 (译者)
● 解决从数据到业务实操的最后一公里问题
大数据和机器学习等的兴起使得商业分析领域越来越倚重数据科学。本书详细介绍了商业数据科学中的关键元素,汇集了机器学习、经济学以及统计学领域的核心原则和最佳实践,内容涵盖识别商业政策中的重要变量、通过实验测量这些变量,以及挖掘社交媒体以了解公众对于政策修改的反应,为从事商业数据科学的数据科学家和商业人士提供了必备工具。书中通过大量数据分析示例讲解如何利用R语言编写脚本来解决复杂的数据科学问题。
纸质书
¥81.18 ¥99.00

出版信息

  • 书  名数据科学与商业分析:用机器学习与统计学优化商业决策
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 张卫国
  • 出版日期2021-03-15
  • 书  号978-7-115-55913-5
  • 定  价99.00 元
  • 页  数251
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售

所属分类

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Python编程:从入门到实践(第2版)

    埃里克·马瑟斯(Eric Matthes)   袁国忠   译

    本书是针对所有层次Python读者而作的Python入门书。全书分两部分:第一部分介绍用Python编程所必须...

本书特色

本书是解决数据业务问题的实践指南,旨在通过大量真实的一线案例,介绍如何将业务问题和数据联系起来。本书详细展示运用统计学+机器学习+经济学进行数据分析,进而驱动和优化商业决策的过程。

“马特·塔迪撰写了一本关于在统计学基础上使用大数据的详尽而有深度的书。本书实战性强,案例丰富,充满真知灼见,是相当棒的参考资源。”
——Preston McAfee,谷歌杰出科学家,微软前首席经济学家,加州理工学院教授

“马特·塔迪是芝加哥大学布斯商学院的明星教师,并在微软和亚马逊带领数据科学团队。基于丰富的教学和工作经验……他将现代统计学、机器学习算法和社会科学因果模型中的重要概念巧妙地综合在一起,写出了一本通俗易懂的书。这本书有望成为该领域的标杆级著作。
——Guido Imbens,斯坦福大学商学院经济学教授

“如果你想知道如何使用数据分析驱动更好的决策过程,那么这本书不可不读。”
——Emily Oster,布朗大学经济学教授

“马特·塔迪综合计算机科学、经济学和统计学中的各种知识,帮助各位提升企业使用数据的能力,在这方面无人出其右。所有人都应该读一读这本书。”
——Jens Ludwig,芝加哥大学犯罪实验室主任

“这本书介绍了对于解决现代商业中的数据问题来说非常重要的数学理论和实战方法。”
——David Blei,哥伦比亚大学计算机科学与统计学教授

目录

对本书的赞誉
献词
前言
常见符号的标准用法
第0章 引言 1
从两张图说起 1
大数据与机器学习 4
计算 6
第 1章 不确定性 14
1.1 频率不确定性和bootstrap方法 14
1.2 假设检验和错误发现率控制 25
1.3 贝叶斯推断 33
第 2章 回归 37
2.1 线性模型 37
2.2 逻辑回归 46
2.3 偏差与似然 49
2.4 ◆回归不确定性 53
2.5 空间和时间 56
第3章 正则化 64
3.1 样本外预测效果 64
3.2 正则化方法 68
3.3 模型选择 77
3.4 ◆lasso的不确定性量化 87
第4章 分类 94
4.1 最近邻 94
4.2 概率、成本和分类 97
4.3 多元逻辑回归 102
4.4 分布式多元回归 106
4.5 分布式与大数据 110
第5章 实验 114
5.1 随机控制试验 115
5.2 近似实验设计 125
5.3 ◆工具变量 135
第6章 控制 143
6.1 条件可忽略性与线性处理效果 143
6.2 高维混淆变量调整 146
6.3 ◆样本分割与正交机器学习 148
6.4 异质性处理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚类 167
7.2 因子模型和主成分分析 173
7.3 主成分回归 180
7.4 偏最小二乘法 184
第8章 文本作为数据 189
8.1 分词 190
8.2 文本回归 194
8.3 主题模型 194
8.4 多元逆回归 200
8.5 协同过滤 204
8.6 词嵌入技术 206
第9章 非参数方法 209
9.1 决策树 210
9.2 随机森林 216
9.3 因果关系树 224
9.4 半参数方法与高斯过程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用机器学习 237
10.3 深度学习 240
10.4 ◆SGD 244
10.5 强化学习 248
10.6 商业环境中的人工智能 251

作者介绍

Matt Taddy,美国经济学家、数据科学家。现任亚马逊北美首席经济学家、大名鼎鼎的亚马逊经济学家团队Central Economics Team VP。曾任芝加哥大学布斯商学院计量经济学和统计学教授,明星教师,开创了数据科学课程。曾任微软商务人工智能首席研究员、eBay研究员。

大家也喜欢

  • R图形化数据分析

    John Jay Hilfiger   王洋洋   译

    本书介绍如何使用图形化的方法来分析和理解复杂的数据,该方法突出数据中重要的关联和分布趋势,并使用尽可能简单的视...

  • R语言与数据分析实战

    徐珉久   武传海   译

    R语言是面向统计和机器学习的编程语言,本书以R语言的“编程属性”为中心,介绍了熟练使用R语言的方法和关于数据可...

  • R包开发

    Hadley Wickham   杨学辉   译

    本书是一本开发理念与开发实例相结合的实用指南,主要内容包括:R包基础知识介绍,包的基本结构和可能形式,R代码,...

  • R语言入门与实践

    Garrett Grolemund   冯凌秉   译

    本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象...

  • R语言实战(第2版)

    Robert I. Kabacoff   王小宁   刘撷芯   黄俊文   译

    本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传...

相关文章

  • 预计什么时候出版?
    入门级炼丹师  发表于 2021-02-25 11:55:50
    推荐
    • 预计下个月出版。

      张卫国  发表于 2021-02-25 12:06:25
  • 有电子版?
    jiniechen  发表于 2021-03-16 15:45:56
    推荐
    • 中文版仅发售纸质版。

      张卫国  发表于 2021-03-16 17:02:04