Python数据分析:活用Pandas库
12推荐 收藏
20.6K阅读
图灵程序设计丛书

Python数据分析:活用Pandas库

丹尼尔·陈 (作者) 武传海 (译者)
请至页面右侧“随书下载”获取配套文件。

● 轻松掌握流行的Python数据分析工具
● 深入浅出,示例丰富,容易理解和上手
本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和Series对象,使用matplotlib、seaborn和Pandas提供的绘图方法为探索性数据分析作图,连接与合并数据集,处理缺失数据,清理数据,转换数据类型,处理字符串,应用函数,分组操作,拟合及评估模型,正则化方法与聚类技术等。
纸质书
¥70.31 ¥89.00

出版信息

  • 书  名Python数据分析:活用Pandas库
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 张卫国
  • 出版日期2020-03-14
  • 书  号978-7-115-52911-4
  • 定  价89.00 元
  • 页  数312
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Pandas for Everyone: Python Data Analysis
  • 原书号9780134546933

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • Python编程:从入门到实践(第2版)

    埃里克·马瑟斯(Eric Matthes)   袁国忠   译

    本书是针对所有层次Python读者而作的Python入门书。全书分两部分:第一部分介绍用Python编程所必须...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

本书特色

Python强大易用,是数据处理和数据分析利器,而众多库的加持令其如虎添翼。Pandas就是其中一个非常流行的开源库,它可以确保数据的准确性,将数据可视化,还可以高效地操作大型数据集。借助它,Python可以快速地自动化和执行几乎任何数据分析任务。

本书细致讲解了Pandas的基础知识和常见用法,通过简单的实例展示了如何使用Pandas解决复杂的现实问题,以及如何利用matplotlib、seaborn、statsmodels和sklearn等库辅助进行Python数据分析,涵盖了数据处理、数据可视化、数据建模等内容。此外,本书还简单介绍了Python数据分析生态系统。

亚马逊读者评论

“这本书比我读过的其他介绍Pandas的书好很多,别的书也不错,但这本书更简明扼要。作者先介绍方法,接着给出示例,然后继续推进,非常适合学习。”

“这本书令人耳目一新,讲解没有陷入无关紧要的细节和冗长的理论,而是直截了当地介绍如何精通Pandas(以及seaborn和其他库),还涵盖了数据科学的基础(整理数据、可视化等)。”

“我读过许多介绍Pandas的书、博客和论文,这本书格外出众,它讲解清晰,示例丰富,讨论也很有层次:先整体概述,再逐渐深入……一些困扰了我很久的问题在这本书中得到了解答。”

目录

前言 阅读
致谢 阅读
关于作者 阅读
第一部分 简介
第1章 Pandas DataFrame基础知识 阅读
第2章 Pandas数据结构
第3章 绘图入门
第二部分 数据处理
第4章 数据组合
第5章 缺失数据
第6章 整理数据
第三部分 数据整理
第7章 数据类型
第8章 字符串和文本数据
第9章 应用
第10章 分组操作:分割-应用-组合
第11章 datetime数据类型
第四部分 数据建模
第12章 线性模型
第13章 广义线性模型
第14章 模型诊断
第15章 正则化
第16章 聚类
第五部分 终章 
第17章 Pandas之外
第18章 写给自学者

作者介绍

丹尼尔·陈(Daniel Y. Chen)
Lander Analytics公司数据科学家,Software Carpentry和Data Carpentry的讲师和课程维护人员,DataCamp的课程讲师。目前他在弗尼吉亚理工大学社会与决策分析实验室从事政策决策数据分析。

大家也喜欢

相关文章

  • 陈孟寒 4推荐

    2月书讯 | 193张图表+388段代码,原版长销13年的日系书终于来了

    第二次世界大战后,美军为了有效管理大量的资料,便把所有的信息都集中在一个基地里,这个集中了所有信息的基地就称为 database。“数据库”一词便由此诞生。 MySQL 是世界上最受欢迎的开源数据库软件,是由米卡埃尔 • 维德纽斯在 1995 年开发的 RDBMS。起初,它是…...

  • 图灵小悦 推荐

    Python 数据分析入门宝藏书,选它!

    入门数据分析最简单的途径就是去学习 Python 生态系统中,最流行也是最基础的库之一:Pandas,尤其对于从 Excel 转向 Python 的朋友来说,从效率到功能会发现很多惊喜。 为什么要使用 Python 这样的编程语言和 Pandas 库这样的工具来处理数据呢?为…...

  • 大家好,本书P123.
    import os
    import urllib
    with open(r'C:\Users\freessh\Desktop\test\data\raw_data_urls.txt')as data_urls:
    for line,url in enumerate(data_urls):
    if line == 5:
    break
    fn = url.split('/')[-1].strip()
    fp = os.path.join('..','data',fn)
    print(url)
    print(fp)
    #urllib.request.urlretrieve(url,fp)
    由于一些网络问题代码数据不能正常下载,这可能会导致后面案例无法操作,现在,把这部分需要的数据包已下载分享给各位,共500M
    链接:https://pan.baidu.com/s/1FSuuGO26fW78pxk8-GaX4Q
    提取码:zch0
    本人B站主页: https://space.bilibili.com/406566843 欢迎访问啊,帮忙点点赞 ,谢谢。
    freessh  发表于 2020-05-24 15:50:03
    推荐
    • 有人心,给力

      故事经济学  发表于 2020-11-18 21:23:22
    • 能发书中的所有数据包吗?286944198@qq.com

      全德胜  发表于 2021-04-24 11:28:02
  • 看完了这本书觉得实用性非常强,里面的代码基本都用手敲过了一遍
    无知的真理追求者  发表于 2020-04-26 21:05:54
    推荐
  • 申请翻译,
    reyne  发表于 2018-02-28 22:20:04
    推荐
    • 试译请先发邮件给zhuw@turingbook.com(朱巍,图灵资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:11
  • 申请翻译,
    reyne  发表于 2018-02-28 22:25:45
    推荐
    • 试译请先发邮件给zhuw@turingbook.com(朱巍,图灵资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:05
  • 申请翻译
    龙家晓言  发表于 2018-03-02 19:19:24
    推荐
    • 试译请先发邮件给zhuw@turingbook.com(朱巍,图灵资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:08:54
  • 申请试译
    gobelieve  发表于 2018-03-13 13:47:23
    推荐
    • 试译请先发邮件给zhuw@turingbook.com(朱巍,图灵资深策划)介绍自身技术背景,并注明想翻译的图书。

      英子  发表于 2018-04-02 21:09:00
  • 申请翻译,
    geeeeeeeek  发表于 2018-08-06 11:02:29
    推荐
  • 期待
    白宦成  发表于 2018-09-20 09:35:15
    推荐
  • 图灵在售的还有哪本书讲pandas比较详细啊?
    大羊羊  发表于 2019-11-12 19:07:12
    推荐
    • 《Python数据分析实战(第2版)》目前正在印制,很快会出版。

      张卫国  发表于 2019-11-13 09:42:48
    • @张卫国 了解啦,目前正在看Python数据科学手册的第三章,实战这本先去下个单~

      大羊羊  发表于 2019-11-15 13:07:55
    • 个人觉得是《Python 数据科学手册》

      Leszek  发表于 2020-05-11 16:09:07
    • @Leszek
      没错,我看了这本,从numpy到pandas,里面的例子十分易懂,非常棒。

      大羊羊  发表于 2020-05-22 09:44:11
  • 老师,这本书大约什么时候能上市呢?
    Jeonhae  发表于 2019-12-05 18:07:37
    推荐
    • 您好,预计一月初出版。

      张卫国  发表于 2019-12-06 14:19:12
  • 电子书今年出吗?
    yueyeKIDL  发表于 2020-02-28 13:45:47
    推荐
    • 本书仅发售纸质版。

      张卫国  发表于 2020-02-28 16:50:01
  • 发售了吗?
    飞飞小雨  发表于 2020-03-09 20:11:35
    推荐
    • 已印刷完成,很快会发售,谢谢关注。

      张卫国  发表于 2020-03-10 16:30:48
    • @张卫国 几月可以买到

      nickcarter  发表于 2020-03-13 22:18:49
    • @nickcarter 您好,现已发售。

      张卫国  发表于 2020-03-16 11:59:08
  • P6 country_df = df['country'] 这个获取的其实就不是 DataFrame,而是 Series。
    要让获取的是 DataFrame,还要加个 [] 才行 country_df = df[['country']]
    Leszek  发表于 2020-05-16 00:14:17
    推荐
    • 感谢指出。

      张卫国  发表于 2020-05-17 16:49:06
  • 这书有出电子版的计划吗?
    gbhx413  发表于 2020-07-20 10:31:21
    推荐
    • 您好,这本书没有电子书授权。

      张卫国  发表于 2020-07-20 10:35:23
  • 小错误:P30,最下方一段关于布尔值索引:”#获取索引0,1,4和5“。漏写了index 7,应为“#获取索引0,1,4,5和7”
    MiGiLee  发表于 2020-10-08 11:42:14
    推荐
    • 感谢指出。

      张卫国  发表于 2020-10-15 10:03:53