图书

  • Python数据分析:活用Pandas库

    丹尼尔·陈   武传海   译

    本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python...

  • 特征工程入门与实践

    Sinan Ozdemir   Divya Susarla   庄嘉盛   译

    本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据开始学习,机器学习模型的成功正是取决...

  • Python数据科学入门

    Dmitry Zinoviev   熊子源   译

    本书以Python语言讲述数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络...

  • 亿级电商Elasticsearch开发实践

    ElasticSearch是一款非常流行的搜索引擎框架。它的查询速度很快,支持集群化部署,可以很容易的进行横向...

  • Python数据分析基础

    Clinton W. Brownley   陈光欣   译

    本书展示如何用 Python 程序将不同格式的数据处理和分析任务规模化和自动化。主要内容包括 :Python ...

  • Python数据处理

    【美】Jacqueline Kazil   Katharine Jarmu   张亮   吕家明   译

    本书采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程...

  • 客户端存储技术

    Raymond Camden   马德奎   译

    【主要内容】 客户端数据存储赋予浏览器快速访问数据的能力,从而节省网络流量并减轻服务器的压力,同时使离线...

  • Spark快速大数据分析

    Holden Karau   Andy Konwinski   Patrick Wendell   Matei Zaharia   王道远   译

    本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具—...

  • Storm源码分析

    李明   王晓鹏  

    本书是国内第一本详细介绍Storm设计实现的图书,从源代码的角度详细剖析了Storm的设计与实现,分析了Sto...

  • OneAPM官方技术博客 推荐

    如何使用 Cloud Insight SDK 实现 Druid 监控?

    Druid 简介与用途 首先说明,这里所说的 Druid 并不是阿里巴巴的数据库连接池项目,而是 Eric Tschetter 创立的一个开源的分布式实时处理系统,希望为烧钱的大数据处理,提供一种更廉价的选择。为了解决查询延迟问题,使用 Hadoop 来实现交互式查询分析很难…...

  • OneAPM官方技术博客 推荐

    Kafka 处理器客户端介绍

    【编者按】本文作者为 Bill Bejeck,主要介绍如何有效利用新的 Apache [Kafka][1] 客户端来满足数据处理需求。文章系国内 [ITOM][2] 管理平台 [OneAPM][3] 编译呈现,以下为正文。 如果你使用的系统需要传输大量数据,就算你没用过 [K…...