图书

  • Etcd源码解析

    目前在分布式一致性应用软件领域,Etcd作为一款后起之秀越来越得到广大从业人员的偏爱,大有取代ZooKeepe...

  • Zookeeper源码分析

    本书无 pdf 版本,您可以在线阅读,或者推送mobi 版。 大数据量的计算需要用到大量的机器集群作为支...

  • Hadoop应用架构

    Mark Grover   Ted Malaska   Jonathan Seidman   Gwen Shapira   郭文超   译

    本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中...

  • 走进大数据:组织如何推进大数据战略

    张东麟   武传海   译

    本书从最切实可行的大数据方案选择方法着手,面向不懂大数据相关概念、不知道如何将大数据项目引入何种领域的IT团队...

  • 数据架构:大数据、数据仓库以及Data Vault

    W.H. Inmon   Daniel Linstedt   唐富年   译

    本书是数据仓库之父Inmon的新作,探讨数据的架构和如何在现有系统中最有效地利用数据。本书的主题涵盖企业数据、...

  • Python数据分析实战

    Fabio Nelli   杜春晓   译

    Python 简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python 语言的强大功能,以...

  • Python数据挖掘入门与实践

    Robert Layton   杜春晓   译

    本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数...

  • R语言入门与实践

    Garrett Grolemund   冯凌秉   译

    本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象...

  • R语言实战(第2版)

    Robert I. Kabacoff   王小宁   刘撷芯   黄俊文   译

    本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传...

  • Spark最佳实践

    本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍...

  • 干净的数据:数据清洗入门与实践

    Megan Squire   任政委   译

    本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的...

  • 身边的未来

    李焌桢   崔航旗   译

    飞速发展的新技术为我们描绘的可预见的未来,本书介绍了包括人工智能、3D打印、信息通信、生命科学等诸多领域在内的...

  • 数据科学入门

    Joel Grus   高蓉   韩波   译

    本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:P...

  • Python网络数据采集

    Ryan Mitchell   陶俊杰   陈小莉   译

    本书适合熟悉Python的程序员、安全专业人士、网络管理员阅读。书中不仅介绍了网络数据采集的基本原理,还深入探...

  • 精通Hadoop

    Sandeep Karanth   刘淼   唐觊隽   陈智威   译

    本书是一本循序渐进的指导手册,重点介绍了Hadoop的高级概念和特性。内容涵盖了Hadoop 2.X版的改进,...

  • 决策知识自动化:大数据时代的商业决策分析方法

    Alan N. Fish   王飞跃   王晓   郑心湖   译

    本书是大数据商业实践手册,通过大量来源于流程自动化的主流应用场景,聚焦于企业业务流程中经营决策的知识自动化这一...

  • 社会媒体挖掘

    Reza Zafarani   Mohammad Ali Abbasi   Huan Liu   刘挺   秦兵   赵妍妍   译

    “这本讲述社会媒体的书结构非常合理,对学术界和产业界来说十分有用。该书以清晰易懂的方式全面地讲述了社会网络分析...

  • 云数据中心网络技术

    Gary Lee   唐富年   译

    本书聚焦于数据中心内部的网络,所讨论的话题集中在大型云数据中心内部组网所需的设备、软件和标准。主要内容包括:云...

  • Spark高级数据分析

    Sandy Ryza   Uri Laserson   Sean Owen   Josh Wills   龚少成   译

    本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金...

  • Spark快速大数据分析

    Holden Karau   Andy Konwinski   Patrick Wendell   Matei Zaharia   王道远   译

    本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具—...

  • 盼盼姐 17推荐

    《大数据》作者之二Jeffrey D. Ullman教授

    Jeffrey David Ullman(生于1942年11月22日)是一位计算机科学家,现任斯坦福大学的教授。他编写的关于编译器的教科书(各种版本非常流行被称为“龙书”)、关于计算理论的书(被称为“灰姑娘书”),以及数据结构和数据库的相关书籍都被视为是业界的规范。 ![…...

  • 陈冰 16推荐

    重新设计互联网!互联网全新地图已经解锁——《腾云》有奖问答抢赠书!

    大数据风起云涌,云计算席卷全球。 云计算时代,网络面临怎样的挑战?大数据之下,网络设计应着眼何处?虚拟化的最后1000米你该如何冲刺?OpenFlow、FCoE、LISP、FabricPath、VN-Tag、VPLS、VXLAN……当所有这一切结合到一起,你将面临怎样的情形?…...

  • 张霞@Turing 13推荐

    从资源到资产——大数据时代的企业管理

    欢迎来到大数据时代! ![enter image description here][1] ...

  • 出版圈郭志敏 12推荐

    为什么现在要谈大数据?

    “所谓大数据,是一个综合性概念,它包括因具备3V(Volume/Variety/Velocity)特征而难以进行管理的数据,对这些数据进行存储、处理、分析的技术,以及能够通过分析这些数据获得实用意义和观点的人才和组织。” 所谓“存储、处理、分析的技术”,指的是用于大规模数据分…...

  • yuangz 12推荐

    Lost in Translation

    终于把《大数据时代》一书粗略地读了一遍,一路上踉踉跄跄,感觉不少地方逻辑不通,令人费解。前三章观点时而激进,时而温和,后几章非常理性,像是将打出去的拳头又缩了回来。想到作者从事法律工作,还在《科学》杂志上发表过文章,逻辑不应如此混乱,决定找来原书一探究竟,发现中文版与英文版不太…...

  • 李松峰 12推荐

    《数据分析实战》选读:大数据时代的总体和样本

    译者:王群锋(简介附后) 译文未经编辑 总体和样本 让我们先来统一一些术语和概念。 在经典统计学理论中,有总体和样本之分。提起总体,人们会马上有以下反应:美国人口总数3亿、世界人口总数70亿等。但是,在统计推断中,总体并不特指人口,它可以是任何对象,任何单位,比如推…...

  • 英子 12推荐

    专题图书败家特推之第六届云计算大学

    各位小伙伴,不知不觉地,[第六届中国云计算][1]大会已经悄悄地开幕了,今天是第一天哦,接下来的21日~23日会更为火爆。各路英雄豪杰正马不停蹄地奔向大会,图灵君也抱着一众美书“陆”降现场。小伙伴们,大数据风起云涌,云计算如火如荼啊,图灵君也觉得这股浪潮着实无法抵抗,这不,我诚…...

  • 英子 11推荐

    数据从业人员图灵参考图书一览表

    ▌​基础知识 {数学与算法} [具体数学][1] [概率论及其应用][2] [程序员的数学][3] [程序员的数学2:概率统计][4] [程序员的数学3:线性代数][5] [算法(第4版)][6] [… ...

  • 2gua 11推荐

    六月六好书

    很想说一句,这个6月,图灵出版发力了,吸引我的书一下子有好几本。 《机器学习》:大数据火了,机器学习也跟着火了,“in Action”系列就代表着口碑,况且还是 @王斌_ICTIR 参与翻译的; **《[大数据的冲击](http://www.ituring.com.cn……...

  • 风林火山 10推荐

    大数据见闻录之编程语言的华山论剑

    从接触软件开发开始,我就一直在学习各种语言,并被同事嘲讽为“Hello World“。其实,我是在寻找最有影响力语言,最适合我性格和习惯的语言。但是在实际的工作中渐渐的被IDE惯坏了,Java成了还用最多的语言。但是内心对C仍然满怀尊敬,但是对C++一直很讨厌。随着对Andro…...

  • 出版圈郭志敏 9推荐

    写在《机器学习实战》上市之前

    编者按: 大家期待已经的《机器学习实战》终于送印制了,预计6月初即可上市。在此之前,有发过一篇微博,转发量6百有余,今日,确定了上市信息,立即发出消息与大家分享。如何将数学矩阵描述的机器学习算法转化为可以实际工作的应用程序是本书的主要目的,本书使用Python语言进行编程,希望…...

  • 谢工在百度 9推荐

    为大数据时代做好准备——来自《大数据的冲击》一书精彩片段

    需求高涨的数据科学家 从技术方面来看,硬盘价格下降,NoSQL数据库等技术的出现,使得和过去相比,大量数据能够以廉价高效的方式进行存储。此外,像Hadoop这样能够在通用性服务器上工作的分布式处理技术的出现,也使得对庞大的非结构化数据进行统计处理的工作比以往更快速且更廉价。 …...

  • 盼盼姐 9推荐

    “龙书”作者Jeffery Ullman:相信你自己,自由地思考(图灵访谈)

    图灵访谈之四十一:专访《大数据》作者Jeffery Ullman教授 英文版 完整无修订英文版 … ...

  • 盼盼姐 9推荐

    IBM美女工程师Holden Karau:寻找友善的人一起共事(图灵访谈)

    Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks Cloud的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负…...

  • 盼盼姐 9推荐

    Coursera数据工程师董飞:硅谷大数据的过去与未来(图灵访谈)

    董飞,Coursera数据工程师。曾先后在创业公司酷迅,百度基础架构组,Amazon 云计算部门,LinkedIn担任高级工程师,负责垂直搜索,百度云计算平台研发和广告系统的架构。董飞本科毕业于南开大学,硕士毕业于杜克大学计算机系。他在知乎上分享过多个引起强烈反响的问答,其中包…...

  • 盼盼姐 9推荐

    连城:大数据场景下的“搔到痒处”和“戳到痛处”(图灵访谈)

    连城,Databricks工程师,Apache Spark committer。《Erlang/OTP并发编程实战》与《Erlang并发编程(第一篇)》译者。目前从事Apache… ...

  • 钱亦欣 9推荐

    【译文】17个助你开阔视野、熟练技能的免费的数据科学项目(数据集)

    【译文】17个助你开阔视野、熟练技能的免费的数据科学项目(数据集) 作者 MANISH SARASWAT 译者 钱亦欣 简介 数据科学项目可以为你的分析师生涯开辟一条康庄大道,通过它们你不仅可以提升实战经验,也可以让你的CV更加吸引人。毕竟现在已经不是只凭证书和简历就能…...

  • OneAPM官方技术博客 8推荐

    新手福利:Apache Spark 入门攻略

    【编者按】时至今日,Spark 已成为大数据领域最火的一个开源项目,具备高性能、易于使用等特性。然而作为一个年轻的开源项目,其使用上存在的挑战亦不可为不大,这里为大家分享 SciSpike 软件架构师 Ashwini Kuntamukkala 在 Dzone 上进行的 Spar…...

  • 盼盼姐 8推荐

    李厦戎:一个在生物领域创业的数据控(图灵访谈)

    李厦戎称自己为数据控,他致力于机器学习算法和分布式系统的实际应用。目前他正在生物数据领域创业,创办聚道科技(Genedock),希望用数据技术推动生命健康行业革新。李厦戎曾在中国最大的移动数据服务平台友盟工作,他作为首席数据科学家,带领团队针对移动数据特点,构建了面向数十亿移动…...

  • 喵一喵 8推荐

    【J+】8月【Java高并发实践】【Druid实时海量多维数据分析】

    ![enter image description here][1] J+移动互联网技术沙龙2016八月场! 大伙注意: 场地转移到(山东省济南市高新区鑫盛大厦2号楼24层 智汇蓝海路演厅) 跟奥盛大厦斜对过。 时间(8月27日-周六下午) 秋天已到,烈日转和,虽有大雨…...