图书

  • 数据分析实战

    [日]酒卷隆治 里洋平   肖峰   译

    本书由实战经验丰富的两位数据分析师执笔,书中首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真...

  • R语言与数据分析实战

    徐珉久   武传海   译

    R语言是面向统计和机器学习的编程语言,本书以R语言的“编程属性”为中心,介绍了熟练使用R语言的方法和关于数据可...

  • 码农·数据技能(第24期)

    本期《码农》选取了数据采集、数据清洗、数据分析和数据可视化方向的代表性文章,帮助读者掌握从事数据科学工作所面临...

  • Python数据挖掘入门与实践

    Robert Layton   杜春晓   译

    本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数...

  • R语言实战(第2版)

    Robert I. Kabacoff   王小宁   刘撷芯   黄俊文   译

    本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传...

  • 干净的数据:数据清洗入门与实践

    Megan Squire   任政委   译

    本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的...

  • 数据科学入门

    Joel Grus   高蓉   韩波   译

    本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:P...

  • Python网络数据采集

    Ryan Mitchell   陶俊杰   陈小莉   译

    本书适合熟悉Python的程序员、安全专业人士、网络管理员阅读。书中不仅介绍了网络数据采集的基本原理,还深入探...

  • 机器学习

    Peter Flach   段菲   译

    被誉为内容最全面的机器学习教材,Machine Learning期刊主编力作 “本书写作思路清楚,逻...

  • 社会媒体挖掘

    Reza Zafarani   Mohammad Ali Abbasi   Huan Liu   刘挺   秦兵   赵妍妍   译

    “这本讲述社会媒体的书结构非常合理,对学术界和产业界来说十分有用。该书以清晰易懂的方式全面地讲述了社会网络分析...

  • 大数据:互联网大规模数据挖掘与分布式处理(第2版)

    Jure Leskovec   Anand Rajaraman   Jeffrey David Ullman   王斌   译

    本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)...

  • 推荐系统

    Dietmar Jannach   Markus Zanker   Alexander Felfernig   Gerhard Friedrich   蒋凡   译

    本书全面阐述了开发最新水平推荐系统的方法,其中呈现了许多经典算法,并讨论了如何衡量推荐系统的有效性。书中内容包...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

  • R语言实战

    Robert I. Kabacoff   高涛   肖楠   陈钢   译

    本书先介绍了R语言,然后举例说明了R语言的各种特性,内容涉及数据挖掘方法、R的可扩展的图形环境、有用的附加模块...

  • 大数据:互联网大规模数据挖掘与分布式处理

    Anand Rajaraman   Jeffrey D. Ullman   王斌   译

    本书由斯坦福大学的“Web 挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、...

  • 数据挖掘导论(完整版)

    Pang-Ning Tan   Michael Steinbach   Vipin Kumar   范明   范宏建   译

      本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。   本书涵盖五...

  • 信息检索导论

    Prabhakar Raghavan   Hinrich Schütze   Christopher D.Manning   王斌   译

      本书是一本讲授信息检索的经典教材。全书共21 章,前8 章详述了信息检索的基础知识,包括倒排索引、布尔检索...

  • 信息检索:算法与启发式方法(第2版)

    David A.Grossman   Ophir Frieder   张华平   译

      本书是“信息检索”课程的优秀教材,书中对信息检索的概念、原理和算法进行了详细介绍,内容主要包括检索模型与算...

  • 信息检索:算法与探索法(英文版•第2版)

    David A.Grossman  

    本书是“信息检索”课程的优秀教材,书中对信息检索的概念、原理和算法进行了详细介绍,内容主要包括检索策略...

  • Web数据挖掘:超文本数据的知识发现(英文版)

    Soumen Chakrabarti  

    本书是信息检索领域的名著,深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了We...

  • 刘敏ituring 9推荐

    《机器学习》作者Peter Flach访谈问题有奖征集(图灵访谈)

    Peter Flach,布里斯托大学人工智能教授,拥有20多年的机器学习教研经验。在高度结构化的数据挖掘以及通过ROC分析来评估和改进机器学习模型方面,Flach是国际领先的研究人员。他著有Simply Logical: Intelligent Reasoning by Exa…...

  • 李洁 8推荐

    编辑推荐之《推荐系统》

    当你在当当或淘宝上浏览一件衣服时,旁边总会出现“购买此商品的顾客还购买过……”或“看过此商品的顾客还看过……”之类的推荐信息。在这个物质供应极度丰富的时代,对于顾客来说,面对众多令人眼花缭乱的商品,该选择哪一个呢?于是,推荐商品起到了关键作用,这些商品… ...

  • chaosky 8推荐

    可视化数据的目的化设计

    探索自己的数据,就是我们自己在讲故事,我们希望别人能够理解我们得出的结果。 1、探索自己的数据 充分了解自己掌握的原始材料,这往往是设计数据图表时最容易忽略的。如果对自己数据集中有什么数据都不清楚,还在谈论怎么设计一张看起来精彩、漂亮又有趣的图表,无疑是痴人说梦,又怎么能够…...

  • 新华字典 6推荐

    Nathan Yau新作《数据之美:一本书学会可视化设计》(Data Points)

    Nathan Yau新作《Data Points:Visualization That Means Something》中文版《数据之美》已上市,《大数据时代》作者、《经济学人》大数据主编肯尼思库克耶倾情推荐、《经济学人》可视化类图书年度推荐,被誉为“大数据时代数据的呈现和思考…...

  • 盼盼姐 5推荐

    数据挖掘和定向广告的黄金时代——Lamp人交流会参会分享

    2月18日的lamp人交流会以“新一代互联网行为定向广告技术的挑战与优化”为主题,由品友互动联合创始人兼CTO沈学华和来自品友的几位资深工程师分享了他们在这个领域的一些见解。 ![enter image description here][1] 沈学华是本场交流会的开场嘉宾…...

  • luli 4推荐

    编辑手记:海量数据挖掘

    Web和互联网商务的普及导致了大量极大规模数据集的产生,大规模数据的应用越来越广泛,从传统的零售业到复杂的商业世界,到处都能见到它的身影。通过数据挖掘技术可以从这些数据集中发掘信息。本书集中关注那些已用于解决数据挖掘中关键问题的实际算法,这些算法甚至可能用于最大规模的数据集。 …...

  • 紫凤 3推荐

    2012,大数据五大预测

    文 / Edd Dumbill 译 / 张龙 更加强大且富有表现力的分析工具 在过去的一年中,围绕着NoSQL和Hadoop,基本的存储与数据处理引擎方面的改进工作得到了加强并且日趋工程化。毫无疑问,这种态势将会持续下去,因为我们看到了Hadoop世界中有越来越多形态各异的…...

  • 紫凤 3推荐

    大数据是否意味着更多的工作机会?

    据麦肯锡咨询公司去年公布的一份报告显示,到2018年,美国在 “能够分析数据帮助公司做出商业决策”方面将面临150万的人才缺口。 大量公司目前正在寻求可发掘大数据竞争优势的人才。那么“大数据人才”具体是指什么呢?他们需要什么样的技能和教育背景呢? ---------------…...

  • 紫凤 3推荐

    机器学习实战之开篇

    原文地址:[夜月星][1] 机器学习实战之开篇 首先说点儿题外话,上上周末去了趟杭州参加阿里巴巴2013的ADC技术嘉年华,感觉阿里巴巴的大数据不说牛逼只能说运用的真是淋漓尽致,人家有的是用户资源,这么多财富不充分挖掘真是对不起d对不起gj更对不起自己,期间赶上图灵打折,…...

  • 刘华 2推荐

    IT行业如何突出百万价值

    IT行业如何突出百万价值-开源力量 文开源力量 最近碰到个老友,谈起现在行业不景气啊!好不容易在IBM混的风生水起,今年2月大… ...

  • 盼盼姐 2推荐

    《社会媒体挖掘》作者刘欢教授访谈问题有奖征集(图灵访谈)

    刘欢(Huan Liu),亚利桑那州立大学计算机科学与工程专业教授,在教学和科研领域都取得了公认的优异成绩。研究方向为数据挖掘、机器学习、社会计算、人工智能,以及真实数据密集型应用的问题。 刘欢教授和他的学生——亚利桑那州立大学计算机… ...

  • chaosky 2推荐

    切尔洛夫脸谱图

    当希望各种指标作为一个整体进行观察时,这时切尔洛夫脸谱图(Chernoff Faces)就能满足要求。 切尔洛夫脸谱图关键在于,它会根据数据集中的数字将多个变量一次性展现在人脸的各个部位上。 通过对2008-2009赛季NBA前50位得分手的统计成绩。 R语言代码如下: in…...

  • 袁野 2推荐

    BIG DATA 大数据时代来临

    “大数据时代”已经来临,并对各个领域都产生了深远的影响。在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预见能力也已经崭露头角。 数据聚类找出霍乱病因 一种重要的数据汇总形式是聚类,在…...

  • 晨晨 2推荐

    网上可供下载的数据集合大整理

    本文严禁转载,欢迎链接 目前网上可供下载的数据众多,但是内容庞杂,我把其中比较有用的数据找了出来。 wiki系: wikipedia大家都不陌生,它的下载地址是:http://dumps.wikimedia.org/ , 这里有详细介绍:http://en.wikipedi…...

  • 晨晨 1推荐

    关于成立英语数据抓取组的倡议

    现在互联网上有着海量数据,对这些数据的抓取,加工和分享将是一件非常有意义的数据,但是目前还没有一个以抓取及分享互联网数据为目的的组织。所以我现在发起并成立了英文数据抓取组(English Data Crawling Group),简称EDCG。本组织的目标,主要是抓取英文的电商…...

  • 毛倩倩 1推荐

    编辑小记之《推荐系统实践》

    推荐系统是根据用户的兴趣特点、行为,向用户推荐用户感兴趣的信息和物品。随着互联网领域地不断发展,物品数量和种类急剧增长,用户开始面临严重的信息过载问题,很多情况下为获得感兴趣的物品和信息他们不得不浏览大量无关信息和物品。另外,因为信息及物品众多,怎样将特定物品展示到用户面前变得…...

  • 晨晨 推荐

    英语数据抓取组的章程

    1.EDCG是一个以抓取、处理和分享英文数据为目的的组织。 2.EDCG抓取的数据覆盖以下方面:商品数据,公司信息数据,公开的新闻,报纸,杂志,图书,文章,博客等内容。 3.EDCG中任何组员都可以分享所有数据,数据将存放于网盘,或用超大邮件发送给大家。抓取数据时应遵循中华人民…...

  • 晨晨 推荐

    EDCG的第一个数据抓取项目启动了

    作为EDCG成立后的第一个项目,这个项目我亲自挂帅,一共有12个人参与,目标是抓取:纽约时报,卫报,今日美国,美国国家公共广播电台,路透社,美联社的数据,预计将能够抓取到数百万的数据。 ...

  • liudl2011 推荐

    2013-数据挖掘方面书籍总结

    blank ...