图书

  • 菜鸟侦探挑战数据分析

    石田基广   支鹏浩   译

    本书以小说的形式展开,讲述了主人公俵太从大学文科专业毕业后进入征信所,从零开始学习数据分析的故事。书中以主人公...

  • R语言与数据分析实战

    徐珉久   武传海   译

    R语言是面向统计和机器学习的编程语言,本书以R语言的“编程属性”为中心,介绍了熟练使用R语言的方法和关于数据可...

  • R包开发

    Hadley Wickham   杨学辉   译

    本书是一本开发理念与开发实例相结合的实用指南,主要内容包括:R包基础知识介绍,包的基本结构和可能形式,R代码,...

  • R语言入门与实践

    Garrett Grolemund   冯凌秉   译

    本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。书中涵盖R语言编程的方方面面,内容涉及R对象...

  • R语言实战(第2版)

    Robert I. Kabacoff   王小宁   刘撷芯   黄俊文   译

    本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传...

  • 学习R

    Richard Cotton   刘军   译

    编写简单的R程序,知道R语言能做什么 使用向量、数组、列表、数据框和字符串等数据类型 掌握条件语句以及分支...

  • R语言实战

    Robert I. Kabacoff   高涛   肖楠   陈钢   译

    本书先介绍了R语言,然后举例说明了R语言的各种特性,内容涉及数据挖掘方法、R的可扩展的图形环境、有用的附加模块...

文章

  • 子华 1推荐

    R语言中的情感分析与机器学习

    利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy P.Jurka开发的情感分析以及更一般的文本挖掘包已经得到了很好的发展。你可以查看下sentiment包以及梦幻般的RTextTools包。实际上,Tim…...

  • 钱亦欣 1推荐

    【译文】R语言中的离群值检测和处理

    【译文】R语言中的离群值检测和处理 作者Selva Prabhakaran 译者 钱亦欣 数据中的离群值往往会扭曲预测结果并影响模型精度,回归模型中离群值的影响尤其大,因此我们需要对其进行检测和处理。 离群值检测的重要性 处理离群值或者极端值并不是数据建模的必要流程,…...

  • 钱亦欣 2推荐

    【译文】2016年度Analytics Vidhya上最火爆的36篇文章和资源

    作者 KUNAL JAIN 译者 钱亦欣 引言 时光犹如白驹过隙,又到一年末尾,该做点总结了。(译者注:原文有大量抒情文字,我懒得翻译了。。。) 这篇文章总结了16年度本网站上最火的资源,我们把它们分成了指南,短文,职业文和技能测试四个板块以方便阅读。 如果你是个新人…...

  • 钱亦欣 2推荐

    【译文】使用文本挖掘技术分析Twitter用户对电影的评价

    作者佚名 译者钱亦欣 引言 使用一些建模分析手段来评价电影的成功已经屡见不鲜,这类预测模型常常使用注入电影制作成本,类型,主演,出品方等结构化数据作为输入。然而,在社交媒体日益发达的现在,人们时常会在Twitter,Facebook等网站上发表自己的意见和建议。社交媒体已…...

  • 钱亦欣 2推荐

    【译文】用R语言做网页爬虫和文本分析

    【译文】用R语言做网页爬虫和文本分析 作者 Florent Buisson 译者 钱亦欣 受到这篇情感分析的文章和这篇网页爬虫[指南](http://zevross.com/blog/2015/05/19/scrape-website-data-wit… ...

  • 钱亦欣 2推荐

    【译文】ggplot2 包主题范例

    【译文】ggplot2 包主题范例 作者 Andrea Cirillo 译者 钱亦欣 译者注:ggplot2是R语言中使用最多,功能最全面,效果最好的数据可视化包(你看我都不加之一)。包作者为男神Hadley Wickham(本月他的书《R包开发》也在图灵上架)。 这篇…...

  • 钱亦欣 2推荐

    【译文】利用R语言处理数据库中的数据

    【译文】利用R语言处理数据库中的数据 作者Fisseha Berhane 译者 钱亦欣 R中的dplyr包是我最喜欢的包之一(译者注:也是我的最爱),可以用来处理存储在内存和数据库中的数据。本文我会分享自己使用dplyr包来处理数据的经验,基本还敢数据处理的方方面面。关于…...

  • 钱亦欣 2推荐

    【译文】利用dplyr包进行数据操作

    【译文】利用dplyr包进行数据操作 作者 Teja Kodali 译者 钱亦欣 dplyr是R中用来进行数据操作的一个包,由Hadley Wickham(男神!)编写维护。它提供了一些功能强大,易于使用的函数,这些函数对于数据探索分析和数据操作而言非常实用。在本文中我将…...

  • 钱亦欣 2推荐

    【译文】R语言中的缺失值处理

    【译文】R语言中的缺失值处理 作者 Selva Prabhakaran 译者 钱亦欣 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失…...

  • 钱亦欣 2推荐

    【译文】R语言中离群值的识别、描述、绘制与移除

    【译文】R语言中离群值的识别、描述、绘制与移除 作者 Klodian Dhana 译者 钱亦欣 统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。 鉴定离群值的方法有很多种,包括…...

  • 钱亦欣 2推荐

    【译文】R语言不平衡数据分类指南

    【译文】R语言不平衡数据分类指南 作者 MANISH SARASWAT 译者 钱亦欣 引言 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而,世事并…...

  • 2gua 2推荐

    R的矩阵相乘/逆矩阵,小礼物和美食 - 2013.06.06小计

    相信很多人都不记得矩阵相乘了吧?举例是最好的了: ![enter image description here][1] ![enter image description here][2] R中的表示: A %*% B 那逆矩阵呢?定义:*对于n阶方阵A,如果存在n阶方阵C…...

  • 2gua 2推荐

    《统计思维》 - 习题1.3练习

    开始做《统计思维》的练习题,貌似作者为写本书,自己开发了很多Python基础库,你得对这些代码有一定了解,所以,这本书的学习还是有一定挑战度的,不会Python,至少来说你的练习就做不下去了,咳,幸好我也是Pythonic,只是很久不用了就是...... 习题1.3共四小点作…...

  • 毛倩倩 2推荐

    R语言实战(图8-6)

    本书图8-6在1~4印次时有误,于第5印次改正。正确的图如下所示。 ...

  • 出版圈郭志敏 3推荐

    《R实战》封面里的故事

    本书的封面图片标题是“来自扎达尔的男人”。这张图片取自19世纪中期Nikola Arsenovic的一本克罗地亚传统服饰图集的复刻版,由克罗地亚斯普利特的Ethnographic博物馆在2003年时出版。图片由Ethnographic博物馆一位热心的图书管理员提供。斯普利特在中…...

  • 2gua 3推荐

    R中比较古怪的运算符

    说点R技巧,R中比较古怪的运算符。 %%:取模; %/%:整除; [代码] > 19 / 4 [1] 4.75 > 19 %% 4 [1] 3 > 19 %/% 4 [1] 4 > & 和 |:逻辑与和逻辑或,作用于对象的每一个元…...

  • 钱亦欣 3推荐

    【译文】如何在R语言中使用SQL命令

    【译文】如何在R语言中使用SQL命令 作者 Fisseha Berhane 译者 钱亦欣 对于有SQL背景的R语言学习者而言,sqldf是一个非常有用的包,因为它使我们能在R中使用SQL命令。只要掌握了基本的SQL技术,我们就能利用它们在R中操作数据框。关于sqldf包的…...

  • 钱亦欣 4推荐

    【译文】因子分析在2016欧洲杯数据中的应用

    【译文】因子分析在2016欧洲杯数据中的应用 作者 Hamze Dokoohaki 译者 钱亦欣 本文我将演示如何对2016年欧洲杯第一轮小组赛的数据进行因子分析(FA)。同时,我假设你对于因子分析的背景知识已经有了足够了解,所以我在此就把论述重点放在了应用上。 维基百…...

  • 2gua 6推荐

    R读写文件略记

    R读写文件,我用得最多的就是csv格式文件。 读文件举例如下(D:\temp\1.csv): ![enter image description here][1] 示例代码如下: > myData = read.table(file = "d://temp…...

  • 2gua 6推荐

    喜形于色

    ![enter image description here][1] 今天终于“启封”了Canon 600D,这是个数据和信息可视化的年代,没有色彩怎么能行?就像Pinterest一样,原来图片、照片也能这么玩啊。刚去网店又买了个单反相机包,五月的福州,是最美的季节,不出去走…...