很高兴参加图灵社区的电子书奖励计划,简直是免费读新书啊。第一本:特征工程入门与实践。因为一直在学习机器学习,但是在特征工程这方面还存在一些不理解,因此果断入手这本。![特征工程入门与实践][1]

第一章主要是对于特征工程的介绍,阐述了特征工程的重要性。在机器学习工程师和数据科学家日常工作中,超过50%的时间事实上都是在数据的准备阶段。这其中包括存储,清洗,组织数据等等。特征工程就是这样的一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的学习性能。一个完整的特征工程包括对于数据中特征的理解,特征增强:清洗数据,特征选择,特征构建,特征转换,特征学习。最后本章还介绍了特征工程的评估。 第二章对于数据集特征的理解进行了介绍。通过本章的学习,可以掌握对于数据等级的划分,包括定类,定序,定距,定比等级。最后,不同等级的数据可以进行的描述性分析以及常用图表给出了介绍,加强了我的理解。 第三章是对于特征增强:清洗数据的介绍。本章从对于缺失值的识别开始,介绍了缺失值的删除,缺失值的常用填充方法,数据归一化处理(z-score,min-max,行归一化),并且介绍了使用sklearn完成上述步骤的方法。最后使用Pipeline进行了演示,直观且容易理解。