以下是常规的统计学手段,也是统计过程:
- 收集数据:基础性工作,数据收集;
- 描述性统计:计算出能总结数据的统计量,并评测各种数据可视化的方法;
- 探索性数据分析:寻找模式、差异和其它能解答我们问题的特征。并会检查不一致性,确认其局限性;
- 假设检验:在发现明显的影响时(如两个族群间的差异),需要评判这种影响是否真实,也就是评判是否因随机因素造成;
- 估计:用样本数据推断出具体特征。
另外,有必要搞明白以下三门关联学科:
- 概率论:研究随机事件,可能或不可能;
- 统计学:根据数据样本推测总体情况,大部分统计分析都基于概率;
- 计算:码农们最熟悉了,是量化分析的最佳工具,比如用R、Python、分析软件等等。
图灵出版的这本《统计思维》小册子(口袋书^_^),非常适合快速掌握基础,坐在地铁里看最好了。
接下来陆续做个总结提炼。