以下是常规的统计学手段,也是统计过程:

  • 收集数据:基础性工作,数据收集;
  • 描述性统计:计算出能总结数据的统计量,并评测各种数据可视化的方法;
  • 探索性数据分析:寻找模式、差异和其它能解答我们问题的特征。并会检查不一致性,确认其局限性;
  • 假设检验:在发现明显的影响时(如两个族群间的差异),需要评判这种影响是否真实,也就是评判是否因随机因素造成;
  • 估计:用样本数据推断出具体特征。

外,有必要搞明白以下三门关联学科:

  • 概率论:研究随机事件,可能或不可能;
  • 统计学:根据数据样本推测总体情况,大部分统计分析都基于概率;
  • 计算:码农们最熟悉了,是量化分析的最佳工具,比如用R、Python、分析软件等等。

图灵出版的这本统计思维小册子(口袋书^_^),非常适合快速掌握基础,坐在地铁里看最好了。
接下来陆续做个总结提炼。