最近对大数据和统计学很感兴趣,于是买了一些书来看。首先从从这本以描述而非计算为主的《赤裸裸的统计学》看起。作者是《经济学人》杂志的记者,这种并不是特别专业的人写出来的书反而可能会更通俗易懂。本书从简单的知识点比如平均数、中位数、标准差开始讲起,慢慢深入,涉及相关系数、概率论,然后再逐步引入中心极限定理和正态分布,并提出统计推断和假设检验的概念和基本流程,最后介绍了用途最多的回归分析。在每个部分,除了介绍这些统计学概念和方法外,一定会谈及滥用这些方法可能会出现的错误,越是实用好用的方法,就越是容易被滥用。