ap统计学知识点
AP统计学考试知识点一、描述统计
* 数据(data)分为定性数据(qualitative or categorical data)与定量数据(quantitativedate)。
定性数据:按照类别进行划分,展示对象的属性;
定量数据:展示对象的数值特征。
* 图(graph):分为bar chart, pie chart, dotplot, stemplot, histogram, boxplot
* 通过图形可以看出数据的分布特征:
(1)对称(symmetric)
(2)偏态(skewed)
左偏(skewed to the left)
右偏(skewed to the right)
(3)集中趋势
(4)异常值
* histogram的画法:
(1)以个数作为高度
(2)以百分比作为高度
(3)以百分比作为面积。
* 概率密度(probability density function, pdf)
描绘以百分比作为面积的histogram的曲线。
* 累积分布(cumulative distribution function, cdf)
以小于等于该数的数据所占百分比作为该数的纵坐标绘制出的曲线。
* 数字特征(numerical value)
(1)描述集中趋势
(2)描述离散趋势
(3)描述位置
(4)标准化变量(z-score)
* 众数(mode)
一组数据中出现次数最多的数;
* 平均数(mean)
数据求和后除以数据个数。
* 方差(variance)与标准差(standard deviation)
衡量数据与平均值偏离程度平方和的平均值。
* 标准化变量(z-score)
计算方式是将原始数据减去平均数之后再除以标准差,用它可以展示不同度量单位数据的偏离程度。
* 散点图(scatterplot)
以一个变量作为横坐标、另一个变量作为纵坐标绘制出的图形,以散点的形式表现在坐标轴中。变量选用单位不同,会造成图形有差异。
* 相关系数(linear correlation coefficient)
衡量两个量之间线性关系的指标,介于-1和1之间,负数代表两个变量之间是反向变化的,正数代表两个变量之间是同向变化的,越靠近0代表线性关系越弱,越靠近-1和1代表线性关系越强。它只能衡量线性关系,不能衡量非线性关系;只反应关系,不代表因果。
* 回归(regression)
寻找代表变量之间关系的数学表达式。
* 线性回归
假定变量之间存在一次函数的关系(形如y=kx+b)。此函数在坐标系中图像是一条直线,因此称作线性回归。
* 残差(residual)
真实值与估计值之间的差。
* 残差图(residual plot)
以一个变量作为横坐标、该变量所对应的残差为纵坐标绘制出的图形。若两变量之间存在线性关系,则残差图应为无规则的散点。
* 最小二乘法(least square)
利用残差平方和最小求出直线斜率与截距(k和b)的方法。
* 线性化(linearity)
将非线性关系转换为线性关系的方法,常用有对数变换、指数变换等。
AP统计学考试知识点二、抽样方法
* 总体(population):
研究对象的全体。
* 样本(sample):
总体中的一部分。
* 参数(parameter):
描述总体特征的指标,一般用希腊字母表示。
* 统计量(statistics):
描述样本特征的指标,一般用拉丁字母表示。
* 普查(census):
对总体中的每一个个体都进行研究。
* 抽样(sample):
对总体中的部分个体进行研究。
* 实验法(experiment):
对目标群体进行干预而得到数据。