总体
指具有某些共同的、可观测的特征的一类事物的全体,构成总体的每一个基本单位称为个体
样本
从总体中选出来的个体集合
随机取样
从总体中取样本,要求总体中的每一个个体被抽取到的概率相同,用随机取样抽取的样本叫随机样本
描述统计
指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质
推论统计
指运用一系列数学方法,将从样本中获得的结果推广到样本所在的总体
参数(总体的任何一个特征)
描述总体的数值,可以测量获得,也可以从总体的一系列测量中推论得到
统计量(样本的特征)
统计量描述样本的数值,可以测量获得,也可以从样本的一系列测量中推论得到
取样误差
指样本统计量与相应的总体参数之间的差距
离散型变量
是由分离的、不可分割的范畴组成,在邻近范畴之间没有值存在。
连续型变量
任何两个观测值之间都存在无限多个可能值,它可以分割成无限多个组成部分
命名测度(名义测度等级)
最低的一种测度等级,由一系列具有不同名称的类型组成,它只包含性质差异,无大小之分
顺序测度
量化水平高于命名等级,观察得到的结果分成了类别,还是按照一定顺序进行排列,可以提供不同个体之间的顺序差异,但不能说明差异的程度和大小
等距测度
由一系列按顺序排列的范畴组成,每个邻近的范畴之间的距离都是相等的
比例测度
最高等的测度等级,具有等距的所有特征,还有绝对0点
次数分布
一批数据在一个量度的每一个类目出现的次数情况(把数据从高到底进行排列,将相同的值的数据合并在一组)
简单次数分布表
把数据从大到小排列,另一列列车每个数值的次数,得到的最简单的次数分布表
分组次数分布表
当数据范围很大,把数据分成一段一段的区间,计算各个区间内数据的次数得到的表
组距
每组最大值和最小值的差距
全距
全部数据的最大值和最小值的差距
组距=全距/组数
次数分布直方图
横轴表示数据X,纵抽表示次数f
次数分布棒图
当数据时命名或者顺序量度时
次数分布折线图
次数分布茎叶图
如:X=75, 茎为7,叶为5
次数分布的形状
一个分布,有三个特征来描述:
集中趋势:分布曲线重心的位置,数据围绕重心上下波动
变异性:离散程度
形状:对称分布(图像对称)和非对称分布(偏态分布:数据堆积在分布的一端,另一端少)
累计次数分布表
在简单或者分组次数分布表上加一列累积次数
插值法
一种求解中间值的方法,假设是在求解点的附近1个组距单位区间之内的分数和对应的百分比的变化是线性。
插值法求解,先找到求解点最近的两个区间,区间端点是已知的