标准差 标准误 偏度系数和峰度系数的作用
关键词:偏度系数和峰度系数、峰度系数 偏度系数、标准误和标准差的区别、标准差和标准误、标准差与标准误
标准差和标准误是两个不同的概念,标准差就是一个变量的所有数据的离均差平方和再平均之后开平方,它是度量离散程度的指标。标准误用于估计参数的可信区间,进行假设检验等。它们与样本含量的关系不同:当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 .联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。标准误的计算公式为
标准误在标准差的基础上消去了数据量带来的影响,对一些数据量相差大的数据集来说,标准误比标准差更有意义。
偏度系数和峰度系数是一个可以用来衡量数据集的分布形状的系数。
偏度系数的计算公式如下:
它是一个取值通常在-3–3之间的值,它衡量了数据集的对称程度。偏度系数越接近0,这说明数据集越对称,越远离0则表明
数据集越不对称。如果偏度系数为正,则表明他的数据在右边更为分散,若为负的,则说明他的左侧更为分散。
峰度系数的计算公式如下:
它是用数据集的四阶中心矩来计算出来的。正态分布的峰度系数为3.峰度系数越接近0,就说明数据集的分布峰度与正态分布越相似。越远离0,数据集的分布峰度就越和正态分布不相似。如果说峰度系数为负,则表明数据集较为集中,两侧数据集较少。如果它为正则相反。如果偏度系数和峰度系数都为0的时候,则该数据集服从一个标准的正态分布。
转载请注明:数据分析 » 标准差 标准误 偏度系数和峰度系数的作用