本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

常见统计量_常用统计量

数据挖掘 cdadata 7726℃

常见统计量

最小值. 数值变量的最小值。

最大值. 数值变量的最大值。

总数. 所有具有缺失值的测量值的总和或合计。

范围. 数值变量的最大值与最小值的差值就是用最大值减最小值后得出的值。

平均值. 集中趋势的测量。 算术平均值,等于总和除以观测值数。

均值标准误. 取自相同分布中随样本不同而变化的均值的值个数的度量值。 用于粗略将观测到的均值与假设值对比(即,如果差异与标准误的比率小于 -2 或大于 +2,则可以得出此均值与假设值不同的结论)。

标准差. 均值离差的度量值,等于方差的平方根。 以和原始变量相同的单位度量标准差。

方差. 平均值离散度的测量值,等于均值的平方差除以观测值数减一的差。 方差按单元计量,即变量自身单元数的平方。

偏度. 分布的不对称度量值。 正态分布是对称的,且所含偏度值为 0。具有显著正偏态的分布具有向右延伸的长尾。 具有显著负偏态的分布具有向左延伸的长尾。 提示:取大于其标准误差两倍的偏度值指示离开对称的距离。

偏度标准误. 偏态与其标准误的比率可用作正态检验(即,如果该比率小于 -2 或大于 -2,则可以拒绝正态)。 偏度正值越大表示长尾向右越长;负极值表示向左的长尾。

峰度. 观测值聚类围绕中心点的程度的一种测度。 对于正态分布,峰度统计量的值为零。 正峰度表示观测值聚类较大并且具有比正态分布更长的尾部,负峰度表示观测值聚类较小并且具有较短的尾部。峰度标准误. 峰度与其标准误的比率可用作正态检验(即如果比率小于 -2 或大于 +2,则可以拒绝正态)。 峰度较大的正值表示该分布的尾部比正态分布的尾部长;峰度的负值表示较短的尾部(与箱形均匀分布的尾部变得相似)。

唯一. 同步评估所有效应,同时为任意类型的所有其他效应调整每一个效应。

有效的. 有效观测值既不包含系统缺失值,也不包含定义为用户缺失的值。

中位数. 大于或小于中位数的观测值各占一半,即 50%。 如果有偶数个观测值,则中位数为它们以升序或降序排列时两个中间观测值的平均值。 中位数是集中趋势的一种测量,对离群值不敏感(与平均值不同,平均值会受部分极高或极低值的影响)。

众数. 最频繁出现的值。 如果多个值共享最大出现频数,则每个值都是一种众数。

交叠的统计量

如果数字范围交叠字段正在使用,则下列统计量也可用:

相关 (Pearson). 两个变量间关联强度的衡量标准。如果一个变量值的更改意味着另一个变量的值也将随之更改,则两个变量相关。值接近于 1(或 –1)表示相关性很强,值接近于 0 表示弱相关性或不相关。系数符号表示关系方向,正相关表示一个变量增加,另一变量也将随之增加。

相关 T. 相关系数的检验统计量,指示相关性是否明显不等于零。

相关 T DF. 检验统计量的自由度。

相关 T 显著性. T 统计量的显著性。

协方差. 两个变量间关联性的非标准化测量值,等于叉积偏差除以 N-1。

转载请注明:数据分析 » 常见统计量_常用统计量

喜欢 (5)or分享 (0)