博客
关于我
统计学之偏度系数和峰度系数
阅读量:563 次
发布时间:2019-03-10

本文共 1170 字,大约阅读时间需要 3 分钟。

根据用户要求,以下是优化后的文章内容:

偏度(Skewness)系数是用来描述数据分布形态的一个重要统计量。它能够反映数据的偏态程度,帮助分析数据的对称性与偏离性。接下来,将从不同的方法来计算偏度系数进行详细说明,并结合实际例子进行讲解。

皮尔逊偏度系数是基于算术平均数和众数或中位数计算的常用方法。其计算公式为:

[ E[X - \mu] = \frac{\sum_{i=1}^{n} (x_i - \bar{x})}{n} ]

其中,(\bar{x})是数据的算术平均数,(x_i)是数据点。

皮尔逊偏度系数的取值范围为[-3,3]。通过计算不同数据点偏离平均数的程度,可以直观地判断分布的偏态。例如,若偏度系数为正,说明数据分布呈右偏;若为负,说明数据分布呈左偏。

鲍莱偏度系数则是基于四分位数的计算方式。其步骤如下:

  • 首先将数据按大小顺序排列并计算四分位数(Q1和Q3)。
  • 计算中位数 (\bar{Q})。
  • 利用公式:
  • [ E[X - \bar{Q}] = \frac{\sum_{i=1}^{n} (x_i - \bar{Q})}{n} ]

    计算偏度系数。

    利用动差(矩)法求偏度系数,其原理是利用各阶动差(矩)来反映数据的偏离情况。其中,t阶动差是指将所有数据减去同一个常数a的t次方,然后计算其平均值。对于偏度(kurtosis)系数,常用的方法是矩阵法或公式法。

    通过动差法计算偏度系数的具体步骤如下:

  • 计算一阶动差(矩):(\bar{X})。
  • 计算t阶动差(矩):(\bar{X}t = \frac{1}{n} \sum{i=1}^{n} (x_i - \bar{X})^t)。
  • 根据不同t值计算偏度系数。
  • 举例说明:

    假设有数据集:[1, 2, 3, 4, 5],一阶动差(矩)为:2.5,三阶动差(矩)为:2.979。通过公式计算偏度系数和峰度系数。

    具体计算如下:

  • 一阶动差:(\bar{X}_1 = \frac{1}{5}(1+2+3+4+5)=3)
  • 三阶动差:(\bar{X}_3 = \frac{1}{5}((1-3)^3 + (2-3)^3 + (3-3)^3 + (4-3)^3 + (5-3)^3) = \frac{1}{5}( (-2)^3 + (-1)^3 + 0 + 1^3 + 2^3 ) = \frac{1}{5}(-8 + (-1) + 0 + 1 + 8) = \frac{0}{5} = 0)
  • 通过上述公式计算偏度系数和峰度系数,可以更直观地了解数据的分布形态。


    本文主要介绍了偏度(Skewness)系数及其计算方法,并结合实际例子进行了详细讲解。通过皮尔逊偏度系数、鲍莱偏度系数和动差法,我们掌握了多种常用计算方式。这些方法为数据分析提供了丰富的工具,有助于更好地理解数据的分布特征。

    转载地址:http://cgdvz.baihongyu.com/

    你可能感兴趣的文章
    GridView自定义删除操作
    查看>>
    http常见响应状态码
    查看>>
    Nginx Location
    查看>>
    计算机操作系统之第二章 进程的描述与控制(1)
    查看>>
    java 正则 持续更新中
    查看>>
    解决github Git clone 慢的问题
    查看>>
    一张图搞定RPC框架核心原理
    查看>>
    MySQL-8免安装版配置
    查看>>
    Scala中的包
    查看>>
    参加阿里的Java面试经验
    查看>>
    Python微信公众号
    查看>>
    2017物联网安全事件盘点
    查看>>
    MySQL的时间获取和时间转换
    查看>>
    他来了他来了,他带着云栖大会的免费门票走来了
    查看>>
    Oracle笔记
    查看>>
    hive环境安装
    查看>>
    mysql 关闭安全模式
    查看>>
    JS实现删除行按钮只有一行时不能删除
    查看>>
    有问题找男人帮忙- Linux下man命令
    查看>>
    如何复用外部shell脚本
    查看>>