【偏度和峰度公式】在统计学中,偏度(Skewness)和峰度(Kurtosis)是描述数据分布形态的两个重要指标。它们可以帮助我们了解数据的对称性以及尾部的厚重程度,从而更全面地理解数据特征。
一、偏度(Skewness)
偏度用于衡量数据分布的不对称性。如果偏度为0,表示数据是对称的;若偏度为正,说明数据右偏(长尾在右侧);若偏度为负,则表示左偏(长尾在左侧)。
偏度公式:
- 样本偏度公式(基于三阶中心矩):
$$
\text{Skewness} = \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^3}{s^3}
$$
其中:
- $ x_i $ 是第 $ i $ 个数据点;
- $ \bar{x} $ 是样本均值;
- $ s $ 是样本标准差;
- $ n $ 是样本数量。
- 另一种常用计算方式(调整后的偏度):
$$
\text{Adjusted Skewness} = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^3
$$
二、峰度(Kurtosis)
峰度用于衡量数据分布的尖峭程度或尾部厚度。它比较的是数据与正态分布的差异。通常以“峰度系数”来表示。
峰度公式:
- 样本峰度公式(基于四阶中心矩):
$$
\text{Kurtosis} = \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^4}{s^4} - 3
$$
其中:
- $ x_i $ 是第 $ i $ 个数据点;
- $ \bar{x} $ 是样本均值;
- $ s $ 是样本标准差;
- $ n $ 是样本数量。
- 解释:
- 若峰度为0,表示与正态分布相同;
- 若峰度 > 0,表示分布比正态分布更尖峭(高峰度);
- 若峰度 < 0,表示分布更平坦(低峰度)。
三、总结表格
指标 | 定义 | 公式 | 解释 |
偏度(Skewness) | 衡量数据分布的不对称性 | $ \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^3}{s^3} $ 或 $ \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^3 $ | 正值:右偏;负值:左偏;0:对称 |
峰度(Kurtosis) | 衡量数据分布的尖峭程度 | $ \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^4}{s^4} - 3 $ | 0:正态分布;>0:尖峰;<0:平峰 |
通过理解偏度和峰度的计算方法及其含义,我们可以更好地分析数据的分布特性,并在实际应用中做出更合理的判断和决策。
以上就是【偏度和峰度公式】相关内容,希望对您有所帮助。