【四分位差怎么算的】在统计学中,四分位差(Interquartile Range, IQR)是衡量数据离散程度的一个重要指标,它反映了中间50%数据的分布范围。相比极差(最大值与最小值之差),四分位差更能体现数据的集中趋势和异常值的识别能力。
以下是对“四分位差怎么算的”这一问题的总结性说明,并结合实例进行表格展示,帮助读者更直观地理解计算过程。
一、四分位差的定义
四分位差是指第三四分位数(Q3)与第一四分位数(Q1)之间的差值,即:
$$
IQR = Q3 - Q1
$$
其中:
- Q1:将数据从小到大排列后,位于25%位置的数值。
- Q3:将数据从小到大排列后,位于75%位置的数值。
二、计算步骤
1. 将数据从小到大排序
确保所有数据按升序排列。
2. 确定中位数(Q2)
中位数是将数据分为两半的中间值,用于确定Q1和Q3的位置。
3. 计算Q1和Q3的位置
- Q1的位置为:$ \frac{n + 1}{4} $
- Q3的位置为:$ \frac{3(n + 1)}{4} $
其中,n为数据个数。
4. 根据位置查找Q1和Q3的值
如果位置是整数,则取该位置的数值;如果是小数,则取相邻两个数的平均值。
5. 计算IQR
用Q3减去Q1得到四分位差。
三、示例计算
假设有一组数据如下:
| 数据 | 排序后 |
| 10 | 10 |
| 20 | 15 |
| 15 | 20 |
| 25 | 25 |
| 30 | 30 |
| 35 | 35 |
| 40 | 40 |
共7个数据点,n = 7
计算步骤:
1. 排序后的数据:10, 15, 20, 25, 30, 35, 40
2. 中位数(Q2):第4个数,即25
3. 计算Q1位置:$ \frac{7 + 1}{4} = 2 $ → 第2个数为15
4. 计算Q3位置:$ \frac{3(7 + 1)}{4} = 6 $ → 第6个数为35
5. 计算IQR:35 - 15 = 20
四、表格总结
| 步骤 | 内容 |
| 数据排序 | 10, 15, 20, 25, 30, 35, 40 |
| n | 7 |
| Q2 | 第4个数:25 |
| Q1位置 | (7 + 1) / 4 = 2 → 第2个数:15 |
| Q3位置 | 3 × (7 + 1) / 4 = 6 → 第6个数:35 |
| IQR | Q3 - Q1 = 35 - 15 = 20 |
五、注意事项
- 当数据个数为偶数时,Q1和Q3的计算方式略有不同,通常采用线性插值法。
- 四分位差不适用于偏态分布的数据,但对识别异常值非常有效。
- 在实际应用中,常用于箱形图(Boxplot)中表示数据的中间50%范围。
通过以上步骤和示例,我们可以清晰地了解“四分位差怎么算的”,并能灵活运用在数据分析中。


