四分位数:四分位数(Quartile),也称四分位点,是指把一组数据中的所有数值由小到大排列并分成四等份时,处于三个分割点位置的数值。多应用于箱线图的绘制。
四分位数有三个,第一个四分位数称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、Q2、Q3表示。
第一步:确定四分位数的位置。Qi 所在的位置=i(n+1)/4,其中i=1,2,3。n表示资料项数。第二步:根据第一步四分位数的位置,计算相应四分位数。例1:某数学补习小组11人年龄(岁)为:17,19,22,24,
统计学解释
四分位数位置的确定方法有两种。其一是Excel函数QUARTILE.EXC的方法,四分位数例题及答案,也就是SPSS中使用的方法,其确定方法如下:
其二是Excel函数QUARTILE.INC的方法,其确定方法如下:
我们以如下一组数据作为例子:1,2,3,4,5,6,7,8,9,10,11,12;
首先确定四分位数的位置:Q1的位置= (n+1) × 0.25 Q2的位置= (n+1) × 0.5 Q3的位置= (n+1) × 0.75 n表示项数 对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即:Q1的位置=
用第一种方法确定的四分位数位置分别为3.25,6.5,9.75;用第二种方法确定的四分位数位置分别为3.75、6.5、9.25。
实现思路
例如:设25%的四分位数为Q25%,75%四分位数为Q75%,根据四分位数定义有:Q25%位置=n/4,Q75%位置=3n/4。
实现代码
定义测试数据
data_test=[1,2,3,4,5,6,7,8,9,10,11,12]
计算四分位数方法一(Excel的QUARTILE.EXC方法)
测试
Me=〔X(n/2)+ X(n/2+1)〕/2---当样本数偶奇数 低四分位数(即第二十五百分位数)P(25)和高四分位数(即第七十五百 分位数)P(75)的计算公式如下:P(M)=X(【Mn/100】+1)---当 Mn/100 不 。
结果
第1四分位数 3.25第2四分位数 6.5第3四分位数 9.75
计算四分位数方法二(Excel的QUARTILE.INC方法)
import math#其中data为数据组,n为第几个四分位数def quantile_inc(data,n): if n<1 or n>3: return false data.sort() position = 1 + (len(data)-1)*n/4 pos_integer = int(math.modf(position)[1]) pos_decimal = position - pos_integer quartile = data[pos_integer - 1] + (data[pos_integer] - data[pos_integer - 1])*pos_decimal return quartile
四分位数(Quartile),即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数.第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字.第二四。
测试
结果
第1四分位数 3.75第2四分位数 6.5第3四分位数 9.25
调用numpy的percentile方法计算四分位数
import numpyprint('第1四分位数',numpy.percentile(data_test,(25)))print('第2四分位数',numpy.percentile(data_test,(50)))print('第3四分位数',numpy.percentile(data_test,(75)))
结果
第1四分位数 3.75第2四分位数 6.5第3四分位数 9.25
代码解释
x=math.modf(i) #获取i的整数位整数位和小数位,其中x[0]为小数位,x[1]为整数位