ICC,全称为intraclass correlation coefficient,即组内相关系数。它是衡量和评价观察者间信度(inter-observer reliability)和复测信度(test-retest reliability)的信度系数(reliability coefficient)指标之一。它最先由Bartko于1966年用于测量和评价信度的大小。ICC等于个体的变异度除以总的变异度,故其值介于0~1之间。0表示不可信,1表示完全可信。一般认为信度系数低于0.4表示信度较差,大于0.75表示信度良好,相关系数的计算方法,对于定量资料常常需要更高的ICC值。,
统计学中,组内相关系数常用于评价具有某种特定亲属关系(如双胞胎,兄弟姐妹等)的个体间某种定量属性(如遗传力)的相似程度,另一方面主要用于评价不同测定方法或评定者对同一定量测量结果的一致性或可靠性。有很多不同的ICC统计量,这些统计量并不估计相同的总体参数。由于对同一组数据不同ICC计算结果不同,有关这些ICC统计量的恰当应用一直是争论的焦点。1979年,Columbia University生物统计系的Shrout和Fleiss教授提出了研究者评价评定者测量结果的可靠性时选择恰当系数的准则。
下面是集中不用的实现ICC的方法:
第一种:这些可以通过rpy2包从 Python 中使用。
from rpy2.robjects import DataFrame,FloatVector,IntVectorfrom rpy2.robjects.packages import importrfrom math import isclose
groups = [1,1,1,1,2,2,2,2,3,3,3,3,4,4,4。
4,5,5,5,5,6,6,6,6,7,7,7,7,8,8,8,8]
values = [1,2,0,1,1,3,3,2,3,8,1,4,6,4,3。
3,6,5,5,6,7,5,6,2,8,7,7,9,9,9,9,8]
r_icc = importr(&34;)
df = DataFrame({&34;: IntVector(groups)。
&34;: FloatVector(values)})
icc_res = r_icc.ICCbare(&34;,&34;,data=df)
icc_val = icc_res[0] # icc_val now holds the icc value
第二种:pengouin库以 6 种不同的方式计算 ICC,以及相关的置信水平和 p 值。
您可以使用pip install pingouin或安装它conda install -c conda-forge pingouin
import pingouin as pg
data = pg.read_dataset(&39;)
icc = pg.intraclass_corr(data=data,targets=&39;,raters=&39; ,ratings=&39;)
第三种:R包psych具有类内相关 (ICC) 的实现,可计算多种类型的变体,包括 ICC(1,1)、ICC(1,k)、ICC(2,1)、ICC(2,k)、ICC (3,1) 和 ICC(3,k) 以及其他指标。
1. 首先安装psych并lme4在 R 中:
install.packages(&34;)
install.packages(&34;)
2. 使用 rpy2 在 Python 中计算 ICC 系数:
psych = importr(&34;)
values = rpy2.robjects.r.matrix(
IntVector(
[9,2,5,8。
6,1,3,2。
8,4,6,8。
7,1,2,6。
10,5,6,9。
相关系数r的计算公式是ρXY=Cov(X,Y)/√[D(X)]√[D(Y)]。公式描述:公式中Cov(X,Y)为X,Y的协方差,D(X)、D(Y)分别为X、Y的方差。公式。若Y=a+bX,则有:令E(X) =μ,D(X) =σ。则E(Y) =。
6,2,4,7])。
ncol=4,byrow=True
)
icc_df = pandas2ri.rpy2py(icc[0])
第四种:import osimport numpy as npfrom numpy import ones,kron,mean,eye,hstack,dot,tilefrom numpy.linalg import pinvdef icc(Y,icc_type=&39;):
样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。样本相关系数的推导过程 相关系数。
&39;' Calculate intraclass correlation coefficient
ICC Formulas are based on:
assessing rater reliability. Psychological bulletin,86(2),420.
icc1: x_ij = mu + beta_j + w_ij
icc2/3: x_ij = mu + alpha_i + beta_j + (ab)_ij + epsilon_ij
Code modifed from nipype algorithms.icc
Args:
Y: The data Y are entered as a &39; ie. subjects are in rows and repeated
measures in columns
icc_type: type of ICC to calculate. (ICC(2,1),ICC(2,k),ICC(3,1),ICC(3,k))
Returns:
ICC: (np.array) intraclass correlation coefficient
&39;'
[n,k] = Y.shape
dfc = k - 1
dfe = (n - 1) * (k-1)
dfr = n - 1
E(XY) = E(aX + bX) = aμ + b(σ + μ)Cov(X,Y) = E(XY) − E(X)E(Y) = bσ
mean_Y = np.mean(Y)
SST = ((Y - mean_Y) ** 2).sum()
x = np.kron(np.eye(k),np.ones((n,1))) # sessions
x0 = np.tile(np.eye(n),(k,1)) # subjects
X = np.hstack([x,x0])
predicted_Y = np.dot(np.dot(np.dot(X,np.linalg.pinv(np.dot(X.T,X)))。
X.T),Y.flatten(&39;))
residuals = Y.flatten(&39;) - predicted_Y
SSE = (residuals ** 2).sum()
MSE = SSE / dfe
SSC = ((np.mean(Y,0) - mean_Y) ** 2).sum() * n
MSC = SSC / dfc # / n (without n in SPSS results)
SSR = SST - SSC - SSE
常见的相关系数为简单相关系数,简单相关系数又称皮尔逊相关系数或者线性相关系数,其定义式为:r值的绝对值介于0~1之间。通常来说,r越接近1,表示x与y两个量之间的相关程度就越强,反之,r越接近于0,x与y两个量之间。
MSR = SSR / dfr
if icc_type == &39;:
NotImplementedError(&39;t implemented yet.")
elif icc_type == &39; or icc_type == &39;:
if icc_type == &39;:
k = 1
elif icc_type == &39; or icc_type == &39;:
if icc_type == &39;:
k = 1
ICC = (MSR - MSE) / (MSR + (k-1) * MSE)
return ICC