Covariância
Em teoria da probabilidade e na estatística, a covariância, ou variância conjunta, é uma medida do grau de interdependência numérica entre duas variáveis aleatórias. Assim, variáveis independentes têm covariância zero.
A covariância ou variância conjunta é um momento conjunto de primeira ordem das variáveis aleatórias X e Y, centrados nas respectivas médias. É a média do grau de interdependência ou inter-relação numérica linear entre elas. Se a variável for discreta, a covariância pode ser calculada de duas formas:
Em teoria da probabilidade e na estatística, a covariância entre duas variáveis aleatórias reais X e Y, com valores esperados E ( X ) = μ X {\displaystyle \operatorname {E} (X)=\mu _{X}} e E ( Y ) = μ Y {\displaystyle \operatorname {E} (Y)=\mu _{Y}} é definida como uma medida de como duas variáveis variam conjuntamente: onde E ( ) {\displaystyle E()} é o operador do valor esperado. Desenvolvendo a expressão para a Covariância, temos: cov ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] {\displaystyle \operatorname {cov} (X,Y)=\operatorname {E} [(X-\operatorname {E} (X))(Y-\operatorname {E} (Y))]} cov ( X , Y ) = E [ X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ] {\displaystyle \operatorname {cov} (X,Y)=\operatorname {E} [XY-X\operatorname {E} (Y)-Y\operatorname {E} (X)+\operatorname {E} (X)\operatorname {E} (Y)]} Usando a propriedade de que a Esperança (Valor esperado) de uma variável aleátória X qualquer é um operador linear, determinamos que a Esperança de uma soma é a soma das Esperanças:
Se X e Y são variáveis aleatórias de valor real e a, b, c e d constantes ("constante", neste contexto, significa não aleatória), então os seguintes factos são uma consequência da definição da covariância: Para variáveis aleatórias em vetores coluna X e Y com respectivos valores esperados μX e μY, e n e m de componentes escalares respectivamente, a covariância é definida como matriz n×m Para variáveis aleatórias em vetor, cov(X, Y) e cov(Y, X) são a transposta de cada um.
A covariância entre duas variáveis pode ser obtida de dados de variância. Para variáveis aleatórias X e Y, sejam:
A covariância é por vezes chamada de medida de dependência linear entre as duas variáveis aleatórias. O Coeficiente de Correlação Linear é um conceito relacionado usado para medir o grau de dependência linear entre duas variáveis, variando entre -1 e 1, indicando o sentido da dependência.
Seja X a variável "altura dos jogadores de basquete" e seja Y a variável "peso dos mesmos atletas". A partir desses dados, é possível montar uma tabela com os desvios em relação a média. Essa tabela auxilia no cálculo da covariância:


