Variància: diferència entre les revisions

Contingut suprimit Contingut afegit
m retocs
m Definició del coeficient de correlació
Línia 23:
# <math>V(X) \geq 0</math>, i <math>V(X) = 0</math> si i només si <math> X</math> és una constant quasi segurament
# <math>V(aX+b) = a^2 V(X)</math> essent <math>a</math> i <math>b</math> constants qualssevol.
# <math>V(X)=E[X^2]-\big(E[X]\big)^2</math>.
# [[Desigualtat de Txebixev]]: per a qualsevol constant <math>k>0</math><math display="block">P \left ( \left |X-E[X] \right | \leq k \sigma \right ) \geq 1 - \frac {1}{k^2}.</math>, per a qualsevol constant <math>k>0</math>.
# Si <math>X</math> i <math>Y</math> són [[variables aleatòries independents]], llavors <math>V(X+Y)=V(X)+V(Y)</math>
# [[Desigualtat de Txebixev]] <math>P \left ( \left |X-E[X] \right | \leq k \sigma \right ) \geq 1 - \frac {1}{k^2}</math>, per a qualsevol constant <math>k>0</math>.
#Desigualtat de Cauchy-Schwarz. Si <math>X</math> i <math>Y</math> són dues variables aleatòries, aleshores, <math display="block">E\big[\vert X\,Y\vert\big]\le \sqrt{E[X^2]\,E[Y^2]}.</math>
 
Linha 35 ⟶ 34:
== Covariància i correlació ==
 
Siguin <math>X</math> i <math>Y</math> dues variables aleatòries. Definim la '''covariància''' de <math>X</math> i <math>Y</math> a <math display="block">\text{Cov}(X,Y)=E\big[(X-E[X])(Y-E[Y])\big]=E[X\, Y]-E[X]\, E[Y],</math>on suposem que <math>E[X^2]<\infty \quad \text{i}\quad E[Y^2]<\infty.</math> Tenim la següent fórmula per a la variància d'una suma de dues variables aleatòries: <math display="block">V(X+Y)=V(X)+V(Y)+2\,\text{Cov}(X,Y).</math>Més generalment, per a la variància de la suma de <math>n</math> variables aleatòries <math>X_1,\dots, X_n,</math> tenim <math display="block">V\big(\sum_{i=1}^n X_i\big)=\sum_{i=1}^nV(X_i)+2\sum_{1\le i<j\le n}\text{Cov}(X_i,X_j).</math>
 
Si <math>\text{Cov}(X,Y)=0</math>, es diu que <math>X</math> i <math>Y</math> estan '''incorrelacionades'''. En aquest cas, la variància de la suma o la resta de variables es simplifica: <math display="block">V(X+Y)=V(X-Y)=V(X)+V(Y),</math>on, al cas de la resta, hem aplicat la propietat 2 de l'apartat anterior.
 
Noteu que si dues variables <math>X</math> i <math>Y</math> són independents, aleshores són incorrelacionades.
 
 
La fórmula de la variància de la suma de <math>n</math> variables també es simplifica: Si <math>X_1,\dots,X_n</math>són incorrelacionades dos a dos, és a dir, <math>\text{Cov}(X_i,X_j)=0, </math> per a <math>i\ne j</math>, aleshores <math display="block">V\big(\sum_{i=1}^n X_i\big)=\sum_{i=1}^nV(X_i).</math>Sigui <math>X</math> i <math>Y</math> dues variables aleatòries tals que <math>V(X)\ne 0 \quad i\quad V(Y)\ne 0.</math> Es defineix el coeficient de correlació entre <math>X</math> i <math>Y</math> al nombre <math display="block">\rho=\frac{\text{Cov}(X,Y)}{V(X)\, V(Y)}.</math>Es té que <math>-1\le \rho\le 1</math>. A més, si <math>\rho=1</math>, aleshores existeixen nombres <math>a,\, b</math>, amb <math>a>0</math>, tals que (quasi segurament) <math display="block">Y=aX+b.</math>I si <math>\rho=-1</math>, aleshores existeixen nombres <math>a,\, b</math>, amb <math>a<0</math>, tals que (quasi segurament)<math display="block">Y=aX+b.</math>Per aquest motiu, el coeficient de correlació s'interpreta com una mesura del grau d''''associació lineal''' entre dues variables (però no del grau d'associació general).
 
== Variància d'una població finita ==