Variància: diferència entre les revisions

Contingut suprimit Contingut afegit
Cap resum de modificació
m Modificació de la introducció. Afegir un exemple sobre la interpretació de la variància
Línia 1:
En [[teoria de probabilitat]], la '''variància d'una variable aleatòria''' <ref>{{Ref-llibre|cognom=Chung|nom=Kai Lai|títol=Teoría elemental de la probabilidad y de los procesos estocásticos, cap . 6|url=|edició=|llengua=|data=1983|editorial=Editorial Reverté|lloc=|pàgines=|isbn=}}</ref> és una mesura de la dispersió d'una [[variable aleatòria]] <math>X</math> respecte de la seva [[mitjana aritmètica|mitjana]] <math>E[X]</math>. Es defineix com l'[[esperança matemàtica|esperança]] de <math>\left ( X - E[X] \right )^2 </math>, això és
 
<center><math>
V(X)=E \left [ \left ( X - E[X] \right )^2 \right ],
</math></center>
on suposem que <math>E[X^2]<\infty</math>.
 
Està relacionada amb la [[desviació típica]], que se sol designar amb la lletra grega <math>\sigma</math> i que és l'arrel quadrada de la variància:
 
<center><math> \sigma_X = \sqrt {V(X)} .</math> </center>
En [[Estadística descriptiva]]<ref name=":0" /> la '''variància''' d'un conjunt de dades <math>x_1,\dots,x_N</math>es defineix per
 
<math display="block"> v=\frac{(x_1-\overline x)^2+\cdots+(x_N-\overline x)^2}{N}=\frac{1}{N}\sum_{i=1}^N (x_i-\overline x)^2, </math>on <math>\overline x</math> és la mitjana aritmètica de les dades: <math display="block"> \overline x =\frac{x_1+\cdots+x_N}{N}=\frac{1}{N}\sum_{i=1}^N x_i. </math>En Inferència estadística s'utilitzen la '''variància poblacional''' i la '''variància mostral'''.
== Càlcul de la variància en els casos habituals ==
 
== Variància d'una variable aleatòria ==
=== Variables aleatòries discretes ===
La variància de una variable aleatòria <math>X</math> es defineix per <math display="block">
V(X)=E \left [ \left ( X - E[X] \right )^2 \right ]=E[X^2]-\big(E[X]\big)^2,
</math>on <math>E[X]</math> és l'esperança o mitjana de <math>X</math>, on suposem que <math>E[X^2]<\infty</math>. La segona igualtat s'obté desenvolupant el quadrat i utilitzant que <math>E[X]</math> és una constant. Cal remarcar que si <math>E[X^2]<\infty</math>, aleshores <math>X</math> té esperança. Això es dedueix del fet que per a qualsevol nombre <math>x\in \mathbb{R}</math>, <math>\vert x \vert \le (x^2+1)/2</math>, d'on,<math display="block">\vert X \vert \le \frac{1}{2}(X^2+1).
 
</math>Llavors, traient esperances tenim <math display="block">E[\vert X\vert]\le \frac{1}{2}(E[X^2]+1).</math>La desigualtat <math>\vert x \vert \le (x^2+1)/2</math> es dedueix del fet que <math>(\vert x\vert +1)^2\ge 0.</math>
 
=== Interpretació de la variància ===
Considerem tres variables aleatòries. La primera és la constant 0: <math>X_1=0</math>que com és evident no varia gens. La segona, <math>X_2,</math> pren els valors 1 i -1 amb probabilitat 1/2; per exemple, correspon a un joc a cara o creu on si surt cara guanyem 1 euro i si surt creu perdem un euro. Finalment, <math>X_3</math>pren els valors 10 i -10 amb probabilitats 1/2; correspondria al mateix joc que abans però ara guanyaríem o perdríem 10 euros. Les tres variables tenen la mateixa esperança: <math display="block"> E[X_1]=0,
</math><math display="block">E[X_2]=\frac{1}{2}\times 1+\frac{1}{2}\times(-1)=0,</math><math display="block">E[X_3]=\frac{1}{2}\times 10+\frac{1}{2}\times(-10)=0.</math>D'altra banda, <math>X_1^2=0</math>, i llavors <math> E[X_1^2]=0,
</math> i llavors <math>V(X_1)=0</math>.
 
Per a <math>X_2</math>, aplicant la [[Esperança matemàtica|fórmula del càlcul de l'esperança d'una funció]] d'una variable aleatòria tenim <math display="block">E[X_2^2]=\frac{1}{2}\times 1^2+\frac{1}{2}\times(-1)^2=1,</math>d'on <math display="block">V(X_2)=E[X_2^2]-\big(E[X_2]\big)^2=1.</math>Anàlogament, per a <math>X_3</math> tenim <math>E[X_3^2]=100</math> i <math>V(X_3)=100</math>.
 
Així, les tres variables tenen igual mitjana, però la primera variable que és una constant té variància 0 (no varia gens respecte la seva mitjana), mentre que <math>X_2 </math>pren valors més propers a la mitjana que
 
<math>X_3</math>, i llavors la variància de <math>X_2</math> és més petita que la de <math>X_3</math>.
<br />
=== Càlcul de la variància en els casos habituals ===
 
==== Variables aleatòries discretes ====
Sigui <math>X</math> una variable aleatòria discreta que pot prendre un nombre finit o infinit numerable de valors <math>x_1,\, x_2,\dots</math> amb probabilitats respectives <math>p_1,\, p_2,\dots</math> Aleshores <math display="block">V(X)=\sum_i(x_i-\mu)^2p_i=\sum_ix_i^2\,p_i-\mu^2,</math>on <math>\mu=E[X]=\sum_ix_ip_i,</math> i suposem que <math>\sum_ix_i^2\,p_i<\infty.</math>
 
Linha 30 ⟶ 50:
Per a calcular <math>E[X^2]</math> farem com en el cas de la binomial i calcularem <math>E[X(X-1)]</math>: Utilitzant arguments anàlegs als anteriors, tenim<math display="block">E[X(X-1)]=\sum_{k=0}^\infty k(k-1)\, e^{-\lambda}\frac{\lambda^k}{k!}=\lambda^2 e^{-\lambda}\sum_{k=2}^\infty \frac{\lambda^{k-2}}{(k-2)!}=\lambda^2.</math>D'on es dedueix <math display="block">V(X)=\lambda.</math>
 
==== Variables aleatòries absolutament contínues ====
Sigui <math>X</math> una variable aleatòria amb funció de densitat <math>f</math>. Aleshores <math display="block">V(X)=\int_{-\infty}^\infty (x-\mu)^2\, f(x)\, dx=\int_{-\infty}^\infty x^2\, f(x)\, dx-\mu^2,</math>on <math>\mu=E[X]=\int_{-\infty}^\infty x\, f(x)\, dx</math>, i suposem <math>\int_{-\infty}^\infty x^2\, f(x)\, dx<\infty.</math>
 
Linha 38 ⟶ 58:
<math display="block">E(X)=\int_{-\infty}^{\infty}x\, e^{-x^2/2}dx= \int_{-\infty}^{0}x\, e^{-x^2/2}dx+\int_{0}^{\infty}x\, e^{-x^2/2}dx=-\int_{0}^{\infty}x\, e^{-x^2/2}dx+\int_{0}^{\infty}x\, e^{-x^2/2}dx=0.</math>
 
=== Variables aleatòries sense variància ===
Pot ocórrer que una variable aleatòria no tingui esperança: per exemple, una variable amb [[distribució de Cauchy]]. Aleshores la fórmula <math>E\big[(X-E[X])^2\big]</math> no tindrà sentit. Es diu que la variància de <math>X</math> no existeix.
 
Linha 47 ⟶ 67:
</math>Llavors, traient esperances tenim <math display="block">E[\vert X\vert]\le \frac{1}{2}(E[X^2]+1).</math>La desigualtat <math>\vert x \vert \le (x^2+1)/2</math> es dedueix del fet que <math>(\vert x\vert +1)^2\ge 0.</math>
 
=== Propietats de la variància ===
 
 
Linha 53 ⟶ 73:
# <math>V(aX+b) = a^2 V(X)</math> essent <math>a</math> i <math>b</math> constants qualssevol.
# <math>V(X)=E[X^2]-\big(E[X]\big)^2</math>
#[[Desigualtat de Txebixev]]: per a qualsevol constant <math>k>0</math><math display="block">P \left ( \left |X-E[X] \right | \leqgeq k \sigma_X \right ) \geq 1 -leq \frac {1}{k^2}.</math>
 
# Desigualtat de Cauchy-Schwarz. Si <math>X</math> i <math>Y</math> són dues variables aleatòries, aleshores,''' <math display="block">E\big[\vert X\,Y\vert\big]\le \sqrt{E[X^2]\,E[Y^2]}.</math>
 
=====Nova interpretació de la variància gràcies a la desigualtat de Txebixev =====
 
La desigualtat de Txebixev permet interpretar de quina manera la variància mesura la "dispersió" d'una variable aleatòria <ref>{{Ref-llibre|cognom=Bonet, E.|nom=|títol=Espais de probabilitat finits|url=|edició=|llengua=|data=1969|editorial=Editorial Lavínia, S. A.|lloc=Barcelona|pàgines=p. 158|isbn=}}</ref>. Si a la fórmula de la desigualtat de Txebixev prenem, per exemple, <math>k=3</math>, aleshores la probabilitat que la variable s'allunyi de la seva mitjana més de 3 vegades la desviació típica serà menor de <math>1/9 \approx 0,11</math>.
 
=== Covariància i correlació ===
 
Siguin <math>X</math> i <math>Y</math> dues variables aleatòries. Definim la '''covariància''' de <math>X</math> i <math>Y</math> a <math display="block">\text{Cov}(X,Y)=E\big[(X-E[X])(Y-E[Y])\big]=E[X\, Y]-E[X]\, E[Y],</math>on suposem que <math>E[X^2]<\infty \quad \text{i}\quad E[Y^2]<\infty.</math> Tenim la següent fórmula per a la variància d'una suma de dues variables aleatòries: <math display="block">V(X+Y)=V(X)+V(Y)+2\,\text{Cov}(X,Y).</math>Més generalment, per a la variància de la suma de <math>n</math> variables aleatòries <math>X_1,\dots, X_n,</math> tenim <math display="block">V\big(\sum_{i=1}^n X_i\big)=\sum_{i=1}^nV(X_i)+2\sum_{1\le i<j\le n}\text{Cov}(X_i,X_j).</math>
Linha 62 ⟶ 87:
Si <math>\text{Cov}(X,Y)=0</math>, es diu que <math>X</math> i <math>Y</math> estan '''incorrelacionades'''. En aquest cas, la variància de la suma o la resta de variables es simplifica: <math display="block">V(X+Y)=V(X-Y)=V(X)+V(Y),</math>on, al cas de la resta, hem aplicat la propietat 2 de l'apartat anterior.
 
Noteu que si dues variables <math>X</math> i <math>Y</math> són independents, aleshores són incorrelacionades, ja que <math>E[X\, Y]=E[X]\, E[Y]</math>.
 
 
Linha 68 ⟶ 93:
 
== Variància d'una població finita ==
En [[Estadística descriptiva]] <ref name=":0">{{Ref-llibre|cognom=Lobez Urquía, J.|nom=|títol=Estadística intermedia|url=|edició=Segunda edición|llengua=|data=1975|editorial=Vicens-Vives|lloc=|pàgines=|isbn=|cognom2=Casa Aruta, E.}}</ref>es considera una '''població''' (de persones o de coses: també s'anomena '''univers''' o '''col·lectiu''') finita, amb <math>N</math> elements, i es mesura una característica numèrica. Els resultats, iguals o diferents, es designen per <math>x_1, \dots,x_N</math>. La [[mitjana]] o [[mitjana aritmètica]] es defineix per
<center> <math> \overline x =\frac{x_1+\cdots+x_N}{N}=\frac{1}{N}\sum_{i=1}^N x_i. </math> </center>
La variància es defineix per
<center> <math> v=\frac{(x_1-\overline x)^2+\cdots+(x_N-\overline x)^2}{N}=\frac{1}{N}\sum_{i=1}^N (x_i-\overline x)^2. </math> </center>
 
En general, en les observacions hi ha nombres repetits i només tenim <math>K</math> valors diferents,que escriurem <math> x_1,\dots, x_K</math>, de manera que els <math>N</math> nombres es resumeixen en una [[taula de freqüències]]: