La variància d'una variable aleatòria es defineix per on és l'esperança o mitjana de , on suposem que . La segona igualtat s'obté desenvolupant el quadrat i utilitzant que és una constant. Cal remarcar que si , aleshores té esperança. Això es dedueix del fet que per a qualsevol nombre, , d'on,Llavors, traient esperances tenim La desigualtat es dedueix del fet que
Considerem tres variables aleatòries. La primera és la constant 0: que com és evident no varia gens. La segona, pren els valors 1 i -1 amb probabilitat 1/2; per exemple, correspon a un joc a cara o creu on si surt cara guanyem 1 euro i si surt creu perdem un euro. Finalment, pren els valors 10 i -10 amb probabilitats 1/2; correspondria al mateix joc que abans però ara guanyaríem o perdríem 10 euros. Les tres variables tenen la mateixa esperança: D'altra banda, , i llavors i llavors .
Així, les tres variables tenen igual mitjana, però la primera variable que és una constant té variància 0 (no varia gens respecte la seva mitjana), mentre que pren valors més propers a la mitjana que , i llavors la variància de és més petita que la de .
Sigui una variable aleatòria discreta que pot prendre un nombre finit o infinit numerable de valors amb probabilitats respectives Aleshores on i suposem que
Exemples
1. Si tenim un dau ordinari, que pren els valors amb probabilitatsaleshores,
Aplicant la fórmula del càlcul de l'esperança d'una funció d'una variable aleatòria,
Ara podem calcular la variància de : 2. Sigui una variable binomial de paràmetres i , és a dir, que pot prendre els valors , amb probabilitats: aleshores on a la igualtat (*) hem fet el canvi , i a la igualtat (**) que on és una variable binomial de paràmetres .
D'altra banda, per calcular calcularem primer . Utilitzant de nou la fórmula per a calcular l'esperança d'una funció d'una variable aleatòria (en aquest cas, la funció), i amb arguments similars als anteriors,Així,Aïllant tenim
i aleshores, 3. Sigui una variable aleatòria de Poisson de paràmetre , és a dir, que pot prendre qualsevol valor natural (0 inclòs) amb probabilitats D'una banda tenim que on a la igualtat (*) hem fet el canvi , i després hem utilitzat que per a qualsevol nombre ,
Per a calcular farem com en el cas de la binomial i calcularem : Utilitzant arguments anàlegs als anteriors, tenimD'on es dedueix
Sigui una variable aleatòria amb funció de densitat . Aleshores on , i suposem
ExempleVariable normal estàndard. Sigui una variable aleatòria normal estàndard, amb funció de densitat Integrant per parts,
D'altra banda, l'esperança de val
Pot ocórrer que una variable aleatòria no tingui esperança: per exemple, una variable amb distribució de Cauchy. Aleshores la fórmula no tindrà sentit. Es diu que la variància de no existeix.
D'altra banda, també pot passar que una variable tingui esperança, però que . Aleshores la fórmula de la variància es pot aplicar, però dona . En aquest cas també es diu que la variància de no existeix o que és infinita. Una variable amb distribució t de Student amb dos graus de llibertat està en aquest cas.
Desigualtat de Cauchy-Schwarz. Si i són dues variables aleatòries, aleshores,
Nova interpretació de la variància gràcies a la desigualtat de Txebixev
La desigualtat de Txebixev permet interpretar de quina manera la variància mesura la "dispersió" d'una variable aleatòria.[6] Si a la fórmula de la desigualtat de Txebixev prenem, per exemple, , aleshores la probabilitat que la variable s'allunyi de la seva mitjana més de 3 vegades la desviació típica serà menor de .
Siguin i dues variables aleatòries. Definim la covariància de i a on suposem que Tenim la següent fórmula per a la variància d'una suma de dues variables aleatòries: Més generalment, per a la variància de la suma de variables aleatòries tenim
Si , es diu que i estan incorrelacionades. En aquest cas, la variància de la suma o la resta de variables se simplifica: on, al cas de la resta, hem aplicat la propietat 2 de l'apartat anterior.
Noteu que si dues variables i són independents, aleshores són incorrelacionades, ja que .
La fórmula de la variància de la suma de variables també se simplifica: Si són incorrelacionades dos a dos, és a dir, per a , aleshores Sigui i dues variables aleatòries tals que Es defineix el coeficient de correlació entre i al nombre Es ha de . A més, si , aleshores existeixen nombres , amb , tals que (quasi segurament) I si , aleshores existeixen nombres , amb , tals que (quasi segurament)Per aquest motiu, el coeficient de correlació s'interpreta com una mesura del grau d'associació lineal entre dues variables (però no del grau d'associació general).
En estadística descriptiva[4] es considera una població (de persones o de coses: també s'anomena univers o col·lectiu) finita, amb elements, i es mesura una característica numèrica. Els resultats, iguals o diferents, es designen per . La mitjana o mitjana aritmètica es defineix per
La variància es defineix per
En general, en les observacions hi ha nombres repetits i només tenim valors diferents, que escriurem , de manera que els nombres es resumeixen en una taula de freqüències:
Valor
Freqüència
absoluta
Freqüència
relativa
TOTAL
on és la freqüència absoluta de la dada , és a dir, el nombre de vegades que surt aquesta dada, i és la freqüència relativa. Aleshores la mitjana es calcula per la fórmula
i la variància per
Atès que la variància de la població descrita per la taula anterior coincideix amb la variància d'una variable aleatòria discreta que prengui els valors amb probabilitats , les propietats i fórmules que hem comentat als apartats anteriors també serveixen per aquest cas. Aleshores, per la Propietat 3 de la variància, tenim la fórmula
Aquesta fórmula és útil per a calcular la variància amb les dades tabulades. Per exemple, utilitzant freqüències absolutes tenim
TOTAL
Llavors dividint el total de la tercera columna per s'obté , i dividint el total de la cinquena columna per s'obté l'altre terme que intervé en la fórmula de la variància.
Per a variància poblacional i variància mostral vegeu la pàgina desviació tipus.