Mediana: diferència entre les revisions

Contingut suprimit Contingut afegit
m Bot estandarditza format de referència citada per a posterior revisió tipogràfica.
m Bot elimina espais sobrants
Línia 18:
 
==== Càlcul de la mediana a partir d'una taula de freqüències (dades no agrupades) ====
Quan tenim les dades donades per una taula de freqüències, la mediana es busca utilitzant les freqüències acumulades (absolutes o relatives). Per exemple, la següent taula dóna el nombre de fills de 200 parelles d'una ciutat. Utilitzarem les freqüències absolutes.
 
<center>
Línia 37:
</math>
</center>
Com que <math> n=200 </math> és parell, hem de buscar les observacions que, en ordenar totes les dades, ocupen les posicions 100 i 101. Per la columna de freqüències acumulades veiem que ambdues són 1; llavors, la mediana és 1 fill.
 
==== Càlcul de la mediana a partir d'una taula de freqüències amb dades agrupades ====
Si les dades estan agrupades en classes (o intervals) el càlcul de la mediana és aproximat, ja que a partir de la taula no es coneix el valor exacte de les dades; pel mateix motiu, no es distingeix si <math>n</math> és parell o senar.
 
Per calcular la mediana,<ref name=:1/> primer es calcula la classe (o interval) mediana, que és aquella classe que conté la freqüència absoluta acumulada n/2, és a dir, és la classe <math>i</math> tal que
Línia 46:
<math>FA_{i-1}<\dfrac{n}{2}\le FA_{i},</math>
</center>
on <math>FA_i</math> designa la freqüència acumulada de la classe <math>i</math> (amb el conveni <math>FA_0=0</math>). Després s'interpola linealment en aquesta classe per trobar el valor aproximat de la mediana. La fórmula de la interpolació lineal és la següent: Designem per <math> [L_i,L_{i+1}[</math> la classe mediana (el conveni que s'adopti sobre els extrems de les classes no té importància), <math>a_i</math> la seva longitud, <math> F_i</math> la seva freqüència absoluta i <math> FA_{i-1}</math> la freqüència absoluta acumulada de la classe anterior a la classe mediana. Aleshores
<center>
<math>M=L_i+\dfrac{\dfrac{ n}{2}-FA_{i-1}}{F_i}\, a_i.
Línia 95:
2. Si les dades tenen una distribució força simètrica respecte a la seva [[mitjana aritmètica]], llavors la mediana i la mitjana tenen valors molt semblants, que seran iguals si la distribució és perfectament simètrica. En canvi, si la distribució de valors presenta valors molt allunyats de la mitjana en valors grans o en valors petits, llavors la mediana i la mitjana diferiran apreciablement.
 
3. Continuant amb el punt anterior, tot i que no es poden donar receptes concretes, la mediana és una mesura adient quan hi ha valors extrems molt diferents de les altres dades i que tenen molta influència en la mitjana, la qual cosa donaria una imatge distorsionada de les dades.
 
'''Exemple.''' Considerem les dades <math>\left \{ 1,2,3,4,5,6,7,8,9 \right \}</math>, la mediana <math>Me</math> pren el valor 5, ja que al darrere d'aquest valor tenim el mateix nombre de dades que al davant. Simbòlicament: <math>\left \{ \left \{1,2,3,4 \right \}5 \left \{6,7,8,9 \right \}\right \}</math>. La mitjana també val 5, perquè tenim simetria de valors. En efecte, les distàncies entre cada valor i la mitjana són simètrics, i valen <math>\left \{4,3,2,1,0,1,2,3,4\right \}</math>. En la seqüència <math>\left \{0,1,1,2,3,3,4,4,27\right \}</math>, la mediana val 3 i la mitjana continua valent 5; la diferència ve de l'asimetria de la distribució, ja que les distàncies entre cada valor i la mitjana són <math>\left \{5,4,4,3,2,2,1,1,22\right \}</math>.
Línia 114:
</math>
</center>
on <math>F(M^-)</math> designa el límit per l'esquerra en el punt <math>M</math>. Utilitzant que <math>F</math> és creixent, que <math>\lim_{x\to -\infty}F(x)=0</math> i <math>\lim_{x\to \infty}F(x)=1</math> es demostra que, tal com passava amb la mediana d'un conjunt finit de nombres, hi ha dos casos:
 
1. Només hi ha un nombre que compleix la condició (2), és a dir, la mediana és única.
Línia 159:
Per tant, la mediana és 3.
 
2. Per a una variable aleatòria discreta, quan la probabilitat dels nombres no és la mateixa, el fet que el nombre de valors possibles sigui parell o senar no determina la mediana. Per exemple, una variable <math>X</math> que prengui els valors 1, 2, 3 amb probabilitats
<center>
<math>
Línia 202:
Així, 7 és el primer valor tal que <math>P(X\ge k)\ge 0.5</math>, i per tant la mediana de <math>X</math> és 7.
 
Si el nombre de dades és parell, aleshores la mediana segons la definició (3) és el valor que, amb les dades ordenades, ocupa el lloc <math>n/2</math>, mentre que a la primera secció hem adoptat el conveni de prendre com a mediana la semisuma dels valors que ocupen, amb les dades ordenades, els llocs <math>n/2</math> i <math>n/2+1</math>.
 
'''Exemple.''' Considerem també l'exemple de la primera secció amb un nombre de dades parell: 3,4,4,7,8,9,11,12. Ara la variable aleatòria tindrà probabilitats:
Línia 218:
També 7 és el primer valor tal que <math>P(X\ge k)\ge 0.5.</math>D'acord amb el conveni (3), la mediana és 7. A la secció primera, amb el conveni de la semisuma havíem obtingut 7.5. Per tant ambdós convenis en el cas d'un nombre parell de dades són diferents.
 
'''Important.''' Noteu que tant en el cas parell com en el senar, la mediana segons (3) és el valor ocupa el lloc <math>[(n+1)/2]</math> , és a dir, la [[part entera]] de <math>(n+1)/2</math>, en les dades ordenades.
 
== Mediana poblacional i mediana mostral ==