Diferència entre revisions de la pàgina «Mediana»

5.243 bytes afegits ,  fa 1 any
Modificació de la introducció. Separació dels casos amb nombre de dades senar o parell. Càlcul de la mediana a partir de taules de freqüències (agrupades en classes o no). Afegit exemples i comentaris. Afegit referències
(Robot posa data a plantilles de manteniment)
(Modificació de la introducció. Separació dels casos amb nombre de dades senar o parell. Càlcul de la mediana a partir de taules de freqüències (agrupades en classes o no). Afegit exemples i comentaris. Afegit referències)
{{FR|data=abril de 2019}}
{{confusió|Mitjana}}
En [[Estadística descriptiva]], la '''mediana''' <ref>{{Ref-llibre|cognom=Lobez Urquia, J., Casa Aruta, E.|nom=|títol=Estadística intermedia|url=|edició=Segunda edición|llengua=|data=1975|editorial=Vicens-Vives|lloc=Barcelona|pàgines=|isbn=}}</ref> <ref>{{Ref-llibre|cognom=Calot, Gérard|nom=|títol=Curso de Estadística Descriptiva|url=|edició=|llengua=|data=1970|editorial=Paraninfo|lloc=Madrid|pàgines=|isbn=}}</ref> d'una sèrie de dades <math>x_1,\dots,x_n</math> és un nombre tal que la meitat de les dades són menors (o iguals) que ell i l'altra meitat més grans (o iguals). Per calcular-la es distingeix segons que el nombre de dades <math>n</math> sigui senar o parell.
La '''mediana''' és una mesura o dada [[estatística|estadística]] descriptiva de tendència central que resumeix un conjunt de dades o d’observacions estatístiques de nombres, ordenats de menor a major <math>x_1 < x_2 < ... < x_n </math>, en un únic nombre <math>m</math>. Aquest té una valor del paràmetre mesurat sobre el conjunt d'elements de la [[població]] o [[mostra estadística]] en què se'n mesuren tots els elements tal com el nombre de dades que resta per sota de <math>m</math> és igual al nombre de dades que roman per sobre de <math>m</math>.
 
'''Nombre de dades senar.''' Per exemple, si tenim els nombres 12, 7, 4, 4 , 3, 9, 8, per calcular la mediana comencem ordenant-los de menor a major: 3, 4, 4, '''<u>7</u>''', 8, 9, 12. La mediana és el nombre que ocupa el lloc central, en aquest exemple el 7. En general, quan el nombre de dades <math> n</math> és senar, la mediana és la dada que ocupa el lloc central en l'ordenació, és a dir, la que ocupa la posició <math>\frac{n+1}{2}</math>.
 
'''Nombre de dades parell.''' Quan hi ha un nombre parell de dades, aleshores la mediana pot ser qualsevol número que estigui entre el valor que ocupa el lloc <math>n/2</math> i el del lloc<math>n/2+1</math> (en la sèrie ordenada). Per exemple, si tenim 12, 7, 4, 4 , 3, 9, 8, 11,que ordenats queden 3, 4, 4, '''<u>7, 8</u>''', 9, 11, 12, la mediana pot ser qualsevol número entre 7 i 8. Per conveni es pren la semisuma:
<center><math>Me=\frac{7+8}{2}=7'5</math>.</center>
 
== Càlcul de la mediana a partir d'una taula de freqüències (dades no agrupades) ==
 
Quan tenim les dades donades per una taula de freqüències, la mediana es busca utilitzant les freqüències acumulades (absolutes o relatives). Per exemple, la següent taula dóna el nombre de fills de 200 parelles d'una ciutat. Utilitzarem les freqüències absolutes.
 
<center>
<math>
\begin{array}{ccc}
\hline
Nombre\ de \ fills & Freq. \ absoluta & Freq. \ abs.\ acumulada \\
\hline
0 & 52 & 52 \\
1 & 54 & 106 \\
2 & 70 & 176 \\
3 & 18 & 194 \\
4 & 6 & 200 \\
\hline
Total & 200 & \\
\hline
\end{array}
</math>
</center>
Com que <math> n=200 </math> és parell, hem de buscar les observacions que a l'ordenar totes les dades ocupen les posicions 100 i 101. Per la columna de freqüències acumulades veiem que ambdues són 1; llavors, la mediana és 1 fill.
 
== Càlcul de la mediana a partir d'una taula de freqüències amb dades agrupades ==
 
Si les dades estan agrupades en classes (o intervals) el càlcul de la mediana és aproximat, ja que a partir de la taula no es coneix el valor exacte de les dades; pel mateix motiu, no es distingeix si <math>n</math> és parell o senar.
 
Primer es calcula la classe (o interval) mediana, que és aquella classe que conté la freqüència absoluta acumulada n/2, és a dir, és la classe <math>i</math> tal que
<center>
<math>FA_{i-1}<\dfrac{n}{2}\le FA_{i},</math>
</center>
on <math>FA_i</math> designa la freqüència acumulada de la classe <math>i</math> (amb el conveni <math>FA_0=0</math>). Després s'interpola linealment en aquesta classe per trobar el valor aproximat de la mediana. La fórmula de la interpolació lineal és la següent: Designem per <math> [a_i,a_{i+1}[</math> la classe mediana (el conveni que s'adopti sobre els extrems de les classes no té importància), <math>L_i</math> la seva longitud, <math> F_i</math> la seva freqüència absoluta i <math> FA_{i-1}</math> la freqüència absoluta acumulada de la classe anterior a la classe mediana. Aleshores
<center>
<math>Me=a_i+L_i\, \dfrac{\dfrac{ n}{2}-FA_{i-1}}{F_i}.
</math>
</center>
Hi ha una fórmula anàloga utilitzant freqüències relatives.
 
Exemple. La taula següent dóna la superfície (en <math>m^2</math>) dels habitatges a Catalunya (taula construïda a partir de la taula de Superfície útil dels habitatges principals de 2011 de l'Idescat. https://www.idescat.cat/pub/?id=censph&n=311 (consultada el 6 d'octubre de 2019).
 
<center>
<math>
\begin{array}{crr}
\hline
Superficie & Freq. abs. & Freq. abs. acum. \\
\hline
menys\ de \ 30 & 8.548 & 8.548 \\
de \ 30 \ a \ 60 & 339.439 & 347.987 \\
de \ 60 \ a \ 90 & 1.343.051 & 1.691.038 \\
de \ 90 \ a \ 120 & 778.443 & 2.469.481 \\
de \ 120 \ a \ 150 & 223.017 & 2.692.498 \\
de \ 150 \ a \ 180 & 110.336 & 2.802.834 \\
de \ 180 \ a \ 210 & 81.889 & 2.884.723 \\
mes \ de \ 210& 60.221 & 2.944.944 \\
\hline
Total & 2.944.944 & \\
\hline
\end{array}
</math>
</center>
 
Aleshores <math>n/2=1.472.472</math> i la classe mediana és [60,90[. La mediana és
<center>
<math> Me=60+30\, \dfrac{1.472.472-347.987}{1.343.051}=85'12</math>
</center>
 
== Comentaris ==
 
1. Es diu que la mediana, com la mitjana, és una mesura estadística de posició o de tendència central.
 
2. Si les dades tenen una distribució bastant simètrica respecte a la seva [[mitjana aritmètica]], llavors la mediana i la mitjana tenen valors molt semblants, que seran iguals si la distribució és perfectament simètrica. En canvi, si la distribució de valors presenta valors molt allunyats de la mitjana en valors grans o en valors petits, llavors la mediana i la mitjana diferiran apreciablement. La mediana d'un conjunt de dades és única i el seu valor no és sensible a la presència de dades extremes.
 
3. Continuant amb el punt anterior, tot i que no es poden donar receptes concretes, la mediana és una mesura adient quan hi ha valors extrems molt diferents de les altres dades i que tenen molta influència en la mitjana, la qual donaria una imatge distorsionada de les dades. Per exemple, a l'analitzar el temps que els estudiants universitaris tarden en fer una carrera, el fet que hi hagi alguns estudiants que estiguin molts anys per acabar la carrera (perquè es posen a treballar i alenteixen els estudis, o altres motius) fa que la mitjana no reflecteixi bé les dades. Al contrari, la mediana no és sensible als valors extrems.
 
Siguin'''Exemple.''' Considerem les dades <math>\left \{ 1,2,3,4,5,6,7,8,9 \right \}</math>, la mediana <math>mMe</math> pren el valor 5, ja que al darrere d'aquest valor tenim el mateix nombre de dades que al davant. Simbòlicament: <math>\left \{ \left \{1,2,3,4 \right \}5 \left \{6,7,8,9 \right \}\right \}</math>. La mitjana també val 5, perquè tenim simetria de valors. En efecte, les distàncies entre cada valor i la mitjana són simètrics, i valen <math>\left \{4,3,2,1,0,1,2,3,4\right \}</math>. En la seqüència <math>\left \{0,1,1,2,3,3,4,4,27\right \}</math>, la mediana val 3 i la mitjana continua valent 5; la diferència ve de l'asimetria de la distribució, ja que les distàncies entre cada valor i la mitjana són <math>\left \{5,4,4,3,2,2,1,1,22\right \}</math>.
 
 
4. A vegades s'escolta la frase ''la meitat de les dades són més petites que la mitjana i l'altre meitat més grans''. En general, no és certa, com es comprova, per exemple, amb les dades 0, 1, 1, 1. Però si que és certa amb la mediana.
 
<references />
 
 
 
 
 
== Propietats ==
Si les dades tenen una distribució bastant simètrica respecte a la seva [[mitjana aritmètica]], llavors la mediana i la mitjana tenen valors molt semblants, que seran iguals si la distribució és perfectament simètrica. En canvi, si la distribució de valors presenta valors molt allunyats de la mitjana en valors grans o en valors petits, llavors la mediana i la mitjana diferiran apreciablement. La mediana d'un conjunt de dades és única i el seu valor no és sensible a la presència de dades extremes.
 
== Exemples ==
Siguin les dades <math>\left \{ 1,2,3,4,5,6,7,8,9 \right \}</math>, la mediana <math>m</math> pren el valor 5, ja que al darrere d'aquest valor tenim el mateix nombre de dades que al davant. Simbòlicament: <math>\left \{ \left \{1,2,3,4 \right \}5 \left \{6,7,8,9 \right \}\right \}</math>. La mitjana també val 5, perquè tenim simetria de valors. En efecte, les distàncies entre cada valor i la mitjana són simètrics, i valen <math>\left \{4,3,2,1,0,1,2,3,4\right \}</math>.
En la seqüència <math>\left \{0,1,1,2,3,3,4,4,27\right \}</math>, la mediana val 3 i la mitjana continua valent 5; la diferència ve de l'asimetria de la distribució, ja que les distàncies entre cada valor i la mitjana són <math>\left \{5,4,4,3,2,2,1,1,22\right \}</math>.
 
{{Commonscat}}
431

modificacions