Mediana: diferència entre les revisions

Contingut suprimit Contingut afegit
m Robot treu puntuació penjada després de referències
m modificacions en la introducció
Línia 1:
{{FR|data=abril de 2019}}
{{confusió|Mitjana}}
En [[Estadística descriptiva]], la '''mediana''' d'un conjunt finit de dades és un nombre tal que la meitat de les dades són menors (o iguals) que ell;, i l'altra meitat més grans (o iguals). quePer elltant, en el conjunt de les dades ordenades, la mediana ocupa el lloc central. Anàlogament, en [[Teoria de la probabilitat]] es defineix la '''mediana d'una variable aleatòria''' com un nombre tal que lesla probabilitatsvariable del conjuntigual probabilitat de nombresprendre valors menors o iguals que ell, i el conjunt dels nombres majors o iguals que ell, són ambdues més grans o iguals a 0.5. Finalment, en [[Inferència estadística]] s'estudia la '''mediana poblacional''' i la '''mediana mostral'''. En aquest article es revisen tots aquests conceptes i es relacionen entre ells.
 
La mediana s'utilitza normalment per a donar un valor "típic" que caracteritza un conjunt de dades. En comparació amb la mitjana, la característica essencial de la mediana es que no es veu afectada si hi ha un grup de dades molt més petit o molt més grans que les altres, mentre que la mitjana sí que pot quedar distorsionada. Un exemple d'aquesta situació es dóna quan l'analitzar el temps que els estudiants universitaris tarden en fer una carrera, el fet que hi hagi alguns estudiants que estiguin molts anys per acabar la carrera (perquè es posen a treballar i alenteixen els estudis, o altres motius) fa que la mitjana no reflecteixi bé les dades; al contrari, la mediana no és sensible a aquests valors extrems, i proporciona un millor valor representatiu de la durada dels estudis.
 
=== Mediana d'un conjunt finit de nombres ===
Linha 36 ⟶ 38:
Com que <math> n=200 </math> és parell, hem de buscar les observacions que, a l'ordenar totes les dades, ocupen les posicions 100 i 101. Per la columna de freqüències acumulades veiem que ambdues són 1; llavors, la mediana és 1 fill.
 
==== Càlcul de la mediana a partir d'una taula de freqüències amb dades agrupades<ref name=":1" />====
 
Si les dades estan agrupades en classes (o intervals) el càlcul de la mediana és aproximat, ja que a partir de la taula no es coneix el valor exacte de les dades; pel mateix motiu, no es distingeix si <math>n</math> és parell o senar.
 
PrimerPer calcular la mediana<ref name=":1" />, primer es calcula la classe (o interval) mediana, que és aquella classe que conté la freqüència absoluta acumulada n/2, és a dir, és la classe <math>i</math> tal que
<center>
<math>FA_{i-1}<\dfrac{n}{2}\le FA_{i},</math>
Linha 90 ⟶ 92:
==== Comentaris ====
 
1. Tal com hem vist, la mediana és un nombre que ocupa el lloc central en l'ordenació de les dades. Es diu que la mediana, com la mitjana, és una mesura estadística de posició o de tendència central.
 
2. Si les dades tenen una distribució força simètrica respecte a la seva [[mitjana aritmètica]], llavors la mediana i la mitjana tenen valors molt semblants, que seran iguals si la distribució és perfectament simètrica. En canvi, si la distribució de valors presenta valors molt allunyats de la mitjana en valors grans o en valors petits, llavors la mediana i la mitjana diferiran apreciablement.
 
3. Continuant amb el punt anterior, tot i que no es poden donar receptes concretes, la mediana és una mesura adient quan hi ha valors extrems molt diferents de les altres dades i que tenen molta influència en la mitjana, la qual cosa donaria una imatge distorsionada de les dades. Per exemple, a l'analitzar el temps que els estudiants universitaris tarden en fer una carrera, el fet que hi hagi alguns estudiants que estiguin molts anys per acabar la carrera (perquè es posen a treballar i alenteixen els estudis, o altres motius) fa que la mitjana no reflecteixi bé les dades. Al contrari, la mediana no és sensible als valors extrems.
 
'''Exemple.''' Considerem les dades <math>\left \{ 1,2,3,4,5,6,7,8,9 \right \}</math>, la mediana <math>Me</math> pren el valor 5, ja que al darrere d'aquest valor tenim el mateix nombre de dades que al davant. Simbòlicament: <math>\left \{ \left \{1,2,3,4 \right \}5 \left \{6,7,8,9 \right \}\right \}</math>. La mitjana també val 5, perquè tenim simetria de valors. En efecte, les distàncies entre cada valor i la mitjana són simètrics, i valen <math>\left \{4,3,2,1,0,1,2,3,4\right \}</math>. En la seqüència <math>\left \{0,1,1,2,3,3,4,4,27\right \}</math>, la mediana val 3 i la mitjana continua valent 5; la diferència ve de l'asimetria de la distribució, ja que les distàncies entre cada valor i la mitjana són <math>\left \{5,4,4,3,2,2,1,1,22\right \}</math>.