Interval de confiança: diferència entre les revisions

Contingut suprimit Contingut afegit
Interval de confiança de la mitjana d'una població normal amb variància desconeguda
m neteja i estandardització de codi
Línia 14:
En aquesta primera part suposarem que a partir d'estudis anteriors o per comparació amb dades similars, que la desviació típica és coneguda: <math>d=4</math>.
 
=== Interval de confiança per a <math>m</math> ===
Volem calcular un interval de confiança per <math>m</math>; per concretar, començarem calculant un interval amb una confiança del 95% (equivalentment, en tant per u, una confiança de 0.95). Per tal d'escriure fórmules generals designarem la mida de la mostra per <math>n</math>, i la mitjana mostral per <math>\overline X</math>
<math display="block">\overline X=\frac{\sum_{i=1}^n X_i}{n}.</math>
Línia 31:
Noteu que en augmentar la confiança també augmenta la llargada de l'interval, vegeu la figura 1. Per tant, com més confiança volem tenir, és a dir, com més segurs vulguem estar que l'interval que calculem conté l'autèntic valor del paràmetre desconegut, més llarg ens donarà l'interval. ''Pregunta al lector'': ¿quin seria l'interval per tenir una confiança del 100%?
 
== Formula general de l'interval de confiança per la mitjana d'una població normal amb desviació típica coneguda ==
Donat un '''nivell de confiança''' <math>\gamma\in (0,1)</math>, que habitualment és 0'9, 0'95 o 0'99 (s'expressa en tant per u; si es vol en tant per cent, es multiplica per 100), aleshores l'interval de confiança és
<math display="block"> \Big[\overline X-z_\gamma \,\frac{d}{\sqrt n},\, \overline X+z_\gamma\, \frac{d}{\sqrt n}\Big], \qquad (3)</math>
Línia 60:
L'ideal seria tenir la màxima confiança, la mínima llargada de l'interval i la mida de mostra petita, però pot ser: aquests tres ingredients és com si fossin els angles d'un triangle (vegeu la Figura 2): dos angles determinen el tercer: si volem molta confiança i molta precisió caldrà prendre una mida de mostra molt gran, que serà molt car!, etc. <<''Res és perfecte''>>, sospirà la guineu...
[[Fitxer:Triangle confiança.svg|miniatura|Figura 2. Els tres factors d'un interval de confiança]]
=== Demostració de la fórmula de l'interval de confiança ===
Per simplificar les notacions veurem a demostració pel cas d'una confiança <math>\gamma=0'95</math>. De les propietats de les [[Distribució normal|variables aleatòries normals]]) es dedueix que
 
Línia 74:
<math display="block"> m\in \Big[\overline X-1'96 \frac{d}{\sqrt n},\, \overline X+1'96 \frac{d}{\sqrt n}\Big],\ \text{amb probabilitat 0'95.}</math>
 
== Interval de confiança per a la mitjana d'una població normal amb desviació típica desconeguda ==
Quan la desviació típica de la població és desconeguda, aleshores es fa una estimació a partir de la mostra utilitzant la [[Desviació tipus|desviació típica mostral modificada]] <math display="block"> S=\sqrt{\frac{\sum_{i=1}^n(X_i-\overline X)^2}{n-1}}.</math>Llavors, l'interval amb nivell de confiança <math>\gamma\in (0,1)</math> és <math display="block">\Big[\overline X-t_\gamma\, \frac{S}{\sqrt n},\, \overline X+t_\gamma\, \frac{S}{\sqrt n}\Big],</math>
 
on <math>t_\gamma</math> és el nombre tal que<math display="block">P(-t_\gamma\le T\le t_\gamma)=\gamma,</math>on <math>T</math> és una variable aleatòria amb [[Distribució t de Student|distribució <math>t</math> de Student]] amb <math>n-1</math> graus de llibertat.
 
===== Tornem a l'exemple de les alçades =====
Si a l'exemple de les alçades de les dones de 18 anys no suposem la desviació típica coneguda, aleshores l'estimem per <math>S</math>, que dóna <math display="block">S=\frac{(166-165'88)^2+\cdots+(168'9-165'88)^2}{9}=3'89.</math>Per calcular l'interval de confiança del 95% necessitem el valor <math>t_{0'95}</math> corresponent a una <math>t</math> de Student amb 9 graus de llibertat. Aquest valor es troba en unes taules estadístiques o bé amb el [[full de càlcul]] (per exemple, l'excel) o programari estadístic (per exemple, l'[[R (llenguatge de programació)|R]]). S'obté <math display="block">t_{0'95}=2'26.</math>Llavors, l'interval és <math display="block">
\Big[165'88-2'26\,\frac{3'89}{\sqrt{10}}, \, 165'88+2'26\,\frac{3'89}{\sqrt{10}}\Big]
=[163'1,\, 168'66].</math>Cal notar que l'interval que hem calculat suposant la desviació típica coneguda tenia una longitud de 4'96 cm, mentre que aquest últim mesura 5'56 cm, i per tant és més llarg. Això és degut al fet que en estimar la desviació típica introduïm més incertesa en els càlculs.
 
===== Demostració de la fórmula de l'interval de confiança amb desviació típica desconeguda =====
 
El genial estadístic anglès [[Ronald Aylmer Fisher|R. A. Fisher]] va demostrar el 1923, que sota les hipòtesis de normalitat que estem suposant, la variable aleatòria <math display="block">T=\frac{\overline X-m}{S/\sqrt{n}}</math>segueix una distribució <math>t</math> de Student amb <math>n-1</math> graus de llibertat <ref>Degroot, M. H. (1988) ''Probabilidad y estadística''. Addison-Wesley Iberoamericana, México, cap. 7.</ref>
 
== Referències ==
{{Referències}}