Interval de confiança: diferència entre les revisions

Contingut suprimit Contingut afegit
m Diacrítics
m Espais sobrants
Línia 1:
En [[estadística|estadística matemàtica]], un '''interval de confiança''' d'un paràmetre poblacional (per exemple, la mitjana poblacional) és un [[interval (matemàtiques)|interval]] numèric construït a partir d'una mostra, el qual conté aquest paràmetre amb determinada probabilitat (per exemple, el 95 %) que s'anomena el '''nivell de confiança'''.
 
El nivell de confiança desitjat és establert per l'investigador (no és determinat per les dades). És molt habitual utilitzar el nivell de confiança del 95%,<ref>Zar, J.H. (1984) ''Biostatistical Analysis.'' Prentice-Hall International, New Jersey, pp 43–45.</ref> no obstant això, es poden utilitzar altres nivells de confiança, per exemple, el 90% o el 99%.
 
En contrast amb un estimador puntual d'un paràmetre, on es dona un únic nombre, en un interval de confiança, tal com hem dit, es proporciona tot un rang de nombres entre dos valors, i a més, es quantifica en termes probabilístics la confiança que es té en què aquest interval contindrà l'autèntic valor del paràmetre.
Línia 36:
on <math>z_\gamma</math> és el nombre tal que
<math display="block">P(-z_\gamma\le Z\le z_\gamma)=\gamma,</math>
on <math>Z\sim\mathcal{N}(0,1)</math> és una [[Distribució normal|variable aleatòria normal estàndard]]. Aquest nombre <math>z_\gamma</math> es troba en unes taules estadístiques o bé amb un [[full de càlcul]] (per exemple, l'excel) o un programari estadístic (per exemple, l'[[R (llenguatge de programació)|R]]). Pels casos més habituals tenim:
{| class="wikitable" style="text-align:left;margin-left:100pt;border:none;background:none;"
!<math>\gamma</math>!!<math>z_\gamma</math>
Línia 114:
Hem passat de la fórmula (5) a la fórmula (6) canviant la quantitat desconeguda <math>p</math> per l'estimació <math>\widehat p</math>. Un mètode diferent per resoldre la dificultat que a (5) intervé una quantitat desconeguda és basa en el fet que<math display="block">0\le p(1-p)\le 0'25\quad p\in [0,1].</math>
[[Fitxer:Parabola p.svg|miniatura|Figura 3. Gràfic per calcular la mida de l'interval de confiança]]
Això es veu gràficament perquè la funció <math>y=x(1-x)</math> és una paràbola invertida amb el vèrtex al punt (0'5, 0'25). Vegeu la Figura 3. Aleshores, l'interval de confiança més llarg possible (el que tindrà menys precisió) serà el corresponent a <math>p=0'5</math>, i l'interval de confiança serà <math display="block"> \Bigg[\widehat p-z_\gamma \,{\frac{0'5}{\sqrt n}},\, \widehat p+z_\gamma \,{\frac{0'5}{\sqrt n}}\Bigg]. \qquad \qquad (7)</math>O escrit d'una altra manera, <math display="block"> \widehat p\pm z_\gamma \,{\frac{0'5}{\sqrt n}}. \qquad \qquad (8)</math>Aquest interval és diu que és el més conservador, ja que el que pretén és ser molt prudent i intentar equivocar-nos el mínim possible. A l'exemple de la bicicleta, amb <math>\gamma=0'95</math>, aquest interval és <math>[0'369,\, 0'439]</math>. Aquest interval té una longitud 0'07, lleugerament més gran que l'anterior de 0'068. En aquest cas la diferència és petita perquè l'estimació <math>\widehat p</math> és propera a 0'5.
 
=== Una recepta per a la mida de la mostra ===