Interval de confiança: diferència entre les revisions
Contingut suprimit Contingut afegit
m neteja i estandardització de codi |
Final demostració interval de confiança mitjana amb desviació típica desconeguda |
||
Línia 10:
== Exemple introductori. Estimació puntual i per interval de l'alçada de les dones d'un poble ==
Les alçades de 10 dónes de 18 anys d'un poble són les següents<ref>{Dades simulades a partir de la informació de l'article {Ref-web|url=https://www.academia.cat/files/204-6146-FITXER/millennialsgrowth2017CAT.pdf|títol=millennialsgrowth2017CAT.pdf|consulta=30 de juny de 2020|llengua=|editor=|data=}}</ref> (en cm):<math display="block">166,\,171'2,169'1,\,163'4,\,165,\,163'6,\,158'2,\,163'9,\,169'5,\,168'9</math>(Per claredat tipogràfica, en tot l'article escriurem els decimals de la forma 171'2 en lloc de 171,2). L'alçada mitjana és<math display="block">\overline X=\frac{166+171'2+\cdots+169'8}{10}=165'
En aquesta primera part suposarem que a partir d'estudis anteriors o per comparació amb dades similars,
=== Interval de confiança per a <math>m</math> ===
Volem calcular un interval de confiança per a <math>m</math>; per concretar, començarem calculant un interval amb una confiança del 95% (equivalentment, en tant per u, una confiança de 0
<math display="block">\overline X=\frac{\sum_{i=1}^n X_i}{n}.</math>
Argumentarem més endavant que un interval amb confiança del 95% per <math>m</math> s'obté per la fórmula
Línia 21:
En aquest exemple, tenim que l'interval és
<math display="block">
\Big[165'
=[163'4,\, 168'
=== I si volem més confiança? ===
[[Fitxer:Interval95 99.svg|miniatura|Figura 1. Intervals de confiança del 95% (línia blava) i del 99% (línia vermella discontínua) de la mitjana de les alçades de dones de 18 anys d'un poble.]]
Raonarem més endavant que si volem una confiança del 99%, aleshores a la fórmula (1) cal canviar 1'96 per 2'58, i per tant, la fórmula a utilitzar és <math display="block"> \Big[\overline X-2'58 \frac{d}{\sqrt n},\, \overline X+2'58 \frac{d}{\sqrt n}\Big]. \qquad (2)</math>A l'exemple, l'interval de confiança del 99% és <math display="block">
\Big[165'
=[162'
Noteu que en augmentar la confiança també augmenta la llargada de l'interval, vegeu la figura 1. Per tant, com més confiança volem tenir, és a dir, com més segurs vulguem estar que l'interval que calculem conté l'autèntic valor del paràmetre desconegut, més llarg ens donarà l'interval. ''Pregunta al lector'': ¿quin seria l'interval per tenir una confiança del 100%?
Línia 36:
on <math>z_\gamma</math> és el nombre tal que
<math display="block">P(-z_\gamma\le Z\le z_\gamma)=\gamma,</math>
on <math>Z\sim\mathcal{N}(0,1)</math> és una [[Distribució normal|variable aleatòria normal estàndard]]. Aquests valor <math>z_\gamma</math> Aquest valor es troba en unes taules estadístiques o bé amb el [[full de càlcul]] (per exemple, l'excel) o programari estadístic (per exemple, l'[[R (llenguatge de programació)|R]]). Pels casos més habituals tenim:
{| class="wikitable" style="text-align:left;margin-left:100pt;border:none;background:none;"
!<math>\gamma</math>!!<math>z_\gamma</math>
Línia 58:
* La '''mida de la mostra''' <math>n</math>. Com més gran sigui, més precisió tindrem (més curt serà l'interval), però prendre una mostra és car, en temps o en diners.
L'ideal seria tenir la màxima confiança, la mínima llargada de l'interval i la mida de mostra petita, però tot alhora no pot ser: aquests tres ingredients és com si fossin els angles d'un triangle (vegeu la Figura 2): dos angles determinen el tercer: si volem molta confiança i molta precisió caldrà prendre una mida de mostra molt gran, que serà molt car!, etc. <<''Res és perfecte''>>, sospirà la guineu...
[[Fitxer:Triangle confiança.svg|miniatura|Figura 2. Els tres factors d'un interval de confiança]]
=== Demostració de la fórmula de l'interval de confiança ===
Línia 75:
== Interval de confiança per a la mitjana d'una població normal amb desviació típica desconeguda ==
Quan la desviació típica de la població és desconeguda, aleshores es fa una estimació a partir de la mostra utilitzant la [[Desviació tipus|desviació típica mostral modificada]] <math display="block"> S=\sqrt{\frac{\sum_{i=1}^n(X_i-\overline X)^2}{n-1}}.</math>Llavors, l'interval amb nivell de confiança <math>\gamma\in (0,1)</math> és <math display="block">\Big[\overline X-t_\gamma\, \frac{S}{\sqrt n},\, \overline X+t_\gamma\, \frac{S}{\sqrt n}\Big],\qquad\qquad (4)</math>
on <math>t_\gamma</math> és el nombre tal que<math display="block">P(-t_\gamma\le
En resum, si la desviació típica <math>d</math> és desconeguda, aleshores per calcular l'interval de confiança per a <math>m</math> fem dos canvis:
# Canviem la quantitat desconeguda <math>d</math> per l'estimació <math>S</math>.
# Canviem el valor <math>z_\gamma</math> de la fórmula (3) obtingut amb una llei normal estàndard pel valor <math>t_\gamma</math> calculat a partir d'una variable <math>t</math> de Student amb <math>n-1</math> graus de llibertat.
===== Tornem a l'exemple de les alçades =====
Si a l'exemple de les alçades de les dones de 18 anys no suposem la desviació típica coneguda, aleshores l'estimem per <math>S</math>, que dóna <math display="block">S=\frac{(166-165'88)^2+\cdots+(168'9-165'88)^2}{9}=3'89.</math>Per calcular l'interval de confiança del 95% necessitem el valor <math>t_{0'95}</math> corresponent a una <math>t</math> de Student amb 9 graus de llibertat.
\Big[165'88-2'26\,\frac{3'89}{\sqrt{10}}, \, 165'88+2'26\,\frac{3'89}{\sqrt{10}}\Big]
=[163'1,\, 168'66].</math>Cal notar que l'interval que hem calculat suposant la desviació típica coneguda tenia una longitud de 4'96 cm, mentre que aquest últim mesura 5'56 cm, i per tant és més llarg. Això és degut al fet que en estimar la desviació típica introduïm més incertesa en els càlculs.
===== Demostració de la fórmula de l'interval de confiança amb desviació típica desconeguda =====
El genial estadístic
<math display="block">P\bigg(-t_\gamma\le \frac{\overline X-m}{S/\sqrt{n}}\le t_\gamma \bigg)=\gamma.</math>
Ara es procedeix exactament igual que en la demostració de l'interval de confiança amb desviació típica coneguda que hem vist abans i es dedueix la fórmula (4).
== Referències ==
|