Interval de confiança: diferència entre les revisions

Contingut suprimit Contingut afegit
→‎Referències: - {{Esborrany de matemàtiques}}
Etiqueta: editor de codi 2017
m Manteniment de plantilles
Línia 10:
 
== Exemple introductori. Estimació puntual i per interval de l'alçada de les dones d'un poble ==
Les alçades de 10 dónes de 18 anys d'un poble són les següents<ref>{Dades simulades a partir de la informació de l'article {Ref-web|url=https://www.academia.cat/files/204-6146-FITXER/millennialsgrowth2017CAT.pdf|títol=millennialsgrowth2017CAT.pdf|consulta=30 de juny de 2020|llengua=|editor=}}</ref> (en cm):<math display="block">166,\,171'2,169'1,\,163'4,\,165,\,163'6,\,158'2,\,163'9,\,169'5,\,168'9</math>(Per claredat tipogràfica, en tot l'article escriurem els decimals de la forma 171'2 en lloc de 171,2). L'alçada mitjana és<math display="block">\overline X=\frac{166+171'2+\cdots+169'8}{10}=165'88.</math>Però el que volem és estimar l'alçada mitjana de totes les dones de 18 anys, que designarem per <math>m</math>, i no només la de les dones de la mostra. El nombre 165'88 és un '''estimador puntual''' d'aquesta mitjana <math>m</math>, i normalment s'escriu <math display="block">\widehat m=\overline X=165'88 \ {\rm cm}.</math> Però, ¿estem segurs que <math>m=165'88</math> ? ¿No podria ser que <math>m=168</math> o que <math>m=162</math>? Aquests dubtes provenen del fet que hem preguntat a 10 dones, i per estar segurs de la mitjana de tota la població hauríem de preguntar a totes les dones! Però podem afinar més aquest resultat i quantificar la incertesa associada amb aquesta estimació. Per fer això, necessitem un model estadístic adient: suposarem que l'alçada de les dones de 18 anys d'aquell poble segueix una distribució normal de mitjana <math>m</math> i desviació típica <math>d</math>; en altres paraules, l'alçada genèrica d'una dona de 18 anys es modelitza per una variable aleatòria <math display="inline">X\sim {\mathcal N}(m,d^2) </math>. En mesurar les alçades de 10 dones tenim 10 variables aleatòries, que s'anomenen una '''mostra''',<math display="block">X_1,\dots, X_{10}. </math> Aquestes variables aleatòries són independents (suposem que la mostra s'ha triat a l'atzar) i cadascuna d'aquestes variables segueix la mateixa distribució que la genèrica: <math display="block">X_i\sim {\mathcal N}(m,d^2),\, i=1,\dots, 10.</math>Els nombres concrets obtinguts, 166, 171'2, etc. s'anomenen una '''realització de la mostra'''.
 
En aquesta primera part suposarem que a partir d'estudis anteriors o per comparació amb dades similars, que la desviació típica és coneguda: <math>d=4</math>.
Línia 96:
== Interval de confiança per a una proporció (cas d'una població gran) ==
=== Exemple. ===
Segons dades del Centre d'Estudis d'Opinó <ref>{{Ref-web|url=http://upceo.ceo.gencat.cat/wsceop/7508/Informe%20de%20resultats%20-960.pdf|títol=Barómetre de la bicileta. 2019|consulta=13/10/2020|llengua=|editor=}}</ref> en una enquesta a 800 persones, entre 12 i 79 anys, a Catalunya realitzada a finals de 2018, 323 persones van dir que utilitzaven la bicicleta amb alguna freqüència (diàriament o esporàdicament). A la mostra, la proporció de gent que utilitza la bicicleta és <math display="block">\widehat p=\frac{323}{800}=0'404,</math>
 
o, equivalentment, un 40'4% de la mostra. Però estem interessats en estimar la proporció en tota la població de Catalunya, no només a la mostra.