Distribució khi quadrat

distribució gamma

En Teoria de la probabilitat i Estadística la distribució distribució khi quadrat (pronunciat [xi] o [ci]), també anomenada khi quadrat de Pearson, amb de llibertat és la distribució de la suma dels quadrats de variables aleatòries normals estàndard independents. És un cas particular de la distribució gamma i es pot estendre a un nombre no enter de graus de llibertat. És molt important en Estadística ja que intervé en nombrosos tests estadístics, com el de la de Student o de la de Pearson, així com en la construcció de diversos intervals de confiança.

Infotaula distribució de probabilitat
Funció de densitat de probabilitat
Funció de distribució de probabilitat
Tipusfamília exponencial, Distribució khi quadrat no central, distribució gamma, Generalized chi-squared distribution (en) Tradueix i distribució de probabilitat contínua Modifica el valor a Wikidata
Notació o
Paràmetres (graus de llibertat)
Suport Modifica el valor a Wikidata
fdp
FD
Esperança matemàtica
Mediana
Moda
Variància
Coeficient de simetria
Curtosi Modifica el valor a Wikidata
Entropia
FGM Modifica el valor a Wikidata
FC Modifica el valor a Wikidata
MathworldChi-SquaredDistribution Modifica el valor a Wikidata

La referència bàsica d'aquest article és Johnson et al.[1].

Definició, funció de densitat i funció de distribució modifica

Siguin   variables aleatòries independents, totes amb distribució normal estàndard  . La variable aleatòria

 
es diu que té una distribució   amb   graus de llibertat i s'escriu   o   .

La funció de densitat és

 
on   és la funció gamma. Per tant, tenim que la distribució coincideix amb una distribució gamma amb paràmetre de forma   i paràmetre d'escala 2,   .

Funció de distribució modifica

La funció de distribució es pot escriure en termes de la funció gamma incompleta:

 
on   és la funció gamma incompleta inferior.

Extensió a graus de llibertat no enters modifica

La funció   està ben definida i és una funció de densitat per a qualsevol  : en efecte, fixat qualsevol nombre real  , tenim que   i  . Aleshores, una variable aleatòria amb aquesta densitat es diu que té una distribució   amb   graus de llibertat. Alternativament, la distribució   està definida per a qualsevol  . A partir d'ara, suposarem que  . i especificarem quan suposem que   és un nombre natural.

Moments, funció generatriu de moments i funció característica modifica

Moments modifica

Aquestes propietats es dedueixen particularitzant les corresponents propietats de la distribució gamma. Si   aleshores té moments de tots els ordres, que valen

 
Utilitzant la funció Gamma es pot escriure
 

En particular,

 
d'on
 
Així,

 

Moments d'ordre negatiu modifica

Si   és una variable aleatòria positiva,  , aleshores per a qualsevol   podem calcular

 
però pot donar   . Quan dóna finit, llavors es diu que la variable   té moment d'ordre negatiu  .[2]

Sigui  . Llavors, si   ,   té moment d'ordre negatiu   i val [2]

 
Per exemple, si   , llavors   té moment negatiu d'ordre -1 i val
 
Aquesta propietat s'utilitza per a calcular els moments de distribucions de quocients (o ratios) de variables aleatòries independents quan al denominador hi ha una distribució khi quadrat, com en el cas d'una distribució   de Student o una distribució  .

Funció generatriu de moments modifica

La funció generatriu de moments és

 

Funció característica modifica

La funció característica és

 

Caràcter reproductiu modifica

Del caràcter reproductiu de les distribucions gamma es dedueix el de les distribucions  : Siguin   independents, amb distribucions  ,  . Llavors,

 
Propietat.:[3] Siguin   i  . Suposem que   és independent de  . Aleshores  .



Aproximació per la distribució normal modifica

En aquesta secció considerarem la distribució   amb un nombre enter de graus de llibertat. D'acord amb el teorema central del límit, si  , aleshores

 
En altres paraules, per a   gran,   és aproximadament normal  .

Però aquesta aproximació demana   força gran. La següent aproximació, deguda a Fisher,[4] és més ràpida

 
Equivalentment, per a   gran,   és aproximadament normal   .

Segons Johnson et al[5] encara és més ràpida l'aproximació deguda a Wilson and Hilferty:[6] per a   gran,   és aproximadament normal  

La distribució χ² i les mostres de poblacions normals modifica

El següent resultat té una importància fonamental en la inferència estadística basada en mostres de poblacions normals.

Teorema. Sigui   una mostra d'una població normal  , és a dir, les variables aleatòries   són independents i totes tenen distribució  . Considerem la mitjana mostral

 
Aleshores:
  1.  
  2. Les variables aleatòries   i   són independents.

A partir d'aquest teorema i del fet que  , tenim que la variable aleatòria (estadístic)

 
té una distribució   de Sudent amb   graus de llibertat:  , on

 
és la variància mostral.

Relació amb altres distribucions modifica

  • Si  , aleshores   té una distribució gamma  .
  • Si   i  , aleshores  . En particular, per a  , tenim que  . Aquesta propietat és deguda a la propietat d'escala de la distribució gamma.
  • Relació amb la distribució de Poisson.[10]. Sigui   amb   parell. Aleshores per a qualsevol  ,

 
on   és una variable aleatòria amb una distribució de Poisson de paràmetre  .

Noteu que aquesta propietat és equivalent a la que es formula a la pàgina de la distribució de Poisson: Si   és una variable amb distribució de Poisson de paràmetre  , aleshores [11] per a  ,

 

on  .

  • Si  , aleshores   té una distribució exponencial de paràmetre 1/2.
  • Si  , aleshores   té una distribució d'Erlang de paràmetres   i 1/2.
  • Si   (distribució d'Erlang) llavors  .
  • Si   (distribució de Rayleigh) llavors  .
  • Si   (distribució de Maxwell) llavors  .
  • Si   i   són independents, llavors   (Distribució beta).
  • Si   (distribució uniforme contínua) llavors  .

Aplicacions modifica

La distribució khi quadrat té moltes aplicacions en inferència estadística, per exemple en el test khi quadrat i en l'estimació de variàncies. També està involucrada en el problema d'estimar la mitjana d'una població normalment distribuïda i en el problema d'estimar el pendent d'una recta de regressió lineal, a través del seu paper en la distribució t de Student, i participa en tots els problemes d'anàlisi de variància, pel seu paper en la distribució F de Snedecor, que és la distribució del quocient de dues variables aleatòries de distribució khi-quadrat i independents. També té ús al contrast de   poblacions amb els contrasts d'homogeneïtat i al d'independència.

Referències modifica

  1. Johnson, Kotz i Balakrishnan, 1994, Chapter 18.
  2. 2,0 2,1 David, H. A. «Moments of Negative Order and Ratio-Statistics». Journal of the Royal Statistical Society. Series B (Methodological), 17, 1, 1955, pàg. 122–123. ISSN: 0035-9246.
  3. Seber, G. A. F.. Linear regression analysis. 2a edició. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13. ISBN 0-471-41540-5. 
  4. Fisher, Ronald A. Stastistical Methods for Social Workers. Edimburg: Oliver & Boyd, 1925, p. 63. 
  5. Johnson, Kotz i Balakrishnan, 1994, p. 426.
  6. Wilson, Edwin B.; Hilferty, Margaret M. «The Distribution of Chi-Square» (en anglès). Proceedings of the National Academy of Sciences, 17, 12, 1931-12, pàg. 684–688. DOI: 10.1073/pnas.17.12.684. ISSN: 0027-8424. PMC: PMC1076144. PMID: 16577411.
  7. Williams, D. Weighing the odds : a course in probability and statistics. Cambridge: Cambridge University Press, 2001, p. 164. ISBN 0-521-80356-X. 
  8. DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374. ISBN 0-201-64405-3. 
  9. Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0. 
  10. Johnson, Kotz i Balakrishnan, 1994, p. 450.
  11. Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9. 

Bibliografia modifica

Vegeu també modifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució khi quadrat