Distribució gamma.

En la teoria de la probabilitat i l'estadística, la distribució gamma és una família de distribucions contínues amb dos paràmetres. Té un paràmetre d'escala θ i un paràmetre de forma k. Si k és un nombre sencer aleshores la distribució representa la suma de k variables aleatòries exponencials, cadascuna de les quals té mitjana θ.

CaracteritzacióModifica

Una variable aleatòria gamma X amb escala θ i forma k es denota

 

Funció de densitat de probabilitatModifica

La funció de probabilitat de densitat de la distribució gamma pot expressar-se en termes de la funció gamma:

 

En aquesta parametrització l'esperança és   Alternativament, la distribució gamma pot parameteritzar-se en termes d'un paràmetre de forma   i un paràmetre d'escala inversa  , anomenat un paràmetre de tasa:

 

En la segona parametrització l'esperança és  . Ambdues parametritzacions són comunes perquè qualsevol de les dues pot ésser més convenient depenent de la tasca a la que un s'enfronta. És possible una tercera parametrització, on es manté el paràmetre de forma   i s'introdueix l'esperança  . L'avantatge d'aquesta darrera parametrització és que és més fàcilment interpretable.

Funció de distribucióModifica

La funció de distribució pot expressar-se en termes de la funció gamma incomplerta,

 

PropietatsModifica

MomentsModifica

  • Mitjana =  
  • Mediana = no hi ha una expressió simple
  • Moda =   per  , 0 altrament
  • Variància =  
  • Asimetria =  
  • Curtosis =  
  • Entropia =  
  • Funció generadora de moments =   for  
  • Funció característica =  

SumaModifica

Si Xi segueix una distribució Γ(αi, β) per a i = 1, 2, ..., N, aleshores

 

assumint que totes les Xi són independents.

La distribució gamma és infinitament divisible.

Transformació d'escalaModifica

Per a qualssevol t > 0 es compleix que tX segueix una distribució Γ(ktθ), demonstrant que θ és un paràmetre d'escala.

Família exponencialModifica

La distribució gamma pertany a la família exponencial de dos paràmetres i té paràmetres naturals   i  , i estadístics naturals   i  .

EntropíaModifica

L'entropia ve donada per

 
 
 

on ψ(k) és la funció digamma.

Divergència Kullback-LeiblerModifica

La divergència Kullback-Leibler entre una Γ(α0, β0) (la distribució veritable) i una Γ(α, β) (la distribució que l'aproxima) ve donada per

 

Transformada de LaplaceModifica

La transformada de Laplace de la distribució gamma és:

 

Estimació dels paràmetresModifica

Màxima versemblançaModifica

La funció de versemblança per a N observacions iid   és

 

de la qual podem calcular la log-versemblança

 

L'estimador màxim-versemblant s'obté maximitzant la log-versemblança, és a dir, calculant-ne la derivada i igualant a zero (es pot demostrar que la funció és convexa i que per tant té un sol extrem). Procedint d'aquesta manera trobem que:

 

Substituint aquest resultat a l'expressió de la log-versemblança dóna

 

Per trobar el màxim respecte de k cal calcular la derivada i igualar-la a zero, amb què s'obté:

 

on

 

és la funció digamma. No existeix cap fórmula tancada per a k, però la funció es comporta bé numèricament (és convex), i per tant és senzill trobar-ne una solució numèrica, per exemple amb el mètode de Newton. És possible trobar un valor inicial per a k emprant el mètode dels moments, o emprant l'aproximació

 

Si definim

 

aleshores k és aproximadament

 

que és dins d'un 1,5% del valor correcte.

Estimador BayesiàModifica

Si considerem que k és conegut i   és desconegut, la funció de densitat a posteriori per a   és (assumint que la distribució a priori és proporcional a  )

 

Definint

 

Per tal de calcular l'esperança cal calcular la integral respecte &theta, el qual pot dur-se a terme emprant un canvi de variables que revela que 1/&theta segueix una distribució gamma amb paràmetres  .

 

Els moments podem calcular-se especificant diferents valors per a m a la següent expressió

 

Per exemple, l'esperança +/- la desviació estàndard de la distribució a posteriori de   és:

  +/-  

També és possible obtenir estimadors Bayesians sense assumir que k és conegut, però en general no és possible obtenir-ne una expressió senzilla.

Generant valors d'una distribució gammaModifica

Tenint en compte la propietat d'escala esmentada anteriorment, és suficient generar una variable gamma amb β = 1 i després transformar-la a qualsevol altre valor de β amb una simple divisió.

Emprant el fet que una distribució Γ(1, 1) és el mateix que una distribució exponencial Exp(1), i tenint en compte el mètode per generar variables aleatòries exponencials, arribem a la conclusió de què si U prové d'una distribució uniforme en (0, 1], aleshores -ln(U) segueix una Γ(1, 1). Emprant la propietat de què la suma de variables aleatòries gamma independents segueix novament una distribució gamma, extenem el resultat:

 

on Uk són uniformement distribuïdesen (0, 1] i independents.

Tanmateix aquesta estratègia només funciona si n és un nombre sencer. Ara veurem com generar observacions d'una Γ(δ, 1) per a 0 < δ < 1, ja que després podem aplicar la propietat de la suma per al cas 1 < &delta.

A continuació presenten un algoritme, sense demostració. Es tracta d'un cas particular del mètode d'acceptació-rebuig:

  1. Sigui m= 1.
  2. Generar   i   — independents i uniformement distribuïdes a (0, 1].
  3. Si  , on  , aleshores anar a 4, altrament anar a 5.
  4. Sigui  . Anar a 6.
  5. Sigui  .
  6. Si  , aleshores incrementar m i tornar a 2.
  7. Assumim que   és l'observació d'una  

Per resumir,

 

on [k] és la part sencera de k, i ξ ha estat generat emprant l'algoritme que hem presentat δ = {k} (la part fraccional de k), Uk i Vl segueixen la distribució explicada anteriorment i són independents.

La Llibreria científica GNU disposa de rutines robustes per a generar observacions de moltes distribucions, incloent la distribució Gamma.

Distribucions relacionadesModifica

Casos particularsModifica

  • Si  , aleshores X segueix una distribució exponencial amb paràmetre λ.
  • Si  , aleshores X és idènticament distribuïda a una χ2(ν), la distribució khi-quadrat amb ν graus de llibertat.
  • Si   és un nombre sencer, la distribució gamma es denomina

distribució d'Erlang que serveix per a modelar el temps d'arribada fins a la  -ena "arribada" en un procés de Poisson d'una dimensió amb intensitat 1/θ.

  • Si  , aleshores X segueix una distribució de Maxwell-Boltzmann amb paràmetre a.
  •  , aleshores  

AltresModifica

  • Si X segueix una Γ(k, θ) aleshores 1/X segueix una distribució gamma inversa amb paràmetres k i θ-1.
  • Si X i Y són Γ(α, θ) i Γ(β, θ) independents, respectivament, aleshores X / (X + Y) segueix una distribució beta amb paràmetres α i β.
  • Si Xi són Γ(αi,θ) independents, aleshores el vector (X1 / S, ..., Xn / S), on S = X1 + ... + Xn, segueix una distribució de Dirichlet amb paràmetres α1, ..., αn.

BibliografiaModifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució gamma