Distribució conjugada

distribució de probabilitat

En la teoria de la probabilitat bayesiana, si la distribució posterior es troba a la mateixa família de distribució de probabilitat que la distribució de probabilitat anterior , l'anterior i el posterior s'anomenen distribucions conjugades, i l'anterior s'anomena a priori conjugat per a la funció de versemblança .[1]

Infotaula distribució de probabilitatDistribució conjugada

Un a priori conjugat és una conveniència algebraica, que dóna una expressió de forma tancada per a la posterior; en cas contrari, pot ser necessària la integració numèrica. A més, els priors conjugats poden donar intuïció mostrant de manera més transparent com una funció de probabilitat actualitza una distribució prèvia.[2]

El concepte, així com el terme "conjugat anterior", van ser introduïts per Howard Raiffa i Robert Schlaifer en el seu treball sobre la teoria de la decisió bayesiana.[3] Un concepte similar havia estat descobert independentment per George Alfred Barnard.

Exemple modifica

La forma del prior conjugat es pot determinar generalment mitjançant la inspecció de la densitat de probabilitat o la funció de massa de probabilitat d'una distribució. Per exemple, considerem una variable aleatòria que consisteix en el nombre d'èxits   en   Assajos de Bernoulli amb probabilitat d'èxit desconeguda   en [0,1]. Aquesta variable aleatòria seguirà la distribució binomial, amb una funció de massa de probabilitat de la forma

 

L'a priori conjugat habitual és la distribució beta amb paràmetres ( ,  ):

 

on   i   es trien per reflectir qualsevol creença o informació existent (  i   donaria una distribució uniforme) i   és la funció Beta que actua com a constant normalitzadora.

En aquest context,   i   s'anomenen hiperparàmetres (paràmetres de l'anterior), per distingir-los dels paràmetres del model subjacent (aquí  ). Una característica típica dels priors conjugats és que la dimensionalitat dels hiperparàmetres és un més gran que la dels paràmetres de la distribució original. Si tots els paràmetres són valors escalars, hi haurà un hiperparàmetre més que un paràmetre; però això també s'aplica als paràmetres de valors vectorials i matricials. (Vegeu l'article general sobre la família exponencial, i també considereu la distribució de Wishart, anterior conjugada de la matriu de covariància d'una distribució normal multivariada, per exemple on hi ha una gran dimensionalitat).

Taula de distribucions conjugades modifica

Sigui n el nombre d'observacions. En tots els casos següents, se suposa que les dades consten de n punts   (que seran vectors aleatoris en els casos multivariants).

Si la funció de versemblança pertany a la família exponencial, llavors existeix un a priori conjugat, sovint també a la família exponencial; vegeu Família exponencial: distribucions conjugues.

Quan la funció de versemblança és una distribució discreta modifica

Confiança Paràmetres Distribució conjugada Hiperparàmetres anteriors Hiperparàmetres posteriors
Bernoulli p (probabilitat) Beta    
Binomial amb nombre conegut d'intents, m p (probabilitat) Beta    
Negative binomial amb nombre conegut de fallides, r p (probabilitat) Beta    
Poisson λ (ràtio) Gamma    
   
Categorical p (vector probabilitat), k (nombre de categories) Dirichlet     on   és el nombre d'obserbacions en categoria i
Multinomial p (vector probabilitat), k (nombre de categories) Dirichlet    
Hypergeometric amb mostres totals conegudes, N M (nombre de blancs) Beta-binomial    
Geometric p0 (probabilitat) Beta    

Referències modifica

  1. «Conjugate Prior Explained» (en anglès). https://towardsdatascience.com.+[Consulta: 9 juliol 2023].
  2. «Conjugate prior | Definition, explanation and examples» (en anglès). https://www.statlect.com.+[Consulta: 9 juliol 2023].
  3. Howard Raiffa and Robert Schlaifer. Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration, Harvard University, 1961.