Figura 1. Densitat d'una mixtura de tres distribucions normals (μ=5, 10, 15, σ=2) amb iguals pesos (1/3). Cada component es representa com una funció de densitat ponderada amb àrea igual a 1/3.

En Probabilitat i Estadística, una mixtura de distribucions de probabilitat o distribució de probabilitat composta és una distribució de probabilitat que s'ha obtingut combinant diverses distribucions de probabilitat. Exemples importants són les mixtures de distribucions normals que permeten obtenir distribucions multimodals (Figura 1), o la distribució de Poisson composta que permet modelar el total de reclamacions en un període de temps d'una companyia d'assegurances o, des del punt de vista teòric, és una peça clau en l'estudi de les distribucions infinitament divisibles i els processos de Lévy. Les notacions i nomenclatures varien entre els autors.


L'expressió distribució de probabilitat composta té principalment dues accepcions: la primera la considera equivalent a mixtura de probabilitats [1], és a dir, informalment, una distribució de probabilitat que depèn d'un paràmetre, el qual també és una variable aleatòria; mentre que la segona es refereix a la distribució d'una suma d'un nombre aleatori de variables aleatòries independents, totes amb la mateixa distribució [2]; Johnson et al. [3] les anomenen distribucions de suma aturada (stopped sum distribution) i dediquen tot un capítol al cas que les variables siguin discretes. Atès que hi ha un article dedicat a les mixtures de distribucions de probabilitat, en el present article tractarem breument de la segona accepció. Un exemple especialment important és la distribució de Poisson composta que, des del punt de vista aplicat, s'utilitza com a model del total de reclamacions en un període de temps d'una companyia d'assegurances [4] o, des del punt de vista teòric, és una peça clau en l'estudi de les distribucions infinitament divisibles i els processos de Lévy [5].

Definició i primeres propietats

modifica

Considerem una successió   de variables aleatòries independents, totes amb la mateixa distribució. Definim

 
La successió   s'anomena una passejada aleatòria.

Sigui   una variable aleatòria que pren valors 0, 1, 2,... amb probabilitats

 
independent de   La distribució de la variable aleatòria
 
s'anomena distribució de probabilitat composta (compound probability distribution) [2].


El cas més important és quan   té una distribució de Poisson i aleshores la distribució de   s'anomena distribució de Poisson composta (compound Poisson distribution) [6].

La funció de distribució d'una distribució de probabilitat composta, que designarem per   , es calcula mitjançant el teorema de les probabilitats totals i la independència entre   i  :

 
on   és la funció de distribució de  , que és
 
on   denota l'operació de convolució. Per tant, identifiquem una distribució de Poisson composta com una mixtura amb un nombre infinit numerable de components.

Si designem per   la funció característica comuna de  , i per   la de  , aleshores, pel teorema de les esperances totals i la independència entre   i  ,

 
En el cas de la funció de distribució de Poisson composta, si   té paràmetre  , és a dir,  , aleshores la funció característica és
 

Exemples introductoris

modifica

Mixtura de tres distribucions normals

modifica

Considerem tres distribucions normals, amb mitjanes   i   , totes amb variància  . Siguin   i   les funcions de densitats respectives:

 
Considerem tres nombres   , tals que  . Definim
 
Aleshores   és una funció de densitat que s'anomena mixtura de les distribucions   i   amb pesos respectius   i  . Vegeu la figura 1 per un exemple.

Si designem per   la funció de distribució corresponent a la densitat   , aleshores tenim que la funció de distribució corresponent a la densitat   és

 

Interpretació del paràmetre com una variable aleatòria

modifica

En molts casos, com aquest que estem estudiant, les distribucions que considerem pertanyen a una família paramètrica de distribucions; en aquest exemple, les tres components són distribucions normals parametritzades per la mitjana   . Aquest paràmetre pot ser considerat com una variable discreta   que pren els valors   i   amb probabilitats

 
Aleshores

Interpretació en termes de variables aleatòries. Marginalització

modifica

Per simplificar l'exposició ens limitarem a comentar una mixtura finita. Anem a calcular la mixtura de les funcions de distribució   amb pesos  . Considerem una variable aleatòria   que prengui els valors   amb probabilitat  :

 
D'altra banda, considerem   variables aleatòries,  , tals que   condicionada a   tingui funció de distribució  :
 
Aleshores, pel teorema de les probabilitats totals, la funció de distribució (no condicionada) de   serà.
 
i per tant, coincideix amb la funció de distribució de la mixtura.

Aquest procediment s'anomena marginalització, ja que el que hem fet correspon a calcular la distribució marginal de   a partir de la informació que tenim sobre el vector  .

Considerem un vector aleatori   on   és discret i només pot prendre els valors 1, 2 i 3 amb probabilitats:

 
També coneixem que les distribucions de   condicionada per   són normals  ,  . Aleshores, pel teorema de les probabilitats totals,
 
Per tant, la distribució de   és la mixtura de distribucions normals que hem introduït al paràgraf anterior. Aquest procediment s'anomena marginalització, ja que el que hem fet correspon a calcular la distribució marginal de   a partir de la informació que tenim sobre el vector  .


En el cas general, suposem que tenim una família de funcions de distribució  , i els pesos venen donats per una distribució de probabilitat (discreta o contínua)   sobre   . Així, en el cas discret, si  , llavors  . El el cas continu, la distribució de   vindrà donada per una funció de densitat  . Considerem una variable aleatòria   tal que la distribució condicionada   tingui funció de distribució   Aleshores la mixtura correspondrà a la distribució (no condicionada) de la variable   obtinguda per marginalització del vector   . D'aquesta interpretació es dedueix la següent fórmula que permet calcular els moments o la funció característica de la mixtura. Sigui   una funció tal que   . Aleshores

 
o, escrit d'una altra manera,
 
Vegeu a la pàgina esperança matemàtica l'apartat corresponent a l'esperança condicionada.

Mixtura de distribucions gamma

modifica

En aquest exemple de Dubey[7] es considera una distribució gamma on el seu paràmetre d'escala inversa té també una distribució inversa. Considerem una distribució gamma amb paràmetre d'escala  , amb   (també es diu que   és el paràmetre d'escala inversa), i paràmetre de posició   , amb funció de densitat (condicionada)

 
on   és la funció gamma d'Euler. Suposem que el paràmetre   segueix una distribució gamma amb paràmetre de posició   (amb   ) i paràmetre de posició  , amb funció de densitat

 
Aleshores la funció de densitat de la mixtura és
 
on   és la funció beta. Aquesta distribució és un cas particular d'una distribució beta prima que també s'anomena distribució gamma composta [7].
  1. Moran, Patrick A. P.. An introduction to probability theory. paperback ed. with corr., repr. Oxford: Clarendon Press, 1986, p. 98. ISBN 978-0-19-853242-2. 
  2. 2,0 2,1 Ross, Sheldon M. Introduction to probability models. 10th ed. Amsterdam Heidelberg: Elsevier, 2010, p. 167. ISBN 978-0-12-375686-2. 
  3. Johnson, Norman Lloyd; Kotz, Samuel; Kemp, Adrienne W. «Chap. 9». A: Univariate discrete distributions. 2nd ed. New York: J. Wiley & sons, 1992, p. 305. ISBN 978-0-471-54897-3. 
  4. Encyclopedia of actuarial science. Chichester: Wiley, 2004. ISBN 978-0-470-84676-6. 
  5. Satō, Ken'ichi. Lévy processes and infinitely divisible distributions. Cambridge New York: Cambridge university press, 1999. ISBN 978-0-521-55302-5. 
  6. Satō, Ken'ichi. Lévy processes and infinitely divisible distributions. Cambridge New York: Cambridge university press, 1999, p. 18. ISBN 978-0-521-55302-5. 
  7. 7,0 7,1 Dubey, Satya D. «Compound gamma, beta and F distributions» (en anglès). Metrika, 16, 1, 1970-12, pàg. 27–31. DOI: 10.1007/BF02613934. ISSN: 0026-1335.