Distribució de Poisson

distribució de probabilitat discreta

En teoria de probabilitat i estadística, la distribució de Poisson o llei dels petits nombres o dels fenòmens rars és una distribució de probabilitat discreta que és un bon model per molts fenòmens naturals o socials. Una propietat especialment important és que una distribució binomial de paràmetres i , , amb gran i petitat es pot aproximar (en distribució) per una distribució de Poisson de paràmetre ; moltes de les aplicacions de la distribució de Poisson es justifiquen en base aquesta propietat.

Distribució de Poisson
Plot of the Poisson PMF
L'eix horitzontal és l'índex k . La funció només està definida en valors sencers de k . Les línies que connecten els punts són només guies per a l'ull i no indiquen continuïtat.
Funció de distribució de probabilitat
Plot of the Poisson CDF
L'eix horitzontal és l'índex k .
Paràmetres
Suportk ∈ { 0, 1, 2, 3, ... }
FD (on és la Funció gamma incompleta)
Mitjana
Mediana
Moda
Variància
Coeficient de simetria
Curtosi
Entropia
FGM
FC

Aquesta distribució va ser introduïda per Siméon-Denis Poisson l'any 1837 en el seu treball Recherches sur la probabilité des jugements en matière criminelle et en matière civile[1] ( Investigació sobre la probabilitat dels judicis en matèries criminals i civils ).


Les referències bàsiques d'aquesta pàgina són[2][3]

DefinicióModifica

Una variable aleatòria de Poisson   de paràmetre   és una variable discreta que pot prendre qualsevol valor natural, 0, 1, 2, ... amb probabilitats

 
S'escriu   o   o alguna notació similar.

PropietatsModifica

1. Esperança i variància. L'esperança i la variància d'una variable aleatòria amb distribució de Poisson de paràmetre   són iguals a  :

 

Així, si la distribució de Poisson s'utilitza per modelar el comptatge d'un fenomen, aleshores   es pot interpretar com la freqüència esperada del fenomen.

Prova:

 
on hem utilitzat el desenvolupament es sèrie de la funció exponencial.



Per trobar el moment de segon ordre i la variància calcularem  :


 
D'altra banda,
 
d'on
 
Llavors,
 

2. Moments d'ordre superior. Els moments d'ordre superior són polinomis de Touchard en  , i els coeficients tenen una interpretació combinatòria. De fet, quan el valor esperat de la distribució de Poisson és 1, llavors segons la fórmula de Dobinski, el  -èsim moment iguala el nombre de particions de mida  .

3. Moda. La moda d'una variable aleatòria de distribució de Poisson amb un   no sencer és igual a  , el més gran dels enters menors que   (els símbols   representen la funció part sencera). Quan   és un enter positiu, les modes són   i  .




4. Funció generatriu de moments. La Funció generatriu de la distribució de Poisson de paràmetre   és

 


Anàlogament, la funció característica és

 

5. Les variables aleatòries de Poisson són infinitament divisibles.



6. Divergència de Kullback-Leibler. La divergència Kullback-Leibler d'una variable aleatòria de Poisson de paràmetre   a una altra de paràmetre   és

 

7. Sumes de variables aleatòries de Poisson. La suma de variables aleatòries de Poisson independents és una altra variable aleatòria de Poisson en què el paràmetre és la suma dels paràmetres de les originals. Dit d'una altra manera, si

 

són N variables aleatòries de Poisson independents, llavors

 
.

Relació amb altres distribucionsModifica

Distribució binomialModifica

La distribució de Poisson és un cas límit de la distribució binomial: una distribució binomial   amb   gran,   petita, i   petita respecte a  , es pot aproximar raonablement bé per una distribució de Poisson de paràmetre  . Històricament, Poisson va utilitzar aquest argument per introduir la seva distribució,[4] i és el principal raonament per justificar la utilització d'aquesta distribució, tal com veurem en els exemples més avall.

Formalment, sigui   una successió de nombres   tals que  . Considerem una llei binomial de paràmetres   i  ,  , i sigui   Aleshores

 


En efecte, tenim que

 
Llavors, per a  
 
on hem utilitzat un límit tipus nombre   .

Per a qualsevol natural  , tenim, per a   prou gran,

 
i passant al límit s'obté
 
Noteu que d'aquí es dedueix que la successió   convergeix en distribució a  .


En particular, si partim de   i prenem   aleshores tenim que una distribució binomial   amb   gran,   petita i   relativament petita respecte   , es pot aproximar per una distribució de Poisson   . Aquesta propietat fa que la distribució de Poisson també s'anomeni llei dels petits nombres; [5] o dels fenòmens rars, ja que el fenomen subjacent té probabilitat petita; Johnson and Kotz [3] atribueixen el nom <<llei del petits nombres>> a Bortkiewicz (o Borkiewitsch) (1868-1931) i el seu llibre Das Gesetz der kleinen Zahlen (La llei dels petits nombres) . Un autor de pes, Feller,[6] considera desafortunat aquest nom i dona nombrosos exemples per mostrar-ho. Cal tenir present que si bé la probabilitat   és petita, el producte   pot ser gran, sempre que sigui relativament petit respecte de   .

Aproximació normalModifica

A conseqüència de teorema central del límit, per a valors grans de  , una variable aleatòria de Poisson   es pot aproximar per una variable normal de mitjana i variància   ja que

 
Vegeu .[7][8]

Distribució exponencialModifica

Suposem que per a cada valor  , que representa el temps, el nombre d'aparicions de cert fenomen aleatori segueix una distribució de Poisson de paràmetre  . Llavors, els temps que discorren entre dos aparicions successives segueix la distribució exponencial.

Distribució khi-quadrat  Modifica

Si   és una distribució de Poisson de paràmetre  , aleshores [9] per a  ,

 

on   és una variable aleatòria amb distribució   amb   graus de llibertat.

Aquesta fórmula és útil perquè permet calcular el valor de la funció de distribució d'una variable aleatòria de Poisson de manera ràpida.

Exemples històricsModifica

Soldats de l'exèrcit prussià morts per una guitza del seu cavallModifica

En el llibre que hem citat abans de Bortkiewicz, s'estudia el nombre de soldats de l'exèrcit prussià morts per una guitza del seu cavall. A la taula [10] hi ha el nombre de morts corresponent a 10 cossos de característiques similars [11] durant 20 anys


Taula 1. Nombre de soldats morts per una guitza del seu cavall a l'exercit en 10 cossos de l'exercit prussià durant 1875-1894
Cos de l'exercit
Any II III IV V VII VIII IX X XIV XV Total
1875 1 1 1 3
1876 1 1 1 3
1877 1 1 2 4
1878 2 1 1 1 1 6
1879 1 1 2 1 1 6
1880 2 1 1 1 2 1 3 11
1881 2 1 1 1 5
1882 1 1 2 4 1 9
1883 1 2 1 1 1 6
1884 1 1 2 1 1 6
1885 2 1 3
1886 1 1 1 3 6
1887 2 1 2 1 1 2 9
1888 1 1 1 3
1889 1 1 1 1 2 2 8
1890 2 1 2 2 1 2 2 12
1891 1 1 1 1 1 3 1 9
1892 2 1 1 1 1 1 7
1893 1 2 1 4
1894 1 1 2
Total 12 12 8 11 12 7 13 15 24 8 122

En total es van produir 122 morts. La següent taula és un resum de la Taula 1 en termes de freqüències absolutes i relatives:

Taula 2. Taula de freqüències de les dades de Bortkiewicz
Nombre de soldats morts en un cos i anys 0 1 2 3 4 Total
Freqüència absoluta 109 65 22 3 1 200
Freqüència relativa 0.545 0,325 0,110 0,015 0,005 1

La mitjana de morts per cos i any és

 

Suposem que cos de l'exèrcit tenia 1000 soldats (com veurem, aquest nombre, que desconeixem, no té cap paper, podríem posar  ). Un model raonable per al nombre de soldats morts (per cos i any) és una distribució binomial  , on   és la probabilitat que un soldat resulti mort. Aquesta probabilitat és molt petita i podem estimar-la de la següent manera: Tenim 10 cossos durant 10 anys, que representen   soldats. Aleshores

 
D'acord amb els comentaris anteriors, podem aproximar la distribució binomial per una distribució de Poisson de paràmetre
 
que és la mitjana que hem calculat abans. La Taula 3 dona les probabilitats d'una variable aleatòria de Poisson   de paràmetre  ,  :
Taula 3. Taula de probabilitats d'una distribució de Poisson Poi(0,61)
  0 1 2 3  
Probabilitat 0.543 0,331 0,101 0,020 0,003

En comparar la fila de les freqüències relatives de la Taula 2 i les probabilitats de la Taula 3 veiem que la concordança entre ambdues és realment notable.

Desintegració de partícules radioactivesModifica

Rutherford i Geiger [12] reporten que varen observar el nombre de partícules   emeses per una massa de material radioactiu durant 2.608 intervals de 7,5 segons cadascun. A la Taula 4 la   denota el nombre de partícules emeses en un interval de 7,5 segons, la freqüència absoluta és el nombre de vegades que es va observar el corresponent valor  , després hi ha freqüència relativa i finalment la probabilitat que una variable de Poisson de paràmetre   prengui aquell valor:

Taula 4. Experiment de Rutherford et al.
  0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Total
Freq. absoluta 57 203 383 525 532 408 273 139 45 27 10 4 0 1 1 2608
Freq. relativa 0,022 0,078 0,147 0,201 0,204 0,156 0,105 0,053 0,017 0,010 0.004 0.002 0.000 0,000 0,000 1
Probabilitat Poisson 0,021 0,081 0,156 0,201 0,195 0,151 0,097 0,054 0,026 0,011 0.004 0.002 0.000 0,000 0,000 1



El paràmetre   s'ha calculat com la mitjana del nombre de partícules emeses per unitat de temps:

 

Com veiem la concordança entre les dades observades i les probabilitats corresponents a la distribució de Poisson és molt bona. Breiman [13] argumenta perquè la distribució de Poisson apareix en aquesta situació: Suposem que durant un període llarg, la mitjana de partícules emeses per unitat de temps és   (en aquest cas, la unitat de temps seria 7,5 seg). Considerem ara el nombre de partícules emeses durant un interval de temps de longitud   unitats; el resultat pot ser 0, 1, 2, etc. Per trobar una assignació raonable de probabilitats dividim l'interval   en   parts d'amplada  ; prenem   prou gran perquè els subintervals siguin molt petits; en cada subinterval podem observar 0, 1, 2, ... partícules. Suposem:



1. Les probabilitats d'observar 0, 1, ... partícules són les mateixes per a tots els subintervals.

2. La probabilitat d'observar dos o més partícules en un subinterval és menyspreable comparada amb les probabilitats d'observar-ne zero o una partícula.

3. La probabilitat d'observar o no una partícula en un subinterval és independent d'observar o no una partícula en un altre subinterval.

El bombardeig de Londres durant la 2a. Guerra MundialModifica

Durant la Segona Guerra Mundial els alemanys van bombardejar Londres i altres llocs amb bombes volants. Molta gent creia que les bombes tendien a agrupar-se en clústers; amb l'objectiu d'analitzar si aquesta suposició era veritat es va dividir el sud de Londres en 576 quadrats de 0'5 km²; durant el període considerat van caure 537 bombes, vegeu la Figura 1.

 
Figura 1. Part de la quadrícula del mapa de Londres amb els impactes de les bombes volants (punts simulats per ordinador). En total hi havia 576 quadrats, cadascun de 0'5 Km²

La taula 5 [14] mostra el nombre de quadrats on van caure 0 bombes, 1 bomba, etc. (freqüència absoluta), així com la freqüència relativa.



Taula 5. Bombardeig sobre Londres
  0 1 2 3 4   Total
Freq. absoluta 229 211 93 35 7 1 576
Freq. relativa 0,397 0,366 0,161 0,061 0,012 0,002 1
Prob. Poisson 0,394 0,367 0,171 0,053 0,012 0,002 1
Freq. esperada Poisson 226,7 211,4 98,5 36,6 7,1 1,3 575,8

La mitjana de bombes per quadrat és

 
A la taula 5 hi ha una fila amb les probabilitats   d'una variable de Poisson   de paràmetre   per   i el valor  . També hi ha una fila amb els productes
 
els quals són les freqüències absolutes esperades per una variable de Poisson.

L'ajustament de les dades observades amb les donades per la distribució de Poisson és molt bona, la qual cosa suggereix que no va haver-hi clústers i que el lloc de caiguda de les bombes era completament aleatori. Chung [15] argumenta el bon ajust amb la distribució de Poisson dient que, si el fenomen és purament aleatori, es pot estudiar com un problema de col·locació de 537 objectes en 576 caixes; la probabilitat d'observar exactament   bombes (objectes) en un quadrat (una capsa) serà  , on   és una variable binomial de paràmetres   i   :  . Atès que   és gran i   petita, podem aproximar   per una variable de Poisson de paràmetre

 
que és el que hem fet anteriorment.

Feller [16] també analitza aquestes dades i comenta que <<la taula anterior indica que hi ha aleatorietat i homogeneïtat perfectes, [...] però que per a [l'ull] inexpert, l'aleatorietat apareix com regularitat [...]>>. Per profunditzar en aquest comentari de Feller és molt interessant el capítol 2 del llibre de J. A. Paulos [17]

Més exemplesModifica

Si el 2% dels llibres enquadernats en cert taller té enquadernació defectuosa, la probabilitat que 5 de 400 llibres enquadernats en aquest taller tinguin enquadernacions defectuoses es pot calcular usant la distribució de Poisson. En efecte, el nombre de llibres defectuosos es pot modelar per una distribució binomial de paràmetres   i  , la qual el pot aproximar per una distribució de Poisson de paràmetre

 
que, d'altra banda, és la mitjana de llibres defectuosos. Per tant, la probabilitat desitjada és

 

Aquest problema també podria resoldre's recorrent a una distribució binomial de paràmetres  ,   i  .

Processos de PoissonModifica

Article principal: Procés de Poisson

La distribució de Poisson s'aplica a diversos fenòmens discrets de la natura (és a dir, aquells fenòmens que ocorren 0, 1, 2, 3, ... vegades durant un període definit de temps o en una àrea determinada) quan la probabilitat d'ocurrència del fenomen és constant en el temps o l'espai. Exemples d'aquests esdeveniments que poden ser modelats per la distribució de Poisson inclouen:

  • El nombre de cotxes que passen a través d'un cert punt en una ruta (prou distants dels semàfors) durant un període definit de temps.
  • El nombre d'errors d'ortografia que un comet en escriure una única pàgina.
  • El nombre de trucades telefòniques en una central telefònica per minut.
  • El nombre de servidors web accedits per minut.
  • El nombre d'animals morts trobats per unitat de longitud de ruta.
  • El nombre de mutacions de determinada cadena d'ADN després de certa quantitat de radiació.
  • El nombre de nuclis atòmics inestables que van decaure en un determinat període en una porció de substància radioactiva. La radioactivitat de la substància es debilitarà amb el temps, per tant el temps total de l'interval utilitzat en el model ha de ser significativament menor que la vida mitjana de la substància.
  • El nombre d'estels en un determinat volum d'espai.
  • El nombre d'estels fugaços per una unitat de temps.
  • La distribució de receptors visuals a la retina de l'ull humà.
  • La inventiva d'un inventor a través de la seva carrera.

Vegeu tambéModifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució de Poisson

ReferènciesModifica

  1. Poisson, Siméon-Denis (1781-1840) Auteur du texte. Recherches sur la probabilité des jugements en matière criminelle et en matière civile ; précédées des Règles générales du calcul des probabilités / par S.-D. Poisson,... (en fr), 1837. 
  2. Feller, W.. Introducción a la teoría de las probabilidades y sus aplicaciones. México: Limusa-Wiley, S. A.. 
  3. 3,0 3,1 Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992. ISBN 0-471-54897-9. 
  4. Poisson, Siméon-Denis (1781-1840) Auteur du texte. Recherches sur la probabilité des jugements en matière criminelle et en matière civile ; précédées des Règles générales du calcul des probabilités / par S.-D. Poisson,... (en fr), 1837, p. 205. 
  5. L. von Bortkiewicz, <<Das Gesetz der Klenen Zahlen>> (1898), citat per Jonhson, N. L. and Kotz, S. <<Univariate Discrete Distributions>>, 2nd edition, Wiley (1992)
  6. Feller, W.. Introducción a la teoría de las probabilidades y sus aplicaciones. México: Limusa-Wiley, S. A., p. 169. 
  7. Feller, W.. Introducción a la Teoría de las Probabilidades y sus aplicaciones. México: Limusa-Wiley, S. A., 1973, p. 253. 
  8. Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, ©1994-, p. 412. ISBN 0-412-05221-0. 
  9. Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9. 
  10. Andrews, D. F.. Data : a Collection of Problems from Many Fields for the Student and Research Worker. New York, NY: Springer New York, 1985, p. 18. ISBN 978-1-4612-5098-2. 
  11. De la taula original s'han exclòs les columnes corresponents als cossos G, I, VI i XI perquè tenien característiques diferents
  12. F.R.S, Professor E. Rutherford; Ph.D, H. Geiger; Bateman, H. «LXXVI. The probability variations in the distribution of α particles». The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 20, 118, 01-10-1910, pàg. 698–707. DOI: 10.1080/14786441008636955. ISSN: 1941-5982.
  13. Breiman, Leo. Statistics: with a view toward applications.. Boston,: Houghton Mifflin, 1973. ISBN 0-395-04232-1. 
  14. CLARKE, R. D. «AN APPLICATION OF THE POISSON DISTRIBUTION». Journal of the Institute of Actuaries (1886-1994), 72, 3, 1946, pàg. 481–481. ISSN: 0020-2681.
  15. Lai Chung, Kai. Teoría elemental de la probabilidad y de los procesos estocásticos. Barcelona: Reverté, 1983, p. 231-233. ISBN 84-291-5049-8. 
  16. Feller, W.. Introducción a la Teoría de las Probabilidades y sus aplicaciones. México: Limusa- Wiley, S. A., 1973, p. 170-171. 
  17. Paulos, John Allen. El hombre anúmerico : el analfabetismo matemático y sus consecuencias. 4a. ed. Barcelona: Tusquets, 1998. ISBN 84-7223-149-6.