Distribució de Wishart

En estadística, la distribució de Wishart és una generalització de la distribució khi quadrat a múltiples dimensions, o en el cas dels graus de llibertat no sencers de la distribució gamma. S'anomena així en honor de John Wishart, qui va formular per primera vegada la distribució l'any 1928.[1]

Infotaula distribució de probabilitatDistribució de Wishart
Tipusdistribució matriu gamma i distribució Wishart complexa Modifica el valor a Wikidata
EpònimJohn Wishart Modifica el valor a Wikidata
NotacióX ~ Wp(V, n)
Paràmetresn > p − 1 graus de llibertat (real)
V > 0 matriu d'escala (p × p def. positiva)
SuportX(p × p) matriu definida positiva
fdp
Esperança matemàticanV
Moda(np − 1)V per a np + 1
Variància
FC
MathworldWishartDistribution Modifica el valor a Wikidata

És una família de distribucions de probabilitat definides sobre matrius simètriques, definides no negatives amb valors de variables aleatòries ("matrius aleatòries"). Aquestes distribucions són de gran importància en l'estimació de matrius de covariància en estadística multivariant.

Definició modifica

Suposem que X és una matriu n × p, de la que cada fila s'obté de forma independent d'una distribució normal p-variada amb mitjana zero:

 

La distribució de Wishart és la distribució de probabilitat de la matriu p × p aleatòria S = XT X coneguda com la matriu de dispersió. Hom indica que S té aquesta distribució de probabilitat escrivint:

 

El nombre enter positiu n és el nombre de graus de llibertat. En certes ocasions això s'escriu com W(V, p, n). Per n ≥ p la matriu S és invertible amb probabilitat 1 si V és invertible.

Si p = V = 1 llavors aquesta distribució és una distribució khi-quadrat amb n graus de llibertat.

Ocurrència modifica

La distribució de Wishart correspon a la distribució de la matriu de covariància d'una mostra de la distribució normal multivariada. Apareix amb freqüència en les proves de la raó de versemblança en l'anàlisi estadística multivariada. També es dona en la teoria espectral de matrius aleatòries i en l'anàlisi bayesiana multidimensional.[2] També apareix en telecomunicacions en l'anàlisi de les característiques de l'esvaniment de Rayleigh en canals MIMO.[3]

Funció densitat de probabilitat modifica

La distribució de Wishart es pot caracteritzar per la seva funció de densitat de probabilitat de la següent manera:

Sigui X una matriu simètrica p × p de variables aleatòries definida positiva.

Sigui V una matriu (fixada) definida positiva de mida p × p.

Llavors, si np, X segueix una distribució de Wishart amb n graus de llibertat si té una funció de densitat de probabilitat donada per:

 

on   és el determinant i Γp (·) és la funció gamma multivariant definida com:

 

De fet, aquesta definició es pot estendre a qualsevol valor real n > p – 1. Si np – 1 llavors ja no segueix una distribució de Wishart sinó que en lloc seu representa una distribució singular que pren valors en un subespai de dimensió inferior a l'espai de les matrius p × p.[4]

Ús en Estadística Bayesiana modifica

En estadística bayesiana i en el context de la distribució normal multivariable, la distribució de Wishart és el conjugat previ de la matriu de precisió Ω = Σ -1, on Σ és la matriu de covariància.

Selecció dels paràmetres modifica

L'adequada distribució de Wishart prèvia s'obté fixant n = p. La mitjana prèvia de Wp (V, n) és nV, el que suggereix que una opció raonable per a V – 1 seria n Σ0, on Σ0 és una estimació prèvia de la matriu de covariància.

Propietats modifica

Esperança matemàtica del logaritme de X modifica

Considerem la següent expressió:[5]

 

on   és la funció digamma multivariada (la derivada del logaritme de la funció gamma multivariant).

Això té un paper important en les derivacions variacionals bayesianes per a xarxes de Bayes que involucren la distribució de Wishart.

Entropia modifica

L'entropia d'informació de la distribució té la següent expressió:[5]

 

on B(V, n) és la constant de normalització de la distribució:

 

Això es pot expandir com:

 

Entropia creuada modifica

L'entropia creuada de dues distribucions de Wishart amb els paràmetres p0, n0, V0 i p1, n1, V1 és:

 

Que quan p0 = p1 equival a l'entropia.

Divergència K-L modifica

La divergència de Kullback-Leibler de p1 donat p0 és

 

Funció característica modifica

La funció característica de la distribució de Wishart és

 

En altres paraules:

 

on E[⋅] indica l'esperança matemàtica. (Aquí Θ i I són matrius de la mateixa mida que V (I és la matriu identitat), i i és l'arrel quadrada de -1).[6]

Teorema modifica

Si una matriu p × p aleatòria X té una distribució Wishart amb m graus de llibertat i la matriu de variància V – escrita com   - i C és una matriu q × p de rang q, llavors,[7]

 

Corol·lari 1 modifica

Si z és un vector constant diferent de zero p × 1, llavors:[7]

 

En aquest cas,   és la distribució de khi-quadrat i   (  és una constant, és positiu perquè V és definida positiva).

Corol·lari 2 modifica

Considerem el cas en zT = (0, ..., 0, 1, 0, ..., 0) (és a dir, l'element j-èsim és 1 i tots els altres zero). Llavors el corol·lari 1 mostra que:

 

dona la distribució marginal de cada un dels elements de la matriu diagonal.

L' estadístic George Seber assenyala que la distribució de Wishart no es diu la "distribució chi quadrat multivariant" perquè la distribució marginal dels elements fora de la diagonal no és de chi-quadrat. Seber prefereix reservar el terme multivariant per al cas en què tots els distribucions marginals univariades pertanyen a la mateixa família.[8]

Estimació de la distribució normal multivariada modifica

La distribució Wishart és la distribució mostral de l'estimador de màxima versemblança (MLE) de la matriu de covariància d'una distribució normal multivariada.[9] Una derivació de la MLE utilitza el teorema espectral.

Descomposició de Barlett modifica

La descomposició de Bartlett d'una matriu X d'una distribució Wishart de p-variables amb matriu d'escala V i n graus de llibertat és la factorització:

 

on L és el factor de Cholesky de V, i:

 

on   i nij ~ N(0, 1) de manera independent.[10] Això proporciona un mètode útil per a l'obtenció de mostres a l'atzar d'una distribució de Wishart.[11]

Distribució marginal dels elements de la matriu modifica

Sigui V una matriu de variància 2 × 2 caracteritzada pel coeficient de correlació -1 < ρ < 1 i L el seu factor de Cholesky més petit:

 

Multiplicant per l'anterior descomposició de Bartlett, trobem que una mostra aleatòria de la distribució de Wishart 2 × 2 és:

 

Els elements de la diagonal, com és evident en el primer element, segueixen, com era d'esperar, la distribució χ2 amb n graus de llibertat (escalada per σ²). L'element de fora de la diagonal és menys familiar però pot ser identificat com una barreja normal de variància-mitja on la densitat de la mescla és una distribució χ2. Per tant, la corresponent densitat de probabilitat marginal per a l'element de fora de la diagonal és la distribució de variància-gamma

 

on Kν(z) és la funció de Bessel modificada de segona classe.[12] Resultats similars es poden trobar per les dimensions superiors, però la interdependència de les correlacions fora de la diagonal es fa cada vegada més complicada. També és possible escriure la funció generadora de moments fins i tot en el cas no central (essencialment l'enèsima potència de Craig[13]) tot i que la densitat de probabilitat es converteix en una suma infinita de funcions de Bessel.

Possible rang del paràmetre de forma modifica

Es pot demostrar[14] que la distribució de Wishart es pot definir si, i només si, el paràmetre de forma n pertany al conjunt

 

Aquest conjunt porta el nom de conjunt de Gindikin, que va ser qui el va introduir en els anys setanta dins el context de les distribucions gamma sobre cons homogenis.[15] No obstant això, per als nous paràmetres en l'espectre discret del conjunt Gindikin, és a dir:

 

la corresponent distribució Wishart no té la densitat de Lebesgue.

Relació amb altres distribucions modifica

  • La distribució de Wishart està relacionada amb la distribució Inversa de Wishart,  , com segueix: Si X ~ Wp(V, n) i si fem el canvi de variables C = X−1, llavors  . Aquesta relació es pot derivar tenint present que el valor absolut del determinant jacobià d'aquest canvi de variable és |C|p+1.[16]
  • En estadística bayesiana, la distribució Wishart és un conjugat previ per al paràmetre de precisió de la distribució normal multivariada quan el paràmetre mitja és conegut.[5]
  • Una generalització és la distribució gamma multivariant.
  • Un tipus diferent de generalització és la distribució normal de Wishart, essencialment el producte d'una distribució normal multivariada i una distribució de Wishart.

Vegeu també modifica

Referències modifica

  1. Wishart, J «The generalised product moment distribution in samples from a normal multivariate population». Biometrika, 20A, (1 - 2), 1928, pàg. 32 - 52. DOI: 10.1093/biomet/20A.1-2.32. JSTOR: 2331939.
  2. Gelman, A. Bayesian Data Analysis. Londres: Chapman & Hall, 2013. ISBN 158488388X. 
  3. Zanella, A.; Chiani, M.; Win, M. Z «On the marginal distribution of the eigenvalues of Wishart matrices». IEEE Transactions on Communications, 57, (4), 2009, pàg. 1050 - 1060. DOI: 10.1109/TCOMM.2009.04.070143.
  4. Uhlig, H «On Singular Wishart and Singular Multivariate Beta Distributions». The Annals of Statistics, 22, 1994, pàg. 395. DOI: 10.1214/aos/1176325375.
  5. 5,0 5,1 5,2 Bishop, C. M. Pattern Recognition and Machine Learning. New York (NY):: Springer-Verlag, 2006. ISBN 9780387310732. 
  6. Anderson, T. W. An Introduction to Multivariate Statistical Analysis. 3ª Ed. Hoboken (NJ): Wiley-Interscience, 2003. ISBN 0-471-36091-0. 
  7. 7,0 7,1 Rao, C. R. Linear Statistical Inference and its Applications. Hoboken (NJ): Wiley, 1965. ISBN 0-471-21875-8. 
  8. Seber, George A. F. Multivariate Observations. Hoboken (NJ): Wiley, 2004. ISBN 978-0471691211. 
  9. Chatfield., C.; Collins, A. J. Introduction to Multivariate Analysis. Londres: Chapman and Hall, 1980. ISBN 0-412-16030-7. 
  10. Anderson, T. W.. An Introduction to Multivariate Statistical Analysis. 3ª Ed. Hoboken (NJ): Wiley-Interscience, 2003. ISBN 0-471-36091-0. 
  11. Smith, W. B.; Hocking, R. R «Algorithm AS 53: Wishart Variate Generator». Journal of the Royal Statistical Society, Series C, 21, (3), 1972, pàg. 341 - 345. JSTOR: 2346290.
  12. Pearson, K.; Jeffery, G. B.; Elderton, E. M «On the Distribution of the First Product Moment-Coefficient, in Samples Drawn from an Indefinitely Large Normal Population». Biometrika, 21, 1929, pàg. 164 - 201. DOI: 10.2307/2332556. JSTOR: 2332556.
  13. Craig, C. C «On the Frequency Function of xy». Ann. Math. Statist., 7, 1936, pàg. 1 - 15. DOI: 10.1214/aoms/1177732541.
  14. Peddada and Richards, S. D; Richards, D «Proof of a Conjecture of M. L. Eaton on the Characteristic Function of the Wishart Distribution». Annals of Probability, 19, (2), 1991, pàg. 868 - 874. DOI: 10.1214/aop/1176990455.
  15. Gindikin, S. G «Invariant generalized functions in homogeneous domains». Funct. Anal. Appl., 9, (1), 1975, pàg. 50 - 52. DOI: 10.1007/BF01078179.
  16. Dwyer, P. S «Some Applications of Matrix Derivatives in Multivariate Analysis». J. Amer. Statist. Assoc, 62, (318), 1967, pàg. 607 - 625. JSTOR: 2283988.

Enllaços externs modifica