Distribució t multivariant

distribució de probabilitat multivariada


En Teoria de la probabilitat i Estadística, la distribució mutivariable o multivariant és una extensió vectorial de la distribució de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori .[1]

Infotaula distribució de probabilitatDistribució t multivariant
Tipusdistribució conjunta, Distribució el·líptica i matrix t-distribution (en) Tradueix Modifica el valor a Wikidata
Notació
Paràmetres
matriu definida positiva
graus de llibertat
Suport
fdp
Esperança matemàtica, si
Mediana
Moda
Variància, si
Coeficient de simetria0

Definició

modifica

Escriurem tots els vectors en columna i per una matriu o vector   , escriurem   per designar la seva transposada.

El cas més senzill

modifica

Siguin   variables aleatòries independents , totes amb distribució normal estàndard  , i sigui   una variable aleatòria amb distribució hki quadrat amb   graus de llibertat,   , independent de  . Definim el vector

 
Es diu que   té té una distribució   multivariable amb   graus de llibertat.[2] Noteu que
 
tenen distribució   de Student amb   graus de llibertat,  , però no són independents ja que totes tenen el factor  .

En notació vectorial, si escrivim  , que és un vector normal multivariable  , on   és la matriu identitat de dimensió  , tenim

 
Notació: S'escriu  . La funció de densitat de   és [2]

 

Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució   de Student, però fent el canvi de variables  i calculant la densitat marginal de  .

Per a  , l'expressió (2) es redueix a la funció de densitat de la distribució   de Student amb   graus de llibertat.
Estudiem el cas   . Tenim
 
Per construcció, les densitats marginals de   i   són
 

Per tant,

 
que és coherent amb el fet que   i   no són independents. Però també implica que si   i   són dues variables aleatòries independents ambdues amb distribució   , llavors el vector   no té una distribució   bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si  , llavors   i   tindran moment de segon ordre i
 
i
 
amb la qual cosa   i   estan incorrelacionades

Cas general

modifica

Sigui  , on   és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) ,   , i   , independent de  . Aleshores el vector aleatori

 
es diu que té una distribució   multivariable amb   graus de llibertat, amb paràmetres   i   (també es diu que   és el vector de posició i   el paràmetre d'escala ), i s'escriu  . La funció de densitat és [2]

 

on   és el determinant de la matriu  . Quan  , llavors s'obté una distribució   amb tres paràmetres.

De les propietats de les distribucions normals multivariables

 
on   és l'arrel quadrada de la matriu  ,[3] tindrem que
 
D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.

Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica [4]

Propietats

modifica

La distribució   multivariable comparteix amb la distribució normal multivariable diverses propietats importants.

Distribucions marginals

modifica

Sigui  . Aleshores qualsevol subvector també té una distribució   multivariable. Més concretament, per   i (per simplificar les notacions) prenem  . Llavors  , on   i   és la submatriu de   obtinguda eliminant les files   i les columnes  . Aquesta propietat es dedueix de la representació (3) del vector  .

Transformacions afins

modifica

Sigui  ,   una matriu   definida positiva (en particular, simètrica) i  . Aleshores

 
Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.

Combinacions lineals de les components

modifica

Sigui  . Considerem una combinació lineal de les seves components

 
on   . Aleshores
 
on aquesta última és una distribució   de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .


Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.

Distribucions condicionades

modifica

Sigui   i separem-lo en dues parts   i   de dimensions   i   respectivament, amb   ,

 
Partim de la mateixa manera   ,

 

i la matriu   de la forma

 
Aleshores la distribució de   condicionada a   és una distribució   multivariable:
 
on
  és el quadrat de la distància de Mahalanobis de   a   amb matriu d'escala

 .

  és el complement de Schur de la matriu   en  .
  és la regressió lineal de   sobre  .
Per a la demostració vegeu.[5]

Convergència a la distribució normal multivariable

modifica

Quan  , la distribució   s'aproxima a una distribució normal multivariable  . Concretament, si   (suposem   un nombre natural), i   llavors

 
Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució   multivariable i la convergència de la distribució   de Student a la distribució normal.

Moments

modifica

Sigui  . Les següents dues propietats es demostren a partir de la representació (3).

Esperança

Si   , llavors el vector   té esperança i  

Matriu de variàncies-covariàncies.

Si  , aleshores la matriu de variàncies-covariàncies del vector   és:

 
Moments d'ordre superior. [4]

Ens restringirem al cas que   i  . Sigui   i   nombres naturals tals que   . Aleshores

 
i si   són parells, aleshores
 
Si algun dels   és senar, aleshores l'esperança anterior és 0.

Aquesta propietat es demostra a partir de la representació (1), de la independència de   i  , i les fórmules per als moments d'una distribució   i dels d'una distribució khi quadrat.

Funció característica

modifica

La funció característica no té una expressió senzilla. Vegeu [1] o.[6][7]

Simulació

modifica

La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:

  1. Generar   i  , independentment.
  2. Calcular   .

Mixtura

modifica

Aquesta formulació dóna lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: Si  on   indica una distribució gamma amb densitat proporcional a  , i   condicionalment segueix   .


Referències

modifica
  1. 1,0 1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9. 
  2. 2,0 2,1 2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9. 
  3. Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2. 
  4. 4,0 4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3. 
  5. Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.
  6. Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.
  7. «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.