Distribució t de Student

llei de probabilitat

En probabilitat i estadística, la distribució t de Student és una distribució de probabilitat que sorgeix del problema d'estimar la mitjana d'una població normalment distribuïda amb variància desconeguda quan la mida de la mostra és petita. Aquesta és la base de la popular prova t de Student per a la determinació de les diferències entre dues mitjanes mostrals i per a la construcció de l'interval de confiança per a la diferència entre les mitjanes de dues poblacions.

Infotaula distribució de probabilitatDistribució t de Student
Funció de densidad de probabilitat
Funció de distribució de probabilitat
Funció de distribució de probabilitat
TipusDistribució t multivariant, Distribució t no central, família escala de localització, distribució de probabilitat simètrica, distribució univariant i distribució de probabilitat contínua Modifica el valor a Wikidata
EpònimWilliam Gosset Modifica el valor a Wikidata
Paràmetres graus de llibertat
Suport
FD
on ₂F1 és la funció hipergeomètrica
Esperança matemàtica0 per a
Mediana0
Moda0
Variància per a
Coeficient de simetria0 per a
Curtosi per a
Entropia
on ψ és la funció digamma i B és la funció beta
FGMcap valor Modifica el valor a Wikidata
FC on és Funció de Bessel modificada de segon tipus
MathworldStudentst-Distribution Modifica el valor a Wikidata

El seu nom, Student, es deu al pseudònim que utilitzava l'estadístic britànic William Sealey Gosset quan publicava els seus articles científics. Per a la història d'aquesta distribució vegeu la pàgina Prova t de student. La referència bàsica d'aquest article és Johnson et al.[1].

Definició modifica

Sigui   una variable aleatòria normal estàndard i   una variable aleatòria amb distribució   amb   graus de llibertat,   i   independents. La variable

 
es diu que té una distribució   de Student amb   graus de llibertat i s'escriu   o bé  .

Comentari sobre els graus de llibertat. El cas més habitual d'una distribució   és quan el nombre   de graus de llibertat és un nombre natural i llavors es pot interpretar com la suma dels quadrats de   variables aleatòries normals estàndard independents. Però mitjançant la funció de densitat es pot definir una distribució   que tingui com a graus de llibertat qualsevol nombre real estrictament positiu  , nombre que continua anomenat-se els graus de llibertat de la distribució.[2] En conseqüència, pot definir-se la distribució   de Student amb graus de llibertat qualsevol nombre  . Cal dir que el programari estadístic estàndard, per exemple, el llenguatge R, utilitza graus de llibertat fraccionaris en certs tests estadístics.



Funció de densitat modifica

La funció de densitat de la distribució   de Student amb   graus de llibertat és

 

on   és la funció gamma.

Utilitzant la funció Beta   i que   també es pot escriure

 
Funció parella. Cal remarcar que aquesta funció és parella :  ; gràficament, és simètrica respecte l'eix d'ordenades. Aquesta propietat és important en els càlculs de probabilitats.

Quan   és un nombre natural, la funció de densitat és simplifica. Concretament,per a  ,

 
Llavors
 
i per tant es tracta d'una distribució de Cauchy (centrada en l'origen). Per a   senar, la constant de la funció de densitat és
 
on   és el doble factorial del nombre  .

Per a   parell,

 
(Cal recordar que  =1).

Funció de distribució modifica

Quan el nombre de graus de llibertat és un nombre natural, la funció de distribució es pot donar explícitament en termes de funcions elementals, amb una expressió que es complica a l'augmentar els graus de llibertat.

  Funció de densitat Funció de distribució
1    
2    
3    
4    
5    

Expressions alternatives de la funció de distribució modifica

Per al cas general podem escriure la funció de distribució en termes de la funció beta incompleta[4]:

 
on   i   és la funció beta incompleta regularitzada.

Per a  , atès que la funció de densitat és parella, el càlcul de   és fa per arguments de simetria.

També, per a  , es pot escriure la funció de distribució en termes d'una funció hipergeomètrica[5]

 
on   és una funció hipergeomètrica.

Moments modifica

Sigui   un nombre natural. Aleshores

  • Si  , tenim que
     
  • Si  , llavors  , i en conseqüència el moment d'ordre   no existeix.


En el cas   parell,  , també tenim [5]

 


En particular, si  , llavors  . Si  , llavors

 

Aproximació normal modifica

Sigui  , aleshores per a   gran,   és aproximadament normal estàndard  .[6]

Els següents gràfics mostren la densitat de la distribució   per a valors creixents de  . La densitat de la distribució normal estàndard està dibuixada en blau. Noteu que la densitat de la distribució   (en vermell) s'aproxima cada com més a la normal quan   creix.

Densitat de la distribució   (en vermell) per a 1, 2, 3, 5, 10 i 30 graus de llibertat comparats amb la densitat de la distribució normal estàndard (en blau). Els gràfics anteriors surten en verd.
1 grau de llibertat
2 graus de llibertat
3 graus de llibertat
5 graus de llibertat
10 graus de llibertat
30 graus de llibertat

Funció característica modifica

Quan el nombre de graus de llibertat és una nombre natural, hi ha fórmules per la funció característica de la distribució de Student, que depenen de si els graus de llibertat son senars o parells, fórmules que cada cop són més complicades a l'augmentar el nombre de graus de llibertat[7]. Una fórmula general utilitzant funcions especials va ser obtinguda el 1995 independentment per S. Hurst [8] i A. H. Jorder (veieu).[9] Concretament, si  ,

 
on   és la funció de Bessel modificada de segon tipus.

La distribució t de Student amb tres paràmetres modifica

La funció de densitat   d'una distribució   permet construir de la manera habitual una família de posició i escala :[10] sigui   i    ; definim

 
Aquesta distribució s'anomena distribució   de Student amb tres paràmetres, o distribució   de Student amb posició i escala, i es designa per   o   . Alternativament, si   , llavors la variable aleatòria
 

té distribució  .

La distribució t de Student en Estadística modifica

El paper central que té distribució   de Student en la inferència estadística de poblacions normals és degut al següent teorema:[11]

Teorema. Sigui   una mostra d'una població normal  , és a dir, les variables aleatòries   són independents i totes tenen distribució  . Considerem la mitjana mostral

 
Aleshores:
  1.  
  2. Les variables aleatòries   i   són independents.
  3. Sigui
     

on

 
és la variància mostral. Llavors,  .

Vegeu la pàgina de la distribució   per a la demostració dels punts 1 i 2. El punt 3 es dedueix del fet que   i de les parts 1 i 2 i de la definició de la distribució   de Student.

Vegeu la pàgina Interval de confiança per a exemples concrets d'utilització de la distribució de Student.


Relació amb altres distribucions modifica

  • La distribució   coincideix amb la distribució de Cauchy.
  • Si  , aleshores   té una distribució   amb 1 i   graus de llibertat:   .

Vegeu també modifica

Notes modifica

  1. Johnson, Kotz i Balakrisnan, 1995, Chapter 28.
  2. Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 1. 2a edició. Nova York: Wiley, 1994, p. 417. ISBN 0-471-58495-9. 
  3. 3,0 3,1 Gradshteĭn, I. S.. Table of integrals, series and products. 7th ed. Oxford: Academic, 2007, p. 96, fórmula 2.263.3. ISBN 978-0-12-373637-6. 
  4. Johnson, Kotz i Balakrisnan, 1995, p. 364.
  5. 5,0 5,1 Johnson, Kotz i Balakrisnan, 1995, p. 365.
  6. Johnson, Kotz i Balakrisnan, 1995, p. 363.
  7. Johnson, Kotz i Balakrisnan, 1995, p. 367-368.
  8. Hurst, Simon. [url=https://web.archive.org/web/20100218072259/http://wwwmaths.anu.edu.au/research.reports/srr/95/044/ The Characteristic Function of the Student-t Distribution], Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95
  9. Gaunt, Robert E. «A simple proof of the characteristic function of Student’s t -distribution» (en anglès). Communications in Statistics - Theory and Methods, 50, 14, 18-07-2021, pàg. 3380–3383. DOI: 10.1080/03610926.2019.1702695. ISSN: 0361-0926.
  10. Casella, George; Berger, Roger L. Statistical inference. 2. ed. Pacific Grove, Calif: Duxbury, 2002, p. 119. ISBN 978-0-534-24312-8. 
  11. DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374 i 379-380. ISBN 0-201-64405-3. 

Bibliografia modifica

  • Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 2. 2a edició. Nova York: Wiley, 1995. ISBN 0-471-58494-0. 




A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució t de Student