Distribució truncada

distribució condicional

En estadística, una distribució truncada és una distribució condicional que resulta de restringir el domini d'alguna altra distribució de probabilitat. Les distribucions truncades sorgeixen en les estadístiques pràctiques en els casos en què la capacitat de registrar, o fins i tot de conèixer-ne, es limita a valors que es troben per sobre o per sota d'un determinat llindar o dins d'un rang determinat. Per exemple, si s'examinen les dates de naixement dels nens d'una escola, aquestes normalment estarien subjectes a truncament en relació amb les de tots els nens de la zona, ja que l'escola només accepta nens d'una franja d'edat determinada en una data específica. No hi hauria informació sobre quants nens de la localitat tinguessin dates de naixement abans o després de les dates límit de l'escola si només s'utilitzessin una aproximació directa a l'escola per obtenir informació.[1]

Infotaula distribució de probabilitatDistribució truncada

Quan el mostreig és tal que reté el coneixement dels elements que queden fora de l'interval requerit, sense registrar els valors reals, això es coneix com a censura, a diferència del truncament aquí.[2]

Definició modifica

La discussió següent és en termes d'una variable aleatòria que té una distribució contínua encara que les mateixes idees s'apliquen a les distribucions discretes. De la mateixa manera, la discussió assumeix que el truncament és a un interval semiobert y ∈ (a, b] però altres possibilitats es poden manejar directament.[3]

Suposem que tenim una variable aleatòria,   que es distribueix segons alguna funció de densitat de probabilitat,  , amb funció de distribució acumulada   tots dos tenen un suport infinit. Suposem que volem conèixer la densitat de probabilitat de la variable aleatòria després de restringir el suport a estar entre dues constants de manera que el suport,  . És a dir, suposem que volem saber com   es distribueix donat  .[4]

 

on   per a tot   i   a tot arreu. Això és,   on   és la funció indicadora. Tingueu en compte que el denominador de la distribució truncada és constant respecte a  .

Fixeu-vos que de fet   és una densitat:

 

A les distribucions truncades no cal que s'eliminin parts de la part superior i inferior. Una distribució truncada on només s'ha eliminat la part inferior de la distribució és la següent:

 

on   per a tot   i   a tot arreu, i   és la funció de distribució acumulada.

Referències modifica