Independència condicional

En teoria de la probabilitat, dos esdeveniments aleatoris i són condicionalment independents donat un tercer esdeveniment precisament si l'ocurrència d' i l'ocurrència de són esdeveniments independents en la seva distribució de probabilitat condicional donada . En altres paraules, i són independents condicionalment donat si i només si, tenint en compte que es produeix, se sap que si es produeix no proporciona informació sobre la probabilitat que es produeixi , i el coneixement de si es produeix no proporciona informació sobre la probabilitat que es produeixi .

El concepte d'independència condicional es pot estendre des d'esdeveniments aleatoris a variables aleatòries i vectors aleatoris.

Independència condicional dels esdeveniments modifica

Definició modifica

En la notació estàndard de la teoria de la probabilitat,   i   són condicionalment independents   si i només si  . La independència condicional de   i   donat   es denota com  . Formalment:

 

 

 

 

 

(Eq.1)

o de forma equivalent,

 

Exemples modifica

La discussió sobre StackExchange proporciona un parell d'exemples útils (vegeu la referència).[1]

Caselles de colors modifica

Cada casella representa un possible resultat. Els esdeveniments  ,   i   estan representats per les zones pintades de vermell, blau i groc respectivament. La intersecció entre els esdeveniments   i   es pinta de porpra.

Les probabilitats d'aquests esdeveniments són zones ombrejades respecte a l'àrea total. En els dos exemples   i   són condicionalment independents donat   perquè:

 [Nota 1]

però no són condicionalment independents donat   perquè:

 

Clima i retards modifica

Sigui dos esdeveniments que siguin les probabilitats que les persones   i   tornin a casa a temps per sopar i el tercer esdeveniment   és que una tempesta de neu afecti a la ciutat. Si tant   com   tinguessin una menor probabilitat d'arribar a casa a temps per sopar, aquestes probabilitats inferiors encara seran independents les unes de les altres. És a dir, el coneixement que   arriba tard no indica si   arribarà tard (poden viure a diferents barris, recórrer distàncies diferents i utilitzar diferents mitjans de transport). Tanmateix, si es té informació que viuen al mateix barri, utilitzen el mateix transport i treballen al mateix lloc, aleshores els dos esdeveniments NO són condicionalment independents si es veuen afectats per la tempesta de neu.

Suma de daus modifica

La independència condicional depèn de la naturalesa del tercer esdeveniment. Si es llancen dos daus (  i  ), es pot suposar que els dos daus es comporten independentment l'un del altre. Si ens fixem en els resultats d'una matriu, no té relació amb l'altra matriu (és a dir, els dos daus són independents). Però si el primer resultat és 3, i algú us explica un tercer esdeveniment   (per exemple, que la suma dels dos resultats sigui parell), aquesta informació addicional restringeix les opcions del segon resultat per a un nombre senar. És a dir, els dos esdeveniments poden ser independents, però NO condicionalment independents.

Alçada i vocabulari dels nens modifica

L'alçada   i el vocabulari   són independents; però no són condicionalment independents si s'afegeix l'edat  .

Independència condicional de variables aleatòries modifica

Dues variables aleatòries   i   són independents condicionals donada una tercera variable aleatòria   si i només si són independents en la distribució de probabilitats condicionals que dona  . Això és,   i   són condicionalment independents donat   si i només si, donat qualsevol valor de  , la distribució de probabilitats de   és el mateix per a tots els valors de   i la distribució de probabilitats de   és el mateix per a tots els valors de . Formalment:

 

 

 

 

 

(Eq.2)

on   és la funció de distribució acumulada condicional de   i   donat  .

Dos esdeveniments   i   són condicionalment independents donada una σ-àlgebra   si

 

on   denota l'esperança condicional de la funció indicatriu de l'esdeveniment  ,  , donada la σ-àlgebra  . Això és,

 

Dues variables aleatòries   i   són condicionalment independents donada una σ-àlgebra   si l'equació anterior es manté per a tots   en  i   en  .

Dues variables aleatòries   i   són condicionalment independents donada una variable aleatòria   si són independents, donat  : la σ-àlgebra generada per  . Això s'escriu comunament:

  o
 

Això es llegeix «  és independent de  , donat  »; el condicionament s'aplica a tota la declaració: «(  és independent de  ) donat  ».

 

Si   assumeix un conjunt de valors comptable, que equival a la independència condicional de   i   per als esdeveniments de la forma  .

La independència condicional de més de dos esdeveniments, o de més de dues variables aleatòries, es defineix de manera analògica.

Els dos exemples següents mostren que  ni implica ni està implicada per  .

  • Primer, suposem que   amb la probabilitat 0,5 i en cas contrari 1. Quan   agafa   i   per ser independents, cadascun té el valor 0 amb la probabilitat 0,99 i el valor 1 en cas contrari. Quan  ,   i   tornen a ser independents, però aquesta vegada prenen el valor 1 amb la probabilitat 0,99. Aleshores  . Pero   i   són dependents, perquè  . Això és perquè  , però si   llavors és molt probable que això   i així això   és també així  .
  • Per al segon exemple, suposem que  , cadascuna prenent els valors 0 i 1 amb probabilitat 0,5. Fem que   sigui el producte  . Llavors quan  ,  , però  , com   és fals.

Consulteu el tutorial de Kevin Murphy on   i   agafa els valors «mentals» i «esportius».[2]

Independència condicional de vectors aleatoris modifica

Dos vectors aleatoris   i   són condicionalment independents donat un tercer vector aleatori   si i només si són independents en la seva distribució acumulada condicional donada  . Formalment:

 

 

 

 

 

(Eq.3)

on  ,   i   i les distribucions acumulatives condicionals es defineixen de la manera següent.

 

Usos en inferència bayesiana modifica

Sigui p la proporció de votants que votaran «sí» en un proper referèndum. En fer una enquesta d'opinió, es tria n votants a l'atzar entre la població. Per a i = 1, ..., n, fem Xi = 1 o 0 corresponent, respectivament, a si el votant escollit votarà o no votarà «sí».

En un enfocament de freqüència d'inferència estadística, no s'atribuiria cap distribució de probabilitats a p (tret que les probabilitats es poguessin interpretar d'alguna manera com a freqüències relatives d'ocurrència d'algun esdeveniment o com a proporcions d'alguna població) i es diria que X1, ..., Xn són variables aleatòries independents.

Per contra, en un enfocament bayesià d'inferència estadística, es podria assignar una distribució de probabilitats a p independentment de la inexistència d'alguna interpretació d'aquest tipus de «freqüència», i es deuria interpretar les probabilitats com a graus de creença que p es troba en qualsevol interval a que s'assigna una probabilitat. En aquest model, les variables aleatòries X1, ..., Xn no són independents, però són condicionalment independents atès el valor de p. En particular, si s'observa que un gran nombre de X són iguals a 1, això implicaria una alta probabilitat condicional, atès que l'observació, que p és a prop d'1, i per tant una alta probabilitat condicional, donada aquesta observació, que la següent. X a observar serà igual a 1.

Les normes de la independència condicional modifica

De la definició bàsica s'han derivat un conjunt de regles que regulen les declaracions d'independència condicional.[3][4]

  • Nota: ja que aquestes implicacions contenen qualsevol espai de probabilitat, es continuaran mantenint si es considera un subunivers que condiciona tot sobre una altra variable,  . Per exemple,   també voldria dir això  .
  • Nota: a continuació, la coma es pot llegir com una «i».

Simetria modifica

 

Decomposició modifica

 

Prova:

  •   (significat de  )
  •   (ignora la variable   integrant-la)
  •  

Una prova similar mostra la independència de   i  .

Unió feble modifica

 

Prova:

  • Per definició,  .
  • A causa de la propietat de la descomposició  ,  .
  • Combinant les dues igualitats anteriors dona  , que estableix  .

La segona condició es pot demostrar de manera semblant.

Contracció modifica

 

Prova: Aquesta propietat es pot comprovar escrivint  , cada igualtat de les quals són afirmades per   i  , respectivament.

Contracció - unió feble - descomposició modifica

Combinant els tres anteriors, tenim:

 

Intersecció modifica

Per a les distribucions de probabilitats estrictament positives,[4] també es manté el següent:

 

Les cinc regles anteriors es van anomenar «Axiomes dels grafoides» de Pearl i Paz, perquè contenen gràfics,[5] si   s'interpreta com «Tots els camins de   a   són interceptats pel conjunt  ».[6]

Notes modifica

  1. Per veure que és així, cal adonar-se’n que Pr(RB | Y) és la probabilitat que superposa R i B (la zona ombrejada de pòrpora) a l'àrea Y. Ja que, a la imatge de l'esquerra, hi ha dos quadrats on R i B es solapen dins de l'àrea Y, i l'àrea Y té dotze quadrats, Pr(RB | Y) = 2/12 = 1/6. De manera semblant, Pr(R | Y) = 4/12 = 1/3 i Pr(B | Y) = 6/12 = 1/2

Referències modifica

  1. «Could someone explain conditional independence?» (en anglès).
  2. Murphy, Kevin. «A Brief Introduction to Graphical Models and Bayesian Networks» (en anglès), 1998.
  3. Dawid, A. P. «Conditional Independence in Statistical Theory» (en anglès). Journal of the Royal Statistical Society, Series B, 41(1), 1979, pàg. 1–31. JSTOR: 2984718.
  4. 4,0 4,1 Pearl, J. Causality: Models, Reasoning, and Inference (en anglès). Cambridge University Press, 2000. 
  5. Pearl, Judea; Paz, Azaria. Graphoids: A Graph-Based Logic for Reasoning About Relevance Relations (en anglès), 1985. 
  6. Pearl, Judea. Probabilistic reasoning in intelligent systems: networks of plausible inference (en anglès). Morgan Kaufmann, 1988. 

Vegeu també modifica