Usuari:Freutci/vector aleatori

Vector aleatori

En Probabilitat i Estadística, molt sovint al resultat que s'obté en un experiment aleatori o un estudi estadístic se li associem diversos nombres; per exemple, triem una persona a l'atzar i en mesurem el pes i l'alçada: tenim així dues mesures, $X$ i $Y$ , que considerades conjuntament $(X,Y)$ constitueixen un vector aleatori.

Definició

Nota. A la secció Exemples al final de l'article hi ha desenvolupats dos exemples amb vectors aleatoris bidimensionals que poden ser útils a les persones que prefereixin començar analitzant casos concrets.

Considerem un espai de probabilitat $(\Omega ,{\mathcal {A}},P)$ . Un vector aleatori $d$ -dimensional ^[1] és una aplicació ${\boldsymbol {X}}=(X_{1},\dots ,X_{d}):\Omega \to \mathbb {R} ^{d}$ tal que cada component $X_{i},\ i=1,\dots ,d$ és una variable aleatòria. També s'anomena variable aleatòria $d$ -dimensional.

Comentaris sobre les notacions.

Hem escrit el vector en fila ^[1], però en Estadística multivariant és molt freqüent escriure els vectors en columna^[2] , ja que es fan moltes operacions amb matrius i és més convenient seguir les normes estàndard de l'àlgebra lineal. En aquest article escriurem els vectors en fila, excepte a les seccions dedicades a l'esperança d'un vector aleatori i a la matriu de variàncies-covariàncies, i als exemples que tractem de lleis normals multidimensionals.
Per alleugerir les fórmules, s'utilitzen 'comes' com a interseccions; així, donats uns conjunts $A_{1},\dots ,A_{d}$ de $\mathbb {R}$ , $P(X_{1}\in A_{1},\dots ,X_{d}\in A_{d})=P{\big (}\{X_{1}\in A_{1}\}\cap \cdots \cap \{X_{d}\in A_{d}\}{\big )}.$ O bé, en el cas discret que veurem a continuació, per $x_{1},\dots ,x_{d}\in \mathbb {R}$ s'escriu $P{\big (}(X_{1},\dots ,X_{d})=(x_{1},\dots ,x_{d}){\big )}=P{\big (}X_{1}=x_{1},\dots ,X_{d}=x_{d}{\big )}=P{\big (}\{X_{1}=x_{1}\}\cap \cdots \cap \{X_{d}=x_{d}\}{\big )}.$

Vectors aleatoris discrets

Un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ es diu que es discret si només pot prendre un nombre finit o numerable de valors; en altres paraules, si existeix un conjunt finit o infinit numerable $S\subset \mathbb {R} ^{d}$ tal que $P({\boldsymbol {X}}\in S)=1$ .

S'anomena funció de probabilitat (a vegades s'afegeix conjunta) del vector o funció de repartiment de massa a la funció

$p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})=P(X_{1}=x_{1},\dots ,X_{d}=x_{d}),\quad (x_{1},\dots ,,x_{d})\in S.$

Les distribucions de probabilitat de cadascuna de les components dels vector, $X_{1},\dots ,X_{d}$ , o dels vectors $(X_{i_{1}},\dots ,X_{i_{r}})$ , $1\leq i_{1}<\cdots <i_{r}\leq d$ , $1\leq r\leq d-1$ , s'anomenen distribucions marginals.

A partir de la funció de probabilitat del vector podem calcular totes les distribucions marginals sumant respecte les altres components: per exemple, per simplificar la notació, la funció de probabilitat de $(X_{1},\dots ,X_{r})$ , on $r\leq d-1$ , és $p_{(X_{1},\dots ,X_{r})}(x_{1},\dots ,x_{r})=\sum _{x_{r+1},\dots ,x_{d}}p_{\boldsymbol {X}}(x_{1},\dots ,x_{d}).$

Exemple: Distribució multinomial

Considerem un experiment que pot tenir $d$ resultats diferents, que designarem per $R_{1},\dots ,R_{d}$ , amb probabilitats $p_{1},\dots ,p_{d}\in (0,1)$ , $p_{1}+\cdots +p_{d}=1$ . Fem $n$ repeticions independents i denotem per $X_{1}$ el nombre de vegades que obtenim el resultat $R_{1}$ , per $X_{2}$ el nombre de vegades que obtenim el resultat $R_{2}$ , i així successivament. Aleshores la probabilitat d'obtenir $x_{1}$ vegades el resultat $R_{1}$ , $x_{2}$ vegades el resultat $R_{2}$ , etc. amb $x_{1}+\cdots +x_{d}=n$ és $p_{(X_{1},\dots ,X_{d})}(x_{1},\dots ,x_{d})=P(X_{1}=x_{1},\dots ,X_{d}=x_{d})={\frac {n!}{x_{1}!\cdots x_{d}!}}\,p_{1}^{x_{1}}\cdots p_{d}^{x_{d}}.$

Es diu que el vector ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ segueix una distribució multinomial ^[3] de paràmetres $n,p_{1},\dots ,p_{d}$ , i s'escriu ${\boldsymbol {X}}\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . Cal notar que cada component $X_{i}$ té una distribució binomial de paràmetres $n$ i $p_{i}$ , $X_{i}\sim B(n,p_{i})$ . De fet, una distribució multinomial és una extensió de la distribució binomial quan hi ha més de dos resultats possibles.

Per exemple, tenim una urna amb 4 boles blanques, 3 vermelles i 3 grogues. Traiem $n=4$ boles amb reemplaçament, és a dir, traiem una bola, anotem el color, la retornem a l'urna, en traiem una altra, etc. Designem per:

X_{1}

: nombre de boles blanques que traiem.

X_{2}

: nombre de boles vermelles que traiem.

X_{3}

: el nombre de boles grogues que traiem.

Aquí, $p_{1}=0'4$ , $p_{2}=0'3$ i $p_{3}=0'3$ . Llavors, la probabilitat de treure 1 bola blanca, 1 vermella i 2 grogues és $p_{(X_{1},X_{2},X_{3})}(1,1,2)=P(X_{1}=1,X_{2}=1,X_{3}=2)={\frac {4!}{1!\,1!\,2!}}\,0'4^{1}\,0'3^{1}\,0'3^{2}=0'1296.$ A partir d'aquí, podem calcular, per exemple, la distribució marginal del vector aleatori $(X_{1},X_{3})$ o la de la variable aleatòria $X_{3}$

Vectors aleatoris absolutament continus o amb funció de densitat

Es diu que un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ és absolutament continu, o senzillament continu, si existeix una funció $f_{\boldsymbol {X}}:\mathbb {R} ^{d}\to \mathbb {R}$ , anomenada funció de densitat (conjunta), que compleix

1.

f(x_{1},\dots ,x_{d})\geq 0,\ \ \forall (x_{1},\dots ,x_{d})\in \mathbb {R} ^{d}.

2.

\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d}=1.

3. Per a qualsevol

B\subset \mathbb {R} ^{d}

(en rigor

B

ha de ser un conjunt de Borel de

\mathbb {R} ^{d}

), tenim

P{\big (}(X_{1},\dots ,X_{d})\in B{\big )}=\int \cdots \int _{B}f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d}.

En particular, si

-\infty \leq a_{1}<b_{1}\leq \infty ,\dots ,-\infty \leq a_{d}<b_{d}\leq \infty

, tenim

$P{\big (}(X_{1},\dots ,X_{d})\in (a_{1},b_{1})\times \cdots \times (a_{d},b_{d}){\big )}=\int _{a_{1}}^{b_{1}}\cdots \int _{a_{d}}^{b_{d}}f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d}.$ A partir de la funció de densitat conjunta pot calcular-se la funció de densitat de qualsevol vector $(X_{i_{1}},\dots ,X_{i_{r}})$ , $1\leq i_{1}<\cdots <i_{r}\leq d$ , $1\leq r\leq d-1$ , que s'anomena la densitat marginal; per exemple, la densitat marginal de $(X_{1},\dots ,X_{r})$ , amb $1\leq r\leq d-1$ és

$f_{(X_{1},\dots ,X_{r})}(x_{1},\dots ,x_{r})=\underbrace {\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }} _{d-r\ {\text{integrals}}}f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{r+1}\cdots dx_{d}.$

Exemple: distribució normal multidimensional

Un vector aleatori $d$ -dimensional amb funció de densitat $f(x_{1},\dots ,x_{d})={\frac {1}{(2\pi )^{d/2}}}\,e^{-(x_{1}^{2}+\cdots +x_{d}^{2})/2},\quad x_{1},\dots ,x_{d}\in \mathbb {R} ,$ es diu que té una llei normal multidimensional o multivariada, ${\mathcal {N}}_{d}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ on ${\boldsymbol {I}}_{d}$ és la matriu identitat. Cada component del vector té una distribució normal estàndard ${\mathcal {N}}(0,1)$ .

Vegeu els vectors aleatoris normals multidimensionals generals ${\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ als exemples de la secció Funcions d'un vector aleatori amb densitat.

Funcions de distribució multidimensional

La funció de distribució d'un vector aleatori ^[1] ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ és la funció $F:\mathbb {R} ^{d}\to [0,1]$ definida per $F(x_{1},\dots ,x_{d})=P(X_{1}\leq x_{1},\dots ,\leq X_{d}\leq x_{d}).$

Si el vector aleatori ${\boldsymbol {X}}$ té funció de densitat $f$ , aleshores la funció de distribució del vector és $F(x_{1},\dots ,x_{d})=\int _{-\infty }^{x_{1}}\cdots \int _{-\infty }^{x_{d}}f(t_{1},\dots ,t_{d})\,dt_{1}\cdots dt_{d}.$

Si la funció de densitat $f$ és contínua en el punt $(x_{1},\dots ,x_{d})$ , aleshores ^[4] $f(x_{1},\dots ,x_{d})={\frac {\partial ^{d}F(x_{1},\dots ,x_{d})}{\partial x_{1}\cdots \partial x_{d}}}.$

Variables aleatòries independents

Recordem que es diu que les variables aleatòries $X_{1},\dots ,X_{k}$ són independents si per a qualsevol conjunts $B_{1},\dots ,B_{k}\subset \mathbb {R}$ (en rigor, conjunts de Borel de $\mathbb {R}$ ), $P(X_{1}\in B_{1},\dots ,X_{k}\in B_{k})=P(X_{1}\in B_{1})\cdots P(X_{k}\in B_{k}).$

Designem per $F_{(X_{1},\dots ,X_{k})}$ la funció de distribució del vector $(X_{1},\dots ,X_{k})$ , i per $F_{X_{1}},\dots ,F_{X_{k}}$ les funcions de distribució de les variables aleatòries $X_{1},\dots ,X_{k}$ (marginals). Aleshores $X_{1},\dots ,X_{k}$ són independents si i només si $F_{(X_{1},\dots ,X_{k})}(x_{1},\dots ,x_{k})=F_{X_{1}}(x_{1})\cdots F_{X_{k}}(x_{k}),\ \forall (x_{1},\dots ,x_{k})\in \mathbb {R} ^{k}.$

En el cas discret la independència equival a que la funció de probabilitat conjunta sigui igual al producte de marginals: $X_{1},\dots ,X_{k}$ són independents si i només si $p_{(X_{1},\dots ,X_{k})}(x_{1},\dots ,x_{k})=p_{X_{1}}(x_{1})\cdots p_{X_{k}}(x_{k}),\ \forall (x_{1},\dots ,x_{k})\in S.$

En el cas absolutament continu, la propietat d'independència equival a que la densitat conjunta sigui igual al producte de marginals: $X_{1},\dots ,X_{k}$ són independents si i només si $f_{(X_{1},\dots ,X_{k})}(x_{1},\dots ,x_{k})=f_{X_{1}}(x_{1})\cdots f_{X_{k}}(x_{k}),\ \forall (x_{1},\dots ,x_{k})\in \mathbb {R} ^{k}.$

Per exemple, en el cas de la distribució normal multidimensional que hem comentat, les distribucions marginals de les diferents components són lleis normals estàndard: tenim que per a $j=1,\dots ,d$ , $f_{X_{j}}(x)={\frac {1}{\sqrt {2\pi }}}\,e^{-x^{2}/2},\ x\in \mathbb {R} .$ Llavors és clar que es compleix la condició anterior i, per tant, les variables $X_{1},\dots ,X_{d}$ són independents.

Vectors aleatoris independents

Considerem $k$ vectors aleatoris, que poden ser de dimensions diferents: ${\boldsymbol {X}}_{1}=(X_{11},\dots ,X_{1j_{1}}),\dots ,{\boldsymbol {X}}_{k}=(X_{k1},\dots ,X_{kj_{k}})$ . Es diu que són independents si per qualsevol $B_{1}\in {\mathcal {B}}(\mathbb {R} ^{j_{1}}),\dots ,B_{k}\subset {\mathcal {B}}(\mathbb {R} ^{j_{k}})$ , on ${\mathcal {B}}(\mathbb {R} ^{r})$ és la $\sigma$ -àlgebra de Borel sobre $\mathbb {R} ^{r}$ , $P({\boldsymbol {X}}_{1}\in B_{1},\dots ,{\boldsymbol {X}}_{k}\in B_{k})=P({\boldsymbol {X}}_{1}\in B_{1})\cdots P({\boldsymbol {X}}_{k}\in B_{k}).$ Les caracteritzacions de la independència de variables aleatòries en els casos discret i continus es trasllada al cas de vectors aleatoris.

Esperança d'una funció d'un vector aleatori

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ un vector aleatori i $h:\mathbb {R} ^{d}\to \mathbb {R}$ una funció (mesurable), tenim que $h({\boldsymbol {X}})$ és una variable aleatòria de la qual podrem calcular l'esperança quan $E[\vert h({\boldsymbol {X}})]<\infty$ . Si ${\boldsymbol {X}}$ és discret, aleshores $E{\big [}h({\boldsymbol {X}}){\big ]}=\sum _{x_{1},\dots ,x_{d}}h(x_{1},\dots ,x_{d})\,p_{\boldsymbol {X}}(x_{1},\dots ,x_{d}),$ sempre que $\sum _{x_{1},\dots ,x_{d}}\vert h(x_{1},\dots ,x_{d})\vert \,p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})<\infty .$ Si ${\boldsymbol {X}}$ és absolutament continu, aleshores $E{\big [}h({\boldsymbol {X}})]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }h(x_{1},\dots ,x_{d})\,f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d},$ sempre que $\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }\vert h(x_{1},\dots ,x_{d})\vert \,f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{p}<\infty .$ Naturalment, si tenim una funció $h:\mathbb {R} ^{r}\to \mathbb {R}$ que només fa intervenir una part de ${\boldsymbol {X}}$ , posem $(X_{i_{1}},\dots ,X_{i_{r}})$ , amb , $1\leq i_{1}<\cdots <i_{r}\leq r$ , $1\leq r\leq d-1$ , aleshores l'esperança de $h(X_{i_{1}},\dots ,X_{i_{r}})$ es calcula utilitzant la distribució marginal d'aquest vector.

Moments d'un vector aleatori

Considerem un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ i siguin $n_{1}\geq 0,\dots ,n_{d}\geq 0$ . Es diu que ${\boldsymbol {X}}$ té moment d'ordre $(n_{1},\dots ,n_{d})$ si $E{\big [}{\big \vert }X_{1}^{n_{1}}\cdots X_{d}^{n_{d}}{\big \vert }{\big ]}<\infty$ , i, en aquest cas, es defineix el moment d'ordre $(n_{1},\dots ,n_{d})$ (alguns autors diuen moment mixt^[5]) per $m_{n_{1},\dots ,n_{d}}=E{\big [}X_{1}^{n_{1}}\cdots X_{d}^{n_{d}}{\big ]}.$ D'acord amb les fórmules que hem vist abans, si el vector és discret, aleshores $E{\big [}X_{1}^{n_{1}}\cdots X_{d}^{n_{d}}{\big ]}=\sum _{x_{1},\dots ,x_{d}\in S}x_{1}^{n_{1}}\cdots x_{d}^{n_{d}}\,p_{\boldsymbol {X}}(x_{1},\dots ,x_{d}).$ Si el vector aleatori és absolutament continu, $E{\big [}X_{1}^{n_{1}}\cdots X_{d}^{n_{d}}{\big ]}=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }x_{1}^{n_{1}}\cdots x_{d}^{n_{d}}\,f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d}.$ Tenim la següent propietat: Si $E[\vert X_{j}\vert ^{m}]<\infty ,pera\ j=1,\dots ,d$ , aleshores per a $n_{1}\geq 0,\dots ,n_{d}\geq 0,\ n_{1}+\cdots +n_{d}\leq m$ , tenim que ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ té moment d'ordre $(n_{1},\dots ,n_{d})$ ^[6] .

Vegeu els moments factorials en la secció de la funció generatriu de probabilitats.

Esperança d'un vector aleatori

Totes les propietats d'aquesta secció i la següent es troben demostrades a Seber ^[7] . Atès que farem operacions matricials, en aquesta secció i la següent escriurem tots els vectors en columna; en particular, escriurem en columna els elements de $\mathbb {R} ^{d}$ . Donada una matriu (o vector) ${\boldsymbol {U}}$ designarem per ${\boldsymbol {U}}'$ la seva transposada . Considerem un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'$ tal que totes les seves components tinguin esperança. Aleshores es defineix l'esperança de ${\boldsymbol {X}}$ per $E[{\boldsymbol {X}}]={\big (}E[X_{1}],\dots ,E[X_{d}]{\big )}'.$

Propietats

Si ${\boldsymbol {a}}=(a_{1},\dots ,a_{d})'\in \mathbb {R} ^{d}$ , aleshores $E[{\boldsymbol {a}}]={\boldsymbol {a}}.$
Siguin ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ dos vectors aleatoris $d$ -dimensionals amb esperances finites, i ${\boldsymbol {A}}$ i ${\boldsymbol {B}}$ dues matrius d'ordre $k\times d$ . Aleshores $E[{\boldsymbol {AX}}+{\boldsymbol {BY}}]={\boldsymbol {A}}\,E[{\boldsymbol {X}}]+{\boldsymbol {B}}\,E[{\boldsymbol {Y}}].$

Matriu de variàncies-covariàncies

Continuem escrivint tots els vectors en columna. Si totes les components del vector ${\boldsymbol {X}}$ tenen variància, aleshores es defineix la seva matriu de variàncies-covariàncies o matriu de dispersió: ${\boldsymbol {V}}({\boldsymbol {X}})={\begin{pmatrix}{\text{Var}}(X_{1})&{\text{Cov}}(X_{1},X_{2})&\cdots &{\text{Cov}}(X_{1},X_{d})\\{\text{Cov}}(X_{2},X_{1})&{\text{Var}}(X_{2})&\cdots &{\text{Cov}}(X_{2},X_{d})\\\vdots &\vdots &&\vdots \\{\text{Cov}}(X_{d},X_{1})&{\text{Cov}}(X_{d},X_{2})&\cdots &{\text{Var}}(X_{d})\end{pmatrix}}$ Atès que ${\text{Var}}(X_{j})={\text{Cov}}(X_{j},X_{j})$ , aquesta matriu també s'escriu ${\boldsymbol {V}}({\boldsymbol {X}})={\big (}{\text{Cov}}(X_{i},X_{j}){\big )}_{i=1,\dots ,d \atop j=1,\dots ,d}$

Propietats

1. Donat que

{\text{Cov}}(X_{i},X_{j})={\text{Cov}}(X_{j},X_{i})

, la matriu

{\boldsymbol {V}}({\boldsymbol {X}})

es simètrica.

2. La matriu

{\boldsymbol {V}}({\boldsymbol {X}})

és semidefinida positiva, ja que per qualsevol

{\boldsymbol {x}}=(x_{1},\dots ,x_{d})'\in \mathbb {R} ^{d}

,

${\boldsymbol {x}}{\boldsymbol {V}}({\boldsymbol {X}}){\boldsymbol {x}}'=\sum _{i,j=1}^{d}x_{i}x_{j}{\text{Cov}}(X_{i},X_{j})={\text{Var}}(\sum _{i=1}^{d}X_{i})\geq 0.$ A més, el determinant de la matriu ${\boldsymbol {V}}({\boldsymbol {X}})$ és 0 si i només si hi ha una relació lineal entre les variables $X_{1},\dots ,X_{d}$ , això és, existeixen escalars $\lambda _{1},\dots ,\lambda _{d+1}\in \mathbb {R}$ , no tots nuls, tals que $\lambda _{1}X_{1}+\cdots +\lambda _{d}X_{d}=\lambda _{d+1},\quad {\text{q.s.}}$

3. Si

{\boldsymbol {X}}

és un vector

d

-dimensional,

{\boldsymbol {A}}

una matriu

k\times d

i

{\boldsymbol {b}}\in \mathbb {R} ^{k}

, aleshores

{\boldsymbol {V}}({\boldsymbol {AX}}+{\boldsymbol {b}})={\boldsymbol {A}}\,{\boldsymbol {V}}({\boldsymbol {X}}){\boldsymbol {A}}'.

Exemples

1. Sigui

{\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})

. Aleshores, donat que cada component

X_{j}

té una distribució binomial

B(n,p_{j})

,

$E[{\boldsymbol {X}}]=(np_{1},\dots ,np_{d})'.$ També tenim que ${\text{Var}}(X_{j})=np_{j}(1-p_{j}).$ Per calcular les covariàncies cal utilitzar la marginal de $(X_{i},X_{j})$ i s'obté que ${\text{Cov}}(X_{i},X_{j})=-np_{i}p_{j},\quad i\neq j.$ (vegeu els exemples de la secció Funció característica). Així, ${\boldsymbol {V}}({\boldsymbol {X}})={\begin{pmatrix}np_{1}(1-p_{1})&-np_{1}p_{2}&\cdots &-np_{1}p_{d}\\-np_{1}p_{2}&np_{2}(1-p_{2})&\cdots &-np_{2}p_{d}\\\vdots &\vdots &\ddots &\vdots \\-np_{1}p_{d}&-np_{2}p_{d}&\cdots &np_{d}(1-p_{d})\end{pmatrix}}$

2. En el cas del vector normal multidimensional

E[{\boldsymbol {X}}]={\boldsymbol {0}}

. D'altra banda,

{\text{Var}}(X_{j})=1

i, atès que les variables són independents,

{\text{Cov}}(X_{i},X_{j})=0,\quad i\neq j

. Llavors

{\boldsymbol {V}}({\boldsymbol {X}})={\boldsymbol {I}}_{d}.

Ampliació: Matriu de covariàncies entre dos vectors

En el que segueix és convenient introduir les matrius aleatòries que són matrius tals que les seves components són variables aleatòries. Sigui ${\boldsymbol {Z}}$ una d'aquestes matrius, de dimensions $n\times m$ : ${\boldsymbol {Z}}={\big (}Z_{ij}{\big )}_{i=1,\dots ,n \atop j=1,\dots ,m}.$ S'anomena esperança de la matriu aleatòria ${\boldsymbol {Z}}$ a la matriu ${\boldsymbol {E}}[Z]={\big (}E[Z_{ij}]{\big )}_{i=1,\dots ,n \atop j=1,\dots ,m}.$ Sigui ${\boldsymbol {X}}$ un vector aleatori $d$ -dimensional i ${\boldsymbol {Y}}$ un vector aleatori $k$ -dimensional ambdós amb moments de segon ordre. S'anomena matriu de covariàncies de ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ a la matriu de dimensions $d\times k$ ${\boldsymbol {C}}({\boldsymbol {X}},{\boldsymbol {Y}})={\big (}{\text{Cov}}(X_{i},Y_{j}){\big )}_{i=1,\dots ,d \atop j=1,\dots ,k}$ Propietats.

Si ${\boldsymbol {X}}={\boldsymbol {Y}}$ aleshores la matriu de covariàncies coincideix amb la matriu de variàncies-covariàncies: ${\boldsymbol {C}}({\boldsymbol {X}},{\boldsymbol {X}})={\boldsymbol {V}}({\boldsymbol {X}}).$
Si $E[{\boldsymbol {X}}]={\boldsymbol {\alpha }}$ i $E[{\boldsymbol {Y}}]={\boldsymbol {\beta }}$ , aleshores ${\boldsymbol {C}}({\boldsymbol {X}},{\boldsymbol {Y}})=E{\big [}({\boldsymbol {X}}-{\boldsymbol {\alpha }})({\boldsymbol {Y}}-{\boldsymbol {\beta }})'{\big ]}.$
En particular, ${\boldsymbol {V}}({\boldsymbol {X}})=E{\big [}({\boldsymbol {X}}-{\boldsymbol {\alpha }})({\boldsymbol {X}}-{\boldsymbol {\alpha }})'{\big ]}=E{\big [}{\boldsymbol {X}}{\boldsymbol {X}}'{\big ]}-{\boldsymbol {\alpha }}{\boldsymbol {\alpha }}'.$
Siguin ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ dos vectors aleatoris de dimensions $d$ i $k$ respectivament i ${\boldsymbol {A}}$ i ${\boldsymbol {B}}$ matrius de dimensions $n\times d$ i $m\times k$ respectivament, aleshores ${\boldsymbol {C}}({\boldsymbol {A}}X,{\boldsymbol {B}}Y)={\boldsymbol {A}}\,{\boldsymbol {C}}({\boldsymbol {X}},{\boldsymbol {Y}})\,{\boldsymbol {B}}'.$

Funció característica i altres transformades

Funció característica

La funció característica d'un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ és la funció $\varphi :\mathbb {R} ^{d}\to \mathbb {C}$ definida per $\varphi _{\boldsymbol {X}}(t_{1},\dots ,t_{d})=E[e^{i(t_{1}X_{1}+\cdots +t_{d}X_{d})}],\quad (t_{1},\dots ,t_{d})\in \mathbb {R} ^{d}.$ Les funcions característiques de les distribucions marginals es dedueixen fàcilment de la funció característica conjunta; per exemple, per simplificar les notacions, per a $r=1,\dots ,d-1$ , $\varphi _{(X_{1},\dots ,X_{r})}(t_{1},\dots ,t_{r})=\varphi _{(X_{1},\dots ,X_{d})}(t_{1},\dots ,t_{r},0\,\dots ,0),\quad t_{1},\dots ,t_{r}\in \mathbb {R} .$

Propietats ^[8].

Unicitat. La funció característica determina la distribució del vector ${\boldsymbol {X}}$ ; concretament, si ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ són dos vectors aleatoris, amb funcions característiques $\varphi _{\boldsymbol {X}}$ i $\varphi _{\boldsymbol {Y}}$ respectivament, tals que $\varphi _{\boldsymbol {X}}(t_{1},\dots ,t_{d})=\varphi _{\boldsymbol {Y}}(t_{1},\dots ,t_{d}),\quad \forall (t_{1},\dots ,t_{d})\in \mathbb {R} ^{d},$ aleshores ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ tenen la mateixa distribució (tenen la mateixa funció de distribució, o si són discrets tenen la mateixa funció de probabilitat, o si són absolutament continus tenen la mateix funció de densitat). La propietat recíproca evidentment també és certa.

Funció característica i independència. Els vectors aleatoris $d$ -dimensionals ${\boldsymbol {X}}_{1},\dots ,{\boldsymbol {X}}_{k}$ són independents si i només si $\varphi _{({\boldsymbol {X}}_{1},\dots ,{\boldsymbol {X}}_{k})}({\boldsymbol {t}}_{1},\dots ,{\boldsymbol {t}}_{k})=\varphi _{{\boldsymbol {X}}_{1}}({\boldsymbol {t}}_{1})\cdots \varphi _{{\boldsymbol {X}}_{k}}({\boldsymbol {t}}_{k}),\quad \forall {\boldsymbol {t}}_{1},\dots ,{\boldsymbol {t}}_{k}\in \mathbb {R} ^{d}.$ Funció característica i suma de vectors aleatoris independents. Siguin ${\boldsymbol {X}}_{1},\dots ,{\boldsymbol {X}}_{k}$ vectors aleatoris $d$ -dimensionals independents i posem ${\boldsymbol {Y}}={\boldsymbol {X}}_{1}+\cdots +{\boldsymbol {X}}_{k}.$ Aleshores $\varphi _{\boldsymbol {Y}}({\boldsymbol {t}})=\varphi _{{\boldsymbol {X}}_{1}}({\boldsymbol {t}})\cdots \varphi _{{\boldsymbol {X}}_{k}}({\boldsymbol {t}}),\quad \forall {\boldsymbol {t}}\in \mathbb {R} ^{d}.$

Funció característica i moments. La següent propietat és especialment útil per a calcular els moments d'un vector aleatori: Si el vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ compleix $E{\big [}\Vert {\boldsymbol {X}}\Vert ^{m}{\big ]}<\infty$ , on $\Vert X\Vert ={\sqrt {X_{1}^{2}+\cdots +X_{d}^{2}}}$ , aleshores la funció característica $\varphi _{\boldsymbol {X}}$ és de classe ${\mathcal {C}}^{m}$ i per a $n_{1},\dots ,n_{d}\geq 0$ , $\sum _{j=1}^{d}n_{j}\leq m$ , $E(X_{1}^{n_{1}}\cdots X_{d}^{n_{d}})={\frac {1}{i^{n_{1}+\cdots +n_{d}}}}\,{\frac {\partial ^{n_{1}+\cdots +n_{d}}}{\partial t_{1}^{n_{1}}\cdots \partial t_{d}^{n_{d}}}}\,\varphi _{\boldsymbol {X}}(t_{1}\dots ,t_{d}){\Big \vert }_{t_{1}=0,\dots ,t_{d}=0}.$ Recíprocament, si la funció característica $\varphi _{\boldsymbol {X}}$ és de classe ${\mathcal {C}}^{m}$ per a $m$ parell , aleshores el vector ${\boldsymbol {X}}$ té moments d'ordre $(n_{1},\dots ,n_{d})$ per qualsevol $n_{1},\dots ,n_{d}\geq 0$ , $\sum _{j=1}^{d}n_{j}\leq m$ Exemple. Vector multinomial. Retornem al vector multinomial ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . La seva funció característica és $\varphi (t_{1},\dots ,t_{d})={\big (}p_{1}e^{it_{1}}+\cdots p_{d}e^{it_{d}}{\big )}^{n},\ t_{1},\dots ,t_{d}\in \mathbb {R} .$ El vector ${\boldsymbol {X}}$ té moments de tots els ordres perquè les seves components són variables aleatòries positives i afitades per $n$ . Podem calcular $E[X_{1}X_{2}]$ de la següent manera: ${\frac {\partial ^{2}}{\partial t_{1}\partial t_{2}}}\varphi (t_{1},\dots ,t_{k})=-n(n-1)(p_{1}e^{it_{1}}+\cdots +p_{k}e^{it_{k}})^{n-2}p_{1}p_{2}e^{it_{1}}e^{it_{2}},$ d'on $E(X_{1}X_{2})=n(n-1)p_{1}p_{2}.$ Exemple: Vector normal multidimensional. El vector ${\boldsymbol {X}}\sim {\mathcal {N}}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ té funció característica $\varphi (t_{1},\dots ,t_{d})=e^{-(t_{1}^{2}+\cdots +t_{d}^{2})/2},\ t_{1},\dots ,t_{d}\in \mathbb {R} .$

Funció generatriu de moments

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ un vector aleatori. La funció $M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})=E{\big [}e^{s_{1}X_{1}+\cdots +s_{d}X_{d}}{\big ]},$ definida en aquells punts $(s_{1},\dots ,s_{d})\in \mathbb {R} ^{d}$ on l'esperança de la dreta és finita, s'anomena funció generatriu de moments ^[9] de ${\boldsymbol {X}}$ . Atès que per qualsevol nombre real $a\in \mathbb {R}$ , $e^{a}>0$ , sempre es pot calcular l'esperança de $\exp\{s_{1}X_{1}+\cdots +s_{d}X_{d}\}$ , però pot donar infinit. Evidentment, sempre està definida en ${\boldsymbol {0}}=(0,\dots ,0)$ i $M_{\bf {X}}({\boldsymbol {0}})=1$ . Quan està definida (o existeix) en un entorn de $(0,\dots ,0)$ , aleshores té molt bones propietats i pot substituir la funció característica, amb l'avantatge que és una funció real i , per tant, més fàcil d'utilitzar; d'altra banda, en aquest cas, es pot estendre el domini de definició a un subconjunt de $\mathbb {C} ^{n}$ ^[10].

Afortunadament, molts vectors aleatoris que apareixen habitualment en l'Anàlisi de la variància i en l'Anàlisi estadística multivariant tenen funció generatriu de moments ^[11], però no tots, tal com després veurem.

Alguns autors ^[10] anomenen transformada de Laplace la funció generatriu de moments; si el vector aleatori ${\boldsymbol {X}}$ només pren valors positius i té funció de densitat $f_{\boldsymbol {X}}$ , aleshores $M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})=\int _{0}^{\infty }\cdots \int _{0}^{\infty }e^{s_{1}x_{1}+\cdots +s_{d}x_{d}}f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})\,dx_{1}\cdots dx_{d},$ que, a part del signe de $s_{1},\dots ,s_{d}$ , és la transformada de Laplace (multidimensional) de la funció $f_{\boldsymbol {X}}$ ^[12].

Les tres propietats següents són especialment útils:

Unicitat ^[11]. Si la funció generatriu de moments d'un vector aleatori està definida en un entorn de $(0,\dots ,0)$ , aleshores determina unívocament la distribució d'aquest vector.

Independència.^[11] Siguin ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ i ${\boldsymbol {Y}}=(Y_{1},\dots ,Y_{r})$ dos vectors aleatoris tal que el vector $({\boldsymbol {X}},{\boldsymbol {Y}})$ té funció generatriu de moments definida en un entorn de zero. Aleshores ${\boldsymbol {X}}\ {\text{i}}\ {\boldsymbol {Y}}$ són independents si i només si

$M_{({\boldsymbol {X,Y}})}(s_{1},\dots ,s_{d},t_{1},\dots ,t_{r})=M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})\,M_{\boldsymbol {Y}}(t_{1},\dots ,t_{r}).$ Moments ^[9]. Si un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ té funció generatriu de moments en un entorn de $(0,\dots ,0)$ , aleshores té moments de tots els ordres i $E(X_{1}^{n_{1}}\cdots X_{d}^{n_{d}})={\frac {\partial ^{n_{1}+\cdots +n_{d}}}{\partial s_{1}^{n_{1}}\cdots \partial s_{d}^{n_{d}}}}\,M_{\boldsymbol {X}}(s_{1}\dots ,s_{d}){\Big \vert }_{s_{1}=0,\dots ,s_{d}=0}.$

Exemples

Vector multinomial ${\boldsymbol {X}}\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . La funció generatriu és $M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})={\big (}p_{1}e^{s_{1}}+\cdots p_{d}e^{s_{d}}{\big )}^{n},\ s_{1},\dots ,s_{d}\in \mathbb {R} .$
Vector normal multidimensional ${\boldsymbol {X}}\sim {\mathcal {N}}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ . $M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})=e^{(s_{1}^{2}+\cdots +s_{d}^{2})/2},\ s_{1},\dots ,s_{d}\in \mathbb {R} .$
Vectors aleatoris sense funció generatriu de moments. Segons hem comentat, un vector aleatori amb funció generatriu de moments en un entorn de $(0,\dots ,0)$ té moments de tots els ordres. Per tant, qualsevol vector que contingui alguna component que no tingui moments de qualsevol ordre no tindrà funció generatriu de moments. Per exemple, una distribució $t$ -multidimensional ^[13].

Funció generatriu de probabilitats

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ un vector aleatori que només prengui valors naturals (zero inclòs), amb funció de probabilitats $p_{\boldsymbol {X}}$ . S'anomena funció generatriu de de probabilitats ^[5] a la funció $G_{\boldsymbol {X}}(s_{1},\dots ,s_{d})=E[s_{1}^{X_{1}}\cdots s_{d}^{X_{d}}]=\sum _{x_{1}\geq 0,\dots ,x_{d}\geq 0}s_{1}^{x_{1}}\cdots s_{d}^{x_{d}}p_{\boldsymbol {X}}(x_{1},\dots ,x_{d}).$ (Amb el conveni $0^{0}=1$ ). La sèrie de la dreta és una sèrie de potències multidimensional, que és absolutament convergent per a $(s_{1},\dots ,s_{d})\in [-1,1]^{d}$ , ja que $0\leq \sum _{x_{1},\dots ,x_{d}}{\big \vert }s_{1}^{x_{1}}\cdots s_{d}^{x_{d}}p_{\boldsymbol {X}}(x_{1},\dots ,x_{d}){\big \vert }\leq \sum _{x_{1},\dots ,x_{d}}p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})=1,$ . A vegades la regió de convergència és més gran que $[-1,1]^{d}$ . Alguns autors defineixen aquesta funció per al camp complex, ja que la sèrie és absolutament convergent per a ${\boldsymbol {z}}=(z_{1},\dots ,z_{d})\in \mathbb {C} ^{d}$ , amb $\vert z_{1}\vert \leq 1,\dots ,\vert z_{d}\vert \leq 1$ i potser en conjunts més grans de $\mathbb {C} ^{d}$ .

La funció generatriu de probabilitats està relacionada amb la funció generatriu de moments per la fórmula: $M_{\boldsymbol {X}}(s_{1},\dots ,s_{d})=G_{\boldsymbol {X}}(e^{s_{1}},\dots ,e^{s_{d}}).$ Aquesta funció s'utilitza molt en situacions on intervenen vectors aleatoris que només prenen valors naturals, com els processos de ramificació ^[14].

Propietats ^[14].

1. La funció

G_{\boldsymbol {X}}

és contínua i infinitament diferenciable en

(-1,1)^{d}

.

2. Fórmula d'inversió i unicitat. La funció de probabilitat del vector

{\boldsymbol {X}}

es pot recuperar a partir de la funció generatriu de probabilitat:

p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})={\frac {1}{x_{1}!\cdots x_{d}!}}\,{\frac {\partial ^{x_{1}+\cdots +x_{d}}G_{\boldsymbol {X}}(s_{1},\dots ,s_{d})}{\partial s_{1}^{x_{1}}\cdots \partial s_{d}^{x_{d}}}}{\big \vert }_{s_{1}=0,\dots ,s_{d}=0},\quad (x_{1},\dots ,x_{d})\in \mathbb {N} ^{d}.

En conseqüència, la funció generatriu de probabilitats determina la distribució del vector ${\boldsymbol {X}}$ .

3. Moments factorials. Per a

x\in \mathbb {R}

i

k\in \mathbb {N}

, designem per

x^{\underline {k}}

el factorial decreixent ^[15] :

x^{\underline {k}}=x(x-1)\cdots (x-k+1).

Noteu que si $x\in \mathbb {N}$ i $k\geq x+1$ , llavors $x^{\underline {k}}=0$ . S'anomena moment factorial ^[16] d'ordre $(n_{1},\dots ,n_{d})$ del vector ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ a $\mu '_{{\boldsymbol {(}}n_{1},\dots ,n_{d})}=E[X_{1}^{{\underline {n}}_{1}}\dots X_{d}^{{\underline {n}}_{d}}].$ Aleshores , aquesta esperança és finita si i només si ^[14] $\lim _{s_{1}\uparrow 1,\dots ,s_{d}\uparrow 1}{\frac {\partial ^{n_{1}+\cdots +n_{d}}G(s_{1},\dots ,s_{d})}{\partial s_{1}^{n_{1}}\cdots \partial s_{1}^{n_{1}}}}<\infty ,$ i en aquest cas, $\mu '_{(n_{1},\dots ,n_{d})}=\lim _{s_{1}\uparrow 1,\dots ,s_{d}\uparrow 1}{\frac {\partial ^{n_{1}+\cdots +n_{d}}G(s_{1},\dots ,s_{d})}{\partial s_{1}^{n_{1}}\cdots \partial s_{1}^{n_{1}}}}.$

4. Suma de vectors aleatoris independents. Siguin

{\boldsymbol {X}}=(X_{1},\dots ,X_{d})

i

{\boldsymbol {Y}}=(Y_{1},\dots ,Y_{d})

dos vectors aleatoris que només prenen valors naturals. Aleshores

G_{{\boldsymbol {X}}+{\boldsymbol {Y}}}({\boldsymbol {s}})=G_{\boldsymbol {X}}({\boldsymbol {s}})\,G_{\boldsymbol {Y}}({\boldsymbol {s}}).

Exemple. Vector multinomial ${\boldsymbol {X}}\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . La funció generatriu de probabilitat és $G_{\boldsymbol {X}}(s_{1},\dots ,s_{d})={\big (}p_{1}{s_{1}}+\cdots p_{d}{s_{d}}{\big )}^{n},\ s_{1},\dots ,s_{d}\in \mathbb {R} .$

Funcions d'un vector aleatori amb densitat

Les transformacions d'un vector aleatori són especialment importants tant en la teoria com en les aplicacions, i és molt convenient disposar d'eines per determinar la distribució del vector transformat a partir de l'inicial . Si ${\boldsymbol {X}}$ és un vector aleatori $d$ -dimensional amb funció de densitat i $h:\mathbb {R} ^{d}\to \mathbb {R} ^{d}$ és una bona funció, aleshores ${\boldsymbol {Y}}=h({\boldsymbol {X}})$ també té funció de densitat i hi ha fórmules per calcular-la. De fet, si el vector ${\boldsymbol {X}}$ està concentrat en un subconjunt $U$ , és a dir, si $P({\boldsymbol {X}}\in U)=1$ , aleshores la funció ${\boldsymbol {h}}$ només ha d'estar definida en aquest conjunt.

Propietat.^[17] Sigui ${\boldsymbol {X}}$ un vector aleatori amb funció de densitat conjunta $f_{\boldsymbol {X}}({\boldsymbol {x}})$ . Suposem que $P({\boldsymbol {X}}\in U)=1$ on $U$ és un conjunt obert de $\mathbb {R} ^{d}$ . Sigui $h=(h^{(1)},\dots ,h^{(d)}):U\to V,$ on $V$ és un obert de $\mathbb {R} ^{d}$ , $h$ bijectiva de classe ${\cal {C}}^{1}$ , amb determinant jacobià no nul sobre $U$ : $J_{\boldsymbol {h}}(x_{1},\dots ,x_{d}):={\text{det}}{\Big (}{\partial h^{(i)} \over \partial x_{j}}{\Big )}_{i,j=1,\dots ,d}\neq 0,\ \forall (x_{1},\dots ,x_{d})\in U.$ Designem la inversa de $h$ per $g=(g^{(1)},\dots ,g^{(d)})$ . Aleshores el vector aleatori ${\boldsymbol {Y}}=h({\boldsymbol {X}})$ és absolutament continu amb densitat $f_{\boldsymbol {Y}}({\boldsymbol {y}})={\begin{cases}f_{X}{\big (}g({\boldsymbol {y}}){\big )}\vert J_{g}({\boldsymbol {y}})\vert ,&{\text{ si }}{\boldsymbol {y}}\in V,\\0,&{\text{en cas contrari.}}\end{cases}}$

Exemple. Vector aleatori normal multidimensional. En aquest exemple escriurem tots els vectors en columna. Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {N}}({\boldsymbol {0}},{\boldsymbol {I}}_{d})$ un vector aleatori normal multidimensional com el que hem introduït anteriorment. Considerem una matriu $d\times d$ definida positiva ${\boldsymbol {\Sigma }}$ i un vector ${\boldsymbol {\mu }}\in \mathbb {R} ^{d}$ . Existeix ^[18] una única matriu definida positiva ^[19] ${\boldsymbol {\Sigma }}^{1/2}$ tal que $({\boldsymbol {\Sigma }}^{1/2})^{2}={\boldsymbol {\Sigma }}$ . Definim el vector ${\boldsymbol {Y}}$ per ${\boldsymbol {Y}}={\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {X}}+{\boldsymbol {\mu }}.$ Així, l'aplicació que estem considerant és $h:\mathbb {R} ^{d}\to \mathbb {R} ^{d}$ donada per $h({\boldsymbol {x}})={\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {x}}+{\boldsymbol {\mu }}.$ Noteu que $U=V=\mathbb {R} ^{d}$ .

L'aplicació inversa és $g({\boldsymbol {y}})=h^{-1}({\boldsymbol {y}})={\boldsymbol {\Sigma }}^{-1/2}({\boldsymbol {y}}-{\boldsymbol {\mu }}),$ on ${\boldsymbol {\Sigma }}^{-1/2}$ és la matriu inversa de ${\boldsymbol {\Sigma }}^{1/2}$ . La matriu jacobiana de $g$ és ${\boldsymbol {\Sigma }}^{-1/2}$ , que té determinant diferent de zero a tot $\mathbb {R} ^{d}$ . La densitat de ${\boldsymbol {X}}$ és $f({\boldsymbol {x}})={\frac {1}{(2\pi )^{d/2}}}\,e^{-(x_{1}^{2}+\cdots +x_{d}^{2})/2}={\frac {1}{(2\pi )^{d/2}}}\,e^{-{\boldsymbol {x}}'{\boldsymbol {x}}/2}.$ Llavors, la densitat de ${\boldsymbol {Y}}$ és $f_{\boldsymbol {Y}}({\boldsymbol {y}})={\frac {1}{(2\pi )^{d/2}}}\,e^{({\boldsymbol {y}}-{\boldsymbol {\mu }})^{\prime }{\boldsymbol {\Sigma }}^{-1/2}{\boldsymbol {\Sigma }}^{-1/2}({\boldsymbol {y}}-{\boldsymbol {\mu }})}\,\vert {\text{det}}\,{\boldsymbol {\Sigma }}^{-1/2}\vert ={\frac {1}{(2\pi )^{d/2}({\text{det}}\,{\boldsymbol {\Sigma }})^{1/2}}}\,e^{({\boldsymbol {y}}-{\boldsymbol {\mu }})^{\prime }{\boldsymbol {\Sigma }}^{-1}({\boldsymbol {y}}-{\boldsymbol {\mu }})}.$

Es diu que ${\boldsymbol {Y}}$ té una llei normal multidimensional ${\boldsymbol {Y}}\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ . D'acord amb les propietats que hem vist sobre el vector d'esperances i la matriu de variàncies-covariàncies tenim que

 $E[{\boldsymbol {Y}}]={\boldsymbol {\Sigma }}^{1/2}\,E[{\boldsymbol {X}}]+{\boldsymbol {\mu }}={\boldsymbol {\mu }}$

i ${\boldsymbol {V}}({\boldsymbol {Y}})={\boldsymbol {\Sigma }}^{1/2}{\boldsymbol {V}}({\boldsymbol {X}}){\boldsymbol {\Sigma }}^{1/2}={\boldsymbol {\Sigma }}.$

Extensió. La propietat anterior es pot estendre al cas que la funció $h$ es pugui descomposar en una funció bijectiva a trossos. Concretament tenim ^[20]: Sigui ${\boldsymbol {X}}$ un vector aleatori $d$ -dimensional, amb funció de densitat conjunta $f_{\boldsymbol {X}}({\boldsymbol {x}})$ . Suposem que $P\{{\boldsymbol {X}}\in U\}=1$ amb $U=U_{1}\cup \cdots \cup U_{k}$ , on $U_{i}$ són oberts de $\mathbb {R} ^{d}$ disjunts dos a dos. Sigui ${\textstyle h:\,U\longrightarrow \mathbb {R} ^{d},}$ tal que les restriccions $h_{i}:U_{i}\longrightarrow V_{i}$ són bijectives de classe ${\cal {C}}^{1}$ amb determinant jacobià no nul (els conjunts $V_{1},\dots ,V_{k}$ no cal que siguin disjunts dos a dos i, de fet, poden ser iguals). Designem per $g_{i}:V_{i}\longrightarrow U_{i}$ la inversa de $h_{i}$ . Aleshores el vector aleatori ${\boldsymbol {Y}}=h({\boldsymbol {X}})$ és absolutament continu amb densitat $f_{\boldsymbol {Y}}({\boldsymbol {y}})=\sum _{i=1}^{k}f_{\boldsymbol {X}}{\big (}g_{i}({\boldsymbol {y}})\vert J_{g_{i}}({\boldsymbol {y}})\vert {\boldsymbol {1}}_{V_{i}}({\boldsymbol {y}}),$ on, ${\boldsymbol {1}}_{V_{i}}$ és la funció indicador del conjunt $V_{i}$ : ${\boldsymbol {1}}_{V_{i}}(y)={\begin{cases}1,&{\text{si }}y\in V_{i},\\0,&{\text{en cas contrari.}}\end{cases}}$

Distribucions condicionades

Cas discret

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ un vector aleatori discret amb funció de probabilitat $p_{\boldsymbol {X}}$ . Considerem una de les components del vector, per exemple, per simplificar les notacions, l'última, $X_{d}$ , amb funció de probabilitat marginal $p_{X_{d}}$ , i fixem $x_{d}$ tal que $p_{X_{d}}(x_{d})>0$ . S'anomena distribució de $(X_{1},\dots ,X_{d-1})$ condicionada per $X_{d}=x_{d}$ a la probabilitat donada per la funció de probabilitat $p_{X_{1},\dots ,X_{d-1}\,\vert \,X_{d}}(x_{1},\dots ,x_{d-1}\vert x_{d})={\frac {p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})}{p_{X_{d}}(x_{d})}}.$ Més generalment, per a $2\leq r\leq d,$ podem considerar el vector $(X_{r},\dots ,X_{d})$ (per simplificar les notacions); fixat $(x_{r},\dots ,x_{d})$ tal que $p_{X_{r},\dots ,X_{d}}(x_{r},\dots ,x_{d})>0$ , definim la distribució de $(X_{1},\dots ,X_{r-1})$ condicionada per $X_{r}=x_{r},\dots ,X_{d}=x_{d}$ a la probabilitat donada per la funció de probabilitat $p_{X_{1},\dots ,X_{r-1}\,\vert \,X_{r},\dots ,X_{d}}(x_{1},\dots ,x_{r-1}\vert X_{r}=x_{r},\dots ,x_{d})={\frac {p_{\boldsymbol {X}}(x_{1},\dots ,x_{d})}{p_{X_{r},\dots ,X_{d}}(x_{r},\dots ,x_{d})}}.$ Exemple. Considerem un vector multinomial ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . Aleshores, fixat $k\in \{0,\dots ,n\}$ , la distribució de $(X_{1},\dots ,X_{d-1})$ condicionada per $X_{d}=k$ és $p_{(X_{1},\dots ,X_{d-1})\,\vert \,X_{d}}(x_{1},\dots ,x_{d-1}\vert k)={\frac {(n-k)!}{x_{1}!\cdots x_{d-1}!}}\,{\Big (}{\frac {p_{1}}{1-p_{k}}}{\Big )}^{x_{1}}\cdots {\Big (}{\frac {p_{d-1}}{1-p_{k}}}{\Big )}^{x_{d-1}},\quad x_{1}\geq 0,\dots ,x_{d-1}\geq 0,{\text{amb }}x_{1}+\cdots +x_{d-1}=n-k.$ Per tant, $(X_{1},\dots ,X_{d-1})$ condicionat a $X_{d}=k$ té una distribució multinomial ${\mathcal {M}}{\big (}n-k;p_{1}/(1-p_{k}),\dots ,p_{d-1}/(1-p_{k}){\big )}$ .

En general ^[21], fixats $x_{r}\geq 0,\dots ,x_{d}\geq 0,$ tals que $x_{r}+\cdots +x_{d}\leq n$ , el vector $(X_{1},\dots ,X_{r-1})$ condicionat per $X_{r}=x_{r},\dots ,X_{d}=x_{d}$ té una distribució multinomial ${\mathcal {M}}(n-m;p_{1}^{*},\dots ,p_{r-1}^{*})$ , on $m=x_{r}+\cdots +x_{d}$ i $p_{j}^{*}=p_{j}/(p_{1}+\cdots +p_{r-1}),\quad j=1,\dots ,r-1$ .

Cas absolutament continu

Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ un vector aleatori amb funció de densitat conjunta $f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})$ . Per a $2\leq r\leq d,$ fixats $x_{r},\dots ,x_{d}$ tals que $f_{X_{r},\dots ,x_{d}}(x_{r},\dots ,x_{d})>0$ , definim la densitat condicionada de $(X_{1},\dots ,X_{r-1})$ condicionada per $X_{r}=x_{r},\dots ,X_{d}=x_{d}$ $f_{X_{1},\dots ,X_{r-1}\,\vert \,X_{r},\dots ,X_{d}}(x_{1},\dots ,x_{r-1}\vert x_{r},\dots ,x_{d})={\frac {f_{\boldsymbol {X}}(x_{1},\dots ,x_{d})}{f_{X_{r},\dots ,X_{d}}(x_{r},\dots ,x_{d})}}.$

Exemple. Vector normal multidimensional. . Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})'\sim {\mathcal {N}}_{d}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})$ un vector normal multidimensional (de nou aquí escriurem tots els vectors en columna), i $2\leq r\leq d$ . Escrivim ${\boldsymbol {X}}_{1}=(X_{1},\dots ,X_{r-1})'\quad {\text{i}}\quad {\boldsymbol {X}}_{2}=(X_{r},\dots ,X_{d})'$ ${\boldsymbol {\mu }}_{1}=E[{\boldsymbol {X}}_{1}]=(\mu _{1},\dots ,\mu _{r-1})'\quad {\text{i}}\quad {\boldsymbol {\mu }}_{2}=E[{\boldsymbol {X}}_{2}]=(\mu _{r},\dots ,\mu _{d})'.$ D'altra banda, partim la matriu ${\boldsymbol {\Sigma }}$ de la següent manera: ${\boldsymbol {\Sigma }}={\begin{pmatrix}{\boldsymbol {\Sigma }}_{11}&{\boldsymbol {\Sigma }}_{12}\\\Sigma _{21}&{\boldsymbol {\Sigma }}_{22}\end{pmatrix}},$ on ${\boldsymbol {\Sigma }}_{ij}={\boldsymbol {C}}({\boldsymbol {X}}_{i},{\boldsymbol {X}}_{j})$ . Noteu que ${\boldsymbol {\Sigma }}_{21}={\boldsymbol {\Sigma }}_{12}'$ . Aleshores ^[22], la distribució $(X_{1},\dots ,X_{r-1})'$ condicionada per $X_{r}=x_{r},\dots ,X_{d}=x_{d}$ (escrivim ${\boldsymbol {x}}_{2}=(x_{r},\dots ,x_{d})'$ ) és normal mutidimensional ${\mathcal {N}}_{r-1}({\boldsymbol {\mu }}^{*},{\boldsymbol {\Sigma }}^{*})$ on ${\boldsymbol {\mu }}^{*}={\boldsymbol {\mu }}_{1}+{\boldsymbol {\Sigma }}_{12}{\boldsymbol {\Sigma }}_{22}^{-1}({\boldsymbol {x}}_{2}-{\boldsymbol {\mu }}_{2})\quad {\text{i}}\quad {\boldsymbol {\Sigma }}^{*}={\boldsymbol {\Sigma }}_{11}-{\boldsymbol {\Sigma }}_{12}{\boldsymbol {\Sigma }}_{22}^{-1}{\boldsymbol {\Sigma }}_{21}.$ En particular, per a $d=2$ , si posem ${\text{Var}}(X_{1})=\sigma _{1}^{2},\ {\text{Var}}(X_{2})=\sigma _{2}^{2}\ \ {\text{i}}\ \ {\text{Cov}}(X_{1},X_{2})=\sigma _{12},$ tenim que $X_{1}$ condicionada per $X_{2}=x_{2}$ té una distribució normal ${\mathcal {N}}(\mu ,\sigma ^{2})$ on $\mu =\mu _{1}+{\frac {\sigma _{12}}{\sigma _{2}^{2}}}(x_{2}-\mu _{2})\quad {\text{i}}\quad \sigma ^{2}=\sigma _{1}^{2}-{\frac {\sigma _{12}^{2}}{\sigma _{2}^{2}}}.$

Exemples

Aquests exemples tracten de vectors aleatoris bidimensionals, que habitualment és denoten per $(X,Y)$ en lloc de $(X_{1},X_{2})$ .

Exemple 1. Vector aleatori bidimensional discret

Tirem una moneda tres cops. El model probabilístic que prendrem és $\Omega ={\big \{}{\text{(cara,cara,cara), (creu, cara, cara),...}}{\big \}}$ , que té 8 elements; ${\mathcal {A}}$ és la col.lecció de tots els subconjunts de $\Omega$ , i $P$ assigna a tots els resultats la mateixa probabilitat 1/8. Siguin

X

: nombre de cares que surt.

Y

: diferència, en valor absolut, entre el nombre de cares i de creus.

Aleshores $X$ pot prendre els valors 0, 1, 2 o 3, i $Y$ pot valer 1 o 3. Llavors, el vector $(X,Y)$ pot prendre els valors (0,1), (0,3), (2,1), (2,3), (3,1) o (3,3). El conjunt $S={\big \{}(0,1),(0,3),(2,1),(2,3),(3,1),(3,3){\big \}}$ s'anomena el suport de la distribució del vector. Notem que $P{\big (}(X,Y)\in S{\big )}=1.$ Calculem les probabilitats que prengui cadascun dels valors del suport. Recordem que per alleugerir les fórmules s'utilitzen 'comes' en lloc d'interseccions):

P{\big (}(X,Y)=(0,1){\big )}=P{\big (}X=0,Y=1{\big )}=P{\big (}\{X=0\}\cap \{Y=1\}{\big )}=P(\emptyset )=0

.

P{\big (}(X,Y)=(0,3){\big )}=P{\big (}{\text{(creu,creu,creu)}}{\big )}=1/8

P{\big (}(X,Y)=(1,1){\big )}=P{\big (}{\text{(cara,creu,creu), (creu,cara,creu), (creu,creu,cara)}}{\big )}=3/8,

(noteu que l'ordre en què surten els resultats s'ha de tenir en compte).

I així successivament. De fet, els punts (0,1), (1,3), (2,3) i (3,1) es poden treure del suport, ja que tenen probabilitat zero, i per a certes fórmules és convenient fer-ho per evitar expressions sense sentit. La funció $p_{(X,Y)}(x,y)=P(X=x,Y=y),\ (x,y)\in S$ s'anomena funció de probabilitat conjunta o funció de repartiment de massa del vector $(X,Y)$ . Quan hi ha un nombre petit de casos, com en aquest exemple, la funció de probabilitat s'acostuma a posar en una taula, anomenada taula de probabilitats conjuntes del vector i que determina la llei o distribució del vector.

${\begin{array}{cc|cccc}&&&X\\&&0&1&2&3\\\hline &1&0&3/8&3/8&0\\Y\\&3&1/8&0&0&1/8\\\hline \end{array}}$

Distribucions marginals

A partir d'aquesta taula, sumant per files o columnes, es dedueixen les funcions de probabilitat de les variables $X$ i $Y$ , que denotem per $p_{X}$ i $p_{Y}$ i que s'anomenen distribucions marginals de $X$ i de $Y$ respectivament, o taules de probabilitats marginals:

${\begin{array}{c|ccccc}\hline x&0&1&2&3\\\hline p_{X}(x)&1/8&0&0&1/8\\\hline \end{array}}\qquad \qquad {\begin{array}{c|ccc}\hline y&1&3\\\hline p_{Y}(y)&3/4&1/4\\\hline \end{array}}$ Independència de variables aleatòries Recordem que dues variables aleatòries $X$ i $Y$ es diu que són independents si per a qualsevol $A,B\subset \mathbb {R}$ (en rigor, conjunts de Borel $A,B\in {\mathcal {B}}(\mathbb {R} )$ ) , els esdeveniments $\{X\in A\}$ i $\{Y\in B\}$ són independents, això és, $P{\big (}X\in A,Y\in B)=P(X\in A)\,P(Y\in B).$ Quan ambdues variables són discretes, aquesta condició es redueix a una sobre la funció de probabilitat conjunta: Les variables $X$ i $Y$ són independents si i només si $p_{(X,Y)}(x,y)=p_{X}(x)\,p_{Y}(y),\quad \forall (x,y)\in S.$ A l'exemple és evident que aquesta propietat no es compleix: per exemple, $p_{(X,Y)}(0,1)=0\neq p_{X}(0)\,p_{Y}(1)={\frac {3}{32}}.$

Distribucions condicionades

Atès que l'esdeveniment $\{Y=1\}$ (obtenir exactament una cara) té probabilitat estrictament positiva, podem calcular les probabilitat condicionada: $P(X=0\,\vert \,Y=1)={\frac {P(X=0,Y=1)}{P(Y=1)}}=0.$

Anàlogament, $P(X=1\,\vert \,Y=1)=1/2,\quad P(X=2\,\vert \,Y=1)=1/2\quad {\text{i}}\quad P(X=3\,\vert \,Y=1)=0.$ Per tant, fixat $Y=1$ , tenim definida una probabilitat sobre el conjunt $\{0,1,2,3\}$ , de fet, només cal considerar el conjunt $\{1,2\}$ , que s'anomena la distribució de $X$ condicionada per $Y=1$ , per a la qual es dóna la funció de probabilitat condicionada $p_{X\vert Y}(1|1)={\frac {1}{2}}\quad {\text{i}}\quad p_{X\vert Y}(2|1)={\frac {1}{2}},$ i que es pot representar per la taula ${\begin{array}{c|cc}\hline x&1&2\\\hline p_{X\vert Y}(x|1)&1/2&1/2\\\hline \end{array}}$ Anàlogament, tenim la distribució de condicionada per $Y=3$ donada a la següent taula: ${\begin{array}{c|cc}\hline x&0&3\\\hline p_{X\vert Y}(x|3)&1/2&1/2\\\hline \end{array}}$ Esperança d'un vector. Es defineix l'esperança del vector $(X,Y)$ com el vector ${\boldsymbol {E}}[(X,Y)]=(E[X],E[Y])$ . Concretament, atès que $E[X]=0\cdot {\frac {1}{8}}+1\cdot {\frac {3}{8}}+2\cdot {\frac {3}{8}}+0\cdot {\frac {1}{8}}={\frac {9}{8}}\quad {\text{i}}\quad E[Y]=1\cdot {\frac {3}{4}}+3\cdot {\frac {1}{4}}={\frac {3}{2}},$ tenim que $E[(X,Y)]=(9/8,3/2)$ .

Matriu de variàncies-covariàncies d'un vector. La matriu ${\boldsymbol {V}}{\big (}(X,Y){\big )}={\begin{pmatrix}{\text{Var}}(X)&{\text{Cov}}(X,Y)\\{\text{Cov}}(X,Y)&{\text{Var}}(Y)\end{pmatrix}}$ s'anomena matriu de variàncies-covariàncies o matriu de dispersió del vector $(X,Y)$ . Tenim que ${\text{Var}}(X)=E[X^{2}]-{\big (}E[X]{\big )}^{2}={\frac {15}{8}}-{\frac {81}{64}}={\frac {39}{64}}.$ De la mateixa manera es calcula que ${\text{Var}}(Y)=3/2$ . Per calcular la covariància farem servir que ${\text{Cov}}(X,Y)=E[XY]-E[X]E[Y].$ Ara, per obtenir $E[XY]$ , necessitem utilitzar la funció de probabilitat conjunta de $(X,Y)$ : $E[XY]=0\cdot 1\cdot 0+1\cdot 1\cdot {\frac {1}{8}}+2\cdot 1\cdot {\frac {3}{8}}+\cdots ={\frac {7}{4}},$ d'on, ${\text{Cov}}(X,Y)=1/16$ . Així, la matriu de variàncies-covariàncies és ${\boldsymbol {V}}{\big (}(X,Y){\big )}={\begin{pmatrix}{\tfrac {39}{64}}&{\tfrac {1}{4}}\\{\tfrac {1}{4}}&{\tfrac {3}{2}}\end{pmatrix}}$

Exemple 2. Vector aleatori bidimensional continu

De manera anàloga al cas d'una variable aleatòria absolutament contínua, es diu que un vector $(X,Y)$ és absolutament continu si existeix una funció $f_{(X,Y)}:\mathbb {R} ^{2}\to \mathbb {R}$ , anomenada funció de densitat (conjunta), que compleix

1.

f_{(X,Y)}(x,y)\geq 0,\ \ \forall (x,y)\in \mathbb {R} ^{2}.

2.

\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }f_{(X,Y)}(x,y)\,dx\,dy=1.

3. Per qualsevol

B\subset \mathbb {R} ^{2}

(en rigor, conjunt de Borel de

\mathbb {R} ^{2}

,

$P{\big (}(X,Y)\in B{\big )}=\iint _{B}f_{(X,Y)}(x,y)\,dx\,dy.$

Figura 1. Triangle

T

Com exemple, sigui $(X,Y)$ un vector aleatori bidimensional amb distribució uniforme en el triangle $T$ de vèrtexs els punts (0,0), (1,0) i (1,1) (vegeu la Figura 1). La funció de densitat conjunta és

$f_{(X,Y)}(x,y)={\begin{cases}2,&{\text{si}}\ (x,y)\in T,\\0,&{\text{en cas contrari.}}\end{cases}}$

La funció de densitat (marginal) de $Y$ es calcula per la fórmula:

$f_{Y}(y)=\int _{-\infty }^{\infty }f_{(X,Y)}(x,y)\ dx$

Ara cal distingir dos casos:

1. Fixada $y\notin (0,1)$ , aleshores $f_{(X,Y)}(x,y)=0,\ \forall x$ . És evident que $f_{Y}(y)=0.$

2. Fixada $y\in (0,1)$ ,

$f_{(X,Y)}(x,y)={\begin{cases}2,&{\text{si}}\ x\in (y,1),\\0,&{\text{en cas contrari.}}\end{cases}}$

Llavors

$f_{Y}(y)=\int _{-\infty }^{\infty }f_{(X,Y})(x,y)\,dx=\int _{y}^{1}2\,dx=2(1-y).$

Figura 2. Densitat marginal de la variable Y

Ajuntant ambdós casos tenim, vegeu la Figura 2,

$f_{Y}(y)={\begin{cases}2(1-y),&{\text{si}}\ y\in (0,1),\\0,&{\text{en cas contrari.}}\end{cases}}$

Figura 3. Densitat marginal variable X

De manera anàloga s'obté que la densitat marginal de $X$ és, vegeu la Figura 3, $f_{X}(x)=\int _{-\infty }^{\infty }f_{(X,Y)}(x,y)\,dy={\begin{cases}2x,&{\text{si}}\ x\in (0,1),\\0,&{\text{en cas contrari.}}\end{cases}}$

Ara podem calcular la densitat condicionada $f_{X|Y}(x|y)$ , que només es calculara per a $y\in (0,1)$

$f_{X|Y}(x|y)={\frac {f_{(X,Y)}(x,y)}{f_{Y}(y)}}={\begin{cases}{\dfrac {1}{1-y}},&{\text{quan}}\ x\in (y,1),\\0,&{\text{en cas contrari}}.\end{cases}}$

Figura 3. Funció de densitat condicionada

Vegeu la Figura 4. Noteu que els papers de $x$ i de $y$ són completament diferents. Fixada la $y\in (0,1)$ tenim una funció de densitat en $x$ . De fet, en aquest cas, es tracta de la densitat d'una distribució uniforme en l'interval $(y,1).$

Per obtenir l'esperança del vector $(X,Y)$ s'ha de calcular l'esperança de cada component utilitzant les fórmules corresponents al cas absolutament contínu: $E[X]=\int _{-\infty }^{\infty }xf_{X}(x)\,dx=2\int _{0}^{1}x^{2}\,dx={\frac {2}{3}}.$

També, $E[Y]=2/3$ . Així, $E[{\boldsymbol {X}}]=(2/3,2/3)$ .

El moment de segon ordre de $X$ és: $E[X^{2}]=\int _{-\infty }^{\infty }x^{2}f_{X}(x)\,dx=2\int _{0}^{1}x^{3}\,dx={\frac {1}{2}}.$ D'on ${\text{Var}}(X)=E[X^{2}]-{\big (}E[X]{\big )}^{2}={\frac {1}{2}}-{\frac {4}{9}}={\frac {1}{18}}.$

I el mateix dóna ${\text{Var}}(Y)$ .

Finalment, per calcular la covariància, $E[XY]=\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }xy\,f_{(X,Y)}(x,y)\,dx\,dy=\iint _{T}xy\,dx\,dy=\int _{x=0}^{1}\int _{y=0}^{x}xy\,dx\,dy={\frac {1}{6}}.$ Aleshores, ${\text{Cov}}(X,Y)=E[XY]-E[X]\,E[Y]={\frac {1}{6}}-{\frac {4}{9}}=-{\frac {5}{18}}.$ Per tant, la matriu de variàncies covariàncies dóna ${\boldsymbol {V}}{\big (}(X,Y){\big )}={\begin{pmatrix}~~~{\tfrac {1}{18}}&-{\tfrac {5}{18}}\\-{\tfrac {5}{18}}&~~~{\tfrac {1}{18}}\end{pmatrix}}$

Notes

↑ ^1,0 ^1,1 ^1,2 Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 66-68. ISBN 84-8338-091-9.
↑ Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-36091-0.
↑ Forbes, C.; Evans, M.; Hastings, N.; Peacock, B. Statistical distributions.. 4th ed.. Oxford: Wiley-Blackwell, 2010, pp.135-136. ISBN 978-0-470-62724-2.
↑ Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 90. ISBN 84-8338-091-9.
↑ ^5,0 ^5,1 Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 2-3. ISBN 0-471-12844-9.
↑ Cuppens, Roger. Decomposition of multivariate probabilities. New York: Academic Press, 1975, p. 52. ISBN 0-12-199450-3.
↑ Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 5-8. ISBN 0-471-41540-5.
↑ Sato, Ken-iti. Lévy processes and infinitely divisible distributions. Cambridge, U.K.: Cambridge University Press, 1999, p. 9. ISBN 0-521-55302-4.
↑ ^9,0 ^9,1 Athreya, Krishna B. Measure theory and probability theory. New York: Springer, 2006, p. 198-199. ISBN 0-387-32903-X.
↑ ^10,0 ^10,1 Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994. ISBN 0-412-05221-0.
↑ ^11,0 ^11,1 ^11,2 Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13-14. ISBN 0-471-41540-5.
↑ Debnath, Joyati; Dahiya, R.S. «Theorems on multidimensional laplace transform for solution of boundary value problems» (en anglès). Computers & Mathematics with Applications, 18, 12, 1989, pàg. 1033–1056. DOI: 10.1016/0898-1221(89)90031-X.
↑ Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 55. ISBN 0-471-36091-0.
↑ ^14,0 ^14,1 ^14,2 Kimmel, Marek. Branching processes in biology. New York: Springer, 2002, p. Appendix A. ISBN 0-387-95340-X.
↑ NIST handbook of mathematical functions. Cambridge: Cambridge University Press, 2010, p. Item 26.1.1. ISBN 978-0-521-19225-5.
↑ Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 4. ISBN 0-471-12844-9.
↑ Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 73. ISBN 84-8338-091-9.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 225, propietat 10.32. ISBN 978-0-470-22678-0.
↑ Per definició, les matrius definides positives són simètriques
↑ Per un resultat semblant vegeuCasella, George. Statistical inference. 2nd ed. Australia: Thomson Learning, 2002, p. 185. ISBN 0-534-24312-6.
↑ Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 35. ISBN 0-471-12844-9.
↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 439. ISBN 978-0-470-22678-0.

Bibliografia

Johnson, N. L.; Kotz, S.; Kemp, A. W.. Univariate discrete distributions.. 2nd ed.. New York: Wiley, 1992. ISBN 0-471-54897-9.

Kotz, S.; Balakrihsnan, N.; Johnson, N. L.. Continuous multivariate distributions. Vol. 1, Models and applications.. 2nd ed.. New York: Wiley, 2000. ISBN 0-471-65403-5.

Si tenim  $-\infty \leq a<b\leq \infty ,-\infty \leq c<d\leq \infty$ ,

$P{\big (}(X,Y)\in B{\big )}=\iint _{B}f_{\boldsymbol {X}}(x,y)\,dx\,dy.$ $P{\big (}(X,Y)\in (a,b)\times (c,d){\big )}=\int _{a}^{b}\int _{c}^{d}f_{\boldsymbol {X}}(x,y)\,dx\,dy.$

Vector d'esperances i matriu de variàncies-covariàncies

Considerem un vector aleatori ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})$ tal que totes les seves components tinguin esperança. Aleshores es defineix el vector d'esperances de ${\boldsymbol {X}}$ per $E[{\boldsymbol {X}}]={\big (}E[X_{1}],\dots ,E[X_{d}]{\big )}.$ Si el vector aleatori s'escriu en columna, aleshores el vector d'esperances també. De fet, de seguida veurem que és més pràctic escriure els vectors en columna, tal com es fa habitualment en Àlgebra lineal.

Propietats

Si ${\boldsymbol {a}}=(a_{1},\dots ,a_{d})\in \mathbb {R} ^{d}$ , aleshores $E[{\boldsymbol {a}}]=a.$
Siguin ${\boldsymbol {X}}$ i ${\boldsymbol {Y}}$ dos vectors aleatoris $d$ -dimensionals amb esperances finites, i ${\boldsymbol {A}}$ i ${\boldsymbol {B}}$ dues matrius d'ordre $n\times d$ . Aleshores $E[{\boldsymbol {AX'}}+{\boldsymbol {BY'}}]={\boldsymbol {A}}\,E[{\boldsymbol {X}}']+{\boldsymbol {B}}\,E[{\boldsymbol {Y}}'],$

on ${\boldsymbol {C}}'$ designa la transposada de la matriu (o vector) ${\boldsymbol {C}}$ .

Si totes les components del vector ${\boldsymbol {X}}$ tenen variància, aleshores es defineix la seva matriu de variàncies-covariàncies o matriu de dispersió: ${\boldsymbol {V}}({\boldsymbol {X}})={\begin{pmatrix}{\text{Var}}(X_{1})&{\text{Cov}}(X_{1},X_{2})&\cdots &{\text{Cov}}(X_{1},X_{d})\\{\text{Cov}}(X_{2},X_{1})&{\text{Var}}(X_{2})&\cdots &{\text{Cov}}(X_{2},X_{d})\\\vdots &\vdots &&\vdots \\{\text{Cov}}(X_{d},X_{1})&{\text{Cov}}(X_{d},X_{2})&\cdots &{\text{Var}}(X_{d})\end{pmatrix}}$ Atès que ${\text{Var}}(X_{j})={\text{Cov}}(X_{j},X_{j})$ , aquesta matriu també s'escriu ${\boldsymbol {V}}({\boldsymbol {X}})={\big (}{\text{Cov}}(X_{i},X_{j}){\big )}_{i=1,\dots ,d \atop j=1,\dots ,d}$

Propietats

Donat que ${\text{Cov}}(X_{i},X_{j})={\text{Cov}}(X_{j},X_{i})$ , la matriu ${\boldsymbol {V}}({\boldsymbol {X}})$ es simètrica.
La matriu ${\boldsymbol {V}}({\boldsymbol {X}})$ és semidefinida positiva, ja que per qualsevol ${\boldsymbol {x}}=(x_{1},\dots ,x_{d})\in \mathbb {R} ^{d}$ ,

${\boldsymbol {x}}{\boldsymbol {V}}({\boldsymbol {X}}){\boldsymbol {x}}'=\sum _{i,j=1}^{d}x_{i}x_{j}{\text{Cov}}(X_{i},X_{j})={\text{Var}}(\sum _{i=1}^{d}X_{i})\geq 0.$ A més, ${\text{det}}\,{\boldsymbol {V}}({\boldsymbol {X}})=0$ si i només si hi ha una relació lineal entre les variables $X_{1},\dots ,X_{d}$ , això és, existeixen escalars $\lambda _{1},\dots ,\lambda _{d+1}\in \mathbb {R}$ , no tots nuls, tals que $\lambda _{1}X_{1}+\cdots +\lambda _{d}X_{d}=\lambda _{d+1},\quad {\text{q.s.}}$

3. Si ${\boldsymbol {A}}$ és una matriu $n\times d$ , aleshores ${\boldsymbol {V}}({\boldsymbol {AX'}})={\boldsymbol {A}}\,{\boldsymbol {V}}({\boldsymbol {X}}'){\boldsymbol {A}}'.$

Exemples

1. Sigui ${\boldsymbol {X}}=(X_{1},\dots ,X_{d})\sim {\mathcal {M}}(n;p_{1},\dots ,p_{d})$ . Aleshores, donat que cada component $X_{j}$ té una distribució binomial $B(n,p_{j})$ , tenim que $E[{\boldsymbol {X}}]=(np_{1},\dots ,np_{d})$ També tenim que ${\text{Var}}(X_{j})=np_{j}(1-p_{j}).$ Per calcular les covariàncies cal utilitzar la marginal de $(X_{i},X_{j})$ . Concretament s'obté ${\text{Cov}}(X_{i},X_{j})=-np_{i}p_{j},\quad i\neq j.$ Així, ${\boldsymbol {V}}({\boldsymbol {X}})={\begin{pmatrix}np_{1}(1-p_{1})&-np_{1}p_{2}&\cdots &-np_{1}p_{d}\\-np_{1}p_{2}&np_{2}(1-p_{2})&\cdots &-np_{2}p_{d}\\\vdots &\vdots &\ddots &\vdots \\-np_{1}p_{d}&-np_{2}p_{d}&\cdots &np_{d}(1-p_{d})\end{pmatrix}}$ 2. En el cas del vector normal multidimensional, $E[{\boldsymbol {X}}]=(0\dots ,0)$ , ${\text{Var}}(X_{j})=1$ i ${\text{Cov}}(X_{i},X_{j})=0,\quad i\neq j$ . Llavors, ${\boldsymbol {V}}({\boldsymbol {X}})={\boldsymbol {I}}_{d}.$

[:4-1] 1,0 ^1,1 ^1,2 Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 66-68. ISBN 84-8338-091-9.

[2] Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003. ISBN 0-471-36091-0.

[3] Forbes, C.; Evans, M.; Hastings, N.; Peacock, B. Statistical distributions.. 4th ed.. Oxford: Wiley-Blackwell, 2010, pp.135-136. ISBN 978-0-470-62724-2.

[4] Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 90. ISBN 84-8338-091-9.

[:1-5] 5,0 ^5,1 Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 2-3. ISBN 0-471-12844-9.

[6] Cuppens, Roger. Decomposition of multivariate probabilities. New York: Academic Press, 1975, p. 52. ISBN 0-12-199450-3.

[7] Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 5-8. ISBN 0-471-41540-5.

[8] Sato, Ken-iti. Lévy processes and infinitely divisible distributions. Cambridge, U.K.: Cambridge University Press, 1999, p. 9. ISBN 0-521-55302-4.

[:5-9] 9,0 ^9,1 Athreya, Krishna B. Measure theory and probability theory. New York: Springer, 2006, p. 198-199. ISBN 0-387-32903-X.

[:2-10] 10,0 ^10,1 Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, 1994. ISBN 0-412-05221-0.

[:0-11] 11,0 ^11,1 ^11,2 Seber, G. A. F.. Linear regression analysis. 2nd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13-14. ISBN 0-471-41540-5.

[12] Debnath, Joyati; Dahiya, R.S. «Theorems on multidimensional laplace transform for solution of boundary value problems» (en anglès). Computers & Mathematics with Applications, 18, 12, 1989, pàg. 1033–1056. DOI: 10.1016/0898-1221(89)90031-X.

[13] Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J.: Wiley-Interscience, 2003, p. 55. ISBN 0-471-36091-0.

[:3-14] 14,0 ^14,1 ^14,2 Kimmel, Marek. Branching processes in biology. New York: Springer, 2002, p. Appendix A. ISBN 0-387-95340-X.

[15] NIST handbook of mathematical functions. Cambridge: Cambridge University Press, 2010, p. Item 26.1.1. ISBN 978-0-521-19225-5.

[16] Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 4. ISBN 0-471-12844-9.

[17] Sanz, Marta. Probabilitats. Barcelona: Edicions Universitat de Barcelona, 1999, p. 73. ISBN 84-8338-091-9.

[18] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 225, propietat 10.32. ISBN 978-0-470-22678-0.

[19] Per definició, les matrius definides positives són simètriques

[20] Per un resultat semblant vegeuCasella, George. Statistical inference. 2nd ed. Australia: Thomson Learning, 2002, p. 185. ISBN 0-534-24312-6.

[21] Johnson, Norman Lloyd. Discrete multivariate distributions. New York: Wiley, 1997, p. 35. ISBN 0-471-12844-9.

[22] Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 439. ISBN 978-0-470-22678-0.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]