Funció de distribució: diferència entre les revisions

Contingut suprimit Contingut afegit
m Bot elimina espais repetits
Ampliació de l'article
Línia 1:
[[Fitxer:Normal Distribution CDF.svg|miniatura|<center>Funció de distribució acumulada per a la distribució normal.</center>]]
[[Fitxer:Normal Distribution PDF.svg|miniatura|<center>Funció de densitat de probabilitat per a diverses distribucions normals. La corba vermella segueix la distribució normal estàndard, amb mitjana zero i variància la unitat.</center>]]
En [[teoria de la probabilitat]] i [[estadística]], la '''funció de distribució acumulada''' (també '''funció de distribució''' o '''funció de densitat acumulada''', o '''CDF''' pel seu acrònim en anglès '''cumulative distribution function''') d'una [[variable aleatòria]] ''X'' de valors realsreal, evaluadaavaluada en ''x'', és la [[probabilitat]] que ''X'' prengui un valor inferior o igual a ''x''. La funció de distribució determina totes les probabilitats relatives a la variable aleatòria.
 
En el cas de les distribucions absolutament contínues, dónaequival l'[[Integral de Lebesgue|àrea]] sota la [[funció de densitat de probabilitat]] de menys infinit a ''x''. Les funcions de distribució acumuladamultidimensionals o multivariants també serveixen per especificar lales distribucióprobabilitats dels [[Vector aleatori|vectors aleatoris]] o de [[vector aleatori|variables aleatòries multivariades]].
 
== Definició ==
Considerem un [[espai de probabilitat]] <math>(\Omega, \mathcal{A}, P)</math>. La funció de distribució acumulada{{Sfn|Sanz|1999|p=42}} d'una vairable[[variable aleatòria]] ''X'' de valor real és la funció donada<math>F:\mathbb{R}\longrightarrow [0,1]</math> definida per:
 
:<math display="block">F_XF(x) = \operatorname{P}(X\leq x)=P\big(X\in (-\infty,x]\big). \qquad (*) </math>
En'''Observació.''' Alguns autors {{Sfn|Loeve|1976|p=167}} defineixen la definiciófunció de dalt,distribució elcanviant signea l'expressió (*) el "menor o igual a", "≤", ésper un conveni, no s'utilitzamenor universalmentestricte: <math>P(perX<x)</math>. exempleEl enconveni laque literaturahem acadèmicaadoptat hungaresa s'utilitzaés el signemés "<"),habitual peròactualment. ésCal importanttenir-ho enpresent, lesja distrucions discretes.que Ll'ús correcte de les taules de les variables discretes com les de la [[distribució binomial]] io la [[distribució de Poisson|de Poisson]] depèn d'aquest conveni. És més, fórmules importants com la fórmula d'inversió de [[Paul Lévy]] per a la [[Funció característica (teoria de la probabilitat)#Teorema d'inversió|funció característica]] també es basen en aquesta formulació.
 
Si es tracta amb diverses variables aleatòries ''<math> X''</math>, ''<math> Y''..</math>, etc. les lletres corresponents que les designenaleshores s'utilitzenescriu com<math>F_X</math>, a<math> subíndexsF_Y</math>, mentreetc. queper siindicar nomésles hifuncions hade unadistribució variablerespectives. aleatòria, el subíndex se sol obviar. El conveni marca l'ús de la ''<math>F''</math> majúscula per a la funció de distribució acumulada, en contrast amb la '' <math>f''</math> minúscula usada per a les [[funció de densitat de probabilitat|funcions de densitat de probabilitat]] (cas absolutament contínu) i les [[Funció de probabilitat|funcions de probabilitat o de repartiment de massa de probabilitat]] (cas discret). Això s'aplica quan es treballa amb distribucions generals: algunes distribucions específiques tenen la seva pròpia notació, com és el cas de la [[distribució normal]]., on la funció de distribució d'una variable normal estàndard s'acostuma a designar per <math>\Phi(x)</math>
on l'expressió a la dreta de l'igual representa la [[probabilitat]] que la variable aleatòria ''X'' prengui un valor inferior o igual a ''x''. La probabilitat que ''X'' es trobi en l'[[Interval (matemàtiques)|interval]] (''a'',&nbsp;''b''<nowiki>]</nowiki>, on ''a'' < &nbsp;''b'', és doncs
 
[[Fitxer:Discrete probability distribution illustration.svg|miniatura|<center>De dalt a baix:la funció de distribució acumulada d'una distribució de probabilitat discreta, d'una distribució de probabilitat contínua i d'una distribució que té una part discreta i una de contínua.</center>]]
:<math>\operatorname{P}(a < X \le b)= F_X(b)-F_X(a).</math>
 
En la definició de dalt, el signe "menor o igual a", "≤", és un conveni, no s'utilitza universalment (per exemple en la literatura acadèmica hungaresa s'utilitza el signe "<"), però és important en les distrucions discretes. L'ús correcte de les taules de la [[distribució binomial]] i la [[distribució de Poisson|de Poisson]] depèn d'aquest conveni. És més, fórmules importants com la fórmula d'inversió de [[Paul Lévy]] per a la [[Funció característica (teoria de la probabilitat)#Teorema d'inversió|funció característica]] també es basen en aquesta formulació.
 
== Propietats ==
Si es tracta amb diverses variables aleatòries ''X'', ''Y''... les lletres corresponents que les designen s'utilitzen com a subíndexs, mentre que si només hi ha una variable aleatòria, el subíndex se sol obviar. El conveni marca l'ús de la ''F'' majúscula per a la funció de distribució acumulada, en contrast amb la ''f'' minúscula usada per a les [[funció de densitat de probabilitat|funcions de densitat de probabilitat]] i les [[Funció de probabilitat|funcions de massa de probabilitat]]. Això aplica quan es treballa amb distribucions generals: algunes distribucions específiques tenen la seva pròpia notació, com és el cas de la [[distribució normal]].
Totes aquestes propietats es troben demostrades, per exmple, a {{Sfn|Sanz|1999|pp=43-47}}
 
: '''1.''' <math>F</math> és una funció monòtona no decreixent: Si <math>x<y</math> aleshores <math>F(x)\le F(y)</math>.
La CDF d'una variable aleatòria contínua ''X'' pot ser expressada com la integral de la seva funció de densitat de probabilitat ƒ<sub>X</sub> com segueix:
 
:<math>F_X(x) = \int_{-\infty}^x f_X(t)\,dt.</math>
 
: '''2.''' <math>F</math> és contínua per la dreta i té límit per l'esquerra en tot punt. El límit per l'esquerra en el punt <math>x</math> el designarem per <math>F(x^-)</math>.
En el cas de la variable aleatòria ''X'' que té una distribució amb una component discreta per ''x=b'',
 
:<math>\operatorname{P}(X=b) = F_X(b) - \lim_{x \to b^{-}} F_X(x).</math>
 
: '''3.''' <math>\lim_{x\to -\infty}F(x)=0, \quad \text{i}\quad \lim_{x\to +\infty}F(x)=1.</math>
Si ''F<sub>X</sub>'' és contínua en ''b'', això serà igual a zero i voldrà dir que que no hi ha component discret en ''b''.
 
== Propietats ==
[[Fitxer:Discrete probability distribution illustration.svg|miniatura|<center>De dalt a baix:la funció de distribució acumulada d'una distribució de probabilitat discreta, d'una distribució de probabilitat contínua i d'una distribució que té una part discreta i una de contínua.</center>]]
 
Tota funció de distribució acumulada ''F'' és una funció [[funció monòtona|monòtonament]] creixent i [[Funció contínua|contínua]], cosa que la fa ser una [[funció càdlàg]]. És més:
 
'''Observació''' Aquestes tres propietats són importants perquè caracteritzen les funcions de distribució de les variables aleatòries: Donada una funció que compleixi aquestes tres propietats, llavors és la funció de distribució d'una variable aleatòria, és a dir, es pot construir un espai de probabilitat i definir-hi una [[variable aleatòria]] que tingui aquesta funció com a funció de distribució.<br>
:<math>\lim_{x\to -\infty}F(x)=0, \quad \lim_{x\to +\infty}F(x)=1.</math>
: '''4.''' Probabilitat que <math>X</math> pertanyi a diversos tipus d'intervals.
 
:: (a) <math display="block"> P\big(X\in (s,t]\big)=P(s<X\le t)=F(t)-F(s).</math>
Tota funció que reuneixi aquestes quatre propietats és una CDF, és a dir per tota funció d'aquest tipus, es pot definir una [[variable aleatòria]] que tingui aquesta funció com a funció de distribució acumulada.
 
:: (b) <math display="block"> P\big(X\in (-\infty, x)\big)=P(X<x)=F(x^-),</math>
Si ''X'' és una variable aleatòria purament discreta, llavors pren valors ''x''<sub>1</sub>, ''x''<sub>2</sub>, ... amb probabilitats ''p''<sub>''i''</sub> = P(''x''<sub>''i''</sub>), llavors la CDF de ''X'' serà [[funció contínua|discontínua]] en els punts ''x''<sub>''i''</sub> i constant entre aquests punts:
on <math>F(x^-)</math> és el límit per l'esquerra de <math>F</math> en el punt <math>x</math>:
<math display="block"> F(x^-)=\lim_{s\uparrow x,\ s<x}F(s).</math>
 
:: (c) <math display="block"> P\big(X=x\big)=F(x)-F(x^-),</math>
:<math>F(x) = \operatorname{P}(X\leq x) = \sum_{x_i \leq x} \operatorname{P}(X = x_i) = \sum_{x_i \leq x} p(x_i).</math>
és a dir, <math> F</math> té una discontinuïtat al punt <math> x</math> si només si <math>P\big(X=x\big)>0 </math>.
 
Si la CDF ''F'' de la variable aleatòria amb valors reals ''X'' és [[funció contínua|contínua]], llavors ''X'' és una variable aleatòria contínua; si a més ''F'' és [[continuïtat absoluta|absolutament contínua]], llavors existeix una funció [[Integral de Lebesgue|Lebesgue-integrable]] ''f''(''x'') tal que:
 
:: (d) <math display="block">F P\big(b)-FX\in (as,t) = \operatorname{big)=P}(as< X\leq< bt) = \int_aF(t^b f-)-F(xs)\,dx.</math><br>
:: (e) <math display="block"> P\big(X\in [s,t)\big)=P(s\le X< t)=F(t^-)-F(s^-).</math>
<br>
: '''5.''' La funció <math> F</math> té, com màxim, un nombre numerable de punts de discontinuïtat.
 
==== Funcions de distribució de variables discretes i absolutament contínues ====
 
Si ''X'' és una [[Variable aleatòria#Tipus de variables aleatòries|variable aleatòria purament discreta]], llavorsque pren valors ''x''<sub>1</submath>x_1, ''x''<sub>2x_2\dots</submath>, ... amb probabilitats ''p''<submath>''i''</sub> p_i= P(''x''<sub>''i''X=x_i)</submath>), llavors la CDFfunció de distribució de ''X'' serà [[funció contínua|discontínua]] en els punts ''x''<sub>''i''</sub> i constant entre aquests punts:
 
:<math display="block">F(x) = \operatorname{P}(X\leq x) = \sum_{x_i \leq x} \operatorname{P}(X = x_i) = \sum_{x_i \leq x} p(x_i).</math>
 
Recordem que una variable aleatòria <math> X</math> es diu que té [[Variable aleatòria#Tipus de variables aleatòries|densitat]] (o que és absolutament contínua, o també -informalment- que és contínua, si existeix una funció <math>f:{\mathbb R} \to {\mathbb R} </math> que compleix
 
: '''1.''' <math display="inline">f(x)\ge 0, \forall x\in {\mathbb R}.</math>
<br>
 
: '''2.''' <math>f</math> és integrable i <math display="inline">\int_{-\infty}^{\infty}f(x)\, dx =1.</math> és a dir, l'àrea total entre la gràfica de la funció de densitat i l'eix d'abscisses és 1. Vegeu la Figura 3.[[Fitxer:Funcio_densitat_exemple_Area.pdf|alt=L'àrea sota la corba de la funció de densitat és 1|miniatura|Figura 3. L'àrea entre la corba de la funció de densitat i l'eix d'abscisses és 1.]]
<br>
: '''3.''' Per a <math> -\infty \le a \le b \le +\infty</math>,
<math display="block"> P( a \le X \le b)= \int_a ^b f(t)\, dt.</math>És a dir, la probabilitat que la variable prengui un valor de l'interval <math>[a\ , b]</math> és l'àrea de la zona limitada pel gràfic de la funció<math>f</math>, l'eix de les x i l les rectes x=a i x=b.Vegeu la Figura 4.
[[Fitxer:Funcio_densitat_exemple_Probab.pdf|alt=Relació entre la probabilitat i l'àrea sota la corba de la funció de densitat|miniatura|Figura 4. Relació entre la probabilitat i l'àrea sota la corba de la funció de densitat]]
Llavors,
:<math display="block">F_XF(x) = \int_{-\infty}^x f_Xf(t)\,dt.</math>
 
 
per tot valor real d'''a'' i ''b''. La funció ''f'' és igual a la derivada d'''F'' [[gairebé pertot]], i rep el nom de [[funció de densitat de probabilitat]] de la distribució de ''X''.
 
== Exemples ==
Linha 64 ⟶ 86:
\end{cases}</math>
 
== Funcions derivadesconstruïdes a partir de la funció de distribució ==
=== Funció de distribució acumulada complementària (distribució cua) ===
Sovint, és útil estudiar la qüestió oposada i preguntar-se amb quina probabilitat la variable aleatòria està ''per sobre'' un nivell en particular. Això s'anomena '''funció de distribució acumulada complementària''' o simplement '''distribució cua''' o '''excedència''', i es defineix com:
 
:<math>\bar F(x) = \operatorname{P}(X > x) = 1 - F(x).</math>
 
Això té aplicacions en [[contrast d'hipòtesi]]s [[estadística|estadístiques]], per exemple, perquè el [[valor p]] d'un costat és la probabilitat d'observar un estadístic test ''com a mínim'' tan extrem com l'observat. Llavors, sempre que l'estadístic, ''T'', té una distribució contínua, el [[valor p]] d'un costat ve simplement donat per la funció de distribució acumulada complementària: per un valor ''t'' observat en l'estadístic test:
 
:<math>p= \operatorname{P}(T \ge t) = \operatorname{P}(T > t) =1 - F_T(t).</math>
Linha 80 ⟶ 102:
:: <math>\bar F(x) \leq \frac{\operatorname{E}(X)}{x} .</math>
* Com que quan <math> x \to \infty, \bar F(x) \to 0 \ </math>, i de fet <math> \bar F(x) = o(1/x) </math> sempre que <math>\operatorname{E}(X)</math> sigui finit.
:Demostració: assumeixi's que la variable aleatòria ''X'' té una funció de denistatdensitat ''f'', per tot <math> c> 0 </math>
::<math>
\operatorname{E}(X) = \int_0^\infty xf(x) \, dx \geq \int_0^c xf(x) \, dx + c\int_c^\infty f(x) \, dx
Linha 146 ⟶ 168:
* [[Estadística descriptiva]]
 
== ReferènciesNotes ==
{{Referències}}
{{Commonscat}}
{{Autoritat}}
 
== Referències ==
{{Ref-llibre
|títol=Teoría de la probabilidad|url=https://www.worldcat.org/oclc/432496610|editorial=Tecnos
|data=1976
|lloc=Madrid|isbn=84-309-0663-0|nom=Michel
cognom=Loeve
}}
 
 
* {{Ref-llibre
|títol=Probabilitats|url=https://www.worldcat.org/oclc/807622317|editorial=Edicions Universitat de Barcelona
|data=1999
|lloc=Barcelona|isbn=84-8338-091-9|nom=Marta
|cognom=Sanz
}}</ref>
 
[[Categoria:Estadística]]