Desigualtat de Jensen

En matemàtiques, la desigualtat de Jensen per funcions convexes relaciona el valor que assigna a una integral amb la integral d'aquesta mateixa funció permutant, per dir-ho així, la funció i la integral. Va ser provada pel matemàtic danès Johan Jensen el 1906.[1] Donada la seva generalitat, la desigualtat apareix en múltiples contextos.

Formulació

modifica

En la seva formulació més simple, la desigualtat és la següent: una transformació convexa de la mitjana és menor o igual en valor que la mitjana d'una transformació convexa.

Formulació finita

modifica

Donada una funció convexa φ, nombres x 1 , x 2 , ..., x n en el seu domini i pesos positius a i es compleix que:

 

Si els pesos a i són tots iguals a 1, llavors

 

Per exemple, com la funció-log ( x ) és convexa, la desigualtat anterior es pot concretar en

 

Formulació probabilística (dins de la teoria de la mesura)

modifica

Sigui (Ω, A , μ ) un espai mètric tal que μ (Ω) = 1. Si g és una funció real μ-integrable i φ una funció convexa en l'eix real, llavors:

 

En anàlisi real, pot ser necessària una estimació de

 

on   són nombres reals i   és una funció real integrable. Llavors, reescalat, es pot aplicar la desigualtat de Jensen per obtenir

 

La desigualtat de Jensen, usant la notació habitual en teoria de la probabilitat, pot reescriure així:

 

Aplicacions en casos especials

modifica

Quan hi ha una funció de densitat

modifica

Si f ( x ) és una funció no negativa tal que

 

g és una funció real qualsevol i φ és una funció convexa sobre el rang de g , llavors

 

En cas que g sigui la funció identitat, s'obté

 

Física estadística

modifica

La desigualtat de Jensen té un paper important en física estadística quan la funció convexa és l'exponencial perquè llavors

 

fórmula en la qual els parèntesis angulars representen l'esperança respecte a la distribució de probabilitat de la variable aleatòria X .

Teoria de la informació

modifica

Si p ( x ) és la distribució de probabilitat veritable de x i q ( x ) és una altra distribució, aplicant la desigualtat a la variable aleatòria I ( x ) = q ( x )/ p ( x ) i la funció φ ( i ) =-log ( i ) s'obté

 
 
 
 

que és l'anomenada desigualtat de Gibbs i està relacionada amb el fet que la longitud dels missatges és mínima quan es codifiquen en termes de la distribució veritable. Està relacionada amb el concepte de la divergència de Kullback-Leibler.

Referències

modifica
  1. Jensen, J. L. W. V. «Sur les fonctions convexes et les inégalités entre les valeurs moyennes». Acta Mathematica, 30, 1906, p. 175-193. DOI: 10.1007/BF02418571.

Bibliografia

modifica