Regressió del nucli

tècnica en estadística

En estadística, la regressió del nucli és una tècnica no paramètrica per estimar l'expectativa condicional d'una variable aleatòria. L'objectiu és trobar una relació no lineal entre un parell de variables aleatòries X i Y.

Regressió del nucli gaussià

En qualsevol regressió no paramètrica, l'expectativa condicional d'una variable relatiu a una variable es pot escriure:

on és una funció desconeguda.

Regressió del nucli de Nadaraya-Watson

modifica

Nadaraya i Watson, tots dos en 1964, van proposar estimar   com a mitjana ponderada localment, utilitzant un nucli com a funció de ponderació.[1][2][3] L'estimador de Nadaraya-Watson és:

 


on   és un nucli amb una amplada de banda   de tal manera que   és d'ordre almenys 1, és a dir   .

Exemple

modifica

Aquest exemple es basa en dades de salaris transversals canadencs que consisteixen en una mostra aleatòria presa de les cintes d'ús públic del cens canadenc de 1971 per a individus masculins amb educació comuna (grau 13). Hi ha 205 observacions en total.

La figura de la dreta mostra la funció de regressió estimada utilitzant un nucli gaussià de segon ordre juntament amb límits de variabilitat asimptòtica.

Implementació estadística

modifica

Referències

modifica
  1. Nadaraya, E. A. Theory of Probability and Its Applications, 9, 1, 1964, pàg. 141–2. DOI: 10.1137/1109020.
  2. Watson, G. S. Sankhyā: The Indian Journal of Statistics, Series A, 26, 4, 1964, pàg. 359–372. JSTOR: 25049340.
  3. Bierens, Herman J. «The Nadaraya–Watson kernel regression function estimator». A: Topics in Advanced Econometrics (en anglès). New York: Cambridge University Press, 1994, p. 212–247. ISBN 0-521-41900-X. 
  4. Horová, I. Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing (en anglès). Singapore: World Scientific Publishing, 2012. ISBN 978-981-4405-48-5. 
  5. Kloke, John. Nonparametric Statistical Methods Using R (en anglès). CRC Press, 2014, p. 98–106. ISBN 978-1-4398-7343-4.