Model probit

és un tipus de regressió on la variable dependent només pot prendre dos valors.

En estadística, un model probit és un tipus de regressió on la variable dependent només pot prendre dos valors, per exemple casat o no casat. La paraula és un acrònim, que prové de prob ability + un it.[1] L'objectiu del model és estimar la probabilitat que una observació amb característiques particulars caigui en una determinada de les categories; a més, classificar les observacions en funció de les seves probabilitats previstes és un tipus de model de classificació binari.[2]

Gràfic de la funció probit 2erf−1⁡(2p−1).

Un model probit és una especificació popular per a un model de resposta binària. Com a tal, tracta el mateix conjunt de problemes que la regressió logística utilitzant tècniques similars. Quan es veu en el marc del model lineal generalitzat, el model probit utilitza una funció d'enllaç probit.[3] Sovint s'estima utilitzant el procediment de màxima versemblança,[4] aquesta estimació s'anomena regressió probit.

Marc conceptual modifica

Suposem que una variable de resposta Y és binària, és a dir, només pot tenir dos possibles resultats que denotarem com 1 i 0. Per exemple, Y pot representar la presència/absència d'una determinada condició, l'èxit/error d'algun dispositiu, respondre sí/no en una enquesta, etc. També tenim un vector de regressors X, que se suposa que influeixen en el resultat Y. Concretament, assumim que el model pren la forma

 

on P és la probabilitat i   és la funció de distribució acumulada de la distribució normal estàndard. Els paràmetres β s'estimen normalment per la màxima versemblança.

És possible motivar el model probit com un model de variable latent. Suposem que existeix una variable aleatòria auxiliar

 

on ε ~ N (0, 1). Aleshores, Y es pot veure com un indicador de si aquesta variable latent és positiva:

 

L'ús de la distribució normal estàndard no provoca pèrdua de generalitat en comparació amb l'ús d'una distribució normal amb una mitjana arbitrària i desviació estàndard, perquè afegir una quantitat fixa a la mitjana es pot compensar restant la mateixa quantitat de la intercepció i multiplicant-la. la desviació estàndard per una quantitat fixa es pot compensar multiplicant els pesos per la mateixa quantitat.

Referències modifica

  1. Oxford English Dictionary, 3rd ed. s.v. probit (article dated June 2007): Bliss, C. I. Science, 79, 2037, 1934, pàg. 38–39. Bibcode: 1934Sci....79...38B. DOI: 10.1126/science.79.2037.38. PMID: 17813446. «These arbitrary probability units have been called ‘probits’.»
  2. Stephanie «Probit Model (Probit Regression): Definition» (en anglès). Statistics How To, 26-09-2016.
  3. Agresti, Alan. Foundations of Linear and Generalized Linear Models (en anglès). Nova York: Wiley, 2015, p. 183–186. ISBN 978-1-118-73003-4. 
  4. Aldrich, John H. Linear Probability, Logit, and Probit Models (en anglès). Sage, 1984, p. 48–65. ISBN 0-8039-2133-0.