Nucli de funció de base radial

En l'aprenentatge automàtic, el nucli de la funció de base radial, o nucli RBF, és una funció real del nucli que s'utilitza en diversos algorismes d'aprenentatge kernelitzats. En particular, s'utilitza habitualment en la classificació de màquines de vectors de suport.^[1]

El nucli RBF en dues mostres $\mathbf {x} \in \mathbb {R} ^{k}$ i x', representat com a vectors de característiques en algun espai d'entrada, es defineix com ^[2]

$K(\mathbf {x} ,\mathbf {x'} )=\exp \left(-{\frac {\|\mathbf {x} -\mathbf {x'} \|^{2}}{2\sigma ^{2}}}\right)$

$\textstyle \|\mathbf {x} -\mathbf {x'} \|^{2}$ es pot reconèixer com la distància euclidiana al quadrat entre els dos vectors de característiques. $\sigma$ és un paràmetre lliure. Una definició equivalent implica un paràmetre $\textstyle \gamma ={\tfrac {1}{2\sigma ^{2}}}$ :

$K(\mathbf {x} ,\mathbf {x'} )=\exp(-\gamma \|\mathbf {x} -\mathbf {x'} \|^{2})$

Com que el valor del nucli RBF disminueix amb la distància i oscil·la entre zero (al límit) i un (quan $x = x'$ ), té una interpretació fàcil com a mesura de semblança. L'espai de característiques del nucli té un nombre infinit de dimensions; per $\sigma =1$ , la seva expansió utilitzant el teorema multinomial és:

${\begin{alignedat}{2}\exp \left(-{\frac {1}{2}}\|\mathbf {x} -\mathbf {x'} \|^{2}\right)&=\exp({\frac {2}{2}}\mathbf {x} ^{\top }\mathbf {x'} -{\frac {1}{2}}\|\mathbf {x} \|^{2}-{\frac {1}{2}}\|\mathbf {x'} \|^{2})\\&=\exp(\mathbf {x} ^{\top }\mathbf {x'} )\exp(-{\frac {1}{2}}\|\mathbf {x} \|^{2})\exp(-{\frac {1}{2}}\|\mathbf {x'} \|^{2})\\&=\sum _{j=0}^{\infty }{\frac {(\mathbf {x} ^{\top }\mathbf {x'} )^{j}}{j!}}\exp \left(-{\frac {1}{2}}\|\mathbf {x} \|^{2}\right)\exp \left(-{\frac {1}{2}}\|\mathbf {x'} \|^{2}\right)\\&=\sum _{j=0}^{\infty }\quad \sum _{n_{1}+n_{2}+\dots +n_{k}=j}\exp \left(-{\frac {1}{2}}\|\mathbf {x} \|^{2}\right){\frac {x_{1}^{n_{1}}\cdots x_{k}^{n_{k}}}{\sqrt {n_{1}!\cdots n_{k}!}}}\exp \left(-{\frac {1}{2}}\|\mathbf {x'} \|^{2}\right){\frac {{x'}_{1}^{n_{1}}\cdots {x'}_{k}^{n_{k}}}{\sqrt {n_{1}!\cdots n_{k}!}}}\\&=\langle \varphi (\mathbf {x} ),\varphi (\mathbf {x'} )\rangle \end{alignedat}}$

$\varphi (\mathbf {x} )=\exp \left(-{\frac {1}{2}}\|\mathbf {x} \|^{2}\right)\left(a_{l_{0}}^{(0)},a_{1}^{(1)},\dots ,a_{l_{1}}^{(1)},\dots ,a_{1}^{(j)},\dots ,a_{l_{j}}^{(j)},\dots \right)$

on $l_{j}={\tbinom {k+j-1}{j}}$ ,

$a_{l}^{(j)}={\frac {x_{1}^{n_{1}}\cdots x_{k}^{n_{k}}}{\sqrt {n_{1}!\cdots n_{k}!}}}\quad |\quad n_{1}+n_{2}+\dots +n_{k}=j\wedge 1\leq l\leq l_{j}$

Aproximacions modifica

Com que les màquines de vectors de suport i altres models que utilitzen el truc del nucli no s'escalen bé a un gran nombre de mostres d'entrenament o un gran nombre de funcions a l'espai d'entrada, s'han introduït diverses aproximacions al nucli RBF (i a nuclis similars). Normalment, aquests prenen la forma d'una funció z que mapeja un sol vector a un vector de dimensionalitat més alta, aproximant-se al nucli: ^[3]

$\langle z(\mathbf {x} ),z(\mathbf {x'} )\rangle \approx \langle \varphi (\mathbf {x} ),\varphi (\mathbf {x'} )\rangle =K(\mathbf {x} ,\mathbf {x'} )$

on $\textstyle \varphi$ és el mapeig implícit incrustat al nucli RBF.^[4]

Referències modifica

↑ Chang, Yin-Wen; Hsieh, Cho-Jui; Chang, Kai-Wei; Ringgaard, Michael; Lin, Chih-Jen Journal of Machine Learning Research, 11, 2010, pàg. 1471–1490.
↑ «Radial Basis Function Kernel - Machine Learning» (en anglès americà). https://www.geeksforgeeks.org,+05-06-2020.+[Consulta: 21 agost 2023].
↑ Sreenivasa, Sushanth. «Radial Basis Function (RBF) Kernel: The Go-To Kernel» (en anglès). https://towardsdatascience.com/,+12-10-2020.+[Consulta: 21 agost 2023].
↑ «The Radial Basis Function Kernel» (en anglès). https://pages.cs.wisc.edu.+[Consulta: 21 agost 2023].

[Chang2010-1] Chang, Yin-Wen; Hsieh, Cho-Jui; Chang, Kai-Wei; Ringgaard, Michael; Lin, Chih-Jen Journal of Machine Learning Research, 11, 2010, pàg. 1471–1490.

[2] «Radial Basis Function Kernel - Machine Learning» (en anglès americà). https://www.geeksforgeeks.org,+05-06-2020.+[Consulta: 21 agost 2023].

[3] Sreenivasa, Sushanth. «Radial Basis Function (RBF) Kernel: The Go-To Kernel» (en anglès). https://towardsdatascience.com/,+12-10-2020.+[Consulta: 21 agost 2023].

[4] «The Radial Basis Function Kernel» (en anglès). https://pages.cs.wisc.edu.+[Consulta: 21 agost 2023].

[1]

[2]

[3]

[4]