Teorema de representació de Kolmogorov-Arnold
En l'anàlisi real i la teoria d'aproximació, el teorema de representació de Kolmogorov-Arnold (o teorema de superposició) estableix que tota funció contínua multivariant es pot representar com una superposició de l'addició de dos arguments de funcions contínues d'una variable. Va resoldre una forma més restringida del tretzè problema de Hilbert, de manera que el tretzè problema de Hilbert original és un corol·lari.[1][2][3]
Els treballs de Vladimir Arnold i Andrey Kolmogorov van establir que si f és una funció contínua multivariant, aleshores f es pot escriure com una composició finita de funcions contínues d'una sola variable i l'operació binària d'addició.[4] Més específicament,
on i .
Hi ha proves amb construccions específiques.[5]
En cert sentit, van demostrar que l'única funció multivariant veritable és la suma, ja que totes les altres funcions es poden escriure utilitzant funcions univariants i sumant.[6] :180
Història
modificaEl teorema de representació de Kolmogorov-Arnold està estretament relacionat amb el 13è problema de Hilbert. En la seva conferència de París al Congrés Internacional de Matemàtics el 1900, David Hilbert va formular 23 problemes que, segons la seva opinió, eren importants per al desenvolupament de les matemàtiques.[7] El 13è d'aquests problemes tractava de la solució d'equacions generals de graus superiors. Se sap que per a les equacions algebraiques de grau 4 la solució es pot calcular mitjançant fórmules que només contenen radicals i operacions aritmètiques. Per a ordres superiors, la teoria de Galois ens mostra que les solucions d'equacions algebraiques no es poden expressar en termes d'operacions algebraiques bàsiques. De l'anomenada transformació de Tschirnhaus es desprèn que l'equació algebraica general
es pot traduir al formulari . La transformació de Tschirnhaus ve donada per una fórmula que conté només radicals i operacions i transformacions aritmètiques. Per tant, la solució d'una equació algebraica de grau es pot representar com una superposició de funcions de dues variables si i com a superposició de funcions de variables si . Per la solució és una superposició d'operacions aritmètiques, radicals i la solució de l'equació .
Una simplificació addicional amb transformacions algebraiques sembla ser impossible, fet que va portar a la conjectura de Hilbert que "Una solució de l'equació general de grau 7 no es pot representar com una superposició de funcions contínues de dues variables". Això explica la relació del tretzè problema de Hilbert amb la representació d'una funció de dimensions superiors com a superposició de funcions de dimensions inferiors. En aquest context, ha estimulat molts estudis sobre la teoria de les funcions i altres problemes relacionats per part de diferents autors.
En el camp de l'aprenentatge automàtic, hi ha hagut diversos intents d'utilitzar xarxes neuronals modelades a partir de la representació de Kolmogorov-Arnold.[8][9] En aquests treballs, el teorema de Kolmogorov-Arnold té un paper anàleg al del teorema d'aproximació universal en l'estudi dels perceptrons multicapa.
Referències
modifica- ↑ Khesin, Boris A. Arnold: Swimming Against the Tide (en anglès). American Mathematical Society, 2014, p. 165. ISBN 978-1-4704-1699-7.
- ↑ Akashi, Shigeo (en anglès) Reports on Mathematical Physics, 48, 1-2, 2001, pàg. 19–26. DOI: 10.1016/S0034-4877(01)80060-4.
- ↑ Morris, Sidney A. (en anglès) Bulletin of the American Mathematical Society, 58, 1, 06-07-2020, pàg. 107–118. DOI: 10.1090/bull/1698. ISSN: 0273-0979 [Consulta: free].
- ↑ Bar-Natan, Dror. «Dessert: Hilbert's 13th Problem, in Full Colour» (en anglès).
- ↑ Braun, Jürgen; Griebel, Michael (en anglès) Constructive Approximation, 30, 3, 2009, pàg. 653–675. DOI: 10.1007/s00365-009-9054-2.
- ↑ Diaconis, Persi; Shahshahani, Mehrdad «Còpia arxivada». SIAM Journal on Scientific Computing, 5, 1, 1984, pàg. 175–191. Arxivat de l'original el 2012-05-13 [Consulta: 16 juny 2024].
- ↑ Hilbert, David Bulletin of the American Mathematical Society, 8, 10, 1902, pàg. 461–462. DOI: 10.1090/S0002-9904-1902-00923-3 [Consulta: free].
- ↑ Lin, Ji-Nan; Unbehauen, Rolf Neural Computation, 5, 1-1993, pàg. 18–20. DOI: 10.1162/neco.1993.5.1.18.
- ↑ Köppen, Mario Artificial Neural Networks — ICANN 2002, 2415, 2022, pàg. 474–479. DOI: 10.1007/3-540-46084-5_77.