Vés al contingut

Autoencoder

De la Viquipèdia, l'enciclopèdia lliure
Aquesta és una versió anterior d'aquesta pàgina, de data 16:32, 13 maig 2021 amb l'última edició de Alzinous (discussió | contribucions). Pot tenir inexactituds o contingut no apropiat no present en la versió actual.
Esquema bàsic d'un autoencoder

Un autoencoder és un tipus de xarxa neuronal artificial no supervisada. Té la particularitat de que té el mateix número de nodes a la primera capa i a la última, pel que té tants valors input com output. Està format per la capa inicial, seguit per capes ocultes i amb una última capa de sortida. La capa oculta central té una dimensionalitat menor que la primera i la última, pel que forma un coll d'ampolla. L'objectiu de l'autoencoder és reproduir a la última capa les mateixes dades que obté a la primera capa de forma tan aproximada com sigui possible. Degut a que en el coll d'ampolla el número de dimensions és menor, l'autoencoder haurà d'aprendre una nova representació de les dades que tingui un número menor de dimensions que l'original. Del contrari, no podrà mantenir la informació necessària en el coll d'ampolla per reproduir correctament les dades a l'última capa.

El coll d'ampolla divideix l'autoencoder en dues parts: l'encoder i el decoder. L'encoder forma les capes a l'esquerra de la capa en el coll d'ampolla, i té aquest nom degut a que codifica la informació d'entrada a una representació de menys dimensions. El decoder forma les capes a la dreta de la capa en el coll d'ampolla, i s'encarrega de convertir les dades en l'espai de poques dimensions a l'espai de tantes dimensions com l'original.

Les aplicacions d'un autoencoder passen per reducció de soroll, compressió, detecció d'anomalies, etc. N'existeixen diferents variants, com Variatonal autoencoder (VAE). La propietat de reducció de dimensionalitat es pot comparar amb altres algoritmes com Principal Component Analysis (PCA), però l'autoencoder té l'avantatge d'usar operacions no lineals, guanyant flexibilitat i així sent capaç en ocasions de fer més compressió sense augmentar l'error de reconstrucció.

Referències