Gli Auto-Encoders sono particolari tipi di reti neurali non supervisionate che mirano a codificare l'ingresso in una rappresentazione compatta
, tale da permettere la ricostruzione dell'ingresso stesso. In questo senso, gli Auto-Encoders possono essere visti come un'alternativa alle RBM addestrate con l'algoritmo di Contrastive Divergence, con cui condividono l'obiettivo di apprendere rappresentazioni latenti significative.
La rete è composta da due parti:
L'obiettivo è minimizzare la negative log-likelihood della ricostruzione:
| (4.87) |
Se invece gli ingressi sono binari (o seguono una distribuzione binomiale), la funzione costo diventa:
| (4.88) |
La funzione
rappresenta una compressione con perdita (lossy compression). Essa è efficace nel rappresentare i dati visti durante la fase di addestramento non supervisionato, ma può risultare sub-ottimale per dati non appartenenti al dominio di addestramento.
Paolo medici