L'impiego dell'architettura beta-VAE (Variational Autoencoder con regolarizzazione beta) rappresenta un cambiamento di paradigma nel trattamento dei dati scientifici, permettendo di superare l'opacità dei modelli ''black box'' a favore di una rappresentazione latente trasparente e interpretabile. Il presente studio esplora la capacità di questo modello di operare una decomposizione semantica dei dati, trasformando i neuroni del bottleneck informativo in veri e propri ''cursori'' capaci di isolare fattori di variazione indipendenti e fisicamente significativi. Partendo dal successo ottenuto nel campo della mineralogia — dove l'applicazione di un vincolo beta = 4 ha permesso di isolare il contributo dell'acqua di cristallizzazione dalla struttura del solfato nel gesso - il lavoro estende l'analisi al dominio della visione artificiale. Attraverso l'uso di dataset standard come MNIST e tecniche di Latent Space Traversal, viene dimostrato come il modello sia in grado di smontare un'immagine nei suoi concetti logici costitutivi (forma, rotazione, spessore) senza alcuna supervisione esterna. I risultati evidenziano l'emergere di un neurone dominante (nel caso proposto il Neurone 3), responsabile della gestione topologica della forma, che agisce in modo disaccoppiato (disentangled) dagli altri fattori. Questo approccio non si limita al semplice denoising, ma ribadisce il concetto di pseudospettro e introduce ''immagine ideale'' o ''pseudoimmagine'', già proposta in https://iris.polito.it/handle/11583/3003213 , fornendo uno strumento rigoroso per la creazione di librerie di modelli archetipici utili nella ricerca accademica e scientifica. In conclusione, il beta-VAE si conferma come il motore d'elezione per una IA esplicabile, capace di tradurre distribuzioni statistiche in leggi fisiche e chimiche coerenti.
Decomposizione Semantica e Disentanglement nella Visione Artificiale tramite beta-VAE autoencoder / Sparavigna, Amelia Carolina. - ELETTRONICO. - (2026). [10.5281/zenodo.20052021]
Decomposizione Semantica e Disentanglement nella Visione Artificiale tramite beta-VAE autoencoder
Amelia Carolina Sparavigna
2026
Abstract
L'impiego dell'architettura beta-VAE (Variational Autoencoder con regolarizzazione beta) rappresenta un cambiamento di paradigma nel trattamento dei dati scientifici, permettendo di superare l'opacità dei modelli ''black box'' a favore di una rappresentazione latente trasparente e interpretabile. Il presente studio esplora la capacità di questo modello di operare una decomposizione semantica dei dati, trasformando i neuroni del bottleneck informativo in veri e propri ''cursori'' capaci di isolare fattori di variazione indipendenti e fisicamente significativi. Partendo dal successo ottenuto nel campo della mineralogia — dove l'applicazione di un vincolo beta = 4 ha permesso di isolare il contributo dell'acqua di cristallizzazione dalla struttura del solfato nel gesso - il lavoro estende l'analisi al dominio della visione artificiale. Attraverso l'uso di dataset standard come MNIST e tecniche di Latent Space Traversal, viene dimostrato come il modello sia in grado di smontare un'immagine nei suoi concetti logici costitutivi (forma, rotazione, spessore) senza alcuna supervisione esterna. I risultati evidenziano l'emergere di un neurone dominante (nel caso proposto il Neurone 3), responsabile della gestione topologica della forma, che agisce in modo disaccoppiato (disentangled) dagli altri fattori. Questo approccio non si limita al semplice denoising, ma ribadisce il concetto di pseudospettro e introduce ''immagine ideale'' o ''pseudoimmagine'', già proposta in https://iris.polito.it/handle/11583/3003213 , fornendo uno strumento rigoroso per la creazione di librerie di modelli archetipici utili nella ricerca accademica e scientifica. In conclusione, il beta-VAE si conferma come il motore d'elezione per una IA esplicabile, capace di tradurre distribuzioni statistiche in leggi fisiche e chimiche coerenti.Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/11583/3010601
Attenzione
Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo
