Transient-fault-aware design and training to enhance DNNs reliability with zero-overhead

Cavagnero, Niccolo'; Fernando Dos Santos,; Ciccone, Marco; Averta, Giuseppe; Tommasi, Tatiana; Rech, Paolo

doi:10.1109/IOLTS56730.2022.9897813

Deep Neural Networks (DNNs) enable a wide series of technological advancements, ranging from clinical imaging, to predictive industrial maintenance and autonomous driving. However, recent findings indicate that transient hardware faults may corrupt the models prediction dramatically. For instance, the radiation-induced misprediction probability can be so high to impede a safe deployment of DNNs models at scale, urging the need for efficient and effective hardening solutions. In this work, we propose to tackle the reliability issue both at training and model design time. First, we show that vanilla models are highly affected by transient faults, that can induce a performances drop up to 37%. Hence, we provide three zero-overhead solutions, based on DNN re-design and re-train, that can improve DNNs reliability to transient faults up to one order of magnitude. We complement our work with extensive ablation studies to quantify the gain in performances of each hardening component.

Transient-fault-aware design and training to enhance DNNs reliability with zero-overhead / Cavagnero, Niccolo'; Dos Santos, Fernando; Ciccone, Marco; Averta, GIUSEPPE BRUNO; Tommasi, Tatiana; Rech, Paolo. - ELETTRONICO. - (2022). (Intervento presentato al convegno IOLTS - The 28th IEEE International Symposium on On-Line Testing and Robust System Design tenutosi a Torino (ITA) nel 12-14 Settembre 2022) [10.1109/IOLTS56730.2022.9897813].

Transient-fault-aware design and training to enhance DNNs reliability with zero-overhead

Niccolo' Cavagnero;Fernando Dos Santos;Marco Ciccone;Giuseppe Averta;Tatiana Tommasi;Paolo Rech

2022

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Anno del prodotto

2022

Appare nelle tipologie

4.1 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
iolts_2022.pdf accesso aperto Tipologia: 2. Post-print / Author's Accepted Manuscript Licenza: Pubblico - Tutti i diritti riservati Dimensione 367.37 kB Formato Adobe PDF Visualizza/Apri	367.37 kB	Adobe PDF	Visualizza/Apri
Transient-Fault-Aware_Design_and_Training_to_Enhance_DNNs_Reliability_with_Zero-Overhead.pdf accesso riservato Tipologia: 2a Post-print versione editoriale / Version of Record Licenza: Non Pubblico - Accesso privato/ristretto Dimensione 408.32 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	408.32 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11583/2971443

PORTO @ Archivio Istituzionale della Ricerca

Transient-fault-aware design and training to enhance DNNs reliability with zero-overhead

Niccolo' Cavagnero;Fernando Dos Santos;Marco Ciccone;Giuseppe Averta;Tatiana Tommasi;Paolo Rech

2022

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)