MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection

Borra, Federico; Savelli, Claudio; Rosso, Giacomo; Koudounas, Alkis; Giobergia, Flavio

doi:10.18653/v1/2024.semeval-1.240

In Natural Language Generation (NLG), contemporary Large Language Models (LLMs) face several challenges, such as generating fluent yet inaccurate outputs and reliance on fluency-centric metrics. This often leads to neural networks exhibiting "hallucinations". The SHROOM challenge focuses on automatically identifying these hallucinations in the generated text. To tackle these issues, we introduce two key components, a data augmentation pipeline incorporating LLM-assisted pseudo-labelling and sentence rephrasing, and a voting ensemble from three models pre-trained on Natural Language Inference (NLI) tasks and fine-tuned on diverse datasets.

MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection / Borra, Federico; Savelli, Claudio; Rosso, Giacomo; Koudounas, Alkis; Giobergia, Flavio. - (2024), pp. 1678-1684. (Intervento presentato al convegno 18th International Workshop on Semantic Evaluation (SemEval-2024) tenutosi a Mexico City (MEX) nel 20-21 June, 2024) [10.18653/v1/2024.semeval-1.240].

MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection

Federico Borra;Claudio Savelli;Giacomo Rosso;Alkis Koudounas;Flavio Giobergia

2024

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Anno del prodotto

2024

Appare nelle tipologie

4.1 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
2024.semeval-1.240.pdf accesso aperto Tipologia: 2a Post-print versione editoriale / Version of Record Licenza: Creative commons Dimensione 230.12 kB Formato Adobe PDF Visualizza/Apri	230.12 kB	Adobe PDF	Visualizza/Apri

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11583/2992886

PORTO @ Archivio Istituzionale della Ricerca

MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection

Federico Borra;Claudio Savelli;Giacomo Rosso;Alkis Koudounas;Flavio Giobergia

2024

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)