Transformer-based highlights extraction from scientific papers

LA QUATRA, Moreno; Cagliero, Luca

doi:10.1016/j.knosys.2022.109382

Highlights are short sentences used to annotate scientific papers. They complement the abstract content by conveying the main result findings. To automate the process of paper annotation, highlights extraction aims at extracting from 3 to 5 paper sentences via supervised learning. Existing approaches rely on ad hoc linguistic features, which depend on the analyzed context, and apply recurrent neural networks, which are not effective in learning long-range text dependencies. This paper leverages the attention mechanism adopted in transformer models to improve the accuracy of sentence relevance estimation. Unlike existing approaches, it relies on the end-to-end training of a deep regression model. To attend patterns relevant to highlights content it also enriches sentence encodings with a section-level contextualization. The experimental results, achieved on three different benchmark datasets, show that the designed architecture is able to achieve significant performance improvements compared to the state-of-the-art.

Transformer-based highlights extraction from scientific papers / LA QUATRA, Moreno; Cagliero, Luca. - In: KNOWLEDGE-BASED SYSTEMS. - ISSN 1872-7409. - ELETTRONICO. - 252:(2022). [10.1016/j.knosys.2022.109382]

Transformer-based highlights extraction from scientific papers

Moreno La Quatra;Luca Cagliero

2022

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno del prodotto
	
				2022
			
	Codice DOI
	
				https://dx.doi.org/10.1016/j.knosys.2022.109382
			
	Titolo della Rivista
	
				KNOWLEDGE-BASED SYSTEMS
			
	Appare nelle tipologie
	
				1.1 Articolo in rivista

File in questo prodotto:

File	Dimensione	Formato
THExt_KBS_draft.pdf Open Access dal 09/07/2024 Descrizione: Post-print version without editor layout Tipologia: 2. Post-print / Author's Accepted Manuscript Licenza: Creative commons Dimensione 524.76 kB Formato Adobe PDF Visualizza/Apri	524.76 kB	Adobe PDF	Visualizza/Apri
1-s2.0-S0950705122006931-main.pdf non disponibili Tipologia: 2a Post-print versione editoriale / Version of Record Licenza: Non Pubblico - Accesso privato/ristretto Dimensione 773.65 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	773.65 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11583/2969878

PORTO @ Archivio Istituzionale della Ricerca

Transformer-based highlights extraction from scientific papers

Moreno La Quatra;Luca Cagliero

2022

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)