Domain generalization using action sequences for egocentric action recognition

Nasirimajd, Amirshayan; Plizzari, Chiara; Peirone, Simone Alberto; Ciccone, Marco; Averta, Giuseppe; Caputo, Barbara

doi:10.1016/j.patrec.2025.06.010

Recognizing human activities from visual inputs, particularly through a first-person viewpoint, is essential for enabling robots to replicate human behavior. Egocentric vision, characterized by cameras worn by observers, captures diverse changes in illumination, viewpoint, and environment. This variability leads to a notable drop in the performance of Egocentric Action Recognition models when tested in environments not seen during training. In this paper, we tackle these challenges by proposing a domain generalization approach for Egocentric Action Recognition. Our insight is that action sequences often reflect consistent user intent across visual domains. By leveraging action sequences, we aim to enhance the model’s generalization ability across unseen environments. Our proposed method, named SeqDG, introduces a visual-text sequence reconstruction objective (SeqRec) that uses contextual cues from both text and visual inputs to reconstruct the central action of the sequence. Additionally, we enhance the model’s robustness by training it on mixed sequences of actions from different domains (SeqMix). We validate SeqDG on the EGTEA and EPIC-KITCHENS-100 datasets. Results on EPIC-KITCHENS-100, show that SeqDG leads to +2.4% relative average improvement in cross-domain action recognition in unseen environments, and on EGTEA the model achieved +0.6% Top-1 accuracy over SOTA in intra-domain action recognition.

Domain generalization using action sequences for egocentric action recognition / Nasirimajd, A., Plizzari, C., Peirone, S.A., Ciccone, M., Averta, G., Caputo, B.. - In: PATTERN RECOGNITION LETTERS. - ISSN 0167-8655. - ELETTRONICO. - 196:(2025), pp. 213-220. [10.1016/j.patrec.2025.06.010]

Domain generalization using action sequences for egocentric action recognition

Nasirimajd, Amirshayan;Plizzari, Chiara;Peirone, Simone Alberto;Ciccone, Marco;Averta, Giuseppe;Caputo, Barbara

2025

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno del prodotto
	
				2025
			
	Codice DOI
	
				https://dx.doi.org/10.1016/j.patrec.2025.06.010
			
	Titolo della Rivista
	
				PATTERN RECOGNITION LETTERS
			
	Appare nelle tipologie
	
				1.1 Articolo in rivista

File in questo prodotto:

File	Dimensione	Formato
1-s2.0-S0167865525002387-main.pdf accesso aperto Tipologia: 2a Post-print versione editoriale / Version of Record Licenza: Creative commons Dimensione 1.7 MB Formato Adobe PDF Visualizza/Apri	1.7 MB	Adobe PDF	Visualizza/Apri

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11583/3001251

PORTO @ Archivio Istituzionale della Ricerca

Domain generalization using action sequences for egocentric action recognition

Nasirimajd, Amirshayan;Plizzari, Chiara;Peirone, Simone Alberto;Ciccone, Marco;Averta, Giuseppe;Caputo, Barbara

2025

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)