L’analisi di spettri interi mediante metodi chemiometrici presenta spesso alcune limitazioni pratiche, come l’interpretazione a volte poco accessibile dei segnali o come il costo computazionale richiesto. Questa situazione si verifica soprattutto con la presenza di numerosi campioni, e vale sia per l’analisi esplorativa che per eventuali successive modellazioni di regressione/classificazione, dato che il punto di partenza di tali analisi è la “tabella numerica” contenente gli spettri NMR: più questa sarà grande, più aumenterà il costo computazionale. Un primo passo nella direzione di semplificare la gestione e l’analisi dei dati NMR può essere l’utilizzo di un approccio ad intervalli, che prevede la creazione di tanti “modelli locali” (cioè corrispondenti a zone accuratamente selezionate dello spettro), permettendo così di ridurre i problemi di linea di base, rumore e, in parte, di costo computazionale. Un ulteriore passaggio consiste nell’estrazione di feature dal set di dati, sempre con un approccio ad intervalli. Ciò è fattibile in diverse maniere, ma l’obiettivo è solitamente quello di ottenere delle feature a cui sia possibile dare un nome chimico (anche se provvisorio/preliminare), cioè un’assegnazione molecolare del segnale descritto dalla feature. L’assegnazione si basa solitamente sul confronto del segnale descritto dalla feature con librerie di riferimento, database e articoli di letteratura. Il risultato è un set di dati “compresso”, a ridotto contenuto di rumore, facilmente interpretabile. I passaggi fin qui descritti trovano difficile applicazione utilizzando gli strumenti a disposizione di ricercatori e ricercatrici, in quanto si tratta spesso di software e tool particolarmente specializzati, o specifici per un determinato formato di dati. Lo scopo di questo intervento è quindi quello di presentare un’idea di toolbox sviluppata in ambiente MATLAB che raggruppi gran parte dei passaggi di analisi dati sopra descritti. Verranno presentati alcuni casi studio in cui l’applicazione di tecniche ad intervalli per la risoluzione dei segnali ha fornito intepretazioni molto chiare e risultati confrontabili se non migliori rispetto all’approccio a spettro intero, e durante il cui sviluppo sono state codificate le funzioni di base della toolbox. Verrà inoltre posta molta attenzione alla questione dell’interpretazione dei risultati e delle feature estratte, oltre che alla loro corretta assegnazione chimica considerando diversi livelli di confidenza.
Nascita di una toolbox: import, visualizzazione, analisi e risoluzione chemiometrica di spettri 1H-NMR / Cavallini, Nicola; Sozzi, Mattia; Cocchi, Marina; Savorani, Francesco. - ELETTRONICO. - (2022), pp. 24-25. (Intervento presentato al convegno VII Workshop - APPLICAZIONI DELLA RISONANZA MAGNETICA NELLA SCIENZA DEGLI ALIMENTI tenutosi a Roma nel 23-24 giugno 2022).
Nascita di una toolbox: import, visualizzazione, analisi e risoluzione chemiometrica di spettri 1H-NMR
Nicola Cavallini;Mattia Sozzi;Marina Cocchi;Francesco Savorani
2022
Abstract
L’analisi di spettri interi mediante metodi chemiometrici presenta spesso alcune limitazioni pratiche, come l’interpretazione a volte poco accessibile dei segnali o come il costo computazionale richiesto. Questa situazione si verifica soprattutto con la presenza di numerosi campioni, e vale sia per l’analisi esplorativa che per eventuali successive modellazioni di regressione/classificazione, dato che il punto di partenza di tali analisi è la “tabella numerica” contenente gli spettri NMR: più questa sarà grande, più aumenterà il costo computazionale. Un primo passo nella direzione di semplificare la gestione e l’analisi dei dati NMR può essere l’utilizzo di un approccio ad intervalli, che prevede la creazione di tanti “modelli locali” (cioè corrispondenti a zone accuratamente selezionate dello spettro), permettendo così di ridurre i problemi di linea di base, rumore e, in parte, di costo computazionale. Un ulteriore passaggio consiste nell’estrazione di feature dal set di dati, sempre con un approccio ad intervalli. Ciò è fattibile in diverse maniere, ma l’obiettivo è solitamente quello di ottenere delle feature a cui sia possibile dare un nome chimico (anche se provvisorio/preliminare), cioè un’assegnazione molecolare del segnale descritto dalla feature. L’assegnazione si basa solitamente sul confronto del segnale descritto dalla feature con librerie di riferimento, database e articoli di letteratura. Il risultato è un set di dati “compresso”, a ridotto contenuto di rumore, facilmente interpretabile. I passaggi fin qui descritti trovano difficile applicazione utilizzando gli strumenti a disposizione di ricercatori e ricercatrici, in quanto si tratta spesso di software e tool particolarmente specializzati, o specifici per un determinato formato di dati. Lo scopo di questo intervento è quindi quello di presentare un’idea di toolbox sviluppata in ambiente MATLAB che raggruppi gran parte dei passaggi di analisi dati sopra descritti. Verranno presentati alcuni casi studio in cui l’applicazione di tecniche ad intervalli per la risoluzione dei segnali ha fornito intepretazioni molto chiare e risultati confrontabili se non migliori rispetto all’approccio a spettro intero, e durante il cui sviluppo sono state codificate le funzioni di base della toolbox. Verrà inoltre posta molta attenzione alla questione dell’interpretazione dei risultati e delle feature estratte, oltre che alla loro corretta assegnazione chimica considerando diversi livelli di confidenza.File | Dimensione | Formato | |
---|---|---|---|
GIDRM_2022_Cavallini_BOA.pdf
accesso aperto
Tipologia:
Abstract
Licenza:
PUBBLICO - Tutti i diritti riservati
Dimensione
980.75 kB
Formato
Adobe PDF
|
980.75 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/11583/2981907