Vai al contenuto

Elaborazioni audio per il patrimonio delle lingue minoritarie

Download

DESCRIZIONE RICERCA​

Macro-obiettivo del progetto Elaborazione Audio per il Patrimonio delle Lingue Minoritarie’ è la preservazione, la tutela e la promozione delle lingue di minoranza, che rappresentano un patrimonio immateriale a rischio di estinzione.

Con particolare attenzione alle isole linguistiche germaniche del Friuli Venezia Giulia, il Laboratorio di Comunicazione e Linguistica del Dipartimento di Studi Umanistici e del patrimonio culturale (DIUM) dell’Università di Udine ha creato due archivi digitali: ArDLiS per il saurano (https://archiviosauris.uniud.it/), parlato nella comunità di Sauris e ArDLiT per il timavese (https://archiviotimavese.uniud.it/), parlato a Timau, frazione del Comune di Paluzza, entrambi in provincia di Udine. Si è così creata una sinergia positiva tra l’ambito di ricerca umanistico e i metodi di lavoro di area informatica.

Lo sviluppo di metodi di trascrizione e annotazione semiautomatici e automatici, basati su un corpus ridotto di dati annotati manualmente, è stato reso possibile dall’utilizzo di architetture neurali di tipo Transformer per apprendere modelli multilingue di testo e parlato, insieme a metodi per mettere a punto le rappresentazioni generali ricavate.

Per entrare nello specifico, un modello viene addestrato con molte ore di parlato in tante lingue; il suo compito è quello di sviluppare una rappresentazione generale ed efficace che leghi le caratteristiche acustiche del parlato a quelle dei testi associati. In questa prima fase, unico obiettivo del modello è di costruire queste caratteristiche. Solo in una fase successiva, questa “rappresentazione generale” viene utilizzata e “fine-tuned” (affinata) per un compito specifico, ovvero selezionando una specifica lingua e uno specifico obiettivo (traduzione da una lingua all’altra, produzione di una voce sintetica, trascrizione di registrazioni vocali come nel nostro caso, etc..).

Il progetto ‘Elaborazione Audio per il Patrimonio delle Lingue Minoritarie’ si occupa infatti della messa a punto del modello Wav2Vec2 pre-addestrato per il riconoscimento vocale automatico con esperimenti su un corpus nella varietà germanica di Sauris/Zahre.

Il progetto si è avvalso di API HuggingFace e del modello multilingue XLS-R pre-addestrato: è stato messo a punto un dataset in saurano (de zahrar sproche) composto da  circa 2 ore di parlato controllato prodotto da sei parlanti e trascritto manualmente.

I risultati ottenuti si riveleranno di grande utilità sia per la tutela e la valorizzazione del codice di minoranza, sia per la ricerca di ambito linguistico, sia per approfondire alcune questioni aperte nel campo del riconoscimento vocale automatico (ASR), come ad esempio la valutazione della consistenza minima necessaria di un corpus per l’allenamento e in che modo gli iperparametri di messa a punto influiscono in modo diverso sui diversi corpora linguistici. 

PROJECT TEAM