Messa a punto del modello Wav2Vec2 preaddestrato
Ricerca
Messa a punto del modello Wav2Vec2 preaddestrato
per il riconoscimento vocale automatico: esperimenti su un corpusnella varietà germanica di Sauris/Zahre
Responsabile scientifico: Raffaella Bombi
L'uso di architetture neurali di tipo Transformer per apprendere modelli multilingue di testo e parlato, insieme a metodi per mettere a punto queste rappresentazioni generali, ha aperto la possibilità allo sviluppo di metodi di trascrizione e annotazione semiautomatici e automatici, basati su corpus ridotto di dati annotati manualmente. L’utilizzo di questi strumenti si rivela di grande utilità per la preservazione, la tutela e la promozione delle lingue di minoranza, che rappresentano un patrimonio immateriale a rischio di estinzione. Con particolare attenzione alle isole linguistiche germaniche del Friuli Venezia Giulia, il Laboratorio di Comunicazione e Linguistica del DIUM dell'Università di Udine ha creato due archivi digitali: ArDLiS per il saurano e ArDLiT per il timavese,creando una sinergia positiva tra questo ambito di ricerca umanistico e i metodi di lavoro di area informatica. Il nostro progetto si è avvalso di API HuggingFace e del modello multilingue XLS-R pre-addestrato, che è stato messo a punto un dataset in saurano (de zahrar sproche) formato da circa 2 ore di parlato controllato prodotto da sei parlanti e trascritto manualmente. I risultati ottenuti si riveleranno di grande utilità sia per la tutela e la valorizzazione del codice di minoranza, sia per la ricerca di ambito linguistico, sia per approfondire alcune questioni aperte nel campo del riconoscimento vocale automatico (ASR), come ad esempio la valutazione della consistenza minima necessaria di un corpus per l'allenamento e in che modo gli iperparametri di messa a punto influiscono in modo diverso sui diversi corpora linguistici.