Messa a punto del modello Wav2Vec2 preaddestrato

Messa a punto del modello Wav2Vec2 preaddestrato
per il riconoscimento vocale automatico: esperimenti su un corpusnella varietà germanica di Sauris/Zahre

Responsabile scientifico: Raffaella Bombi

Tag:

comunicazione digital fvg intelligenza artificiale linguistica società tecnologia territorio

Messa a punto del modello Wav2Vec2 preaddestrato per il riconoscimento vocale automatico

L'uso di architetture neurali di tipo Transformer per apprendere modelli multilingue di testo e parlato, insieme a metodi per mettere a punto queste rappresentazioni generali, ha aperto la possibilità allo sviluppo di metodi di trascrizione e annotazione semiautomatici e automatici, basati su corpus ridotto di dati annotati manualmente. L’utilizzo di questi strumenti si rivela di grande utilità per la preservazione, la tutela e la promozione delle lingue di minoranza, che rappresentano un patrimonio immateriale a rischio di estinzione. Con particolare attenzione alle isole linguistiche germaniche del Friuli Venezia Giulia, il Laboratorio di Comunicazione e Linguistica del DIUM dell'Università di Udine ha creato due archivi digitali: ArDLiS per il saurano e ArDLiT per il timavese,creando una sinergia positiva tra questo ambito di ricerca umanistico e i metodi di lavoro di area informatica. Il nostro progetto si è avvalso di API HuggingFace e del modello multilingue XLS-R pre-addestrato, che è stato messo a punto un dataset in saurano (de zahrar sproche) formato da circa 2 ore di parlato controllato prodotto da sei parlanti e trascritto manualmente. I risultati ottenuti si riveleranno di grande utilità sia per la tutela e la valorizzazione del codice di minoranza, sia per la ricerca di ambito linguistico, sia per approfondire alcune questioni aperte nel campo del riconoscimento vocale automatico (ASR), come ad esempio la valutazione della consistenza minima necessaria di un corpus per l'allenamento e in che modo gli iperparametri di messa a punto influiscono in modo diverso sui diversi corpora linguistici.

Unità di ricerca

Raffaella Bombi

Messa a punto del modello Wav2Vec2 preaddestrato

Research