@ARTICLE{BIFFI_2022_ARTICLE_BDFGMS_477716, 
 AUTHOR = {Biffi, M. and De Blasi, F. and Favaro, M. and Guadagnini, E. and Montemagni, S. and Sassolini, E.}, 
 TITLE = {Parole in rete / reti di parole. Possibili impieghi didattici dei grandi vocabolari storici digitalizzati}, 
 YEAR = {2022}, 
 ABSTRACT = {After a brief presentation of the great historical dictionaries of Italian, which are free to use online thanks to the digitalisation work carried out by the Accademia della Crusca, the contribution offers a number of examples of how these tools can be used for educational purposes. Finally, further didactic uses are described, which will be made possible thanks to the advanced digital tools that the Accademia della Crusca and the Istituto di Linguistica Computazionale "Antonio Zampolli" del Consiglio Nazionale delle Ricerche (ILC) are currently working on.}, 
 KEYWORDS = {Lessicografia italiana, Didattica dell'italiano, Lessicografia digitale}, 
 PAGES = {143-188}, 
 URL = {https://italianoascuola.unibo.it/article/view/14866}, 
 VOLUME = {4}, 
 DOI = {10.6092/issn.2704-8128/14866}, 
 PUBLISHER = {ABIS-AlmaDL (Bologna, Italia)}, 
 ISSN = {2704-8128}, 
 JOURNAL = {Italiano a scuola}, 
}

@INPROCEEDINGS{SASSOLINI_2021_INPROCEEDINGS_SBDGM_455303, 
 AUTHOR = {Sassolini, E. and Biffi, M. and De Blasi, F. and Guadagnini, E. and Montemagni, S.}, 
 TITLE = {La digitalizzazione del GDLI: un approccio linguistico per la corretta acquisizione del testo?}, 
 YEAR = {2021}, 
 ABSTRACT = {In questo articolo sono discussi metodi e strategie in via di elaborazione per la correzione (propedeutica alla successiva strutturazione) dei contenuti del Grande dizionario della lingua italiana (GDLI) fondato da Salvatore Battaglia, estratti da un formato digitale non standard. La presenza, in questo formato, di errori distribuiti di vario tipo ha condizionato la scelta dell'approccio all'estrazione e messo in luce tutte le difficoltà dell'operazione. Le sperimentazioni fatte sino a oggi portano a privilegiare una strategia di correzione multilivello, che procede scomponendo in sezioni distinte l'individuazione e la correzione degli errori, in modo da rendere gestibili interventi complessi di correzione semi-automatica, altrimenti improponibili, e consentire un loro raffinamento progressivo. Parallelamente alla definizione di regole di riconoscimento di struttura e formato, stiamo analizzando metodi e procedure in grado di migliorare la qualità dell'input e specializzare i moduli di estrazione per i singoli campi della voce a partire dal "lemma". Le finalità del lavoro sono duplici: l'estrazione e strutturazione dei contenuti e la produzione di un formato standard di rappresentazione dei dati. Si tratta di un percorso difficile perché il formato dei dati rende l'uso di strumenti reperibili in letteratura non applicabile. Solamente al termine del lavoro potremo capire se esistono le condizioni per trasformare l'approccio adottato in un protocollo di intervento replicabile.}, 
 KEYWORDS = {dizionari digitali, risorse linguistiche, estrazione dell'informazione, correzione del testo post OCR}, 
 PAGES = {159-166}, 
 URL = {https://aiucd2021.labcd.unipi.it/wp-content/uploads/2021/05/AIUCD2021_BOA-versione3A.pdf}, 
 DOI = {10.6092/unibo/amsacta/6712}, 
 ISBN = {9788894253559}, 
 CONFERENCE_NAME = {AIUCD 2021-DH per la società: e-guaglianza, partecipazione, diritti e valori nell'era digitale}, 
 CONFERENCE_PLACE = {Pisa}, 
 CONFERENCE_DATE = {19-22/01/2021}, 
}