@ARTICLE{BIFFI_2023_ARTICLE_BGMS_490948, AUTHOR = {Biffi, M. and Guadagnini, E. and Montemagni, S. and Sassolini, E.}, TITLE = {Il lemmario del «GDLI»: dati quantitativi e prime osservazioni}, YEAR = {2023}, ABSTRACT = {Dopo la realizzazione della versione elettronica del solo testo del "Grande dizionario della lingua italiana" (GDLI), si è avviato un progetto di graduale informatizzazione della sua struttura. Questo articolo ne presenta il primo risultato, vale a dire l'estrazione automatica del lemmario che è così per la prima volta quantificabile e individuabile. Una prima parte del testo è dedicata all'illustrazione della strutturazione dei contenuti del dizionario e la loro rappresentazione secondo standard internazionalmente riconosciuti (XML-TEI); la seconda presenta una prima elaborazione dei dati del lemmario estratto; la terza propone una prima analisi comparativa con i lemmari di altri dizionari della lingua italiana.}, KEYWORDS = {Lessicografia, Lessicografia digitale, Lessicografia storica}, PAGES = {331-351}, URL = {https://accademiadellacrusca.it/it/riviste/articoli/slei-xl-2023/8679}, VOLUME = {40}, PUBLISHER = {Le Lettere (Firenze, Italia)}, ISSN = {0392-5218}, JOURNAL = {Studi di lessicografia italiana}, } @ARTICLE{BIFFI_2022_ARTICLE_BDFGMS_477716, AUTHOR = {Biffi, M. and De Blasi, F. and Favaro, M. and Guadagnini, E. and Montemagni, S. and Sassolini, E.}, TITLE = {Parole in rete / reti di parole. Possibili impieghi didattici dei grandi vocabolari storici digitalizzati}, YEAR = {2022}, ABSTRACT = {After a brief presentation of the great historical dictionaries of Italian, which are free to use online thanks to the digitalisation work carried out by the Accademia della Crusca, the contribution offers a number of examples of how these tools can be used for educational purposes. Finally, further didactic uses are described, which will be made possible thanks to the advanced digital tools that the Accademia della Crusca and the Istituto di Linguistica Computazionale "Antonio Zampolli" del Consiglio Nazionale delle Ricerche (ILC) are currently working on.}, KEYWORDS = {Lessicografia italiana, Didattica dell'italiano, Lessicografia digitale}, PAGES = {143-188}, URL = {https://italianoascuola.unibo.it/article/view/14866}, VOLUME = {4}, DOI = {10.6092/issn.2704-8128/14866}, PUBLISHER = {ABIS-AlmaDL (Bologna, Italia)}, ISSN = {2704-8128}, JOURNAL = {Italiano a scuola}, } @ARTICLE{BIFFI_2022_ARTICLE_BG_469340, AUTHOR = {Biffi, M. and Guadagnini, E.}, TITLE = {«Le citazioni riconducono il dizionario nell'ambito della letteratura e della vita»: un primo sguardo d'insieme sui citati del GDLI}, YEAR = {2022}, ABSTRACT = {Nel corso dei lavori di affinamento della versione informatizzata del Grande dizionario della lingua italiana, condotti dall'Accademia della Crusca in collaborazione con l'Istituto di linguistica computazionale (CNR-Pisa), è stato integralmente corretto e acquisito digitalmente l'Indice degli autori citati. Il contributo presenta alcuni dati, oggi disponibili per la prima volta grazie alla conversione in formato elettronico del vocabolario e della sua bibliografia, utili ad approfondire lo studio delle fonti impiegate nel Battaglia. Gli esempi citati nelle voci rappresentano, come è noto, il cuore del GDLI e insieme uno degli aspetti più intensamente discussi dagli studiosi. La percezione che si ha e si è avuta di questo aspetto del dizionario, tuttavia, non sempre corrisponde ai dati effettivi. Posta la mole del corpus delle allegazioni alle voci, infatti, soltanto la visione complessiva resa possibile dall'interrogazione digitale ne consente una valutazione oggettiva.}, KEYWORDS = {Lessicografia italiana, Storia della lingua italiana}, PAGES = {351-386}, URL = {https://accademiadellacrusca.it/it/riviste/articoli/slei-xxxix-2022/7599}, VOLUME = {XXXIX}, PUBLISHER = {Le Lettere (Firenze, Italia)}, ISSN = {0392-5218}, JOURNAL = {Studi di lessicografia italiana}, } @INPROCEEDINGS{SASSOLINI_2021_INPROCEEDINGS_SBDGM_455303, AUTHOR = {Sassolini, E. and Biffi, M. and De Blasi, F. and Guadagnini, E. and Montemagni, S.}, TITLE = {La digitalizzazione del GDLI: un approccio linguistico per la corretta acquisizione del testo?}, YEAR = {2021}, ABSTRACT = {In questo articolo sono discussi metodi e strategie in via di elaborazione per la correzione (propedeutica alla successiva strutturazione) dei contenuti del Grande dizionario della lingua italiana (GDLI) fondato da Salvatore Battaglia, estratti da un formato digitale non standard. La presenza, in questo formato, di errori distribuiti di vario tipo ha condizionato la scelta dell'approccio all'estrazione e messo in luce tutte le difficoltà dell'operazione. Le sperimentazioni fatte sino a oggi portano a privilegiare una strategia di correzione multilivello, che procede scomponendo in sezioni distinte l'individuazione e la correzione degli errori, in modo da rendere gestibili interventi complessi di correzione semi-automatica, altrimenti improponibili, e consentire un loro raffinamento progressivo. Parallelamente alla definizione di regole di riconoscimento di struttura e formato, stiamo analizzando metodi e procedure in grado di migliorare la qualità dell'input e specializzare i moduli di estrazione per i singoli campi della voce a partire dal "lemma". Le finalità del lavoro sono duplici: l'estrazione e strutturazione dei contenuti e la produzione di un formato standard di rappresentazione dei dati. Si tratta di un percorso difficile perché il formato dei dati rende l'uso di strumenti reperibili in letteratura non applicabile. Solamente al termine del lavoro potremo capire se esistono le condizioni per trasformare l'approccio adottato in un protocollo di intervento replicabile.}, KEYWORDS = {dizionari digitali, risorse linguistiche, estrazione dell'informazione, correzione del testo post OCR}, PAGES = {159-166}, URL = {https://aiucd2021.labcd.unipi.it/wp-content/uploads/2021/05/AIUCD2021_BOA-versione3A.pdf}, DOI = {10.6092/unibo/amsacta/6712}, ISBN = {9788894253559}, CONFERENCE_NAME = {AIUCD 2021-DH per la società: e-guaglianza, partecipazione, diritti e valori nell'era digitale}, CONFERENCE_PLACE = {Pisa}, CONFERENCE_DATE = {19-22/01/2021}, } @INPROCEEDINGS{SASSOLINI_2020_INPROCEEDINGS_SB_455300, AUTHOR = {Sassolini, E. and Biffi, M.}, TITLE = {Strategie e metodi per il recupero di dizionari storici}, YEAR = {2020}, ABSTRACT = {L'articolo descrive un approccio sperimentale all'estrazione, da formato digitale non standard, della completa struttura delle entrate lessicali del Grande Dizionario storico della Lingua Italiana (GDLI) di S. Battaglia. Sono riportati i risultati preliminari di una collaborazione tra l'Accademia della Crusca e Istituto di Linguistica Computazionale "A. Zampolli" del CNR, che mira a convertire i contenuti testuali in dati digitali strutturati per offrirli alla consultazione e allo studio degli utenti e/o per la successiva integrazione con altre risorse linguistiche, sia dizionari che corpora. Il processo di estrazione si articola da un lato nella definizione di procedure di estrazione dei dati, dall'altro nell'adozione di strategie finalizzate al supporto alla correzione degli errori.}, KEYWORDS = {Archivi digitali, recupero e conservazione, estrazione dell'informazione}, PAGES = {235-239}, URL = {https://publications.cnr.it/doc/455300}, DOI = {10.6092/unibo/amsacta/6316}, ISBN = {978-88-942535-4-2}, CONFERENCE_NAME = {IX Convegno annuale AIUCD: LA SVOLTA INEVITABILE: SFIDE E PROSPETTIVE PER L'INFORMATICA UMANISTICA}, CONFERENCE_PLACE = {Università Cattolica del Sacro Cuore, Milano}, CONFERENCE_DATE = {15-17/01/2020}, } @MISC{CUCURULLO_2008_MISC_CPB_151564, AUTHOR = {Cucurullo, S. and Picchi, E. and Biffi, M.}, TITLE = {Lessico italiano radiofonico 1995-2003}, YEAR = {2008}, KEYWORDS = {Lessico radiofonico, Corpus parlato}, URL = {https://publications.cnr.it/doc/151564}, }