[{"id":366730,"last_updated":"2024-01-10 11:01:36","id_people":490948,"institutes":["ILC"],"type":"journal_article","type_order":0,"type_people":"article","title":"Il lemmario del \u00abGDLI\u00bb: dati quantitativi e prime osservazioni","year":2023,"authors_people":"Marco Biffi, Elisa Guadagnini, Simonetta Montemagni ed Eva Sassolini","authors_cnr":["Montemagni, Simonetta","Sassolini, Eva","Guadagnini, Elisa"],"authors_cnr_id":["5595","11032","12720"],"authors_cnr_institute":[""],"authors":["Biffi, M.","Guadagnini, E.","Montemagni, S.","Sassolini, E."],"abstract":"Dopo la realizzazione della versione elettronica del solo testo del \"Grande dizionario della lingua italiana\" (GDLI), si \u00e8 avviato un progetto di graduale informatizzazione della sua struttura. Questo articolo ne presenta il primo risultato, vale a dire l'estrazione automatica del lemmario che \u00e8 cos\u00ec per la prima volta quantificabile e individuabile. Una prima parte del testo \u00e8 dedicata all'illustrazione della strutturazione dei contenuti del dizionario e la loro rappresentazione secondo standard internazionalmente riconosciuti (XML-TEI); la seconda presenta una prima elaborazione dei dati del lemmario estratto; la terza propone una prima analisi comparativa con i lemmari di altri dizionari della lingua italiana.","keywords":["Lessicografia","Lessicografia digitale","Lessicografia storica"],"pages":"331-351","url":"https:\/\/accademiadellacrusca.it\/it\/riviste\/articoli\/slei-xl-2023\/8679","volume":"40","doi":"","editors_people":"","editors":[""],"published":"Studi di lessicografia italiana","publisher":"Le Lettere (Firenze, Italia)","issn":"0392-5218","isbn":"","conference_name":"","conference_place":"","conference_date":""},{"id":354899,"last_updated":"2023-04-19 15:24:29","id_people":477716,"institutes":["ILC"],"type":"journal_article","type_order":0,"type_people":"article","title":"Parole in rete \/ reti di parole. Possibili impieghi didattici dei grandi vocabolari storici digitalizzati","year":2022,"authors_people":"Marco Biffi, Francesca De Blasi, Manuel Favaro, Elisa Guadagnini, Simonetta Montemagni e Eva Sassolini","authors_cnr":["Favaro, Manuel","De Blasi, Francesca","Montemagni, Simonetta","Sassolini, Eva","Guadagnini, Elisa"],"authors_cnr_id":["5595","11032","12720"],"authors_cnr_institute":[""],"authors":["Biffi, M.","De Blasi, F.","Favaro, M.","Guadagnini, E.","Montemagni, S.","Sassolini, E."],"abstract":"After a brief presentation of the great historical dictionaries of Italian, which are free to use online thanks to the digitalisation work carried out by the Accademia della Crusca, the contribution offers a number of examples of how these tools can be used for educational purposes. Finally, further didactic uses are described, which will be made possible thanks to the advanced digital tools that the Accademia della Crusca and the Istituto di Linguistica Computazionale \"Antonio Zampolli\" del Consiglio Nazionale delle Ricerche (ILC) are currently working on.","keywords":["Lessicografia italiana","Didattica dell'italiano","Lessicografia digitale"],"pages":"143-188","url":"https:\/\/italianoascuola.unibo.it\/article\/view\/14866","volume":"4","doi":"10.6092\/issn.2704-8128\/14866","editors_people":"","editors":[""],"published":"Italiano a scuola","publisher":"ABIS-AlmaDL (Bologna, Italia)","issn":"2704-8128","isbn":"","conference_name":"","conference_place":"","conference_date":""},{"id":340714,"last_updated":"2022-07-22 09:30:36","id_people":469340,"institutes":["ILC"],"type":"journal_article","type_order":0,"type_people":"article","title":"\u00abLe citazioni riconducono il dizionario nell'ambito della letteratura e della vita\u00bb: un primo sguardo d'insieme sui citati del GDLI","year":2022,"authors_people":"Marco Biffi, Elisa Guadagnini","authors_cnr":["Guadagnini, Elisa"],"authors_cnr_id":["12720"],"authors_cnr_institute":[""],"authors":["Biffi, M.","Guadagnini, E."],"abstract":"Nel corso dei lavori di affinamento della versione informatizzata del Grande dizionario della lingua italiana, condotti dall'Accademia della Crusca in collaborazione con l'Istituto di linguistica computazionale (CNR-Pisa), \u00e8 stato integralmente corretto e acquisito digitalmente l'Indice degli autori citati. Il contributo presenta alcuni dati, oggi disponibili per la prima volta grazie alla conversione in formato elettronico del vocabolario e della sua bibliografia, utili ad approfondire lo studio delle fonti impiegate nel Battaglia. Gli esempi citati nelle voci rappresentano, come \u00e8 noto, il cuore del GDLI e insieme uno degli aspetti pi\u00f9 intensamente discussi dagli studiosi. La percezione che si ha e si \u00e8 avuta di questo aspetto del dizionario, tuttavia, non sempre corrisponde ai dati effettivi. Posta la mole del corpus delle allegazioni alle voci, infatti, soltanto la visione complessiva resa possibile dall'interrogazione digitale ne consente una valutazione oggettiva.","keywords":["Lessicografia italiana","Storia della lingua italiana"],"pages":"351-386","url":"https:\/\/accademiadellacrusca.it\/it\/riviste\/articoli\/slei-xxxix-2022\/7599","volume":"XXXIX","doi":"","editors_people":"","editors":[""],"published":"Studi di lessicografia italiana","publisher":"Le Lettere (Firenze, Italia)","issn":"0392-5218","isbn":"","conference_name":"","conference_place":"","conference_date":""},{"id":132456,"last_updated":"2022-02-17 18:43:13","id_people":455303,"institutes":["ILC"],"type":"conference_article","type_order":5,"type_people":"conferenceObject","title":"La digitalizzazione del GDLI: un approccio linguistico per la corretta acquisizione del testo?","year":2021,"authors_people":"Sassolini Eva, Biffi Marco, De Blasi Francesca, Guadagnini Elisa, Montemagni Simonetta","authors_cnr":["De Blasi, Francesca","Montemagni, Simonetta","Sassolini, Eva","Guadagnini, Elisa"],"authors_cnr_id":["5595","11032","12720"],"authors_cnr_institute":[""],"authors":["Sassolini, E.","Biffi, M.","De Blasi, F.","Guadagnini, E.","Montemagni, S."],"abstract":"In questo articolo sono discussi metodi e strategie in via di elaborazione per la correzione (propedeutica alla successiva strutturazione) dei contenuti del Grande dizionario della lingua italiana (GDLI) fondato da Salvatore Battaglia, estratti da un formato digitale non standard. La presenza, in questo formato, di errori distribuiti di vario tipo ha condizionato la scelta dell'approccio all'estrazione e messo in luce tutte le difficolt\u00e0 dell'operazione. Le sperimentazioni fatte sino a oggi portano a privilegiare una strategia di correzione multilivello, che procede scomponendo in sezioni distinte l'individuazione e la correzione degli errori, in modo da rendere gestibili interventi complessi di correzione semi-automatica, altrimenti improponibili, e consentire un loro raffinamento progressivo. Parallelamente alla definizione di regole di riconoscimento di struttura e formato, stiamo analizzando metodi e procedure in grado di migliorare la qualit\u00e0 dell'input e specializzare i moduli di estrazione per i singoli campi della voce a partire dal \"lemma\". Le finalit\u00e0 del lavoro sono duplici: l'estrazione e strutturazione dei contenuti e la produzione di un formato standard di rappresentazione dei dati. Si tratta di un percorso difficile perch\u00e9 il formato dei dati rende l'uso di strumenti reperibili in letteratura non applicabile. Solamente al termine del lavoro potremo capire se esistono le condizioni per trasformare l'approccio adottato in un protocollo di intervento replicabile.","keywords":["dizionari digitali","risorse linguistiche","estrazione dell'informazione","correzione del testo post OCR"],"pages":"159-166","url":"https:\/\/aiucd2021.labcd.unipi.it\/wp-content\/uploads\/2021\/05\/AIUCD2021_BOA-versione3A.pdf","volume":"","doi":"10.6092\/unibo\/amsacta\/6712","editors_people":"","editors":[""],"published":"","publisher":"","issn":"","isbn":"9788894253559","conference_name":"AIUCD 2021-DH per la societ\u00e0: e-guaglianza, partecipazione, diritti e valori nell'era digitale","conference_place":"Pisa","conference_date":"19-22\/01\/2021"},{"id":132455,"last_updated":"2021-07-16 09:05:16","id_people":455300,"institutes":["ILC"],"type":"conference_article","type_order":5,"type_people":"conferenceObject","title":"Strategie e metodi per il recupero di dizionari storici","year":2020,"authors_people":"Sassolini Eva, Biffi Marco","authors_cnr":["Sassolini, Eva"],"authors_cnr_id":["11032"],"authors_cnr_institute":[""],"authors":["Sassolini, E.","Biffi, M."],"abstract":"L'articolo descrive un approccio sperimentale all'estrazione, da formato digitale non standard, della completa struttura delle entrate lessicali del Grande Dizionario storico della Lingua Italiana (GDLI) di S. Battaglia. Sono riportati i risultati preliminari di una collaborazione tra l'Accademia della Crusca e Istituto di Linguistica Computazionale \"A. Zampolli\" del CNR, che mira a convertire i contenuti testuali in dati digitali strutturati per offrirli alla consultazione e allo studio degli utenti e\/o per la successiva integrazione con altre risorse linguistiche, sia dizionari che corpora. Il processo di estrazione si articola da un lato nella definizione di procedure di estrazione dei dati, dall'altro nell'adozione di strategie finalizzate al supporto alla correzione degli errori.","keywords":["Archivi digitali","recupero e conservazione","estrazione dell'informazione"],"pages":"235-239","url":"https:\/\/publications.cnr.it\/doc\/455300","volume":"","doi":"10.6092\/unibo\/amsacta\/6316","editors_people":"","editors":[""],"published":"","publisher":"","issn":"","isbn":"978-88-942535-4-2","conference_name":"IX Convegno annuale AIUCD: LA SVOLTA INEVITABILE: SFIDE E PROSPETTIVE PER L'INFORMATICA UMANISTICA","conference_place":"Universit\u00e0 Cattolica del Sacro Cuore, Milano","conference_date":"15-17\/01\/2020"},{"id":131438,"last_updated":"2009-09-24 00:00:00","id_people":151564,"institutes":["ILC"],"type":"misc","type_order":12,"type_people":"other","title":"Lessico italiano radiofonico 1995-2003","year":2008,"authors_people":"Cucurullo S., Picchi E., Biffi M.","authors_cnr":["Cucurullo, Sebastiana","Picchi, Eugenio"],"authors_cnr_id":["16688"],"authors_cnr_institute":[""],"authors":["Cucurullo, S.","Picchi, E.","Biffi, M."],"abstract":"","keywords":["Lessico radiofonico","Corpus parlato"],"pages":"","url":"https:\/\/publications.cnr.it\/doc\/151564","volume":"","doi":"","editors_people":"","editors":[""],"published":"","publisher":"","issn":"","isbn":"","conference_name":"","conference_place":"","conference_date":""}]