@ARTICLE{PAPINI_2025_ARTICLE_PG_557903, AUTHOR = {Papini, M. and Giovannetti, E.}, TITLE = {The Challenge of the Talmud in Italian: Tools and Computational Linguistics in the Service of Translation}, YEAR = {2025}, ABSTRACT = {The translation of the Babylonian Talmud into Italian constitutes a true challenge. To address the numerous issues posed by translating such a vast and complex text, the Traduco system was developed to support translators through collaborative features, a translation memory, distributional semantics, glossary management, and annotation tools. Additionally, recent experiments have explored the integration of large language models to assist in the translation and the construction of a Talmud Knowledge Base designed to provide a formal representation of the terminological and conceptual data identified in the Talmud}, KEYWORDS = {Computer-Assisted Translation, Translation Memory, Babylonian Talmud, Traduco, Large Language Models}, PAGES = {135-154}, URL = {http://doi.org/10.30687/TranScript/5876-7987}, VOLUME = {4}, DOI = {10.30687/TranScript}, ISSN = {5876-7987}, JOURNAL = {TRANSCRIPT}, } @INPROCEEDINGS{PAPINI_2025_INPROCEEDINGS_PADGM_544703, AUTHOR = {Papini, M. and Albanesi, D. and Dattilo, D. and Giovannetti, E. and Marchi, S.}, TITLE = {Experiments on the Use of LLMs for the Translation of the Babylonian Talmud}, YEAR = {2025}, ABSTRACT = {In this paper, we present an experiment on the use of Large Language Models (LLMs) in the translation of the Babylonian Talmud into Italian. The experiment focuses on translation and demonstrates how the combined use of LLMs and Translation Memory can improve the quality of suggested translations in a Computer-Assisted Translation context. The initial results highlight both the positive contribution of this hybrid technique and the limitations posed by the nature of complex texts like the Babylonian Talmud, whose translation can only be interpretative}, KEYWORDS = {Babylonian Talmud, Computer Assisted Translation, Large Language Models, Artificial Intelligence, Talmud Babilonese, Traduzione Assistita dal Computer, Modelli di Linguaggio di Grandi Dimensioni, Intelligenza Artificiale}, PAGES = {363-367}, URL = {https://aiucd2025.dlls.univr.it/assets/pdf/papers/58.pdf}, VOLUME = {DIVERSITÀ, EQUITÀ E INCLUSIONE: SFIDE E OPPORTUNITÀ PER L’INFORMATICA UMANISTICA NELL’ERA DELL’INTELLIGENZA ARTIFICIALE, PROCEEDINGS DEL XIV CONVEGNO ANNUALE AIUCD2025}, DOI = {10.6092/unibo/amsacta/8380}, ISBN = {978-88-942535-9-7}, CONFERENCE_NAME = {Diversità, Equità e Inclusione: Sfide e Opportunità per l’Informatica Umanistica nell’Era dell’Intelligenza Artificiale. XIV Convegno Annuale AIUCD2025}, BOOKTITLE = {Diversità, Equità e Inclusione: Sfide e Opportunità per l’Informatica Umanistica nell’Era dell’Intelligenza Artificiale, Proceedings del XIV Convegno Annuale AIUCD2025}, } @TECHREPORT{ALBANESI_2025_TECHREPORT_AGMPS_544743, AUTHOR = {Albanesi, D. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 27}, YEAR = {2025}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l’attività svolta da CNR-ILC nel contesto del Progetto Traduzione Talmud Babilonese nel periodo gennaio 2025-maggio 2025. Le principali attività tecniche svolte sul sistema Traduco attualmente in produzione hanno riguardato l’aggiornamento di alcune funzionalità. Sul fronte della ricerca è proseguito il lavoro sulla terminologia talmudica finalizzato all’integrazione delle voci terminologiche con il lessico della lingua italiana. Infine, sono proseguite le attività sperimentali di Intelligenza Artificiale con l’uso dei Large Language Models, in particolare sul fronte del supporto alla traduzione}, KEYWORDS = {Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, traduzione assistita dal calcolatore, Large Language Models, Intelligenza Artificiale}, URL = {https://iris.cnr.it/handle/20.500.14243/544743}, } @ARTICLE{GIOVANNETTI_2024_ARTICLE_GABMPS_506221, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Maia: an Open Collaborative Platform for Text Annotation, E-Lexicography, and Lexical Linking}, YEAR = {2024}, ABSTRACT = {Although open tools for manual text annotation and the creation of lexical resources have been available for some years, there is currently no integrated tool that allows, within the same environment, annotating a text corpus, building a computational lexicon, and linking linguistic annotations to lexical elements. For this reason, we have developed Maia, an open and collaborative web tool based on semantic web and linked open data technologies for text annotation, e-lexicography, and lexical linking, primarily designed and developed for use by digital humanists. This article presents the first version of Maia, describing its functionality, and outlining its software architecture and development prospects}, KEYWORDS = {Text Annotation, E-Lexicography, Lexical Linking, Computational Lexicons, Linguistic Resources, Linguistic Linked Open Data, OntoLex-Lemon, Maia, Annotazione del testo, lessicografia digitale, lexical linking, lessici computazionali, risorse linguistiche, Linguistic Linked Open Data, OntoLex-Lemon, Maia}, PAGES = {27-52}, URL = {https://umanisticadigitale.unibo.it/article/view/19705}, VOLUME = {18}, ISSN = {2532-8816}, JOURNAL = {UMANISTICA DIGITALE}, } @ARTICLE{SCIOLETTE_2024_ARTICLE_SBGM_519970, AUTHOR = {Sciolette, F. and Bellandi, A. and Giovannetti, E. and Marchi, S.}, TITLE = {CompL-it: a Computational Lexicon of Italian Language}, YEAR = {2024}, ABSTRACT = {This paper describes CompL-it, a new open computational lexicon for contemporary Italian. The resource was constructed from three sources: an already available Italian lexicon, a lemmatized list of inflected forms obtained from a morphological analyzer, and a set of treebanks. Integrating these resources required a standardisation process in accordance with the standards of the Linguistic Linked Open Data community, which was necessary for the subsequent conversion into the OntoLex-Lemon model. The resulting computational lexicon comprises approximately 100, 000 lexical entries, 790, 000 forms, 57, 000 senses, and 86, 000 semantic relations. The lexicon, thanks to its rich and articulated linguistic structure, can be used, as shown, to enhance information retrieval in the context of full-text search tasks}, KEYWORDS = {Computational Lexicon, Linguistic Resources, Linguistic Linked Open Data, OntoLex-Lemon, Information Retrieval}, PAGES = {119-148}, URL = {https://www.aidainformazioni.it/index.php/aidainformazioni/article/view/315}, VOLUME = {42 (3-4)}, ISSN = {1121-0095}, JOURNAL = {AIDA INFORMAZIONI}, } @TECHREPORT{ALBANESI_2024_TECHREPORT_ABGMPS_544741, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 25}, YEAR = {2024}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l’attività svolta da CNR-ILC nel contesto del Progetto Traduzione Talmud Babilonese nel periodo gennaio 2024-luglio 2024. Le principali attività tecniche svolte sul sistema Traduco attualmente in produzione hanno riguardato l’aggiornamento di alcune funzionalità. Parallelamente, in continuità alle attività descritte nel documento di SAL precedente, è proseguito il lavoro di ricerca e sviluppo sui fronti della realizzazione della nuova versione di Traduco e sull’ampliamento della risorsa lessicale per l’italiano contemporaneo a supporto della funzionalità di ricerca full-text sul testo del Talmud tradotto in italiano. Inoltre, sempre in relazione alle tecnologie per l’accesso semantico alla traduzione, è stata avviata una attività di sperimentazione dell’uso di Large Language Models}, KEYWORDS = {Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, traduzione assistita dal calcolatore, Large Language Models}, URL = {https://iris.cnr.it/handle/20.500.14243/544741}, } @TECHREPORT{ALBANESI_2024_TECHREPORT_AGMPS_544742, AUTHOR = {Albanesi, D. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 26}, YEAR = {2024}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l’attività svolta da CNR-ILC nel contesto del Progetto Traduzione Talmud Babilonese nel periodo agosto 2024-dicembre 2024. Le principali attività tecniche svolte sul sistema Traduco attualmente in produzione hanno riguardato l’aggiornamento di alcune funzionalità. In continuità alle attività descritte nel documento di SAL precedente è stato concluso il lavoro di sviluppo che ha portato alla realizzazione della nuova versione di Traduco. Sul fronte della ricerca è proseguito il lavoro sulla terminologia talmudica finalizzato all’integrazione delle voci terminologiche con il lessico della lingua italiana. Infine, sono proseguite le attività sperimentali di Intelligenza Artificiale con l’uso dei Large Language Models, in particolare sul fronte dell’accesso intelligente al testo talmudico}, KEYWORDS = {Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, traduzione assistita dal calcolatore, Large Language Models, Intelligenza Artificiale, question answering}, URL = {https://iris.cnr.it/handle/20.500.14243/544742}, } @MISC{SCIOLETTE_2024_MISC_SGMB_530422, AUTHOR = {Sciolette, F. and Giovannetti, E. and Marchi, S. and Bellandi, A.}, TITLE = {CompL-it}, YEAR = {2024}, ABSTRACT = {CompL-it is a computational lexicon for Italian derived from LexicO (https: //dspace-clarin-it. ilc. cnr. it/repository/xmlui/handle/20. 500. 11752/ILC-977), with the integration of following resources:-M-GLF (https: //dspace-clarin-it. ilc. cnr. it/repository/xmlui/handle/20. 500. 11752/ILC-1002), a list of lemmatized forms generated by the morphological analyzer MAGIC (Battista and Pirrelli, 1999, Pirrelli and Battista 2000);-a set of treebanks for Italian (contained in https: //lindat. cz/repository/xmlui/handle/11234/1-4611):-ISDT;-VIT;-ParTUT;-ParlaMint-it. The resource contains a morphological layer (including lemmas, inflected forms, and morphological features) and a semantic layer (including senses and relations between them). Entries are encoded according to the OntoLex-Lemon model and made available as a semantic repository}, KEYWORDS = {morphology, semantics, computational lexicon, linked open data}, URL = {https://iris.cnr.it/handle/20.500.14243/530422}, } @ARTICLE{SCIOLETTE_2023_ARTICLE_SMG_462840, AUTHOR = {Sciolette, F. and Marchi, S. and Giovannetti, E.}, TITLE = {LexicO: an Italian Computational Lexicon derived from Parole-Simple-Clips}, YEAR = {2023}, ABSTRACT = {Parole-Simple-Clips (PSC) is a computational lexicon of the Italian language, developed from1996 to 2003 by the Institute of Computational Linguistics of the Italian National ResearchCouncil (ILC-CNR) in the context of national and European projects. The PSC resource isstrongly structured, rich of data, and, for its features, may provide an edge if used in the supportof text retrieval related tasks, such as full-text search. However, the lexicon still appears incompleteand presents some redundant, erroneous and missing data. This paper documents the first stepsundertaken for the creation of LexicO, an Italian computational lexicon built upon PSC startingfrom an in depth analysis of its four linguistic layers (semantic, syntactic, morphological, andphonological) in which it is structured. As a result of this work, LexicO has been released andmade freely available}, KEYWORDS = {Computational Lexicon, Parole-Simple-Clips, Linguistic Resources, Full-text Search, LexicO}, PAGES = {24}, URL = {https://iris.cnr.it/handle/20.500.14243/462840}, VOLUME = {15}, DOI = {10.6092/issn.2532-8816/15176}, ISSN = {2532-8816}, JOURNAL = {UMANISTICA DIGITALE}, } @INCOLLECTION{GIOVANNETTI_2023_INCOLLECTION_GSS_475249, AUTHOR = {Giovannetti, E. and Saponaro, D. and Sciolette, F.}, TITLE = {Una rappresentazione computazionale della diversità religiosa in una prospettiva terminologica e concettuale}, YEAR = {2023}, PAGES = {497-536}, URL = {https://iris.cnr.it/handle/20.500.14243/475249}, VOLUME = {46}, DOI = {10.7410/1677}, ISBN = {978-88-97317-81-4}, BOOKTITLE = {Storie di idee nell'Europa mediterranea}, } @INPROCEEDINGS{SCIOLETTE_2023_INPROCEEDINGS_SMG_452910, AUTHOR = {Sciolette, F. and Marchi, S. and Giovannetti, E.}, TITLE = {Towards a New Computational Lexicon for Italian: building the morphological layer by harmonizing and merging existing resources}, YEAR = {2023}, ABSTRACT = {The present work illustrates the first steps towards the construction of a new computational lexicon for the Italian language. Following an analysis of existing lexical resources, it was decided to use LexicO as the reference base. In this first phase a resource of nearly 800, 000 inflected forms was produced, accompanied by lemmas and morphological traits, obtained by integrating the available data in LexicO with those coming from two support sources: the tool MAGIC and a selection of Italian treebanks}, KEYWORDS = {computational lexicon, lexical resources, morphology, morphological harmonization}, PAGES = {5}, URL = {https://ceur-ws.org/Vol-3596/short20.pdf}, CONFERENCE_NAME = {9th Italian Conference on Computational Linguistics}, BOOKTITLE = {Proceedings of the 9th Italian Conference on Computational Linguistics}, EDITOR = {Boschetti, F. and Lebani, G. E. and Magnini, B. and Novielli, N.}, } @TECHREPORT{ALBANESI_2023_TECHREPORT_ABGMPS_544724, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 24}, YEAR = {2023}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l’attività svolta da CNR-ILC nel contesto del Progetto Traduzione Talmud Babilonese nel periodo luglio 2023-dicembre 2023. Le principali attività tecniche svolte sul sistema Traduco attualmente in produzione hanno riguardato l’aggiornamento di alcune funzionalità. Parallelamente, in continuità alle attività descritte nel documento di SAL precedente, è proseguito il lavoro di ricerca e sviluppo su due fronti: i) la realizzazione della nuova versione di Traduco, ii) l’ampliamento della risorsa lessicale per l’italiano contemporaneo a supporto della funzionalità di ricerca full-text sul testo del Talmud tradotto in italiano}, KEYWORDS = {Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, traduzione assistita dal calcolatore}, URL = {https://iris.cnr.it/handle/20.500.14243/544724}, } @TECHREPORT{ALBANESI_2023_TECHREPORT_AGMPS_452915, AUTHOR = {Albanesi, D. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 23}, YEAR = {2023}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo gennaio 2023-giugno 2023. Le principali attività tecniche svolte sul sistema Traduco attualmente in produzione sono state la risoluzione di bug e l'aggiornamento di alcune funzionalità. Parallelamente, è proseguito il lavoro di ricerca e sviluppo su due fronti: i) la realizzazione della nuova versione di Traduco, ii) l'ampliamento della risorsa lessicale per l'italiano contemporaneo a supporto della funzionalità di ricerca full-text sul testo del Talmud tradotto in italiano}, KEYWORDS = {Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, traduzione assistita dal calcolatore}, PAGES = {13}, URL = {https://iris.cnr.it/handle/20.500.14243/452915}, } @MISC{GIOVANNETTI_2023_MISC_GABCGMPS_452912, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Carniani, E. and Guidi, L. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Maia}, YEAR = {2023}, ABSTRACT = {Maia is an open and collaborative web tool based on semantic web and linked open data technologies for text annotation, e-lexicography, and lexical linking}, KEYWORDS = {maia, linked open data, e-lexicography, text annotation, lexical linking, collaborative tools}, URL = {https://github.com/klab-ilc-cnr/Maia}, } @ARTICLE{SAPONARO_2022_ARTICLE_SGS_455990, AUTHOR = {Saponaro, D. and Giovannetti, E. and Sciolette, F.}, TITLE = {From Religious Sources to Computational Resources: Approach and Case Study on Hebrew Terms and Concepts}, YEAR = {2022}, ABSTRACT = {This paper introduces a methodology for the creation of a digital representation of a religious case study integrating textual, linguistic, and conceptual entities. the description of a holistic model of text, to be used as the backbone of the computational resource that needs to be built, is provided. the proposed case study, focusing on the semantic field of "face" in Jewish religion, is first introduced from the point of view of the scholar and then translated, with the support of digital tools, into the relative computational representation}, KEYWORDS = {religious studies, Hebrew terminology, ontology}, PAGES = {21}, URL = {https://iris.cnr.it/handle/20.500.14243/455990}, VOLUME = {XXVII(2022)}, ISSN = {2282-4499}, JOURNAL = {MATERIA GIUDAICA}, } @INCOLLECTION{SCIOLETTE_2022_INCOLLECTION_SG_447932, AUTHOR = {Sciolette, F. and Giovannetti, E.}, TITLE = {Un modello per domarli tutti: verso una rappresentazione del testo come esplicitazione di documento, lingua e contenuto}, YEAR = {2022}, ABSTRACT = {The aim of this research is to describe the first steps towards the theoretical elaboration of a holistic model to represent textual information. The focus of the model is the definition of "text", with its different dimensions, as a "diasystem". The set of elements, organized into distinct but strictly interconnected systems, wherein each element has an effect on the whole diasystem, is described in a model structured in the following components: graphic, linguistic, documental, discursive, and conceptual. In this work, the first attempts in the modeling of text will be shown through two case studies: the Babylonian Talmud and the DiTMAO (Dictionary of Old Occitan medico-botanical terminology)}, KEYWORDS = {textual model, holystic model, diasystem, model of text}, PAGES = {145-157}, URL = {http://www.aitla.it/images/pdf/StudiAItLA14/009_AItLA14_ScioletteGiovannetti.pdf}, PUBLISHER = {Officinaventuno (Milano, ITA)}, ISBN = {978-88-97657-51-4}, CONFERENCE_PLACE = {Milano}, BOOKTITLE = {Fare linguistica applicata con le digital humanities}, EDITOR = {Saturno, J. and Spreafico, L.}, } @INPROCEEDINGS{COLOMBO_2022_INPROCEEDINGS_CG_443112, AUTHOR = {Colombo, M. and Giovannetti, E.}, TITLE = {La Visualizzazione Grafica di Sensi e Relazioni Semantiche di un Lessico Computazionale della Lingua Italiana}, YEAR = {2022}, ABSTRACT = {La visualizzazione, intesa come ausilio alla consultazione e alla ricerca, può giocare un ruolo fondamentale nella fruizionedi dati linguistici e di conoscenza. Attraverso la rappresentazione di una risorsa lessicale o di una ontologia sotto forma digrafo, ad esempio, uno studioso ha la possibilità di farsi un'idea immediata delle relazioni che intercorrono tra i varielementi di un lessico (di lingua o specialistico) o dei concetti che formalizzano un determinato dominio. In questocontributo presentiamo un'applicazione web based per la visualizzazione grafica della componente semantica di un lessicocomputazionale dell'italiano. Il grafo è stato sviluppato con Cytoscape. js, una libreria Javascript per la creazione di grafi. L'interfaccia al grafo, sviluppata come applicazione Angular, offre un primo insieme di funzionalità di interazione per lanavigazione e la manipolazione della risorsa lessico-semantica}, KEYWORDS = {human-computer interaction, lessico computazionale, grafi, Visualizzazione grafica di risorse linguistiche, rappresentazione della conoscenza}, PAGES = {155-160}, URL = {http://amsacta.unibo.it/6848/1/Proceedings_AIUCD2022.pdf}, DOI = {10.6092/unibo/amsacta/6848}, PUBLISHER = {Fabio Ciracì, Giulia Miglietta, Carola Gatto}, ISBN = {9788894253566}, CONFERENCE_NAME = {AIUCD 2022}, BOOKTITLE = {AIUCD 2022-Culture digitali. Intersezioni: filosofia, arti, media. Proceedings della 11a conferenza nazionale}, } @INPROCEEDINGS{MARCHI_2022_INPROCEEDINGS_MCDG_443132, AUTHOR = {Marchi, S. and Colombo, M. and Dattilo, D. and Giovannetti, E.}, TITLE = {Un esperimento di visualizzazione grafica della terminologia del Talmud babilonese}, YEAR = {2022}, ABSTRACT = {L'impiego di tecnologie di information visualization nel settore delle digital humanities può aprire nuove frontiere di ricerca. Le informazioni veicolate attraverso modalità grafiche, infatti, possono apparire agli studiosi più immediatamente comprensibili e le interfacce grafiche realizzate fornire inediti paradigmi di studio e di manipolazione dei dati analizzati. Il caso d'uso sperimentale illustrato in questo contributo è stato concepito per fornire allo studioso una modalità visiva, immediata, per l'analisi comparativa del contenuto terminologico di un corpus testuale}, KEYWORDS = {Visualizzazione grafica di risorse testuali, terminologia, linguistica computazionale, tf-idf, grafi}, PAGES = {239-241}, URL = {http://amsacta.unibo.it/6848/1/Proceedings_AIUCD2022.pdf}, DOI = {10.6092/unibo/amsacta/6848}, ISBN = {9788894253566}, CONFERENCE_NAME = {AIUCD 2022}, BOOKTITLE = {AIUCD 2022-Culture digitali. Intersezioni: filosofia, arti, media. Proceedings della 11a conferenza nazionale}, } @TECHREPORT{ALBANESI_2022_TECHREPORT_ABCGMPS_447933, AUTHOR = {Albanesi, D. and Bellandi, A. and Colombo, M. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 21}, YEAR = {2022}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo novembre 2021-aprile 2022. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug e l'implementazione di nuove funzionalità richieste. Parallelamente, è stata realizzata una applicazione per la consultazione del corpus biblico e sono proseguite le attività volte alla visualizzazione di risorse lessicali tramite grafi e per l'analisi, l'allineamento di testi, l'aggiornamento e la conversione del lessico computazionale PSC da utilizzarsi per la consultazione avanzata, su base morfologica e semantica, del testo talmudico tradotto in italiano}, KEYWORDS = {Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi}, PAGES = {23}, URL = {https://iris.cnr.it/handle/20.500.14243/447933}, } @TECHREPORT{ALBANESI_2022_TECHREPORT_ACGMPS_414174, AUTHOR = {Albanesi, D. and Colombo, M. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 22}, YEAR = {2022}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo maggio 2022-dicembre 2022. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug e l'implementazione di nuove funzionalità richieste. Parallelamente, è proseguito il lavoro di ricerca e sviluppo su tre fronti: i) la nuova versione di Traduco, ii) la visualizzazione grafica di risorse lessicali, e iii) la ricerca full-text sul testo del Talmud tradotto in italiano}, KEYWORDS = {Traduzione Assistita dal CalcolatoreTraduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi, ricerca full-text}, PAGES = {40}, URL = {https://iris.cnr.it/handle/20.500.14243/414174}, } @TECHREPORT{ALBANESI_2022_TECHREPORT_AGP_447934, AUTHOR = {Albanesi, D. and Giovannetti, E. and Papini, M.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-rapporto integrativo 4}, YEAR = {2022}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto delle attività di progetto previste dalla convenzione integrativa stipulata tra PTTB e ILC-CNR in data 10/07/2018 e condotte nel periodo febbraio 2021-gennaio 2022}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Sviluppo front-end}, PAGES = {15}, URL = {https://iris.cnr.it/handle/20.500.14243/447934}, } @MISC{SCIOLETTE_2022_MISC_SGM_455982, AUTHOR = {Sciolette, F. and Giovannetti, E. and Marchi, S.}, TITLE = {LexicO}, YEAR = {2022}, ABSTRACT = {LexicO is a resource deriving from Parole-Simple-Clips (http: //hdl. handle. net/20. 500. 11752/ILC-88). This resource contains all four levels of linguistic information represented in PSC (phonology, morphology, syntax, and semantics) which have been automatically analysed to find redundant, erroneous and missing data. The process of updating that conducted to the current version of LexicO starting from PSC included: i) the removal of all sure redundant entries (i. e. duplicates) belonging to all four linguistic levels; ii) the creation of tables dedicated to candidate redundants, detected by considering specific similarities amongst entries; iii) the correction of missing semantic and syntax-semantics interface relations amongst the entries of lexicon}, KEYWORDS = {computational lexic, Lexical Database, semantics, morphology, syntax, phonology}, URL = {https://dspace-clarin-it.ilc.cnr.it/repository/xmlui/handle/20.500.11752/ILC-977}, } @ARTICLE{GIOVANNETTI_2021_ARTICLE_GABDDM_396547, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Dattilo, D. and Del Grosso, A. M. and Marchi, S.}, TITLE = {An ontology of masters of the Babylonian Talmud}, YEAR = {2021}, ABSTRACT = {The purpose of this research is to build an ontology of the masters appearing in the Babylonian Talmud (BT). The ontology built so far has been shared as a Linked Open Data and it will be linked to existing vocabularies. This work has been developed in the context of the Babylonian Talmud Translation Project, where more than eighty Talmudists are working together, since 2012, at the translation (comprehensive of explicative notes and glossaries) of the Talmud into Italian. The construction of the resource has involved the application of tools leveraging on computational linguistics approaches. The ontology, already describing more than 500 masters, constitutes the first portion of a more comprehensive Talmudic Knowledge Base where the text itself, the terminology, the entities, and the concepts constituting the BT will be formalized and linked to each other}, KEYWORDS = {ontology, babylonian talmud, terminology, word alignment, linked open data, semantic web, knowledge representation}, PAGES = {725-737}, URL = {https://academic.oup.com/dsh/article-abstract/37/3/725/6410110}, VOLUME = {37 (3)}, DOI = {10.1093/llc/fqab043}, ISSN = {2055-7671}, JOURNAL = {DIGITAL SCHOLARSHIP IN THE HUMANITIES}, } @ARTICLE{PICCINI_2021_ARTICLE_PBG_396586, AUTHOR = {Piccini, S. and Bellandi, A. and Giovannetti, E.}, TITLE = {A Model for Representing Diachronic Terminologies: the Saussure Case Study}, YEAR = {2021}, ABSTRACT = {The aim of this article is to present a model for representing in an explicit and formal way the diachronic evolution of concepts and terms in a given domain, so that this formalization can be machine-actionable. The approach we here propose is based on Semantic Web technologies in order to guarantee interoperability and reuse across scientific communities of diachronic terminological resources that can be thus easily accessed, interconnected and mutually enriched. More specifically, the representation of dynamic evolution of terms and concepts was performed in OWL using the N-ary relations mechanisms. In addition, a set of SWRL rules was set up, in order to automatically identify the evolution of the concepts evoked within a text, as well as the terms representing these concepts. Our model was adopted to formally represent diachronic aspects of Saussure's terminology as they emerge from his works. An example will be provided to highlight the potential of such a knowledge structuration for gaining a wider understanding of the profound terminological and conceptual changes brought about by the paradigmatic and epistemological revolutions in sciences}, KEYWORDS = {diachronic terminology, Saussure's terminology, semantic web, linked data}, URL = {http://digitalhumanities.org/dhq/vol/15/3/000549/000549.html}, VOLUME = {15 (2)}, ISSN = {1938-4122}, JOURNAL = {DIGITAL HUMANITIES QUARTERLY}, } @INCOLLECTION{PICCINI_2021_INCOLLECTION_PABG_396587, AUTHOR = {Piccini, S. and Abrate, M. and Bellandi, A. and Giovannetti, E.}, TITLE = {Rappresentazione, costruzione e visualizzazione di risorse terminologiche diacroniche nell'era del web semantico}, YEAR = {2021}, ABSTRACT = {This article introduces the model DIATERM, devoted to representing the diachronic evolution of concepts and terms in a given domain, according to Semantic Web standards and Linked Data technologies. The approach adopted for the representation of temporal information is based on the reification of N-ary relationships. DIATERM is articulated on three levels, textual, terminological and conceptual. Each level can be affected, more or less simultaneously, by change. The use of SWRL rules allows to automatically assign temporal information, thus facilitating the construction of the terminological resource and highlighting any inconsistencies. Two examples of interrogation and visualization of diachronic terminological resources will be illustrated. The first example is taken from the resource dedicated to the astronomical terminology introduced by Christopher Clavius in his Commentary on the Sacrobosco's Tractatus de Sphaera. The second example is taken from the electronic lexicon of Ferdinand de Saussure's linguistic terminology}, KEYWORDS = {computational terminology, diachronic terminology, ontology, semantic web, linked data}, PAGES = {125-139}, URL = {https://iris.cnr.it/handle/20.500.14243/396587}, DOI = {10.36253/978-88-5518-364-2.12}, PUBLISHER = {Firenze University Press (Firenze, ITA)}, ISBN = {978-88-5518-363-5}, CONFERENCE_PLACE = {Firenze}, BOOKTITLE = {Terminologie e vocabolari Lessici specialistici e tesauri, glossari e dizionari}, EDITOR = {Grimaldi, C. and Zanola, M. T.}, } @INPROCEEDINGS{GIOVANNETTI_2021_INPROCEEDINGS_GABMPS_446010, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {The role of a computational lexicon for query expansion in full-text search}, YEAR = {2021}, ABSTRACT = {This work describes the first experiments conducted with a computational lexicon of Italian in a context of query expansion for full-text search. An application, composed of a graphical user interface and backend services to access the lexicon and the database containing the corpus to be queried, was developed. The text was morphologically analysed to improve the precision of the search process. Some examples of queries are given to show the potential of a text search approach supported by a complex and stratified lexical resource}, KEYWORDS = {full-text search, computational lexicon, query expansion}, PAGES = {162-168}, URL = {http://www.scopus.com/record/display.url?eid=2-s2.0-85121247840\&origin=inward}, VOLUME = {3033}, DOI = {10.4000/books.aaccademia.10417}, PUBLISHER = {Accademia University Press (Torino, ITA)}, ISBN = {9791280136947}, CONFERENCE_NAME = {CLiC-it 2021 Italian Conference on Computational Linguistics 2021}, CONFERENCE_PLACE = {Torino}, BOOKTITLE = {Proceedings of the Eight Italian Conference on Computational Linguistics (Clic-it 2021)}, EDITOR = {Fersini, E. and Passarotti, M. and Patti, V.}, } @INPROCEEDINGS{BELLANDI_2021_INPROCEEDINGS_BGMPS_446104, AUTHOR = {Bellandi, A. and Giovannetti, E. and Marchi, S. and Piccini, S. and Sciolette, F.}, TITLE = {Fostering the Collaborative Creation of Linguistic Linked Open Data with LexO, an open source Editor of Multilingual Lexicons and Terminologies}, YEAR = {2021}, ABSTRACT = {In the context of the semanitc web and the linguistic linked open data paradigm, we propose LexO, a web editor of computational lexicons and terminologies based on the OntoLex-Lemon model}, KEYWORDS = {LexO, Linguistic Linked Open Data, Semantic Web, Computational Lexicography, Terminology, CLARIN}, PAGES = {436-439}, URL = {https://aiucd2021.labcd.unipi.it/book-of-abstracts/}, CONFERENCE_NAME = {AIUCD 2021-DH per la società: e-guaglianza, partecipazione, diritti e valori nell'era digitale}, BOOKTITLE = {DHs for society: e-quality, participation, rights and values in the Digital Age}, } @TECHREPORT{ALBANESI_2021_TECHREPORT_ABCPGS_446083, AUTHOR = {Albanesi, D. and Bellandi, A. and Colombo, M. and Papini, M. and Giovannetti, E. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 19}, YEAR = {2021}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo novembre 2020-aprile 2021. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug, l'implementazione di nuove funzionalità richieste e lo sviluppo di una nuova interfaccia grafica utente. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto precedente, nella rappresentazione del lessico, della terminologia e della conoscenza del Talmud}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, PAGES = {28}, URL = {https://iris.cnr.it/handle/20.500.14243/446083}, } @TECHREPORT{ALBANESI_2021_TECHREPORT_ABCPGS_446085, AUTHOR = {Albanesi, D. and Bellandi, A. and Colombo, M. and Papini, M. and Giovannetti, E. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 20}, YEAR = {2021}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo maggio 2021-ottobre 2021. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug e l'implementazione di nuove funzionalità richieste. Parallelamente, sono proseguite le attività volte alla visualizzazione di risorse testuali e linguistiche tramite grafi e per la conversione e l'utilizzo del lessico computazionale PSC a supporto di ricerca "full-text" sul testo talmudico italiano}, KEYWORDS = {Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza, Linguistica Computazionale, traduzione di testi religiosi}, PAGES = {20}, URL = {https://iris.cnr.it/handle/20.500.14243/446085}, } @TECHREPORT{ALBANESI_2021_TECHREPORT_AGPS_446086, AUTHOR = {Albanesi, D. and Giovannetti, E. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-rapporto integrativo 3}, YEAR = {2021}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto delle attività di progetto previste dalla convenzione integrativa stipulata tra PTTB e ILC-CNR in data 10/07/2018 e condotte nel periodo febbraio 2020-gennaio 2021}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Sviluppo front-end, lessici computazionali}, PAGES = {17}, URL = {https://iris.cnr.it/handle/20.500.14243/446086}, } @ARTICLE{GIOVANNETTI_2020_ARTICLE_GBDDMPP_400775, AUTHOR = {Giovannetti, E. and Bellandi, A. and Dattilo, D. and Del Grosso, A. M. and Marchi, S. and Pecchioli, A. and Piccini, S.}, TITLE = {The Terminology of the Babylonian Talmud: Extraction, Representation and Use in the Context of Computational Linguistics}, YEAR = {2020}, ABSTRACT = {A formal digital structuring of the terminology of the Talmud is being carried out in the context of the Project for the Translation of the Babylonian Talmud in Italian. The terminological resource was encoded in the form of a multi-language Explanatory Combinatorial Dictionary (Hebrew-Aramaic-Italian) according to the principles of the Meaning-Text Theory. The construction of such a resource was supported by text processing and computational linguistics techniques aimed at automatically extracting terms from the Italian translation of the Talmud and aligning them with the corresponding Hebrew/Aramaic source terms. The paper describes the process that was set up for the construction of the terminological resource with the ultimate goal of illustrating the advantages of the adoption of a formal linguistic model. The terminological resource aims, indeed, to be a useful tool to deepen the characteristics of the languages of the Talmud, to help translators in their work and more generally scholars in their study of the Talmud itself}, KEYWORDS = {Babylonian Talmud, Computational Linguistics, Explanatory and Combinatorial Lexicology}, PAGES = {61-74}, URL = {http://aisg.cise.unipi.it/Materia-giudaica-2020/006_Giovannettipp61-74.pdf}, VOLUME = {XXV}, DOI = {10.1400/283235}, ISSN = {2282-4499}, JOURNAL = {MATERIA GIUDAICA}, } @INPROCEEDINGS{BELLANDI_2020_INPROCEEDINGS_BG_411285, AUTHOR = {Bellandi, A. and Giovannetti, E.}, TITLE = {Involving Lexicographers in the LLOD Cloud with LexO, an Easy-to-use Editor of Lemon Lexical Resources}, YEAR = {2020}, ABSTRACT = {In this contribution, we show LexO, a user-friendly web collaborative editor of lexical resources based on the lemon model. LexO has been developed in the context of Digital Humanities projects, in which a key point in the design of an editor was the ease of use by lexicographers with no skill in Linked Data or Semantic Web technologies. Though the tool already allows creating a lemon lexicon from scratch and lets a team of users work on it collaboratively, many developments are possible. The involvement of the LLOD community appears now crucial both to find new users and application fields where to test it, and, even more importantly, to understand in which way it should evolve}, KEYWORDS = {lexO, lexical resources editor, semantic web, llod}, PAGES = {70-74}, URL = {https://www.aclweb.org/anthology/2020.ldl-1.10.pdf}, PUBLISHER = {European Language Resources Association ELRA (Paris, FRA)}, ISBN = {979-10-95546-36-8}, CONFERENCE_NAME = {7th Workshop on Linked Data in Linguistics (LDL-2020)}, CONFERENCE_PLACE = {Paris}, BOOKTITLE = {Proceedings of the 7th Workshop on Linked Data in Linguistics (LDL-2020)}, EDITOR = {Ionov and Maxim and McCrae and John, P. and Chiarcos and Christian and Declerck and Thierry and Bosque Gil and Julia and Gracia and Jorge}, } @INPROCEEDINGS{DELGROSSO_2020_INPROCEEDINGS_DGM_411284, AUTHOR = {Del Grosso, A. M. and Giovannetti, E. and Marchi, S.}, TITLE = {Enriching a Multilingual Terminology Exploiting Parallel Texts: An Experiment on the Italian Translation of the Babylonian Talmud}, YEAR = {2020}, ABSTRACT = {Parallel texts can represent an extremely useful source of information in a number of text and linguistic processing tasks. In this work we show an experiment conducted on the Italian translation of the Babylonian Talmud, a text we have analyzed and processed to support in the construction of a multilingual Hebrew/Aramaic/Italian terminological resource. The approach we adopted comprised: i) the TEI encoding of the text, ii) the automatic extraction of the Italian terms, iii) the addition of Hebrew/Aramaic terms via word-by-word alignment, iv) the revision of the obtained results}, KEYWORDS = {multilingual terminology, parallel text, text alignment, babylonian talmud}, PAGES = {119-124}, URL = {http://amsacta.unibo.it/6316/1/AIUCD_2020_volume_FINAL.pdf}, DOI = {10.6092/unibo/amsacta/6316}, ISBN = {978-88-942535-4-2}, CONFERENCE_NAME = {IX Convegno Annuale AIUCD}, BOOKTITLE = {Atti del IX Convegno Annuale AIUCD. La svolta inevitabile: sfide e prospettive per l'Informatica Umanistica}, } @TECHREPORT{ALBANESI_2020_TECHREPORT_ABCGMPPS_427138, AUTHOR = {Albanesi, D. and Bellandi, A. and Colombo, M. and Giovannetti, E. and Marchi, S. and Papini, M. and Piccini, S. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 17}, YEAR = {2020}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo novembre 2019-aprile 2020. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug, l'implementazione di nuove funzionalità richieste e lo sviluppo di una nuova interfaccia grafica utente. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto precedente, nella rappresentazione della terminologia e della conoscenza del Talmud}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, PAGES = {34}, URL = {https://iris.cnr.it/handle/20.500.14243/427138}, } @TECHREPORT{ALBANESI_2020_TECHREPORT_ABCGMPS_427139, AUTHOR = {Albanesi, D. and Bellandi, A. and Colombo, M. and Giovannetti, E. and Marchi, S. and Papini, M. and Sciolette, F.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 18}, YEAR = {2020}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo maggio 2020-ottobre 2020. Le principali attività tecniche svolte sul sistema Traduco sono state la risoluzione di bug, l'implementazione di nuove funzionalità richieste e lo sviluppo di una nuova interfaccia grafica utente. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto precedente, nella rappresentazione del lessico, della terminologia e della conoscenza del Talmud}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, PAGES = {35}, URL = {https://iris.cnr.it/handle/20.500.14243/427139}, } @TECHREPORT{ALBANESI_2020_TECHREPORT_ABDGP_427143, AUTHOR = {Albanesi, D. and Bellandi, A. and Del Grosso, A. M. and Giovannetti, E. and Papini, M.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-rapporto integrativo 2}, YEAR = {2020}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto delle attività di progetto previste dalla convenzione integrativa stipulata tra PTTB e ILC-CNR in data 10/07/2018 e condotte nel periodo febbraio 2019-gennaio 2020}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Allineamento di Testi, Sviluppo front-end}, PAGES = {9}, URL = {https://iris.cnr.it/handle/20.500.14243/427143}, } @ARTICLE{DELGROSSO_2019_ARTICLE_DCCDGMSS_411280, AUTHOR = {Del Grosso, A. M. and Capizzi, E. and Cristofaro, S. and De Luca, M. R. and Giovannetti, E. and Marchi, S. and Seminara, G. and Spampinato, D.}, TITLE = {Bellini's Correspondence: a Digital Scholarly Edition for a Multimedia Museum}, YEAR = {2019}, ABSTRACT = {Within the "Museo Virtuale della Musica BellinInRete" project, a corpus of letters, written by the renowned composer Vincenzo Bellini (1801-1835) from Catania, will be encoded and made publicly available. This contribution aims at illustrating the part of the project regarding the implementation of the prototype for the metadata and text encoding, indexing and visualisation of Bellini's correspondence. The encoding scheme has been defined according to the latest guidelines of the Text Encoding Initiative and it has been instantiated on a sample of letters. Contextually, a first environment has been implemented by customizing two open source tools: Edition Visualization Technology and Omega Scholarly platform. The main objective of the digital edition is to engage general public with the cultural heritage held by the Belliniano Civic Museum of Catania. This wide access to Bellini's correspondence has been conceived preserving the scholarly transcriptions of the letters edited by Seminara within her most recent critical edition (Olschki, 2017). The digital edition of the corpus takes care of handling the correspondence metadata by means of the correspDesc TEI tagset. Finally, Bellini's letters will be accessible via the Web platform as well as integrated into a forthcoming interactive and multimedia tour hosted at the museum}, KEYWORDS = {digital scholarly edition, correspondence, Digital and Computational Philology, Software Design, Vincenzo Bellini, Music, Multimedia Museum}, PAGES = {23-47}, URL = {https://umanisticadigitale.unibo.it/article/view/9162/9918}, VOLUME = {7}, DOI = {10.6092/issn.2532-8816/9162}, ISSN = {2532-8816}, JOURNAL = {UMANISTICA DIGITALE}, } @INCOLLECTION{GIOVANNETTI_2019_INCOLLECTION_G_396546, AUTHOR = {Giovannetti, E.}, TITLE = {Traduzione Talmud Babilonese}, YEAR = {2019}, ABSTRACT = {Traduzione Talmud Babilonese è un progetto di ricerca che ha come obiettivo la traduzione in lingua italiana del Talmud Babilonese, un testo fondamentale della cultura ebraica non solo in campo religioso ma che tocca anche ogni aspetto della conoscenza umana, dalla giurisprudenza alla scienza, dalla filosofia alla vita di tutti i giorni}, KEYWORDS = {traduzione assistita dal calcolatore, talmud babilonese}, PAGES = {126-126}, URL = {https://iris.cnr.it/handle/20.500.14243/396546}, DOI = {10.36173/PLURIMI-2019-1}, PUBLISHER = {CNR EDIZIONI (ROMA, ITA)}, ISBN = {978}, CONFERENCE_PLACE = {ROMA}, BOOKTITLE = {Linguaggi, ricerca, comunicazione. Focus CNR}, EDITOR = {Cadeddu, M. E. and Marras, C.}, } @TECHREPORT{ALBANESI_2019_TECHREPORT_ABDGMP_411289, AUTHOR = {Albanesi, D. and Bellandi, A. and Del Grosso, A. M. and Giovannetti, E. and Marchi, S. and Piccini, S.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 15}, YEAR = {2019}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo dicembre 2018-maggio 2019. Le due principali attività tecniche svolte sul sistema Traduco sono la risoluzione di bug e l'implementazione di nuove funzionalità. Queste due attività sono strettamente correlate: di fatto, l'introduzione di nuove funzionalità può implicare l'introduzione di nuovi bug all'interno del sistema. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto recedente, nella rappresentazione della terminologia e della conoscenza del Talmud}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, URL = {https://iris.cnr.it/handle/20.500.14243/411289}, } @TECHREPORT{ALBANESI_2019_TECHREPORT_ABDGMP_404158, AUTHOR = {Albanesi, D. and Bellandi, A. and Del Grosso, A. M. and Giovannetti, E. and Marchi, S. and Piccini, S.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 16}, YEAR = {2019}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo giugno 2019-ottobre 2019. Le due principali attività tecniche svolte sul sistema Traduco sono la risoluzione di bug e l'implementazione di nuove funzionalità. Queste due attività sono strettamente correlate: di fatto, l'introduzione di nuove funzionalità può implicare l'introduzione di nuovi bug all'interno del sistema. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto precedente, nella rappresentazione della terminologia e della conoscenza del Talmud}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, URL = {https://iris.cnr.it/handle/20.500.14243/404158}, } @TECHREPORT{ALBANESI_2019_TECHREPORT_ABGD_427142, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Del Grosso, A. M.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-rapporto integrativo 1}, YEAR = {2019}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto delle attività di progetto previste dalla convenzione integrativa stipulata tra PTTB e ILC-CNR in data 10/07/2018 e condotte nel periodo dicembre 2017-gennaio 2019}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Allineamento di Testi}, PAGES = {5}, URL = {https://iris.cnr.it/handle/20.500.14243/427142}, } @MISC{GIOVANNETTI_2019_MISC_GBDMPPS_411270, AUTHOR = {Giovannetti, E. and Bellandi, A. and Del Grosso, A. M. and Marchi, S. and Pecchioli, A. and Piccini and S}, TITLE = {La Terminologia del Talmud Babilonese: Estrazione, Rappresentazione e Uso nel Contesto della Linguistica Computazionale}, YEAR = {2019}, ABSTRACT = {Nel contesto del Progetto per la traduzione del Talmud babilonese in italiano (PTTB) si sta procedendo a una strutturazione digitale formale della terminologia. La risorsa terminologica è stata codificata sotto forma di un dizionario combinatorio ed esplicativo, multilingue (ebraico-aramaico-italiano) secondo i principi della teoria testo-senso. La costruzione di tale risorsa è stata supportata dall'elaborazione del testo e dalle tecniche linguistiche computazionali volte a estrarre automaticamente i termini dalla traduzione italiana del Talmud e ad allinearli con i corrispondenti termini in ebraico / aramaico. L'articolo descrive il processo avviato per la costruzione della risorsa terminologica con l'obiettivo finale di illustrare i vantaggi dell'adozione di un modello linguistico formale. La risorsa terminologica mira, infatti, a essere uno strumento utile per approfondire le caratteristiche delle lingue del Talmud, per aiutare i traduttori nel loro lavoro e più in generale l'ampia platea di studiosi del Talmud}, KEYWORDS = {terminologia, talmud, teoria testo-senso, estrazione terminologica, allineamento di testi}, URL = {https://iris.cnr.it/handle/20.500.14243/411270}, CONFERENCE_NAME = {AISG "Ebraismo fra peculiarità e interculturalità"}, } @ARTICLE{BELLANDI_2018_ARTICLE_BGW_348535, AUTHOR = {Bellandi, A. and Giovannetti, E. and Weingart, A.}, TITLE = {Multilingual and Multiword Phenomena in a lemon Old Occitan Medico-Botanical Lexicon}, YEAR = {2018}, ABSTRACT = {This article illustrates the progresses made in representing a multilingual and multi-alphabetical Old Occitan medico-botanical lexicon in the context of the project Dictionnaire de Termes Médico-botaniques de l'Ancien Occitan (DiTMAO). The chosen lexical model of reference is lemon, which has been extended accordingly to some specific linguistic and lexical features of the lexicon. In particular, issues and solutions about the modeling of multilingual and multiword phenomena are discussed, as the way they are managed through LexO, a web editor developed in the context of the project}, URL = {https://iris.cnr.it/handle/20.500.14243/348535}, DOI = {10.3390/info9030052}, ISSN = {2078-2489}, JOURNAL = {INFORMATION}, } @ARTICLE{PECCHIOLI_2018_ARTICLE_PABGM_343397, AUTHOR = {Pecchioli, A. and Albanesi, D. and Bellandi, A. and Giovannetti, E. and Marchi, S.}, TITLE = {Annotazione Linguistica Automatica dell'Ebraico Mishnaico: Esperimenti sul Talmud Babilonese}, YEAR = {2018}, ABSTRACT = {The automatic linguistic analysis of ancient Hebrew represents a new research opportunity in the field of Jewish studies. In fact, very little has been produced, both in terms of linguistic resources and, above all, of tools for the analysis of ancient Hebrew. This article illustrates a work born within the Italian Translation of the Babylonian Talmud Project aimed at the construction of an automatic linguistic annotator of Mishnaic Hebrew}, KEYWORDS = {Babylonian Talmud, Natural Language Processing, Mishnaic Hebrew}, PAGES = {281-291}, URL = {http://aisg.cise.unipi.it/Materia-giudaica-2018/018-Pecchioli%20pp%20281-292B.pdf}, VOLUME = {XXIII}, ISSN = {2282-4499}, JOURNAL = {MATERIA GIUDAICA}, } @INPROCEEDINGS{DELGROSSO_2018_INPROCEEDINGS_DBGMN_348283, AUTHOR = {Del Grosso, A. M. and Bellandi, A. and Giovannetti, E. and Marchi, S. and Nahli, O.}, TITLE = {Scanning is Just the Beginning: Exploiting Text and Language Technologies to Enhance the Value of Historical Manuscripts}, YEAR = {2018}, ABSTRACT = {In this paper we present a digital process for the explicitation of the textual, linguistic and semantic content of historical manuscripts. The proposed workflow is composed of a sequence of incremental steps, each of which is described both on a methodological and practical perspective. The steps are: 1) visualization and structuring of metadata, 2) transcription, 3) structural encoding, 4) annotation, 5) lexical and conceptual structuring}, KEYWORDS = {Computational Lexica, Digital Scholarly Editing, Digital Humanities, al-Qamus al-Muhit}, PAGES = {214-219}, URL = {https://iris.cnr.it/handle/20.500.14243/348283}, DOI = {10.1109/CIST.2018.8596373}, PUBLISHER = {IEEE (New York, USA)}, ISBN = {978-1-5386-4385-3}, CONFERENCE_NAME = {CIST 2018 WH-MNLP}, CONFERENCE_PLACE = {New York}, BOOKTITLE = {Colloquium in Information Science and Technology, CIST}, EDITOR = {Al Achhab, M. and El Mohajir, M. and Jellouli, I. and El Mohajir, B. E.}, } @INPROCEEDINGS{GIOVANNETTI_2018_INPROCEEDINGS_GABMP_500052, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Marchi, S. and Pecchioli, A.}, TITLE = {Constructing an annotated resource for part-of-speech tagging of mishnaic Hebrew}, YEAR = {2018}, ABSTRACT = {This paper introduces the research in Part-Of-Speech tagging of mishnaic Hebrew carried out within the Babylonian Talmud Translation Project. Since no tagged resource was available to train a stochastic POS tagger, a portion of the Mishna of the Babylonian Talmud has been morphologically annotated using an ad hoc developed tool connected with the DB containing the talmudic text being translated. The final aim of this research is to add a linguistic support to the Translation Memory System of Traduco, the Computer-Assisted Translation tool developed and used within the Project}, KEYWORDS = {pos tagging, mishnaic hewbrew, babilonian talmud}, PAGES = {219-223}, URL = {https://iris.cnr.it/handle/20.500.14243/500052}, VOLUME = {2253}, DOI = {10.4000/books.aaccademia.3394}, PUBLISHER = {Accademia University Press}, ISBN = {9788831978682}, CONFERENCE_NAME = {CLiC-It 2018. Fifth Italian Conference on Computational Linguistics}, BOOKTITLE = {Proceedings of the Fifth Italian Conference on Computational Linguistics CLiC-It 2018}, } @INPROCEEDINGS{PICCINI_2018_INPROCEEDINGS_PCG_340691, AUTHOR = {Piccini, S. and Corsi, E. and Giovannetti, E.}, TITLE = {Une ressource termino-ontologique bilingue chinois-italien: le cas de la traduction de la Mappemonde de Matteo Ricci par Pasquale D'Elia}, YEAR = {2018}, ABSTRACT = {Cet article a pour but d'illustrer les premiers résultats obtenus dans la cadre du projet intitulé Todo el mundo es nuestra casa'. The World is Our Home. ' A Virtual Journey Around the World Atlas by Matteo Ricci, SJ (1602). Le projet comporte deux objectifs: en premier lieu permettre aux internautes un voyage virtuel à travers la Mappemonde réalisée par Matteo Ricci en 1602 et sa raduction en italien accomplie par le jésuite sinologue Pasquale D'Elia; en second lieu fournir les instruments pour l'étude linguistique et conceptuelle des cartouches contenus dans la Mappemonde. Dans le contexte de ce deuxième objectif une ressource termino-ontologique bilingue chinois-italien est en cours de développement. Dans cette ressource le niveau lexical a été modélisé suivant le modèle lemon, étendu pour représenter des caractéristiques spécifiques de la langue chinoise classique. Par contre, la partie conceptuelle a reçu une formalisation ontologique en OWL}, KEYWORDS = {Matteo Ricci, Pasquale d'Elia, risorsa termino-ontologica, cinese classico, terminologia computazionale, ontologie}, PAGES = {33-49}, URL = {http://ontologia.fr/TOTh/Conference/TOTh2017/TOTh_2017.pdf}, ISBN = {2919732803}, CONFERENCE_NAME = {Conference TOTh 2017 Terminology \& Ontology}, BOOKTITLE = {Actes de la conférence TOTh 2017, Terminologie \& Ontologie: Théories et Applications}, EDITOR = {Roche, C.}, } @INPROCEEDINGS{BELLANDI_2018_INPROCEEDINGS_BGP_346698, AUTHOR = {Bellandi, A. and Giovannetti, E. and Piccini, S.}, TITLE = {Collaborative Editing of Lexical and Termino-ontological Resources: a Quick Introduction to LexO}, YEAR = {2018}, ABSTRACT = {We here present LexO, a web collaborative editor of lexical and termino-ontological resources. As the underlying lexical model we adopted lemon, which appeared to be perfect for our purposes, in particular regarding the separation between the conceptual and linguistic dimensions}, KEYWORDS = {lemon model, lexo, collaborative editor, termino-ontological resource}, PAGES = {23-27}, URL = {http://euralex2018.cjvt.si/wp-content/uploads/sites/6/2018/12/Euralex2018_book_of_abstracts_FINAL.pdf}, CONFERENCE_NAME = {XVIII EURALEX International Congress}, BOOKTITLE = {The XVIII EURALEX International Congress: Lexicography in Global Contexts-Book of Abstracts}, EDITOR = {Čibej, J. and Gorjanc, V. and Kosem, I. and Krek, S.}, } @INPROCEEDINGS{DELGROSSO_2018_INPROCEEDINGS_DCDGMSS_346825, AUTHOR = {Del Grosso, A. M. and Cristofaro, S. and De Luca, R. M. and Giovannetti, E. and Marchi, S. and Seminara, G. and Spampinato, D.}, TITLE = {Le lettere di Bellini: dalla Carta al Web}, YEAR = {2018}, ABSTRACT = {Nel contesto del progetto "Museo virtuale della Musica BellinInRete" sarà reso fruibile, attraverso un processo di acquisizione, codifica e pubblicazione digitale, un corpus di lettere di Vincenzo Bellini, compositore catanese del XIX secolo. L'edizione digitale delle lettere belliniane sarà consultabile in rete e, inoltre, sarà integrata in un percorso museale interattivo in allestimento presso il Museo Civico Belliniano di Catania}, KEYWORDS = {Digital Edition, Digital Scholarly Platform}, PAGES = {60-64}, URL = {http://www.aiucd2018.uniba.it/content/AIUCD2018-BoA.pdf}, DOI = {10.6092/unibo/amsacta/5997}, ISBN = {9788894253528}, CONFERENCE_NAME = {AIUCD 2018 Conference}, BOOKTITLE = {AIUCD 2018-Book of abstracts}, EDITOR = {Spampinato, D.}, } @INPROCEEDINGS{GIOVANNETTI_2018_INPROCEEDINGS_GABDDPP_346702, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Dattilo, D. and Dollinar, M. and Pecchioli, A. and Piperno, C.}, TITLE = {Il Progetto Traduzione del Talmud Babilonese: il Ruolo della Tecnologia e della Linguistica Computazionale}, YEAR = {2018}, ABSTRACT = {L'obiettivo principale del Progetto Traduzione del Talmud Babilonese è produrre la traduzione del Talmud in italiano. La traduzione, affidata ad un team di circa 80 studiosi, è condotta con l'aiuto di Traduco, un software preposto ad agevolare tutte le fasi di lavoro previste dal progetto, dall'attribuzione degli utenti alle sezioni da tradurre, fino al supporto all'impaginazione finale. La presenza di una piattaforma collaborativa digitale che già, di per sé, costituisce una innovazione nell'ambito dei grandi progetti di traduzione, è arricchita da algoritmi per il trattamento automatico del testo e della lingua, in costante evoluzione, attraverso i quali il traduttore, il revisore o lo studioso possono contare su funzionalità sempre più avanzate}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa}, PAGES = {144-146}, URL = {http://amsacta.unibo.it/5997/}, DOI = {10.6092/unibo/amsacta/5997}, ISBN = {9788894253528}, CONFERENCE_NAME = {AIUCD 2018 Conference}, BOOKTITLE = {AIUCD 2018-Book of abstracts}, EDITOR = {Spampinato, D.}, } @INPROCEEDINGS{PICCINI_2018_INPROCEEDINGS_PBG_346696, AUTHOR = {Piccini, S. and Bellandi, A. and Giovannetti, E.}, TITLE = {A Semantic Web Approach to Modelling and Building a Bilingual Chinese-Italian Termino-ontological Resource}, YEAR = {2018}, ABSTRACT = {This paper introduces a bilingual Chinese-Italian onto-terminological resource, devoted to modelling the Chinese terminology of Matteo Ricci's World Map (1602), together with the Italian translation by Pasquale D'Elia (1835) [3]. The Map was created in collaboration with the Chinese mathematician and astronomer Li Zizhao, and is entitled ? ? ? ? ? ? Kunyu Wanguo Quantu (literally "Map of the Ten Thousand Countries of the Earth"). Its publication in China was significant as it was the first map to show the Americas, and to represent the world as a sphere. Its large number of cartouches provide information about the geography, history and customs of the world at that time as well as cosmological and cosmographic data. The map had a revolutionary impact from a linguistic standpoint as well: a large number of neologisms were introduced by Ricci, many of which have survived until today}, KEYWORDS = {termino-ontological resource, classical chinese, lemon model}, PAGES = {87-90}, URL = {http://euralex2018.cjvt.si/wp-content/uploads/sites/6/2018/12/Euralex2018_book_of_abstracts_FINAL.pdf}, CONFERENCE_NAME = {XVIII EURALEX International Congress}, BOOKTITLE = {The XVIII EURALEX International Congress: Lexicography in Global Contexts-Book of Abstracts}, EDITOR = {Čibej, J. and Gorjanc, V. and Kosem, I. and Krek, S.}, } @TECHREPORT{ALBANESI_2018_TECHREPORT_ABGM_345453, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Marchi, S.}, TITLE = {Traduco: l'Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 14}, YEAR = {2018}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo luglio 2018-novembre 2018. Le due principali attività tecniche svolte sul sistema Traduco sono la risoluzione di bug e l'implementazione di nuove funzionalità. Queste due attività sono strettamente correlate: di fatto, l'introduzione di nuove funzionalità può implicare l'introduzione di nuovi bug all'interno del sistema. Le attività di ricerca sono state condotte, in continuità a quelle descritte nel rapporto precedente, nella rappresentazione del lessico e della conoscenza talmudica}, KEYWORDS = {Linguistica Computazionale, Traduzione di Testi Religiosi, Traduzione Assistita dal Calcolatore, Traduzione Collaborativa, Lessici elettronici, rappresentazione della conoscenza}, URL = {https://iris.cnr.it/handle/20.500.14243/345453}, } @TECHREPORT{ALBANESI_2018_TECHREPORT_ABGM_350504, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Marchi, S.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 13}, YEAR = {2018}, ABSTRACT = {La presente relazione tecnico-scientifica descrive l'attività svolta da ILC-CNR nel contesto del Progetto Traduzione Talmud Babilonese nel periodo novembre 2017-giugno 2018. Le due principali attività tecniche svolte su sistema Traduco sono la risoluzione di bug e l'implementazione di nuove funzionalità. Queste due attività sono fisiologicamente interrelate: di fatto, l'introduzione di nuove funzionalità implica inevitabilmente la possibilità di introdurre nuovi bug all'interno del sistema. Le attività di ricerca, come descritto nella sezione 4, sono state incentrate sulla rappresentazione della conoscenza talmudica}, URL = {https://iris.cnr.it/handle/20.500.14243/350504}, } @MISC{GIOVANNETTI_2018_MISC_GBM_370147, AUTHOR = {Giovannetti, E. and Bellandi, A. and Marchi, S.}, TITLE = {Ontology of Rabbis of the Babylonian Talmud-RDF version}, YEAR = {2018}, ABSTRACT = {The purpose of this research in progress is to build an ontology of the rabbis appearing in the Babylonian Talmud. The ontology, the construction of which is still in progress, will be shared as a Linked Open Data and linked to existing vocabularies (among which: Wikidata, DBpedia and VIAF). This work is being developed in the context of the Babylonian Talmud Translation Project, where more than 80 talmudists are working together at the translation of the Talmud in Italian, which will include notes and glossaries, and provide the biographies of the Talmudic Masters this ontology is being constructed from. The ontology will constitute the first portion of a more comprehensive Talmudic Knowledge Base where the text itself, the terminology, the entities and the concepts constituting the Babylonian Talmud will be formalized and linked to each other}, URL = {https://iris.cnr.it/handle/20.500.14243/370147}, } @ARTICLE{GIOVANNETTI_2017_ARTICLE_GABB_354702, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Benotto, G.}, TITLE = {Traduco: A collaborative web-based CAT environment for the interpretation and translation of texts}, YEAR = {2017}, ABSTRACT = {Traduco is a web-based collaborative tool aimed at supporting the translation of texts that pose particular challenging interpretative issues. Nowadays, Computer-Assisted Translation (CAT) tools are mainly applied to the translation of technical manuals or legislative texts and are aimed at speeding up the translation process. Traduco extends most of the standard components of a traditional CAT tool with specific features necessary to support the interpretation and translation of complex texts (like the Babylonian Talmud, that we here present as a case study), which pose particular comprehension issues. Traduco goes beyond the translation and its printing: it includes features for the addition of notes and annotations and the creation of glossaries. Translators, editors, supervisors, and end-users accessing Traduco are able to use components that can ease the translation process through the use of CAT technologies, the supervision and managing of the whole process of translation and publishing, the exporting of translations and notes in standard formats for desktop publishing software and TEI format, and, soon, the possibility to perform automatic linguistic analysis of the text. Moreover, Traduco allows the users to insert notes, comments, annotations, and bibliographical references. The design and development of Traduco required the adoption of a multidisciplinary approach, leveraging on advances in software engineering, computational linguistics, knowledge engineering, and publishing}, KEYWORDS = {computer-assisted translation, talmud, progetto traduzione del talmud babilonese}, PAGES = {47-62}, URL = {http://dsh.oxfordjournals.org/content/early/2016/10/26/llc.fqw054}, VOLUME = {32 (1)}, DOI = {10.1093/llc/fqw054}, ISSN = {2055-7671}, JOURNAL = {DIGITAL SCHOLARSHIP IN THE HUMANITIES}, } @INPROCEEDINGS{BELLANDI_2017_INPROCEEDINGS_BGPW_340692, AUTHOR = {Bellandi, A. and Giovannetti, E. and Piccini, S. and Weingart, A.}, TITLE = {Developing LexO: a Collaborative Editor of Multilingual Lexica and Termino-ontological Resources in the Humanities}, YEAR = {2017}, ABSTRACT = {In this paper we present a first version of LexO, a collaborative editor of multilingual lexica and termino-ontological resources. It is based on the lemon model, and aims at supporting lexicographers and terminologists in their work. Although the development of LexO is still ongoing, the editor is already being used within two research projects in the field of Computational Linguistics applied to Humanities: DiTMAO and Totus Mundus. This allowed to test the functionalities of LexO, and prove its high degree of flexibility according to the different extensions of the lemon model needed to fulfill the needs of the involved scholars}, KEYWORDS = {lexo, multi-lingual termino-ontological resources, DiTMAO, Totus Mundus}, URL = {http://www.aclweb.org/anthology/W17-7000}, CONFERENCE_NAME = {Workshop on Language, Ontology, Terminology and Knowledge Structures-LOTKS 2017}, BOOKTITLE = {Proceedings of Language, Ontology, Terminology and Knowledge Structures Workshop (LOTKS 2017)}, } @INPROCEEDINGS{DELGROSSO_2017_INPROCEEDINGS_DGM_335873, AUTHOR = {Del Grosso, A. M. and Giovannetti, E. and Marchi, S.}, TITLE = {The Importance of Being. Object-Oriented: Old Means for New Perspectives in Digital Textual Scholarship}, YEAR = {2017}, ABSTRACT = {In this contribution we propose an Object-Oriented (OO) approach to the design and development of reusable tools for the domain of scholarly editing. It regards some software engineering considerations about the importance of being object-oriented in implementing software applications for digital textual scholarship. This work fits into an ongoing discussion about textual modelling (Pierazzo 2015) where the need for extensible, reusable and modular applications is constantly increasing (Driscoll and Pierazzo 2016). Although the digital turn of textual scholarship is nowadays a reality and many advancements have been made in encoding and visualizing textual resources, flexible and shared models in the construction of tools for scholarly editing are still missing (Almas and Beaulieu 2013; Shillingsburg 2015; Robinson and Bordalejo 2016). This lack typically leads to the development of ad hoc-i. e. not reusable-software (Ciotti 2014; Schmidt 2014). Exploiting our experience in projects we worked on (e. g. Giovannetti et al. 2016; Abrate et al. 2014; Bozzi 2013; Del Grosso et al. 2013), we have conceived a general OO model that will be introduced in the following section (Del Grosso et al. 2016; Boschetti and Del Grosso 2015)}, KEYWORDS = {Digital Scholarly Editing, Web Application, Abstract Data Type}, PAGES = {269-274}, URL = {https://iris.cnr.it/handle/20.500.14243/335873}, VOLUME = {1}, ISBN = {9789088904837}, CONFERENCE_NAME = {Digital Scholarly Editing: Theory, Practice, Methods}, BOOKTITLE = {Advances in Digital Scholarly Editing}, } @INPROCEEDINGS{GIOVANNETTI_2017_INPROCEEDINGS_GABDD_340694, AUTHOR = {Giovannetti, E. and Albanesi, D. and Bellandi, A. and Dattilo, D. and Dell'Orletta, F.}, TITLE = {Stylometry in Computer-Assisted Translation: Experiments on the Babylonian Talmud}, YEAR = {2017}, ABSTRACT = {The purpose of this research is to experiment the application of stylometric techniques in the area of Computer-Assisted Translation to reduce the revision effort in the context of a collaborative, large scale translation project. The obtained results show a correlation between the editing extent and the compliance to some specific linguistic features, proving that supporting translators in writing translations following a desired style can actually reduce the number of following necessary interventions (and, consequently, save time) by revisors, editors and curators}, KEYWORDS = {traduco, babylonian talmud, computer-assisted translation, stylometry, readability}, PAGES = {177-182}, URL = {https://iris.cnr.it/handle/20.500.14243/340694}, PUBLISHER = {Accademia University Press (Torino, ITA)}, ISBN = {9788899982942}, CONFERENCE_NAME = {Fourth Italian Conference on Computational Linguistics (CLiC-it)}, CONFERENCE_PLACE = {Torino}, BOOKTITLE = {Proceedings of 4th Italian Conference on Computational Linguistics (CLiC-it)}, EDITOR = {Basili, R. and Nissim, M. and Satta, G.}, } @INPROCEEDINGS{DELGROSSO_2017_INPROCEEDINGS_DGM_339001, AUTHOR = {Del Grosso, A. M. and Giovannetti, E. and Marchi, S.}, TITLE = {Il modello a microkernel di Omega nello sviluppo di strumenti per lo studio dei testi: dagli ADT alle API}, YEAR = {2017}, KEYWORDS = {microkernel, studio del testo, Omega, ADT, API}, PAGES = {199-205}, URL = {https://iris.cnr.it/handle/20.500.14243/339001}, ISBN = {978-88-942535-1-1}, CONFERENCE_NAME = {AIUCD 2017 Conference}, } @TECHREPORT{ALBANESI_2017_TECHREPORT_ABGP_350499, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Pecchioli, A.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 11}, YEAR = {2017}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del Progetto Traduzione Talmud Babilonese in italiano nei mesi di novembre, dicembre 2016 e gennaio, febbraio 2017. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come l'undicesimo dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350499}, } @TECHREPORT{ALBANESI_2017_TECHREPORT_ABGPM_350502, AUTHOR = {Albanesi, D. and Bellandi, A. and Giovannetti, E. and Pecchioli, A. and Marchi, S.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 12}, YEAR = {2017}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del Progetto Traduzione Talmud Babilonese in italiano nei mesi di marzo, aprile, maggio e giugno 2017. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il dodicesimo dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350502}, } @MISC{ALBANESI_2017_MISC_ABBCDGCP_404165, AUTHOR = {Albanesi, D. and Bellandi, A. and Bulleri, F. and Carniani, E. and Dattilo, D. and Giovannetti, E. and Colombo, M. and Papini, M.}, TITLE = {Traduco}, YEAR = {2017}, ABSTRACT = {il Progetto Traduzione del Talmud Babilonese ha permesso di allestire una "officina digitale" specializzata nella traduzione di testi di particolare complessità interpretativa, quali, appunto, il Talmud Babilonese. Per la realizzazione della complessa opera di traduzione è stata costituita una équipe multidisciplinare che ha coinvolto traduttori, revisori di contenuto, redattori, curatori e grafici che, attraverso la piattaforma digitale Traduco hanno potuto lavorare congiuntamente sul testo da diversi luoghi del mondo. Traduco è uno strumento web collaborativo per la traduzione assistita di testi, per lo sviluppo del quale sono state condotte ricerche specifiche, sia nell'ambito dell'Ingegneria del Software che in quello della Linguistica Computazionale. Attraverso il lavoro di ricerca, è stato possibile mettere a punto un ambiente "intelligente" di supporto alla traduzione con caratteristiche innovative. Traduco ha consentito, come side effect positivo del processo vero e proprio di traduzione, di produrre innovazione tecnologica e scientifica}, KEYWORDS = {traduzione collaborativa, traduzione assistita dal calcolatore, linguistica computazionale, traduco, talmud babilonese}, URL = {https://iris.cnr.it/handle/20.500.14243/404165}, } @MISC{DELGROSSO_2017_MISC_DGM_340684, AUTHOR = {Del Grosso, A. M. and Giovannetti, E. and Marchi, S.}, TITLE = {Thinking like the "Modern Operating Systems": The Omega architecture and the Clavius on the Web project}, YEAR = {2017}, ABSTRACT = {The current digital turn in studying and analyzing historical documents results in both having machine actionable cultural data and providing software able to process them. However, these data and services often lack in integration strategies among them in order to be reused in other contexts different from the original ones. As pointed out by Franz Fischer in a worthy of note article: "There is no out-of-the-box software available for creating truly critical and truly digital editions at the same time" [1]. Likewise, Monica Berti stated that is now important to "build a model for representing quotations and text reuses of lost works in a digital environment" [2]. In this vision Bridget Almas is in charge of developing an integrated platform for collaboratively transcribing, editing, and translating historical documents and texts. She claimed that through this platform, called Perseids, students and scholars are able to create open source digital scholarly editions [3]. A number of interesting projects are currently under development to realize general models, digital services, and online tools that can be adopted as part of a long-term infrastructure for managing digital editions. Among Perseids and others, we cite as reference systems (a) the Textual Community project led by P. Robinson and B. Bordalejo, (b) the AustESE project led by the Australian eResearch group, (c) the Tagore Online Variorum "Bichitra" project led by Sukanta Chaudhuri, (d) Homer Multitext led by Neel Smith and Christopher Blackwell, (e) Sharing Ancient Wisdoms founded by the HERA network}, KEYWORDS = {Omega, object-oriented design, digital scholarly editing, clavius on the web}, URL = {https://iris.cnr.it/handle/20.500.14243/340684}, CONFERENCE_NAME = {Global Philology Open Conference}, } @MISC{GIOVANNETTI_2017_MISC_GD_350043, AUTHOR = {Giovannetti, E. and Del Grosso, A. M.}, TITLE = {LicoLab@LabexObvil}, YEAR = {2017}, ABSTRACT = {This talk illustrates some aspects of our research activities, specifically some outcomes carried out during designing and developing a digital environment for textual scholarship}, KEYWORDS = {digital humanities, computational philology, software engineering}, URL = {https://iris.cnr.it/handle/20.500.14243/350043}, } @MISC{PECCHIOLI_2017_MISC_PABMG_340687, AUTHOR = {Pecchioli, A. and Albanesi, D. and Bellandi, A. and Marchi, S. and Giovannetti, E.}, TITLE = {Elaborazione del linguaggio naturale (NLP) in Ebraico: il caso dell'analisi linguistica automatica applicata all'ebraico mishnaico del Talmud}, YEAR = {2017}, ABSTRACT = {The paper briefly introduces the field of Digital Humanities (i. e. the intersection of digital technologies and disciplines of humanities) and provides some examples of digital applications in the area of jewish studies. The Progetto Traduzione Talmud Babilonese (PTTB) project, aimed at producing the first complete Italian translation of the Babylonian Talmud, then will be presented. The translation is being carried out with the help of "Traduco", an innovative, collaborative, computer-assisted translation (CAT) tool developed at the Istituto di Linguistica Computazionale of Consiglio Nazionale delle Ricerche (ILC-CNR) in Pisa. In particular, the paper will focus on what is automatic linguistic analysis, why it's being integrated in one of the components of "Traduco" and its application to the mishnaic language. Even if we are at the very beginning of the construction of the tool, this research activity have exposed all the peculiarities of the mishnaic language and the problems arising from the lacking of resources and tools for the processing of this language. Finally, we will show the two main use cases leveraging on the obtained analysis, namely the improvement of the automatic suggestions component and the linguistic based querying of the annotated talmudic corpus}, KEYWORDS = {traduco, nlp, Mishanic Hebrew, talmud}, URL = {http://aisg.cise.unipi.it/Materia-giudaica-2018/018-Pecchioli%20pp%20281-292B.pdf}, CONFERENCE_NAME = {Nuovi studi sull'Ebraismo-XXXI Convegno AISG 2017}, } @MISC{PICCINI_2017_MISC_PMG_330935, AUTHOR = {Piccini, S. and Marchi, S. and Giovannetti, E.}, TITLE = {Étudier le structuralisme par le structuralisme: expériences de sémantique distributionnelle dans la construction d'un lexique électronique de la terminologie saussurienne}, YEAR = {2017}, ABSTRACT = {En 2010-2011, le premier lexique électronique dédié à la terminologie linguistique saussurienne a été créé [1] dans le cadre d'un projet de recherche intitulé « Pour une édition numérique des manuscrits de Ferdinand de Saussure », projet coordonné par le Professeur Gambarara. La première étape de construction de la ressource lexicale a consisté en l'identification manuelle dans les textes des termes clés du vocabulaire saussurien et de leurs propriétés sémantiques. L'informatique n'est intervenue que dans la phase de formalisation des données extraites. C'est pourquoi nous nous proposons d'illustrer ici la possibilité de recourir à des techniques automatiques et, en particulier, à des algorithmes de sémantique distributionnelle [2] pour identifier les relations que les termes entretiennent entre eux dans le texte. La méthodologie sous-jacente est basée sur l'hypothèse distributionnelle selon laquelle plus deux mots sont sémantiquement proches, plus ils ont tendance à se produire dans des contextes similaires. Le lexique d'un texte est considéré comme un espace métrique où chaque mot peut être représenté comme un vecteur à n dimensions, chacune d'elles enregistrant le nombre de fois que ce mot apparaît dans un contexte donné. La proximité spatiale entre deux vecteurs indique la similarité sémantique entre deux mots. Elle est calculée par le cosinus de l'angle compris entre les deux vecteurs: plus la valeur du cosinus est grande, plus les termes sont, en principe, sémantiquement similaires. Les techniques computationnelles ont été appliquées aux mêmes textes à partir desquels le lexique électronique a été construit: le Cours de linguistique générale [3], les Écrits de linguistique générale [4] et le Recueil des publications scientifiques [5]. Bien qu'au stade préliminaire, l'expérience a permis d'obtenir des résultats intéressants. À titre d'exemple, nous présentons ci-dessous (Tableau) les valeurs de similitude obtenues par l'algorithme entre le terme signe et d'autres mots dans les textes. Si l'on compare les résultats avec l'entrée du lexique signe, on peut remarquer que l'algorithme est en mesure de détecter un grand nombre de liens explicités dans la ressource et de suggérer, en outre, des relations possibles avec d'autres termes comme valeur, rapport, idée. L'application de ces techniques computationnelles au corpus saussurien peut donc constituer une aide précieuse non seulement pour les lexicographes mais également pour les experts du domaine en faisant émerger des connections qui n'apparaissent pas immédiatement de manière explicite et en suggérant ainsi des parcours alternatifs d'analyse de la pensée de l'auteur}, KEYWORDS = {structuralisme, sémantique distributionnelle, terminologie saussurienne, lexique électronique}, URL = {https://iris.cnr.it/handle/20.500.14243/330935}, CONFERENCE_NAME = {Atelier "Les manuscrits de Saussure, parmi d'autres. Problèmes, stratégies et solutions d'édition pour les archives numériques"}, } @MISC{WEINGART_2017_MISC_WBG_340685, AUTHOR = {Weingart, A. and Bellandi, A. and Giovannetti, E.}, TITLE = {Representing Multilingualism and Multiwords in a Lemon Old Occitan Medico-Botanical Lexicon}, YEAR = {2017}, ABSTRACT = {This article illustrates the progresses made in representing a multilingual and multi-alphabetical Old Occitan medico-botanical lexicon in the context of project DiTMAO. The chosen lexical model of reference is lemon, that has been extended accordingly to some specific linguistic and lexical features of the lexicon. In particular, issues and solutions about the modelling of multilingual and multiword phenomena are discussed, as the way they will be managed through LexO, a web editor developed in the context of the project}, KEYWORDS = {lemon model, RDF, multilingualism, multiwords, multialphabet, historical lexicon, medico-botanical terminology, Old Occitan, Hebrew, Arabic, LexO Web editor}, URL = {https://iris.cnr.it/handle/20.500.14243/340685}, CONFERENCE_NAME = {Third International Workshop on Semantic Web for Scientific Heritage (SW4SH 2017)}, } @MISC{WEINGART_2017_MISC_WG_338563, AUTHOR = {Weingart, A. and Giovannetti, E.}, TITLE = {From canabo to Cannabis sativa L.: Modelling Diachronic Termino-ontological Resources in the Context of DiTMAO}, YEAR = {2017}, ABSTRACT = {The paper aims at contributing to the understanding of the Medieval Brain from a knowledge engineering perspective. As the brain is conceived as locus of cognition and knowledge in medieval medicine, we want to focus on the representation of medieval medico-botanical knowledge by means of a three-level text-termino-ontological resource. The resource is based on lemon (a model for the representation of lexica as RDF) and a set of ontologies represented in OWL and consists of (i) a medieval termino-ontological resource, (ii) a modern termino-ontological resource and (iii) a documentation corpus. It is developed and implemented within the DFG-funded project "Dictionnaire de Termes Médico-botaniques de l'Ancien Occitan" (DiTMAO). In an introductory part we will briefly introduce the aims of the project and the particularities of the corpus. The corpus consists of medical monographs in Latin script but also of so-called synonym lists in Hebrew script. These lists can be described as ancient multilingual dictionaries, in our case of Old Occitan, (Judaeo-)Arabic, Hebrew, Latin or other Romance languages and sometimes Greek and Aramaic, and they are of particular importance because the equivalent terms in other ancient languages help to determine the meaning of otherwise opaque Old Occitan terms. After introducing the three components of the resource, given some examples from our corpus, we elaborate, in the main part of paper, a solution to the problem of representing the relation between medieval medical terms or concepts and their ancient and modern correspondences. The problem concerns in particular the process of determining the terms´ meaning through the documentation of each term in corpus-external dictionaries and editions, and how this process can be represented in a comprehensive and transparent way. We propose to relate the terms of the medieval termino-ontological resource at a lexical level using relations such as synonymy or sublemma. The connections between modern and medieval terms, like a translation into modern English, will be mediated by the documentation corpus. As for modern scientific terms, we opt for an ontological connection. These types of connections will be exemplified with (mainly) plant names from our corpus. For example, a medieval term has a referent in the medieval ontology, structuring the botanic world as conceived by a "medieval brain" by giving the medieval classifications e. g. the primary qualities. This ontological entity is related to a referent of a modern scientific name, given that the documentation of the medieval term provides such information. We will argue that a clear separation of datasets (medieval and modern) allows for the diachronic study of the evolution of terminology and, more importantly for this context, paves the way for the analysis of the changes in the cognitive representation of what those terms actually refer to}, KEYWORDS = {lexica, multi-language lexica, termino-ontological resource, ancient occitan}, URL = {https://themedievalbrain.wordpress.com/}, CONFERENCE_NAME = {The Medieval Brain Conference}, } @ARTICLE{BELLANDI_2016_ARTICLE_BABG_354700, AUTHOR = {Bellandi, A. and Albanesi, D. and Benotto, G. and Giovannetti, E.}, TITLE = {Il Sistema Traduco nel Progetto Traduzione del Talmud Babilonese}, YEAR = {2016}, ABSTRACT = {Nell'ambito del Progetto Traduzione del Talmud Babilonese, l'Istituto di Linguistica Computazionale del CNR ha sviluppato Traduco, uno strumento web collaborativo con alcune caratteristiche che lo rendono particolarmente adatto alla traduzione di testi che pongono problemi interpretativi. Ad oggi, gli strumenti per la traduzione assistita (in inglese, Computer-Assisted Translation, o CAT) sono utilizzati tipicamente per la traduzione di manuali tecnici, testi legislativi o siti Web e hanno principalmente lo scopo di accelerare il processo di traduzione. Traduco riprende la maggior parte dei componenti standard di uno strumento di traduzione assistita tradizionale, ma li estende con caratteristiche specifiche necessarie per supportare l'interpretazione e la traduzione di testi complessi che pongono particolari problemi di comprensione. In questo articolo presenteremo un caso di studio specifico, relativo a un testo con queste caratteristiche: il Talmud Babilonese. Traduco include funzionalità per l'aggiunta di note, riferimenti bibliografici, annotazioni semantiche e creazione di glossari. Traduttori, revisori, redattori, supervisori e utenti finali che accedono al Sistema sono supportati nell'intero processo di traduzione, che va dall'interpretazione del testo originario alla fase ditoriale per la stampa delle traduzioni, attraverso l'uso di tecnologie di traduzione assistita, l'annotazione semantica del testo, l'arricchimento delle traduzioni con informazioni esplicative, l'esportazione delle traduzioni in XML e in TEI e l'integrazione di tecniche per il trattamento automatico della lingua. La progettazione e lo sviluppo di Traduco ha richiesto l'adozione di un approccio multidisciplinare che combina aspetti di ingegneria del software, linguistica computazionale, ingegneria della conoscenza ed editoria digitale}, KEYWORDS = {traduco, traduzione-assistita, talmud}, PAGES = {109-126}, URL = {https://journals.openedition.org/ijcol/404}, VOLUME = {2 (2)}, ISSN = {2499-4553}, JOURNAL = {IJCOL}, } @INCOLLECTION{WEINGART_2016_INCOLLECTION_WG_354705, AUTHOR = {Weingart, A. and Giovannetti, E.}, TITLE = {Extending the Lemon Model for a Dictionary of Old Occitan Medico-Botanical Terminology}, YEAR = {2016}, ABSTRACT = {The article presents the adaptation of the lemon model (a model for lexica as RDF data) for a multilingual and multi-alphabetical lexicon of Old Occitan medico-botanical terminology. The lexicon is the core component of an ontology-based information system that will be constructed and implemented within the DFG-funded project "Dictionnaire des Termes Medico-botaniques de l'Ancien Occitan" (DiTMAO). The difficulties for the lemmatization raised by the particularities of the corpus (terms in Latin, Hebrew and Arabic script and corresponding terms in other ancient languages, mostly Hebrew and Arabic) can be perfectly solved by extending the basic properties of lemon and introducing domain specific vocabulary}, KEYWORDS = {Lemon model, RDF, Multilingual, Multi-alphabetical, Historical lexicon, Medico-Botanical terminology, Old occitan, Hebrew, Arabic}, PAGES = {408-421}, URL = {http://link.springer.com/chapter/10.1007/978-3-319-47602-5_53}, DOI = {10.1007/978-3-319-47602-5_53}, ISBN = {978-3-319-47601-8}, BOOKTITLE = {The Semantic Web}, EDITOR = {Sack, H. and Rizzo, G. and Steinmetz, N. and Mladenić, D. and Auer, S. and Lange, C.}, } @INPROCEEDINGS{BELLANDI_2016_INPROCEEDINGS_BBDG_354708, AUTHOR = {Bellandi, A. and Benotto, G. and Di Segni, G. and Giovannetti, E.}, TITLE = {Investigating the Application and Evaluation of Distributional Semantics in the Translation of Humanistic Texts: a Case Study}, YEAR = {2016}, ABSTRACT = {Digital Humanities are persisting ascending and the need for translating humanistic texts using Computer Assisted Translation (CAT) tools demands for a specific investigation both of the available technologies and of the evaluation techniques. Indeed, humanistic texts can present deep differences from texts that are usually translated with CAT tools, due to complex interpretative issues, the request of heavy rephrasing, and the addition of explicative parts in order to make the translation fully comprehensible to readers and, also, stylistically pleasant to read. In addition, these texts are often written in peculiar languages for which no linguistic analysis tool can be available. We faced this situation in the context of the project for the translation of the Babylonian Talmud from Ancient Hebrew and Aramaic into Italian. In this paper we describe a work in progress on the application of distributional semantics to the informing of the Translation Memory, and on the evaluation issues arising from its assessment}, KEYWORDS = {computer-assisted translation, distributional semantics, talmud}, PAGES = {6-11}, URL = {http://www.lrec-conf.org/proceedings/lrec2016/workshops/LREC2016Workshop-NLP4TM_Proceedings.pdf}, PUBLISHER = {European Language Resources Association ELRA (Paris, FRA)}, CONFERENCE_NAME = {2nd Workshop on Natural Language Processing for Translation Memories (NLP4TM 2016)}, CONFERENCE_PLACE = {Paris}, BOOKTITLE = {Proceedings of the 2nd Workshop on Natural Language Processing for Translation Memories (NLP4TM 2016)}, } @INPROCEEDINGS{BENOTTO_2016_INPROCEEDINGS_BGM_354707, AUTHOR = {Benotto, G. and Giovannetti, E. and Marchi, S.}, TITLE = {Investigating the Application of Distributional Semantics to Stylometry}, YEAR = {2016}, ABSTRACT = {The inclusion of semantic features in the stylometric analysis of literary texts appears to be poorly investigated. In this work, we experiment with the application of Distributional Semantics to a corpus of Italian literature to test if words distribution can convey stylistic cues. To verify our hypothesis, we have set up an Authorship Attribution experiment. Indeed, the results we have obtained suggest that the style of an author can reveal itself through words distribution too}, KEYWORDS = {NLP for Digital Humanities, Stilometry, Distributional Semantic}, PAGES = {61-65}, URL = {https://drive.google.com/open?id=0B0sEp2O7Oo7feVJLdHI3YXBxdTg}, PUBLISHER = {Accademia University Press (Torino, ITA)}, ISBN = {9788899982089}, CONFERENCE_NAME = {Third Italian Conference on Computational Linguistics}, CONFERENCE_PLACE = {Torino}, BOOKTITLE = {Proceedings of Third Italian Conference on Computational Linguistics (CLiC-it 2016)}, } @INPROCEEDINGS{BENOTTO_2016_INPROCEEDINGS_BGN_333396, AUTHOR = {Benotto, G. and Giovannetti, E. and Nahli, O.}, TITLE = {An application of distributional semantics for the analysis of the Holy Quran}, YEAR = {2016}, ABSTRACT = {In this contribution we illustrate the methodology and the results of an experiment we conducted by applying Distributional Semantics Models to the analysis of the Holy Quran. Our aim was to gather information on the potential differences in meanings that the same words might take on when used in Modern Standard Arabic w. r. t. their usage in the Quran. To do so we used the Penn Arabic Treebank as a contrastive corpus}, KEYWORDS = {Distributional Semantics, the Holy Quran, Classical Arabic, Modern Standard Arabic, Contrastive Linguistics}, PAGES = {374-379}, URL = {http://ieeexplore.ieee.org/document/7805074/}, DOI = {10.1109/CIST.2016.7805074}, ISBN = {978-1-5090-0751-6}, CONFERENCE_NAME = {4th (IEEE) International Colloquium on Information Science and Technology, CiSt 2016}, BOOKTITLE = {2016 4th IEEE International Colloquium on Information Science and Technology (CiSt)}, EDITOR = {El Mohajir and Mohammed and Chahhou and Mohamed and Al Achhab and Badr, E.}, } @INPROCEEDINGS{KHAN_2016_INPROCEEDINGS_KBBFGR_322088, AUTHOR = {Khan, A. F. A. and Bellandi, A. and Benotto, G. and Frontini, F. and Giovannetti, E. and Reboul, M.}, TITLE = {Leveraging a narrative ontology to query a literary text}, YEAR = {2016}, ABSTRACT = {In this work we propose a model for the representation of the narrative of a literary text. The model is structured in an ontology and a lexicon constituting a knowledge base that can be queried by a system. This narrative ontology, as well as describing the actors, locations, situations found in the text, provides an explicit formal representation of the timeline of the story. We will focus on a specific case study, that of the representation of a selected portion of Homer's Odyssey, in particular of the knowledge required to answer a selection of salient queries, formulated by a literary scholar. This work is being carried out within the framework of the Semantic Web by adopting models and standards such as RDF, OWL, SPARQL, and lemon among others}, URL = {https://iris.cnr.it/handle/20.500.14243/322088}, DOI = {10.4230/OASIcs.CMN.2016.10}, } @INPROCEEDINGS{PICCINI_2016_INPROCEEDINGS_PBBG_371091, AUTHOR = {Piccini, S. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {La modellazione diacronica di risorse termino-ontologiche nell'ambito delle digital humanities: Esperimenti su clavius}, YEAR = {2016}, ABSTRACT = {In this work, we present an experiment in the modeling of a diachronic termino-ontological resource named CLAVIUS through both the N-ary relations model and the 4D-fluents approach. Some of the salient differences of these two models are discussed. The overall objective of this research is to illustrate the main advantages and disadvantages in the adoption of a given model to build diachronic resources}, KEYWORDS = {Diachronic terminology, termino-ontological resources, n-ary models, perdurantist models}, PAGES = {205-245}, URL = {http://www.scopus.com/record/display.url?eid=2-s2.0-85009289234\&origin=inward}, VOLUME = {1749}, PUBLISHER = {Accademia University Press (Torino, ITA)}, ISBN = {9788899982089}, CONFERENCE_NAME = {Third Italian Conference on Computational Linguistics}, CONFERENCE_PLACE = {Torino}, } @INPROCEEDINGS{PICCINI_2016_INPROCEEDINGS_PGBR_264622, AUTHOR = {Piccini, S. and Giovannetti, E. and Bellandi, A. and Ruimy, N.}, TITLE = {Le lexique électronique de la terminologie de Ferdinand de Saussure: une première}, YEAR = {2016}, ABSTRACT = {Le Projet italien intitulé "Per un'edizione digitale dei manoscritti di Ferdinand de Saussure" a pour objectif la création d'un prototype d'édition numérique des textes du grand linguiste genevois, réalisé à partir d'une sélection de ses documents autographes. Dans ce projet, l'un des volets novateurs est la création du premier thésaurus-lexique électronique de la terminologie linguistique Saussurienne. Afin de réaliser cette base de connaissance, nous nous sommes inspirés du modèle lexical SIMPLE qui a permis le développement de vastes lexiques sémantiques informatisés, et l'avons adapté aux exigences de notre domaine de la connaissance. Le lexique réalisé a été conçu dans le but d'offrir un outil performant pour les études saussuriennes. Il fournit en effet une représentation structurée de la terminologie de Saussure, une définition du contenu sémantique de chacun des termes ainsi qu'un cadre explicite de la nature et de l'importance des liens qui les unissent. Ce faisceau d'informations devrait donc contribuer de manière significative à mieux maîtriser le vocabulaire saussurien et, partant, à éclairer certains aspects originaux de la pensée du père de la linguistique moderne}, KEYWORDS = {Saussure, lessici computazionali, ontologie}, PAGES = {255-267}, URL = {http://www.atilf.fr/cilpr2013/actes/section-16/CILPR-2013-16-Piccini-Giovannetti-Bellandi-Ruimy.pdf}, ISBN = {979-10-91460-32-3}, CONFERENCE_NAME = {XXVII Congrès international de linguistique et de philologie romanes}, BOOKTITLE = {Section 16: Projets en cours; ressources et outils nouveaux}, EDITOR = {Trotter, D. and Bozzi, A. and Fairon, C.}, } @INPROCEEDINGS{WEINGART_2016_INPROCEEDINGS_WG_354709, AUTHOR = {Weingart, A. and Giovannetti, E.}, TITLE = {A lexicon for Old Occitan medico-botanical terminology in lemon}, YEAR = {2016}, ABSTRACT = {The article presents the adaptation of the lemon model (a model for lexica as RDF data) for a multilingual and multi-alphabetical lexicon of Old Occitan medico-botanical terminology. The lexicon is the core component of an ontology-based information system that will be constructed and implemented within the DFG-funded project "Dictionnaire de Termes Médico-botaniques de l'Ancien Occitan" (DiTMAO). The difficulties for the lemmatization raised by the particularities of the corpus (terms in Latin, Hebrew and Arabic script and corresponding terms in other ancient languages, mostly Hebrew and Arabic) can be perfectly solved by extending the basic properties of lemon and introducing domain specific vocabulary}, KEYWORDS = {lemon model, RDF, multilingual, multi-alphabetical, historical lexicon, medico-botanical terminology, Old Occitan, Hebrew, Arabic}, PAGES = {25-36}, URL = {http://www.scopus.com/record/display.url?eid=2-s2.0-84978818653\&origin=inward}, VOLUME = {1595}, CONFERENCE_NAME = {Second International Workshop on Semantic Web for Scientific Heritage (SW4SH 2016)}, } @INPROCEEDINGS{DELGROSSO_2016_INPROCEEDINGS_DAGM_316981, AUTHOR = {Del Grosso, A. M. and Albanesi, D. and Giovannetti, E. and Marchi, S.}, TITLE = {Defining the Core Entities of an Environment for Textual Processing in Literary Computing}, YEAR = {2016}, KEYWORDS = {Digital Humanities, Literary Computing, Software Engineering, Object Oriented Design and Development}, URL = {http://dh2016.adho.org/abstracts/425}, ISBN = {978-83-942760-3-4}, CONFERENCE_NAME = {Digital Humanities Conference}, } @INPROCEEDINGS{DELGROSSO_2016_INPROCEEDINGS_DBMG_316984, AUTHOR = {Del Grosso, A. M. and Boschetti, F. and Marchi, S. and Giovannetti, E.}, TITLE = {Vantaggi dell'Astrazione attraverso l'Approccio Orientato agli Oggetti per il Digital Scholarly Editing}, YEAR = {2016}, KEYWORDS = {Object Oriented Design, ADT, Digital Textual Scholarship}, URL = {http://www.himeros.eu/aiucd2016/c33.pdf}, DOI = {10.6092/unibo/amsacta/5559}, ISBN = {978-88-942535-0-4}, CONFERENCE_NAME = {Quinto Convegno Annuale AIUCD. Edizioni digitali: rappresentazione, interoperabilità, analisi del testo e infrastrutture}, } @INPROCEEDINGS{MARCHETTI_2016_INPROCEEDINGS_MABBGMP_323894, AUTHOR = {Marchetti, A. and Abrate, M. and Bacciu, C. and Bellandi, A. and Giovannetti, E. and Mancini, L. and Piccini, S.}, TITLE = {When Traditional Ontologies are not Enough: Modelling and Visualizing Dynamic Ontologies in Semantic-Based Access to Texts}, YEAR = {2016}, ABSTRACT = {The work described in this paper came about as a result of reflections made within the "Clavius on the web" Project, which studied the correspondence between the Jesuit mathematician and also astronomer and some important scientists of his century, such as Galileo and Brahe. One of the main aims of the project is to make it possible for students and scholars to access the texts on a semantic basis, in order to allow a deeper understanding of the often complex content, they convey. Texts are often the unique source that scholars have at their disposal in order to be able to reconstruct and more completely understand the past author's thought. In order for technology to come to the aid of scholars in this effort, the concepts evoked within the text, as well as the terms representing these concepts need to 1) have a structured organization 2) be explicitly and univocally represented and 3) be defined through the relationships that unite them. In order to achieve this, we chose to adopt an ontology based model, as ontologies are a de facto standard for knowledge representation. Interestingly, the choice to use ontologies raised some issues, also with regard to theoretical aspects: indeed, standard ontological formalisms usually static and crisp proved to be inadequate in modelling the complexity of the knowledge conveyed by the analysed texts. As a result, more refined models as well as appropriate graphical representations needed to be introduced so that computers would be able to process these ontologies and visualize them in a way that students and scholars could understand and work with them}, KEYWORDS = {Data Visualization, Information Visualization, knowledge engineering, Ontologies}, PAGES = {1-5}, URL = {http://dh2016.adho.org/abstracts/324}, CONFERENCE_NAME = {Digital Humanities 2016}, } @TECHREPORT{ALBANESI_2016_TECHREPORT_ABBGP_350494, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E. and Pecchioli, A.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 9}, YEAR = {2016}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC­CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" (vedi sezione "Pubblicazioni relative al PTTB") in italiano nei mesi di marzo, aprile, maggio e giugno 2016. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC­CNR e si configura come il nono dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350494}, } @TECHREPORT{ALBANESI_2016_TECHREPORT_ABBGP_350498, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E. and Pecchioli, A.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 10}, YEAR = {2016}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" (vedi sezione "Pubblicazioni relative al PTTB") in italiano nei mesi di luglio, agosto, settembre e ottobre 2016. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il decimo dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350498}, } @INPROCEEDINGS{ALBANESI_2015_INPROCEEDINGS_ABBDG_289694, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Di Segni, G. and Giovannetti, E.}, TITLE = {When Translation Requires Interpretation: Collaborative Computer-Assisted Translation of Ancient Texts}, YEAR = {2015}, ABSTRACT = {This paper introduces the main features of Traduco, a Web-based, collaborative Computer-Assisted Translation (CAT) tool developed to support the translation of ancient texts. In addition to the standard components offered by traditional CAT tools, Traduco includes a number of features designed to ease the translation of ancient texts, such as the Babylonian Talmud, posing specific structural, stylistic, linguistic and hermeneutical challenges}, KEYWORDS = {Computer-Assisted Translation, Babylonian Talmud}, PAGES = {84-88}, URL = {https://iris.cnr.it/handle/20.500.14243/289694}, ISBN = {978-1-941643-63-1}, CONFERENCE_NAME = {9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2015)}, BOOKTITLE = {Proceedings of the 9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities}, } @INPROCEEDINGS{BELLANDI_2015_INPROCEEDINGS_BBG_264615, AUTHOR = {Bellandi, A. and Bellusci, A. and Giovannetti, E.}, TITLE = {Computer Assisted Translation of Ancient Texts: the Babylonian Talmud Case Study}, YEAR = {2015}, ABSTRACT = {In this paper we introduce some of the features of the Computer Assisted Translation web application developed to support the translation of the Babylonian Talmud (BT) in Italian. The BT is a late antique Jewish anthological corpus, which, as other ancient texts, presents a number of hurdles related to its intrinsic linguistic and philological nature. In this work, we illustrate the solutions we adopted in the system, with particular emphasis on the Translation Memory and the translation suggestion component}, KEYWORDS = {computer-assisted translation, Babylonian Talmud, Translation Memory}, PAGES = {287-302}, URL = {https://www.degruyter.com/view/book/9781501501289/10.1515/9781501501289.287.xml}, DOI = {10.1515/9781501501289}, PUBLISHER = {De Gruyter Saur (Berlin/Munich, DEU)}, ISBN = {9781501501289}, CONFERENCE_NAME = {NLPCS 2014: 11th International Workshop on Natural Language Processing and Cognitive Science}, CONFERENCE_PLACE = {Berlin/Munich}, BOOKTITLE = {Natural Language Processing and Cognitive Science, Proceedings 2014}, EDITOR = {Sharp, B. and Delmonte, R.}, } @INPROCEEDINGS{ALBANESI_2015_INPROCEEDINGS_ABBG_302509, AUTHOR = {Albanesi, A. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {Translation, Annotation and Knowledge Modelling of the Babylonian Talmud: the Traduco System}, YEAR = {2015}, ABSTRACT = {In this work, we are going to present the Traduco System, a collaborative web-based application for the translation of the Babylonian Talmud (BT) into Italian. The System has been designed around a Computer-Assisted Translation (CAT) component, constituting its core. However, Traduco is not limited to assist the translation process and to provide printing functionalities. In fact, it allows linguistic and semantic annotations and advanced searches, paving the way to the construction of a talmudic knowledge base. In order to achieve these results, the Traduco development process abided by a model that took into account aspects of Natural Language Processing and Knowledge Engineering. The component based architectural structure was implemented using the object oriented Java 2 Enterprise Edition framework}, KEYWORDS = {Computer-Assisted Translation, Interpretation, Semantic Annotation, Babylonian Talmud}, URL = {https://dh-abstracts.library.virginia.edu/works/2399}, CONFERENCE_NAME = {Digital Humanities 2015}, } @TECHREPORT{ALBANESI_2015_TECHREPORT_ABBG_350489, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 5}, YEAR = {2015}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il quinto dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350489}, } @TECHREPORT{ALBANESI_2015_TECHREPORT_ABBG_350491, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 6}, YEAR = {2015}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano [1, 2, 3]. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il sesto dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350491}, } @TECHREPORT{ALBANESI_2015_TECHREPORT_ABBG_350492, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 7}, YEAR = {2015}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC­CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" (vedi sezione "Pubblicazioni relative al PTTB") in italiano nei mesi di luglio, agosto, settembre e ottobre 2015. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC­CNR e si configura come il settimo dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350492}, } @INPROCEEDINGS{ABRATE_2014_INPROCEEDINGS_AMGLLMMPP_264619, AUTHOR = {Abrate, M. and M Del Grosso, A. and Giovannetti, E. and Lo Duca, A. and Luzzi, D. and Mancini, L. and Marchetti, A. and Pedretti, I. and Piccini, S.}, TITLE = {Sharing Cultural Heritage: the Clavius on the Web Project}, YEAR = {2014}, ABSTRACT = {In the last few years the amount of manuscripts digitized and made available on the Web has been constantly increasing. However, there is still a considarable lack of results concerning both the explicitation of their content and the tools developed to make it available. The objective of the Clavius on the Web project is to develop a Web platform exposing a selection of Christophorus Clavius letters along with three different levels of analysis: linguistic, lexical and semantic. The multilayered annotation of the corpus involves a XML-TEI encoding followed by a tokenization step where each token is univocally identified through a CTS urn notation and then associated to a part-of-speech and a lemma. The text is lexically and semantically annotated on the basis of a lexicon and a domain ontology, the former structuring the most relevant terms occurring in the text and the latter representing the domain entities of interest (e. g. people, places, etc.). Moreover, each entity is connected to linked and non linked resources, including DBpedia and VIAF. Finally, the results of the three layers of analysis are gathered and shown through interactive visualization and storytelling techniques. A demo version of the integrated architecture was developed}, KEYWORDS = {language technologies for digital cultural heritage, lexica and ontologies, data visualization}, PAGES = {8}, URL = {https://iris.cnr.it/handle/20.500.14243/264619}, ISBN = {978-2-9517408-8-4}, CONFERENCE_NAME = {LREC 2014-The 9th edition of the Language Resources and Evaluation Conference}, BOOKTITLE = {LREC 2014 Proceedings}, } @INPROCEEDINGS{BELLANDI_2014_INPROCEEDINGS_BABBG_253556, AUTHOR = {Bellandi, A. and Albanesi, D. and Bellusci, A. and Bozzi, A. and Giovannetti, E.}, TITLE = {The Talmud System: a Collaborative Web Application for the Translation of the Babylonian Talmud Into Italian}, YEAR = {2014}, URL = {https://iris.cnr.it/handle/20.500.14243/253556}, PUBLISHER = {Pisa University Press srl (Pisa, ITA)}, ISBN = {978-8-86741-472-7}, CONFERENCE_NAME = {First Italian Conference on Computational Linguistics (CLiC-it 2014)}, CONFERENCE_PLACE = {Pisa}, BOOKTITLE = {Proceedings of the First Italian Conference on Computational Linguistics (CLiC-it 2014)}, EDITOR = {Basili, R. and Lenci, A. and Magnini, B.}, } @INPROCEEDINGS{BELLANDI_2014_INPROCEEDINGS_BBCG_264618, AUTHOR = {Bellandi, A. and Bellusci, A. and Cappelli, A. and Giovannetti, E.}, TITLE = {Graphic visualization in literary text interpretation}, YEAR = {2014}, ABSTRACT = {We here illustrate a possible approach combining existing technologies for Natural Language Processing (NLP), Knowledge Representation and Reasoning (KRR) and Data Visualization in a coherent Decision Support System (DSS). The approach to the development of the system we are working on can be articulated in two main steps: the customization and integration of existing tools for automatic text annotation (at least linguistic, lexicographic and semantic) and the construction of a user-friendly and highly expressive GUI. The interface should allow a user to: upload her/his own text, run the desired annotation tools, visually interact with the resulting multilayered network to: i) proof-read the results of the automatic annotations, ii) manually add missing elements and/or relations between elements and, finally, iii) formulate and verify specific interpretative hypotheses}, KEYWORDS = {Computational hermeneutics, Text processing, Knowledge representation and reasoning, Data visualization}, PAGES = {392-397}, URL = {https://ieeexplore.ieee.org/document/6902939}, DOI = {10.1109/IV.2014.62}, PUBLISHER = {IEEE (New York, USA)}, ISBN = {978-1-4799-4103-2}, CONFERENCE_NAME = {IV 2014-18th International Conference on Information Visualisation}, CONFERENCE_PLACE = {New York}, BOOKTITLE = {2014 18th International Conference on Information Visualisation-IV 2014. Proceedings}, EDITOR = {Banissi, E. and Bannatyne, M. W. M. and Marchese, F. T. and Sarfraz, M. and Ursyn, A. and Venturini, G. and Wyeld, T. G. and Cvek, U. and Trutschl, M. and Grinstein, G. and Geroimenko, V. and Kenderdine, S. and Bouali, F.}, } @INPROCEEDINGS{BELLANDI_2014_INPROCEEDINGS_BBCG_264621, AUTHOR = {Bellandi, A. and Bellusci, A. and Carniani, E. and Giovannetti, E.}, TITLE = {Content Elicitation: Towards a New Paradigm for the Analysis and Interpretation of Texts}, YEAR = {2014}, ABSTRACT = {In this paper we show how semantic technologies can be exploited, with the help of user friendly interfaces, to identify and structure the knowledge embedded in literary texts. The proposed approach, that we have called Content Elicitation, supports the experts in defining hierarchical and associative relationships between semantically annotated chunks of text denoting relevant entities, allowing visual structuring of knowledge, which can be edited by different experts in a collaborative way. This knowledge, formally coded as an ontology, can then be used by scholars and students as a guide for the analysis of the text and for the discovery of potential novel interpretations. We are testing and evaluating this approach on the Babylonian Talmud, due to its historical, linguistic, semantic and structural richness}, KEYWORDS = {semantic annotation, knowledge representation, text ontology, content elicitation, literary computing, da}, URL = {https://iris.cnr.it/handle/20.500.14243/264621}, DOI = {10.2316/P.2014.810-031}, PUBLISHER = {Acta press (Calgary, CAN)}, CONFERENCE_NAME = {The 13th IASTED International Conference on Software Engineering}, CONFERENCE_PLACE = {Calgary}, EDITOR = {Hamza, M. H.}, } @INPROCEEDINGS{BELLUSCI_2014_INPROCEEDINGS_BBBCGM_253555, AUTHOR = {Bellusci, A. and Bellandi, A. and Benotto, G. and Cappelli, A. and Giovannetti, E. and Marchi, S.}, TITLE = {Towards a decision support system for text interpretation}, YEAR = {2014}, ABSTRACT = {This article illustrates the first steps towards the implementation of a Decision Support System aimed to recreate a research environment for scholars and provide them with computational tools to assist in the processing and interpretation of texts. While outlining the general characteristics of the system, the paper presents a minimal set of user requirements and provides a possible use case on Dante's Inferno}, KEYWORDS = {DDS, XML, Text interpretation, Literary computing}, PAGES = {58-62}, URL = {http://clic.humnet.unipi.it/proceedings/vol1/CLICIT2014112.pdf}, VOLUME = {I}, DOI = {10.12871/CLICIT2014118}, ISBN = {9788867414727}, CONFERENCE_NAME = {CLiC-it 2014-First Italian Conference on Computational Linguistics}, BOOKTITLE = {Proceedings of the First Italian Conference on Computational Linguistics (CLiC-it 2014)}, EDITOR = {, B. R. L. A. and Magnini, B.}, } @INPROCEEDINGS{PEDRETTI_2014_INPROCEEDINGS_PDGMPALM_300283, AUTHOR = {Pedretti, I. and Del Grosso, A. and Giovannetti, E. and Mancini, L. and Piccini, S. and Abrate, M. and Lo Duca, A. and Marchetti, A.}, TITLE = {The Clavius on the Web Project: Digitization, Annotation and Visualization of Early Modern Manuscripts}, YEAR = {2014}, ABSTRACT = {This paper describes the full procedure adopted in the context of the Clavius on the Web project, which aims to help Web users to appraise the importance of specific manuscripts by going beyond their digital reproduction. The proposed approach is based on the multilayered explication of linguistic, lexical and semantic data representing the innermost nature of the analyzed manuscripts. The final purpose of the project is to gather and display the results of the three layers of analysis through interactive visualization techniques and export them as Linked Data. All the analyses rely on the XML/TEI encoding of the text, followed by a CTS-based tokenization. As a working example for this paper, the analysis of a portion of a manuscript provided by Historical Archives of the Pontifical Gregorian University will be illustrated. The text is a letter written in Latin and sent by Botvitus Nericius to Christophorus Clavius in 1598 from Madrid}, KEYWORDS = {Clavius, Data Visualization, Early Modern Manuscripts, Lexica and Ontologies, Linked Open Data, NLP for Latin, Promotion of Cultural Heritage}, PAGES = {7}, URL = {http://dl.acm.org/citation.cfm?id=2802636}, DOI = {10.1145/2802612.2802636}, PUBLISHER = {ACM, Association for computing machinery (New York, USA)}, ISBN = {978-1-4503-3295-8}, CONFERENCE_NAME = {Third AIUCD Annual Conference on Humanities and Their Methods in the Digital Ecosystem (AIUCD '14)}, CONFERENCE_PLACE = {New York}, BOOKTITLE = {Proceedings of the Third AIUCD Annual Conference on Humanities and Their Methods in the Digital Ecosystem (AIUCD '14)}, EDITOR = {Tomasi, F. and Del Turco, R. R.}, } @INPROCEEDINGS{PICCINI_2014_INPROCEEDINGS_PRG_264633, AUTHOR = {Piccini, S. and Ruimy, N. and Giovannetti, E.}, TITLE = {Il primo lessico elettronico della terminologia saussuriana}, YEAR = {2014}, ABSTRACT = {Il lavoro che intendiamo presentare si iscrive all'interno di un Progetto di Ricerca Nazionale finanziato dal governo italiano, intitolato "Per una edizione digitale dei manoscritti di Ferdinand de Saussure", e volto a creare un prototipo di edizione digitale degli scritti autografi del grande linguista ginevrino. A tal fine, ogni manoscritto è stato digitalizzato, classificato e dotato di un link ipertestuale che rimanda alla sua trascrizione. Un sistema di gestione dei testi permette di consultare e annotare il singolo manoscritto e di effettuare studi filologici e critici sul corpus digitalizzato. Le concordanze per forma e per lemma prodotte per l'insieme dei testi forniscono un insieme di termini caratteristici dei quali viene descritta la semantica. Accanto alla realizzazione di tale piattaforma filologica digitale, uno degli aspetti innovativi del progetto consiste nella creazione del primo thesaurus-lessico elettronico della terminologia linguistica saussuriana. Quest'ultima riceve per la prima volta una rappresentazione strutturata, con una definizione del contenuto semantico di ciascuno dei termini chiave del pensiero del maestro ginevrino ed un quadro esplicito della natura e dell'importanza dei legami che li uniscono. Tale fascio di informazioni dovrebbe contribuire in modo significativo a meglio conoscere ed interpretare il pensiero del padre della linguistica moderna. L'architettura del lessico è ispirata al modello lessicale SIMPLE. Tra i modelli lessicali di maggior rilievo (WordNet, EuroWordNet, ItalWordNet, FrameNet, Pattern Dictionary, SIMPLE e Brandeis Semantic Ontology) esso è apparso essere il più adeguato, in quanto si distingue per alcuni importanti ed innovati aspetti. Il modello SIMPLE, infatti, ha permesso la realizzazione di lessici elettronici multilivello armonizzati per dodici lingue europee, imponendosi così come standard de facto nell'ambito della Lessicografia Computazionale. Successivamente ha fortemente ispirato lo standard ISO per i lessici del TAL Lexical Markup Framework. La strutturazione del lessico ha necessitato anzitutto della creazione di una ontologia lessicale di dominio. A tal fine è stato adottato un approccio centrifugo: in un primo momento sono stati identificati i concetti centrali del dominio di interesse, i quali sono stati poi generalizzati o specificati. L'ontologia così modellizzata è attualmente costituita da 43 tipi semantici ed ha una profondità di 4 livelli. Alcune classi semantiche sono state poi ulteriormente "specificate" in termini di tratti e/o relazioni semantiche obbligatorie (definitorie). Un insieme di cinquantotto relazioni semantiche permette di collegare le istanze delle differenti classi ontologiche, mentre trentadue tratti semantici codificano informazioni tipiche di una classe semantica nella sua interezza o di una specifica istanza. La semantica lessicale di ciascuna delle istanze di una classe ontologica è rappresentata in una entrata lessicale, nella quale una ed una sola accezione di un termine, semplice o complesso, viene riccamente definita attraverso un vasto insieme di informazioni formalizzate ed altamente strutturate, che coprono un ampio ventaglio di aspetti semantici. Il senso analizzato è anzitutto associato alla definizione data da Saussure stesso, e laddove non disponibile, a quelle di R. Godel e R. Engler. Per ogni lemma vengono specificati anche il periodo di attestazione, le fonti nelle quali occorre, la sua frequenza di occorrenza e le collocazioni nelle quali appare. La classificazione ontologica del termine rappresenta un dato essenziale al quale si aggiungono l'informazione concernente il dominio d'uso, il tipo di evento denotato (qualora si tratti di un evento), dei tratti semantici distintivi e una vasta rete di relazioni semantico-lessicali. Il modello lessicale adottato, infatti, conferisce una attenzione particolare ai legami che esistono tra i differenti termini. La multidimensionalità intrinseca al senso di ogni lemma è colta e formalizzata attraverso un insieme di relazioni semantiche specifiche del modello SIMPLE e ispirate alla Struttura Qualia della teoria del Lessico Generativo. Esse offrono un quadro preciso della natura dei legami (intra ed extra categoriali) che sussistono tra le unità lessicali contenute nella base di dati sia sull'asse paradigmatico (iperonimia, iponimia, meronimia ed olonimia) sia sull'asse sintagmatico (fornendo in particolare informazioni sull'origine e la funzione dell'entità denotata). Inoltre, accanto alle classiche relazioni di sinonimia, antonimia e di derivazione morfologica, sono state create delle relazioni specifiche, al fine di formalizzare nel modo più preciso possibile i legami particolari esistenti tra i termini del dominio della conoscenza e più generalmente la sua organizzazione concettuale. Dei termini predicativi contenuti nel lessico viene descritta anche la struttura argomentale con indicazioni sul ruolo semantico e sulle restrizioni semantiche degli argomenti introdotti. Allo stato attuale, la popolazione del lessico è costituita da 500 entrate lessicali (379 nomi, 113 aggettivi e 8 verbi): si tratta principalmente dei termini proposti da Godel e Engler e di alcune parole-chiave estratte dagli Écrits de linguistique générale. In una fase successiva verrà integrata la nuova terminologia dei manoscritti attualmente studiati. In una prima fase i dati lessicali sono stai gestiti in una piattaforma MS ACCESS. Più recentemente, per esigenze di standardizzazione ed interoperabilità, è stata effettuata una migrazione sulla piattaforma Protégé-OWL. Owl è, infatti, il linguaggio standard del W3C per la rappresentazione e la condivisone di ontologie sul Web. Il sistema di gestione Access, tuttavia, non è stato abbandonato: il lessico, attualmente, è ospitato in entrambe le piattaforme grazie ad un software che consente la perfetta sincronizzazione dei dati. Questa provvisoria "doppia ubicazione" permette, intanto, di sfruttare in modo ottimale le potenzialità dei due sistemi di gestione. Una tale strutturazione informatizzata dei dati lessicali offre numerosi vantaggi. In fase di creazione del lessico, essa permette uno sviluppo collaborativo rigoroso, anche a distanza, e lo stoccaggio di una grande quantità di dati; favorisce una rappresentazione sistematica dei fenomeni linguistici ed assicura la coerenza e la completezza dell'informazione codificata. Inoltre, consente di operare costanti controlli di coerenza formale dell'informazione e di effettuare delle modifiche o delle correzioni sull'insieme dei dati. La strutturazione multidimensionale dei concetti del dominio di conoscenza e la rappresentazione semantica altamente strutturata, ricca, diversificata ed espressiva ne fanno uno strumento di ricerca lessicale particolarmente performante. Varie tipologie di ricerca possono essere effettuate molto semplicemente e rapidamente su qualsiasi dato memorizzato, sia esso una relazione, un tratto o una unità semantica e questi dati possono essere interrogati sia singolarmente sia in combinazione. Si ha quindi la possibilità di estrarre gruppi di unità lessicali che condividono una data proprietà o una combinazione di proprietà, secondo dei criteri stabiliti dallo studioso in relazione alle esigenze della sua ricerca. A titolo di esempio, verranno presentate alcune delle numerose ricerche che possono essere effettuate sui dati lessicali all'interno della base di dati. A nostro parere, il thesaurus-lessico semantico della terminologia saussuriana costituisce, per i motivi esposti, uno strumento di grande utilità per gli esperti del settore. Inoltre, l'organizzazione strutturata della conoscenza lessicale, favorendo la ricerca semantica, dovrebbe contribuire in modo significativo ad una più approfondita conoscenza del vocabolario del maestro e pertanto degli aspetti più complessi ed originali del suo pensiero}, KEYWORDS = {Saussure, SIMPLE, lessici computazionali}, URL = {https://iris.cnr.it/handle/20.500.14243/264633}, CONFERENCE_NAME = {XXXVII Convegno della Società Italiana di Glottologia, "Il lessico nella teoria e nella storia linguistica"}, } @INPROCEEDINGS{ABRATE_2014_INPROCEEDINGS_ADGLMMPP_264614, AUTHOR = {Abrate, M. and Del Grosso, A. M. and Giovannetti, E. and Lo Duca, A. and Marchetti, A. and Mancini, L. and Pedretti, I. and Piccini, S.}, TITLE = {Il Progetto Clavius on the Web: tecnologie linguistico-semantiche al servizio del patrimonio documentale e degli archivi storici}, YEAR = {2014}, ABSTRACT = {L'obiettivo del progetto Clavius on the Web è quello di valorizzare una parte dei manoscritti conservati dall'Archivio storico della Pontificia Università Gregoriana (APUG). Il progetto prende in esame alcuni manoscritti relativi a Christophorus Clavius (1538-­1612), matematico e astronomo gesuita. I manoscritti sono digitalizzati, trascritti, tradotti e analizzati dal punto di vista linguistico, lessicale e semantico. La terminologia e le entità di dominio individuate nel testo sono strutturate in un lessico e una ontologia, e collegate a risorse già disponibili sulla Rete secondo i principi dei Linked Data. La loro visualizzazione sul Web è implementata mediante tecniche di Data Visualization: la prima si basa sulla corrispondenza tra testo, traduzione e immagine mentre la seconda ha lo scopo di mostrare i contenuti delle analisi, con particolare enfasi alla navigazione delle risorse lessicali e ontologiche prodotte durante le varie fasi}, URL = {https://iris.cnr.it/handle/20.500.14243/264614}, CONFERENCE_NAME = {AIUCD 2014-Terzo convegno annuale: La metodologia della ricerca umanistica nell'ecosistema digitale}, BOOKTITLE = {AIUCD2014-La metodologia della ricerca umanistica nell'ecosistema digitale-Abstracts 3rd annual conference, 18-19 settembre 2014}, EDITOR = {Rossi, F. and Tomasi, F.}, } @TECHREPORT{ALBANESI_2014_TECHREPORT_ABBG_350478, AUTHOR = {Albanesi, D. and Bellandi, A. and Bellusci, A. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 3}, YEAR = {2014}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il terzo dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350478}, } @TECHREPORT{ALBANESI_2014_TECHREPORT_ABBG_350479, AUTHOR = {Albanesi, D. and Bellandi, A. and Benotto, G. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 4}, YEAR = {2014}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano. Quanto qui descritto costituisce un "Rapporto sullo Stato di Avanzamento dei Lavori (SAL) dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il quarto dei fascicoli previsti a cadenza quadrimestrale}, URL = {https://iris.cnr.it/handle/20.500.14243/350479}, } @TECHREPORT{ALBANESI_2014_TECHREPORT_ABBCG_350477, AUTHOR = {Albanesi, D. and Bellandi, A. and Bulleri, F. and Carniani, E. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 2}, YEAR = {2014}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano. Quanto qui descritto costituisce un "Rapporto sullo stato di avanzamento dei lavori dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come il secondo dei fascicoli previsti a cadenza quadrimestrale. Il rilascio del presente rapporto, previsto per febbraio, è stato ritardato di un mese per consentire di incorporarvi anche la documentazione relativa allo sviluppo di componenti che sono stati richiesti all'ILC-CNR per rispondere ad esigenze editoriali e di composizione del layout di stampa (cfr. sez. 2. 4). In seguito, le parole, le frasi o una intera sezione che riteniamo degne di nota saranno sottolineate}, URL = {https://iris.cnr.it/handle/20.500.14243/350477}, } @ARTICLE{NAHLI_2013_ARTICLE_NG_264611, AUTHOR = {Nahli, O. and Giovannetti, E.}, TITLE = {Computational contributions for Arabic language processing-Part II. Lisan al-'arab as a source of lexical and morphological knowledge}, YEAR = {2013}, ABSTRACT = {The following sections illustrate a part of the study on the morphology of the Arabic language which is carried on within the framework of the ERC project Greek into Arabic. Philosophical Concepts and Linguistic Bridges ADG 249431. We used the Arabic lexicographic encyclopaedia Lisan al-'arab and, thanks to the regularity of its structure, we developed a system for the extraction of morphologically labelled word sequences, to be exploited for morphological analysis purposes}, KEYWORDS = {Arabic morphology, Arabic morphological analysis, Arabic lexicography, Natural Language Processing}, PAGES = {207-210}, URL = {https://iris.cnr.it/handle/20.500.14243/264611}, VOLUME = {3}, ISSN = {2239-012X}, JOURNAL = {STUDIA GRAECO-ARABICA}, } @INCOLLECTION{RUIMY_2013_INCOLLECTION_RPGB_265110, AUTHOR = {Ruimy, N. and Piccini, S. and Giovannetti, E. and Bellandi, A.}, TITLE = {Lessicografia Computazionale e Terminologia Saussuriana}, YEAR = {2013}, PAGES = {161-179}, URL = {https://iris.cnr.it/handle/20.500.14243/265110}, PUBLISHER = {Edizioni dell'Orso (Alessandria, ITA)}, ISBN = {978-88-6274-478-2}, CONFERENCE_PLACE = {Alessandria}, BOOKTITLE = {Guida per un'edizione digitale dei manoscritti di Ferdinand de Saussure}, } @TECHREPORT{ALBANESI_2013_TECHREPORT_ABBCG_350475, AUTHOR = {Albanesi, D. and Bellandi, A. and Bulleri, F. and Carniani, E. and Giovannetti, E.}, TITLE = {Applicazione Web Linguistico-Computazionale per il Progetto di Traduzione del Talmud Babilonese-Rapporto tecnico 1}, YEAR = {2013}, ABSTRACT = {Il presente documento descrive lo stato di avanzamento del lavoro condotto dall'Istituto di Linguistica Computazionale "A. Zampolli" del CNR (ILC-CNR) nel contesto del progetto "Traduzione del Talmud Babilonese" in italiano. In particolare, vi sono illustrate le varie fasi che hanno portato allo sviluppo del sistema Talmud, nelle sue due attuali versioni, "alfa" e "beta", durante il primo anno di progetto. Quanto qui descritto costituisce un "Rapporto sullo stato di avanzamento dei lavori dell'applicazione Web" unicamente da parte dell'ILC-CNR e si configura come un primo fascicolo di una serie che avrà cadenza quadrimestrale. Gli altri fascicoli, pertanto, usciranno a febbraio, giugno e ottobre 2014. Quanto al numero di pagine, mentre questo documento ne occupa 10 perché si riferisce al lavoro di un intero anno svolto da parte di 6 persone (quelle indicate nel frontespizio), i successivi presumibilmente ne occuperanno un numero minore, a meno che non venga richiesto dal Comitato di Coordinamento del PTTB di descrivere particolari tecnici e metodologie informatico-ingegneristiche adottate da parte dell'équipe di sviluppatori. Infine, in tutti i fascicoli, le parole, le frasi o una intera sezione che riteniamo degne di nota saranno sottolineate}, URL = {https://iris.cnr.it/handle/20.500.14243/350475}, } @TECHREPORT{DELGROSSO_2013_TECHREPORT_DGP_315841, AUTHOR = {Del Grosso, A. M. and Giovannetti, E. and Piccini, S.}, TITLE = {Definizione del modello di filologia computazionale}, YEAR = {2013}, ABSTRACT = {Il documento illustra il lavoro di analisi condotto durante la prima fase del progetto Clavius on the Web. Nelle sezioni del documento si descrivono le modalità secondo le quali il modello generale della piattaforma di gestione dei testi verrà implementato partendo dalle esigenze degli studiosi dei manoscritti originali di Clavius digitalizzati e messi a raffronto con i file di trascrizione}, KEYWORDS = {Clavius, Clavius on the web, Literary Computing, Computational Philology, Lexica, Latin, Semantic Web}, URL = {http://claviusontheweb.it/}, } @INPROCEEDINGS{BIANCHI_2012_INPROCEEDINGS_BTG_264623, AUTHOR = {Bianchi, E. and Tavosanis, M. and Giovannetti, E.}, TITLE = {Creation of a bottom-up corpus-based ontology for Italian Linguistics}, YEAR = {2012}, ABSTRACT = {This paper describes the steps of construction of a shallow lexical ontology of Italian Linguistics in Italian, set to be used by a meta-search engine for query refinement. The ontology was constructed with the software Protege 4. 0. 2 and encoded in OWL format; its construction has been carried out following the steps described in the well-known Ontology Learning From Text (OLFT) layer cake. The starting point was the automatic term extraction from a corpus of web documents concerning the domain of interest (304, 000 words); as regards corpus construction, we describe the main criteria of the web documents selection and its critical points, concerning the definition of user profile and of degrees of specialisation. We then describe the process of term validation and construction of a glossary of terms of Italian Linguistics; afterwards, we outline the identification of synonymic chains and the main criteria of ontology design: top classes of ontology are Concept (containing taxonomy of concepts) and Term (containing terms of the glossary as instances), while concepts are linked through part-whole and involved-role relation, both borrowed from Wordnet. Finally, we show some examples of the application of the ontology for query refinement}, KEYWORDS = {Ontologies, Italian Linguistics, Query refinement}, PAGES = {2641-2647}, URL = {https://iris.cnr.it/handle/20.500.14243/264623}, PUBLISHER = {European Language Resources Association ELRA (Paris, FRA)}, CONFERENCE_NAME = {LREC 2012-Eight International Conference on Language Resources and Evaluation}, CONFERENCE_PLACE = {Paris}, BOOKTITLE = {Language Resources and Evaluation}, } @INPROCEEDINGS{RUIMY_2012_INPROCEEDINGS_RPG_122956, AUTHOR = {Ruimy, N. and Piccini, S. and Giovannetti, E.}, TITLE = {Les Outils Informatiques au Service de la Terminologie Saussurienne}, YEAR = {2012}, ABSTRACT = {Bien que l'oeuvre de Ferdinand de Saussure ait été diffusée à travers le monde, sa pensée a été en grande partie reconstruite et interprétée par ses étudiants et disciples. Ses écrits authentiques revêtent pourtant, de notre point de vue, une importance fondamentale: ils mettent en lumière l'attention que Saussure accorde à la terminologie linguistique. Lui-même utilise souvent un vocabulaire particulier. Il forge des néologismes ou confère un sens nouveau à des mots existants, il emploie quelques termes de façon éphémère, change la dénotation de certains concepts au fil du temps, créant ainsi une terminologie qui lui est propre. Dans cet article, nous présentons le premier thésaurus-lexique électronique de la terminologie linguistique saussurienne, en cours de création. La population de ce lexique est constituée par une nomenclature mise à jour, comprenant non seulement la terminologie répertoriée par Godel et Engler mais également de nouveaux termes extraits de manuscrits actuellement à l'étude. À travers ce lexique, nous nous proposons de fournir une représentation structurée de la terminologie saussurienne, de définir le contenu sémantique de chacun des termes ainsi que la nature des relations qui les unissent. À cet effet, nous avons choisi de customiser le modèle lexical SIMPLE qui, dans le panorama de la Lexicographie Computationnelle, s'est imposé comme standard de facto et offre une représentation sémantique hautement structurée des unités lexicales. Le processus de customisation du modèle de base s'est tout d'abord focalisé sur la conception d'une ontologie lexicale de domaine (ontologie SIMPLE_FdS), et sa traduction dans le langage de représentation d'ontologie Web OWL. Puis, les deux autres composants du modèle de base, i. e. un réseau de relations sémantiques et un ensemble de traits sémantiques, ont été également adaptés aux exigences du domaine traité. Les moyens expressifs jugés appropriés pour rendre compte de la terminologie saussurienne ont été retenus tandis que des traits et relations spécifiques ont été créés afin d'exprimer des propriétés et des liens qui caractérisent l'organisation conceptuelle de ce domaine de la connaissance. Le lexique est ici illustré par des exemples d'entrées lexicales et le potentiel de la base de connaissance par des requêtes sur les données mémorisées. L'organisation structurée de la connaissance lexicale et la richesse de la représentation sémantique font de ce lexique un outil de recherche sémantique particulièrement performant et qui devrait contribuer de manière significative à mieux maîtriser le vocabulaire saussurien et à éclairer certains aspects originaux de la pensée du maître genevois}, KEYWORDS = {Computational Lexicon}, PAGES = {1043-1056}, URL = {http://www.shs-conferences.org/articles/shsconf/abs/2012/01/shsconf_cmlf12_000294/shs}, DOI = {10.1051/shsconf/20120100294}, PUBLISHER = {EDP Sciences (Les Ulis Cedex, FRA)}, ISBN = {978-2-7598-0783-3}, CONFERENCE_NAME = {3e Congrès Mondial de Linguistique Française (CMLF 2012)}, CONFERENCE_PLACE = {Les Ulis Cedex}, BOOKTITLE = {3e Congrès Mondial de Linguistique Française}, } @INPROCEEDINGS{RUIMY_2012_INPROCEEDINGS_RPG_122943, AUTHOR = {Ruimy, N. and Piccini, S. and Giovannetti, E.}, TITLE = {Defining and Structuring Saussure's Terminology}, YEAR = {2012}, ABSTRACT = {In the framework of the Italian project 'For a digital edition of Ferdinand de Saussure's manuscripts', an electronic thesaurus of Saussure's terminology is being built, which includes new terms extracted from recently found manuscripts. The lexical model on which it is grounded is a customized version of the SIMPLE model. In this paper, an overview of the customization process is provided, with a special focus on the steps taken for designing a domain-specific ontology as well as on the creation of additional semantic relations and features. Lexical entries are illustrated and the potential of a structured organization of semantic knowledge for gaining a wider understanding of the overall domain terminology is highlighted}, KEYWORDS = {Computational Lexicon}, PAGES = {828-833}, URL = {http://www.euralex.org/elx_proceedings/Euralex2012/pp828-833%20Ruimy,%20Piccini%20and}, CONFERENCE_NAME = {15th EURALEX International Congress (EURALEX2012)}, } @INPROCEEDINGS{PICCINI_2012_INPROCEEDINGS_PRG_264634, AUTHOR = {Piccini, S. and Ruimy, N. and Giovannetti, E.}, TITLE = {Structuring a specific domain: an electronic thesaurus of Ferdinand de Saussure's terminology}, YEAR = {2012}, ABSTRACT = {Although Ferdinand de Saussure's work has been disseminated all over the world, his thought was mainlyreconstructed and interpreted by his students and disciples. His authentic writings are however of paramount importance as they highlight the complexity of the philosophical and semiological system Saussure developed and the attention he payed to linguistic terminology. The great Genevan linguist himself often used a peculiar vocabulary. He forged neologisms or conferred a new meaning to existing words, used a few terms ephemerally, changed the denotation of some concepts over the years, so to create his own idiosyncratic terminology, which is now at the base of modern linguistics. In this paper, we present the first electronic thesaurus-lexicon of the Saussurean linguistic terminology that is being developed in the framework of the ongoing Italian project 'For a digital edition of Ferdinand de Saussure's manuscripts'. The lexicon population consists of an updated nomenclature, encompassing not only the terminology gathered by two famous Saussurean scholars, Robert Godel and Rudolf Engler, but also new terms extracted from recently found manuscripts under study. In the lexicon, the overall structure of Saussure's terminology is made explicit and the semantic import of its component terms as well as the nature and relevance of their relationships are defined. The lexical model, on which the thesaurus is grounded, is a customized version of the SIMPLE model, a de facto standard in the domain of Computational Lexicography that enables a highly structured representation of lexical knowledge. The first stage of the customization process consisted in designing and translating into the Web Ontology Language OWL the central component of the SIMPLE_FdS model, i. e. a domain-specific lexical ontology that would structure Saussure's terminology. The two other building blocks of the root model, i. e. a network of semantic relations and a set of semantic features, were adapted in order to meet the requirements of the domain of interest. The expressive means deemed suitable for our domain were maintained whereas additional specific features and relations were created to account for term properties and relationships peculiar to the conceptual organization of this domain of knowledge. So far, 375 terms were endowed with a rich semantic description. In the extended paper, examples of lexical entries will be provided and many interesting possibilities of lexical investigation will be pointed out. Information retrieval queries may in fact be formulated using any single piece of information encoded, be it a semantic relation, a feature or a lexical unit. Such an electronic thesaurus-lexicon, based on a multidimensional structuring of concepts and a large network of semantic relations among terms, is therefore, in our opinion, a most valuable lexical research tool. It is our deep conviction that it will contribute to better master some of Saussure's reflections and to gain a wider understanding of the overall domain terminology. It might therefore help shading light on original aspectsof the author's thought}, KEYWORDS = {Saussure, terminologia, lessici computazionali}, PAGES = {1}, URL = {https://iris.cnr.it/handle/20.500.14243/264634}, CONFERENCE_NAME = {45th Annual Meeting of the Societas Linguistica Europaea (SLE)}, BOOKTITLE = {45th Annual Meeting of the Societas Linguistica Europae, Book of Abstracts}, EDITOR = {Cornillie, B. and Pascual, M. S. S.}, } @TECHREPORT{BOZZI_2012_TECHREPORT_BGBNMPN_370139, AUTHOR = {Bozzi, A. and Giovannetti, E. and Boschetti, F. and Nahli, O. and Marchi, S. and Piccini, S. and Nilda Ruimy, A. M. D. G.}, TITLE = {Greek into Arabic: contents, technologies and (humanistic and scientific) applications of a new software}, YEAR = {2012}, ABSTRACT = {This contribution aims to describe the methodological approach to Digital Philology by means of the G\&A Web Application. It also shows running examples for the: 1) Visualization and ordering of parallel texts subdivided in pericopes; 2) Linguistic annotations; 3) Scholarly comments; and 4)Search functions}, KEYWORDS = {digital philolog, computational philology, software engineering, Greek into Arabic, Computational linguistics}, URL = {https://iris.cnr.it/handle/20.500.14243/370139}, } @INPROCEEDINGS{GIOVANNETTI_2011_INPROCEEDINGS_GM_244994, AUTHOR = {Giovannetti, E. and Marchi, S.}, TITLE = {Cross-Language Boosting in Pattern-based Semantic Relation Extraction from Text}, YEAR = {2011}, ABSTRACT = {In this work we propose a novel technique called "Cross-Language Boosting" (C-LB), aimed at increasing the accuracy of pattern-based semantic relation extraction systems: given a pair of terms expressed in a "Target Language" (e. g. in Italian), we can translate the terms in a "Support Language" (e. g. in English) and apply the translated term pair to reliable lexico-syntactic patterns expressed in that language to increase the accuracy of the system. Experiments have been conducted by comparing the results obtained by the SemRelEx system, a hybrid unsupervised system for semantic relation extraction from texts, with and without the support of the C-LB technique, applied to a set of candidate semantically related term pairs automatically extracted from a corpus in the History of Art domain}, KEYWORDS = {Computational Linguistics, Cross Language, semantic relation extraction systems, Ontology Learning from Text}, PAGES = {29-36}, URL = {https://web.archive.org/web/20121101020859/http://www.proceedings2011.cla-conf.info/}, ISBN = {9788360810477}, CONFERENCE_NAME = {Computational Linguistics Application Conference-CLA 2011}, BOOKTITLE = {Proceedings of the Computational Linguistics-Applications Conference}, EDITOR = {Jassem, K. and Fuglewicz, P. and Piasecki, M. and Przepiorkowski, A.}, } @INPROCEEDINGS{GIOVANNETTI_2010_INPROCEEDINGS_G_65164, AUTHOR = {Giovannetti, E.}, TITLE = {An unsupervised approach for semantic relation interpretation}, YEAR = {2010}, ABSTRACT = {In this work we propose a hybrid unsupervised approach for semantic relation extraction from Italian and English texts. The system takes as input pairs of "distributionally similar" terms, possibly involved in a semantic relation. To validate and label the anonymous relations holding between the terms in input, the candidate pairs of terms are looked for on the Web in the context of reliable lexico-syntactic patterns. This paper focuses on the definition of the patterns, on the measures used to assess the reliability of the suggested specific semantic relation and on the evaluation of the implemented system}, KEYWORDS = {Information Extra, Information Retrieval, Knowledge Representation, Ontologies}, PAGES = {3811-3816}, URL = {https://iris.cnr.it/handle/20.500.14243/65164}, PUBLISHER = {European language resources association (ELRA) (Paris, FRA)}, ISBN = {2-9517408-6-7}, CONFERENCE_NAME = {Seventh International Conference on Language Resources and Evaluation}, CONFERENCE_PLACE = {Paris}, BOOKTITLE = {Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10)}, EDITOR = {Calzolari, N. and Choukri, K. and Maegaard, B. and Mariani, J. and Odijk, J. and Piperidis, S. and Rosner, M. and Tapias, D.}, } @TECHREPORT{DELGROSSO_2010_TECHREPORT_DG_315844, AUTHOR = {Del Grosso, A. M. and Giovannetti, E.}, TITLE = {Sistema di gestione della banca dati lessicale}, YEAR = {2010}, ABSTRACT = {Il documento descrive l'analisi e lo studio preliminare svolto sul sistema di gestione della banca dati lessicale sviluppato nell'ambito dei progetti PAROLE, SIMPLE e CLIPS}, KEYWORDS = {Lessico elettronico, piattaforma web}, PAGES = {21}, URL = {https://iris.cnr.it/handle/20.500.14243/315844}, } @TECHREPORT{PIRRELLI_2010_TECHREPORT_PLMDGM_353288, AUTHOR = {Pirrelli, V. and Lenci, A. and Montemagni, S. and Dell'Orletta, F. and Giovannetti, E. and Marchi, S.}, TITLE = {ConnectToLife (modulo semantico)-Rapporto tecnico finale}, YEAR = {2010}, ABSTRACT = {Il presente documento costituisce il rapporto tecnico finale del progetto Connect-To-Life (modulo semantico) relativo alle attività svolte dall'unità ILC-CNR}, KEYWORDS = {annotazione linguistica, estrazione di termini, clustering semantico, trattamento automatico della lingua, costruzione di ontologie}, PAGES = {16}, URL = {https://iris.cnr.it/handle/20.500.14243/353288}, } @MISC{GIOVANNETTI_2009_MISC_G_244995, AUTHOR = {Giovannetti, E.}, TITLE = {Semantic relation labelling in ontology learning from texts}, YEAR = {2009}, ABSTRACT = {Semantic relation extraction is a crucial task for Ontology Learning from Texts. In literature, statistical unsupervised systems are used for semantic relation extraction: these systems typically detect pairs of semantically related terms (on the basis of their distribution in texts) without specifying the semantic relation holding between them. In this work I propose a fully unsupervised approach for semantic relation validation and extraction from texts. A statistical component (CLASS, CLustering through Analogy-based Semantic Similarity) is used to obtain a set of pairs of "distributionally similar" terms occurring in similar contexts, and possibly involved in "paradigmatic" relations (as, for instance, the words "car" and "motorcycle" in the sentences "I drive my car" and "Bob drives his mo-torcycle"). To validate and label the anonymous relations obtained through the statistical module occurrences of the candidate pairs of terms are looked for in the Web in the context of "reliable" lexico-syntactic patterns, where they are involved in a "syntagmatic relation" (such as, for example, the words "steer" and "car" in the sentence "steer is part of the car"). This work focuses on the definition and application of the lexico-syntactic patterns and on the measures used to assess the reliability of the specific semantic relation the system suggests. The chosen semantic relations are hyponymy, meronymy, co-hyponymy and co-meronymy, for the relevance they have in ontology construction. Different lexico-syntactic patterns are used for different kinds of relations. In particular, patterns including both terms are used for hyponymy and meronymy discovery, (e. g. "cyclosporine is a medicine"): the number of occurrences of the pattern on the Web will indicate the confidence of the candidate semantic relation. Concerning co-hyponymy and co-meronymy, explorative "open" patterns, including just one term, are used. For example, given the term pair "electron-nucleus", we can see if a co-meronymy relation holds between them by applying the following two patterns: "electron is part of" and "nucleus is part of" and then by looking for common holonyms (e. g. "atom"). Concerning evaluation, two different measures have been defined, one for hypernymy and meronymy relations and the other for co-hyponymy and co-meronymy. The measures are basically built upon the number of occurrences of the patterns on the Web and, concerning co-hyponymy and co-meronymy, on the number of common hypernyms (or holonyms) shared between the terms}, URL = {https://iris.cnr.it/handle/20.500.14243/244995}, } @ARTICLE{BAGLIONI_2008_ARTICLE_BGMRS_63020, AUTHOR = {Baglioni, M. and Giovannetti, E. and Masserotti, M. V. and Renso, C. and Spinsanti, L.}, TITLE = {Ontology-supported Querying of Geographical Databases}, YEAR = {2008}, ABSTRACT = {Querying geographical information systems has been recognized as a difficult task for non-expert users. Furthermore, user queries are often characterized by semantic aspects not directly managed by traditional spatial databases or GIS. Examples of such semantic geospatial queries are the use of implicit spatial relations between objects, or the reference of domain concepts not explicitly represented in data. To handle such queries, we envisage a system that translates natural language queries into spatial SQL statements on a database, thus improving standard GIS with new semantic capabilities. Within this general objective, the contribution of this article is to introduce a methodology to handle semantic geospatial queries issued over a spatial database. This approach captures semantics from an ontology built upon the spatial database and enriched by domain concepts and properties specifically defined to represent the localization of objects. Some examples of the use of the methodology in the urban domain are presented}, KEYWORDS = {H.2.8 Database Applications, Ontology extraction, Spatial databases}, PAGES = {31-44}, URL = {https://iris.cnr.it/handle/20.500.14243/63020}, VOLUME = {12 (SUPPL. 1)}, ISSN = {1467-9671}, JOURNAL = {TRANSACTIONS IN GIS (ONLINE)}, } @INPROCEEDINGS{GIOVANNETTI_2008_INPROCEEDINGS_GMM_65082, AUTHOR = {Giovannetti, E. and Marchi, S. and Montemagni, S.}, TITLE = {Combining statistical techniques and lexico-syntactic patterns for semantic relations extraction from text}, YEAR = {2008}, ABSTRACT = {We describe here a methodology to combine two different techniques for Semantic Relation Extraction from texts. On the one hand, generic lexicosyntactic patterns are applied to the linguistically analyzed corpus to detect a first set of pairs of co-occurring words, possibly involved in "syntagmatic" relations. On the other hand, a statistical unsupervised association system is used to obtain a second set of pairs of "distributionally similar" terms, that appear to occur in similar contexts, thus possibly involved in "paradigmatic" relations. The approach aims at learning ontological information by filtering the candidate relations obtained through generic lexico-syntactic patterns and by labelling the anonymous relations obtained through the statistical system. The resulting set of relations can be used to enrich existing ontologies and for semantic annotation of documents or web pages}, KEYWORDS = {Ontology Learning from Text, Semantic Relation Extraction, Lexico-syntactic Patterns, Distributional Similarity}, URL = {http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-426/swap2008_submission_54.pdf}, CONFERENCE_NAME = {SWAP 2008-Semantic Web Applications and Perspectives}, EDITOR = {Gangemi, A. and Keizer, J. and Presutti, V. and Stoermer, H.}, } @INPROCEEDINGS{GIOVANNETTI_2008_INPROCEEDINGS_GMMB_65100, AUTHOR = {Giovannetti, E. and Marchi, S. and Montemagni, S. and Bartolini, R.}, TITLE = {Ontology Learning and Semantic Annotation: a Necessary Symbiosis}, YEAR = {2008}, ABSTRACT = {Semantic annotation of text requires the dynamic merging of linguistically structured information and a "world model", usually represented as a domain-specific ontology. On the other hand, the process of engineering a domain-ontology through semi-automatic ontology learning system requires the availability of a considerable amount of semantically annotated documents. Facing this bootstrapping paradox requires an incremental process of annotation-acquisition-annotation, whereby domain-specific knowledge is acquired from linguistically-annotated texts and then projected back onto texts for extra linguistic information to be annotated and further knowledge layers to be extracted. The presented methodology is a first step in the direction of a full "virtuous" circle where the semantic annotation platform and the evolving ontology interact in symbiosis. As a case study we have chosen the semantic annotation of product catalogues. We propose a hybrid approach, combining pattern matching techniques to exploit the regular structure of product descriptions in catalogues, and Natural Language Processing techniques which are resorted to analyze natural language descriptions. The semantic annotation involves the access to the ontology, semi-automatically bootstrapped with an ontology learning tool from annotated collections of catalogues}, KEYWORDS = {Information Extraction, Information Retrieval, Ontologies, Tools, Systems}, PAGES = {2079-2085}, URL = {http://www.lrec-conf.org/proceedings/lrec2008/}, PUBLISHER = {European Language Resources Association (ELRA)-Evaluations and Language resources Distribution Agency (ELDA) (Paris, FRA)}, ISBN = {2-9517408-4-0}, CONFERENCE_NAME = {LREC 2008, Sixth International Conference on Language Resources and Evaluation}, CONFERENCE_PLACE = {Paris}, BOOKTITLE = {LREC 2008, Sixth International Conference on Language Resources and Evaluation}, EDITOR = {Calzolari, N. and Choukri, K. and Maegaard, B. and Mariani, J. and Odjik, J. and Piperidis, S. and Tapias, D.}, } @MISC{GIOVANNETTI_2008_MISC_G_244997, AUTHOR = {Giovannetti, E.}, TITLE = {Combining statistical techniques and lexico-syntactic patterns for semantic relations extraction from text}, YEAR = {2008}, ABSTRACT = {Semantic relation extraction is a crucial task for Ontology Learning from Texts. In literature, statistical unsupervised systems are used for semantic relation extraction: these systems typically detect pairs of semantically related terms (on the basis of their distribution in texts) without specifying the semantic relation holding between them. In this work we propose a fully unsupervised approach for semantic relation validation and extraction from texts. A statistical component (CLASS, CLustering through Analogy-based Semantic Similarity) is used to obtain a set of pairs of distributionally-similar terms occurring in similar contexts, and possibly involved in paradigmatic relations (as, for instance, the words "car" and "motorcycle" in the sentences "I drive my car" and "Bob drives his motorcycle"). To validate and label the anonymous relations obtained through the statistical module occurrences of the candidate pairs of terms are looked for in the Web in the context of reliable lexico-syntactic patterns, where they are involved in a syntagmatic relation (such as, for example, the words "steer" and "car" in the sentence "steer is part of the car"). This work focuses on the definition and application of the lexico-syntactic patterns and on the measures used to assess the reliability of the specific semantic relation the system suggests. The chosen semantic relations are hyponymy, meronymy, co-hyponymy and co-meronymy, for the relevance they have in ontology construction. Different lexico-syntactic patterns are used for different kinds of relations. In particular, patterns including both terms are used for hyponymy and meronymy discovery, (e. g. "cyclosporine is a medicine"): the number of occurrences of the pattern on the Web will indicate the confidence of the candidate semantic relation. Concerning co-hyponymy and co-meronymy, xplorative open patterns, including just one term, are used. For example, given the term pair "electron-nucleus", we can see if a co-meronymy relation holds between them by applying the following two patterns: "electron is part of" and "nucleus is part of" and then by looking for common holonyms (e. g. "atom"). Concerning evaluation, two different measures have been defined, one for hypernymy and meronymy relations and the other for co-hyponymy and comeronymy. The measures are basically built upon the number of occurrences of the patterns on the Web and, concerning co-hyponymy and co-meronymy, on the number of common hypernyms (or holonyms) shared between the terms}, URL = {https://iris.cnr.it/handle/20.500.14243/244997}, } @INPROCEEDINGS{BOMBARA_2007_INPROCEEDINGS_BCCCGMRST_456882, AUTHOR = {Bombara, M. and Calì, D. and Calì, I. and Cartelli, V. and Giovannetti, E. and Masserotti, M. and Renso, C. and Spinanti, L. and Tropea, G.}, TITLE = {Tecnologie open-source nel progetto FuLL (Fuzzy Logic and Language)}, YEAR = {2007}, ABSTRACT = {FuLL (Fuzzy Logic and Language) è un progetto di ricerca della Software Company BC, finanziato dal MAP e sviluppato in collaborazione con partner di ricerca del CNR e universitari, che aveva come obiettivo lo sviluppo di una tecnologia software che innova i sistemi di interrogazione dei database tramite l'utilizzo di un'interfaccia in linguaggio naturale. Nell'ambito del progetto, l'impiego di strumenti e tecnologie open-source ha consentito la sperimentazione del prototipo in tempi brevi e senza legare il sistema ad una specifica tecnologia proprietaria. L'interfaccia in linguaggio naturale FuLL, alla base del progetto, è stata sperimentata collegandola a due distinti database GIS di due province italiane, Bologna e Catania. I dati originali sono stati importati all'interno di un DB PostgreSQL con estensioni PostGIS e collegati fra loro con l'impiego di funzioni spaziali e relazioni di natura semantica, per consentirne la consultazione in linguaggio naturale. Per visualizzare i dati geografici su web è stata integrata una web-application GIS, sviluppata con MapServer in tecnologia JSP e pienamente compatibile con PostGIS. Un risultato importante della scelta di tecnologie standard, come le estensioni OpenGIS spaziali di PostgreSQL, è la piena portabilità verso altri sistemi DBMS spaziali}, KEYWORDS = {Interoperabilità, Linguaggio naturale, GIS, Standardizzazione}, PAGES = {5}, URL = {https://geomatica.icar.cnr.it/grass_meeting/articoli/bc_grass2007_full.pdf}, CONFERENCE_NAME = {GRASS \& GFOSS Meeting 2007}, BOOKTITLE = {Atti del Meeting Utenti Italiani GRASS e GFOSS-VIII Edizione 2007}, } @INPROCEEDINGS{GIOVANNETTI_2007_INPROCEEDINGS_GMMB_65068, AUTHOR = {Giovannetti, E. and Marchi, S. and Montemagni, S. and Bartolini, R.}, TITLE = {Ontology-based Semantic Annotation of Product Catalogues}, YEAR = {2007}, ABSTRACT = {This paper describes a methodology for the semantic annotation of product catalogues. We propose a hybrid approach, combining pattern matching techniques to exploit the regular structure of product descriptions in catalogues, and Natural Language Processing techniques which are resorted to analyze natural language descriptions. It also includes the access to an application ontology, semi-automatically bootstrapped from collections of catalogues with an ontology learning tool, which is used to drive the semantic annotation process}, KEYWORDS = {Semantic Annotation of texts, Ontology Learning, Information Extraction for e-commerce}, PAGES = {235-239}, URL = {https://iris.cnr.it/handle/20.500.14243/65068}, CONFERENCE_NAME = {Recent Advances in Natural Language Processing (RANLP-2007)}, BOOKTITLE = {Proceedings of the International Conference "Recent Advances in Natural Language Processing"}, } @TECHREPORT{AITMOKHTAR_2007_TECHREPORT_ABBDGGMSS_195934, AUTHOR = {Aitmokhtar, S. and Barker, E. and Brunelli, R. and Demetriou, G. and Gaizauskas, R. and Giovannetti, E. and Montemagni, S. and Sándor, A. and Sun, H.}, TITLE = {Semantic Annotation Services for Virtual Information and Knowledge Environments}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195934}, } @TECHREPORT{BOUQUET_2007_TECHREPORT_BSMGSNSBCJ_195935, AUTHOR = {Bouquet, P. and Stoermer, H. and Montemagni, S. and Giovannetti, E. and Semeraro, G. and Niederee, C. and Stecher, R. and Brunelli, R. and Chanod, J. P. and Jacquin, T.}, TITLE = {Semantic Representation and Management Report}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195935}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_457837, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Language Recognition Tool, Specifiche di Implementazione}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/457837}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_195930, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Segmentazione di un Testo Italiano in Token}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195930}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_457838, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Segmentazione di un Testo Inglese in Token}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/457838}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_195932, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Specifiche di Chunking per l'Italiano}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195932}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_195931, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Analisi Morfosintattica per l'Italiano}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195931}, } @TECHREPORT{DELLORLETTA_2007_TECHREPORT_DFGLMTP_195933, AUTHOR = {Dell'Orletta, F. and Federico, M. and Giovannetti, E. and Lenci, A. and Marchi, S. and Trabucco, A. and Pirrelli, V.}, TITLE = {Specifiche di Named Entity Recognition per l'Italiano}, YEAR = {2007}, URL = {https://iris.cnr.it/handle/20.500.14243/195933}, } @MISC{GIOVANNETTI_2007_MISC_G_244998, AUTHOR = {Giovannetti, E.}, TITLE = {Creating and exploiting ontologies for semantic annotation of text}, YEAR = {2007}, ABSTRACT = {An ontology is a description of conceptual knowledge organized in a com-puter based representation. Semantic annotation of text is the process of making semantic information (e. g. about entities and relations) formally explicit. Semantic annotation and ontologies are involved in two main and related tasks: an ontology can be used for semantic annotation, this latter requiring a formal representation of the domain of interest during the process of natural language understanding. On the contrary, texts can be useful sources of knowledge for populating and enhancing ontologies. These two tasks can be combined in a cyclic process: ontologies are used as the "world knowledge" for interpreting the text and assigning the correct meanings to linguistic structures, while semantic annotation provides new knowledge to be exploited for the enrichment and refinement of the ontology itself. This (apparent) vicious circle (between the need of having the domain represented in the ontology for the semantic annotation process and the enrichment of the ontology based on the results obtained from the annotation) can be turned to a virtuous circle if the necessary conditions are set to let the evolving ontology and the annotation process interact in a synergetic way. The construction and maintenance of an ontology can be a very costly engineering process: in order to alleviate the costs several proposals for automatically learning ontologies from data have emerged. In particular "ontology learning from text" has recently become quite popular since textual resources are still the main means for knowledge encoding and transfer used by people. Semantic annotation of text requires the application of natural language processing techniques to reconstruct the syntactic structure of sentences, going through tokenization, morphological analysis and part-of-speech tagging. Once syntax has been made explicit, the ontology can be used to drive the attribution of meaning to the syntactical analysed text. In this work we present the state of the art of ontology learning from text and semantic annotation and the techniques necessary to make optimum use of their symbiosis}, URL = {https://iris.cnr.it/handle/20.500.14243/244998}, } @INPROCEEDINGS{BARTOLINI_2006_INPROCEEDINGS_BCGLMPRS_61476, AUTHOR = {Bartolini, R. and Caracciolo, C. and Giovannetti, E. and Lenci, A. and Marchi, S. and Pirrelli, V. and Renso, C. and Spinsanti, L.}, TITLE = {Creation and use of lexicons and ontologies for natural language interface to databases}, YEAR = {2006}, ABSTRACT = {In this paper we present an original approach to natural language query interpretation which has been implemented within the FuLL (Fuzzy Logic and Language) Italian project of BC S. r. l. In particular, we discuss here the creation of linguistic and ontological resources, together with the exploitation of existing ones, for natural language-driven database access and retrieval. Both the database and the queries we experiment with are Italian, but the methodology we broach naturally extends to other languages}, KEYWORDS = {Natual language processing, ontologies, gis, databases}, PAGES = {6}, URL = {https://iris.cnr.it/handle/20.500.14243/61476}, CONFERENCE_NAME = {LREC Conference}, BOOKTITLE = {LREC 2006}, } @INPROCEEDINGS{BARTOLINI_2006_INPROCEEDINGS_BGMMABSB_65047, AUTHOR = {Bartolini, R. and Giovannetti, E. and Marchi, S. and Montemagni, S. and Andreatta, C. and Brunelli, R. and Stecher, R. and Bouquet, P.}, TITLE = {Multimedia Information Extraction in Ontology-based Semantic Annotation of Product Catalogues}, YEAR = {2006}, ABSTRACT = {The demand for efficient methods for extracting knowledge from multimedia content has led to a growing research community investigating the convergence of multimedia and knowledge technologies. In this paper we describe a methodology for extracting multimedia information from product catalogues empowered by the synergetic use and extension of a domain ontology. The methodology was implemented in the Trade Fair Advanced Semantic Annotation Pipeline of the VIKE-framework}, KEYWORDS = {Semantic Web Technologies, ontology creation, ontology extraction, ontology evolution, semantic annotation of multimedia content}, URL = {https://iris.cnr.it/handle/20.500.14243/65047}, CONFERENCE_NAME = {SWAP 2006}, } @INPROCEEDINGS{BOMBARA_2006_INPROCEEDINGS_BCCGMRST_62247, AUTHOR = {Bombara, M. and Calì, D. and Calì, I. and Giovannetti, E. and Masserotti, M. V. and Renso, C. and Spinsanti, L. and Tropea, G.}, TITLE = {Interrogazioni in linguaggio naturale a basi dati eterogenee: l'ontologia nel sistema "FuLL" nei GIS}, YEAR = {2006}, ABSTRACT = {The interaction between users and GIS software is a known and critical issue. The importance of giving those users a natural language interface to the system is thus strategic. Moving such a NL interface between heterogeneous DBs is an even more challenging task. We accomplish this by using a domain ontology as a knowledge repository and interface between raw data and language semantics. Successful tests of FuLL's (Fuzzy Logic and Language) technology are reported, where we have used the same ontology structure and connected it to Bologna's and Catania's district geo-databases}, KEYWORDS = {Natural Language Processing, Query in linguaggio naturale}, PAGES = {6}, URL = {https://iris.cnr.it/handle/20.500.14243/62247}, CONFERENCE_NAME = {AMFM 2006-Informazione Geografica: data harmonisation, interoperabilità e standard, reti e facilities management, ubiquitous GIS}, BOOKTITLE = {Informazione Geografica: data harmonisation, interoperabilità e standard, reti e facilities management, ubiquitous GIS. Atti}, } @INPROCEEDINGS{BARTOLINI_2006_INPROCEEDINGS_BGMMABSNBB_65046, AUTHOR = {Bartolini, R. and Giovannetti, E. and Marchi, S. and Montemagni, S. and Andreatta, C. and Brunelli, R. and Stecher, R. and Niederée, C. and Bouquet, P. and Bortoli, S.}, TITLE = {Ontology Learning in Multimedia Information Extraction from Product Catalogues}, YEAR = {2006}, ABSTRACT = {We propose a methodology for extracting multimedia information from product catalogues empowered by the synergetic use and extension of a domain ontology. The use of domain ontologies in this context additionally opens up innovative ways of catalogue use. The method is characterized by incrementally feeding and exploiting the ontology during an information extraction process, implemented by the semantic annotation of the analysed document, and by providing support for detecting existing similar ontologies to enable reuse of (parts of) them}, KEYWORDS = {knowledge-drive multimedia analysis, ontology learning, semi-automatic content annotation tools}, URL = {https://iris.cnr.it/handle/20.500.14243/65046}, CONFERENCE_NAME = {BOEMIE 2006}, } @INPROCEEDINGS{CAPPELLI_2005_INPROCEEDINGS_CGF_244999, AUTHOR = {Cappelli, A. and Giovannetti, E. and Federico, M.}, TITLE = {The Role of Communication in Human-Robot Interaction}, YEAR = {2005}, ABSTRACT = {This article focuses on the problem of Human-Robot Interaction (HRI) with particular emphasis on the problem of communication between humans and robots. In this perspective, we can talk about Human-Robot Communication (HRC) as a part of HRI. To allow a human and a so called "social robot" to work as partners, it is necessary to develop suitable spoken dialogue systems. In this work, after an overview about social robots, we will face the problem of Human-Robot Communication and the different possible dialogue management techniques}, URL = {https://iris.cnr.it/handle/20.500.14243/244999}, } @ARTICLE{CAPPELLI_2004_ARTICLE_CG_79605, AUTHOR = {Cappelli, A. and Giovannetti, E.}, TITLE = {L'Interazione uomo-robot}, YEAR = {2004}, ABSTRACT = {L'Interazione Uomo-Robot (HRI, Human-Robot Interaction) è un'area di ricerca multidisciplinare in costante sviluppo ricca di spunti per ricerche avanzate e trasferimenti di tecnologia. Essa gioca un ruolo fondamentale nella realizzazione di robot che operano in ambienti aperti e cooperano con gli esseri umani. Compiti di questo tipo richiedono lo sviluppo di tecniche che permettano ad utenti inesperti di usare i loro robot in modo semplice e sicuro utilizzando interfacce intuitive e naturali. In questo lavoro, dopo un'introduzione riguardante le questioni fondamentali dell'HRI, saranno indagate le diverse classificazioni di robot e una particolare tassonomia dell'interazione uomo-robot, dopodiché saranno presentate le diverse modalità di interazione possibili tra un robot e un essere umano corredate da una serie di applicazioni di interfacce uomo-robot avanzate}, KEYWORDS = {Human-robot interaction}, PAGES = {18-36}, URL = {https://iris.cnr.it/handle/20.500.14243/79605}, VOLUME = {1 (2)}, ISSN = {1724-8035}, JOURNAL = {INTELLIGENZA ARTIFICIALE}, } @INPROCEEDINGS{BAGLIONI_2004_INPROCEEDINGS_BNG_57545, AUTHOR = {Baglioni, M. and Nanni, M. and Giovannetti, E.}, TITLE = {Mining literary texts using domain ontologies}, YEAR = {2004}, ABSTRACT = {This paper describes a query system on texts and literary material with advanced information retrieval tools. As a test bed we chose the electronic version of Dante's Inferno, manually tagged using XML, enriched with a domain ontology describing the historical, social and cultural context represented as a separate XML document}, KEYWORDS = {Ontology Engineering, Text Mining}, PAGES = {79-84}, URL = {https://iris.cnr.it/handle/20.500.14243/57545}, CONFERENCE_NAME = {Knowledge Discovery and Ontologies Worskshop 2004}, BOOKTITLE = {Proceedings of the Knowledge Discovery and Ontologies Worskshop 2004}, EDITOR = {Svátek, V.}, } @INPROCEEDINGS{CAPPELLI_2004_INPROCEEDINGS_CGM_57553, AUTHOR = {Cappelli, A. and Giovannetti, E. and Michelassi, P.}, TITLE = {Ontological knowledge and language in modelling classical architectonic structures}, YEAR = {2004}, ABSTRACT = {This article will concern the specification of the conceptual and linguistic constraints for the construction of a knowledge base in classical architecture, an operation that involves the structuring of the concepts of the domain to which appropriate linguistic terms must be associated. Our approach will take into account models of conceptual dictionaries proposed in computational linguistics as well as knowledge representation and ontological formalisms proposed in artificial intelligence and ontological engineering}, KEYWORDS = {Ontological engineering, Knowledge Representation Formalisms and Methods}, PAGES = {85-89}, URL = {https://iris.cnr.it/handle/20.500.14243/57553}, CONFERENCE_NAME = {Ontologies and Lexical Resources in Distributed Environment Ontolex 2004}, BOOKTITLE = {Proceedings of OntoLex 2004-Ontologies and Lexical Resources in Distributed Environment}, } @INPROCEEDINGS{CAPPELLI_2003_INPROCEEDINGS_CG_101362, AUTHOR = {Cappelli, A. and Giovannetti, E.}, TITLE = {Human-Robot Interaction}, YEAR = {2003}, ABSTRACT = {Human-Robot Interaction (HRI) is a constantly growing multidisciplinary area rich of cues for advanced researches and technology transfers. It plays a fundamental role in the development of robots that operate in an open environment and cooperate with humans. This task requires the development of techniques that allow inexpert users to use their robots in an efficient and safe way, using an intuitive and natural interface. In this work, after an introduction to the fundamental issues concerning HRI, we will present the different possible interaction modalities between robot and man followed by a series of advanced interface applications for autonomous mobile robots}, KEYWORDS = {Human robot interaction, Natural language processing, Man-machine interaction, Robotics}, PAGES = {15-20}, URL = {https://iris.cnr.it/handle/20.500.14243/101362}, ISBN = {88-85059-15-5}, CONFERENCE_NAME = {1st RoboCare Workshop}, BOOKTITLE = {Proceedings of the First Robocare Workshop}, EDITOR = {Cesta, A.}, } @MISC{CAPPELLI_2003_MISC_CG_142875, AUTHOR = {Cappelli, A. and Giovannetti, E.}, TITLE = {L'interazione Uomo-Robot}, YEAR = {2003}, ABSTRACT = {L'Interazione Uomo-Robot (HRI, Human-Robot Interaction) è un'area di ricerca multidisciplinare in costante sviluppo ricca di spunti per ricerche avanzate e trasferimenti di tecnologia. Essa gioca un ruolo fondamentale nella realizzazione di robot che operano in ambienti aperti e cooperano con gli esseri umani. Compiti di questo tipo richiedono lo sviluppo di tecniche che permettano ad utenti inesperti di usare i loro robot in modo semplice e sicuro utilizzando interfacce intuitive e naturali. In questo lavoro, dopo un'introduzione riguardante le questioni fondamentali dell'HRI, saranno indagate le diverse classificazioni di robot e una particolare tassonomia dell'Interazione Uomo-Robot, dopodiché saranno presentate le diverse modalità di interazione possibili tra un robot e un essere umano corredate da una serie di applicazioni di interfacce uomo-robot avanzate con particolare riguardo per i robot di assistenza agli anziani e alle persone diversamente abili}, KEYWORDS = {Robotics, Human-robot interaction, Man-machine interfaces}, URL = {https://iris.cnr.it/handle/20.500.14243/142875}, } @MISC{GIOVANNETTI_2003_MISC_G_264613, AUTHOR = {Giovannetti, E.}, TITLE = {8° Congresso della Associazione Italiana per l'Intelligenza Artificiale}, YEAR = {2003}, URL = {https://iris.cnr.it/handle/20.500.14243/264613}, }