Da diversi anni l’Istituto Opera del Vocabolario Italiano (OVI) utilizza, ai fini della redazione del TLIO (Tesoro della Lingua Italiana delle Origini) un software lessicografico interamente progettato e realizzato al suo interno.
Il programma, denominato GATTO-© (Gestione degli Archivi Testuali del Tesoro delle Origini - Copyright CNR 1999), permette di costruire corpus testuali elettronici a partire da testi scritti e opportunamente codificati mediante normali programmi di videoscrittura; i corpus possono essere in seguito modificati tramite inserimento o rimozione di testi. Altre parti del programma permettono di lemmatizzare i corpus mediante associazione di lemmi alle forme grafiche che vi compaiono, sia in riferimento a specifiche occorrenze delle forme sia definendo collegamenti generali tra forme e lemmi.
Una lemmatizzazione a più livelli può essere ottenuta raggruppando forme o lemmi mediante iperlemmi, definibili all’interno di una struttura gerarchica.
I testi, completi di lemmi e iperlemmi associati, possono essere estratti dal corpus, modificati tramite normali programmi di videoscrittura, quindi reinseriti nel corpus di partenza o in altri.
Ogni corpus, lemmatizzato o meno, può essere interrogato al fine di estrarre informazioni lessicografiche relative al corpus completo o a parti di esso (sottocorpus) definibili di volta in volta in maniera dinamica.
Le ricerche riguardano la localizzazione, all’interno del corpus, di occorrenze di forme specifiche, precisabili sia direttamente, sia sulla base delle loro associazioni a lemmi o iperlemmi, sia tramite proprietà associate quali categorie grammaticali e 'disambiguatori'. Possono essere cercate cooccorrenze di più forme e/o segni di interpunzione presenti nei testi in successione o in prossimità . I risultati consistono in una serie di contesti visualizzati ed esportabili su file RTF. Le altre azioni effettuabili sui corpus includono la generazione di index locorum per forme o per lemmi, formari, lemmari, incipitari, statistiche espresse in forma numerica o grafica.
Numerose opzioni, disponibili in tutte le fasi della ricerca, dall’impostazione iniziale all’estrazione dei risultati, consentono di adeguare i comportamenti del programma a esigenze molto diverse. A titolo di esempio, è possibile copiare e incollare in un'apposita finestra un brano tratto da un testo qualunque e cercare automaticamente, all’interno del corpus, le occorrenze delle forme incluse nel brano copiato.
GATTO-© consta attualmente di circa 50.000 righe di codice. È un programma nato e sviluppato in vista di un uso specialistico e, in quanto tale, non è di comprensione immediata: per questo motivo è stato dotato di un'ampia manualistica, sia cartacea che contestuale. Data la varietà delle funzioni di cui dispone è stato peraltro adottato da gruppi di ricerca esterni all’OVI.
Da circa un anno il programma può essere scaricato liberamente all’indirizzo www.ovi.cnr.it da chiunque desideri utilizzarlo, completo della manualistica.
Istituto opera del vocabolario italiano
Sito web dell’Istituto: http://www.ovi.cnr.it
Direttore: Prof Pietro Beltrami
Indirizzo: Via di Castello, 46 - 50141 Firenze FI Toscana
Tel.: 055452841 - 055452842 - 055452843
Fax.: 0554250678
E-Mail: ovi@csovi.fi.cnr.it
Sezioni:
Codice CDS.UO: 062.000
Area disciplinare*:Scienze umane e sociali
Tematiche di ricerca: - Elaborazione del vocabolario storico della lingua italiana. Redazione del vocabolario storico dell’italiano antico (tesoro della lingua italiana delle origini), con la relativa banca dati informatizzata dell’italiano antico. Redazione del vocabolario storico fino ai giorni nostri. Aggiornamento permanente del vocabolario, al passo con gli sviluppi della filologia e della linguistica. Produzione di procedure informatiche per la lessicografia e la linguistica.
Data di costituzione: 12/02/2001
Provvedimento ordinamentale: 15791, 15837, 16273, 16432
Accorpamenti
* l’aggregazione è ai fini funzionali
Ultimi Articoli
JEnerational Mentoring presentato a Mi prendo il Mondo – Dialogo tra generazioni a Parma
Treno di cioccolato record a Palazzo Lombardia – Aperto il 39° piano
Strage Crans-Montana – Dimessi due giovani da Niguarda dopo l'incendio
Strapazzami di coccole Topo Gigio il Musical: una fiaba che parla al cuore
Goldoni al Teatro San Babila di Milano con La Locandiera
Ceresio in Giallo chiude con 637 opere: giallo, thriller e noir dall'Italia all'estero
Milano celebra Leonardo — al Castello Sforzesco tre iniziative speciali per le Olimpiadi 2026
Trasporto ferroviario lombardo: 780.000 corse e 205 milioni di passeggeri nel 2025
Piazza Missori accoglie la Tenda Gialla – Tre giorni di volontariato under zero con i Ministri di Scientology