Manuzio: an object language for annotated text collections

DSpace/Manakin Repository

Show simple item record

dc.contributor.advisor Orsini, Renzo it_IT
dc.contributor.author Maurizio, Marek <1978> it_IT
dc.date.accessioned 2010-03-13T11:18:28Z it_IT
dc.date.accessioned 2012-07-30T15:50:45Z
dc.date.available 2010-03-13T11:18:28Z it_IT
dc.date.available 2012-07-30T15:50:45Z
dc.date.issued 2010-03-02 it_IT
dc.identifier.uri http://hdl.handle.net/10579/918 it_IT
dc.description.abstract Traditionally, collections of texts are digitally represented as a set of documents containing the text along with some kind of markup to define extra information, like metadata, annotations, etc. We propose a different approach that models the textual information in a dual way: as a sequence of characters, as well as a composition of a particular kind of entities, called textual objects. With such objects it is possible to represent portions of text organized in different, potentially overlapping, hierarchies, together with complex annotations. Manuzio is a statically typechecked language to define schemas of such textual objects and to write complex queries and applications on them through a set of powerful operators. In the thesis we describe our textual model, the main features of the language ares specified, and, finally, we introduce a sketch of a system to manage persistent collections of texts and execute programs written in Manuzio. it_IT
dc.description.abstract Tradizionalmente una collezione di testi è reppresentata in formato digitale da un insieme di documenti che contengono, oltre al testo stesso, qualche tipo di marcatura per veicolare informazioni extra-textuali, come metadati, annotazioni, etc. In questa tesi si propone un approccio differente, che modella l'informazione testuale in maniera duplice: sia come una sequenza di caratteri, sia come una composizione di particolari entità, chiamate oggetti testuali. Tramite questi oggetti è possibile rappresentare porzioni di testo, organizzate in gerarchie potenzialmente sovrapposte, complementate da annotazioni strutturate. Manuzio è un linguaggio di programmazione staticamente tipato che permette di deinire schemi di oggetti testuali e di scrivere interrogazioni e algoritmi di analisi testuali attraverso un insieme di operatori potenti. In questa tesi viene descritto il modello testuale, vengono specificate principali caratteristiche del linguaggio Manuzio, e viene introdotta la bozza di un sistema completo capace di archiviare collezioni di testi in maniera persistente e di eseguire programmi Manuzio. it_IT
dc.format.medium Tesi cartacea it_IT
dc.language.iso en it_IT
dc.publisher Università Ca' Foscari Venezia it_IT
dc.rights © Marek Maurizio, 2010 it_IT
dc.subject Object-oriented language it_IT
dc.subject Document database system it_IT
dc.subject Text-analysis it_IT
dc.subject Textual object it_IT
dc.subject Manuzio <linguaggio di programmazione> it_IT
dc.subject Digital libraries it_IT
dc.title Manuzio: an object language for annotated text collections it_IT
dc.type Doctoral Thesis it_IT
dc.degree.name Informatica it_IT
dc.degree.level Dottorato di ricerca it_IT
dc.degree.grantor Facoltà di Scienze matematiche fisiche e naturali it_IT
dc.description.academicyear 2008/2009 it_IT
dc.description.cycle 22 it_IT
dc.degree.coordinator Salibra, Antonio it_IT
dc.location.shelfmark D000849 it_IT
dc.location Venezia, Archivio Università Ca' Foscari, Tesi Dottorato it_IT
dc.rights.accessrights openAccess it_IT
dc.thesis.matricno 955378 it_IT
dc.format.pagenumber 224 p. it_IT
dc.subject.miur INF/01 INFORMATICA it_IT
dc.degree.discipline Informatica it_IT


Files in this item

This item appears in the following Collection(s)

Show simple item record