dc.contributor.advisor |
Orsini, Renzo |
it_IT |
dc.contributor.author |
Maurizio, Marek <1978> |
it_IT |
dc.date.accessioned |
2010-03-13T11:18:28Z |
it_IT |
dc.date.accessioned |
2012-07-30T15:50:45Z |
|
dc.date.available |
2010-03-13T11:18:28Z |
it_IT |
dc.date.available |
2012-07-30T15:50:45Z |
|
dc.date.issued |
2010-03-02 |
it_IT |
dc.identifier.uri |
http://hdl.handle.net/10579/918 |
it_IT |
dc.description.abstract |
Traditionally, collections of texts are digitally represented as a set of documents containing the text along with some kind of markup to define extra information, like metadata, annotations, etc. We propose a different approach that models the textual information in a dual way: as a sequence of characters, as well as a composition of a particular kind of entities, called textual objects. With such objects it is possible to represent portions of text organized in different, potentially overlapping, hierarchies, together with complex annotations. Manuzio is a statically typechecked language to define schemas of such textual objects and to write complex queries and applications on them through a set of powerful operators. In the thesis we describe our textual model, the main features of the language ares specified, and, finally, we introduce a sketch of a system to manage persistent collections of texts and execute programs written in Manuzio. |
it_IT |
dc.description.abstract |
Tradizionalmente una collezione di testi è reppresentata in formato digitale da un insieme di documenti che contengono, oltre al testo stesso, qualche tipo di marcatura per veicolare informazioni extra-textuali, come metadati, annotazioni, etc. In questa tesi si propone un approccio differente, che modella l'informazione testuale in maniera duplice: sia come una sequenza di caratteri, sia come una composizione di particolari entità, chiamate oggetti testuali. Tramite questi oggetti è possibile rappresentare porzioni di testo, organizzate in gerarchie potenzialmente sovrapposte, complementate da annotazioni strutturate. Manuzio è un linguaggio di programmazione staticamente tipato che permette di deinire schemi di oggetti testuali e di scrivere interrogazioni e algoritmi di analisi testuali attraverso un insieme di operatori potenti. In questa tesi viene descritto il modello testuale, vengono specificate principali caratteristiche del linguaggio Manuzio, e viene introdotta la bozza di un sistema completo capace di archiviare collezioni di testi in maniera persistente e di eseguire programmi Manuzio. |
it_IT |
dc.format.medium |
Tesi cartacea |
it_IT |
dc.language.iso |
en |
it_IT |
dc.publisher |
Università Ca' Foscari Venezia |
it_IT |
dc.rights |
© Marek Maurizio, 2010 |
it_IT |
dc.subject |
Object-oriented language |
it_IT |
dc.subject |
Document database system |
it_IT |
dc.subject |
Text-analysis |
it_IT |
dc.subject |
Textual object |
it_IT |
dc.subject |
Manuzio <linguaggio di programmazione> |
it_IT |
dc.subject |
Digital libraries |
it_IT |
dc.title |
Manuzio: an object language for annotated text collections |
it_IT |
dc.type |
Doctoral Thesis |
it_IT |
dc.degree.name |
Informatica |
it_IT |
dc.degree.level |
Dottorato di ricerca |
it_IT |
dc.degree.grantor |
Facoltà di Scienze matematiche fisiche e naturali |
it_IT |
dc.description.academicyear |
2008/2009 |
it_IT |
dc.description.cycle |
22 |
it_IT |
dc.degree.coordinator |
Salibra, Antonio |
it_IT |
dc.location.shelfmark |
D000849 |
it_IT |
dc.location |
Venezia, Archivio Università Ca' Foscari, Tesi Dottorato |
it_IT |
dc.rights.accessrights |
openAccess |
it_IT |
dc.thesis.matricno |
955378 |
it_IT |
dc.format.pagenumber |
224 p. |
it_IT |
dc.subject.miur |
INF/01 INFORMATICA |
it_IT |
dc.degree.discipline |
Informatica |
it_IT |