Dissecting continual learning: a structural and data analysis

DSpace/Manakin Repository

Show simple item record

dc.contributor.advisor Torsello, Andrea it_IT
dc.contributor.author Pelosin, Francesco <1992> it_IT
dc.date.accessioned 2022-06-02 it_IT
dc.date.accessioned 2023-02-22T13:45:52Z
dc.date.available 2023-07-06T08:47:44Z
dc.date.issued ND it_IT
dc.identifier.uri http://hdl.handle.net/10579/22750
dc.description.abstract Continual Learning (CL) è un campo della ricerca dell'intelligenza artificiale dedicata al progetto di algoritmi capaci di superare il problema del catastrofic forgetting nelle reti neurali, il fenomeno per il quale si ha la distruzione dei concetti appresi nel passato quando la rete sta apprendendo un concetto nuovo. Attualmente le reti neurali hanno dimostrato sorprendenti capacità nel risolvere diversi problemi reali, questi modelli, però, assumono una certa stabilità nella distribuzione dei dati e quando questo viene a meno il fenomeno di catastrofic forgettingsi presenta. In questa tesi, dopo una introduzione sullo stato dell'arte ed una discussione sulla letteratura corrente, introduciamo una analisi sul catastrophic forgetting nelle reti convolutive. In particolare vedremo come il pretraining di una backbone influisca sulle performance in ambito incrementale. Dopodichè dimostreremo come nei sistemi basati su buffer di replay (ossia memorie), sia di gran lunga più essenziale riporre l'attenzione nel memorizzare più quanti dati si riesca piuttosto che sula qualità di essi. Infine presentiamo uno dei primi studi sull'apprendimento incrementale nelle architetture che implementano il meccanismo di self-attention, ossia sui ViTs. Introduciamo una comparazione tra metodi basati sui dati, metodi funzionali e metodi basati sulla regolarizzazione del meccanismo di self-attention e dimostreremo come quest'ultimi siano competitivi rispetto allo stato dell'arte. it_IT
dc.language.iso it it_IT
dc.publisher Università Ca' Foscari Venezia it_IT
dc.rights © Francesco Pelosin, 2022 it_IT
dc.title Dissecting continual learning: a structural and data analysis it_IT
dc.title.alternative it_IT
dc.type Doctoral Thesis it_IT
dc.degree.name Informatica it_IT
dc.degree.level Dottorato it_IT
dc.degree.grantor it_IT
dc.description.academicyear Dottorati_01-07-2022_34-33 Ciclo it_IT
dc.description.cycle 34
dc.degree.coordinator Cortesi, Agostino
dc.location.shelfmark D002195
dc.rights.accessrights openAccess it_IT
dc.thesis.matricno 839220 it_IT
dc.format.pagenumber 117 p.
dc.subject.miur INF/01 INFORMATICA it_IT
dc.description.note it_IT
dc.degree.discipline it_IT
dc.contributor.co-advisor it_IT
dc.provenance.upload Francesco Pelosin (839220@stud.unive.it), 2022-06-02 it_IT
dc.provenance.plagiarycheck Andrea Torsello (), 2022-07-01 it_IT


Files in this item

This item appears in the following Collection(s)

Show simple item record