Abstract:
Questo studio offre un’analisi teorica ed un’indagine pratica per lo studio della lingua russa contemporanea su Internet.
Il primo capitolo tratta della linguistica dei corpora, dalle sue origini ad oggi, e degli approcci alla disciplina corpus-based e corpus-driven. In seguito, vengono descritti gli sviluppi diacronici della linguistica dei corpora in area anglofona, in Italia e in Russia.
Il secondo capitolo riguarda i corpora linguistici tradizionali: oltre alle numerose definizioni di corpus linguistico proposte dai principali autori, vengono illustrate le caratteristiche essenziali dei corpora, quali formato elettronico ed autenticità dei dati, rappresentatività, bilanciamento del corpus, nonché le varie tipologie di corpora linguistici.
Il terzo capitolo si focalizza sul Web as Corpus, fornendo una descrizione di questo approccio innovativo e controverso e delle principali critiche mosse nei confronti di questo approccio. Successivamente viene illustrato l’approccio Web for Corpus e le modalità di creazione dei cosiddetti Web Corpora. Il terzo capitolo si conclude con l’analisi di due problematiche relative ai Web corpora, il copyright e il netspeak, la lingua di Internet.
Il quarto ed ultimo capitolo presenta l’analisi pratica svolta su oltre 80 lessemi del netspeak russo contemporaneo e realizzata mediante il Corpus Nazionale della Lingua Russa e due Web Corpora, il RuTenTen11 e il RuTenTen17. A conclusione della ricerca vengono illustrati i risultati ottenuti.