Abstract:
Con l’aumento delle capacità computazioni degli elaboratori elettronici gli insiemi di dati che vengono raccolti da ricercatori e studiosi in ogni settore di indagine aumentano in modo esponenziale. Non sempre però la crescita del numero dei dati e delle loro dimensioni implica una maggiore informazione e conoscenza sui fenomeni. Solo nuovi approcci metodologici e nuove forme di modellazione potranno aiutare nell'identificare l'informazione spesso nascosta in queste grandi insiemi di dati. Nella letteratura statistica si nota un crescente interesse per la costruzione di nuovi metodi di analisi e simulazione che consentano di identificare e interpretare al meglio queste informazioni.
In questo elaborato si darà inizialmente una descrizione del problema della grande numerosità e grande dimensionalità dei dati. Si presenteranno e analizzeranno quindi le nuove metodologie statistiche proposte per affrontare tale problema e si proporrà infine un approccio che si ritiene di particolare utilità in alcuni contesti di ricerca.