Abstract:
Gli obiettivi della tesi sono l'implementazione e l'applicazione di sistemi automatici di trading finanziario alla gestione di portafogli basata sulla tecnica di apprendimento automatico nota come Reinforcement Learning. In particolare, si intende indirizzare la ricerca sulla funzione di reward, cioè sulla funzione che dà una ricompensa negativa o positiva. La più usato in letteratura è il ben noto Sharpe ratio. Sebbene tale rapporto sia una misura di performance corretta per il rischio, non risulta in grado di cogliere entrambi né gli aspetti che caratterizzano le attuali ricerche accademiche su queste misure né le regole prese in considerazione dall'industria di gestione del portafoglio. In letteratura sono state proposte alcune semplici funzioni di ricompensa alternative al Sharpe ratio, ma sono insufficienti. A causa di tutto ciò, si intende concentrare l'elaborato sulla specificazione di funzioni di reward che siano teoricamente fondate e operativamente efficaci.