opera
Environments
categoria | Video |
soggetto | Figura umana, Architettura, Animale |
tags | AI, Artificial Intelligence, Reinforcement Learning, Intelligenza Artificiale, IA, experimental |
minuti | 10 |
secondi | 0 |
anno | 2021 |
Video of Reinforcement Learning Training.
Digital Video, NFT 2Kpx Square.
Environments è una serie di opere focalizzata sulla visualizzazione di addestramenti automatici di reti neurali attraverso tecniche di reinforcement learning.
Il reinforcement learning è uno dei tre più importanti paradigmi di apprendimento automatico insieme all'apprendimento supervisionato e quello non supervisionato. Questa tecnica permette ad intelligenze artificiali di imparare a compiere azioni che portano a conseguire un obiettivo agendo nel modo più efficace possibile all'interno di un dato ambiente.
In Environments ogni opera mostra un piccolo mondo all'interno del quale l'agente intelligente può operare senza condizionamenti. L'AI non ha una conoscenza preventiva delle regole e di ciò che la circonda, ma dopo vari tentativi per ottenere il feedback corretto dall'ambiente imparerà da sola a muoversi come meglio le conviene per ottenere la ricompensa.
Gli apprendimenti per rinforzo vengono spesso modellizzati tramite i processi decisionali di Markov (MDP), particolarmente utili per affrontare una vasta gamma di problemi di ottimizzazione in contesti in cui i risultati sono in parte casuali ed in parte sotto il controllo di un decisore.
Digital Video, NFT 2Kpx Square.
Environments è una serie di opere focalizzata sulla visualizzazione di addestramenti automatici di reti neurali attraverso tecniche di reinforcement learning.
Il reinforcement learning è uno dei tre più importanti paradigmi di apprendimento automatico insieme all'apprendimento supervisionato e quello non supervisionato. Questa tecnica permette ad intelligenze artificiali di imparare a compiere azioni che portano a conseguire un obiettivo agendo nel modo più efficace possibile all'interno di un dato ambiente.
In Environments ogni opera mostra un piccolo mondo all'interno del quale l'agente intelligente può operare senza condizionamenti. L'AI non ha una conoscenza preventiva delle regole e di ciò che la circonda, ma dopo vari tentativi per ottenere il feedback corretto dall'ambiente imparerà da sola a muoversi come meglio le conviene per ottenere la ricompensa.
Gli apprendimenti per rinforzo vengono spesso modellizzati tramite i processi decisionali di Markov (MDP), particolarmente utili per affrontare una vasta gamma di problemi di ottimizzazione in contesti in cui i risultati sono in parte casuali ed in parte sotto il controllo di un decisore.