Intel·ligència Artificial: Aprenentatge per reforç

Kiril Morozov Data Scientist en Teralco, ens va oferir la perspectiva del desenvolupament de solucions d'Intel·ligència Artificial basades en l'aprenentatge per reforç. Va mostrar les fases dels projectes basats en Intel·ligència Artificial i Big Data, com evolucionen en l'empresa i com s'aconsegueixen les fases de producció.

Va revelar els principals paràmetres per a aconseguir l'èxit en les solucions dels projectes, aportant la perspectiva necessària sobre les eines i recursos disponibles.

En aprenentatge per reforç no tenim una "etiqueta d'eixida”, per la qual cosa no és de tipus supervisat i si bé aquests algorismes aprenen per si mateixos, tampoc són de tipus no supervisat, on s'intenta classificar grups tenint en compte alguna distància entre mostres. L'Aprenentatge reforçat intentarà fer aprendre a la màquina basant-se en un esquema de "premis i càstigs” en un entorn on cal prendre accions i que està afectat per múltiples variables que canvien amb el temps.