Repairing Disengagement With Non-Invasive Interventions.
Reinforcement Learning: An Introduction.
Learning to act using real-time dynamic programming
Artificial Intelligence
Satinder P. Singh
Steven J. Bradtke
Beverly Park Woolf
Sridhar Mahadevan
Don Fisher
Hasmik Meheranian
A stochastic approximation method with max-norm projections and its applications to the Q-learning algorithm
Utilizando Agentes Pedagógicos Animados como uma abordagem não restritiva ao Gaming The System
Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente