Neuro-Dynamic Programming.
Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente
Aprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo Explícito do Aprendiz