Peter Dayan
Geoffrey E Hinton
Tutoriais Inteligentes Baseados em Aprendizado por Reforço: Concepção, Implementação e Avaliação Empírica