Deep Reinforcement Learning
¡Bienvenidos al curso Deep Reinforcement Learning! En esta sección encontrará el material semanal del curso, incluyendo las grabaciones de las sesiones en vivo, las notas cuidadosamente redactadas por el tutor y las presentaciones utilizadas en clase. También podrá descargar desde aquí las evaluaciones y acceder a los retos prácticos.
Durante 12 semanas exploraremos juntos los fundamentos del aprendizaje por refuerzo profundo, combinando teoría matemática y práctica en Python. Estudiaremos desde técnicas clásicas como Q-Learning y la ecuación de Bellman, hasta métodos avanzados como Deep Q-Learning, REINFORCE, Actor-Critic, PPO y Conservative Q-Learning, utilizando librerías como PyTorch, TensorFlow y Stable Baselines.
A lo largo del curso aplicaremos estos conocimientos en casos reales de alto impacto como sistemas de recomendación, estrategias de trading, control robótico y más. El objetivo es formar científicos de datos capaces de diseñar agentes inteligentes que tomen decisiones óptimas en entornos complejos.
¡Le deseamos mucho éxito en su aprendizaje y esperamos que este curso transforme su forma de pensar el diseño de soluciones inteligentes!
%2520(1).png)
Semana
Introducción a Redes Neuronales Densas

Semana
Temporal difference, Q-Learning y Bellman

Semana
Deep Q-Learning

Semana
Policy Gradient
.png)
Semana
Actor-Critic
.png)
Semana
PPO & GRPO

Semana
Offline RL: Conservative Q-Learning

