Deep Reinforcement Learning

¡Bienvenidos al curso Deep Reinforcement Learning! En esta sección encontrará el material semanal del curso, incluyendo las grabaciones de las sesiones en vivo, las notas cuidadosamente redactadas por el tutor y las presentaciones utilizadas en clase. También podrá descargar desde aquí las evaluaciones y acceder a los retos prácticos.

Durante 12 semanas exploraremos juntos los fundamentos del aprendizaje por refuerzo profundo, combinando teoría matemática y práctica en Python. Estudiaremos desde técnicas clásicas como Q-Learning y la ecuación de Bellman, hasta métodos avanzados como Deep Q-Learning, REINFORCE, Actor-Critic, PPO y Conservative Q-Learning, utilizando librerías como PyTorch, TensorFlow y Stable Baselines.

A lo largo del curso aplicaremos estos conocimientos en casos reales de alto impacto como sistemas de recomendación, estrategias de trading, control robótico y más. El objetivo es formar científicos de datos capaces de diseñar agentes inteligentes que tomen decisiones óptimas en entornos complejos.

¡Le deseamos mucho éxito en su aprendizaje y esperamos que este curso transforme su forma de pensar el diseño de soluciones inteligentes!

‍

Semana

Introducción a Redes Neuronales Densas

Notas

La intención de este material es compartirle a los estudiantes los conceptos básicos de las redes neuronales profundas que necesitarán para el resto del curso. Las notas de esta sección únicamente contienen las definiciones de las redes neuronales densas sin embargo es posible que a lo largo del curso se utilicen otro tipo de arquitecturas.

‍

No items found.

Semana

Temporal difference, Q-Learning y Bellman

Notas

Presentación

En esta semana introduciremos los procesos de decisión de Markov que representan un modelo de aprendizaje ligeramente distinto a los modelos supervisados con los que los estudiantes están normalmente familiarizados. La intención de esta primera semana es revisar los detalles de los algoritmos de Q-Learning basados en las ecuaciones de Bellman.

DRL - 14 Jul, 2025

Track ciencia de datos

Track de Machine Learning

Track de Deep Learning

Track de Finanzas Cuantitativas

Deep Reinforcement Learning

Semana

Introducción a Redes Neuronales Densas

Semana

Temporal difference, Q-Learning y Bellman

Semana

RETO I

Semana

Deep Q-Learning

Semana

RETO II

Semana

Policy Gradient

Semana

RETO III

Semana

Evaluación Parcial

Semana

Actor-Critic

Semana

RETO IV

Semana

PPO & GRPO

Semana

RETO V

Semana

Oﬄine RL: Conservative Q-Learning

Semana

Reto VI & Evaluación Final

Acceso restringido