Deep Reinforcement Learning

¡Bienvenidos al curso Deep Reinforcement Learning! En esta sección encontrará el material semanal del curso, incluyendo las grabaciones de las sesiones en vivo, las notas cuidadosamente redactadas por el tutor y las presentaciones utilizadas en clase. También podrá descargar desde aquí las evaluaciones y acceder a los retos prácticos.

Durante 12 semanas exploraremos juntos los fundamentos del aprendizaje por refuerzo profundo, combinando teoría matemática y práctica en Python. Estudiaremos desde técnicas clásicas como Q-Learning y la ecuación de Bellman, hasta métodos avanzados como Deep Q-Learning, REINFORCE, Actor-Critic, PPO y Conservative Q-Learning, utilizando librerías como PyTorch, TensorFlow y Stable Baselines.

A lo largo del curso aplicaremos estos conocimientos en casos reales de alto impacto como sistemas de recomendación, estrategias de trading, control robótico y más. El objetivo es formar científicos de datos capaces de diseñar agentes inteligentes que tomen decisiones óptimas en entornos complejos.

¡Le deseamos mucho éxito en su aprendizaje y esperamos que este curso transforme su forma de pensar el diseño de soluciones inteligentes!

Semana

Introducción a Redes Neuronales Densas

Notas

La intención de este material es compartirle a los estudiantes los conceptos básicos de las redes neuronales profundas que necesitarán para el resto del curso. Las notas de esta sección únicamente contienen las definiciones de las redes neuronales densas sin embargo es posible que a lo largo del curso se utilicen otro tipo de arquitecturas.

No items found.

Semana

Temporal difference, Q-Learning y Bellman

Notas

Presentación

En esta semana introduciremos los procesos de decisión de Markov que representan un modelo de aprendizaje ligeramente distinto a los modelos supervisados con los que los estudiantes están normalmente familiarizados. La intención de esta primera semana es revisar los detalles de los algoritmos de Q-Learning basados en las ecuaciones de Bellman.
DRL - 14 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 14 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 15 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 15 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 16 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 16 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

RETO I

Reto I

DRL - 21 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 21 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 23 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 23 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

Deep Q-Learning

Notas

Presentación

En esta estudiaremos cómo se pueden incorporar a las redes neuronales profundas en la predicción de los valores Q sin necesariamente utilizar las ecuaciones de Bellman. Estos métodos fueron utilizados por primera vez por Deep Mind para jugar Atari y en ese caso se utilizaron redes neuronales profundas, en esta semana trabajaremos con un problema de Market Place.
DRL - 28 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 28 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 29 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 29 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 30 Jul, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 30 Jul, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

RETO II

Reto II

DRL - 04 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 04 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 05 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 05 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 06 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 06 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

Policy Gradient

Notas

Presentación

En esta semana hablaremos sobre los métodos de aprendizaje por refuerzo en los que el proceso de entrenamiento optimiza directamente los parámetros de una política en lugar de intentar optimizar la función Q como en otros ejemplos.
DRL - 11 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 11 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 12 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 12 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 13 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 13 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

RETO III

Reto III

DRL - 18 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 18 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 19 Ago, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 19 Ago, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

Evaluación Parcial

No items found.

Semana

Actor-Critic

Notas

En este semana vamos a estudiar una arquitectura muy interesante para el Aprendizaje por Refuerzo en la que dos modelos de redes neuronales van a construir un sistema en el que uno evalúa al otro, su nombre es Actor Critic. Estas arquitecturas recuerdan a los métodos tipo GAN en IA generativa.
DRL - 01 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 01 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 02 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 02 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

RETO IV

Reto IV

DRL - 08 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 08 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 09 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 09 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 10 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 10 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

PPO & GRPO

Notas

En esta semana estudiaremos los modelos de Proximal Policy Optimization los cuales son un método de regularización para los algoritmos estilo Actor Critic que hemos visto anteriormente. Lo utilizaremos para mejorar la calidad de un Gran Modelo de Lenguaje y prevenir mensajes de odio.
DRL - 17 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 17 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 22 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 22 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

RETO V

Reto V

DRL - 23 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 23 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 24 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 24 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

Offline RL: Conservative Q-Learning

Notas

Presentación

En este módulo hablaremos sobre los algoritmos de aprendizaje por refuerzo que son capaces de entrenarse sin la necesidad de interactuar con el medio, a estos algoritmos se les conoce como Offline Reinforcement Learning, el caso de uso que trataremos serán los sistemas de recomendación.
DRL - 29 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 29 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 30 Sep, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 30 Sep, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 03 Oct, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 03 Oct, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.

Semana

Reto VI & Evaluación Final

DRL - 06 Oct, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 06 Oct, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 07 Oct, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 07 Oct, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
DRL - 08 Oct, 2025
RESPONDER CUESTIONARIO
¿Tiene alguna duda para el profesor?
Hacer pregunta sobre lección
DRL - 08 Oct, 2025
Muchas gracias, tu pregunta ha sido enviada al profesor. Se pondrá en contacto contigo a tu correo electrónico.
Algo sucedió mal, favor de intentar de nuevo, si sigue sin funcionar favor de solicitar soporte.
EDL2601 - 19 Feb, 2026
EDL2601 - 18 Feb, 2026
EDL2601 - 17 Feb, 2026
EDL2601 - 16 Feb, 2026
M&DL2501 - 12 Feb, 2026
M&DL2501 - 10 Feb, 2026
M&DL2501 - 05 Feb, 2026
M&DL2501 - 03 Feb, 2026
M&DL2501 - 27 Ene, 2026
M&DL2501 - 26 Ene, 2026
M&DL2501 - 22 Ene, 2026
M&DL2501 - 20 Ene, 2026
M&DL2501 - 19 Ene, 2026
NLP2601 - 15 Ene, 2026 (Parte II)
M&DL2501 - 13 Ene, 2026
M&DL2501 - 12 Ene, 2026
M&DL2501 - 08 Ene, 2026
M&DL2501 - 06 Ene, 2026
M&DL2501 - 06 Ene, 2026
M&DL2501 - 18 Dic, 2025
M&DL2501 - 16 Dic, 2025
M&DL2501 - 15 Dic, 2025
M&DL2501 - 09 Dic, 2025
M&DL2501 - 11 Dic, 2025
M&DL2501 - 08 Dic, 2025

Acceso restringido

Por favor de comunicarte con nuestro soporte si este es un error.