Uno de los objetivos fundamentales de la Escuela Bourbaki es transmitir a los estudiantes, público en general y a la industria, las ventajas prácticas y el placer que implican conocer los detalles de la actividad matemática.
Enseñar un manejo de Python que permita resolver problemas utilizando imágenes,
texto, bases estructuradas, series de tiempo e incluso cuando no existen suficientes datos.
Familiarizar al estudiante con el lenguaje matemático así como su utilidad
para resolver problemas concretos e identificar dificultades. Se hará énfasis en
fortalecer la intuición de los estudiantes.
Estudiar las ideas matemáticas utilizadas en Ciencia de Datos enfocándonos en las
siguientes áreas: Probabilidad, Estadística e Inferencia Bayesiana, Álgebra Lineal y
Optimización y Cálculo Diferencial.
Estudiar algoritmos de Machine Learning y ponerlos en práctica utilizando
fuentes de datos reales.
Practicar el manejo de datos estructurados y no-estructurados utilizando
Python para obtener análisis de analítica avanzada o prescriptiva.
El estudiante debe estar interesado en aprender los detalles matemáticos detrás de los algoritmos y modelos de Machine learning con el objetivo de mejorar su comprensión sobre las ventajas, dificultades o soluciones que ocurren en el
trabajo de los científicos de datos.
Los candidatos ideales son: practicantes de ciencia de datos, ingenieros de datos, analistas de negocios, desarrolladores de software o estudiantes de posgrado que deseen completar su formación.
1. Cada semana se realizará un pequeño test para revisar el aprendizaje del estudiante.
2. Al final cada bloque (tres bloques por curso) se realizará una evaluación que
consiste en dos partes:
3. El curso incluye un acompañamiento por parte de los profesores en el
desarrollo de los proyectos de los estudiantes utilizando las técnicas aprendidas.
Machine Learning & AI for the Working Analyst
1. Invitación a redes neuronales: perceptrón
2. Árboles de decisión y random forest
3. Regresiones logísticas, Ridge y Lasso
4. Latent Dirichlet Allocation
5. Regresión Robusta y outliers
6. ARMA, ARIMA y ARCH
7. Simulación Monte-Carlo para cadenas de Markov
8. Aprendizaje por refuerzo y Q-Learning
9. Deep Learning para NLP (LSTM y Atención)
Matemáticas para la Ciencia de Datos
Módulo 1. Fundamentos de probabilidad
1. La aleatoriedad y la independencia
2. Variables aleatorias y sus invariantes
3. El Método de Monte Carlo
4. Máxima verosimilitud y regresiones Bernoulli
5. Las cadenas de Markov Page Rank
6. Metropolis Hastling
Módulo 2. Estadística e Inferencia Bayesiana
1. Tests estadísticos
2. Inferencia Causal y priors conjugados
3. A/B testing & Thompson samplings
4. Regresiones bayesianas geolocalizadas
5. Redes bayesianas
6. Kriging y procesos gaussianos
Módulo 3. Álgebra Lineal
1. Matrices y sistemas de ecuaciones
2. Medidas de similitud de audios
3. Análisis de Componentes Principales PCA
4. Latent Semantic Analysis y SVD
5. Eigen-descomposición y text-rank
6. Álgebra lineal numérica I
Módulo 4. Optimización y Cálculo Diferencial
1. Programación lineal y optimización
2. Programación dinámica y Bellman
3. Gradiente descendente de Cauchy
4. Stochastic Gradient Descend y Adaptative SGD
5. El algoritmo de Backpropagation
6. Optimización bayesiana
3. Especialización en Deep Learning
Módulo 1. Redes convolucionales
1. Capas densas y convolucionales
2. Detección de objetos
3. Arquitecturas modernas: auto-encoders
4. Algoritmos de entrenamiento
Módulo 2. Redes recurrentes y transformer
1. Capas recurrentes
2. Series de tiempo multi-variadas y multi-horizonte
3. El mecanismo de atención de Bahdanau
4. Regularización
Módulo 3. Redes multi-modales
1. El producto de Hadamard y la fusión de datos
2. Álgebra tensorial
3. Regularización II
4. Backpropagation
Módulo4. Modelos del lenguaje
1. Word2vec & Doc2vec
2. BERT & GPT
3. Fine-tuning
4. Mecanismo de atención
Módulo 5. Difusión estable y GAN’s
1. Generative Adversarial Networks
2. Modelos CLIP
3. Difusión estable
4. Entrenamientos modernos
Módulo 6. Deep Reinforcement Learning
1. Q-Learning
2. Deep Reinforcement Learning
3. Resúmenes de textos
4. Relación con ChatGPT