
Track para la ciencia de datos
Uno de los objetivos fundamentales de la Escuela Bourbaki es transmitir a los estudiantes, público en general y a la industria, las ventajas prácticas y el placer que implican conocer los detalles de la actividad matemática.

Objetivos del curso
01
Enseñar un manejo de Python que permita resolver problemas utilizando imágenes,
texto, bases estructuradas, series de tiempo e incluso cuando no existen suficientes datos.
02
Familiarizar al estudiante con el lenguaje matemático así como su utilidadpara resolver problemas concretos e identificar dificultades. Se hará énfasis enfortalecer la intuición de los estudiantes.
03
Estudiar las ideas matemáticas utilizadas en Ciencia de Datos enfocándonos en las siguientes áreas: Probabilidad, Estadística e Inferencia Bayesiana, Álgebra Lineal, Optimización y Cálculo Diferencial.
04
Estudiar algoritmos de Machine Learning y ponerlos en práctica utilizando fuentes de datos reales.
05
Practicar el manejo de datos estructurados y no-estructurados utilizandoPython para obtener análisis de analítica avanzada o prescriptiva.
Nuestros estudiantes trabajan en algunas de las más reconocidas empresas
Temario
Machine Learning & AI for the Working Analyst
- Invitación a redes neuronales: perceptrón
- Árboles de decisión y random forest
- Regresiones logísticas, Ridge y Lasso
- Latent Dirichlet Allocation
- Regresión Robusta y outliers
- ARMA, ARIMA y ARCH
- Simulación Monte-Carlo para cadenas de Markov
- Aprendizaje por refuerzo y Q-Learning
- Deep Learning para NLP (LSTM y Atención)
Matemáticas para la Ciencia de Datos
Módulo 1. Fundamentos de probabilidad
- La aleatoriedad y la independencia
- Variables aleatorias y sus invariantes
- El Método de Monte Carlo
- Máxima verosimilitud y regresiones Bernoulli
- Las cadenas de Markov Page Rank
- Metropolis Hastling
Matemáticas para la Ciencia de Datos
Módulo 2. Estadística e Inferencia Bayesiana
- Tests estadísticos
- Inferencia Causal y priors conjugados
- A/B testing & Thompson samplings
- Regresiones bayesianas geolocalizadas
- Redes bayesianas
- Kriging y procesos gaussianos
Matemáticas para la Ciencia de Datos
Módulo 3. Álgebra Lineal
- Matrices y sistemas de ecuaciones
- Medidas de similitud de audios
- Análisis de Componentes Principales PCA
- Latent Semantic Analysis y SVD
- Eigen-descomposición y text-rank
- Álgebra lineal numérica I
Matemáticas para la Ciencia de Datos
Módulo 4. Optimización y Cálculo Diferencial
- Programación lineal y optimización
- Programación dinámica y Bellman
- Gradiente descendente de Cauchy
- Stochastic Gradient Descend y Adaptative SGD
- El algoritmo de Backpropagation
- Optimización bayesiana
Especialización en Deep Learning
Módulo 1. Redes convolucionales
- Capas densas y convolucionales
- Detección de objetos
- Arquitecturas modernas: auto-encoders
- Algoritmos de entrenamiento
Matemáticas para la Ciencia de Datos
Módulo 2. Redes recurrentes y transformer
- Capas recurrentes
- Series de tiempo multi-variadas y multi-horizonte
- El mecanismo de atención de Bahdanau
- Regularización
Matemáticas para la Ciencia de Datos
Módulo 3. Redes multi-modales
- El producto de Hadamard y la fusión de datos
- Álgebra tensorial
- Regularización II
- Backpropagation
Especialización en Deep Learning
Módulo 4. Modelos del lenguaje
- Word2vec & Doc2vec
- BERT & GPT
- Fine-tuning
- Mecanismo de atención
Matemáticas para la Ciencia de Datos
Módulo 5. Difusión estable y GAN’s
- Generative Adversarial Networks
- Modelos CLIP
- Difusión estable
- Entrenamientos modernos
Matemáticas para la Ciencia de Datos
Deep Reinforcement Learning
- Q-Learning
- Deep Reinforcement Learning
- Resúmenes de textos
- Relación con ChatGPT
Especialización en Deep Learning
Módulo 4. Modelos del lenguaje
- Word2vec & Doc2vec
- BERT & GPT
- Fine-tuning
- Mecanismo de atención



