Rudimentos de Machine Learning: overfitting & underfitting
.png)
Semana
1
Clasificación binaria

Esta semana del curso será enfocada al entrenamiento supervisado de modelos de clasificación binaria los cuales corresponden al caso más sencillo de soluciones mediante técnicas de Machine Learning para la predicción. Estudiaremos modelos lineales los cuales también serán los más sencillos desde el punto de vista matemático.
Sobre Python vamos a repasar los conceptos básicos revisados durante el curso propedéutico asíncrono de Introducción a Python el cual supondremos ya ha sido estudiado por los estudiantes sin formación previa en este lenguaje. Durante las primeras dos semanas trabajaremos exclusivamente en Google Colab lo cual será considerablemente más simple y nos permitirá en la segunda parte del curso trabajar en local sin tantas complicaciones.
Semana
2
Regresiones lineales y árboles

A diferencia de la semana anterior en esta vamos a estudiar problemas supervisados en los que la variable objetivo no necesariamente es discreta, esto significa un sustancial incremento en la dificultad pues ahora las predicciones deberían de ser mucho más precisas. En esta semana utilizaremos tanto modelos lineales como modelos no-lineales con el objetivo de ajustar mejor los datos durante el entrenamiento. Trataremos un problema clásico de valuación de propiedades.
Semana
3
Clasificaciones multi-clase

En esta tercera semana vamos a tratar problemas de clasificación que no necesariamente son binarios, esto puede significar muchas complicaciones tanto en el proceso de entrenamiento como en el de evaluación de los resultados. Utilizaremos modelos de regresión softmax y también algunos de Boosting la cual es una de las principales herramientas de Machine Learning.
Semana
4
Clusterización (y reducción de la dimensión)

Durante esta semana vamos a introducir el aprendizaje no-supervisado concentrándonos en dos tareas extremadamente importante para los científicos de datos, a saber la clusterización de registros y la reducción de la dimensión. La primera de estas tareas se puede entender como un proceso de clasificación multi-clase en el que no tenemos una base de datos supervisada, por el otro lado la reducción dela dimensión es un proceso que tratará de mitigar la maldición de la dimensión que afecta a tantos procesos en machine learning.
