Sobreajuste
El sobreajuste ocurre cuando un modelo de IA se ajusta demasiado a los datos de entrenamiento.
En lugar de capturar patrones generales, el modelo memoriza el ruido y las características específicas de los datos de entrenamiento, lo que lleva a un rendimiento deficiente en datos nuevos y no vistos durante el entrenamiento.
Características del sobreajuste:
Bajo error en datos de entrenamiento: El modelo puede tener un error muy bajo en los datos utilizados para entrenarlo, lo que indica un ajuste muy preciso a esos datos.
Alto error en datos de prueba: Sin embargo, el modelo tiene un rendimiento pobre en datos de prueba, ya que no puede generalizar bien debido a su ajuste excesivo a los datos de entrenamiento.
Memorización en lugar de generalización: El modelo memoriza los detalles y el ruido en los datos de entrenamiento en lugar de aprender patrones generales, lo que limita su capacidad para hacer predicciones precisas en nuevos datos.
El sobreajuste indica que el modelo se ajusta demasiado a los datos de entrenamiento y no puede generalizar a nuevos datos
Ejemplo
Mostramos un ejemplo de un modelo, para mostrar cómo un modelo demasiado complejo puede llevar al sobreajuste y afectar la generalización a nuevos datos.
Utlizaremos un conjutno de datos sintetícos que podemos interpretar en el contexto de la inflación y el poder adquisitivo de una moneda.
Supongamos que X representa el tiempo en meses y y representa el precio de un producto básico, como el pan, en una economía afectada por la inflación. La relación cuadrática entre el tiempo y el precio del pan podría reflejar el impacto de la inflación en el aumento constante de los precios a lo largo del tiempo.
Importamos los módulos necesarios
Generar datos sintéticos para el ejemplo
Dividir los datos en conjunto de entrenamiento y prueba
Entrenar un modelo de regresión regresión polinómica
Calcular predicciones en datos de entrenamiento y prueba
Calcular el error cuadrático medio en datos de entrenamiento y prueba
Imprimir el error cuadrático medio para el bajo ajuste
Visualizamos la predicción de los datos de entrenamiento
Visualizamos la predicción de los datos de test
Last updated