Arquitecturas

Resumen de algunas de las arquitecturas de redes neuronales convolucionales más utilizadas:

  1. LeNet-5:

    • Desarrollada por Yann LeCun en la década de 1990.

    • Utilizada principalmente para reconocimiento de dígitos escritos a mano.

    • Consiste en capas convolucionales, capas de submuestreo y capas totalmente conectadas.

  2. AlexNet:

    • Desarrollada por Alex Krizhevsky, Ilya Sutskever y Geoffrey Hinton.

    • Ganadora del concurso ImageNet Large Scale Visual Recognition Challenge (ILSVRC) en 2012.

    • Introdujo capas convolucionales profundas, uso de ReLU como función de activación y técnicas como dropout.

  3. VGGNet:

    • Desarrollada por el Grupo de Visión de la Universidad de Oxford.

    • Caracterizada por su profundidad y estructura uniforme (capas convolucionales de 3x3 y capas de agrupamiento de 2x2).

    • VGG16 y VGG19 son variantes comunes utilizadas en aplicaciones de visión por computadora.

  4. GoogLeNet (Inception):

    • Desarrollada por Google Research.

    • Introdujo el concepto de módulos Inception, que combinan diferentes tamaños de filtros en paralelo para capturar características a múltiples escalas.

    • Ganadora del ILSVRC en 2014.

  5. ResNet (Residual Network):

    • Desarrollada por Kaiming He et al. en Microsoft Research.

    • Introdujo bloques residuales que permiten entrenar redes profundas sin sufrir degradación del rendimiento.

    • Las variantes incluyen ResNet50, ResNet101, etc.

ImageNet, es una de las bases de datos más grandes y populares para entrenar y evaluar modelos de visión por computadora. Contiene millones de imágenes etiquetadas en miles de categorías diferentes.

La competencia ImageNet Large Scale Visual Recognition Challenge (ILSVRC) utilizó conjuntos de datos de ImageNet para evaluar el rendimiento de las arquitecturas de CNN en tareas de clasificación de imágenes a gran escala.

Last updated