Reconocimiento de objetos utilizando técnicas de aprendizaje profundo
Object recognition using deep learning techniques
Citación
Fecha
2021-02-25Autor
Gómez Alvarado, Diego Felipe
Título obtenido
Ingeniero Multimedia
Palabras claves
; redes neurales (computadores); programacion orientada a objetos (computacion)
Metadatos
Mostrar el registro completo del ítem
Documentos PDF
Resumen
El presente documento expone el fundamento, desarrollo y resultados obtenidos durante el proceso de entrenamiento y evaluación, de los diferentes modelos computacionales para el reconocimiento de objetos, que utilizan como pilar fundamental las redes neuronales convolucionales. El trabajo tuvo como objetivos principales, la recolección del conjunto de entrenamiento, implementación y pruebas de rendimiento. Se realizó un proceso evaluativo para diez arquitecturas y/o métodos para el reconocimiento de objetos, seis con el TensorFlow Object Detection API y cuatro usando el framework Darknet. Eso con el fin de seleccionar el modelo con mejor proceso operativo, dado parámetros concernientes a la precisión, velocidad y demanda de recursos. La recolección de las imágenes para el conjunto de datos, tomó lugar en las instalaciones de la Universidad Militar Nueva Granada, a través de la toma de vídeos y fotografías, las cuales fueron manualmente etiquetadas y posteriormente utilizadas para el proceso de entrenamiento para cada uno de los diez modelos/métodos utilizados, bajo dos marcos de trabajo diferentes. El documento se encuentra dividido en seis capítulos principales, que brindan la introducción y naturaleza del proyecto, estado del arte, fundamento teórico, desarrollo, resultados y consideraciones finales.
This document presents the theory, development and results obtained during the training and evaluation process of the different computational models for object recognition, which use convolutional neural networks as the main principle. The project had several main objectives, incluiding the collection of the training set, implementation and performance tests. An evaluation process was carried out for ten architectures and/or methods for object recognition, six with the TensorFlow Object Detection API and four with the Darknet framework. This in order to select the best model in terms of operating process, given certain parameters concerning precision, speed and resource demand. The collection of the images for the training dataset, took place in the facilities of the Nueva Granada Military University, through the taking of videos and photographs, which were manually labeled and later used in the training process for each of the ten models/methods under two different working environments. The document is divided into six main chapters concerning the introduction and nature of the project, state of the art, theorical foundation, development, results and final considerations.
Colecciones
- Ingeniería en Multimedia [121]