Universidad Complutense de Madrid
E-Prints Complutense

Detección de vehículos en circulación mediante visión artificial y redes neuronales convolucionales
Detection of vehicles in circulation by artificial vision and convolutional neural networks

Downloads

Downloads per month over past year

62195

Impacto

Downloads

Downloads per month over past year



Pérez Gutiérrez, Fernando (2020) Detección de vehículos en circulación mediante visión artificial y redes neuronales convolucionales. [Trabajo Fin de Máster]

[thumbnail of TFM_Fernando_Perez.pdf]
Preview
PDF
Creative Commons Attribution Non-commercial.

8MB


Abstract

El presente trabajo está orientado a la detección de vehículos en movimiento utilizando secuencias de imágenes consecutivas (vídeos) sobre las que se aplican diferentes técnicas de visión artificial con el fin de obtener datos acerca del tránsito de vehículos en entornos urbanos bajo el contexto de las ciudades inteligentes.
En lo que se refiere a la detección del movimiento, se formula una propuesta computacional basada en una rama de la psicología, concretamente la percepción visual. Sobre esta propuesta teórica, se aplican algoritmos de detección de movimiento relativo entre un observador (la cámara) y la escena, esto es, flujo óptico.
Además, basado en la información obtenida de los algoritmos de flujo óptico, se obtienen las regiones de interés, estas son, regiones de la imágen donde se encuentran los objetos en movimiento. Partiendo de esta información, se hace uso de las redes neuronales convolucionales (CNN, Convolutional Neural Network) como herramienta específica dentro del aprendizaje profundo, para obtener información de los objetos detectados, véase, su categoría.
De esta forma, se diseñan un total de tres modelos de CNN, AlexNet, ResNet y YOLO, con hasta cinco variantes en el caso de ResNet. Así mismo, las arquitecturas mencionadas son entrenadas bajo un conjunto de datos adaptado al contexto de la detección y clasificación de vehículos.
Finalmente, se integran todas funcionalidades un sistema completo con la capacidad para discernir entre distintos tipos de vehículos según su categoría y pertenencia a las diferentes clases establecidas en las CNN.
Con todos los experimentos realizados, se hace a su vez, un análisis del diseño de las diferentes CNN y de los métodos de detección de movimiento en relación a su desempeño y sus casos de uso.

Resumen (otros idiomas)

The present work is oriented to the detection of moving vehicles using sequences of consecutive images (videos) applying different artificial vision techniques in order to obtain data about vehicle traffic in urban environments under the context of smart cities. As far as motion detection is concerned, a computational proposal is formulated based on visual perception, a psychology branch. On this theoretical proposal, relative motion detection algorithms are applied between an observer (the camera) and the scene, that is, optical flow. In addition, based on the information obtained from optical flow algorithms, the regions of interest are calculated. These are regions of the image where the objects in movement are located. With this information, the convolutional neural networks (CNN) are used as a specific tool within the deep learning. All of this with the objetive of obtaining information of the detected objects, for example, its category. A total of three models of CNN, AlexNet, ResNet and YOLO, with up to five variants in the case of ResNet, are designed. Also, the mentioned architectures are trained under a dataset adapted to the context of vehicle detection and classification. Finally, all functionalities are integrated into a complete system with the ability to distinguish between different types of vehicles according to their category and belonging to the different classes established in the CNN. With all the experiments carried out, an analysis of the design of the different CNNs and motion detection methods is made in relation to their performance and use cases.

Item Type:Trabajo Fin de Máster
Additional Information:

Trabajo de Fin de Máster en Máster en Ingeniería Informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2019/2020

Directors:
Directors
Pajares Martinsanz, Gonzalo
Uncontrolled Keywords:Visión por computador, aprendizaje profundo, Red neuronal convolucional, Flujo óptico y Ciudades inteligentes.
Palabras clave (otros idiomas):Computer vision, Deep learning, Convolutional neuronal network, Optical flow and Smart cities.
Subjects:Sciences > Computer science
Título del Máster:Máster en Ingeniería Informática
ID Code:62195
Deposited On:30 Sep 2020 16:00
Last Modified:30 Sep 2020 16:00

Origin of downloads

Repository Staff Only: item control page