Publication:
Detección de frutas en árboles

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2020
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
La tarea que ocupa este proyecto es la conocida como detección de objetos en imágenes, que se encuentra hoy en pleno apogeo gracias a la aparición de arquitecturas de redes neuronales que hacen uso de la disciplina conocida como Deep Learning. La detección de objetos es una de las técnicas de Computer Vision que, a su vez, es un área de la subdisciplina de la Informática conocida como Inteligencia Artificial, la cual está cada día presente en la tecnología, gracias al impulso de las grandes multinacionales tecnológicas, que han visto en esta un gran nicho de mercado que puede suponer una auténtica revolución en tan distintos áreas como la agricultura, la estadística, la conducción automática, la videovigilancia o el reconocimiento facial. Los objetos que se buscan reconocer en este proyecto son frutos en árboles que se encuentran en distintas fases de maduración. En concreto, se ha dispuesto de un conjunto de imágenes de mandarinos con sus frutos en distintos colores (verde y naranja) en función de la mentada maduración. Para esta labor se ha hecho empleo de distintas arquitecturas de Deep Learning, y de una api de Tensorflow en busca de llevar a cabo la técnica conocida como transferencia de aprendizaje, que consiste en reentrenar modelos ya preentrenados con el fin de reducir costes de tiempo y mejorar los resultados. Con esto se busca poder detectar y señalar mediante cuadros delimitadores, con la máxima precisión posible, todas las mandarinas posibles situadas en estos árboles. Para esta labor se creará un dataset propio, haciendo uso de técnicas de anotación y, posteriormente, aumento de datos, para poder así realizar los distintos reentrenamientos cuyos resultados se analizarán apoyándose en las métricas del desafío de evaluación conocido como COCO. Además, se evaluará la velocidad de inferencia de los modelos de detección empleados probandodistintas unidades de procesamiento, como son las CPUs, las GPUs y el acelerador USB de Intel conocido como VPU Intel® MovidiusTM MyriadTM X, haciendo empleo de la herramienta OpenVINO de Intel.
The task of this project is known as object detection in images, which is now in full swing thanks to the emergence of neural network architectures that make use of the discipline known as Deep Learning. Object detection is one of the Computer Vision techniques which, also, is an area of the Computer Science subdiscipline known as Artificial Intelligence, which is present every day in technology, thanks to the support of large technology multinationals , who have seen in this area a great niche market that can be a real revolution in such different sectors as agriculture, stadistics, self-driving car, video surveillance or facial recognition. The objects that are required to be recognized in this project are fruits in trees in different stages of maturation. Specifically, a set of images of tangerine trees with their fruits in different colors (green and orange) depending on maduration. For this work, it has been used different Deep Learning architectures, and a Tensorflow api looking for using the technique known as transfer learning, which consists of retraining pre-trained models in order to reduce time and improve the results. With this it is seek to be able to detect and indicate by bounding boxes, with the maximum precision, all the possible clementines located in these trees. In this task, a custom dataset will be created using annotation techniques and, later, data augmentation, to be able to perform the different retraining and their results will be analyzed based on the metrics of the evaluation challenge known as COCO. In addition, the inference speed of the detection models used will be evaluated by testing different processing units, such as CPUs, GPUs and the Intel USB accelerator known as Intel® Movidius TM Myriad TM X VPU, using the OpenVINO toolkit from Intel.
Description
Trabajo de Fin de Grado en Ingeniería Informática,Facultad de Informática UCM, Departamento de Arquitectura de Computadores y Automática, Curso 2019/2020.
Unesco subjects
Keywords
Citation