Publication:
Aceleración HW de algoritmos de disparidad binocular

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2012
Advisors (or tutors)
Martín Hernández, José Antonio
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
Dentro de la visión por computador, el campo de la visión estereoscópica es un campo muy amplio y muy estudiado en los últimos años. En este campo se estudia la aproximación de manera el una escena tridimensional a partir de dos o más imágenes bidimensionales. Tal y como ocurre en los seres vivos, los ojos están desplazados a una cierta distancia, las cámaras también se deben separar cierto espacio. La computadora debe analizar las imágenes y determinar qué pixel de una corresponde a qué pixel de otra. La distancia entre ellos se conoce como disparidad, y es medida en píxeles. A partir de la disparidad se puede obtener la profundidad de ese punto en la escena tridimensional. Actualmente existen multitud de algoritmos, unos aproximan la escena mejor que otros, pero la mayoría tiene un problema crucial: no llegan a computar la imagen tridimensional en tiempo real y si llegan suele ser a costa de una pérdida en la calidad de la imagen nal o utilizando procesadores del segmento más alto. Nuestro proyecto esta orientado a buscar una solución a este problema paralelizando por hardware el cómputo de las funciones más pesadas (en términos de tiempo) de un algoritmo estereoscópico que proporcione imágenes tridimensionales de calidad. Para ello, utilizaremos la potencia de proceso de las GPUs (unidades de procesamiento gráco) a través de la interfaz de programación que proporciona OpenCL (Open Computing Language). [ABSTRACT] Inside computer vision, stereoscopic vision is a very wide eld and it has been deeply studied in the last years. The main objetive in this eld is to approach, in a faithful way, a 3D scene from two or more 2D images. As it happens with living beings, in which the eyes are placed at a certain distance, cameras must be also placed keeping some space. The computer has to analyze both images and determine which pixel from the rst, matches a pixel in the second image. The distance between those pixels is called disparity, and it's measured in pixels. Based on the disparity of a pixel and knowing the geometry of the cameras, the depth of that pixel, in the 3D scene, can be computed. Nowadays, there are lots of stereo algorithms, some approaches are better than others, but most have the same problem: they can't compute the 3D scene in real time and, if they do, they do it at the price of lower quality or, by computing with top processors. Our project tries to nd a solution to this problem parallelizing by hardware the computation of the heavier functions (speaking in time) of an stereo algorithm which estimates a 3D scene with good quality. To this end, we will use the computational power of the GPUs (Graphics Processing Units) through the API provided by OpenCL (Open Computing Language).
Description
Proyecto de Sistemas Informáticos (Facultad de Informática, Curso 2011-2012)
Unesco subjects
Keywords
Citation