Complutense University Library

Aceleración HW de algoritmos de disparidad binocular

Benítez, Nehuén Eloy and González Flores, Daniel and Ortiz Merino, Roberto (2012) Aceleración HW de algoritmos de disparidad binocular. [Coursework] (Unpublished)

[img] PDF
6MB
View download statistics for this eprint

==>>> Export to other formats

Abstract

Dentro de la visión por computador, el campo de la visión estereoscópica es un campo muy amplio y muy estudiado en los últimos años. En este campo se estudia la aproximación de manera el una escena tridimensional a partir de dos o más imágenes bidimensionales. Tal y como ocurre en los seres vivos, los ojos están desplazados a una cierta distancia, las cámaras también se deben separar cierto espacio. La computadora debe analizar las imágenes
y determinar qué pixel de una corresponde a qué pixel de otra. La distancia entre ellos se conoce como disparidad, y es medida en píxeles. A partir de la disparidad se puede obtener la profundidad de ese punto en la escena tridimensional. Actualmente existen multitud de
algoritmos, unos aproximan la escena mejor que otros, pero la mayoría tiene un problema crucial: no llegan a computar la imagen tridimensional en tiempo real y si llegan suele ser a costa de una pérdida en la calidad de la imagen nal o utilizando procesadores del segmento más alto. Nuestro proyecto esta orientado a buscar una solución a este problema paralelizando
por hardware el cómputo de las funciones más pesadas (en términos de tiempo) de
un algoritmo estereoscópico que proporcione imágenes tridimensionales de calidad. Para ello,
utilizaremos la potencia de proceso de las GPUs (unidades de procesamiento gráco) a través de la interfaz de programación que proporciona OpenCL (Open Computing Language).
[ABSTRACT]
Inside computer vision, stereoscopic vision is a very wide eld and it has been deeply studied in the last years. The main objetive in this eld is to approach, in a faithful way, a 3D scene from two or more 2D images. As it happens with living beings, in which the eyes are placed at a certain distance, cameras must be also placed keeping some space. The computer has to analyze both images and determine which pixel from the rst, matches a pixel in
the second image. The distance between those pixels is called disparity, and it's measured in pixels. Based on the disparity of a pixel and knowing the geometry of the cameras, the depth of that pixel, in the 3D scene, can be computed. Nowadays, there are lots of stereo algorithms, some approaches are better than others, but most have the same problem: they can't compute the 3D scene in real time and, if they do, they do it at the price of lower quality
or, by computing with top processors. Our project tries to nd a solution to this problem
parallelizing by hardware the computation of the heavier functions (speaking in time) of an stereo algorithm which estimates a 3D scene with good quality. To this end, we will use the computational power of the GPUs (Graphics Processing Units) through the API provided
by OpenCL (Open Computing Language).

Item Type:Coursework
Additional Information:Proyecto de Sistemas Informáticos (Facultad de Informática, Curso 2011-2012)
Uncontrolled Keywords:Visión estéreo, Estereopsis, Visión por computador, Escena 3D, Disparidad, GPU, OpenCL, Stereo vision, Stereopsis, Computer vision, 3D scene, Disparity
Subjects:Sciences > Computer science > Expert systems (Computer science)
ID Code:16072
Deposited On:27 Jul 2012 11:33
Last Modified:27 Jul 2012 11:33

Repository Staff Only: item control page