Publication:
Optimización de la transformada Wavelet discreta

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2005
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
El objetivo básico de este proyecto es optimizar la transformada directa wavelet (DWT), parte integrante del estándar JPEG2000, para las plataformas PowerPC y SSE, puesto que los algoritmos simples utilizados presentan problemas de localidad espacial y no aprovechan las operaciones que permiten la vectorización, operaciones que el amplio repertorio de ambas arquitecturas poseen. Inicialmente comentaremos los puntos básicos necesarios que nos ayudarán a definir el ámbito de este proyecto y posteriormente nos centraremos en el trabajo realizado y en los resultados obtenidos. Para ello primeramente presentaremos el estándar JPEG2000, dando una somera definición, explicando sus múltiples usos y las mejoras que presenta frente al estándar JPEG. A continuación nos centraremos en la DWT, parte integrante de este estándar y comienzo del desarrollo del proyecto, la definiremos y compararemos con otro tipo de técnicas de optimización con perdida y mediante algunos diagramas podremos comprender su mecanismo. En los siguientes apartados entraremos en profundidad a comentar las optimizaciones que permiten tanto las plataformas PowerPC como las plataformas SSE. Dentro de cada uno de los apartados estudiaremos la arquitectura así como el repertorio de instrucciones del que se dispone, y más detalladamente las instrucciones necesarias que se han utilizado en las optimizaciones realizadas en la DWT. En los siguientes apartados mostraremos parte del código generado, primeramente en una versión que minimiza en muy poco el sencillo algoritmo de la DWT pero sin usar ningún tipo de vectorización. Esta primera versión se caracteriza por almacenar la imagen no como una matriz sino como un vector en el que las columnas se almacenan continuas unas a otras en una gran fila, esto permite tener una mayor localidad espacial. Además se usan cinco punteros para acceder a la memoria y así minimizar los accesos a posiciones contiguas de memoria. En la siguiente sección que se presenta se muestran los resultados de haber aplicado las operaciones de vectorización con el repertorio de instrucciones altivez, para la máquina con arquitectura PowerPC. Se presentan dos versiones, ambas utilizan el mismo tipo de vectorización para las columnas, pero para las filas en el primero de los casos se aplica la vectorización del filtro, y en el segundo de los casos se aplica transposición de las mismas. A continuación se presenta la misma estructura que el punto anterior, pero esta vez utilizando el repertorio de instrucciones SSE para la arquitectura Pentium. Para finalizar mostraremos las gráficas con los resultados obtenidos y las mejoras frente al algoritmo sin optimizar.
Description
Trabajo de clase de la asignatura Sistemas Informáticos (Facultad de Informática, Curso 2004-2005)
Unesco subjects
Keywords
Citation