Publication:
Algoritmos de programación dinámica con R para resolver problemas de alineamiento de secuencias

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2014
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
Este trabajo analiza e implementa mejoras consecuentes sobre algoritmos de alineamiento de secuencias basados en técnicas de Programación Dinámica. Como base fundamental se han utilizado algoritmos clásicos de alineamiento global Needleman-Wunsch y local Smith-Waterman respectivamente que han sido reprogramados por el autor en el lenguaje R para su optimización. Los algoritmos se han mejorado mediante técnicas que se explican en la memoria. Principalmente penalización por gaps y la utilización opcional de matrices de puntuación de aminoácidos que permiten valorar alineamientos. Este trabajo muestra alternativas de programación de los algoritmos con librerías dinámicas desarrolladas en lenguaje C y una comparativa de tiempos de ejecución. Además se ha desarrollado la plataforma multi-agente “MASBioseq” que permite distribuir y balancear la carga de los alineamientos de secuencias con mejoras de rendimiento que proporciona al usuario una interfaz gráfica accesible. La razón fundamental de este desarrollo alternativo es comprobar la mejora del rendimiento que, como se demuestra en este trabajo, puede obtenerse con la compilación de determinadas partes del código en los distintos lenguajes. En esta memoria se desarrollan todas las temáticas necesarias para la comprensión del objetivo de los algoritmos y las técnicas utilizadas. Esto incluye un estado del arte sobre Bioinformática, Bioestadística, Programación Dinámica, alineamiento y análisis de secuencias biológicas, matrices de puntuación, técnicas y tipos de alineamiento, Agentes Inteligentes, entre otros. [ABSTRACT] This document analyzes and implements consistent improvements on sequences alignment algorithms based on Dynamic Programming techniques. As a fundamental basis classic global alignment algorithm Needleman-Wunsch and local alignment algorithm Smith-Waterman have been used and reprogrammed for optimization respectively by the author in the R language. The algorithms have been improved using techniques explained in the document. Mainly gaps penalty and the optional use of amino acid scoring matrices that allow assessing alignments. This work presents an alternative for programming algorithms with dynamic libraries developed in C language and a comparison of execution times. It has also developed multi-agent “MASBioseq” platform that allows distribution and load balance of sequence alignments with performance enhancements that gives an accessible graphical user interface. The reason of developing this alternative is to check the performance improvement, as demonstrated in this work, can be obtained with the compilation of certain parts of the code in different languages. In this document all necessary themes for understanding the objective of the algorithms and techniques used are developed. This includes a state of the art on Bioinformatics, Biostatistics, Dynamic Programming, alignment and analysis of biological sequences, scoring matrices, techniques and types of alignment, Intelligent Agents, among others.
Description
Trabajo de fin de máster en Ingeniería de Computadores de la Universidad Complutense de Madrid, Facultad de Informática, Departamento de Arquitectura de Computadores y Automática, Curso 2013-2014
Keywords
Citation