Universidad Complutense de Madrid
E-Prints Complutense

Algoritmos de programación dinámica con R para resolver problemas de alineamiento de secuencias

Impacto

Downloads

Downloads per month over past year



Sánchez Becerro, Óscar (2014) Algoritmos de programación dinámica con R para resolver problemas de alineamiento de secuencias. [Trabajo Fin de Máster]

[img]
Preview
PDF
914kB


Abstract

Este trabajo analiza e implementa mejoras consecuentes sobre algoritmos de alineamiento de secuencias basados en técnicas de Programación Dinámica. Como base fundamental se han utilizado algoritmos clásicos de alineamiento global Needleman-Wunsch y local Smith-Waterman respectivamente que han sido reprogramados por el autor en el lenguaje R para su optimización. Los algoritmos se han mejorado mediante técnicas que se explican en la memoria. Principalmente penalización por gaps y la utilización opcional de matrices de puntuación de aminoácidos que permiten valorar alineamientos. Este trabajo muestra alternativas de programación de los algoritmos con librerías dinámicas desarrolladas en lenguaje C y una comparativa de tiempos de ejecución. Además se ha desarrollado la plataforma multi-agente “MASBioseq” que permite distribuir y balancear la carga de los alineamientos de secuencias con mejoras de rendimiento que proporciona al usuario una interfaz gráfica accesible. La razón fundamental de este desarrollo alternativo es comprobar la mejora del rendimiento que, como se demuestra en este trabajo, puede obtenerse con la compilación de determinadas partes del código en los distintos lenguajes. En esta memoria se desarrollan todas las temáticas necesarias para la comprensión del objetivo de los algoritmos y las técnicas utilizadas. Esto incluye un estado del arte sobre Bioinformática, Bioestadística, Programación Dinámica, alineamiento y análisis de secuencias biológicas, matrices de puntuación, técnicas y tipos de alineamiento, Agentes Inteligentes, entre otros.
[ABSTRACT]
This document analyzes and implements consistent improvements on sequences alignment algorithms based on Dynamic Programming techniques. As a fundamental basis classic global alignment algorithm Needleman-Wunsch and local alignment algorithm Smith-Waterman have been used and reprogrammed for optimization respectively by the author in the R language. The algorithms have been improved using techniques explained in the document. Mainly gaps penalty and the optional use of amino acid scoring matrices that allow assessing alignments. This work presents an alternative for programming algorithms with dynamic libraries developed in C language and a comparison of execution times. It has also developed multi-agent “MASBioseq” platform that allows distribution and load balance of sequence alignments with performance enhancements that gives an accessible graphical user interface. The reason of developing this alternative is to check the performance improvement, as demonstrated in this work, can be obtained with the compilation of certain parts of the code in different languages. In this document all necessary themes for understanding the objective of the algorithms and techniques used are developed. This includes a state of the art on Bioinformatics, Biostatistics, Dynamic Programming, alignment and analysis of biological sequences, scoring matrices, techniques and types of alignment, Intelligent Agents, among others.


Item Type:Trabajo Fin de Máster
Additional Information:

Trabajo de fin de máster en Ingeniería de Computadores de la Universidad Complutense de Madrid, Facultad de Informática, Departamento de Arquitectura de Computadores y Automática, Curso 2013-2014

Directors:
DirectorsDirector email
López López, María Victoria
González Pérez, Beatriz
Uncontrolled Keywords:Programación dinámica, Alineamiento de secuencias, Algoritmos de alineamiento, Librerías dinámicas, Programación en R, Agentes inteligentes, Bioinformática, Needleman-Wunsch, Smith-Waterman. Dynamic programming, Sequence alignment, Alignment algorithms, Dynamic libraries, R programming, Intelligents agents, Bioinformatics, Needleman-Wunsch, Smith-Waterman
Subjects:Sciences > Computer science
Sciences > Computer science > Object-oriented programming (Computer science)
ID Code:24491
Deposited On:10 Mar 2014 12:29
Last Modified:25 Apr 2014 10:54

Origin of downloads

Repository Staff Only: item control page