Publication:
Estrategias de planificación en infraestructuras grid federadas

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2010-12-02
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Complutense de Madrid, Servicio de Publicaciones
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
La tecnología Grid está transformando la forma en la que se realiza la computación, la comunicación, la interconexión y la solución de problemas de gran escala científicos, ingenieriles y de negocios. En la actualidad, existen numerosos proyectos científicos y empresariales que hacen uso de la tecnología Grid con resultados exitosos. Tal es el caso del LCG, The Large Hadron Collider (LHC) Computing Grid, en el CERN, la organización europea para la investigación nuclear. Es precisamente la proliferación de sistemas Grids independientes la que ha sacado a la luz la necesidad de estructuras federales que permitan la integración y el control sostenible de los recursos. El ejemplo más representativo de dicha necesidad lo constituye la "European Grid Initiative" (EGI). Aunque un Grid Federado puede estar formado por varias infraestructuras Grid de distinto tipo, éste se sigue basando en el mismo principio que todo sistema Grid, a saber, en la coordinación de recursos que no están sujetos a un control centralizado. El problema de la planificación es uno de los más conocidos en Informática, sin embargo, aplicar alguno de los algoritmos de planificación ya existentes al entorno de los Grids Federados plantea varios problemas, principalmente de escalabilidad. Tanto es así, que con la aparición de este tipo de sistemas las tendencias en planificación han sufrido un cambio de dirección desde una planificación local hacia una planificación global. El principal motivo por el que no se puede sacar provecho de investigaciones anteriores es debido a que las suposiciones que son la base de sistemas centralizados no son aplicables en un entorno Grid. Por lo tanto, las estrategias de planificación para escenarios Grid derivadas de dichas ideas producen malos resultados en la práctica. Es por esto, que uno de los objetivos más importantes de esta tesis sea el de diseñar una arquitectura descentralizada de Grid Federado basada en meta-planificadores. A diferencia del gestor de carga local, el meta-planificador posee información general de todo el Grid Federado. Por lo tanto, las técnicas de planificación de grano-fino no son adecuadas para este nivel. Estas técnicas encajan mejor en un gestor de carga local, dado que estos controlan por completo los recursos al encontrarse en las capas más cercanas a los mismos. En cambio, el metaplanificador necesita de técnicas ligeras, desacopladas y de grano-grueso. En este sentido, el principal objetivo de la presente tesis es el estudio y análisis de varios algoritmos de planificación que siguen estos principios, basados en un modelo de rendimiento, que permiten la distribución de trabajos independientes en Grids Federados y que además consiguen reducir el tiempo de ejecución de las aplicaciones e incrementar la productividad de los recursos. La principal ventaja de utilizar un modelo de rendimiento en el que basar nuestras estrategias de planificación radica en la no dependencia de la información sobre el estado de los recursos. En este sentido, encontramos soluciones, también a nivel de meta-planificador, que apuestan precisamente por utilizar información sobre el estado de los recursos, cuando se ha demostrado que los servicios de información centralizados y jerarquizados presentan importantes limitaciones, como único punto de fallo, falta de escalabilidad y alto coste en las comunicaciones por red. [ABSTRACT] The Grid technology is transforming the form of carrying out computation, communication, interconnection and the solution of large scale scientists problems, engineering and business. Currently, there are numerous scientific and business projects that make use of Grid technology with successful results. Such is the case of the LCG, The Large Hadron Collider (LHC) Computing Grid, at CERN, the European organization for nuclear research. It is the proliferation of independent Grids systems which has brought to light the need for federal structures allowing integration and sustainable resource control. The most representative example of this need it is the “European Grid Initiative” (EGI). Although a Federated Grid can consist of several different types of Grid infrastructures, is still based on the same principle that any Grid system, namely in coordinating resources that are not subject to centralized control. Scheduling problem is one of the best known in Computer Science, however, applying existing scheduling algorithms to a Federated Grid environment presents several problems, mainly for scalability. So much so that with the emergence of such systems the trends in scheduling have undergone a change of address from local to global scheduling. The main reason why you can not take advantage of previous research is because the assumptions that are the basis of centralized systems are not applicable in a Grid environment. Therefore, scheduling strategies based on these ideas produce bad results in practice. As a result, one of the most important objectives of this PhD is to design a Federated Grid decentralized architecture based on meta-schedulers. Unlike the local manager, the meta-scheduler has an overview of the entire Federated Grid. Therefore, fine-grain scheduling policies are not appropriate for this level. These techniques are better suited for local managers, since these completely control the resources found in the layers closest to them. In contrast, the metascheduler needs light, decoupled, and coarse-grain techniques. In this sense, the main objective of this PhD is the study and analysis of various scheduling algorithms that follow these principles, based on a performance model, enabling the scheduling of independent jobs in Federated Grids and also able to reduce the makespan of applications and increase performance of resources. The main advantage of using a performance model on which to base our mapping strategies lies in the lack of dependence on resources state. In this respect, we find solutions, also at the meta-scheduler level, who use information on the state of resources. However, it is well known that centralized and hierarchical information services present significant limitations, such as single point of failure, lack of scalability and high cost in bandwidth.
Description
Tesis de la Universidad Complutense de Madrid, Facultad de Informática, Departamento de Arquitectura de Computadores y Automática, leída el 20-05-2010
UCM subjects
Unesco subjects
Keywords
Citation
Collections