Computación en cuadrícula

La computación en cuadrícula es una forma de computación distribuida en la que se crea una supercomputadora virtual a partir de un grupo de computadoras poco acopladas . Está diseñado para resolver problemas computacionalmente intensivos. Hoy en día, la computación en red se utiliza en muchas áreas, en algunos casos también comercialmente, por ejemplo, en la investigación y la economía farmacéuticas , en el comercio electrónico y en los servicios web . También se utiliza para la gestión de riesgos en la dinámica de edificios y la gestión financiera .

La computación en cuadrícula se diferencia de los clústeres de computadoras típicos en el acoplamiento significativamente más flexible, la heterogeneidad y la dispersión geográfica de las computadoras. Además, una cuadrícula está destinada principalmente a una aplicación especial y, a menudo, utiliza bibliotecas de programas y middleware estandarizados . En el área de bases de datos en particular, la computación en cuadrícula se puede combinar con tecnologías en memoria .

Los conceptos básicos de la computación en grillas provienen de Ian Foster , Carl Kesselman y Steven Tuecke (2001).

Lo esencial

definición

El primer intento de definición proviene de Ian Foster y Carl Kesselman en el libro "The Grid: Blueprint for a New Computing Infrastructure":

"Una cuadrícula computacional es una infraestructura de hardware y software que proporciona acceso confiable, consistente, generalizado y económico a capacidades computacionales de alto nivel".

"Una red computacional es una infraestructura de hardware y software que permite un acceso confiable, consistente y económico a las capacidades de las computadoras de alto rendimiento, accesibles desde cualquier lugar".

Dado que esta definición se escribió antes de la creación real de las cuadrículas, Ian Foster la refinó claramente en la segunda edición del libro:

“El intercambio que nos preocupa no es principalmente el intercambio de archivos, sino más bien el acceso directo a computadoras, software, datos y otros recursos, como lo requieren una variedad de estrategias colaborativas de resolución de problemas y de intermediación de recursos que surgen en la industria, la ciencia, e ingeniería. Este intercambio está, necesariamente, muy controlado, y los proveedores de recursos y los consumidores definen clara y cuidadosamente qué se comparte, quién puede compartir y las condiciones en las que se comparte. Un conjunto de personas y / o instituciones definidas por tales reglas de intercambio forman lo que llamamos una organización virtual ".

“El intercambio de recursos con el que estamos tratando aquí no se trata principalmente de compartir archivos, sino de brindar acceso directo a computadoras, software, datos y otros recursos, como se usa en una serie de estrategias de colaboración, resolución de problemas e intermediación de recursos. que están surgiendo actualmente en la industria, la ciencia y la ingeniería. Este intercambio de recursos se controla, necesariamente, en la mayor medida posible, y los proveedores y consumidores de los recursos estipulan claramente qué recursos se comparten, quién puede compartirlos y en qué condiciones tiene lugar el intercambio. Una gran cantidad de personas y / o instituciones que resultan de tales pautas para compartir recursos forman lo que llamamos una Organización Virtual ".

La principal diferencia con la definición original es que la distribución de recursos está determinada por organizaciones virtuales. Estos también juegan un papel central en las implementaciones actuales de la red. Además, ahora no solo se hace referencia a las computadoras de alto rendimiento como recursos, sino también a los recursos generales, como los experimentos físicos.

Hay otros intentos de una definición uniforme en la literatura (cf.).

Los sistemas como la computación en clúster , la computación entre pares o la metacomputación se denominan incorrectamente sistemas de cuadrícula. Aunque tienen aspectos de la computación en cuadrícula, faltan puntos esenciales para describirlos como una cuadrícula. Ian Foster ha abordado este problema en una lista de verificación de 3 puntos. Las propiedades de un sistema de cuadrícula se definen brevemente de la siguiente manera:

Una cuadrícula ...
... coordina recursos que no están subordinados a una autoridad central ...
Una cuadrícula coordina e integra recursos y usuarios de diferentes dominios administrativos dentro de la misma empresa o dentro de diferentes países. En este contexto, u. a. se tienen en cuenta la seguridad, la facturación y la membresía (cf.). Los recursos pueden incluir clústeres, dispositivos de almacenamiento masivo, bases de datos, aplicaciones o dispositivos de medición.
... y utiliza protocolos e interfaces abiertos y estandarizados , ...
Un grid utiliza interfaces y protocolos abiertos y generales que garantizan funciones básicas para autenticación, autorización, determinación de recursos y acceso a recursos.
... para proporcionar una calidad de servicio no trivial .
Una red utiliza los recursos existentes de manera coordinada para proporcionar una calidad de servicio diferente, dependiendo, por ejemplo, del tiempo de respuesta, el rendimiento, la disponibilidad o la seguridad. O, para satisfacer las complejas expectativas de los usuarios, se reasignan varios tipos de recursos de modo que el beneficio del sistema combinado sea significativamente mayor que la suma de sus partes.

Los proyectos de computación voluntarios (por ejemplo, SETI @ home ) generalmente no se cuentan entre los sistemas de computación en red, ya que la potencia de cálculo allí, a diferencia de la computación en red, no es proporcionada por organizaciones, sino por anónimos y posiblemente no. clientes de confianza.

origen

Los conceptos para la distribución de tareas computacionalmente intensivas ya existían en la década de 1960. La mayor parte de la investigación actual sobre sistemas de redes, sin embargo, tiene su origen en los primeros experimentos con redes de alta velocidad. En este contexto, cabe mencionar en particular los proyectos FAFNER e I-WAY.

El término Grid tiene su origen en la comparación de esta tecnología con la red eléctrica (Engl. Power Grid ). En consecuencia, la cuadrícula debería proporcionar fácilmente al usuario recursos tales como B. Proporcionar poder de cómputo o espacio de almacenamiento a través de Internet, cómo es posible extraer electricidad de un enchufe. El usuario envía su pedido a través de interfaces estandarizadas a la red, después de lo cual la asignación de recursos es automática.

I-WAY

El proyecto I-WAY (Information Wide Area Year) se llevó a cabo en 1995 dentro del entorno de prueba de gigabits de la Universidad de Illinois, en el que 17 instalaciones de EE. UU. Y Canadá estaban conectadas a una red de alta velocidad. Su tarea consistía en conectar diferentes supercomputadoras utilizando las redes existentes. I-WAY apoyó en gran medida el desarrollo del proyecto Globus.

El establecimiento de metas

El objetivo motivador que llevó al desarrollo de la tecnología grid fue el uso conjunto y coordinado de recursos y la solución conjunta de problemas dentro de organizaciones dinámicas, interinstitucionales, virtuales (cf.). Esto significa que una vez determinados los datos contables y los derechos, el acceso directo a, por ejemplo, servicios informáticos, aplicaciones, datos o instrumentos debería ser posible de forma conjunta. En este contexto, una organización virtual (VO) es una asociación dinámica de personas y / o instituciones que persiguen objetivos comunes al utilizar la red. Aunque gran parte del trabajo se centra en la informática distribuida, el objetivo principal, análogo al desarrollo de Internet, es el desarrollo de una red global uniforme.

clasificación

En términos generales, los cálculos de cuadrícula se pueden dividir en clases, como

  • Redes computacionales (Informática Grids) : acceso a los recursos de computación distribuida
  • Cuadrícula de datos (DataGrid) : acceso a bases de datos distribuidas
  • Cuadrículas de recursos
  • Rejillas de servicio
  • Cuadrículas de conocimiento

La clase de la red informática es comparable a la red eléctrica , es decir, la red eléctrica : para este propósito, el consumidor de potencia informática establece una conexión a la red informática, similar al consumidor de electricidad a la red de suministro eléctrico. Todo lo que sucede detrás del enchufe se oculta al consumidor allí; simplemente utiliza el servicio ofrecido.

En la clase de cuadrícula de datos , no solo los sistemas informáticos (de alto rendimiento) de los involucrados cooperan para proporcionar potencia informática, sino que las bases de datos también están vinculadas. Un portal de rejilla generalmente proporciona acceso a dichas rejillas .

Además, la provisión de recursos de red está "reticulada", i. H. una selección automática realizada a partir de un conjunto de recursos basada en ciertos parámetros de QoS . Idealmente, la elección de los recursos debería estar impulsada por la aplicación, es decir, dependiente de la aplicación en la cuadrícula informática o cuadrícula de datos.

Arquitectura e implementaciones

General

Existen varios conceptos para la arquitectura de una cuadrícula . Es peculiar de todo concepto conocido que, además de la autoridad solicitante y el requisito de desempeño real que se establece allí, debe haber una autoridad coordinadora para la aglomeración de la potencia de cómputo y para la fusión de los servicios parciales. Además, se requiere una jerarquía estricta que permita o excluya la aglomeración de la potencia informática según criterios objetivos. Cada computadora en la " cuadrícula " es inicialmente una unidad que es jerárquicamente igual a las otras computadoras (peer-2-peer).

Las tareas típicas en las que la computación en grid se ofrece como estrategia son aquellas que sobrepasan el rendimiento de las computadoras individuales. Esto incluye, por ejemplo, la integración , evaluación y presentación de grandes cantidades de datos de investigación científica y médica . En la rutina, las técnicas también se utilizan en meteorología y simulaciones computacionalmente intensivas en la industria. La física de partículas, en particular con experimentos a gran escala (por ejemplo, el Gran Colisionador de Hadrones ) como aplicación científica, es pionera en el desarrollo y establecimiento de tecnologías de red.

Los problemas típicos que trae consigo la computación en red son el esfuerzo creciente como parte de la potencia disponible para la coordinación. Debido al esfuerzo de coordinación, la potencia informática nunca aumenta linealmente con la cantidad de computadoras involucradas. Este aspecto pasa a un segundo plano en las tareas numéricas complejas.

OGSA

Una posible arquitectura de software para grids es Open Grid Services Architecture (OGSA) co-desarrollada por Ian Foster . Esto ya se describe en su predecesor, Open Grid Services Infrastructure (OGSI). Su idea básica es la representación de los componentes implicados (ordenadores, espacio de almacenamiento, microscopios, ...) como servicios de grid en una arquitectura de componentes abierta.

Con la convergencia de los servicios web del W3C y los estándares OGSA del Open Grid Forum (OGF), los servicios grid a nivel técnico, como los implementados en Globus Toolkit 4, por ejemplo, se han convertido en servicios web que las funcionalidades técnicas del Habilite el middleware de cuadrícula. En este contexto, OGSA sugiere el uso de WSRF ( Web Services Resource Framework ) como un componente básico para las redes de servicios. De esta forma, los servicios web, cuyo uso permite procedimientos uniformes de acceso a los servicios individuales de un grid, también obtienen un estado: se les proporciona recursos con estado (como archivos, objetos Java o POJO , registros de datos en una base de datos ). asociado. Esto es lo que permite realizar funciones que abarcan varias transacciones. La combinación de un servicio web con tal recurso de estado forma un recurso llamado WS .

Organizaciones virtuales

Un concepto central e independiente del hardware detrás de la filosofía de la red es el de organizaciones virtuales (VO, ver allí). Los recursos (o servicios ) se asignan dinámicamente a organizaciones virtuales.

Implementaciones / middleware grid

hardware

En términos prácticos, todo ese hardware que se necesita es una computadora con conexión de red. En estas computadoras de cuadrícula, el software asume la tarea de resolver una subtarea, que se generó, por ejemplo, con la ayuda de un software que puede dividir una gran tarea en varias subtareas para todos los nodos de la cuadrícula y resumir los resultados parciales nuevamente.

Proyectos científicos

EGEE / EGI

El proyecto EGEE ( Enabling Grids for E- science, anteriormente Enabling Grids for E-science en Europa), que finalizó en marzo de 2006, es el proyecto de red más grande de la Unión Europea y ahora se utiliza en todo el mundo. Se ha continuado con el nombre EGEE2 desde abril de 2006. El proyecto fue financiado por la UE con 32 millones de euros en la primera fase del proyecto y representa la infraestructura de red más grande del mundo.En 2010 EGEE fue reemplazado por European Grid Infrastructure (EGI).

Entre los participantes se encuentran el CERN (Suiza), el Instituto de Tecnología de Karlsruhe (KIT, Alemania), el Laboratorio Rutherford Appleton (RAL, Reino Unido), el Istituto Nazionale di Fisica Nucleare (INFN, Italia) y la Academia Sinica (ASCC, Taiwán).

Ugrid del norte

La cuadrícula abierta Nordugrid basada en el middleware de cuadrícula ARC surgió de una fusión de cinco institutos escandinavos.

XtreemOS

La construcción y promoción de un sistema operativo basado en Linux para apoyar a las organizaciones virtuales para las redes de próxima generación es un proyecto financiado por la Unión Europea en el 6º Programa Marco . Además de los 17 socios del proyecto europeo, dos de China también participan en XtreemOS . Comenzó en julio de 2006 y tendrá una duración de cuatro años.

Neugrid

Neugrid es un proyecto financiado por la Unión Europea en el 7º Programa Marco. Su infraestructura permite a la ciencia investigar las enfermedades neurodegenerativas.

Iniciativas nacionales de infraestructura de red

Al igual que en otros países (por ejemplo, EE. UU.: Cyberinfrastructure, Reino Unido: Reino Unido e-Science / OMII, NL: BIG-Grid), también hay iniciativas de red en Alemania y Austria para construir una infraestructura de red nacional.

Ver también

literatura

enlaces web

Evidencia individual

  1. ^ I. Foster, C. Kesselman: The Grid: Blueprint para una nueva infraestructura informática. Morgan Kaufmann, técnico. Rep., 1998.
  2. ^ I. Foster, C. Kesselman: The Grid: Blueprint para una nueva infraestructura informática. 2da edición, Morgan Kaufmann, Tech. Rep., 2003. ISBN 978-1-55860-933-4
  3. ^ A b I. Foster, C. Kesselman, S. Tuecke: La anatomía de la red: habilitación de organizaciones virtuales escalables. En: Revista internacional de aplicaciones informáticas de alto rendimiento. Vol. 15, No. 3, 2001, págs. 200-222.
  4. ^ I. Foster, C. Kesselman, JM Nick, S. Tuecke: La fisiología de la cuadrícula. IBM Corporation, Poughkeepie, NY 12601, Tech. Rep., Junio ​​de 2002.
  5. ^ I. Foster: ¿Qué es la cuadrícula? Una lista de verificación de tres puntos. Julio de 2002.
  6. ^ I. Foster, C. Kesselman, G. Tsudik, S. Tuecke: Una arquitectura de seguridad para cuadrículas computacionales. En: Conferencia ACM sobre Seguridad Informática y Comunicaciones. 1998, págs. 83-92.
  7. M. Humphrey, MR Thompson: Implicaciones de seguridad de escenarios de uso típicos de Grid Computing . En: Actas del décimo Simposio Internacional IEEE sobre Computación Distribuida de Alto Rendimiento . 2001, pág. 95-103 , doi : 10.1109 / HPDC.2001.945180 .
  8. David P. Anderson : Por qué la computación voluntaria no es computación en cuadrícula. ( DOC ; 84 kB) Boinc , consultado el 22 de diciembre de 2015 (inglés).
  9. T. DeFanti, I. Foster, M. Papka, R. Stevens y T. Kuhfuss: Descripción general de i-way: supercomputación visual de área amplia. En: Revista internacional de aplicaciones de supercomputadoras. vol. 10, 1996, págs. 123-130.
  10. ^ C. Catlett: En busca de aplicaciones gigabit. En: Revista de comunicaciones, IEEE. Vol. 30, No. 4, 1992, págs. 42-51.