Clúster de conmutación

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 4 de agosto de 2016; las comprobaciones requieren 9 ediciones .

Clúster de conmutación por error ( clúster de alta disponibilidad en inglés , clúster HA - clúster de alta disponibilidad ) - un clúster (grupo de servidores ), diseñado de acuerdo con técnicas de alta disponibilidad y que garantiza un tiempo de inactividad mínimo debido a la redundancia del hardware. Sin agrupamiento, una falla del servidor hace que las aplicaciones o los servicios de red que admite fallen.no están disponibles hasta que se restaura. La agrupación en clústeres de conmutación por error corrige esta situación reiniciando aplicaciones en otros nodos del clúster sin la intervención del administrador si se detectan fallas de hardware o software. El proceso de reinicio se conoce como conmutación por error . Como parte de este proceso, el software de agrupación en clúster puede configurar aún más el nodo antes de ejecutar la aplicación en él (por ejemplo, importar y montar los sistemas de archivos apropiados, reconfigurar el hardware de la red o ejecutar cualquier aplicación de utilidad).

Los clústeres de conmutación por error se usan ampliamente para admitir bases de datos críticas , almacenamiento de archivos en red, aplicaciones comerciales y sistemas de servicio al cliente, como sitios de comercio electrónico .

Las implementaciones de clústeres HA son intentos de lograr la tolerancia a fallas del clúster en su conjunto al eliminar los puntos críticos de falla, incluso a través de la redundancia de potencia informática, conexiones de red y almacenamiento de datos, combinados en una red SAN redundante .

Requisitos de la arquitectura de la aplicación

No todas las aplicaciones pueden ejecutarse en un entorno agrupado de alta disponibilidad. Las decisiones apropiadas deben establecerse en una etapa temprana del desarrollo del software. Para ejecutarse en un clúster HA, una aplicación debe cumplir al menos los siguientes requisitos técnicos, los dos últimos de los cuales son fundamentales para su funcionamiento confiable en un clúster y son los más difíciles de satisfacer por completo:

Debería haber una forma relativamente sencilla de iniciar, detener, forzar la detención y verificar el estado de una aplicación. En la práctica, esto significa que la aplicación debe tener una interfaz de línea de comandos o scripts para administrarla, incluso para trabajar con varias instancias en ejecución de la aplicación.
La aplicación debe poder utilizar el almacenamiento de datos compartido ( NAS / SAN ).
Es muy importante que la aplicación almacene la mayor cantidad de datos posible sobre su estado actual en un almacenamiento compartido no destructible. En consecuencia, la capacidad de una aplicación para reiniciarse en un nodo diferente en un estado previo a la falla utilizando datos de estado del almacén compartido es igualmente importante.
La aplicación no debe corromper los datos cuando falla o se restaura desde un estado guardado.

Esquemas de construcción

Los clústeres HA de dos nodos más comunes son la configuración mínima requerida para proporcionar tolerancia a fallas. Pero a menudo los clústeres contienen mucho más, a veces decenas de nodos. Todas estas configuraciones generalmente se pueden describir mediante uno de los siguientes modelos:

Activo / activo: parte del tráfico procesado por el nodo fallido se redirige a algún nodo en funcionamiento o se distribuye entre varios nodos en funcionamiento. Este esquema se utiliza cuando los nodos tienen una configuración de software homogénea y realizan la misma tarea.
Activo/pasivo: tiene una redundancia completa (copia en buen estado) de cada nodo. La reserva entra en funcionamiento solo cuando falla el nodo principal correspondiente. Esta configuración requiere hardware redundante significativo.
N + 1: tiene un nodo de respaldo completo, al que pasa el rol del nodo fallido en el momento de la falla. En el caso de una configuración de software heterogénea de los nodos primarios, el nodo secundario debe poder asumir el rol de cualquiera de los nodos primarios de los que es responsable de forma redundante. Este esquema se utiliza en clústeres que prestan servicios a varios servicios heterogéneos que se ejecutan simultáneamente; en el caso de un solo servicio, dicha configuración degenera en Activo/pasivo.
N + M: si un único clúster presta servicios a múltiples servicios, es posible que incluir un solo nodo redundante no sea suficiente para lograr un nivel adecuado de redundancia. En tales casos, el clúster incluye varios servidores redundantes, cuyo número es un compromiso entre el precio de la solución y la confiabilidad requerida.
N-to-1: permite que el nodo en espera se conecte temporalmente hasta que se restablezca el nodo fallido, después de lo cual la carga original se devuelve al nodo principal para mantener el nivel original de disponibilidad del sistema.
N-to-N es una combinación de clústeres activo/activo y N+M. En un clúster N-to-N, los servicios, las instancias del sistema o las conexiones de un nodo fallido se redistribuyen a los nodos activos restantes. Esto elimina (como en el esquema activo/activo) la necesidad de un nodo en espera separado, pero al mismo tiempo todos los nodos del clúster deben tener un exceso de capacidad por encima del mínimo requerido.

Los términos host lógico o host lógico en clúster se utilizan para hacer referencia a la dirección de red que se utiliza para acceder a los servicios proporcionados por el clúster. El ID de host lógico no está vinculado a un solo nodo de clúster. En realidad, es una dirección/nombre de red que está asociado con los servicios proporcionados por el clúster. Si un nodo de clúster con, por ejemplo, una base de datos en ejecución deja de funcionar, la base de datos se reiniciará en otro nodo de clúster y la dirección de red donde los usuarios acceden a la base de datos se conservará para cualquier nodo nuevo, por lo que los usuarios seguirán teniendo acceso a la base de datos.

Confiabilidad de un solo nodo

Los clústeres de alta disponibilidad, además de los esquemas de redundancia entre nodos descritos, utilizan todos los métodos que generalmente se usan en sistemas e infraestructura de red separados (sin clúster) para maximizar la confiabilidad. Éstos incluyen:

Redundancia y replicación de discos: la falla de algunos de los discos internos no provoca fallas en el sistema. DRBD es un ejemplo.
Redundancia de conexiones de red externas : fallas en los cables, interruptores o fallas en la interfaz de red no conducen a una desconexión completa de la red.
Conexiones internas de la red de área de almacenamiento redundante (SAN) : las fallas en los cables, el interruptor o la interfaz de red no harán que los servidores pierdan la conexión con el almacenamiento (esto rompería la arquitectura no compartida).
Esquemas de fuente de alimentación redundante para varios equipos, generalmente protegidos por fuentes de alimentación ininterrumpidas y fuentes de alimentación redundantes : la falla de una sola entrada , cable, UPS o PSU no conduce a una falla crítica de energía del sistema.

Las medidas de tiempo de actividad de los nodos individuales ayudan a minimizar las posibilidades de recurrir a mecanismos nativos de agrupación en clústeres de conmutación por error. Si estos últimos están activados, el acceso al servicio puede verse interrumpido, aunque sea por poco tiempo, y es más conveniente para prevenir fallas en los equipos críticos.

Algoritmos de recuperación de fallos

Los sistemas que manejan errores en sistemas informáticos distribuidos utilizan diferentes estrategias para lidiar con las consecuencias de una falla. Por ejemplo, Apache Cassandra API Hector (API) proporciona tres opciones para el manejo de errores:

Fail Fast , en el script - "FAIL_FAST", simplemente devuelve un error al cliente cuando el nodo no está disponible.
On Fail, Try One - Next Available , en el script - "ON_FAIL_TRY_ONE_NEXT_AVAILABLE", significa que cuando un nodo falla, el sistema intenta transferir la solicitud a otro nodo, el más libre, y devuelve un error después del primer intento fallido.
On Fail, Try All , en el script - "ON_FAIL_TRY_ALL_AVAILABLE", significa que el sistema, después del primer intento fallido, prueba secuencialmente todos los nodos disponibles y solo entonces devuelve un error.

Para controlar la salud de los nodos en un clúster, se suele transmitir una señal periódica continua (“pulso”, latido del corazón en inglés ) en la red interna del clúster desde cada uno de los nodos, por cuya presencia el software de control juzga el funcionamiento normal. de nodos vecinos. Un problema no obvio, pero serio, del "cerebro dividido_ (computación)" está relacionado con esto : en el caso de una interrupción simultánea en muchas conexiones en la red interna del clúster debido a una falla de energía, falla del equipo de red, etc. , el nodo no será capaz de manejar correctamente esta situación, comienza a comportarse como si todos los demás nodos del clúster hubieran fallado, iniciando servicios duplicados que ya se están ejecutando en el clúster, lo que puede provocar daños en los datos en el almacenamiento compartido.

Clúster de conmutación

Requisitos de la arquitectura de la aplicación

Esquemas de construcción

Confiabilidad de un solo nodo

Algoritmos de recuperación de fallos

Véase también

Notas

Enlaces