La conmutación por error o failover, es la capacidad de continuar funcionando aún si se produce una falla en el sistema. Es decir, un modo operativo de respaldo en el que un componente secundario asume las funciones cuando el componente principal deja de estar disponible en el sistema, ya sea por falla o por tiempo de inactividad programado. La conmutación por error es parte integral de los sistemas de misión crítica.

De esta manera, el propósito de la conmutación por error es hacer que un sistema sea más tolerante a errores. El failover puede aplicarse a cualquier aspecto de un sistema: dentro de una computadora personal, por ejemplo, la conmutación por error puede ser un mecanismo para proteger contra un procesador fallido; dentro de una red, la conmutación por error se puede aplicar a cualquier componente de red o sistema de componentes, como una ruta de conexión, un dispositivo de almacenamiento o un servidor web. Por ejemplo, un servidor de conmutación por error resulta cuando un servidor de respaldo está configurado y preparado para asumir el control cuando falla el servidor primario.

Este método, entre otras funciones, permite realizar mantenimientos y cambios de hardware, sin afectar los servicios específicos que se brindan al usuario final.

El nivel de tolerancia a fallos dependerá de las técnicas utilizadas; no obstante, nunca será absoluta ya que siempre existirá algún tipo de fallo masivo que produciría un error irrecuperable.

Cada sistema se debe diseñar de manera que el esfuerzo realizado para mitigar los fallos compense los perjuicios que provocarían no tolerar ese tipo de fallo.

Estrategias

Existen distintas estrategias para conseguir un sistema lo más tolerante a fallos posible. Dos estrategias que se destacan:

  • Redundancia: existencia de módulos pasivos que realizan exactamente lo mismo que otros activos, de forma tal que puedan sustituirlo y evitar que el sistema se detenga por el fallo de ese elemento.
  • Replicación: para evitar que un fallo produzca la pérdida de la información almacenada, se suele replicar esa información en más de un soporte físico, o en un equipo o dispositivo externo a modo de respaldo. De esta forma, si se produce alguna falla que pueda ocasionar pérdida de datos, el sistema debe ser capaz de restablecer toda la información, recuperando los datos necesarios a partir de algún medio de respaldo disponible.

Implementación

Existen dos tipos de conmutación por error: failover y switchover, en la práctica son esencialmente la misma operación, excepto que la primera es automática y generalmente funciona sin previo aviso, mientras que la segunda requiere cierta intervención.

En Adaptix Networks aplicamos failover para garantizar la disponibilidad de nuestros servicios con un promedio anual de 99.9% y de esta manera brindar a nuestros clientes mayor seguridad en su infraestructura e información. Le invitamos a ponerse en contacto con nosotros para proveerle más información respecto al apoyo que Adaptix Networks puede brindar específicamente a su empresa, así como los casos de éxito con nuestros clientes.