DestacadosHistórico de la revistaPortada

Cero Interrupciones: sistemas de emergencia en centros de datos

Un centro de datos no puede permitirse una interrupción en sus actividades, pues toda falla, por breve que sea, implica pérdidas financieras para el centro de datos y para las compañías que hospeda. Garantizar que su operación sea óptima precisa tanto un diseño robusto y seguro del suministro principal, como sistemas de respaldo que entren en funcionamiento ante emergencias. La meta, operación perpetua.

Por Karemm Danel.

Las redes de telecomunicación se han convertido en una necesidad de las sociedades actuales. Cada día crece el número de usuarios de internet, telefonía móvil y de servicios satelitales, lo que ha incrementado las necesidades de disponibilidad de los centros encargados de su operación.

Históricamente, el auge de los centros de datos comenzó en la década de 1990, debido a la exigencia de una rápida conectividad y a la necesidad de disponer de datos de manera ininterrumpida. Con el paso de los años, las necesidades respecto de su infraestructura han ido cambiando, lo que ha hecho imprescindible la incorporación de tecnologías de enfriamiento y potencia eléctrica que resulten más eficientes.

En este tenor, los sistemas de respaldo han atravesado por un proceso de especialización con el objetivo de cumplir con las exigencias de sitios cuya premisa es no fallar. A este respecto, la climatización de los espacios para mantener los servidores a temperaturas adecuadas representa una de las labores fundamentales.

Más relevante aún es la disponibilidad de suministro eléctrico en todo momento. Los centros de datos son sitios insomnes, que no deben ni pueden parar, de lo contrario, toda la actividad de una empresa, un banco o un servidor de correo electrónico se vendría abajo. Los sistemas de emergencia cargan con la responsabilidad de mantenerse siempre a la expectativa ante la ausencia de suministro eléctrico.

Si bien los centros de datos son diseñados de tal modo que las fallas en el suministro eléctrico sean casi imposibles, nunca se está suficientemente protegido cuando se trata de la disponibilidad de redes y datos. Desde el punto de vista de Víctor Caballero, responsable de Operaciones de Cloud Magna, empresa enfocada en brindar servicios de nube para diversas instituciones públicas y privadas, la importancia de instalar un sistema de emergencia consiste en “proteger y respaldar la operación, así como los activos informáticos, por medio de un sistema de alimentación eléctrica. Ninguna red eléctrica es infalible; la estrategia es minimizar la posibilidad de que fallen todos los componentes”.

A0CE0041655En un centro de datos, la ausencia de energía nunca será notoria, puesto que el ups comienza a suministrar en el momento del corte

Estructura del centro de datos
Alberto Llavot, ingeniero en sistemas de la división IT de Schneider Electric, comenta que en el sistema eléctrico se plantea toda una ruta crítica eléctrica, “aunque abarca desde la misma planta de emergencia, para que en caso de un corte ésta comience a suministrar energía por un tiempo determinado; es decir, con un tanque de diésel que le permita operar por un tiempo específico de 12, 24 o 48 horas, de tal manera que se tenga la posibilidad de volver a llenar el tanque en caso necesario. También está conformado por un equipo de energía ininterrumpida (UPS), que dará soporte en caso de un corte de energía.

La ausencia de energía nunca será notoria, porque el UPS comienza a suministrar energía al instante en que se corta. Así, la energía que recibe la carga es limpia, sin problemas de calidad”.

No obstante, según detalla el ingeniero, que la funcionalidad de estos equipos sea adecuada exige un análisis de los requerimientos del centro de datos. “Dentro de la planeación del sistema de emergencia se planifica qué tipo de características debe tener este UPS y cuál es el tiempo de respaldo que necesita, de acuerdo con la carga y la incidencia de cortes eléctricos”.

Si bien los sistemas eléctricos de emergencia brindan soporte ante cortes inesperados en el suministro principal, existen sistemas secundarios que ofrecen seguridad al centro de datos ante cortes provocados por personas externas:

Subsistema de seguridad. Se contempla el sistema de circuito cerrado de televisión (CCTV), que permite monitorear las instalaciones del centro de datos para identificar posibles ataques físicos externos o la presencia de condiciones de operación anómalas.

Dentro de este subsistema está el equipo de monitoreo ambiental, que da todas las características ambientales dentro del piso blanco (donde se encuentran los servidores). De tal manera que es posible saber las condiciones de temperatura, humedad, humedad relativa, punto de rocío, etcétera, que hay dentro del centro de datos y que al salirse de los parámetros habituales requeridos por la estandarización afecta la operación general de los servidores.

Igualmente, hay un sistema de control de acceso, tanto al mismo centro de datos y al edificio donde se encuentra el centro, hasta el acceso al cuarto de cómputo o también al área de piso blanco, con un sistema de esclusa, sensores o detectores de proximidad o biométricos, dependiendo de la criticidad del servicio que presta el centro de datos; incluso, se llega a tener el máximo nivel de seguridad a nivel de gabinete al entrar o ir escalando los niveles de seguridad conforme la carga crítica se encuentra más próxima.

Sistema de salvaguarda. Lo conforma el sistema contraincendios, indispensable para cualquier centro de datos, que no sólo toma en cuenta el cuarto de cómputo, sino las áreas donde se instale equipo activo que forma parte del sistema de emergencia; es decir, el cuarto de máquinas donde están la planta de emergencia y los UPS, y el cuarto mecánico donde está el sistema de DNS.

Sistema de enfriamiento. Contempla que el nivel de redundancia requerido para lograr el enfriamiento dentro del centro de datos o el área de piso blanco permita mantener la operación y las condiciones del cuarto de cómputo dentro de los parámetros que establecen los estándares en tiempos específicos.

Sistema de administración. Desde el más pequeño hasta los grandes centros de datos, requieren una administración adecuada de las condiciones operativas. Si no se conoce cómo se está comportando el centro de datos, será imposible prever condiciones anómalas y actuar con la rapidez suficiente ante las condiciones de emergencia.

El sistema de administración, que se conoce como Data Center Infrastructure Management (DCIM), una plataforma de software, permite administrar toda la infraestructura, la capacidad instalada en el centro de datos, el sistema de seguridad y el sistema eléctrico, centralizado en un punto de monitoreo único, de tal manera que se le pueda dar seguimiento a cada componente del sistema o subsistema.

A partir de la información que el DCIM reporta, se pueden tomar las medidas necesarias para prevenir posibles fallas y planificar mantenimientos de cada uno de los equipos conforme a los requerimientos del cliente o las indicaciones; también es posible prever y visualizar cuando el nivel de consumo de energía de un gabinete está llegando a su tope máximo para agregar más unidad de distribución de energía o distribuir la carga

A0CE0041656La norma mexicana de centros de datos establece los requerimientos por cumplir para visualizar los riesgos que presentan estos sitios

Protección
Parte de las mejoras en la administración del centro de datos que se han desarrollado desde hace tiempo incluyen los análisis de riesgo, los cuales permiten evaluar a profundidad aquellos elementos que lo requieren para prever amenazas.

«En estandarización local, es decir, en la Norma Mexicana de Centros de Datos, se establecen los requerimientos por cumplir para visualizar los riesgos que tiene un centro de datos; por ejemplo, se pueden analizar las condiciones biológicas y las de instalación; qué tan cerca se sitúan de instalaciones que puedan dañar su operación, como aeropuertos o gasolineras; condiciones arquitectónicas propias del edificio; toda una serie de componentes que tenemos que evaluar para determinar el sistema de recuperación ante desastres”, asegura el ingeniero Llavot.

Por su parte, Víctor Caballero insiste en que, a pesar de las precauciones que se toman al diseñar un centro de datos, es necesario contar con un sistema de emergencia, pues el equipo eléctrico, mecánico, lógico o de control que garantice al ciento por ciento la fiabilidad no existe, aspecto que pone en riesgo la disponibilidad del centro de datos.

Al respecto, el ingeniero Llavot asegura que todo depende de la criticidad de la operación: “Recordemos que actualemente el centro de datos es, posiblemente, una de las instalaciones más críticas. Muchas de las operaciones, no sólo en las empresas, sino a nivel macroeconómico, de salud y de seguridad, dependen de la operación adecuada de instalaciones de TI que se concentran en el cerebro del centro de datos. Prever o planificar cuáles son las necesidades de emergencia para dichas instalaciones, que son el punto neurálgico del inmueble, es indispensable”.

Por otro lado, también abunda que los análisis previos, que tienen el objetivo de planificar esquemas de mejora y mantenimiento, aún no se encuentran del todo extendidos y pueden representar un verdadero problema de operación que genere pérdidas significativas para las empresas:

“Aunque en la actualidad muchas empresas no realizan un análisis, principalmente por falta de conocimiento, el enfoque de las estandarizaciones se está moviendo hacia que se planteen estrategias que permitan evitar aquellas problemáticas que provoquen que el centro de datos se apague parcial o totalmente y deje de prestar el servicio que requiere.

El establecimiento de estas estrategias se debe plantear desde el punto de vista de la carga, de su criticidad y del nivel de operación que se desee lograr”.

A0CE0041657Dentro del gabinete, es preciso colocar equipos de transferencia automáticos que permitan switchear la alimentación a dos fuentes independientes de energía

Alimentación eléctrica ante una falla
Sin importar el nivel de criticidad del centro de datos, el servidor debe operar los 365 días, las 24 horas del día. Para lograrlo, puntualiza el ingeniero Llavot, existe un esquema general de suministro eléctrico: “El servidor es alimentado a través de una unidad de distribución de energía, o PDU de rack, que a su vez es alimentada por un tablero principal o una unidad de distribución de energía general, conectada a un UPS que proporcionará la energía necesaria en caso de un corte de energía de la acometida de CFE.

El UPS estará conectado a un tablero de transferencia que realiza el cambio entre la línea de la acometida y la planta de emergencia, esto según la condición de operación que se maneje. Así, si la acometida sufre un corte, el UPS primero soporta la operación de la carga alimentando a todos los servidores a través de la energía que le proporcionan las baterías que el mismo UPS tiene”.

Cuando los centros de datos están clasificados bajo el esquema Tier, que especifica las exigencias de disponibilidad y sistemas de respaldo necesarios. “Se requiere que el UPS sea de doble conversión; es decir, que suministre energía sin cortes o transferencias de energía hacia la carga; en otras palabras, el tiempo en el que el UPS pasa de la energía que viene de la acometida hacia las baterías es cero.

Es por ello que los servidores no detectan problema de alimentación eléctrica”.

Tras la entrada en operación del UPS, cuya carga es limitada, pues funciona sólo a manera de puente mientras la planta de emergencia entra en operación, de forma inmediata, el tablero de transferencia que está arriba del UPS envía la alimentación hacia la planta de emergencia.

“Al detectar el corte de energía, el generador inicia su secuencia de arranque, que suele tardar entre 10 o 20 segundos en llegar a los valores nominales de alimentación. Una vez que llega a ellos, comienza a suministrar energía a través de transferencia al UPS, que recibe alimentación nuevamente y comienza a suministrar la energía proveniente de la alimentación de la planta, con lo que sale de su operación con baterías”, detalla el ingeniero Alberto Llavot.

Ahora bien, los centros de datos varían en sus características, según el tipo de equipo instalado, por lo que también es preciso considerarlo para elegir el esquema que más se adecue a cada uno. “Dentro del gabinete, especialmente para centros de datos que aún poseen equipos de servidores de comunicaciones que sólo se alimentan de una sola fuente, es necesario colocar equipos de transferencia automáticos que permitan switchear la alimentación al servidor o al equipo de comunicaciones de dos fuentes independientes, de tal manera que el equipo selecciona una fuente de alimentación preferente y el equipo de transferencia cambia hacia un equipo de alimentación secundaria, que puede ser tanto otro UPS u otra línea de acometida. Tal equipo se instala dentro del rack y es indispensable para cualquier tipo de centro de datos, sin importar el número de Tier”, indica Alberto Llavot.

A0CE0041658El diseño de los sistemas debe maximizar el potencial de los equipos, los cuales deberán brindar la reserva suficiente para contar con un suministro fiable

Fiabilidad y disponibilidad
El aumento de la fiabilidad en este tipo de inmuebles depende, en gran medida, de la redundancia. Por ello, el diseño del sistema debe maximizar el potencial de los equipos, los cuales tendrán que proporcionar la reserva suficiente para contar con un suministro de energía fiable.

De acuerdo con los expertos, las especificaciones para el diseño de un sistema de emergencia dependen de las necesidades del cliente y del manejo de la carga en función de la disponibilidad, resiliencia y fiabiliadad. “Tenemos que saber cuál es la carga a la que va a estar conectado el sistema y a partir de ella saber el nivel de redundancia que se planea lograr, conocer las condiciones operativas eléctricas, el voltaje, la potencia consumida y el crecimiento esperado”, indica el ingeniero Alberto Llavot.

“El UPS se dimensiona partiendo del área de piso blanco; la planta de emergencia a partir de los consumos que tienen el UPS, la iluminación normal y de emergencia, y en general todos los elementos que forman parte del edificio que están cargados directamente hacia la planta”.

Para el cliente es imprescindible estar seguro de que el equipo se encuentra respaldado por un fabricante confiable y que se cuenta con un correcto mantenimiento periódico. “La fiabilidad se logra de acuerdo con el tipo de equipo que el cliente seleccione. Si el cliente elije un equipo al que no se le da mantenimiento, que no cuenta con refacciones disponibles, que no se ha dimensionado para las condiciones de operación o que no presenta un nivel de redundancia específico, afecta directamente la confiabilidad del sistema. El primer paso es seleccionar un equipo reconocido con respaldo en México, que tenga servicios de mantenimiento, consultoría y el respaldo de una empresa que permita lograr los niveles adecuados de servicio hacia estos equipos”, advierte Alberto Llavot.

El segundo paso, que está enfocado en la disponibilidad, consiste en crear sistemas redundantes que permitan tener los suficientes caminos de alimentación eléctrica hacia la carga para prevenir que cualquier equipo sea susceptible de fallas. “Si seleccionamos un sistema con la redundancia adecuada, tanto plantas de emergencia como UPS, sistemas de seguridad, accesos, etcétera, lograremos un nivel de disponibilidad más alto”, especifica Llavot y explica que la disponibilidad del sistema impactará considerablemente en términos monetarios: “En un centro de datos, entre más robusto se diseña un sistema, tiende a ser más ineficiente su operación, por lo que hay que encontrar un punto intermedio entre eficiencia y disponibilidad, con el objetivo de que el cliente tenga las condiciones operativas óptimas, las cuales tendrán un impacto económico operativo fuerte. Tener un sistema más robusto generará una mayor inversión y probablemente mayor eficacia operativa, por eso es importante evaluar el nivel de electricidad que requiere la carga antes de tomar una decisión respecto del nivel de disponibilidad que queremos”.

“Para garantizar esto en los equipos de emergencia”, explica Víctor Caballero, “se cuenta con un plan de mantenimiento periódico, donde los equipos se arrancan. A su vez, se realizan pruebas controladas y planificadas para mantener los equipos a pruebas exhaustas en caso de corte. El mantenimiento se hace cada mes, en el caso de algunos componentes, y cada tres en algunos otros”.

A0CE0041659Los estándares buscan que se planteen estrategias para evitar problemáticas que provoquen apagones totales o parciales en los centros de datos

Normalización
El apego a las normas para el diseño eléctrico de un centro de datos, como en prácticamente cualquier instalación eléctrica, garantiza que se manejen los más estrictos estándares de calidad en los sistemas, lo que brinda seguridad, tanto a los encargados de la operación, como de los equipos y de los clientes.

En algunos casos, es preciso asesorar al usuario para que siga una metodología estándar de instalación según la criticidad.

Para el ingeniero Llavot, la manera de asegurar esto es apegarse a los lineamientos que marcan los estándares nacionales. “No todos los clientes tienen los mismos requerimientos de disponibilidad; entonces, es importante evaluar y, a partir de ello, proponer cuál sería el sistema más adecuado”.

“La razón principal es garantizar la seguridad al cliente. En nuestro caso, hacemos un estudio para ver lo que se compra y verificamos que cuente con las normas y especificaciones del fabricante y de todas y cada una de las normas con las cuales está regido el centro de datos.

Así llevamos un control estricto y mantenemos los procedimientos de calidad para la parte de adquisiciones de todos los sistemas, con el fin de cumplir con todas las funciones para las que son diseñados”, enfatiza Víctor Caballero.

A0CE0041660Para garantizar que los equipos de emergencia permanezcan en óptimas condiciones se deben establecer esquemas de mantenimiento, según la criticidad de cada sistema instalado

Panorama
A comienzos de 2014, Eduardo Rocha, presidente Internacional de la International Computer Room Experts Association (ICREA), aseguró que el sector de centros de datos en México equivale a 500 millones de dólares. Esta cifra lo ha convertido en una de las ramas más atractivas para la implementación y el desarrollo tecnológico.

Actualmente, dicha Asociación estima que el Distrito Federal, Querétaro y Nuevo León poseen el mayor número de centros de datos y es donde más avances tecnológicos se presentan.

Por su parte, Emerson Network Power, filial de Emerson, publicó en fechas pasadas que entre las previsiones que se tienen están grandes cambios en las fuentes de alimentación de los centros de datos y que el DCIM desempeñará una función prominente.

Por otra parte, Víctor Caballero también señala que la electrónica hoy en día se tiene en casi la mayoría de las tecnologías que conforman el sistema de emergencia, “lo que permite tener ventajas, pues se pueden operar aun cuando exista ausencia de una fuente de energía principal, cuando existe bajo voltaje, una sobretensión o cuando se invierten las fases de alimentación”.

Por su parte, en cuanto a las ventajas que ofrece el uso de corriente directa para hacer más ecológicos los centros de datos, Alberto Llavot declara que ?hasta la fecha todavía es un tema importante de discusión.

“Ya existen centros de datos que operan bajo estas condiciones de corriente directa; sin embargo, no es lo más común, son centros de datos muy grandes en los cuales se les puede solicitar a los mismos fabricantes de servidores la operación bajo estas condiciones. Sigue en una etapa muy experimental. Lo que se busca es hacer distribución en corriente alterna y ya dentro del servidor hacer el cambio de corriente alterna a directa. En los siguientes cinco años, no se ve un crecimiento alto en este tipo de distribución; es probable que después sea más frecuente por las condiciones que los fabricantes de servidores generan”, indica.

Cuantitativamente no es posible medir con exactitud cuánto representa una interrupción en el suministro eléctrico; sin embargo, puede ser muy significativa, razón por la que un sistema de emergencia adecuado es vital para las empresas.
—————————————————————————————————————————————————–

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Botón volver arriba