viernes, 6 de noviembre de 2009

Redundancia en la práctica, control de operaciones

Para asegurar el funcionamiento de las operaciones en caso de incidencias, fallos y averías, la estrategia habitual es la duplicación o agregado de infraestructura, equipamiento por un lado, y la redundancia de tareas, procesos y recursos humanos críticos o especializados por el otro. Los dos primeros siempre y cuando fuera financiera y económicamente viable, los segundos siempre (en teoría).

En Crisis y Contingencias, implícitamente haciamos referencia a catástrofes o problemas que imprevistamente provocan la interrupción total de un servicio, tales como bloqueos de enlaces primarios E1 y centrales públicas, caídas de conexiones de datos punto a punto que por contrato garantizan una disponibilidad de 99,99%, fallos en la central telefónica, la detención del motor del generador de energía de emergencia el día de un corte de energía de la red pública que se estira más de la cuenta, entre otros.

Además de estas grandes crisis, existen pequeñas incidencias que seguramente no producen el corte de la operación, pero que generan desvíos con respecto a las especificaciones del servicio, del cliente o de la operatividad normal, y por lo tanto tampoco deben ser descuidadas o relegadas. Entre estas podemos mencionar: el envío de reportes interno, el abastecimiento de material de librería, etc.

Dejando de lado la prevención de fallos en equipamiento e infraestructura mediante la suma de recursos, el fin de este artículo es enfocar brevemente en las incidencias del tipo de las del párrafo anterior, es decir en las tareas y procedimientos específicos dependientes de personas donde la redundancia existe generalmente en teoría, pero no siempre en la práctica a pesar de la existencia de minuciosos y completísimos documentos escritos acerca de cómo proceder.

En muchos de estos casos, quienes se enfrentan a las incidencias imprevistas no tienen entrenamiento o directamente no saben lo suficiente como para poner en práctica los procedimientos. Otras veces carecen del compromiso o la voluntad necesaria o finalmente prefieren pasar la mochila hacia arriba y proseguir con una existencia sencilla y sin complicaciones.

La forma de mantener a todo al mundo al tanto de cómo reaccionar en caso de incidencias se puede lograr mediante simulacros y entrenamiento. Intentar dentro de lo posible y efectivo “que todos sepan hacer todo”, y realizar simulacros de todo tipo, como por ejemplo: un día cualquiera dejar en manos de los coordinadores la preparación y envío de reportes que produce otra persona dedicada, simular la interrupción del funcionamiento de los elevadores en el momento de cambio de turno, y cualquier otro ensayo sobre procesos importantes y no tanto de vuestra operación.

Al finalizar cada simulacro, no dejen de reunir a las personas involucradas para medir tiempos de respuesta y fundamentalmente los resultados de la experiencia para determinar las necesidades de entrenamiento, y comprender la importancia del compromiso de los involucrados en la búsqueda de soluciones.

Foto: Ruth Flickr (catching up slowly!)

No hay comentarios:

Publicar un comentario

Sobre el Contenido

No se permite la reproducción total o parcial y en ningún soporte y para fines comerciales, de ninguno de los textos de esta página, sin que medie la autorización del autor. Los textos de esta página son para uso personal de su autor, y en caso de que terceros los utilizaran total o parcialmente en cualquier publicación (bien virtual o por cualquier otro medio presente o futuro) se citará siempre la autoría y la fuente original, creando si fuere posible, un vínculo a la misma.2009.