PRIMEROS PASOS EN LA GESTIÓN DE ALARMAS. MIDIENDO EL DESEMPEÑO DEL SISTEMA DE ALARMAS

PRIMEROS PASOS EN LA GESTIÓN DE ALARMAS. MIDIENDO EL DESEMPEÑO DEL SISTEMA DE ALARMAS

Panelista supervisando el funcionamiento de una planta industrial

Este tercer artículo de la serie sobre el problema de las alarmas en la Industria tratará sobre cómo medir el desempeño del Sistemas de Alarmas, uno de los primeros pasos a dar en un proyecto de mejora de la Gestión de Alarmas -especialmente en plantas que ya están en funcionamiento- y que habrá que repetir periódicamente durante en este «proceso sin fin» de la Gestión de Alarmas, como veremos más adelante en otros artículos de la serie.

Si te has perdido alguno de los anteriores artículos, aquí los tienes todos:

  1. «El problema de las alarmas en la Industria»
  2. «¿Por qué es necesario mejorar el funcionamiento de los sistemas de alarmas?»
  3. «Primeros pasos en la Gestión de Alarmas. Midiendo el desempeño del Sistema de Alarmas»
  4. «Mejorando los KPIs de alarmas de forma rápida y sencilla»
  5. «Errores que hacen fracasar los proyectos de mejora del sistema de alarmas»

¿TIENE MI PLANTA UN PROBLEMA CON LAS ALARMAS?

Podemos decir sin temor a equivocarnos que su planta tiene un problema con las alarmas si alguna o varias de estas circunstancias le resulta familiar:

  • Incluso en condiciones normales,hay muchas alarmas. El panel es muy ruidoso, pequeñas alteraciones en el proceso generan un número importante de alarmas. Perturbaciones más importantes causan auténticas avalanchas de alarmas (alarm floods, según la literatura en inglés), ante las que los panelistas poco pueden hacer, salvo reconocerlas sin parar o bajar el volumen del altavoz para silenciarlas y así poder concentrarse en averiguar qué está ocurriendo.
  • Ha experimentado alguna parada imprevista y/o el daño de algún equipo como consecuencia de una alarma no detectada en panel.
  • Para averiguar qué provocó una parada imprevista de la planta, ha tenido que “bucear” entre las cientos de alarmas recogidas en el log de alarmas del ICS.
  • Hay alarmas ante las que el panelista no sabe cómo actuar. Las alarmas no son lo suficientemente informativas: descripciones poco claras, no indican el tipo de riesgo del que alertan (seguridad, medio ambiente, calidad), no informan acerca de cómo corregir la situación sobre la que alertan, etc.
  • Suenan algunas alarmas que no exigen ninguna actuación del panelista, simplemente reconocerlas para que dejen de sonar. Por ejemplo, suenan alarmas de equipos que están fuera de servicio desde hace tiempo o el inicio y comienzo de secuencias de operación habituales se señalizan con una alarma.
  • Cuando la alarma suena, el panelista ya no puede hacer nada: el equipo ya se ha parado o la producción se ha estropeado.
  • Algunas alarmas llevan activadas mucho tiempo (alarmas rancias o perennes, stale o standing alarms en la literatura en inglés). Parte de la pantalla de resumen de alarmas está siempre ocupada por estas alarmas, y, si aparece alguna nueva, puede pasar desapercibida entre ellas.
  • Hay demasiadas falsas alarmas, lo que hace que el personal no confíe en el sistema de alarmas. Existe un alto riesgo de confundir una alarma real con una de las falsas alarmas habituales. Es lo que podríamos llamar “efecto Pedro y el lobo”.
  • La gestión de la configuración de las alarmas es pobre. No hay control de quién, cuándo ni por qué ajustó un determinado valor de alarma o la deshabilitó. Los valores de alarma no se han modificado, aunque sí han cambiado las condiciones de operación. La actualización de la documentación asociada a las alarmas y/o de los gráficos de operación no es la adecuada.
  • No sabe cuántas alarmas silenciadas tiene su planta en cada momento, ni desde cuándo están silenciadas.
  • La priorización de las alarmas es inconsistente, alarmas similares tienen prioridades diferentes. Hay demasiadas alarmas “críticas” o “muy importantes”, o bien todas las alarmas tienen la misma prioridad (la que el ICS asigna por defecto).

¿Con cuántas de estas situaciones se identifica? Probablemente con varias, así que su planta tiene un problema con las alarmas, pero ¿cómo es de grave?

Aunque la deficiente gestión de alarmas es un problema de por sí, no deja de ser síntoma de otros problemas existentes en la organización

Aunque la deficiente gestión de alarmas es un problema de por sí, no deja de ser síntoma de otros problemas existentes en la organización. En efecto, muchas de las situaciones indicadas pueden achacarse a un mantenimiento deficiente, a una mala gestión de los cambios, a una configuración mejorable del ICS, a una mala transmisión de la información, etc.

¿CUÁL ES LA GRAVEDAD DE MI PROBLEMA CON LAS ALARMAS?

Llegados a este punto, siempre me gusta mencionar un par de frases, de William Thomson, matemático, físico e ingeniero británico del siglo XIX, más conocido como Lord Kelvin (sí, el inventor de la escala absoluta de temperatura), y que creo que vienen que ni pintadas para nuestro caso.


Imagen 1. Desconozco si entre los muchos campos que estudió Lord Kelvin estuvo la Gestión de Alarmas, pero sus máximas son plenamente aplicables.

Según Lord Kelvin, para poder hablar «con propiedad» de cualquier tema -en nuestro caso del problema de las alarmas- debemos transformar antes todas esas situaciones que hemos listado más arriba en números que podamos comparar con algunos valores de referencia, por ejemplo, los valores máximos de alarmas indicados por alguno de los estándares de alarmas que vimos en el segundo artículo de esta serie. Los resultados de este benchmarking nos ofrecerán una idea cuantitativa de la gravedad de nuestro problema de las alarmas y al mismo tiempo nos permitirá evaluar el resultado de las medidas correctivas que vayamos aplicando.

¿CÓMO MEDIMOS LAS ALARMAS?

Para evaluar los sistemas de alarma lo habitual es hacer uso del cálculo y evolución de determinados KPI (Key Performance Indicators, o Indicadores Clave de Desempeño). Estos KPI se calculan tanto al comienzo del proyecto de mejora de alarmas (evaluación inicial de la situación) como de manera continua una vez que nuestro proyecto esté en marcha.

Cualquier ICS guarda información sobre las alarmas. Esta información podemos clasificarla en dos categorías:

Datos dinámicos o en tiempo real

Básicamente, se trata del contenido del log de alarmas del ICS. El log de alarmas suele ser un fichero de texto plano que el ICS «va rellenando» a medida que se produce una alarma. Los datos que incluye son: el time stamp (fecha y hora en la que se produce la alarma), el tipo de alarma, su severidad, etc

Imagen 2. Log de alarmas de un ICS

Datos estáticos o de configuración de las alarmas

Los datos de configuración revelan cómo se ha configurado el sistema de alarmas. Son aquellos necesarios para definir una alarma en el ICS: tipo de alarma (HI, HI-HI, LO, LO-LO, DEV+, DEV-, etc), valores de ajuste, prioridad, etc

ISA 18.2 define una serie de KPIs de los sistemas de alarmas, con unos valores objetivo recomendables y otros que podrían ser aceptables. Si calculamos los KPIs de nuestro sistema al comienzo del proyecto de mejora del sistema de alarmas (t0) y los comparamos con estos valores de referencia, sabremos el gap entre nuestro sistema y las recomendaciones del estándar. Si una vez con el proyecto en marcha volvemos a calcular estos KPI, será fácil comprobar si las medidas que estamos tomando están dando resultado y si nuestro sistema de alarmas se está acercando a las recomendaciones del estándar, mantiene el gap o por el contrario éste aumenta.

En general, es deseable analizar datos de al menos 30 días para calcular estos KPIs. En el caso de operaciones por lotes (procesos batch), es conveniente tener datos de varios lotes. De esta manera se pretende que la influencia que pudiera tener en los cálculos cualquier anormalidad en el proceso (por ejemplo, un parada no planificada, la avería de algún equipo) quede amortiguada y los KPIs obtenidos deberían reflejar el funcionamiento habitual del Sistema de Alarmas.

La siguiente tabla resume los distintos KPIs de las alarmas que propone el estándar ISA 18.2.

Esta otra tabla enfrenta los valores recomendados para los KPIs de las alarmas según EEMUA e ISA (pueden verse que son bastante similares) frente a los habituales que se encuentran en distintos tipos de Industrias. Puede apreciarse que la realidad está muy lejos de las recomendaciones de los estándares de alarmas.

Demasiado a menudo, el cálculo de los KPIs de las alarmas se acomete con una hoja de cálculo: es una herramienta barata y fácil de utilizar, y puede servir para la evaluación inicial de la situación, pero si se pretende hacer un control continuo del desempeño del sistema rápidamente se dará cuenta de que pasa más tiempo extrayendo datos y dándoles formato para tratarlos que ejecutando acciones correctoras.

Aunque cuantificar nuestro problema con las alarmas es un buen comienzo, no debemos limitarnos sólo a los números, o correremos el riesgo de pasar por alto otros aspectos que influyen en el desempeño del Sistema de Alarmas. Será otro tema que veamos en futuros artículos.

CONCLUSIONES

  • Un sistema de alarmas deficiente puede mostrarse de muy distintas formas.
  • El problema de las alarmas es síntoma de otros problemas en la organización, como por ejemplo, un mantenimiento deficiente, una mala gestión del cambio, mala ingeniería del ICS, etc
  • Es imprescindible definir y evaluar una serie de KPIs de la Gestión de Alarmas. Podremos así comprobar el gap inicial entre los valores de nuestra instalación y las recomendaciones de los estándares, lo que nos permitirá conocer la gravedad de nuestro problema con las alarmas. Esta medición debe hacerse periódicamente, pues nos servirá para saber si las medidas correctivas que implantemos dan o no resultado.
  • La mejora de un Sistema de Alarmas es un proceso continuo. Cualquier proyecto de mejora planteado como una actuación puntual, sin continuidad en el tiempo está condenado al fracaso.
  • Es necesario dotarse de herramientas que faciliten la extracción de información del sistema, el cálculo de KPIs de alarmas y la elaboración de informes. De lo contrario, es posible que se dedique más tiempo trabajando con los datos (extrayendo información, dándole formato, etc) que analizándolos, extrayendo conclusiones y poniendo en práctica soluciones.
  • No conviene limitarse en exclusiva a trabajar en la mejora de los KPIs de las alarmas, hay aspectos de las alarmas que estos KPIs no miden.

Como siempre, invito a los posibles lectores de este artículo a que lo enriquezcan mediante sus aportaciones en la sección de comentarios. Ojalá que el tiempo empleado en su lectura les haya parecido provechoso y les agradezco que me ayuden a darle mayor difusión recomendándolo y compartiéndolo con los contactos de su red.

Espero contarles también entre los lectores de los próximos artículos de la serie, en los que tengo intención de tratar los errores más comunes que hacen fracasar los proyectos de mejora de los sistemas de alarmas, errores típicos en la configuración de las alarmas, el Ciclo de Vida de la Gestión de Alarmas, etc.

Víctor D. Parra

Dejar una respuesta