SOBRE DATOS, VISUALIZACIÓN DE INFORMACIÓN Y LUCHA CONTRA EPIDEMIAS

SOBRE DATOS, VISUALIZACIÓN DE INFORMACIÓN Y LUCHA CONTRA EPIDEMIAS

2019-nCoV

En estos días de pandemia global de COVID-19 (acrónimo en inglés de Coronavirus Disease 2019) provocada por el virus SARS-CoV-2 (o Coronavirus 2 del síndrome respiratorio agudo grave) todos nos hemos convertido en un poco virólogos y epidemiólogos y nos hemos habituado a ver distintas gráficas tratando de representar la evolución de la enfermedad en el país, comparándola con la situación en otros países y detallándola al nivel de Comunidades Autónomas.

Ejemplo de los dashboards sobre la evolución de COVID-19 que ofrece la prensa diaria. En este caso extraído del periódico ElConfidencial.com el 18/04/2020
Ejemplo del 18/04/2020 con el dashboard que la prensa ofrece diariamente resumiendo la evolución de la epidemia de Covid-19

Así por ejemplo, en este video, Fernando Simón, médico epidemiólogo y desde 2012 director del Centro de Coordinación de Alertas y Emergencias Sanitarias del Ministerio de Sanidad explica la curva de infección ante los medios de comunicación en los primeros días de la crisis de COVID-19 en España. 

Fernando Simón -Director del Centro de Coordinación de Alertas y Emergencias Sanitarias- explica a los medios la curva de infección de cualquier epidemia

También se ha vuelto archiconocida la siguiente curva, explicando la importancia de la implantación temprana de medidas tendentes a reducir el número de contagios y así «Aplanar la curva de contagios» para que el sistema pueda asumir el tratamiento de los contagiados sin llegar a colapsar.

Gráfica con la que se explica la importancia de imponer medidas de distanciamiento social para evitar la excesiva concentración de casos en un reducido periodo de tiempo que implicaría el colapso del sistema sanitario.
El Martillo y la Danza. Gráfico utilizado para explicar la importancia de imponer medidas de confinamiento y distanciamiento social para «Aplanar la curva».

En cuanto a esfuerzos por representar de forma actualizada los datos de esta pandemia global, destacar el COVID-19 Dashboard, elaborado por el Center for Systems Science and Engineering (CSSE) de la Johns Hopkins University (JHU). Se trata de un trabajo muy difícil, por no decir imposible, no sólo por el volumen de datos a manejar, sino porque como parece comprobarse, los datos ofrecidos por los distintos gobiernos no son fiables -cuando no directamente falsos- por distintas razones: incapacidad, diferencia de criterios, interés político, etc. En el caso de España, por ejemplo, no hay acuerdo ni en cómo se cuentan contagiados y fallecidos por COVID-19 en cada Comunidad Autónoma, por lo que los datos se han vuelto inservibles para los modelos predictivos de epidemiólogos y matemáticos.

Por todo lo anterior, he pensado interesante la elaboración de este artículo, que detalla una anécdota histórica de la que tuve conocimiento hace tiempo mientras preparaba una presentación para ISA Sección Española sobre Interfaces Gráficas de Usuario en Sistemas de Control Industriales. Este 2020 espero poder volver a hablar sobre el tema en la Plant Engineering Workshop 2020 que inicialmente se iba a celebrar en Madrid este mes de mayo, pero que ha tenido que ser pospuesta a consecuencia del brote de Covid-19.

John Snow y la epidemia de cólera en Londres

La enfermedad del cólera 

Según Wikipedia, el cólera es una enfermedad infecto-contagiosa intestinal aguda, provocada por la bacteria Vibrio cholerae (aislada en 1854 por el médico italiano Filippo Pacini) y que produce una diarrea acuosa de gran volumen que provoca la rápida deshidratación del organismo.

La enfermedad ha recibido varios nombres a lo largo de la historia, tales como «enfermedad azul», «enfermedad negra», «fiebre álgida grave», «pasión colérica», «diarrea colérica», «cholera morbus», «cholera gravis» y, simplemente cólera.

Se trata de una enfermedad que acompaña a la Humanidad desde hace siglos. Hipócrates (460-377 a.C.), Galeno (129-216) y Wang Shuhe (180-270) ya describían en sus escritos médicos lo que podría ser el cólera, y en textos de la India antigua se encuentran posibles descripciones de la enfermedad en las poblaciones asentadas en la ribera del río Ganges, aunque no es posible demostrar que se trate específicamente de la enfermedad provocada por el V. cholerae ni que se presentara en forma de epidemia como aparece actualmente.

La primera referencia en la historia documentada occidental de la existencia del cólera en India, se encuentra poco después de la llegada de Vasco de Gama a Calicut el año 1498. 

En su forma actual, es probable que el cólera tenga su origen en el subcontinente indio, durante los siglos del IX al XV (como comentamos anteriormente era frecuente en la ribera del Ganges desde la antigüedad, debido a la contaminación del río). La enfermedad habría aprovechado las rutas comerciales terrestres y marítimas para propagarse por todo el mundo. Fuera de la India, la primera referencia documentada sobre el cólera data de 1629 en Yakarta, en la isla de Java.

Epidemias y pandemias de cólera

Existen varios reportes de brotes de cólera en distintas regiones de la India durante el siglo XVIII y XIX, así como en las islas Mauricio, Reunión y Sri Lanka.

La Organización Mundial de la Salud (OMS), mencionaba seis pandemias de cólera en la monografía que dedicó al tema en 1950, las de 1817, 1829, 1852, 1863, la que transcurrió entre 1881 y 1896 y otra entre 1899 y 1923. La última pandemia de cólera ocurrió en 1961. 

En los últimos 100 años, la enfermedad ha sido poco frecuente en los países industrializados. Actualmente el cólera es una enfermedad endémica en más de 50 países, siendo común en el Subcontinente Indio, el Sureste Asiático, Latinoamérica y África Subsahariana. En 2010 estalló en Haití un brote de cólera tras el terremoto que asoló al país.

La Tercera Pandemia golpea Londres: el brote de Broad Street y como un mapa salvó a la ciudad

La pandemia de 1852 se debió a una serie de recrudecimientos locales en diversas áreas así como a migraciones e importaciones sucesivas.

Al surgimiento de focos en la India en 1852 se unieron recrudecimientos en Persia y Mesopotamia, mientras que en paralelo, una amplia ola golpeaba todo el norte de Europa, América del Norte, México y las Indias Orientales. En 1854, el cólera se mantenía en estas zonas, pero al mismo tiempo avanzaba por Europa aprovechando los desplazamientos de las tropas que participaban en la Guerra de Crimea (que enfrentaba al Imperio Ruso y el Reino de Grecia, por un lado y al Imperio Otomano, Francia, el Reino Unido y el Reino de Cerdeña por otro).

En 1854 se produjo en Londres el brote de cólera más violento de Inglaterra. Fue en Broad Street, en el barrio del Soho. En un área de apenas medio kilómetro de diámetro fallecieron aproximadamente 700 personas (un 10% de la población) en menos de una semana. La consulta del Dr. John Snow se encontraba muy próxima al centro de la epidemia por lo que conocía a varias de las víctimas.

Retrato del Dr. John Snow
Retrato del Dr. John Snow considerado uno de los precursores de la epidemiología moderna.

Para investigar las fuentes de la infección John Snow recurrió a un método que ya venía utilizando desde hacía un tiempo: el uso de mapas para argumentar sus tesis. Armado con un plano de la zona asolada y con la ayuda del párroco local Henry Whitehead, comienza a anotar en él las muertes por cólera en el mes de septiembre. Para ello realiza un minucioso trabajo de campo, visitando uno por uno todos los edificios del área afectada y ayudándose de los registros del hospital de Middlesex, donde eran trasladadas muchas de las víctimas.

Sobre el mapa, unas finas líneas negras marcan el hogar de cada fallecido, de forma que se iban apilando unas sobre las otras a medida que el número de decesos aumentaba. Esto permitió conectar de forma visual la incidencia de la enfermedad con su concentración. Además, Snow localizó sobre el mapa los pozos de agua de la zona. Y el resultado fue demoledor: más del 70% de las muertes se habían producido en el área de servicio de la bomba de agua de Broad Street.

Y el resultado fue una de las primeras infografías de la historia:

Mapa del Dr. John Snow ubicando fallecimientos por cóleras y fuentes de agua potable
Variante del mapa original del Dr. John Snow. Los puntos son casos de cólera durante la epidemia en Londres de 1854 y las cruces la ubicación de las bombas de agua.

La investigación a pie de calle del doctor aclaró además algunos puntos oscuros. Es el caso de 500 trabajadores de un taller situado dentro de la zona de epidemia, pero en el que únicamente murieron cinco hombres. El disponer de una bomba de agua propia dentro del edificio les había salvado la vida. Lo mismo ocurrió en una destilería que contaba con un pozo propio. Peor suerte tuvieron algunas de las víctimas, que contrajeron el cólera pese a vivir lejos del pozo de Broad Street. Al parecer, por motivos laborales o familiares frecuentaban esta calle, donde bebían de la fuente.

Con la ayuda de su mapa, Snow pudo convencer a las autoridades para que clausurara la bomba de agua, con lo que fueron disminuyendo los casos de la enfermedad y se salvaron cientos de vidas. Algo más tarde se descubrió al culpable del brote: los pañales de un bebé enfermo que se filtraron al agua subterránea a través de un pozo negro.

Los descubrimientos de Snow inspiraron cambios fundamentales en los sistemas de suministro de agua y aguas residuales de Londres (entonces Londres tenía 2,5 millones de habitantes que arrojaban sus residuos a pozos ciegos que solían rebosar contaminando las fuentes de agua potable) y otras ciudades, lo que supuso una mejora significativa de la salud pública en todo el mundo. 

Desmontando la leyenda

Por este hecho John Snow es reconocido como un precursor de la epidemiología, hasta el punto de ser considerado padre de la epidemiología moderna, un componente importantísimo dentro de la salud pública.

En numerosos textos -por ejemplo, en Visual Explanation de Tufte- se explica cómo a partir de la información incluida en el mapa mostrado anteriormente, John Snow fue capaz de deducir que el agua era culpable de la transmisión de la enfermedad, y más concretamente, el agua que se extraía de la bomba ubicada en Broad Street. 

En realidad, John Snow ya sospechaba de la responsabilidad del agua contaminada en la transmisión del cólera y utilizó el mapa para demostrar su hipótesis. John Snow ya había realizado la descripción de dos brotes epidémicos de cólera localizados en el sur de Londres en 1849, donde sus evidencias le sugerían que se había seguido una ruta que comprometía el agua ingerida. Snow llega a elaborar una teoría sobre la enfermedad completamente diferente a las que existían entonces. Argumenta que el cólera es una enfermedad intestinal y que sus síntomas se deben por completo a la pérdida de los líquidos corporales. Su razonamiento le lleva a pensar que el agente causal debe entrar por la boca, se reproduce y multiplica en el intestino y se elimina por las materias fecales, con lo cual se disemina a otras personas por la ruta fecal-oral, cerrando el circuito.

Aún así, Snow fue incapaz de que la ciencia de la época considerara su hipótesis, dada la fuerte creencia en la teoría miasmática de la enfermedad, formulada por  Thomas Sydenham (1624-1689) y Giovanni María Lancisi (1654-1720) que responsabilizaba a las miasmas (emanaciones fétidas de suelos y aguas impuras) del origen de las enfermedades. La prevalencia de esta teoría miasmática, provocó que el descubrimiento de la bacteria Vibrio cholerae por parte de Pacini en 1854 pasara desapercibido hasta que treinta años más tarde fue redescubierta por Robert Koch y Snow murió en 1858, antes de ver reconocida su hipótesis sobre el cólera.

Pero no debemos quitarle méritos al trabajo de John Snow, aunque evidentemente se ayudó de los avances previos logrados por otros médicos y científicos. Su investigación ha sido piedra angular para estadísticos, epidemiólogos e investigadores y aunque la historia no es exáctamente como la cuenta Tufte, gracias a su contextualización podemos sacar algunas conclusiones sobre la Visualización de Datos:

  • Snow tenía una teoría y debía confirmarla, el criterio para visualizar fue entonces el de confirmación, por eso “eliminó el ruido” del mapa (otros datos que no aportaban).
  • Los datos deben cotejarse: las preguntas a cómo, cuándo, dónde y por quién se obtuvo la información deben aplicarse siempre, aún cuando contraríen la evidencia a favor.
  • Recordar la pregunta clave ¿comparado con qué? si no somos capaces de otorgar marcos comparativos, fallamos en la contextualización y en el objetivo.
  • La elección de un determinado tipo de gráfico puede comprometer el trabajo de investigación: para estos casos conviene probar distintos tipos y elegir la que guarde mayor fidelidad con las conclusiones.
  • La visualización no es un fin en sí mismo, hace parte de un proceso de múltiples etapas y su objetivo es ampliar el conocimiento sobre una cuestión y coadyuvar el proceso de comunicarla.

Conclusiones

  • La visualización de información es una de las técnica más poderosas, y a la vez más accesibles, de las que disponemos para analizar datos y extraer conclusiones. 
  • La visualización gráfica de datos constituye una disciplina propia dentro del universo de la ciencia de datos, especialmente en la actualidad con el auge del Big Data.
  • La selección de los datos adecuados y la forma en la que se representan pueden ayudar a extraer más información de los datos, plantear preguntas sobre un determinado problema que motiven nuevas líneas de investigación o bien ayudando a demostrar hipótesis. ¡Ojo! lo contrario también es cierto y puede usarse para ocultar información.

Gracias por dedicar vuestro tiempo a leer este artículo. Espero que os haya gustado lo suficiente como para querer curiosear el resto de publicaciones en el blog y que consideréis la posibilidad de suscribiros al mismo para no perderos futuras actualizaciones.

La Visualización de Datos es un tema muy interesante del que prometo seguir hablando.

Referencias

Para documentar este artículo he hecho uso de múltiples lecturas y referencias de muy diversas fuentes:

Las visualizaciones de datos más influyentes de la historia, artículo en el blog de Grupo IGN.

Los cinco incunables de la visualización de datos, artículo de Marta Peirano en ElDiario.es dedicado a las representaciones de datos. Marta Peirano es autora de los libros El Pequeño Libro Rojo del activista en Red (una introducción a la criptografía para periodistas, fuentes y medios de comunicación) y El enemigo conoce el sistema.

John Snow y la epidemia de cólera en Londres en 1854, “Los hechos hablan por sí solos, o es necesaria una hipótesis para encontrar los hechos”, de Hernán C. Doval en la Revista Argentina de Cardiología / Vol. 71 Nº6 /Noviembre-Diciembre 2003.

Lecciones de Edward Tufte (II parte): La epidemia de cólera en Londres de 1854 y los orígenes de la epidemiología, en el blog “Aquí de Omnibus Dubitandum”, que dispone de  una buena colección de enlaces relacionados con la Visualización de Datos

John Snow y el mapa que salvó Londres, en el blog All3DForm.

El libro El Mapa Fantasma, la historia real de la epidemia más terrorífica vivida en Londres, de Steven Johnson. Recomiendo también esta charla TED del autor (en inglés, con subtitulos en español).

En inglés:

Los libros de Edward Tufte, aquí el enlace en Amazon.

Heroes of Visualization: John Snow, H.W. Acland, and the Mythmaking Problem, artículo de Alberto Cairo, profesor de Infografía y Visualización de Datos en la School of Communication of the University of Miami, autor del blog http://www.thefunctionalart.com/ así como de varios libros dedicados a la visualización de la información.

The past and future of data visualization, artículo de Nick Brown en Medium que además de recorrer la historia de la visualización de la información y su posible futuro, ofrece una gran cantidad de enlaces para ampliar información.

Víctor D. Parra

Deja un comentario