A partir del relato de la historia de Maury del libro «Big Data, la revolución de los datos masivos» de Viktor Mayer-Schonberger & Kenneth Cukier
En 1.839 un prometedor oficial de la armada, llamado Matthew Fontaine Maury, tuvo un accidente en una diligencia que le inhabilitaron para navegar. Tres años más tarde le destinaron a dirigir el Deposito de Cartas de Navegación e Instrumentos. Algo que pudiera haber resultado un castigo se convirtió en un destino perfecto para un oficial que de joven no comprendía por qué los barcos navegaban en zig zag en lugar de tomar una ruta directa. Su curiosidad le llevaba a preguntar a los capitanes sobre el por qué de dicha estrategia a lo que respondían que preferían una ruta familiar que adentrarse en algo nuevo que podia suponer peligros ocultos. Para ellos el mar era un entorno absolutamente impredecible donde la incertidumbre sólo se suavizaba con el confort de lo «familiar».
Sin embargo, de su experiencia como marino Maury percibía patrones, repeticiones…en los vientos, las corrientes…propiciados por las horas del días, los días del año, los puntos geográficos…Maury comenzó a inventariar los libros naúticos, mapas y cartas de navegación así como cuadernos de bitácora… Allí descubrió innumerable información que si se organizaba y recopilaba en su totalidad podría permitir diseñar de una manera completamente original las cartas de navegación.
Maury y su equipo de doce ayudantes, comenzaron la ingente tarea de extractar y tabular la información que hasta entonces casi había sido consideraba «basura»y tras dividir el Atlántico en bloques de cinco grados de latitud y longitud, anoto una serie de variables como temperatura, velocidad, dirección del viento y oleaje, así como el mes del año de dichas anotaciones. Se hizo evidente que los datos bien ordenados, apuntaban patrones y por tanto permitía definir las rutas más eficientes.
Pero Maury no se conformó, quería mejorar la exactitud de sus cálculos y para ello era necesaria más información para ello, creó una especie de «formulario estandarizado» para registrar los datos y logró que todos los barcos de la Armada de los Estados Unidos, lo usaran y lo entregaran al volver al puerto. Como los barcos mercantes también se mostraron interesados en utilizar la rutas de Maury éste a cambio les pidió que contribuyeran registrando sus datos como el resto de los barcos. Pero fue mucho mas lejos, logró que los barcos arrojasen al mar botellas con el nombre del dia, posición y viento dominante ( a modo de una sonda en la red ) y que recogieran las botellas que se fueran encontrando por su ruta.
Las cartas náuticas de Maury redujeron la duración de los viajes largos casi una tercera parte e incluso los navegantes más avezados que a priori rechazaban este nuevo «modelo» le encontraron utilidad.
El comandante Maury, fue uno de los primeros en darse cuenta de que existe un valor decisivo en un conjunto de datos enormes que no existe en cantidades más pequeñas de datos y con ello se convirtió en un pionero de la «datificación».
Esta historia me apasiona no sólo porque es increíble imaginar que hace 176, sin ordenadores, un hombre con un equipo de 12, estableciera las bases de lo que durante mucho tiempo han sido las rutas de miles de barcos a través de los océanos, sino también porque dentro de esta historia se encuentran la mayoría de los principios básico del Big Data que sintetizo a continuación:
1. El valor de una «cantidad» que hoy somos capaces de obtener, procesar y gestionar gracias a la bajada de costes derivada de la ley de Moore… Mis mantras aquí son:
– Al cambiar la cantidad de datos, cambiamos la esencia
– Cantidad es mejor que calidad… y hoy podemos obtener datos de muchas fuentes no todos ellos «perfectos» ni completos
– «Muchas datos» es también mejor que un algoritmo increíble , más cantidad mejor que más inteligencia
2. Ya no necesitamos buscar la causalidad de las cosas sino que los datos hablan por si mismos
– Saber el qué no el por qué es más que suficiente
3. La datificación de todo
– Fotos, Tuits de 140 caracteres y sus metadatos, virus de la gripe, estamos en el momento en el que todo lo podemos convertir en datos que además podemos tratar casi en cualquier formato
4. El valor de los datos
– El uso que demos ahora a los datos puede ser bien distinto al que hagamos de ellos en el futuro. Eso da un valor inmenso a los datos pues como activos se pueden reutilizar hasta el infinito y mas allá, son eternos.. Los datos se pueden reutilizar!!
– Además, Todos los datos pueden considerarse valiosos y con las nuevas herramientas de gestión de datos, cada vez podemos obtener mas valor de los mismos…
Tenemos que ser conscientes del profundo cambio que la datificación supone para la humanidad. De la misma manera que la imprenta, los acueductos, la máquina de vapor o el petróleo, la era de los datos puede cambiarlo todo. Información que hasta ahora se desdeñaba, acciones que hasta ahora no se podían medir, como las cartas de navegación tiradas en un baúl hace 176 años, como el petróleo que se consideró el residuo de un proceso químico hasta que se inventó el motor de explosión, los datos son el petróleo, el oro de la nueva era y como el agua, la imprenta, el petróleo o la máquina de vapor, están aquí para cambiar de manera irreversible la economía, los negocios y nuestras vidas…