Datos datos y más datos

Desde hace mucho tiempo, las organizaciones y entidades almacenan datos para su posterior tratamiento y obtención de información, pero ¿qué implican los datos en la toma de decisiones? ¿Cuáles son los datos más importantes para las organizaciones? ¿cuánto valen? Demos un pequeño paseo por el mundo del dato.

La importancia de los datos en las decisiones

La vida está hecha de decisiones, la ropa nos ponemos por la mañana, lo que comer, la hipoteca a contratar, si cambiar de trabajo o no; algunas más sencillas y otras mucho más difíciles, y para determinar la mejor opción, nuestro cerebro pondera innumerable información a modo de variables, algunas con mucha seguridad y otras con total incertidumbre, sin pasar por alto que vivencias pasadas también se tienen en cuenta al condicionar decisiones futuras, en ocasiones de manera voluntaria y en otras no.

Supongamos que buscamos información para comprar un coche, nos gusta mirar sus características y compararlas con las de otros coches, algunas como la capacidad de maletero o potencia, son medidas objetivas que nos son fáciles de comparar (no de ponderar), pero también tendremos en cuenta otros aspectos más subjetivos como experiencias anteriores de esa marca, lo que hemos oído, incluso tendremos en cuenta suposiciones como las previsiones de lo que nos puede costar mantenerlo. Usamos información para decidir el coche es el que más nos conviene y el que nos aportará más valor. Pero ¿qué significa “el que nos aportará más valor”? Según su definición, valor es “el grado de utilidad o aptitud de las cosas para satisfacer las necesidades o proporcionar bienestar o deleite”.  En el caso del coche, puede que para una persona el valor resida en que se pueda aparcar fácilmente por ser pequeño y para otra en que tenga siete plazas porque es familia numerosa o que consuma poco. El valor que se le da a cada variable (y por consiguiente a cada coche) dependerá de cada persona y cada momento.

En el caso de las organizaciones la situación es semejante, cuando se va a tomar una decisión, lo ideal es disponer de un conocimiento completo de las variables, el contexto en el que se va a fundamentar esta decisión y sus posibles consecuencias y para ello necesitamos datos fiables. Para permanecer competitivas, las organizaciones deben evitar tomar decisiones basadas en la intuición o en corazonadas y aplicar la analítica a sus datos y así conseguir una visión real de la situación y poder tomar las decisiones teniendo como base información veraz y actual.

Por otro lado, el entorno VUCA (Volatilidad, Incertidumbre, Complejidad, Ambigüedad / Volatility, Uncertainty, Complexity, Ambiguity) en el que nos encontramos, unido al ritmo que ha tomado la manera de realizar los negocios, ha hecho que la disrupción digital sea la norma general en lugar de la excepción y son necesarias tomas de decisiones de manera ágil y dinámica. Este contexto impulsa a las personas ligadas a negocio a trabajar estrechamente junto con los equipos de gestión y explotación del dato para crear soluciones que les ayuden a tomar decisiones y sustentar en ellas la estrategia del negocio, explorando a su vez las posibilidades de crecimiento que puedan ofrecer los datos disponibles, surgiendo modelos de negocio. Las organizaciones orientadas al dato (Data-driven) son conscientes de esto y se han adaptado para vertebrar sus procesos y sistemas en torno a los datos, pudiendo así apalancar sobre ellos la toma de decisiones. Pero las decisiones no se toman sobre los datos directamente, sino que se deben tratar previamente.

Triángulo de la información de Abate

Si nos fijamos en el triángulo de la información de Abate, es a través de los datos de la manera que podemos obtener información básica, de ésta información obtenemos conocimiento aplicándolo a cierto contexto de negocio o función, y del conocimiento obtenemos la visión que nos ayudará a entender y responder cuestiones sobre nuestro presente; del mismo modo y gracias al Big Data, podemos utilizar la ciencia de datos para tratar de vislumbrar el futuro y obtener previsiones y prescripciones, que es donde está el verdadero valor; pero todo ello viene de la misma fuente: los datos.

El valor del dato

Ya hemos visto la importancia de los datos para ayuda en la toma de decisiones, pero no todos los datos son igual de valiosos, entonces ¿Cuáles debemos almacenar?

Lejos quedan las tarjetas perforadas y las capacidades de almacenamiento de 1890, y es que la capacidad de almacenamiento se ha visto incrementada drásticamente en los últimos años, así como su caída de precio. En 1956, el IBM 350 era un disco duro que ocupaba el tamaño de un armario y podía almacenar 3.75 Mb con un coste de más de 3000 dólares al mes; las unidades flash de 8Mb, en el año 2000 costaban alrededor de 30 dólares y ahora por menos de ese precio podemos encontrar almacenamientos de 2Tb, es decir, por el mismo precio, 250.000 veces más almacenamiento que en el 2000. Si a este abaratamiento, le añadimos la capacidad casi infinita de almacenamiento en la nube, significa que podemos guardar con coste muy reducido una inmensidad de datos. Pero no debemos caer en la tentación de simplemente almacenar por almacenar, porque hay costes asociados a este almacenamiento que también hay que tener en cuenta, como pueden ser todos los procesos de adquisición, limpieza o tratamiento de los datos, sin olvidar costes ocultos como filtraciones de datos o riesgos de seguridad. No hay que olvidar que un dato será útil cuando se utilice, no cuando esté simplemente almacenado. Entonces, ¿qué debemos almacenar? ¿Cuánto tiempo? Pues dependerá del valor que cada dato suponga para la organización.

Tomemos el valor como la diferencia entre el coste de una cosa y el beneficio derivado de esa cosa, es decir, interesa cuantificar tanto el coste como el beneficio de ella. En algunas situaciones calcular el valor es sencillo, como podría ser el caso de las acciones de una empresa, que sería la diferencia entre el coste de la compra y el beneficio de la venta, pero en el caso de los datos no resulta tan sencillo, ya que no está estandarizado ni el coste ni el beneficio, por lo que es más difícil conocer su valor real para la organización.

Debemos tener en cuenta que los datos son únicos para cada entidad y su valor puede variar según el contexto, esto quiere decir, que lo que es muy valioso para una organización, puede no tener ningún valor para otra, por ejemplo, una empresa que vende ropa de bebé estará muy interesada en conocer el número de hijos que tiene una persona y sus edades, mientras que este dato puede ser irrelevante para una empresa que se dedique a repartir carburante. Por otro lado, tenemos que un dato puede ser relevante en un momento temporal, pero totalmente irrelevante al cabo de un tiempo, como campañas promocionales o estacionales e incluso crecer su valor a lo largo del tiempo como podría ser el caso de los datos relacionados con un cliente que va haciendo pedidos, es decir, el valor de un dato para una organización no es algo fijo en el tiempo.

En cuanto al coste nos sucede algo parecido, nos puede resultar más o menos sencillo obtener el coste de mantener un dato en nuestros sistemas, pero también se debe tener en cuenta procesos inherentes a la creación y custodia de ese dato como pueden ser las extracciones, transformaciones o limpiezas entre otros. Con esto quiero decir que puede parecer interesante a priori guardar cualquier tipo de dato, pero que antes de aplicarle procesos de gestión y seguridad, se ha de tener en cuenta el valor real de dicho dato para la organización o el riesgo de fuga de este.

Como parte de la estrategia de la gestión del dato está identificar aquellas entidades que son importantes para el negocio y centrar ahí los esfuerzos y no perder el foco gastando energías y recursos en procesar datos que no añaden valor a la organización, porque son muchos más los datos disponibles, que los datos que podemos procesar para obtener el conocimiento.

Disponemos de más datos de los que podemos extraer conocimiento

Pero nuevamente, ¿cuáles son los datos que realmente añaden valor a la organización? Una manera de comenzar a valorar económicamente un dato puede ser valorar la falta de él, es decir lo que tengo que pagar en sanciones o cuanto puedo dejar de ganar si no dispongo de ese dato; por ejemplo, si una empresa obtiene beneficios de 10M€ anuales por campañas enviadas a correos electrónicos, quiere decir que las direcciones de correo para esa empresa son un dato sin el cual no podría recibir este beneficio. Más difícil son valorar los datos que nos permiten inferir conocimiento futuro.

Esto nos lleva a que, en la gestión del dato, un paso fundamental es establecer formas de asociar un valor financiero a los datos, este valor dependerá de cada organización, y algunas formas de medirlo pueden ser por valor de mercado, coste de remplazamiento, coste por riesgo (de pérdida, falta, substracción), venta de los datos, etc.

Lo que es claro es que, asociando un valor a los datos, podremos tomar decisiones estratégicas sobre los datos basándonos en términos financieros, esto no sólo ayudará a dar valor a las actividades de gestión de datos sino también a que la organización tome conciencia del valor de ellos, del impacto financiero en la empresa que tienen y todas las actividades que se realizan para su gestión.

El dato como activo de la organización

Conocemos como activos para la compañía el conjunto de bienes, derechos y otros recursos de los que es propietaria una compañía, por ejemplo, muebles o equipos informáticos, también se incluyen aquellos de los que esperamos tener un beneficio futuro, es decir, todo aquello que suma a su favor.

En el caso de los datos y por lo que hemos visto hasta ahora, son un activo intangible que cumple los atributos necesarios dictados por la International Accounting Standard (IAS) para ser clasificado de esta manera, como pueden ser la capacidad de ser identificable (posibilidad de ser separado y vendido) o la probabilidad de generar beneficios económicos futuros en forma de ingresos, reducción de costes, etc. Pero es un activo muy peculiar, dado que pese a cumplir los atributos de activo intangible, no es un activo desde el punto de vista contable, es decir no aparece en la cuenta de resultados (aunque es posible que lo veamos en un futuro). Otra peculiaridad es que es fácilmente replicable y ubicuo, es decir, podemos tener múltiples copias en distintos sitios a la vez y replicarlo de manera indefinida, con el riesgo que ello representa también (como veremos más adelante), porque además la replicación es casi inmediata. Por otro lado, es un activo que por mucho que lo usemos, no sufre desgaste, es un activo que puede ser utilizado de diversas maneras, a la misma vez y sin deterioro; queda claro que es un activo especial. Hay que aclarar que si el dato no es válido en el contexto del negocio, o si no permite obtener conocimiento fiable sobre él, no es más que un valor inconexo e incluso puede llevarnos a decisiones erróneas, es por ello que debido al incremento exponencial de los datos disponibles y de la necesidad de obtener conocimiento y valor de ellos, la gestión del dato va tomando cada vez más importancia, ayudándonos a convertir los datos en un activo de las organizaciones, pero no un activo cualquiera, sino uno estratégico en el que apoyar las decisiones del negocio.

Riesgos de los datos

Los datos no son sólo un activo para las organizaciones, sino también pueden convertirse en un riesgo si no son bien gestionados, veamos algunos casos.

El uso de un dato puede resultar un riesgo, si su calidad no es la esperada (puede ser incompleto, obsoleto o inexacto) ya que puede llevarnos a tomar decisiones estratégicas erróneas. En ocasiones es mejor no disponer de un dato, que disponer del dato erróneo. Volviendo al símil del coche, si no supiéramos la longitud del coche, podríamos intentar averiguarla por algún otro modo, pero si tenemos ese dato, confiamos en él y resultara ser erróneo, podríamos comprar un coche que no cupiera en nuestra plaza de aparcamiento, es decir, hemos tomado una decisión errónea por basarnos en un dato que no era correcto y el resultado no es el esperado.

Mala calidad de los datos lleva a decisiones erróneas

En cuanto a la calidad, también podemos entrar a valorar lo que consideramos datos de calidad, podríamos decir que son de calidad si cumplen con las expectativas y necesidades de los usuarios, pero esto a su vez tiene muchas interpretaciones porque las expectativas son distintas para cada usuario y situación; así que de manera general podríamos decir que los datos de calidad han de ser completos, precisos, coherentes, pertinentes, comprensibles, utilizables, significativos y estar disponibles cuando se les necesita, por eso es importante que los procesos de aseguramiento de la calidad del dato se encuentren integrados y alienados con los procesos de la organización.

La falta de un dato puede impactar de diferentes formas a la organización, por ejemplo, para la toma de una decisión importante, una falta de un dato seria la diferencia entre lo que sabemos y lo que necesitamos saber para tomar una decisión eficaz, pero ante un requerimiento judicial o una auditoría, la falta de un dato puede afectar directamente a las finanzas y a la reputación de la organización por no cumplir con reglamentos o leyes que apliquen en ese negocio o región. Por otro lado, un dato puede ser malinterpretado o usado de manera errónea, por eso es muy importante una gestión correcta de los metadatos referentes a los datos, de modo que todo aquel que utilice un dato, pueda saber cuál es la forma óptima de utilizarlo, lo que significa, de donde se ha obtenido o esté al tanto de otros datos complementarios a éste.

Con lo que hemos ido viendo anteriormente, queda claro que para poder ofrecer unos datos fiables y de confianza con la seguridad necesaria en el tiempo requerido , los profesionales de la gestión de datos deben entender mejor los requisitos de lo que supone la calidad para sus clientes (los stakeholders a los que el dato les ofrecerá valor) y cómo medir esta calidad para irla mejorando, del mismo modo, disponer de una arquitectura e infraestructura para poder gobernar y gestionar el dato de manera que ofrezca valor a la organizacion, es clave para poder ofrecer los datos en las condiciones mencionadas. Podemos ver que el trabajo a realizar no es poco y supone un proceso de transformación tanto tecnológica como de cultura en las empresas; pero no estamos solos, organizaciones como DAMA ponen a nuestra disposición herramientas y publicaciones para ayudarnos en estas tareas.