Hablemos claro sobre la preparación de datos

“Los datos son el nuevo petróleo”

Esta es una frase que acuñó Clive Humby allá por el 2006, que ya ha llovido, y la verdad es que no puedo estar más de acuerdo con él. Pero yo creo que le falta una segunda parte, quizás más importante aún.

“Pero hay que saber cómo procesarlo”

El procesamiento de datos es una de las disciplinas con más auge e interés en el sector tecnológico, ya que es la base para poder obtener o desarrollar posteriormente soluciones basadas en datos que aporten valor al negocio. Como por ejemplo Dashboards de Visualización de datos, desarrollar modelos de Machine Learning en cualquiera de sus sabores (o simplemente en un enfoque DataMesh), el proporcionar datos de calidad para ser usados por otras áreas de la empresa, o quizás incluso otras empresas.

Pero no nos engañemos, el procesamiento de datos no es una tarea fácil o sencilla, ya que tenemos que organizar, clasificar y limpiar, un montón de información que diferentes aplicativos o procesos previos no han tratado con la suficiente rigurosidad. Porque para obtener conclusiones o resultados de calidad, debemos tener en cuenta la siguiente máxima: “Garbage In, Garbage Out”.

¿Te llama la atención?

Pues sobre esto es de lo que hablaremos en mi sesión de la commitConf sobre el concepto de Calidad de los datos.

Tiene diferentes nombres más o menos cools como “Data Wrangling” o “Data Munging” y la más normalita “Data Quality”. Pero la realidad es que debemos ingeniárnoslas para pasar de unos datos desorganizados, con errores, huecos, valores anómalos, etc. en algo “usable” por los equipos que vengan detrás como los Business Analyst, Data Scientist, etc.

Por ello, en esta sesión de la CommitConf veremos las diferentes dimensiones de lo denominado “Data Quality” (estrategias, desafíos, y ejemplos con demos, que al final es lo más interesante, etc).

¿Que no sabéis lo que es la CommitConf?

Pues es uno de los eventos de comunidad de referencia y más importantes del panorama tecnológico, os dejo algunos datos: 2 días de duración, 70 sesiones en 7 tracks diferentes para que podáis elegir, 1000 asistentes, 49 comunidades tecnológicas… Una pasada, vamos.

Si seguís interesados os dejo aquí el enlace al evento para que lo tengáis fácil.

Tags

He leído y acepto la política de privacidad
Acepto recibir emails sobre actividades de recruiting NTT DATA