Por Esther Riveroll*

Aestas alturas ya no es sorprendente que se hable de los datos como uno de los activos más valiosos para las empresas. También sabemos que la información por sí sola no es de utilidad si no se analiza dentro de un contexto y con un fin específico. Sin embargo, existe un riesgo invisible que podría afectar la analítica de datos de cada compañía: los “datos sucios” o Dirty Data.

Imagina que en un banco existen tres bases de datos, cada una con más de 2,000 filas y más de 300 columnas con información detallada de sus clientes. Ahora imagina que en cada base hay un dato incorrecto por cada cliente, ya sea porque hubo un error al introducir la información, porque ésta no se ha actualizado (por ejemplo, el correo electrónico, número celular o un cambio de domicilio), o porque han proporcionado datos incorrectos de forma intencionada.

Y precisamente estos errores en la información son los Dirty Data y existen en las bases de datos de cualquier empresa. Cada dato erróneo modifica de manera incorrecta las estrategias de atracción de clientes, las ideas para la generación de nuevos productos o servicios que provocan la previsión de ventas inexactas.

Uno de los mayores retos de los negocios es conseguir que la información de sus bases no contengan “datos sucios”.

De acuerdo con la empresa Hocelot, entre los datos más falsificados por los clientes se encuentran los aspectos personales (edad, nivel educativo, etc.), información económica (gastos, ahorros, por mencionar algunos), el domicilio (si el lugar es rentado o propio, precio estimado del inmueble), y el salario percibido. En el lado opuesto, entre los sectores más perjudicados se encuentran la banca, los seguros, las telecomunicaciones, las finanzas y el retail.

Resulta complicado saber cuándo un negocio tiene algún error en sus datos. De este tema, un reporte de eMarketer afirma que sólo 57% de los negocios en Latinoamérica se entera de este problema hasta que lo reporta algún cliente, proveedor o prospecto.

Lo que sí es posible es conocer algunas estrategias para mejorar la calidad de los datos de las empresas, entre los que destacan cuatro aspectos que enunciaré en los párrafos siguientes.

Evita pedir datos innecesarios: recuerda que hay información que los usuarios tratan de ocultar (la mayoría lo hace por privacidad), así que evita obstáculos adicionales para mantener “limpia” tu base de datos y analiza cuál es la información que necesitas y qué es importante solicitar.

Crea una estrategia de limpieza proactiva: establece actividades de limpieza de datos e implementa reglas de captura para que no se pueda ingresar información incorrecta, además de que los campos contengan autoayuda para las personas que vacíen la información.

Descarta datos duplicados: en ocasiones, cuando se juntan datos que provienen de distintas fuentes, se da por hecho que la información es diferente, sin embargo, es necesario comprobar que no esté repetida.

Revisa los datos ocasionalmente: crea una cultura de monitoreo de la información; existen plataformas de software que permiten enviar notificaciones sobre el nivel de calidad de los datos.

También hay plataformas que apoyan en la estrategia para evitar los Dirty Data, además de tecnologías de Deep Learning, Machine Learning, Inteligencia Artificial (IA) o Smart Data, entre otras, para el análisis y uso de datos. De esta forma, las empresas tendrán bases más “limpias” que les permitirán tener verdaderas ventajas ante sus competidores.

Y tú, ¿cómo “limpias” los datos de tu negocio?

* Fundadora y directora general de Alldatum Business

Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Forbes Centroamérica.