Los datos de calidad son claves para el éxito, ¿cierto? Entonces es necesario contar con un marco que permita monitorear con efectividad la calidad de los datos con el fin de mejorarlos y convertirlos en información útil para los procesos de negocio. Alcanzar un alto nivel de calidad no solo requiere de mediciones especializadas y monitoreo permanente, sino que además deben implementarse acciones correctivas dinámicas dado que los datos están en constante actualización.
Un área muy importante de las operaciones de mantenimiento de datos es establecer con claridad la relación entre las fallas de los datos y su impacto en el negocio, lo que requiere identificar datos "buenos" y "malos".
La auditoría y el proceso de inspección de datos es complejo e involucra la revisión objetiva de los datasets utilizando métodos cuantitativos y la observación de analistas especializados. Si bien es posible que un analista no logre identificar todos los datos incorrectos sin la intervención de las personas de la organización que los conocen y utilizan a diario, aún así el reporte de situaciones específicas a dichas personas puede ser extremadamente útil para confirmar la existencia de problemas a corregir. Este proceso incluye diferentes pasos, comenzando por el data profiling.
Data profiling
Se trata de un conjunto de algoritmos que otorga información básica sobre el tipo y modo de uso de los datos. Es una excelente herramienta para explorar las relaciones entre campos y objetos (p.e. contactos y empresas) dentro y a través de los distintos datasets del CRM.
Es capaz de exponer dependencias entre valores de campos que representan reglas del negocio implícitas en los datos y otras inconsistencias (p.e. datos faltantes) o errores en los datasets.
Auditoría de Calidad de Datos
Examina e identifica problemas específicos en los datos. Como ser problemas de formato, redundancias, datos faltantes, duplicados, y otros errores comunes. Según Insycle, algunos de los tipos de errores más comunes detectados en los datos del CRM son:
- Inconsistencias. Registros con problemas de consistencia, como ser países — "USA” vs. “US” vs. “United States”.
- Formateo pobre. Registros con errores como nombres todos en mayúsculas o minúsculas — "CARLOS" or "carlos" vs. "Carlos".
- Baja calidad. Registros que ya no son útiles, como ser contactos con rebote duro, o registros con muy poca información útil.
- Duplicados. Registros que comparten los mismos datos (o similares) con otros registros, como ser mismo nombre y dominio o mismo nombre y teléfono.
- Datos inválidos. Registros con errores que convierten los datos en no válidos. Un ejemplo serían los correos con errores de tipeo, "@gmil.com" vs "gmail.com".
- Datos incompletos. Registros sin información que es crítica para los procesos de la empresa, como ser registros de negocio sin "Valor" o "Fecha de cierre".
Como resultado de la auditoría y del proceso de inspección se obtiene además un conjunto de reglas, las cuales pueden categorizarse en el marco de las distintas dimensiones de calidad de los datos.
Si estás usando HubSpot o Salesforce, te recomiendo correr el Insycle Data Grader para auditar tu CRM en pocos minutos. Luego, envíanos el reporte para asistirte con nuestras recomendaciones profesionales sobre cómo resolver los problemas específicos que aparecieron en dicho reporte y cómo mantener la calidad de tus datos a lo largo del tiempo.