¿Por qué no hay más empresas que tengan un proceso de calidad de datos?

La respuesta simple a su pregunta es porque es difícil implementar un proceso de calidad de datos en cualquier empresa. He aquí por qué hago esta declaración:

  • La calidad es un término nebuloso. Como he mencionado en una de mis respuestas anteriores sobre este tema “La calidad está en el ojo del espectador”. Con esto quiero decir que cada consumidor de una pieza de datos o un conjunto de datos tiene su definición y expectativa de calidad y varían bastante (el término para esto en el lenguaje de gestión de datos es “apto para su uso”). ¿Cómo se puede conciliar esta situación para satisfacer las expectativas de todos?
  • Es muy difícil definir los requisitos de calidad de datos para un amplio espectro de tipos de datos y conjuntos de datos. Por lo general, he aconsejado a los clientes que analicen sus patrones de calidad de datos y casos de uso y luego identifiquen varias dimensiones de calidad que desean medir, para determinar la calidad de sus datos. Sin embargo, no hay acuerdo dentro de la comunidad de gestión de datos sobre estas dimensiones y sus definiciones.
  • Si se considera que se trata de un problema de la cadena de suministro (por ejemplo, los datos de baja calidad en toda la cadena de suministro de información pueden causar cuellos de botella o afectar los procesos comerciales), puede ver cómo se manifestará dentro de las organizaciones. El desafío es que para identificar los cuellos de botella de la cadena de suministro de información y solucionarlos, debe haber una comprensión clara del linaje de datos y las transformaciones de datos legítimas que se han producido a medida que los datos viajan a través de la cadena de suministro. Esto no está disponible ni se hace fácilmente.
  • La semántica de datos es otro desafío. En muchas organizaciones, los asociados no pueden ponerse de acuerdo sobre las definiciones y el significado de los elementos de datos y sus usos. ¿Cómo se pueden definir los requisitos de calidad, los valores permitidos y otros criterios tan importantes si hay una desconexión a nivel semántico?
  • La madurez de Data Governance en muchas organizaciones es muy baja o la organización DG no es muy efectiva. Esto da como resultado una falta de responsabilidad y mecanismos adecuados para abordar problemas relacionados con los datos, como la calidad y la semántica.

Consulte mis artículos sobre calidad de datos que están disponibles aquí: https://www.linkedin.com/pulse/j…

Espero que esto ayude.