Se asocia la DQ con exactitud pero es más que sólo datos exactos
Entonces:
La DQ es un concepto multifacético (distintas dimensiones o características)
Hay dimensiones de calidad que puede detectarse errores fácilmente (ej: exactitud) y en otros casos pueden ser más difícil (ej: valores admisibles pero no correctos)
Las dimensiones puede variar dependiendo del contexto
Software product Quality Requirements and Evaluation (SQuaRE)
Estructurados: Cuando cada elemento tiene asociada una estructura fija. Por ejemplo tablas relacionales.
Company | Contact | Country |
---|---|---|
Alfreds Futterkiste | Maria Anders | Germany |
Centro comercial Moctezuma | Francisco Chang | Mexico |
Ernst Handel | Roland Mendel | Austria |
Semiestructurados: Cuando los datos han sido estructurados con algún grado de flexibilidad.
Ejemplo XML
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Ejemplo JSON
{"name":"John", "age":30, "car":null}
No-estructurados: Cuando los datos son expresados en lenguaje natural, sin una estructura específica.
John tiene treinta años, le gusta el helado de chocolate suizo y está feliz porque el colo gano
Items de datos “crudos” (raw). Considerados pequeñas unidades de datos. Son usados para “fabricar” información y componentes de items de datos. Estos datos suelen ser almacenados por largos periodos de tiempo.
Componentes de ítems de datos. Es información semi-procesada. Se almacenan temporalmente mientras se fabrica la información. Se generan cada vez que se quiere producir información.
Producto de Información. Son el resultado de proceso de fabricación desarrollado sobre los datos. Los mismos datos crudos y componen de items de datos pueden ser usados en la fabricación de distintos de productos de información.