Metadatos para analistas de datos
Los metadatos proporcionan información adicional sobre los datos. Existen diversas convenciones para estandarizar metadatos. La presente guía fue inspirada en NetCDF Climate and Forecast Metadata Conventions (CF Conventions) y Frictionless Data Specifications.
Los conceptos atributo (CF Conventions) y propiedad (Frictionless Data) son sinónimos en esta guía y se refieren al nombre de un metadato (ver tabla de sinónimos abajo). Una descripción más detallada de los metadatos se puede encontrar en el apéndice A: Atributos de la convención CF y en las diferenctes especificaciones de Frictionless Data.
Aquí hay una tabla de sinónimos de conceptos definidos por CF Convetions, Frictionless Data y este protocolo.
CF Convetions | Frictionless Data | Protocolo GECI |
---|---|---|
Attribute | Property | Nombre del metadato |
Root group (/) | Tabular Data Package | Paquete |
Group | Resource | Tabla |
Variable | Field | Columna |
Cada metadato describe un elemento en alguno de los tres niveles de un conjunto de datos:
- Columna. Es el elemento fundamental de un conjunto de datos. Es el contenedor directo de cada dato. Se refiere a una columna de una tabla o a un escalar. También podría referirse a un vector o una matriz. Equivale al concepto de campo (field) en los paquetes de datos tabulados
- Tabla. Es un conjunto de columnas. Puede referirse a una tabla (data frame) en el sentido de tidy data. También podría referirse a una estructura de MATLAB o un diccionario de Python. En NetCDF se le llaman Grupos mientras que en la especificación de Frictionless Data se le conoce como Recurso
- Paquete. Es un conjunto de tablas y constituye el nivel más alto de un conjunto de datos. Los metadatos que describen un paquete se encuentran en la raíz del archivo descriptor de un Data Package o son los metadatos globales del gupo raíz (root o
/
) de un archivo NetCDF.
La tabla siguiente muestra la lista de matadatos reconocidos por este protocolo.