Los metadatos proporcionan información adicional sobre los datos. Existen diversas convenciones para estandarizar metadatos. La presente guía fue inspirada en NetCDF Climate and Forecast Metadata Conventions (CF Conventions) y Frictionless Data Specifications.

Los conceptos atributo (CF Conventions) y propiedad (Frictionless Data) son sinónimos en esta guía y se refieren al nombre de un metadato (ver tabla de sinónimos abajo). Una descripción más detallada de los metadatos se puede encontrar en el apéndice A: Atributos de la convención CF y en las diferenctes especificaciones de Frictionless Data.

Aquí hay una tabla de sinónimos de conceptos definidos por CF Convetions, Frictionless Data y este protocolo.

CF Convetions Frictionless Data Protocolo GECI
Attribute Property Nombre del metadato
Root group (/) Tabular Data Package Paquete
Group Resource Tabla
Variable Field Columna

Cada metadato describe un elemento en alguno de los tres niveles de un conjunto de datos:

  1. Columna. Es el elemento fundamental de un conjunto de datos. Es el contenedor directo de cada dato. Se refiere a una columna de una tabla o a un escalar. También podría referirse a un vector o una matriz. Equivale al concepto de campo (field) en los paquetes de datos tabulados
  2. Tabla. Es un conjunto de columnas. Puede referirse a una tabla (data frame) en el sentido de tidy data. También podría referirse a una estructura de MATLAB o un diccionario de Python. En NetCDF se le llaman Grupos mientras que en la especificación de Frictionless Data se le conoce como Recurso
  3. Paquete. Es un conjunto de tablas y constituye el nivel más alto de un conjunto de datos. Los metadatos que describen un paquete se encuentran en la raíz del archivo descriptor de un Data Package o son los metadatos globales del gupo raíz (root o /) de un archivo NetCDF.

La tabla siguiente muestra la lista de matadatos reconocidos por este protocolo.

Metadato Uso Descripción
comment Paquete Miscellaneous information about the data or methods used to produce it
contributors Paquete The people or organizations who contributed to this Data Package
description Paquete A markdown formatted description of the package
history Paquete List of the applications that have modified the original data
homepage Paquete A URL for the home on the web that is related to this data package
institution Paquete Specifies where the original data was produced
name Paquete A short url-usable (and preferably human-readable) name of the package
profile Paquete A string identifying the profile of this descriptor as per the profiles specification
references Paquete Published or web-based references that describe the data or methods used to produce it
sources Paquete The raw sources for this data package
title Paquete A succinct description of what is in the dataset (written in English)
titulo Paquete Traducción al español de title
description Tabla A description of the resource
id Tabla Igual que name pero sin “.”, “-“ ni “_”
name Tabla The name is a simple name or identifier to be used for this resource
path o data Tabla Property describing the location of the data associated to the resource
profile Tabla A string identifying the profile of this descriptor as per the profiles specification
source Tabla The method of production of the original data
title Tabla A succinct description of what is in the dataset (written in English)
titulo Tabla Traducción al español de title
axis Columna Identifies latitude, longitude, vertical, or time axes
description Columna A description for this field
long_name Columna A descriptive name that indicates a variable’s content (written in English). This name is not standardized
name Columna This property should correspond to the name of field/column in the data file
nombre_largo Columna Traducción al espanol de long_name
standard_name Columna A standard name that references a description of a variable’s content in the standard name table
units Columna Units of a variable’s content