Les données se présentent sous différentes natures, types et supports selon les projets de recherche et les étapes du projet (création, exploitation, analyse, traitement). Les fichiers numériques peuvent aussi prendre divers formats. Les métadonnées, quant à elles, sont tout simplement des données qui décrivent des données. Il est important d'identifier les types et formats des données afin de bien les gérer tout au long du processus de la recherche et après celui-ci.
Les données peuvent être de différentes nature, par exemple: qualitatives, quantitatives, statistiques, brutes, dérivées, formatées, nettoyées, primaires, secondaires, traitées, etc.
Les types les plus courants sont :
Source : DORANum
Un format de fichier est un moyen d'encoder des informations dans un fichier informatique afin qu'il puisse être reconnu par une application et qu'il soit possible d'y accéder. Il est indiqué par l'extension du nom de fichier (généralement un point suivi de trois lettres telles que .txt, .doc, .jpg, .mov) et permet à l'ordinateur de reconnaître ce qu'un document contient, par exemple du texte ou une image.
Le format du fichier influence l'accessibilité au contenu du fichier et le stockage à long terme de ce contenu, car les logiciels et la technologie de stockage des données évoluent rapidement et les fichiers peuvent facilement devenir obsolètes ou difficiles d'accès (source : The University of British Colombia).
Il est donc essentiel de réfléchir au format initial des données et aux formats utilisés pour la conservation, car il est possible de convertir les fichiers d’un format vers un autre, mais il peut en résulter des pertes d’informations.
Il existe deux familles de format de fichiers : le format ouvert et le format fermé ou propriétaire.
Exemples de formats ouverts :
Liens complémentaires