Le Digital Object Identifier, le système DOI
Notice Bibliographique :
LUPOVICI Catherine. Le Digital Object Identifier, le système DOI [en ligne]. Bulletin des Bibliothèques de France, 1998, T43, n°3.
Disponible sur : <http://bbf.enssib.fr/sdx/BBF/pdf/bbf-1998-3/10-lupovici.pdf > (consulté le 19 décembre 2005)
Auteur : Catherine Lupovici est directrice du département de la bibliothèque numérique, Direction des services et des réseaux, Bibliothèque nationale de France.
Sujet : Les systèmes d’identification des ressources sur le réseau Internet.
Mots clés : DOI, PII, SICI, URL, URN, PURL, identifiant.
Définitions :
DOI (Digital Object Identifier): répertoire international permettant d’identifier les publications électroniques
URL (Uniform Resource Locator) : identifie la localisation d’une ressource Internet
URN (Uniform Resource Names) : Il donne une syntaxe de chaîne de caractères utilisable pour identifier une ressource (un document, une image, un enregistrement sonore, etc.) globalement, durant toute son existence, indépendamment de sa localisation ou de son accessibilité par Internet. (source wikipedia)
PURL (Permanent URL) : est basé sur l’existence d’un serveur intermédiaire entre un client (celui qui cherche) et le serveur qui détient la localisation de la ressource.
Résumé informatif :
Conçu et développé par le CNRI (Corporation for National Research Initiative), le système DOI (Digital Object Identifier) est un répertoire international permettant d’identifier les publications électroniques.
L’identifiant est constitué d’un ensemble numérique ou alphanumérique. Il désigne une unité d’information qui peut porter sur une entité physique, une entité logique ou une entité logique documentaire.
Les identifiants d’unité physique sont utilisés tout le long de la chaîne de production et de distribution par l’ensemble des secteurs informationnels. Les plus anciens sont l’ISBN (International Standard book) pour les monographies et l’ISSN (international Standard Book) pour les publications en série. Ils ont été déterminés à partir des types de documents, des besoins des usagers et de leur environnement.
Les identifiants d’unités logiques regroupent tous types de composants à l’intérieur de l’unité physique (par exemple un article ou un chapitre spécifique). Les identifiants utilisés sont le PII (Publisher Item Identifier) et le SICI (Serial Item and Contribution Identifier). Le Publisher Item Identifier, issue d’un groupe d’éditeur scientifique, est employé pour le traitement et l’échange de documents électroniques. Le Serial Item and Contribution Identifier provient du SISAC (Serials Industry Standardisation Advisory Committee), il peut prendre trois formes selon qu’il identifie un fascicule, une contribution dans un fascicule ou une contribution dans un autre composant. Il est utilisé pour la gestion des périodiques ou des articles et lors des échanges de données électroniques (EDI)
L’identification des documents est devenue un enjeu important sur le réseau Internet. L’URL (Uniform Resource Locator) semblait être un bon outil d’identification cependant cette information n’est pas pérenne car il peut être modifier, supprimer et il n’est pas unique. Afin de résoudre ce problème, la communauté Internet propose la normalisation de l’Uniform Resource Name (URN) et de l’Uniform Resource Characteristics (URC) pour une identification unique des informations et pour localiser les ressources. Enfin les éditeurs ont composé le DOI qui est intégré dans les études de normalisation Internet de l’URN. L’URN (Uniform Resource Names) est destiné à identifier une ressource globale ou une unité élémentaire d’information. Il a été conçu dans le but d’identifier toute publication électronique à n’importe quel niveau de granularité et d’être enregistrable dans un répertoire. En attendant l’adoption définitive de l’URN, le PURL (Permanent URL) est basé sur la redirection automatique du protocole HTTP c’est à dire de rediriger l’utilisateur vers la page demandée si la localisation de l’information (l’URL) a été modifiée. Il est nécessaire que le serveur hôte du document effectue sa mise à jour auprès de l’organisme de résolution.
Le système DOI permet d’étendre les systèmes d’identification pour l’accès à des portions d’informations numériques selon plusieurs degrés de granularités. Il est composé de trois éléments : un identifiant pour les objets, un répertoire offrant la résolution des identifiants, une base de données d’informations sur les objets. L’identifiant DOI est constitué d’un préfixe identifiant l’éditeur défini au niveau international, séparé par un slash d’un suffixe identifiant l’objet chez l’éditeur. Le répertoire est un système de résolution des identifiants. Il permet la redirection automatique des utilisateurs vers le document recherché. Il conserve le DOI et met à jour l’URL si elle change. La base de données est constituée des documents enregistrés par chaque éditeur. Elle contient soit les documents eux-mêmes soit communique sur la manière dont l’utilisateur peut les trouver. Le DOI est dirigé par une fondation internationale basée à Washington et à Genève. Cette fondation gère les attributions d’un préfixe et l’engagement des éditeurs à mettre à jour leurs URL.
Commentaires
Les systèmes d’identifications des ressources analogiques ont été mis en place afin décrire les documents de façon univoque pour les différents secteurs informationnels. Avec le développement des nouvelles technologies la reconnaissance des informations électroniques est devenue un enjeu important.
Cet article de Catherine Lupovici m’a paru très intéressant car il explique clairement les possibilités et les limites de l’ensemble des systèmes d’identification des ressources web. Le système DOI (Digital Object Identifier) paraît être le mieux répondre à ce problème. Pour en savoir plus, il existe un site Internet réservé au DOI : www.doi.org