COLLECTION NUMERIQUE
  Page d'accueil
    Fiches de lecture
    Grilles d'analyse
    Bibliographie classée et commentée
  A propos
  Archives
  Contacts

   Anaïs
   Anne
   Anne-Solène
   Antoine
   Dorothée
   Elisabeth
   Evelyne
   Florent
   Fabien
   Gaëlle
   Jessica
   Joël
   Julie
   Sophie

http://20six.fr/cecile13

Hébergé par 20six.fr



Fiches de lecture

Structuration et description automatique des documents électroniques : le projet européen METAe, du

Notice bibliographique :
FREYRE Elisabeth. Structuration et description automatique des documents électroniques : le projet européen METAe, du moteur d’exécution aux outils d’édition. [en ligne] Culture et recherche, n° 100, janvier - février - mars 2004.
Disponible sur <http://www.culture.gouv.fr/culture/editions/r-cr/cr100.pdf> (consulté le 2 décembre 2005)

Auteur :FREYRE Elisabeth est de chargée de mission Europe, elle est membre de la Bibliothèque nationale de France, et elle fait partie de la délégation aux relations internationales

Sujet : Le projet METAe, outil de structuration et description automatique des données électroniques.

 

Mot clé : Projet METAe, automatisation, OCR, reconnaissance de caractères, système intelligent.

 

Définitions

OCR : Optical Character Recognition. Reconnaissance optique de caractères. Procédé permettant de récupérer les symboles de textes. « Optique » serait avantageusement remplacé par « Automatique », car en général l'OCR concerne le traitement d'un document numérisé.

 

Résumé informatif

Suite à l’essor des bibliothèques numériques, quatorze bibliothèques du monde ont collaboré afin de mettre au point un outil favorisant la gestion des documents numériques. Lancé en 2000, le projet METAe développe de façon automatique, les fonctionnalités permettant la reconnaissance des caractères, la description des métadonnées ou la conversion en format d’échange XML. Les documents utilisés étaient principalement des livres et des périodiques imprimés au XIX et plus précisément comportant la police « Fraktur ».

Après chaque processus de numérisation, le moteur METAe reconstitue les métadonnées du document. Ces données reprennent les informations techniques, les droits d’accès, la nature du contenu, ainsi que la structure des documents. Ces renseignements sont stockés ensuite, dans une base de données interne.

Le moteur METAe a été conçu pour fonctionner sur une plateforme Windows et accessible aussi bien à partir d’une architecture client/serveur et d’une architecture poste à poste. Le projet METAe est basé sur un système intelligent qui reconnaît la grammaire des livres et des périodiques qui peut s’étendre à d’autres types de documents.

Le moteur METAe est de plus en plus utilisé dans diverses bibliothèques nationales de différents pays. En France, le projet METAe fait partir des outils pouvant être utilisés par Gallica.

En conclusion, le moteur METAe facilite la gestion des documents numérisés en terme d’ergonomie, de coût, d’automatisation, de reconnaissance et de conservation.

Commentaire :

Projet rassemblant les plus grandes bibliothèques de monde, METAe permet de structurer une normalisation commune au traitement des documents numériques. Cet outil est basé sur une description automatique des metadonnées.

Afin de s’assurer de leurs efficacités, les logiciels issus de ce projet sont analysés et évalués. L’équipe de travail du Systèmes d’Information et Interfaces (SII) (conseil scientifique de l’ENSSIB), engagé par la Bibliothèque Nationale de France participe à cette étude.

La description et l’indexation est devenu un enjeu important dans le secteur de la documentation numérique. Les métadonnées constituent un système d’identification comme le Dublin core.

Pour des informations complémentaires sur le projet METAe, il est possible d’accéder au site Internet : http://meta-e.aib.uni-linz.ac.at/

3.12.05 14:57


[première page] [page suivante]  [page précédente]




L'auteur du blog est responsable de tous ses contenus. Ouvrez votre blog sur 20six.fr ou myblog.de