A lire sur: http://www.atelier.net/trends/articles/de-outils-numerisation-de-masse
Une recherche financée par l’UE a développé un
système pour accélérer la numérisation, afin de faciliter la diffusion
des documents numérisés, et ainsi les rendre plus accessible tout en
s'assurant de leur qualité.
Pour améliorer l'indexation des documents
numérisés en masse à destination des bibliothèques nationales, des
musées, des archives, des chercheurs européens ont mis au point des
outils de traitement. Ces bibliothèques ont en effet l’obligation de
rendre tout ce qui existe disponibles par biais électronique puisque "de
nos jours, ce qui n'est pas numérique n'est pas visible" déclare Hildelies Balk, chef de projets européens à la Koninklijke Bibliotheek,
au Pays-Bas. Autrefois le processus de numérisation consistait
simplement en la numérisation d’un document en image. Aujourd'hui,
l'image est numérisée puis traitée grâce à la "reconnaissance optique de
caractères" (ROC) afin d’extraire le texte dans un format numérique.
Une fois le texte numérisé, l'ensemble du document est disponible pour
l'indexation et accessible depuis les moteurs de recherche. Toutefois
convertir des mots imprimés en un texte lisible depuis une machine n’est
pas suffisant. "La numérisation de masse génère des ressources
immenses pour un avenir proche, nous verrons une prolifération
d'applications qui exploiteront et monétiseront ces ressources. Mais
nous devons d’abord être convaincus que la version numérique d'un texte
historique est une copie conforme à l'original" note Hildelies Balk.
Aucun commentaire:
Enregistrer un commentaire