La numérisation en mode image des fichiers de fonds anciens
par Magali VENE (Paris, Bibliothèque nationale de France, Réserve des livres rares ; magali.vene@bnf.fr).




Les projets de numérisation en mode image de fichiers anciens (que certains établissements ont appelés IPAC : Image Public Access Catalogues), n’ont pas l’ambition scientifique des grandes entreprises de recatalogage "livre en main" (comme le projet Early printed books d'Oxford) ou même de simple saisie rétrospective de notices catalographiques (comme le Catalogue Collectif de France). Ils n'ont pas non plus la même souplesse d'utilisation.

Simple visualisation sur écran des fiches papier, cette technique rapide et peu coûteuse, qui pour le moment a été surtout utilisée par les bibliothèques allemandes, est cependant sans doute amenée à se développer. En utilisant les possibilités d’Internet, elle offrira un accès plus facile à des collections méconnues.

Numériser ses anciens fichiers est en tout cas pour une bibliothèque un excellent préalable à un véritable travail de rétroconversion de ses catalogues : les sociétés prestataires de service peuvent en effet travailler directement sur les cédéroms sans que soit nécessaire un lourd travail de photocopies et d’envois des fiches.
Et pendant la période de saisie et de correction (qui peut être très longue on le sait !), les images numérisées sont consultables simultanément par plusieurs utilisateurs en intranet et en internet… grand progrès alors que les fiches originales, le plus souvent uniques, tombent parfois en ruines ou ne sont pas, pour diverses raisons, directement consultables par les lecteurs !

Enfin, soulignons que la numérisation en mode image préserve l’intégralité des informations contenues dans les anciens catalogues, souvent rédigés au 19e s., où l’ordre de classement, les entrées secondaires et matière et les diverses marques portées sur les fiches elles-mêmes, avaient une signification qui disparaît au crible des normes actuelles de catalogage.

Exemples

1) Vienne, Österreichische NationalBibliothek (http://www.onb.ac.at)

A la Bibliothèque Nationale d’Autriche, les fiches manuscrites ont été remplacées dans les années 1950 par des fiches dactylographiées assez sommaires. A partir de juin 1997 et en moins d’un an, plus de six millions de ces fiches ont été numérisées en mode image N&B, dans une définition moyenne mais suffisante pour la lecture et permettant un chargement rapide (chacune ne « pèse » en effet que 4 à 5 Ko). Ces images ont été chargées sur le site Web de la bibliothèque et un logiciel de recherche appelé KatZoom a été développé.

On peut accéder ainsi à 7 catalogues :

1) par auteurs 1501-1929 (1.113.873 fiches)
2) par auteurs 1930-1988/91 (1.423.731 fiches)
3) par matières 1501-1929 (1.355.430 fiches)
4) par matières 1930-1988/91 (1.689.719 fiches)
5) par lieu d’impression 1501-1800 (101.475 fiches)
6) par genres littéraires 1501-1929 (180.427 fiches)
7) catalogue des ms. autographes (138.658 fiches)

Aucun élément textuel porté sur la fiche n’a été saisi. Le catalogue a simplement été divisé en autant de tranches que de lettres de l’alphabet. On choisit d’abord l’initiale voulue, ensuite KatZoom fonctionne, comme son nom l’indique, sur le principe de zooms successifs à l’intérieur de tranches de fiches de plus en plus réduites (division en quatre groupes à chaque fois). On voit le début de la première fiche de chaque tranche et la dernière de la dernière tranche. A partir de chacun de ces extraits, une fonction liste permet aussi de faire défiler vers le haut ou vers le bas huit fiches entières. Après plusieurs zooms on arrive aussi à faire défiler huit fiches en texte intégral.

Système efficace mais un peu lourd car rien n’a été saisi (pas même un groupe initial de trois lettres par exemple, ce qui aurait déjà considérablement raccourci la recherche).

2) Florence, Biblioteca Nazionale Centrale (http://www.bncf.firenze.sbn.it/, rubrique " Progetti ")

Le projet de numérisation des 225.000 fiches du Catalogue Palatino, qui décrit plusieurs collections constituant le cœur des collections patrimoniales de la bibliothèque nationale de Florence, se place très clairement dans la perspective d’une rétroconversion prochaine. Ces fiches ont été dactylographiées dans les années 1950 et, après l’échec des tentatives de saisie par RCO (Reconnaissance Optique des Caractères), on a décidé de les numériser en mode image et en couleurs (car le papier a été taché lors des inondations de Florence de 1966). Les fiches sont donc plus lourdes malgré leur fort taux de compression (12-13 Ko) et se chargent plus lentement. Elles sont parfois difficiles à lire car le texte dactylographié est très petit par rapport à la fiche. Une description comportant la vedette, le début du titre et la date de publication a été saisie, mais pour l’instant aucune recherche n’est possible sur ces critères. On peut seulement faire défiler des imagettes avec leur description en regard et cliquer sur la fiche voulue. Actuellement, seulement 6000 fiches couvrant à peu près la lettre A ont été numérisées.

3) Paris, BIU de Médecine (http://www.bium.univ-paris5.fr, rubrique " Fonds ancien ")

La numérisation du fichier ancien de la BIUM (des origines à 1952) était une nécessité pour l’établissement, tant au niveau de la conservation que du service public. Ce fichier, en un seul exemplaire, est en mauvais état, et surtout n’est pas tringlé, ce qui interdit sa consultation directe par les lecteurs. Les 337.000 fiches sont manuscrites, avec plusieurs écritures dont certaines sont difficiles à déchiffrer. Le papier est sali et on trouve quelques fiches roses ou bleues foncées. C’est pourquoi une numérisation en 256 niveaux de gris s’imposait.

L’opération a été réalisée sur site en moins de 6 mois par la Société Jouve. Les documents ont été traités sur un scanner à entraînement et numérisés un à un en 200 dpi et 256 niveaux de gris. Les images obtenues ont été stockées au format jpeg sur des cédéroms destinés à la conservation.

Après la phase de numérisation, la société Jouve a mis 4 mois à saisir à partir des cédéroms les renseignements bibliographiques selon des modalités convenues auparavant avec elle, soit 25 caractères se décomposant en trois champs tabulés :

1) Nom de l’auteur
2) Premier prénom de l’auteur (suivi éventuellement
    des initiales des autres prénoms)
3) Date de publication de l’ouvrage

Les images et les données textuelles (ces dernières intégrées au logiciel File Maker Pro 4.0.) ont été chargées sur le serveur de la BIUM. La consultation de l’image compressée (poids moyen : 11-19 Ko) et du texte en parallèle s’effectue sur le site Web de la bibliothèque, le lien informatique se faisant sur le numéro de chaque fiche (donné automatiquement lors du scannage comme nom de chacun des fichiers images et repris en tête de chaque saisie textuelle).

4) Berlin, Zentral- und Landesbibliothek,  http://ipac.zlb.de

5) Munich, Bayerische Staatsbibliothek,  http://www.bsb.badw-muenchen.de/ : fiches numérisées pour la tranche 1953-1981.

6) Heidelberg, Bibliothèque de l'Université,  http://srv19.ub.uni-heidelberg.de : fiches numérisées pour la tranche 1936-1985.

7) Barcelone, Bibliothèque de Catalogne, http://www.gencat.es/bc/colleccions/colleccions.html : plusieurs tranches des catalogue 1914-1990.

8) Prague, Bibliothèque nationale (Národní knihovna Ceské republiky), http://www.nkp.cz/
Les catalogues anciens sont disponibles sur internet sous forme de fiches dactylographiées numérisées (
http://katif.nkp.cz/). Classement auteurs et anonymes. Avant la consultation, il faut installer un logiciel permettant de visionner des images au format " .tiff ", disponible sur la page d'accueil du catalogue.

9) Princeton (NJ), University Library Supplementary Catalog
Fiches numérisées pour les collections entrées avant 1980 (http://imagecat1.princeton.edu/ECC/)

logoretour.jpg (2946 octets)
à la liste des
communications