Rechercher

/ languages

Choisir langue
 

Internet Grand Public

La France archive le Web

Jean-Noël Jeanneney, le président de Bibliothèque national de France 

		(Photo : AFP)
Jean-Noël Jeanneney, le président de Bibliothèque national de France
(Photo : AFP)
La mémorisation de l’Internet en est à ses débuts. La France fait partie des pays les plus engagés dans cette course contre le temps. Archiver le Web français, tel est le travail titanesque que doit réaliser la Bibliothèque nationale de France (BNF). L'Institution devrait assurer l'essentiel de cette mission hormis les sites administratifs et gouvernementaux qui relèveront des Archives nationales, tandis que les sites audiovisuels seront confiés à l'Institut national de l'audiovisuel (INA). Le moment est venu de faire le point sur ce vaste chantier de la BNF alors que la prochaine loi sur «le droit d'auteur et les droits voisins dans la société d'information», présentée à l'automne prochain au Parlement, prévoit d'appliquer le dépôt légal (*) aux contenus diffusés sur la Toile. Le président de la BNF, Jean-Noël Jeanneney revient sur ce chantier, entamé en 1999 avec l'archivage thématique des sites électoraux en France.

RFI : Concrètement, comment va s'organiser la démarche de la BNF ?

Jean-Noël Jeanneney : Depuis François 1er, la BNF a le dépôt légal des imprimés, puis progressivement elle a eu celui des estampes, des partitions musicales et des photographies, etc. Depuis 1975, la BNF reçoit les vidéogrammes et depuis 1992, les produits électroniques. Maintenant il nous faut assurer la mémoire de la Toile. En termes très concrets, le projet de loi qui devrait être adopté à l'automne permettra de préciser ce que sont les droits d'auteur et les droits voisins dans la société de l'information et organisera le devoir du dépôt légal des contenus diffusés sur Internet dans nos instances. On est là dans la continuité d'une mission pluriséculaire.

Il n'est pas question de tout garder. Concrètement, il va falloir établir un système de sélection qui va s'organiser dans trois directions. Premier mode de capture : à intervalles réguliers -par exemple, tous les six mois- on va faire une sorte de photographie de l'ensemble du paysage de la Toile. Deuxième mode : par dépôt volontaire des éditeurs de sites. Nous allons signer des conventions avec des producteurs de sites qui souhaitent pérenniser ce qu'ils font. Le troisième procédé consiste à aller aspirer des sites sur des thèmes particulièrement importants et propres à intéresser les générations futures. Nous avons conduit notamment des expériences à partir des sites électoraux lors de la présidentielle, des législatives, des régionales et des européennes, entre 2002 et 2004. Trois procédés qui convergent tous au service de la volonté de conserver le plus de choses possible.

La BNF face au « défi » de conserver la mémoire d'Internet. 

		(Photo : BNF)
La BNF face au « défi » de conserver la mémoire d'Internet.
(Photo : BNF)

RFI : Quels sont les sites concernés ? Uniquement les sites enregistrés dans le domaine national «.fr » ? Qu'en est-il des sites «.com», «.org», «.edu» ou «.net» et des sites personnels ?

Jean-Noël Jeanneney : Les sites «.fr » sont extrêmement nombreux, près de 250 000 sites publics uniquement pour le domaine «.fr » et peut être 100 000 millions de pages qui sont en croissance exponentielle. Il va s'agir principalement du «.fr » mais nous nous interdisons pas d'aller chercher des sites«.com», «.org» ou des sites personnels dont les contenus peuvent être intéressants. D'autre part, il y a une répartition des responsabilités, avec d'un côté, les sites qui sont intérieurs à l'administration que les Archives nationales ont vocation à garder, et de l'autre, les sites liés à la télévision et à la radio sous la responsabilité de l'Institut national de l'audiovisuel.

RFI : Qui aura accès à ce savoir numérique ? Ces archives seront-elles accessibles à tous gratuitement ?

Jean-Noël Jeanneney : Nous avons l'habitude de distinguer deux types d'accès. Le premier est réservé aux chercheurs qui sont habilités à venir chez nous comme bibliothèque de dernier recours, sur le site François-Mitterrand. Et puis, nous avons Gallica, notre bibliothèque virtuelle accessible à tous. C'est le même principe qui va s'appliquer à ce savoir numérique. Il y aura des choses accessibles à tout le monde librement et d'autres qui seront sous droit matériel ou moral réservé aux chercheurs habilités.

RFI : Les documents sur papier se conservent des centaines d'années. Mais l'utilisation future des informations numériques pose toujours problème. L'information sur les sites web est entièrement codée via des logiciels de plus en plus performants, puis stockée sur des bases de données dont l'obsolescence est de plus en plus vite annoncée. Cette évolution pose la question cruciale de la disponibilité future de ces informations numériques. Comment garantir que les informations numériques seront encore utilisables dans vingt ans ou cent ans ?

Jean-Noël Jeanneney : Il y a deux défis. L'un immédiat : comment aller chercher tout ce savoir numérique le mieux possible. Le second : comment éviter que le temps qui passe dégrade ce que nous avons recueilli. Nous sommes habitués déjà à ce genre de défis. Par exemple, pour conserver les papiers acidifiés des XIXe et XXe siècles ou les journaux qui jaunissent, on a pris la solution des microformes, maintenant on va les numériser. De la même façon, pour la Toile, l'évolution des technologies nous donnera l'obligation d'assurer des formules qui permettront de les transposer au bout d'un certain temps si les supports sont voués à se dégrader.

RFI : Le problème de l'archivage numérique dépasse aujourd'hui le cadre strictement français. La BNF va-t-elle s'inspirer des expérimentations menées chez nos voisins européens ?

 Jean-Noël Jeanneney : Nous travaillons de manière internationale. Dans cette perspective, la France a suscité un Consortium international pour la préservation d'Internet (CIPI) d'une dizaine de bibliothèques de niveau équivalent autour de la planète. Ce Consortium, où la France a un rôle de pilote, a été créé pour permettre d'échanger des informations, de partager des savoir-faire et de mutualiser des expériences sur les techniques et procédés pour préserver des contenus sur Internet. Par exemple, la cartographie deux fois par an du paysage de la Toile est la solution choisie par les Suédois. En revanche, l'aspiration des sites thématiques, c'est la démarche de la Bibliothèque américaine du Congrès qui aspire les événements marquants pour les Etats-Unis tels qu'ils peuvent être vus de l'extérieur. Par exemple, les 30 000 sites dédiés aux attentats du 11 septembre.


par Myriam  Berber

Article publié le 21/07/2004 Dernière mise à jour le 21/07/2004 à 18:19 TU

(*) Le dépôt légal est l’obligation fixée par la loi (créée en 1537 par François 1er) faite à chaque éditeur, producteur, imprimeur de déposer des exemplaires de ses documents  connaissant une diffusion publique auprès des organismes d’Etat (BNF, INA, CNC), dans un souci de conservation et de contrôle.