Bilan de l’opération? «J’en suis complètement ravie». Pas de nuance chez Elena Balzardi, vice-directrice de la Bibliothèque nationale suisse (BN), pour qui la démarche représente «un modèle de partenariat». Dès ce jour, la totalité des archives des trois ancêtres du Temps est disponible, gratuitement, sur la Toile. Celles du Journal de Genève avaient été dévoilées en décembre 2008. Désormais, la Gazette de Lausanne, ainsi que Le Nouveau Quotidien, complètent cette offre, au terme «d’une procédure unique, pragmatique, non bureaucratique», vante encore Elena Balzardi. Un projet à un million de francs, financé par la BN ainsi que les bibliothèques cantonales de Genève et Lausanne, avec l’appui de la Fondation de Famille Sandoz, Mirabaud & Cie Banquiers Privés et PubliGroupe.

Un défi technologique

Pendant plus de quatre ans, l’enjeu de la mémoire a rencontré le défi financier technologique. L’état, parfois attristant, de certaines pages dans les trois collections utilisées, des bibliothèques cantonales, de la BN et du Temps. La difficulté qu’a représentée le scannage, d’autant que les formats de ces publications ont varié. Les exigences informatiques, pour permettre une navigation à plusieurs niveaux – articles, pages entières, illustrations – ainsi que la recherche en plein texte. «La détermination et la recherche de solutions innovantes ont eu raison de la complexité. C’est peut-être la leçon à retenir de cette aventure», indique Virginie Fortun, chargée du développement stratégique au Temps, qui a dirigé le projet.

La reconnaissance de caractères, qui permet l’indexation, a reposé sur le logiciel de la société américaine Olive Software, déjà utilisé par le Financial Times, le Scotsman ou les titres du groupe Time. Le scannage a d’abord été pris en charge par la zurichoise Alos, pour le corpus du Journal de Genève. A la suite d’un second appel d’offres, c’est la compagnie vaudoise Assy 4Digitalbooks qui a repris le flambeau. Le format choisi, le XML, est suffisamment «neutre et standardisé» pour en garantir la conservation, assure Virginie Fortun. A chaque fois, les pages ont été saisies sous trois formes, texte, image et en PDF.

Un million de pages

La pérennité de ces données stockées revêt une haute importance, car la masse d’informations est considérable, tandis que les standards informatiques varient. Les trésors du Journal de Genève, de la Gazette de Lausanne et du Nouveau Quotidien représentent un peu plus d’un million de pages scannées; 2,7 millions de fichiers, pour près de quatre millions d’articles. Un poids total de 22 To, soit 22 000 Go.

L’annonce de cette mise à disposition intégrale des trois journaux intervient dans un contexte toujours crispé, s’agissant de la presse sur Internet. A ce stade, le gros effort de numérisation des journaux relève pour l’essentiel de démarches menées soit par les éditeurs, soit par des instances publiques. En France par exemple, la Bibliothèque nationale (BNF) a entamé dès 2005 un projet au long cours, en numérisant plusieurs titres du patrimoine hexagonal – dont Le Temps, ancêtre du Monde, de 1861 à 1939. Les pages sont accessibles sur Gallica, la bibliothèque en ligne de la BNF.

Google bouscule

A l’instar du livre, Google a bousculé le paysage en septembre 2008 avec son système News Archives, au contenu majoritairement anglo-saxon, mais qui permet une amusante navigation par décennies. L’outil reste toutefois relativement complexe à utiliser. Et à ce jour, le géant de l’informatique n’a pas prévu de numériser des collections de périodiques, à l’image de ce qu’il a fait avec les fonds des institutions publiques, telles que la Bibliothèque cantonale et universitaire de Lausanne. Son moteur de recherche se borne à chercher dans les sites des journaux.

La mise à disposition, ou non, des archives de chaque journal dépend des choix des éditeurs, ce qui explique la grande variété de modalités d’accès: gratuit, en partie ou totalement payant… voire inexistant sur la Toile. La partie qui se joue est plus discrète que celle de l’accès aux articles du jour par le biais d’outils tels que le Kindle ou le futur iPad, entre autres lecteurs numériques, mais elle n’a rien d’anecdotique pour autant.

Importance patrimoniale

Elena Balzardi rappelle que «les journaux sont extrêmement importants pour le patrimoine, et l’étude de l’histoire d’un pays. La mise à disposition d’archives est précieuse, on ouvre l’accès à des sources considérables.» Pour les chercheurs en premier lieu, mais pour un grand public qui, peu à peu, prendra le pli numérique dans sa consommation d’articles, y compris d’archives. D’autant que la facilité d’usage est sans commune mesure avec le fait d’écumer les rayons d’une bibliothèque, en ouvrant d’énormes collections. Pis, du fait de la fragilité du support, la consultation des anciens numéros de périodiques est souvent limitée.

«L’Express/L’Impar» aussi

Depuis l’automne 2009, la société éditrice de L’Express et L’Impartial, à Neuchâtel, a commencé la numérisation de ses collections, couvrant à ce jour la période 2000 à 2005. Le travail se fera en remontant les décennies, avec l’objectif d’une mise en ligne complète en 2012. La technique utilisée est celle du Temps, et là aussi, en partenariat avec les bibliothèques locales ainsi que la BN. Virginie Fortun se félicite que «Le Temps ait ouvert la voie en Suisse romande, donné envie à d’autres éditeurs d’y aller, et inspiré la branche en contribuant à un code de bonnes pratiques en la matière rédigé par Presse Suisse». A la BN, on dit avoir des contacts avec des éditeurs alémaniques.