Search-Day 2O23

Culture et patrimoine sont à la pointe du web sémantique ! par Pierre Col

Les institutions culturelles et le web


Jacqueline Sala


Le Web s'est peu à peu imposé comme un vecteur de diffusion incontournable du patrimoine culturel. Les initiatives de numérisation et de mise à disposition via un site Web de la richesse du patrimoine ont permis de prolonger sur Internet les actions des institutions de ce secteur (musées, archives, bibliothèques…) et de renforcer la diffusion de la Culture au plus grand nombre dans un nouvel espace sans frontières.



La logique institutionnelle a-t-elle encore un sens ?

Pour autant il est permis de se demander si, dans cet espace où la navigation se fait librement, la logique institutionnelle a encore un sens. En effet, la consultation des informations culturelles sur le Web ne part pas d'une action délibérée qui implique la visite d’un site précis, mais d'opportunités en rapport avec des recherches personnelles ou liées à des études ou en relation avec un intérêt ponctuel ou régulier. Ce mode de « consommation » de la Culture et de son patrimoine nécessite de provoquer la sérendipité, c'est-à-dire de favoriser le fait de trouver au hasard une information intéressante.

Or de plus en plus l’internaute privilégie certaines grandes portes d'entrée sur le web que sont les moteurs de recherche comme Google, Bing ou Yahoo !, les réseaux sociaux Facebook, Twitter etc ou encore Wikipedia. C’est en partant de ces grands sites qu’il va pouvoir rebondir de liens en liens pour atteindre la ressource culturelle qui l'intéresse, ce n’est pas en allant directement sur le site d’une institution culturelle.

En d’autres termes, un internaute ne décide pas a priori d’aller visiter le site web du Musée d’Orsay, il veut avant tout découvrir les tableaux de Monet et lire des informations intéressantes sur ce peintre. Et pour cela, généralement, il commence par chercher « Monet » sur Google. Il est donc plus que jamais nécessaire de mettre en relation les différentes organisations du monde de la culture et de systématiser la création de liens entre les différentes collections pour faciliter la navigation et, donc, la découverte de l'utilisateur.

Ces nouvelles formes de médiation ne remettent pas en cause l'existence des institutions qui trouvent leurs racines dans l'histoire de la construction du patrimoine et aussi dans des logiques de fonctionnement différentes : les livres mis à disposition dans les bibliothèques, les archives ou les pièces conservées dans les des musées sont de natures très différentes.

Qu’apporte le web sémantique au monde de la culture et du patrimoine ?

La question est donc de savoir comment réconcilier à la fois la logique de liens au cœur du Web et la logique des collections et des institutions. Pour ce faire, les conditions d'interopérabilité doivent être réunies, à savoir :
 
- un protocole de transport commun, HTTP
- des standards d’échange d’informations, XML ou JSON ;
- une structure commune avec les technologies du Web sémantique mises au point depuis 10 ans au sein du W3C, l'organisme de normalisation du Web.
 
Les avantages de l'approche du web sémantique sont multiples :
 
- désigner chaque entité par un identifiant universel et pérenne, qu'on peut réutiliser dans des contextes différents

- mieux qualifier les entités décrites dans une notice en les identifiant explicitement, structurer plus clairement certaines informations et mettre en relation les bonnes informations internes

- mettre en relation des informations internes avec des informations externes : en effet, le modèle RDF se diffuse dans le monde de la Culture (cf. data.bnf.fr ou data.europeana.eu), et de nombreux ensembles de données sont déjà disponibles en RDF. En les utilisant, il est possible de relier les contenus d’un musée ou d’une bibliothèque à ces ensembles existants et ainsi de créer du lien entre les institutions, chacune enrichissant  ses propres données avec les données mises à disposition par les autres.
 

Premières réalisations emblématiques

Les avantages du web des données ont rapidement été compris par les institutions de la culture et du patrimoine, qui ont su s’en emparer pour réaliser des projets dont les plus emblématiques ont été salués pour leur degré d’innovation.
  • Bibliothèque Nationale de France
Data.bnf.fr , le portail de la Bibliothèque Nationale de France, utilise les outils du web sémantique <http://data.bnf.fr/semanticweb>  et s'inscrit dans une démarche d'ouverture des données . Dans le cadre du schéma numérique de la Bibliothèque nationale de France, qui a pour but de rendre ses données plus visibles et plus utiles sur le Web, ce portail a été mis en ligne dans une première version en 2011. Il comporte désormais plus de 200 000 pages sur des auteurs, des œuvres et des thèmes, qui regroupent plus de 2 millions de références des catalogues de la BnF et plus de 140 000 liens vers Gallica .
Cette belle réussite a reçu en 2013
le Stanford Prize for Innovation in Research Libraries
et le Grand Prix Data Intelligence Awards

  • Centre Pompidou
La numérisation des collections du Centre Pompidou, qui a apporté plus de 75 000 reproductions d’œuvres, a été la première étape du projet. La seconde phase fut marquée par l’ouverture en octobre 2012 du Centre Pompidou virtuel   qui offre déjà la possibilité d'accéder à 95.000 ressources numériques, tous supports confondus. L’approche du web sémantique permet de lier les expositions et événements à toutes les œuvres concernées. Les reproductions des 75.000 œuvres du Musée seront à terme accessibles. Une partie est d’ores et déjà en ligne, avec possibilité zoomer en haute définition sur l'œuvre. Progressivement, des captations de performances, de conférences, interviews d'artistes et de commissaires d'exposition, documents écrits divers, catalogues d'expositions seront rendus disponibles.
  • D’autres  projets « culture et patrimoine » tirent avantage du web sémantique
Le Musée des civilisations de l'Europe et de la Méditerranée  ou MuCEM, inauguré en juin 2013, est dédié à la conservation, l'étude, la présentation et la médiation d'un patrimoine anthropologique relatif à l'aire européenne et méditerranéenne.  Un moteur de recherche sémantique facilite l’accès à l’information sur 900.000 objets, estampes, dessins, affiches, peintures, photographies, cartes postales,  ainsi que 100.000 ouvrages composant sa bibliothèque et environ 1000 documents d’archives.  Les technologies du web sémantique ont été mises en œuvre pour enrichir les données avec le référentiel géographique Geonames, avec un référentiel temporel et avec un référentiel thématique : il est ainsi très simple de rebondir, depuis la fiche d’un objet, vers les objets provenant de la même région, vers les objets de la même période historique ou vers les objets de même nature.
Sous la tutelle du ministère des Affaires étrangères, il contribue au rayonnement de la France à l’étranger dans un dialogue renforcé avec les cultures étrangères et répondre à la demande de France dans une démarche d’écoute, de partenariat et d’ouverture.  L’Institut Français a créé le portail IFVerso , qui propose toute l’information sur les œuvres françaises traduites en langues étrangères : il facilite l’accès à une base de données en ligne de plus de 70 000 œuvres traduites vers plus de 40 langues, avec plus de 20000 auteurs, 20000 traducteurs et 8000 éditeurs du monde entier.

 

Le web sémantique est en marche, et le secteur de la culture et du patrimoine a su assez tôt en tirer avantage.

Cela a notamment été rendu possible par des technologies et une expertise pour laquelle la France compte plusieurs acteurs à la pointe de l’innovation.
Aujourd’hui sont disponibles des solutions logicielles qui facilitent la mise en relation des données selon les principes et standards du web sémantique et favorisent l’accès à une information riche pour le grand public au travers de moteurs de recherche aussi puissants que simples d’emploi.



Auteur