L'utilisation du RDF
dans le développement du Web sémantique



Introduction générale


Mise en contexte

Dans notre société où le traitement et le repérage de l'information sont des activités fondamentales, notamment pour celles et ceux qui les utilisent à des fins professionnelles, intellectuelles ou encore stratégiques, les métadonnées, c'est-à-dire les données sur les données, deviennent des composantes incontournables. Dans le domaine des nouvelles technologies de l'information et de la communication, le Web demeure un espace que les métadonnées n'ont pas encore adéquatement imprégné. Afin d'y parvenir, ne serait-ce qu'en partie tellement le Web apparaît comme une source sans fin, plusieurs spécialistes et organismes ont développé des systèmes de langage et de programmation que l'on regroupe sous une même désignation générale : le Web sémantique. En fait, il s'agit essentiellement de traiter et de comprendre les données du Web plutôt que de seulement les visualiser afin, par exemple, que la machine informatique puisse faire la différence entre une information de type commercial par rapport à un texte universitaire, ou encore de faire le lien entre le nom d'une personne sur une base de données et son curriculum vitæ, qui se trouve ailleurs sur le réseau Internet.

Ce dont il est question dans cette présentation concerne une des applications développées pour répondre à ce besoin d'intégration automatisée : le cadre de description des ressources ou, en anglais, Resource Description Framework, communément connu sous l'appelation RDF. À ce jour (1er trimestre de 2004), le RDF représente l'option la plus prometteuse afin de permettre aux ordinateurs et aux gens de travailler en coopération. Il est considéré comme une technologie mûre, fournissant surtout une solution abordable et économiquement viable puisque proposé par le consortium W3C, ce qui signifie qu'il est d'exploitation libre.

Le système RDF, qui est une application XML standard, est un métalangage spécialisé dans les métadonnées afin de définir des relations arbitrairement complexes entre des documents ou des données. Il permet de représenter la description du contenu d'une ressource, de l'organiser, de contrôler ses accès et de garantir sa disponibilité. Avec ce type de traitement automatique des données, c'est-à-dire l'automatisation de la tâche d'extraction d'informations, il semble que les limites d'utilisation soient difficilement restrictives. Ainsi, grâce à l'emploi d'un URI (Uniform Resource Identifier) différent pour chaque concept spécifique, le pouvoir du RDF, et par extension du Web sémantique, c'est d'étiqueter chaque partie d'une ressource afin de la rendre interopérable avec l'ensemble des autres ressources ayant reçu le même traitement, peu importe la plate-forme informatique sur laquelle reposent ces ressources et peu importe leur localisation sur les réseaux. En d'autres mots, au moyen de la catégorisation des informations, le système RDF interprète celles-ci afin de les rendre mutuellement intelligibles.

Avant de traiter les aspects spécifiques, nous vous conseillons de survoler la page officielle du W3C, organisme de normalisation et de recommandation pour le Web, sur le système RDF. Il s'agit de la traduction française réalisée par Karl Dubost :

Spécification du modèle et la syntaxe du cadre de description des ressources (RDF)
http://www.la-grange.net/w3c/REC-rdf-syntax/

Pour ce qui est de la version anglaise révisée (février 2004), donc la plus récente sur le sujet, veuillez consulter la page Web suivante :
http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/


Aspects spécifiques

Le système RDF est quelquefois faussement réputé complexe. Utilisant le langage XML, le RDF est pourtant un moyen ouvert et efficace d'échanger les données. Afin de contribuer à démythifier ce système, nous présentons en premier lieu quelques textes de vulgarisation qui ont été choisis pour leur clarté et pour l'aptitude de l'auteur du texte à mettre en relation le RDF avec l'application générale du Web sémantique. Par la suite, nous nous attardons à l'un des aspects les plus importants de l'étude du système RDF, le schéma RDF. C'est ce dernier qui produit le vocabulaire pertinent à la mise en opération du système et qui procède alors à l'analyse textuelle des métadonnées afin qu'elles soient pleinement utilisables ailleurs sur le réseau Internet. Une autre section examine quelques forums de discussion et quelques listes de diffusion parmi les plus en vue sur le système RDF et ses enjeux : liens incontournables quand il s'agit d'échanges dans le monde de l'informatique. Finalement, nous proposons une dernière section qui traite de quelques logiciels d'application qui exploitent le RDF. Qu'il s'agisse de structuration des données ou de gestion de contenu, nous exemplifions en quelque sorte l'utilisation du RDF par la présentation de quelques-unes des applications possibles.



Limites

Cette présentation est un tour d'horizon du système RDF, système qui est très intimement relié au Web sémantique. Nous y proposons une série de sites intéressants pour comprendre les enjeux d'un tel langage ainsi que les aspects plus techniques. Toutefois, ce répertoire n'a pas la prétention d'être exhaustif. Il ne couvre qu'un échantillon des sites qui traite du RDF. Pour plus d'informations, veuillez avant tout consulter le site répertoire du W3C.


Accueil
Textes de vulgarisation   - -   Schéma RDF
Lieux virutels de discussion   - -   Applications pratiques
Conclusion

© Claude Dumais, 2004.
Cette page a été réalisée à l'EBSI, Université de Montréal,
dans le cadre du cours BLT 6134 - Analyse de textes et ordinateur
donné durant l'hiver 2004 par Suzanne Bertrand-Gastaldy.