Le web sémantique (ou semantic web, en anglais), est considéré comme l'avenir de l'internet. Imaginé par Tim Berners-Lee, l'inventeur du web, le but est de créer une toile intelligente, capable d'effectuer des liens complexes sur le web. Il s'agit de donner du sens aux recherches sur le web au lieu de seulement trier les pages internet par mots-clés, comme cela se fait actuellement.
Quelle est la différence entre le web sémantique et web classique ?
Lorsqu'on lance une recherche sur le web, tel qu'il se présente aujourd'hui, la machine cherche toutes les pages contenant les mots-clés pertinents. Cependant, la recherche ne peut être complète, car la machine ne peut faire des liens qu'un humain, avec ses capacités d'analyse, peut faire. Par exemple, si on recherche le nombre d'accidents impliquant des véhicules sur les routes de France en 2022, le moteur de recherche va passer en revue toutes les données ayant comme contenu les mots "véhicules", "accidents", "routes" et "France" et ressortir toutes les informations disponibles. Ce qu'il ne fera pas, c'est le lien entre certains mots, comme "bicyclette" ou "collision". Car, contrairement à l'être humain, il ne peut faire le lien entre bicyclette et véhicule ou collision et accident. Pour ajouter de la sémantique au web, ceux qui travaillent sur le web sémantique, ont imaginé une toile capable de faire des connexions que, jusqu'à maintenant, seuls les humains étaient capables de faire. Sur le web classique, les données informatiques sont traitées par les algorithmes sans pouvoir leur donner un sens. Avec le web sémantique, on arrive à traiter et modéliser les métadonnées à l'aide d'algorithmes, pour leur donner un sens. Tout ça se fait grâce à un système de graphe. Un langage, appelé formalisme de description de ressources (ou RDF), décrit les ressources web et leurs métadonnées afin d'établir des liens automatiquement. Ainsi, c'est grâce au RDF que le système pourra savoir qu'une collision est un accident, dans notre exemple précédent. À l'exemple de la grammaire, les documents sont structurés en triplets.
- Le sujet - Il représente la ressource à décrire.
- Le prédicat qui représente le type de propriété lié à cette ressource.
- L'objet qui est une autre ressource, la valeur de cette propriété.
Grâce à l'ontologie, le RDF va constater qu'un véhicule évolue sur les routes tout comme une bicyclette et donc déduire qu'une bicyclette est un véhicule. Tous les liens entre les différentes données ne sont pas possibles sur le web classique. C'est l'identifiant uniforme de ressource (URI) qui isole une ressource afin qu'un lien puisse être établi entre les différents nœuds des ressources web. En clair, le web sémantique, permet de générer des informations en langage informatique automatiquement. Il permet, notamment, de :
- Générer des données sémantiques sans saisie humaine.
- Partager des données sémantiques pour être publiées.
- Publier des données avec une mise en forme personnalisée.
- Échanger automatiquement des informations en fonction de leurs relations sémantiques.
Pourquoi le web sémantique ?
Avec le développement des technologies de l'information dans divers domaines de la vie quotidienne, le web sémantique va trouver son application dans différentes activités qui s'appuient sur la circulation d'informations.
- L'E-commerce - Le secteur de la vente en ligne a trouvé dans le web sémantique un outil essentiel. Le gros problème de l'e-commerce n'est pas un manque d'information. Les données sont disponibles, mais plusieurs informations sont rédigées en langue naturelle (anglais, français, japonais,...). Avec le web sémantique, il est, désormais, facile de recouper les informations à travers un langage standardisé comme le XML, afin de permettre une indexation et un catalogage susceptible d'être compris par tous les systèmes.
- La médecine - Une standardisation des descriptions des ressources permettra un plus grand partage des connaissances parmi la foule de données disponibles et donnera une plus large interopérabilité aux divers systèmes hospitaliers.
- L'entreprise - La gestion mémoire d'entreprise et la gestion des connaissances d'entreprise (KM-knowledge management) permettent une meilleure gestion des ressources humaines, de l'organisation et de la culture de l'entreprise.
Le domaine où le web sémantique sera peut-être le plus utile dans le futur, est celui du traitement automatique des langues. En effet, le langage humain est structuré et a une cohésion inter-phrase très forte. Lorsqu'un locuteur reçoit un message, plusieurs facteurs entrent en considération pour le déchiffrage. Par exemple, le contexte de l'énonciation, ses croyances, les références temporelles ou les attitudes. Afin de comprendre le message, le locuteur doit partager avec son interlocuteur plusieurs connaissances, lexicales, contextuelles ou conversationnelles. Le défi pour le web sémantique sera d'utiliser les outils de l'ontologie linguistique pour extraire le sens d'un texte et intégrer des informations hétérogènes, dans le but de pouvoir passer des mots d'une langue aux mots similaires d'une autre langue. On a déjà vu des systèmes utilisant une interlingua pour des traductions faisant usage de contextes. Ces systèmes, comme WORDNET ou EUROWORDNET, ne permettent, malheureusement, toujours pas d'interconnecter plusieurs langues, mais l'espoir de pouvoir, un jour, faire des traductions instantanées qui prennent en compte le contexte linguistique, est permis grâce au web sémantique.