Définition d’un thésaurus et méthodes de construction

Le centre de documentation du CHR

Roger Salengro

Après avoir fait une description générale du lieu où se déroule le stage, intéressons nous aux différents services de documentation localisés au sein du CHRU de Lille.
Ces organes de documentation sont nombreux, ne les ayant pas tous visités, je vais donc me limiter à ceux que j’ai fréquenté durant mon stage.
Dans le cadre de ma mission, j’ai été amené à côtoyer deux centres de documentation : le CIDDES (le Centres d’Information et de Documentation des Directions, Ecoles et Services) et le centre de documentation Roger Salengro. Je suis entré en contact avec le premier centre cité car ils ont mis en place leur propre Thésaurus qui nous intéressera ultérieurement.
Le CIDDES est situé dans l’Institut Germez Rieux également appelé Institut de formation d’infirmiers et d’infirmières du CHR, ce n’est donc pas un hôpital.
Le deuxième centre de documentation cité est bien évidemment le lieu où s’est déroulé mon stage. Le centre de documentation Roger Salengro est assez récent, il a été créé en 2001. Pour l’anecdote il a été installé dans les anciennes cuisines. Ce centre a été créé pour répondre à une volonté de centraliser les différents documents papier qui se trouvaient auparavant au sein des différents services de l’hôpital et qui n’étaient pas gérés par des professionnels de la documentation. Cette centralisation permettait également à davantage de personnes d’avoir accès à ces mêmes documents. En effet, cela permet par exemple aux étudiants en médecine de pouvoir consulter plusieurs périodiques différents dans un même endroit alors qu’avant ils auraient du se rendre dans plusieurs services pour les consulter.
A côté du centre de documentation a été aménagé un amphithéâtre d’une capacité d’un peu moins de cent personnes. Le centre a pour tâche de gérer les réservations de l’amphithéâtre qui est utilisé à des fins multiples : des cours pour les étudiants, réunion d cadres, ou des symposiums ou encore des conférences entre autre. Cependant, la gestion de l’amphithéâtre par le personnel du centre de documentation du CHR Roger Salengro se limite aux réservations. En effet c’est la personne qui a fait la réservation qui va chercher les clés de l’amphithéâtre à l’accueil de l’hôpital et qui les rapporte au même endroit. Ce suivi limité s’explique facilement par les horaires d’ouverture du centre de documentation qui souvent ne correspondent pas à ceux des réservations pour l’amphithéâtre. En effet le centre de documentation est ouvert de 9H30 àl3H et de 14H à 17H du lundi au jeudi et de 9H30 à 12H le vendredi mais l’amphithéâtre pouvait être réservé jusqu’à 19H voir 20H par exemple ou le vendredi après midi alors que le centre de documentation est fermé.
Le fonds de ce centre de documentation est essentiellement composé de périodiques, en effet le centre met à disposition environ 180 revues différentes dont l’abonnement est en cours ou arrêté. Le centre possède également un petit fonds monographique de 80 livres, partie marginale de la documentation mais pas inutile, ces livres ne traitent pas les mêmes thèmes et pas de la même façon que les périodiques. Les périodiques abordent les thèmes scientifiques, résultat de recherches dans telle discipline médicale alors que les livres abordent comme sujet l’aide à la recherche documentaire, la gestion d’un service, guide pratique prévention de santé ou encore le droit hospitalier. Vous pouvez consulter la liste des ouvrages qui constituent ce fonds dans l’annexe 1.
La marginalité du fonds monographique ne traduit pas des pratiques documentaires éventuelles du personnel de l’hôpital, car chaque service a la liberté de confier au centre une partie ou la totalité de ses fonds. En effet durant mon stage, plusieurs usagers ont demandé si le centre possédait une encyclopédie médicale et la réponse fut à chaque fois négative car ces encyclopédies se trouvent dans les différents services car se sont des documents incontournables. Les services choisissent de garder les documents consultés extrêmement fréquemment plutôt que de les confier au centre de documentation situé au niveau -2 de l’hôpital, ce qui forcerait le personnel médical à de très fréquents déplacements qui risquent de perturber leur travail.
Concernant la politique de prêt du centre de documentation, les règles sont simples : aucun ouvrage ni aucune revue n’est empruntable, une sécurité équipe tous les documents qui déclenche un portique à l’entrée du centre si jamais une personne tentait de faire sortir frauduleusement une revue ou un livre du centre de documentation. Cette règle est appliquée pour que l’ensemble des documents soit toujours consultable car un besoin d’information ponctuelle peut être immédiat et ne peut attendre plusieurs jours voir plusieurs semaines. D’autre part, ce n’est pas le centre lui-même qui s’abonne aux revues qui sont d’ailleurs difficilement remplaçables en cas de perte ou de prêts non-rendu. Pour permettre aux personnes fréquentant le centre de pouvoir travailler sur des articles de revues à l’extérieur du centre, une photocopieuse est mise à la leur disposition. Toutefois, la photocopieuse, fournie par le S CD de Lille II, fonctionne par un système de carte qui semble ne pas satisfaire tous les usagers car l’achat de la carte ne peut pas se faire au centre de documentation.
Notons, que pour une partie du personnel, les photocopies sont gratuites.

Mon intégration au sein du centre et ma mission

Le personnel et leurs tâches

Le personnel du centre de documentation est composé actuellement de quatre personnes : une documentaliste, une ancienne infirmière reclassée au centre de documentation ainsi que deux secrétaires universitaires médicales.
La documentaliste, Annick Dupond, est responsable du centre depuis sa création en 2001.
Auparavant, elle gérait un autre centre de documentation du CHRU, situé à l’hôpital Jeanne de Flandre. Son travail est de gérer le centre et de superviser son fonctionnement. Etant responsable du centre, elle est mon tuteur de stage. La seconde personne est une ancienne infirmière reclassée au sein du centre de documentation. Elle y travaille à temps partiel (70%). Elle s’occupe d’enregistrer les fiches d’événements indésirables survenus aux urgences et assiste Annick Dupond pour la gestion du centre. A ce titre, elle répond aux mails envoyés au centre pour demander une réservation de l’amphithéâtre, répond parfois au téléphone et s’occupe du centre quand Annick Dupond est absente pour raison professionnelle ou congés.
Enfin, les deux secrétaires universitaires, elles officient chacune dans plusieurs services de l’hôpital. Elles sont assignées quelques heures par semaine au centre de documentation pour aider à la gestion du centre comme par exemple au bulletinage des revues dans BCDI. A noter que l’une des secrétaires part prochainement à la retraite et elle ne sera peut être pas remplacée.

Stages déjà effectués dans le centre

Ce centre a pour habitude d’accueillir des étudiants pour qu’ils effectuent leurs stages. Certains de ces stages avaient pour objet la mise en place d’outils encore présents au sein du centre de documentation. D’autres avait pour objet de s’occuper de la vie du centre ou encore des objets de mission plus aboutie comme une enquête de satisfaction. A ma connaissance, aucun stage a de lien direct avec ma mission de stage. Mais certain ont eu des influences indirectes sur ma mission de stage.
En effet, les différents stages ont vu la mise en place d’un logiciel documentaire dans le centre de documentation et l’élaboration d’un manuel expliquant en partie son fonctionnement. L’objet de ma mission, la mise en place d’un Thésaurus, doit être intégré dans ce logiciel et le manuel m’a servi pour découvrir le fonctionnement de ce logiciel documentaire.
Parallèlement à ma mission, deux autres missions de stages étaient menées au centre par deux autres étudiants en première année de Master ICD. La première étudiante devait s’occuper de remanier le site intranet du centre de documentation. Le deuxième étudiant devait mettre en place un nouvel outil pour la revue de sommaire et a été amené à travailler avec des flux RSS.

Intégration et ma mission

Concernant mon intégration au sein du centre, j’ai visité les lieux lors de deux ou trois visites réalisées avant le début du stage donc le premier jour du stage j’étais en terrain connu. Au début du stage j’occupais le bureau d’Annick Dupond, la responsable qui était absente. Puis j’ai occupé le bureau de l’étudiante dont le stage a été écourté. Nos horaires étaient : 8H à 13H et de 14H à 17H. Lors de la première semaine l’assistante d’Annick Dupond nous a réexpliqué le fonctionnement du centre notamment pour aller chercher les clés du centre de documentation à l’accueil de l’hôpital le matin car nous étions les premiers arrivés étant donné que nous commencions à 8H.
Ma mission de stage consiste en une réflexion sur la mise en place d’un Thésaurus pour l’indexation des monographies du centre de documentation en partant d’un premier Thésaurus mit en place par le CIDDES et donc nécessitant une mise à jour dans l’optique de l’adapter au fonds de monographies du centre de documentation du CHR Roger Salengro. J’avais une deuxième mission qui consistait à réaliser une enquête de fréquentation du centre de documentation mais comme je vais l’expliquer dans la partie 3, j’ai du abandonner cette mission.
Après avoir décrit le lieu et l’organisation du service où s’est déroulé mon stage et après avoir expliqué ma mission et mon intégration au sien du centre de documentation, nous allons définir le Thésaurus et expliquer ses méthodes de construction.

Définition d’un thésaurus et méthodes de construction

Le Thésaurus c’est quoi

Petit historique

THESAURUS est un mot latin qui signifie recueil ou répertoire. Sa première apparition se fait en 1531 quand l’humaniste Robert Estienne publie son dictionnaire complet et universel du latin intitulé Thésaurus linguae latinae. Estienne replace les termes de son dictionnaire dans leur contexte sémantique en les accompagnants d’exemples d’utilisation ou de phrases entières ; Le terme THESAURUS est repris par l’anglais Peter Mark Roget en 1852 dans son ouvrage Thésaurus of English words and phrases. Ici aussi les termes sont replacés dans leurs contextes sémantiques, ils sont accompagnés par leurs synonymes et des termes de sens voisin et d’exemples d’application. Les documentalistes du XIXe siècle ont repris le sens donné par Estienne et Roger au mot THESAURUS.
Le Thésaurus comme on le définit aujourd’hui est issu d’une suite de réflexion sur les outils permettant d’indexer et de retrouver un document. Longtemps on a classé les documents selon un plan préétabli. La plupart de ces plans avaient des origines philosophiques, ce qui implique que les mises à jour soient compliquées. Donc ces plans devenaient au bout d’un certain temps caducs. Dans les années trente, apparait un nouvel outil : le catalogue alphabétique de matières où le document est indexé par un ou plusieurs mots ou expressions. Cette outil reste complexe et a une tendance à la dispersion car les indexeurs n’utilisent pas les mêmes termes pour exprimer une même idée. Enfin dans les années cinquante, un anglais, Mortimer Taube créa l’UNITERM, outil qui ne retient qu’un seul mot pour indexer un document. Pour élaborer cet outil, des listes de mots ont été établis à l’usage des indexeurs et des usagers. Le perfectionnement de ces listes a abouti au Thésaurus que nous créons et utilisons aujourd’hui.
L’emploi du mot THESAURUS remonte au XVIe siècle mais le thésaurus comme outil n’apparait que dans les années cinquante. Mais qu’est ce qu’un thésaurus ?

Structure

Un thésaurus est composé de termes, descripteurs et non-descripteurs, qui sont structurés par trois type de relations sémantiques : relation d’équivalence, relation hiérarchiques et relation associatives.

Les descripteurs et non descripteurs

En information-documentation, un descripteur ou terme préférentiel ou terme autorisé est considéré comme une unité lexicale. Par convention, le descripteur est le terme qui est susceptible de caractériser le contenu d’un document faisant parti d’un système informationnel et/ou documentaire. C’est l’unité de représentation d’un contenu qui est de nature conceptuelle. On considère que le descripteur est la clé d’accès aux documents dont il synthétise le contenu. Les descripteurs sont théoriquement des mots clés mais certains logiciels font une différenciation entre mot clé et descripteur. Lors de mon stage, j’ai travaillé sur le logiciel documentaire BCDI qui, dans les fiches d’indexation, réserve un emplacement pour les descripteurs et un autre emplacement pour les mots clés qui servent à compléter les descripteurs. Donc la distinction entre mot-clé et descripteur est assez ambiguë et changeante en fonction des cas.
En général les descripteurs sont des mots simples ou composés (substantifs ou groupes nominaux) du langage courant qui servent à représenter des concepts qui caractérisent le contenu des documents et qui sont utilisés aussi bien pour indexer que pour les requêtes. Selon la norme ISO 2788, les termes composés ne doivent être utilisés que lorsque cela risque de nuire à la compréhension des utilisateurs. Les descripteurs ne peuvent pas être des verbes, des adverbes et des adjectifs. Conventionnellement les descripteurs sont écrits en caractères majuscules mais cette convention n’est pas systématiquement respectée par tous les logiciels documentaires et autres outils qui intègrent les Thésaurus. Les descripteurs sont de préférence au singulier sauf si l’orthographe n’est pas la même ou que le 11 sens change. Si un terme a plusieurs orthographes, on choisit arbitrairement mais on peut aussi essayer de déterminer l’orthographe la plus fréquente auprès des futurs utilisateurs et de la choisir comme descripteur. Concernant le choix entre les noms d’usage courants et les noms scientifiques ou les noms de lieux, à chaque fois il faut choisir le descripteur en fonction des utilisateurs du Thésaurus. Par exemple dans un thésaurus médical le terme rhinite allergique va être utilisé comme descripteur alors que dans un thésaurus à destination du grand public on va utiliser le terme rhume des foins.
Les non descripteurs désignent des concepts identiques ou voisins de ceux représentés par les descripteurs et sont susceptibles d’être utilisés par les futurs utilisateurs.
Les non descripteurs ne peuvent être utilisés pour l’indexation mais renvoient à un terme référentiel utilisé pour l’indexation. Ils permettent de guider les indexeurs vers les termes choisis mais permet également à diminuer le silence lors des recherches. En effet un utilisateur faisant une recherche ne va pas forcément utiliser les descripteurs choisi par l’indexeur mais des termes voisins ou synonyme d’où l’importance de ne pas les négliger au risque de ne pas satisfaire les demandes des utilisateurs.

Les relations sémantiques

Trois des types de relations sémantiques sont couramment utilisés dans la structure de type arborescente du thésaurus.
Tout d’abord la relation hiérarchique qui se fonde sur le principe de «supériorité » et de « subordination ». Cette relation sert à localiser des concepts généraux ou spécifiques à l’intérieur d’une liste ordonnée, caractéristique des thésaurus. Cette hiérarchisation permet d’avoir un important facteur d’amélioration du rappel (allant du spécifique au générique) ainsi que du degré de précision (allant du générique au spécifique).
Cette relation est réciproque et apparait dans le Thésaurus par les conventions suivantes : « TG » pour Terme Générique et « TS » pour Terme Spécifique.
La relation d’équivalence comprend les synonymes et les quasis synonymes.
Les normes définissent les synonymes comme « des termes ayant en gros la même signification dans une grande variété de contextes au point d’être pratiquement interchangeables ». Les synonymes ne sont pas courants dans les langues naturelles mais ils sont plus fréquents dans la terminologie scientifique. Sur un plan plus général, les synonymes sont toujours plus fréquents dans le langage contrôlé, utilisé pour la conception des Thésaurus, car le sens des termes est délibérément plus restreint que dans le langage naturel. Au cours de l’élaboration d’un thésaurus on peut rencontrer plusieurs types de synonymies : entre un nom d’usage courant et un nom scientifique ; entre un nom scientifique ou commun et le nom d’une marque (dans le domaine de la médecine cela peut être des noms de médicaments) ; entre une appellation courante et sa version en argot ; les variations orthographiques ; termes d’origines linguistiques différentes (terme d’origine anglais comme ‘software ») ; abréviations ; formes naturelles et contrôlées des termes. Les termes quasi synonymes, suivant leur définition, sont des termes ayant des sens différents dans l’usage courant mais pour les besoins de l’indexation ils sont traités comme des synonymes. Les termes quasi synonymes englobent des termes ayant manifestement des sens voisins.

Ex : ZONES URBAINE / VILLE SURDOUE/GENIE

L’utilisation des quasi synonymes dépend du domaine traité par le Thésaurus, par exemple un Thésaurus traitant de la santé dans la vie professionnelle ne considère pas que les termes ‘accident de travait et ‘accident d’usine » comme des synonymes alors que dans un Thésaurus plus générale du domaine de la santé on pourrait les considérer comme des synonymes.
Le troisième type de relation qui apparait dans le thésaurus est la relation associative. Cette relation est la moins facile à définir. En langage clair, la relation associative existe entre des termes étroitement liés par le sens mais non hiérarchiquement et qui ne sont pas en relation d’équivalence. Les normes ISO considèrent qu’une relation associative est possible entre deux descripteurs « s’ils sont mentalement associés au point qu’il soit nécessaire de mettre en évidence dans le Thésaurus le lien qui les relie, la raison étant que celui-ci révélera d’autres termes susceptibles d’être employés pour l’indexation et la recherche ». Cette relation peut ainsi révéler d’autres termes qui sont susceptibles d’être utilisés pour l’indexation et améliorer les réponses aux requêtes des utilisateurs. La notation des relations associative se fait par l’abréviation « TA » pour Terme Associé.
Le danger de l’utilisation des relations associatives est que le thésaurus risque d’être encombré de relations non pertinentes. Encombrement qui serait nuisible à la qualité de la précision sans vraiment améliorer le rappel. La norme indique que pour diminuer cette tendance « l’un des termes doit être fortement suggéré par l’autre, en fonction du système de référence des utilisateurs de l’index, toutes les fois que l’autre terme est employé comme terme de d’indexation ».
Un dernier élément peut apparaître dans un Thésaurus : la note d’application.
Dans un Thésaurus imprimé elle est représentée par la notation « NA ». En règle générale, le Thésaurus ne contient pas de définition complète comme dans les dictionnaires mais on peut voir apparaître des définitions brèves sous la forme de notes d’application pour compléter le sens qui se dégage de la structure du Thésaurus. Ces définitions sont très utiles dans les Thésaurus de sciences sociales, lettres et sciences humaines car elles permettent de clarifier une terminologie souvent trop vague dans ces domaines. Les notes d’application permettent aussi de soulever des ambiguïtés notamment issues de l’homographie. Par exemple avec le terme ‘gruev qui désigne un engin de chantier mais aussi un oiseau. Enfin les notes d’application permettent également, à la personne qui élabore le Thésaurus, de donner des indications voir des explications sur la démarche qu’elle a réalisée et sur les logiques qu’il a suivi, à la personne qui est chargé de l’indexation. Ces notes sont très utiles quand une organisation adapte à son fonds documentaire un Thésaurus déjà élaboré et mis à disposition sur le web par exemple. Les personnes chargées de l’indexation peuvent s’appuyer sur les notes d’applications pour comprendre certains termes qui leur sont inconnus et comprendre la démarche des concepteurs du Thésaurus.
Après avoir fait une description de la structure et des éléments présents dans le Thésaurus, nous allons maintenant aborder les fonctions et les rôles d’un Thésaurus et les intérêts d’utiliser un Thésaurus.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction 
PARTIE 1 : Présentation et description du lieu du stage et mon intégration dans ce lieu
I Présentation du lieu où se déroule le stage
A) Le CHRU et le CHR Roger Salengro
B) Le centre de documentation du CHR Roger Salengro
II Mon intégration au sein du centre et ma mission
A) Le personnel et leurs tâches
B) Stage déjà effectué dans le centre
C) Intégration et ma mission
PARTIE 2 : Définition d’un thésaurus et méthodes de construction
I Le Thésaurus c’est quoi
A) Petit historique
B) Définition
C) Structure
C.l Les descripteurs et non descripteurs
C.2 Les relations sémantiques
D) Fonctions, rôles et intérêt du thésaurus
II Méthodes de constructions d’un Thésaurus
A) La méthode classique
A.l La collecte des termes
A.2 La comparaison et la mise en relations des termes
A.3 La hiérarchisation des termes
A.4 La validation
B) Méthode de la mise à jour
C) Présentation du Thésaurus
C.l La liste alphabétique structurée
C.2 La liste alphabétique permutée
C.3 La liste hiérarchique
III Terminologie médicale
A) La terminologie : une représentation des connaissances
B) Particularités de la Terminologie médicale
PARTIE 3 : Mise en place du Thésaurus et rôle de celui-ci dans la valorisation du fonds
I La collecte des termes
A) Choix de la méthode d’élaboration et des Thésaurus
A.l Choix de la méthode de la mise à jour et du Thésaurus
A.2 Le Thésaurus du CIDDES
A.3 Le Thésaurus BDSP
B) La sélection des termes et les contraintes rencontrées
B.l Analyse de l’existant
B.2 Les premières contraintes
C) Le Thésaurus, seule solution pour l’organisation des connaissances ?
II La comparaison des termes
A) Le logiciel documentaire BCDI
A.l Présentation
A.2 Contrainte technique: la mise à jour du Thésaurus
B) L’identification des sous domaines
B.l Elaboration des listes de termes pour la comparaison
B.2 Une analyse du fonds monographique tardive
B.3 Regroupement des termes et sélection des descripteurs
C) Un fonds monographique non valorisé
III Hiérarchisation des termes
A) Méthode de hiérarchisation et cas particulier
B) Contraintes et mise au point des procédures
IV La Validation du Thésaurus
A) Tests et validation du Thésaurus
B) Les causes de la non réalisation de la validation du Thésaurus
L’enquête de fréquentation
A) La démarche
B) Les raisons de la non réalisation de l’enquête
Conclusion 
Bibliographie et sitographie 
ANNEXES

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *