La méthodologie d’enrichissement du service documentation de la Voix du Nord 

LE SERVICE DOCUMENTATION ET ARCHIVES

PERSONNEL ET HORAIRES

Chaque jour do 8h30 à minuit six jours sur sept l’équipe Archives Documentation épluche la presse nationale et régionale, en rédige la synthèse, reçoit et sélectionne les photos, les légende, et les classe. Elle répond aux demandes, nombreuses, des journalistes, des entreprises, ou de particuliers. L’équipe est composée du Chef du Service (au statut de journaliste), M. Christian Garitte ; d’employés : Martine Guionnet responsable du classement «Matières» et des dossiers documentaires ; Jean-Paul Poupon qui s’occupe en particulier des diapositives, et du stockage des photos AFP dans le serveur ; d’un journaliste :
Joseph Raguin qui prépare les notes de synthèse, dossiers thématiques, et rétrospectives. Eric Halluin est détaché du service technique pour la confection des collections reliées ou envoyées au microfilmage, des éditions de la VDN. Chacun tout au long de la journée, outre ses fonctions cidessus détaillées, a pour mission d’enrichir le fonds documentaire et aussi le contenu du journal (recherche et scannage de photos).

LE TRADITIONNEL : les collections, la photothèque et les dossiers textes

Le service est dépositaire de toutes les éditions papier de la VDN depuis sa création (avec en plus une version microfilmée depuis 1944). Cette collection est conservée dans la salle des archives de la Pilaterie (c’est avant tout un lieu de stockage, une source que l’on vient consulter moins souvent), avec «L’Echo du Nord» et «Grand Echo» (1819 à 1944), «Le Monde» (depuis 1947), «Le Figaro» (depuis 1960), et le JO (depuis 1958). L’édition lilloise de la VDN est consultable dans le service du siège.
Dans les locaux de Lille, sont classées plus de 3,5 millions de photos noir et blanc5, 350.000 diapositives, 18.000 boîtes thématiques. Les photos proviennent des photographes de la VDN, des maisons de production (dossiers de presse), ou achetées aux agences de presse (comme l’AFP, Sypa, Sigma). Les photos sont en majorité noir et blanc pour des raisons essentiellement techniques, la couleur étant apparue dans le journal en 1983.

ENRICHISSEMENT DES PHOTOS

Mon stage a pour but l’appréhension du métier de documentaliste, avec ses multiples facettes, et sa couverture universelle ; par le contact avec les journalistes et les autres services du journal, et la disponibilité pour répondre à toutes les demandes (quelles qu’elles soient: journaliste de Lille, des locales, particuliers, entreprises, téléphone, fax, Internet courrier), à classer, faire de la veille, jeter, constituer des dossiers documentaires ; et ceci dans un environnement intermédiaire, avec les méthodes traditionnelles et modernes.
Pour moi, le stage a pour principale mission l’enrichissement des étiquettes DocCenter reprenant les renseignements des étiquettes Hermès (souvent mal remplies), pour en favoriser, faciliter et accélérer les recherches, surtout pour les pages communes.
Depuis le 2 juin 1998, la VDN stocke de façon électronique l’intégralité de sa production rédactionnelle, en se servant des éléments liés à la PHO Hermès. Le logiciel Hermès est une innovation qui a été introduite dans la production du journal en 1994, permettant aux journalistes de pré-formater les pages et d’en maîtriser complètement la réalisation.
En plus d’une recherche full-text la base documentaire permet une recherche en fonction des niveaux de l’arbre de fabrication lié à Hermès : édition, date, niveau de page. Cela est valable pour les pages de locales, aux maquettes normalisées7, tel un jeu de construction. Quant aux pages communes à toutes les éditions, elles ne répondent pas aux mêmes critères, et peuvent être décartonnées, c’est-à-dire ne pas respecter le schéma de base d’un article8 Ce qui supprime les liens hypertextes : à un texte est associé une photo, une légende. C’est pourquoi depuis le 2 juin 1998, il est pratiquement impossible de trouver l’intégralité des sujets traités dans ces pages.
La VDN a accumulé un grand retard dans son travail d’enrichissement de ces pages décartonnées, par manque de temps, de personnes formées aux techniques de la documentation, fiussi M.Garitte m’a confié cette mission, pour rattraper un peu de retard. D’autant que depuis la mise en route en juin 1998 de DocCenter, si l’enrichissement des pages propres à chaque locale est fait par les locales, l’enrichissement des pages dites «une-toutes» c’est-à-dire communes à toutes les éditions, n’a pas été fait ou mal. En effet l’indexation des photos demande rigueur,technique, vigilance. Or des stagiaires précédentes qui avaient commencé le travail, n’ont pas du tout respecté ces conditions, commettant de nombreuses erreurs, et surtout fautes d’orthographe.
J’ai donc pour mission de corriger ces erreurs, et surtout d’avancer dans la description des photos pour optimiser l’utilisation de DocCenter.
Mes tâches sont donc diverses : être documentaliste à part entière, avec un aspect plus particulier, celui d’indexer des photos numériques.

LA DESCRIPTION DU FONDS NUMERIQUE DE LA VPN

Parmi toutes les activités du seivice de documentation, le plus gros de mon travail a été l’enrichissement documentaire des photographies numériques, fiussi, dans mon cas cela a consisté en la description des photos des pages dites «unes-toutes», (les pages communes à toutes les éditions). Pour mieux cerner la problématique, il est nécessaire de rappeler le fonds photographique que possède le service à la VDN :
-Les photos papiers noir et blanc stockées dans les boites, par thèmes ou par personnalités.
-Les diapositives, stockées dans les Kardex, et celles dans les tiroirs pour le cinéma et les dessins animés.
-Les négatifs couleurs stockés dans le Kardex.
-Les photos numériques stockées sur le logiciel DocCenter.
-Les CDRom (FrFP et VDN).
Seules les photos stockées dans DocCenter sont accessibles par les journalistes de la VDN, sur les rares postes équipés de DocCenter, les autres uniquement par le personnel du centre de documentation. Ceci constitue la réserve propre à la VDN.
D’autre part le service de documentation a comme autres sources :
-l’accès en ligne à la banque de données des photos PQR (Presse Quotidienne Régionale, comme Ouest France, Le Dauphiné Libéré…), par le moteur documentaire Phraséa ; ainsi que les sites des grands médias télévisuels (TF1, FranceZ…) pour y acheter des photos.
-par Netscape navigator, accès à la base archives FiFP, pour y lire les dernières dépêches, et acheter des photos.
-par ligne numéris accès aux banques d’images Sipa, Sygma, Temsport
Le service a donc accès à des sources différentes pour répondre à la demande.
Le service est informatisé depuis le Z juin 1998 : équipement de son premier PC en juillet 1998, d’un deuxième en janvier 1999, et d’un troisième en avril 1999. La VDN conserve désormais de façon numérique l’intégralité des photos parues.
Un texte contient des mots qui ont un sens propre, mais qui associés à d’autres mots donnent un sens précis comme le précise O’Connor «les mots sont plutôt des conventions générales qui prennent an sens très précis selon leur position à l’intérieur de ta chaîne des motsH L’image ne possède pas cet aspect 11 est donc différent d’indexer une image par rapport à un texte, pour savoir le lieu, etc.
Il «suffit» de lire un texte pour en saisir le sens. L’image, elle, et j’ai pu le constater à maintes reprises lors de l’enrichissement a besoin d’une légende et d’une indexation, car ce qu’elle nous montre n’est pas toujours explicite : entre unQ usine de sidérurgie et une autre, comment savoir laquelle est la bonne ? Aussi est-il nécessaire d’indexer l’image, pour ne pas risquer de l’utiliser à mauvais escient
Etant donné que les utilisateurs de DocCenter sont le personnel du service documentation, mais également les journalistes, il est d’autant plus difficile d’enrichir les étiquettes de la base DocCenter. Aussi il faut tenir compte de la philosophie DocCenter pour illustrer chaque photo : afin que les journalistes trouvent textes et photos avec leur approche, leurs mots ; afin que les services transversaux puissent trouver ; et afin que le service documentation puisse retrouver.
Pour le moment l’enrichissement au centre de documentation porte uniquement sur les pages communes à toutes les éditions, chaque locale étant censée effectuer la description des photos et des textes propres à leurs pages. Mous n’intervenons donc pas encore sur celles-ci. Pour cela M. Garitte est allé former dans chaque locale, un ou deux journaliste(s) à l’utilisation du logiciel DocCenter.
Dans la plupart des cas, le travail d’enrichissement des locales n’est pas fait soit parce que les gens formés ont quitté l’entreprise, soit parce qu’ils n’ont pas le temps. Par ailleurs, comme nous l’avons expliqué précédemment les photos parues dans les pages communes à toutes les éditions, sont décartonnées, c’est-à-dire sans lien hypertexte permettant d’associer les champs titre, texte, légende et photo. De même, l’usage de cartons Hermès sans champ légende nécessite de passer par le texte et de naviguer dans la base. Pour remédier à cela, l’ajout de la notion de dossier et de descripteur est absolument indispensable pour la rapidité, mais principalement pour la finesse des réponses, et éviter bruits et silences.
(Un exemple pour chercher des photos du Zoo de Lille, si l’on rentre «Zoo» dans le champ description, et «Lille» dans le champ commune, on obtient aucune réponse. Par contre, si on met une astérisque à (Zoo*), on a une réponse. En effet la description contenait «parc zoologique». Comment alors, parvenir à indexer une photo numérique, sans l’aide d’un thésaurus, de façon à ce que les mots-dés employés soient explicites et adaptés pour chaque type d’utilisateur, en tenant compte des recherches (requêtes) futures sur le logiciel informatique DocCenter de la voix du nord ? «Indexer» consiste à compléter les renseignements liés à l’étiquette Hermès de la photo, dont le champ description avec des termes clés. Par «explicites», il faut comprendre significatifs, c’est-à-dire lui attribuer des termes assez précis pour décrire correctement la photo, tout en tenant compte du contexte dans lequel elle a été prise. « Conformes » c’est s’adapter à tous les publics, utiliser des termes compréhensibles, ayant une signification par rapport à chaque représentation individuelle.

LA METHODE PROPRE A LA MISSION

Pour accomplir ma mission, j’ai combiné à la fois l’approcha traditionnelle et l’approche informatique. J’ai rempli les fonctions de documentaliste, avec pour priorité le travail sur l’enrichissement Pour cette mission tout est fait sur PC. (Jn peu à la fois je suis devenue plus rapide dans les saisies, et j’ai appris à connaître les différents dossiers existants pour classer une photo, un certain automatisme s’acquiert tout en tenant compte de la spécificité de chaque photo.
M.Garitte m’a montré la forme de présentation qu’il désirait et nous avons discuté ensemble des choix des termes descripteurs des photos, ainsi qu’avec les personnes du service.
Pour les autres taches, un peu à la fois, j’étais de plus en plus opérationnelle, rapide, efficace, autonome, commettant de moins en moins d’erreurs. Dés lors j’ai progressé, et lorsque je ne savais pas, je demandais.
Nous verrons dans les chapitres suivant les techniques propres à chaque tâche.
L’enrichissement documentaire des photos numériques pouvait prétendre être l’objet d’un questionnaire sur les termes à employer pour indexer; et/ou une enquête sur les besoins des journalistes. Pour les raisons qui vont suivre, je n’ai pas jugé nécessaire ni adéquat de passer par ce type de méthode.
D’une part les photos que j’ai à enrichir sont issues des journaux déjà parus, il n’y a donc pas de choix à effectuer, la direction ayant décidé d’en conserver l’intégralité, toutes doivent être indexées (hormis seulement les radios – trottoirs (photos témoignages), qui sont des portraits d’inconnus dont on demande l’avis sur un fait précis, à une date précise. Ceci n’implique donc à aucun moment d’avoir à faire un choix sur la conservation ou non d’une image.
En outre, pour indexer chaque photo, comme nous l’avons vu auparavant la VDN ne possède pas de thésaurus. On pourrait effectivement faire une enquête auprès des utilisateurs de DocCenter (c’est-à-dire les journalistes), quant à l’emploi de termes descripteurs, pour qu’ils correspondent aux attentes de chacun. Cependant ceci n’est pas envisageable par le caractère subjectif de la description, chacun voudra y mettre ses propres mots, correspondant à ses propres représentations personnelles. Impossible donc de trouver un accord commun entre tous, et donc une uniformité. Or cette uniformité est indispensable si l’on veut créer un certain automatisme dans les mécanismes de recherches sur DocCenter, et s’y «retrouver».
D’autre part si l’on considère que c’est en majorité les documentalistes qui vont effectuer les recherches, alors il semble évident que l’indexation doit être faite par un documentaliste, qui respectera une «norme», celle ci ayant été réfléchie entre toutes les personnes du service, ce qui réduit le nombre de personnes à sonder, et facilite le travail d’uniformisation.
Certes, à terme, le but est que les journalistes fassent eux-mêmes l’enrichissement sur DocCenter, ce qui est d’ailleurs le cas pour les pages propres à chaque édition, mais l’on s’aperçoit que cela n’est pas toujours fait et de loin, ou pas correctement.Enfin, aujourd’hui beaucoup de journalistes effectuent des recherches sur DocCenter ; et bien que l’indexation a été faite par les documentalistes, celle-ci a tenu compte du style journalistique et du vocabulaire employé dans chaque article. Et par ailleurs, rappelons que ce sont les documentalistes qui forment les journalistes à l’utilisation de DocCenter, et ainsi à leurs techniques de description.
Pour terminer, n’oublions pas que le thésaurus reste un projet à réaliser à la VDM, et que celui ci résoudra à terme ce problème.

LA REDACTION DU RAPPORT

Il est difficile de combiner à la fois le travail à la VDM, celui en dehors, et la réalisation du rapport Le temps m’a souvent manqué, et trouver quelques minutes pour s’y consacrer pendant la journée à la VDM, c’est presque mission impossible, étant donné que des commandes arrivent de toutes parts, et qu’il faut réaliser ce que l’on a convenu dans sa mission de stage. En tout cas, M. Garitte m’a beaucoup aidée, et cela m’a été très bénéfique.
En ce qui concerne les lectures associées au stage, il n’est pas facile de trouver des ouvrages pertinents, et en rapport direct avec le sujet Bien souvent puisque les techniques sont sommes toutes assez récentes, on ne trouve dans un livre qu’un ou deux chapitres intéressants.
Par ailleurs, je n’ai pas trouvé pertinent de commencer à rédiger trop tôt dès le début du stage. Il fallait d’abord m’intégrer et me former, connaître mon nouvel environnement de travail, pour expliquer correctement tout ce que j’ai fait à la Voix du Mord.

Le travail effectué

Mon travail d’indexation des photos s’est étendu sur la période de août 1998 à décembre 1998, pour les journaux VDN.
En moyenne, pour les journaux VDN il faut compter une ou deux semaines pour achever la description des pages communes à toutes les éditions d’un mois de l’année, (car entre deux il faut satisfaire les demandes internes et externes). Par journée, la VDN publie entre 40 et photos, soit pour un mois un minimum de 1Z00 photos ; c’est donc un travail long et fastidieux.
J’ai également enrichi certains suppléments de la VDN : les «Evasions» consacrés à la culture et au tourisme, pour l’année 1998, ainsi que «Découvertes» : les pages emplois et immobilier, (supplément du dimanche) pour 1998. ces éditions comportent au maximum 25 photos, ils sont donc plus rapides à indexer.
Techniquement je vais dans un premier temps chercher la collection «papier» du mois à enrichir, ainsi je peux consulter l’article en même temps que je saisis les données dans l’ordinateur puis je fais une requête pour qu’apparaissent à l’écran les photos du journal de la date X puis je tris les photos par page (de la Ie à la dernière).
Ensuite, je prends chaque photo une par une, en affiche l’étiquette21 et je la remplis. Je commence par la source ou l’auteur de la photo, puis la commune, le champ description, avec pour règles de présenter comme suit :
-pour les personnalités : NOM PRENOM, FONCTION (si la personne est peu connue, ou peu médiatisée, pour la retrouver si on cherche le directeur d’une entreprise X) PAYS (dans le cas d’un voyage, comme pour le Président par exemple), PORTRAIT (quand c’en est un, et que la personne est fort médiatisée, pour permettre plus tard d’affiner une recherche sur uniquement les portraits de la personne, cela évite d’avoir comme pour Jospin, par exemple 1102 réponses).
-pour le sport : TYPE (football, basket…) NOM SPORTIF, PRENOM SPORTIF, EQUIPE, TYPE COMPETITION (mondial, jeux olympiques, tour de France…)
-pour les faits divers : TYPE (accident incendie, catastrophe naturelle), LIEU, CONSEQUENCES (dégâts…)
-pour la culture, l’histoire : LIEU EVENEMENT (exposition, concert), Bien entendu, ceci n’est qu’un modèle de base, malléable en fonction de chaque photo. On peut avoir par exemple : CHIRAC JACQUES BERNADETTE VOYAGE ETATS-UNIS COUPLE AEROPORT WASHINGTON.
Pour le choix des dossiers, je me réfère à la liste.”
Au cours de ma mission, avec M.Garitte, nous nous consultions, et discutions ensemble de la façon d’enrichir les photos. Chacun apportait ses idées, bonnes ou moins bonnes, et ceci permis au final d’avoir un enrichissement beaucoup plus rigoureux et précis. Cela est d’autant moins évident en l’absence d’un thésaurus.
En revanche, il existe un certain nombre de conditions à respecter pour l’enrichissement en fonction du logiciel DocCenter. Il faut veiller, entre autres, à ne pas mettre un double espace entre deux mots car le ou les mots qui suivent seront considérés comme inexistants, de mémo qu’un espace en début de ligne, le champs serait considéré comme vide, et donc la photo comme non indexée.
En outre les fautes de frappe sont à surveiller pour ne pas non plus oublier des espaces, mais également faire attention aux fautes d’orthographe.
Ce sont autant d’éléments qui font que la photo peut être perdue, il faut donc être très vigilant.
Enfin tous les mots ne peuvent pas être indexés, car il existe une série de termes appelés stop-words” qui ne sont pas pris en compte dans DocCenter, comme les articles, nous verrons d’ailleurs que ceci pose de nombreux problèmes.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières
REMERCIEMENTS 
INTRODUCTION 
1 / PRÉSENTATION DU STAGE 
1.1 Le Voix Du Nord et son histoire
1.2 Le Service Documentation et Archives de le Voix du Nord
1.3 La mission : l’enrichissement des photos numériques
1.4 L’indexation documentaire : la description par des mots-clés d’une photo
1.4.1 le signe photographique de presse
1.4.2 la description du tonds numérique de la VDN
2/ LA MISE EN PRATIQUE 
2.1 Méthodologie
2.1.1 la sphère de travail
2.1.2 le traditionnel
2.1.3 les nouvelles technologies
2.1.4 la méthode propre à la mission
2.1.5 la rédaction du rapport
2.2 L’enrichissement : l’indexation des photos numériques
2.2.1 l’association photo texte : pourquoi faut-il enrichir ?
2.2.2 l’absolue nécessité pour la Voix du Nord d’indexer ses photos
2.2.3 la méthodologie d’enrichissement du service documentation de la Voix du Nord
2.2.3.1 aspect global
2.2.3.2 le travail effectué
2.2.4 les difficultés
2.3 Les requêtes : la recherche des photos et des textes
2.3.1 les méthodes de recherche
2.3.2 les demandes et réponses apportées
2.3.3 les problèmes rencontrés
2.4 Les autres tâches réalisées
3/ EVALUATIONS DU STAGE
3.1 Complexité de Ia description d’une image Fixe
3.2 Retour sur la méthodologie
3.3 Le métier de documentaliste
CONCLUSION 
ANNEXE
BIBLIOGRAPHIE

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *