La gestion des données de recherche dans les sciences humaines et sociales

Généralités sur les données de recherche en SHS

A partir de la Déclaration de Berlin sur le Libre accès à la connaissance en sciences exactes, sciences de la vie, sciences humaines et sociales (2003), des nouvelles perspectives de définition des données de recherche se sont ouvertes. La déclaration sur l’open access incluait déjà les données scientifiques dans les résultats des recherches à rendre librement accessibles : « les contributions au libre accès se composent de résultats originaux de recherches scientifiques, de données brutes et de métadonnées, de documents sources, de représentations numériques de documents picturaux et graphiques, de documents scientifiques multimédia ». Point de départ nécessairement indéniable de tout processus de recherche, les données ont suscité un nouvel intérêt dans l’environnement numérique contemporain de l’open access et, ensuite, de l’open data. En 2007 l’Organisation de coopération et de développement économiques (OCDE) a défini les données de recherche « comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté́ scientifique comme nécessaires pour valider des résultats de recherche. […] Ces Principes et Lignes directrices portent essentiellement sur les données de la recherche sur support numérique exploitable sur ordinateur.

C’est en effet ce format qui offre le plus de possibilités d’améliorer la distribution efficiente des données et leur application pour la recherche, dans la mesure où les coûts marginaux de la transmission de données via l’internet sont pratiquement nuls. » (OCDE 2007, p. 18) Dans cette définition très large, point de référence pour toute institution scientifique, deux caractéristiques des données de recherche sont évidentes : l’hétérogénéité et le format numérique. Pour ce dernier, on fait l’éloge de son efficience et de ses bas coûts, mais il faut aussi considérer la dépendance des formats à la vitesse du progrès technologique, poussant rapidement à l’obsolescence des supports. En effet, il s’agit d’un aspect crucial dans la curation des données, surtout à long terme. Concernant l’aspect de l’hétérogénéité, en simplifiant par dichotomie, on peut identifier : des données qualitatives et quantitatives, primaires et secondaires, brutes et analysées, numériques et analogiques, structurées et non structurées (RDA Europe 2014, p. 11). D’autres classifications proposent la distinction à partir de la méthode de collecte entre des données d’observation, des données expérimentales obtenues en laboratoire et des données computationnelles issues des simulations de modèles informatiques (National Science Board 2005, p. 19).

Pour compléter le cadre taxonomique, Harvey classifie les données à propos des données, soit les métadonnées, en descriptives des objets numériques, structurelles indiquant les relations entre les données, techniques concernant le format, administratives et de préservation relatives à la gestion, aux droits et à la provenance des données (Harvey 2012, pp. 83-84). Si les classifications peuvent sembler simples, leur mise en pratique n’est pas aussi claire et nécessite un examen au cas par cas. Par exemple, « à partir de quel moment une donnée n’est-elle plus un simple enregistrement objectif du réel ? » (Gaillard 2014, p. 17), ou quand un document peut-il être considéré en tant que donnée ? Ou encore, quand une donnée devient-elle une donnée dérivée ? La situation se complique lorsqu’on traite des données textuelles, qualitatives, dynamiques et très peu structurées. La plupart des données produites dans les SHS sont de ces types.

Dans la définition du Conseil de recherches en sciences humaines (CRSH), en plus des ensembles quantitatifs des données sociales, politiques et économiques, on trouve des « renseignements qualitatifs sous forme numérique, des données de recherche expérimentale, des bases de données d’images et de sons fixes et mobiles, ainsi que d’autres objets numériques utilisés à des fins d’examen analytique » (Guindon 2013, p. 188). Face à cette complexité et hétérogénéité, la littérature se partage entre défenseurs des spécificités des données des SHS et partisans de positions plus généralistes, minimalisant les enjeux relatifs. Ainsi pour Jacobson, Larrousse et Massol (2014, p. 1) : « dans les sciences humaines et sociales, la typologie des informations numériques manipulées est assez vaste sans pour autant présenter de réelles particularités que l’on ne trouverait pas aussi dans d’autres champs disciplinaires. On trouvera donc comme ailleurs : de la production bureautique, de l’édition, de la correspondance, de l’image, de la modélisation, de la mesure, etc. » Au contraire, Henry (2014), Both et Garcia (2014), Chaudiron et l’équipe de l’Université de Lille (2015), Whitmire, Boock et Sutton de l’Université de l’Oregon (2015), Thelwall et Delgado (2015), ainsi que Davis-Kahl (2016), insistent sur les particularités des données des SHS qui impactent sensiblement leur gestion, curation et accessibilité : « Humanities data is some of the richest information available and provides some of the greatest challenges for digital curation. Unlike structured scientific data, humanities data consists of unstructured text, audio, moving images, and visual works that often are not as easy to manage online. » (Henry 2014, p. 370)

La GDR en Europe et en Suisse : un aperçu

En confirmation de l’intérêt stratégique pour le sujet, l’Union européenne a suivi l’exemple des Etats-Unis, où les National Institutes of Health (NIH) et la National Science Foundation (NSF) exigent depuis 2011 la soumission d’un plan de gestion des données (DMP) accompagnant les propositions de recherche. Entre 2014 et 2020, par le biais du programme Horizon 2020, le Conseil européen de la recherche (CER) vise à diffuser la même pratique, déjà introduite au Royaume-Uni par les principaux bailleurs de fonds publics. Dans le domaine des sciences humaines, la plate-forme Digital Research Infrastructure for Arts and Humanities (DARIAH), née en 2006, est devenue en 2014 un consortium au niveau européen (ERIC : European Research Infrastructure Consortium), promouvant le libre accès pour les matériaux de recherche (données et publications), encourageant le développement de l’archivage à long terme et proposant des bonnes pratiques de GDR (David et Larrousse 2014). Pour les sciences sociales, le correspondant est représenté par le Consortium of European Social Science Data Archive (CESSDA), actif depuis 1976 et très engagé dans la formation à la GDR (§ 3.2). L’infrastructure rappelle l’Inter-university Consortium for Political and Social Research (ICPRS), né au sein de l’Université du Michigan en 1962 en tant que Survey Data Archive et affirmé internationalement en tant que consortium spécialisé dans la gestion et curation des données issues des sciences sociales, comptant aujourd’hui plus de 700 institutions scientifiques dans le monde entier.

Sur le cadre européen se base la vision élaborée par DARIS, service de données et d’information sur la recherche rattaché à l’Institut FORS (centre de compétences de recherche en sciences sociales) situé à l’Université de Lausanne. Dans le document visant à changer les pratiques traditionnelles de recherche dans les sciences sociales, les chercheurs sont encouragés à déposer et à partager leurs données quantitatives et qualitatives dans FORSbase, base de données spécifique pour les SHS et librement accessible (FORS 2013). En 2014, le Manifesto to advance Data Access and Research Transparency (DART), rédigé par l’Institut lausannois (FORS 2014), prend nettement position en Suisse en faveur du libre accès aux données de recherche. Il définit les rôles et les enjeux de toutes les parties prenantes : chercheurs, bailleurs de fonds, archives, universités et éditeurs. Le but est alors d’accroître la visibilité, la transparence et la vérifiabilité de la recherche. Le manifeste, conjointement avec FORSbase et les workshops de sensibilisation organisés par l’Institut, constitue « un bon pas vers un meilleur contrôle des études scientifiques et vers un réseau optimal d’échanges des données » (ASSH 2015a, p. 12). En 2015, en tenant compte du cadre européen, le Fonds national suisse de la recherche scientifique (FNS) a explicité sa position en faveur de l’open access et de l’open data dans l’art. 47 du Règlement relatif à l’octroi de subsides : « les bénéficiaires de subsides s’engagent à ce que les résultats de recherche soutenus par des ressources du FNS soient rendus accessibles au public de manière appropriée ; dans ce contexte, ils mentionnent le soutien du FNS. Cela implique notamment : • qu’ils respectent les exigences du FNS visant à rendre accessibles au public les publications scientifiques, notamment les dispositions relatives au libre accès ; • qu’ils mettent à disposition d’autres chercheuses et chercheurs les données recueillies durant les travaux de recherche soutenus par le FNS et qu’ils les déposent dans des bases de données scientifiques reconnues, conformément aux prescriptions du FNS. »

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Déclaration
Remerciements
Résumé
Liste des tableaux
Liste des figures
Liste des abréviations
1. Introduction
1.1Cadre général
1.2Contexte du travail
1.3Objectifs et axes
1.4Structure et méthodologie
2. La gestion des données de recherche dans les sciences humaines et sociales
2.1Généralités sur les données de recherche en SHS
2.2La GDR en Europe et en Suisse : un aperçu
2.3Perspectives envisageables
3. Les formations à la gestion des données de recherche
3.1Formations et compétences au coeur de la GDR
3.2Des exemples pour les SHS
4. La GDR à l’Institut de plurilinguisme et au Centre scientifique de compétence sur le plurilinguisme de Fribourg
4.1Une petite identité institutionnelle complexe et hybride
4.1.1L’Institut de plurilinguisme (IDP)
4.1.2Le Centre scientifique de compétence sur le plurilinguisme (CSP)
4.1.3Le personnel scientifique de l’IDP et du CSP
4.1.4Le Centre de documentation du CSP
4.2Cartographie des projets et des données de recherche
4.3La mise en place de l’archive de données de recherche
4.3.1Enjeux stratégiques à partir de l’analyse environnementale et des
besoins des parties prenantes
4.3.2Evaluation des ressources et des solutions adoptées à la lumière de la
littérature
4.3.3La plate-forme SKCA et son architecture
4.4La gestion des données de recherche en coopération avec les chercheurs
4.4.1Les bonnes pratiques
4.4.2Le DMP
5. Proposition de formation en présentiel à la GDR
5.1Fondements de didactique pour transmettre l’expertise du Centre de
documentation
5.2Unités d’apprentissage pour professionnels de l’information
5.2.1Contextualisation au sein de l’Ecole d’automne
5.2.2Planification du cours
5.2.3Développement des activités didactiques
5.2.3.1Activités didactiques de la première unité d’apprentissage
5.2.3.2Activités didactiques de la deuxième unité d’apprentissage
5.2.3.3Activités didactiques de la troisième unité d’apprentissage
5.2.4Limites et recommandations pour le déroulement de la formation
6. Pistes pour le transfert de l’apprentissage sous format e-learning
6.1La capitalisation du savoir
6.2Une suggestion de e-learning pour les catalogueurs de données
6.3Pour aller plus loin : une valorisation globale de la GDR pour l’IDP et le CSP
7. Conclusion
Bibliographie
Annexe 1: Modèles de cycle de vie de la recherche en SHS et des données
Annexe 2: Modèles de curation et d’archivage des données
Annexe 3: Formations à la GDR dans les SHS
Annexe 4: Extrait de l’Ordonnance sur les langues
Annexe 5: Canevas pyramidal des formations à la GDR
Annexe 6: Programme du Module 5de l’Ecole d’automne en français
Annexe 7: DMP du CSP en français
Annexe 8: DMP du CSP en allemand
Annexe 9: DMP pour la NSF
Annexe 10: Didactisation d’un onglet de catalogage
Annexe 11: Fiche du projet 0002à cataloguer
Annexe 12: Questionnaire de satisfaction du module de formation
Annexe 13: Evaluation de logiciels de screencasting
Annexe 14: Grille d’entretien pour chercheurs de l’IDP/CSP

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *