Contextes et traduction assistée par ordinateur

Depuis l’utilisation massive du poste de travail informatique, la traduction assistée par ordinateur s’est développée sous forme d’un panel d’outils destinés à assister le traducteur dans son travail plutôt qu’à le remplacer. Différents outils se sont succédés dont les mémoires de traduction, les systèmes de traduction automatique, les logiciels d’extraction et de gestion terminologique, ainsi que les concordanciers multilingues. Les logiciels de mémoire de traduction s’appuient sur des documents initialement traduits qui constituent la base de ce qui sera plus tard connu sous le nom de corpus parallèles (Véronis 2000). L’objectif de ces logiciels est d’assister les traducteurs lors du processus de traduction en trouvant pour eux des passages préalablement traduits. Ils permettent également de recycler les traductions passées: lorsqu’un traducteur doit traduire une nouvelle phrase, le logiciel parcourt la mémoire à la recherche de phrases similaires préalablement traduites, et le cas échéant, propose la traduction passée comme modèle de traduction (Bowker et Barlow 2004).

Dans les années 90, les apports de la traduction assistée par ordinateur, de la traduction automatique et de ceux de la terminologie computationelle (Bourigault 1994, Daille 1994, Jacquemin 1995) se sont entrelacés en donnant naissance aux algorithmes d’alignement de termes à partir de corpus parallèles (Daille et al. 1994, Melamed 1999, Gaussier et al. 2000). Les sorties de ces algorithmes sont des listes terminologiques bilingues, particulièrement utiles dans le cas de la traduction en domaine de spécialité. Ces dernières années, la qualité de la traduction automatique s’est améliorée, c’est pourquoi les traducteurs automatiques semblent être largement utilisés en traduction professionnelle. Aujourd’hui, ces outils donnent des résultats exploitables dans les domaines de spécialité dans lesquels le vocabulaire et les structures sont assez répétitifs (Delpech 2013). Il se peut parfois que le traducteur ait une intuition de traduction qui n’apparaît pas parmi les sorties du traducteur automatique qu’il utilise. Dans ce cas, les logiciels de gestion terminologique, qui ont évolué vers les banques terminologiques multilingues telles que TERMIUM ou UNTERM, lui permettent de chercher cette traduction potentielle dans le corpus souhaité. Les concordanciers multilingues constituent également une aide précieuse au traducteur en lui donnant l’accès aux contextes d’un mot (ou d’un terme) et mettent en regard la traduction de ces contextes en langue cible. Le poste de travail du traducteur est à présent un environnement qui est devenu fortement informatisé et intégrant de nombreux logiciels comme Trados, Wordfast, DéjaVu pour en citer quelques uns. D’autres logiciels à destination du grand public sont aussi largement exploités par les professionnels. Les plus populaires étant Linguee pour les concordanciers bilingues, et celui de Google : Google Translate pour les systèmes de traduction automatique. Franz Och, chercheur chez Google Translate, estime que l’équivalent du contenu d’un million de livres est traduit chaque jour en ligne sur ce site. Même si l’utilisation de ces services en ligne n’est pas recommandée dans un cadre professionnel, ces systèmes viennent répondre à un besoin toujours croissant de compréhension d’informations en langues étrangères. Cependant, les limites de ces outils sont rapidement atteintes dès qu’il s’agit d’une traduction très spécialisée. Par exemple, pour traduire de l’anglais en français le terme blob provenant du domaine de la vulcanologie, GoogleTranslate propose goutte, tache et pâté (figure 2.1) avec deux définitions suivies de deux exemples que l’on peut juger « peu utiles» dans ce cas. Concernant Linguee, il propose également pâté, goutte et blob, mais avec plus de contextes qui ne contiennent pas la traduction correcte : projection (figure 2.2).

Si l’on envisage le processus de traduction lui-même comme « une enquête non linéaire » tel que décrit par Rochard (1999), le traducteur n’est pas un simple «passeur » d’une langue à l’autre, il doit pêle-mêle mettre en évidence les éléments logiques du texte original, comprendre la signification de l’énoncé en texte source, le déverbaliser, se référer à des informations textuelles (du monde réel), choisir une formulation adéquate en langue cible ayant le même niveau de performance fonctionnelle que celle du texte source. L’objectif de cette thèse se focalise sur ce type d’information « contextuelle » qui pourrait alléger et améliorer la qualité du travail du traducteur, particulièrement en domaine de spécialité.

Notion de contexte pour les traducteurs

De nombreux travaux se sont penchés sur l’étude du comportement des traducteurs afin d’améliorer l’enseignement de la traductologie ou le fonctionnement des outils d’aide à la traduction (Varantola 1998, Künzli 2001, Bowker 2008, Désilets et al. 2009). Dans ce type d’études, l’un des objectifs est d’identifier les extraits de ressources qui focalisent l’attention des traducteurs. Il s’agit de passages de textes particulièrement utiles au sens où ils jouent un rôle positif dans l’exercice de traduction. Par conséquent, lorsque l’on souhaite fournir aux traducteurs des outils qui répondent mieux à leurs besoins, on devrait en premier lieu se demander ce qui rend un contexte pertinent pour eux. En d’autres termes, ce qui pourrait être un « bon contexte » pour les traducteurs. Selon Rogers et Ahmad (1998, p. 195), l’un des premiers besoins du traducteur est l’information sensible au contexte (en anglais context-sensitive information). Nous nous intéressons alors à ce que cette notion d’information sensible au contexte pourrait englober et aux sources d’informations qui ont du succès auprès des traducteurs. Bien qu’elle soit largement reconnue comme étant essentielle pour le traducteur, la notion de contexte, en traduction, reste difficile à définir (Baker 2006), et manque de définition pratique qui pourrait être appliquée dans le travail quotidien des traducteurs professionnels (Melby et al. 2010, p. 1). Melby et al. (2010) ont finement détaillé comment des spécialistes dans de nombreux domaines (philosophie, psychologie, pragmatique et linguistique fonctionnelle) ont traité la notion de contexte pour aboutir à diverses propositions de définitions. Les trois facettes du contexte telles que définies par Halliday (1999), à savoir le contexte de la situation, le contexte de la culture et le co-texte, sont particulièrement pertinentes dans la traduction. Contrairement au contexte de la situation et celui de la culture, qui sont en dehors du langage lui-même , le co-texte se rapporte spécifiquement à la langue utilisée. Il peut largement être défini comme le discours environnant (ou aux alentours) d’un énoncé donné. Par conséquent, notre définition de « contexte » dans le présent travail sera limitée à ce que Halliday appelle co-texte, et se fondera sur la définition donnée par Fuchs :

« On appelle ‘contexte’ l’entourage linguistique d’un élément (unité phonique, mot ou séquence de mots) au sein de l’énoncé où il apparaît, c’est-à-dire la série des unités qui le précèdent et qui le suivent : ainsi, dans l’énoncé ‘Marie est jolie comme un cœur’, l’élément ‘comme’ a pour contexte immédiat ‘jolie… un cœur’ et pour contexte plus large l’environnement ‘Marie est jolie… un cœur’. Par extension, on parle également du contexte d’un énoncé au sein d’un discours pour désigner le ou les énoncés qui précèdent et suivent immédiatement l’énoncé considéré. »

Contextes utiles aux traducteurs

Roberts et Bossé-Andrieu (2006, p. 203) soulignent que les traducteurs font face à des problèmes qui peuvent être principalement liés aux textes sources, notamment au niveau de la compréhension du texte à traduire ; ou aux textes cibles pendant la transition vers la langue cible. L’auteur a regroupé ces problèmes en trois principales catégories : encyclopédique, linguistique et textuelle. Les problèmes encyclopédiques couvrent les problèmes liés aux sujets généraux ainsi que des problèmes plus spécifiques portant sur des noms propres n’étant pas familiarisés avec le « sujet » du texte. Les problèmes linguistiques sont associés à des mots ou des phrases spécifiques. Enfin, les problèmes textuels concernent les types de textes tels que l’organisation interne et la production d’un type particulier de texte. Bowker (2011; 2012) établit une liste des éléments portant sur les informations contextuelles qui peuvent se révéler « utiles » pour le traducteur dans la résolution des problèmes liés aux textes sources et cibles. JosselinLeray et al. (2014) ont résumé ces éléments comme suit :
a) des informations sur l’usage incluant, bien entendu, les collocations, en particulier les mots de langue générale qui co-occurrent avec des termes (Roberts 1994, p. 56);
b) des informations sur la fréquence d’utilisation d’un mot ou d’un terme particulier ;
c) des informations sur les relations lexicales et conceptuelles comme la synonymie, méronymie, hyperonymie, etc. (Marshman et al. 2012, Rogers et Ahmad 1998) ;
d) des informations pragmatiques sur le style et le genre (Varantola 1998) ;
e) des informations sur les usages à éviter.

Il nous semble alors que ces éléments, qui ne sont liés ni à la situation ni à la culture, peuvent être classés dans les catégories suivantes : conceptuelles (c) et linguistiques (a, b, d et e). Afin de résoudre les problèmes et de prendre des décisions, les traducteurs ont besoin d’aide, obtenue généralement en sollicitant d’autres experts ou en consultant des ressources plus conventionnelles telles que les dictionnaires et les banques terminologiques (Rogers et Ahmad 1998, p. 198) .

Accès aux ressources en traduction

Nous présentons dans cette section les ressources conventionnelles utilisées en traduction et nous discutons l’utilité des connaissances qu’elles procurent par rapport au besoin du traducteur.

Ressources en traduction

En complément des dictionnaires monolingues et bilingues ainsi que les banques terminologiques, les traducteurs s’appuient partiellement sur les informations provenant de corpus. Nous détaillons ci-après ces ressources.

— Les dictionnaires : c’est le plus souvent à travers les exemples que les dictionnaires fournissent des informations contextuelles. L’étude empirique réalisée par Josselin-Leray (2005) sur les termes en dictionnaires généraux (monolingues et bilingues) montre que plus de 80,3 % des utilisateurs ont recours aux dictionnaires afin de trouver des informations concernant l’usage des termes dans des phrases, et que les dictionnaires bilingues ont plus de succès. La majorité des personnes interrogées ayant choisi cette réponse, sont des « professionnels de la langue » comprenant également des traducteurs. Roberts (1994, p. 56) a mené une enquête auprès des utilisateurs potentiels du Dictionnaire Canadien Bilingue afin d’identifier leurs besoins. En conclusion, entre un tiers et la moitié des membres chaque groupe d’utilisateurs ont apprécié, à différents degrés, le nombre d’exemples présentés dans leurs dictionnaires habituels. Cependant entre un quart et la moitié de chaque groupe a estimé qu’une amélioration était nécessaire. L’étude réalisée par JosselinLeray (2005) a abouti à la même conclusion : bien que les utilisateurs aient été globalement satisfaits par les exemples fournis par leurs dictionnaires (entre 41,3 % et 67,5 % des utilisateurs ont déclaré qu’ils étaient satisfaits), le niveau de satisfaction était plus faible pour les dictionnaires bilingues, et encore plus faible pour le groupe d’utilisateurs « professionnels de la langue ».
— Les banques terminologiques : elles fournissent des informations contextuelles inscrites dans le champ « contexte » de la fiche terminologique. L’importance associée par les traducteurs à l’information contextuelle, notamment en ressources terminologiques, a été confirmée par les résultats de l’enquête menée par Duran Muñoz (2010) : les exemples étaient considérés comme des « données essentielles» par les personnes interrogées, parmi les « données désirables ».

Dans le sondage réalisé par Duran-Muñoz (2010), les traducteurs ont eu l’occasion de donner leur avis au sujet de leurs besoins en traduction. Le second 5 argument le plus fréquent a été d’« inclure des informations plus pragmatiques sur l’usage et sur les traductions difficiles », et le cinquième de « fournir des exemples tirés de textes réels ». Dans la conclusion de ses travaux, Munoz (2012, p. 82) confirme clairement que la plupart des ressources terminologiques actuellement disponibles (en particulier sous forme électronique) ne satisfont pas les exigences des traducteurs.
— Les corpus : bien que les corpus soient intrinsèquement construits d’informations contextuelles, ce sont des ressources qui semblent encore rarement utilisées par les traducteurs, comme le montre les résultats de l’étude Duran-Muñoz (2010) : seulement 5,09 % des participants ont cité les corpus (parallèles en particulier) comme étant une ressource terminologique qu’ils utilisent plus de 4 fois lors de la traduction. Cependant, 41,8 % des personnes interrogées à la Mellange Survey , réalisée en 2005-2006 avec des traducteurs stagiaires et professionnels, prétendent utiliser les corpus dans leur pratique de traduction, notamment les corpus en langue cible.

Bien qu’il semble y avoir un large éventail de ressources fournissant de l’information contextuelle, ces ressources ne répondent pas nécessairement aux besoins des traducteurs.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction
1.1 Contexte général
1.2 Motivations et objectifs
1.3 Plan de la thèse
I Terminologie et état de l’art
2 Contextes et traduction assistée par ordinateur
2.1 Introduction
2.2 Notion de contexte pour les traducteurs
2.3 Contextes utiles aux traducteurs
2.4 Accès aux ressources en traduction
2.4.1 Ressources en traduction
2.4.2 Terme hors contexte vs. terme avec contexte
2.5 Outil « idéal » en traduction
2.6 Conclusion
3 Indices et marqueurs de connaissances
3.1 Introduction
3.2 Contextes riches en connaissances
3.3 Marqueurs de relations
3.4 Patrons de connaissances
3.5 CRC et définitions
3.5.1 Types de définitions
3.5.2 Typologies des définitions
3.6 Collocations et connaissances linguistiques
3.6.1 Collocations
3.6.2 Propriétés des collocations
3.7 Conclusion
4 Méthodes d’identification automatique de CRC
4.1 Introduction
4.2 Approches à base de patrons de connaissances
4.3 Approches supervisées
4.4 Approches semi-supervisées
4.5 Extraction automatique des collocations
4.5.1 Systèmes d’extraction automatique des collocations
4.5.2 Mesures d’extraction de collocations
4.5.3 Problèmes de collocations
4.6 Conclusion
II CRC monolingues
5 Extraction unifiée de CRC
5.1 Introduction
5.2 Compréhension en traduction spécialisée
5.3 Contexte
5.4 Travaux connexes
5.5 Patrons de Connaissances pour connaissances conceptuelles
5.5.1 Relations examinées
5.5.2 Stabilité des PC
5.5.3 Méthode
5.6 Collocations pour connaissances linguistiques
5.6.1 Méthode
5.6.2 Discussion
5.7 Conclusion
6 Évaluation
6.1 Introduction
6.2 Ressources
6.2.1 Corpus comparables
6.2.2 Marqueurs de relations
6.2.3 Liste terminologique d’évaluation
6.3 Évaluation manuelle des connaissances conceptuelles
6.3.1 Fiabilité des PC
6.3.2 Validation manuelle des CRCC
6.3.3 Résultats de validation de CRCC
6.3.4 Problèmes rencontrés et solutions
6.4 Évaluation manuelle des connaissances linguistiques
6.4.1 Consignes aux annotateurs
6.4.2 Validation manuelle des CRCL
6.4.3 Résultats des collocations
6.5 Synthèse : stratégie unifiée
6.6 Évaluation expérimentale en traduction
6.6.1 Données expérimentales
6.6.2 Expérimentations préalables
6.6.3 Expérimentations finales
6.7 Conclusion
III CRC bilingues
7 Extraction de CRC bilingues
7.1 Introduction
7.2 Révision en domaine de spécialité
7.3 Concordanciers bilingues
7.3.1 Intérêt des concordanciers bilingues
7.3.2 Exemple de concordanciers
7.3.3 Fonctionnement de concordanciers bilingues
7.3.4 Limites des concordanciers bilingues
7.4 Concordanciers bilingues en révision
7.4.1 Utilisation des concordanciers bilingues en révision
7.4.2 Objectifs en révision bilingue
7.5 Alignement de collocations
7.5.1 Exploitation interlingue des collocations
7.5.2 Collocations et traduction littérale
7.5.3 Alignement des collocatifs
7.5.4 Synthèse
7.6 Alignement de CRC
7.6.1 Filtrage monolingue des contextes
7.6.2 Alignement des contextes
7.7 Conclusion
8 Évaluation
8.1 Introduction
8.2 Évaluation manuelle
8.2.1 Dictionnaire bilingue
8.2.2 Liste terminologique d’évaluation
8.2.3 Protocole d’évaluation et consignes d’annotation
8.2.4 Résultats
8.2.5 Difficultés rencontrées
8.3 Évaluation expérimentale en révision
8.3.1 Données expérimentales
8.3.2 Protocole d’expérimentation
8.3.3 Résultats
8.4 Conclusion
9 Conclusion générale