Dictionnaire électronique français-quechua des verbes pour le TAL

Les origines de la langue

   L’histoire de la langue quechua recouvre l’évolution de la langue et le processus historique de la société andine qui l’a influencée. Un proto-quechua est vraisemblablement né dans les zones tempérées des Andes péruviennes entre les populations qui habitaient les actuels départements d’Ayacucho Huancavelica et Apurimac : la langue quechua « apparaît comme une langue ayant pour origine les Andes et non pas la côte » (Adelaar 2012). La région d’Ayacucho était le centre de l’état Huari (Isbell 1988). D’après l’archéologie, deux civilisations importantes se sont développées pendant dans la deuxième moitié de notre ère dans les Andes péruviennes : celle de Huari et celle de Tiahuanaco. C. Itier nous dit : « l’empire Huari, dont la capitale se trouve dans les alentours de l’actuelle Ayacucho, au Pérou, s’étend de la région de Cuzco à celle de Cajamarca. C’est le plus vaste État d’Amérique du Sud avant l’empire inca. À 2800 m d’altitude, sa capitale, Huari, est une des plus grandes villes ayant existé dans le Pérou ancien. Dotée de fortifications de dix ou douze mètres de haut et d’un système d’égouts, ce dédale d’édifices à plusieurs étages, en pierre revêtue de stuc blanc, abritait une population estimée à environ 40 000 personnes. Les bâtisseurs de Huari entreprirent aussi la construction d’un grand réseau de routes empierrées, antécédent direct de celui des Incas, et de centres administratifs provinciaux, comme Piquillacta, près de Cuzco, Huillcahuain, dans la vallée du fleuve Santa, ou Viracochapampa, dans la province de Huamachuco ». Y aurait-il un rapport entre l’empire Huari (600-1000), la langue parlée par cette civilisation et le quechua ? Quelle langue y parlait-t-on ? La toponymie dans les alentours de Huari garde-t-elle des traces de cette langue ? Pour la première question, il semble que la langue était le proto-quechua ou bien une variante du quechua. D’après Adelaar, « Dans le cas du quechua I, on peut penser à une pénétration graduelle du Pérou central à partir de l’état Huari pendant la seconde moitié du premier millénaire, laquelle aurait eu comme résultat un continuum de dialectes variés dansles Andes péruviennes. Néanmoins, on pourrait accepter le point de vue alternatif d’un territoire au centre du Pérou dont la portion la plus au sud aurait été Huari, où on aurait parlé diverses variétés de quechua. Dans la première perspective, Huari serait le lieu de naissance du quechua comme un tout, et, dans la deuxième perspective, du quechua II seulement » (Adelaar 2012). L’état Huari, grâce à son organisation militaire et à sa politique expansionniste, aurait imposé sa langue aux populations linguistiquement diverses. Selon Heggarty, cet état aurait disposé de la puissance nécessaire pour initier un processus d’unification linguistique dans les territoires des Andes du sud. D’après Adelaar, même après l’effondrement de l’état Huari autour de l’an 1000 de notre ère, la force d’expansion de ce quechua se serait maintenue. « Dans cette perspective, les groupes quechuisants émergent de la tradition Huari, Par exemple, la fédération Chanka, aurait pu occuper des positions stratégiques parmi les populations majoritairement non quechuaphone, lesquelles furent linguistiquement assimilées. Un tel scénario peut expliquer le fait qu’à la fin du quinzième siècle, les gouverneurs Inca substituèrent le quechua à l’aymara comme langue d’administration » (Adelaar 2012). Ainsi, on peut penser que la langue de la civilisation Huari était bien une variante du quechua. Quelques siècles plus tard, c’est la civilisation Inca qui fleurit sur les Andes. Au début, les Incas parlaient l’aymara ou le puquina mais face à la diversité des langues existant sur les territoires qu’ils allaient occuper, ils ont été amenés à trouver une langue de communication qui puisse être comprise par les populations de ces territoires couvrant l’ancien territoire huari.

La famille linguistique quechua

   Au début du XVI siècle, plusieurs centaines de langues étaient parlées dans tout le territoire inca. Le quechua lui-même, présentait toute une famille de variantes dialectales, mais selon Fray Domingo de Santo Tomas12 on parlait dans le territoire Inca un quechua connu et compris par tout le monde, la « lengua general del inca » ( la langue générale de l’inca) , « es lengua que se comunicava y de que se usava y usa por todo el señorio » (c’est une langue qui permettait la communication et était en usage dans tout le territoire). D. Gonzales Holguin pour sa part, donne à son vocabulaire quechua-espagnol le titre évocateur de « Vocabulario de la Lengua General de todo el Perv llamada lengua Qquichua, o del Inca » (Vocabulaire de la langue générale de tout le Pérou appellée langue quechua, ou de l’Inca), en effet, selon les témoignages historiques, le quechua version « langue générale » était parlé et compris dans tout le territoire de l’empire inca. Concernant la classification de toutes les variantes quechua, la proposition de Torero (1974) qui fait consensus de les classifier en quechua I parle depuis la vallée du Mantaro jusqu’au sud de Cajamarca au Pérou. Dans le quechua II : Ayacucho-Chanka, Cuzco-Collao au Pérou, Santiago del Estero en Argentine (méridional) , Ambato, Imbabura dans l’actuel Équateur et Napo, Pastaza au Pérou (septentrional). Celle que nous étudions est la version II, variante Ayacucho-Chanka, parlée par environ un million de personnes.

État de l’art sur les dictionnaires français-quechua

   Il existe plusieurs dictionnaires papier quechua-français ou français-quechua. Parmi les plus anciens, nous avons le suivant : La « Grammaire et Dictionnaire français-kichua ». 1886. Onffroy de Thoron (Don Enrique). Il contient 4736 entrées. Il avance, sans apporter de preuves, quelques hypothèses fantaisistes comme : « le kichua passé d’Asie en Amérique à l’époque préhistorique des premières migrations du globe, dut avoir été parlé dans l’Atlantide au temps de son passage » ou que « la langue kichua était la langue primitive et qu’elle contenait la valeur historique de tous les noms de la Genèse » ou que « la langue kichua existe depuis plusieurs milliers d’années sur le continent américain » et concernant la variante quechua cuzquénien, il affirme « […] des doubles consonnes, cc, kc, qq, tt, ph, kh, appartenant à la prononciation de Cusco, nous regardons son école comme la moins bonne à suivre pour l’enseignement et la vulgarisation d’une langue fort agréable à entendre partout ailleurs que dans cette ville ». Il pense qu’il y a seulement « douze suffixes » sans préciser s’il parle des nominaux ou des verbaux. Quant au lexique, il répertorie des mots comme : acuy « méchant », karan « chef », pacomas « prisonnier », etc. inconnus dans le parler d’Ayacucho ou de Cuzco. Parmi les dictionnaires contemporains, un des plus complets et des mieux structurés est celui de César Itier (2011) « destiné aux francophones qui souhaitent apprendre le quechua ». Ses principales caractéristiques sont :
– de contenir plus de 3900 entrées et sous-entrées, et plus de 1000 exemples,
– de décrire la variété du quechua parlée dans le territoire compris entre le département de Huancavelica, couvrant Ayacucho, Cuzco jusqu’au département de La Paz en Bolivie,
– de faire suivre immédiatement les entrées ou les sous-entrées par des variantes phoniques attestées, signalées entre parenthèses, résultant du soigneux travail de terrain accompli par l’auteur. Il faut noter l’utilisation pour chaque entrée d’une abréviation qui indique le dialecte où elle apparaît ; ce sont : CHAN (pour la variante dialectale chanka comprenant le quechua d’Ayacucho), INCA (pour le quechua de Cuzco), et COLL (pour la variante près du lac Titicaca). L’abréviation UNIV, universel, indique que les trois variantes dialectales présentent la même forme. Les catégories grammaticales des entrées ne sont pas renseignées, or ce renseignement est important pour les applications en TAL. Pour pouoir de pouvoir nous en servir comme outil de base pour notre travail, nous lui avons d’abord donné un format de dictionnaire électronique (défini dans le chapitre 3) et nous l’avons ensuite analysé en appliquant plusieurs requêtes NooJ qui nous ont permis d’obtenir quelques renseignements statistiques sur son contenu. Il contient un total de 1107 verbes simples (voir Figure 3) :
• 195 sont communs à toutes les variantes quechua (UNIV)
• 43 appartiennent exclusivement à la variante (INCA)
• 650 appartiennent aux variantes (INCA) et (COL)
• 167 appartiennent exclusivement à la variante quechua CHAN (Ayacucho).

Sur la structure de LVF

   L’objectif principal de notre travail est de faire, l’équivalent pour le quechua, du dictionnaire Les verbes français LVF de Dubois et Dubois-Charlier. Pour cela, nous allons nous servir de la grammaire du quechua que nous avons formalisée au chapitre 2 et des fonctionnalités de NooJ applicables à notre projet. Pour mieux aborder cette tâche, nous devons connaître avec précision la structure du LVF, ainsi que ses caractéristiques principales. Nous allons d’abord présenter quelques points marquants du processus de formalisation appliqué à ce dictionnaire pour l’intégrer dans la plateforme NooJ. Par rapport aux autres dictionnaires existants, le dictionnaire LVF présente des caractéristiques nouvelles et importantes pour la formalisation des dictionnaires de verbes de la langue française :
a) il a l’ambition de décrire les verbes français de façon exhaustive ;
b) chaque entrée est accompagnée de ses propriétés morphologiques, syntaxiques et sémantiques ;
c) chaque entrée correspond à un verbe (un sens verbal) et à un seul.
Le dictionnaire LVF est considéré comme une bonne base permettant de construire un dictionnaire NooJ de référence des verbes français ; il a été élaboré pour être utilisé par des linguistes, mais, selon les critères formulés par Silberztein, il n’est pas directement utilisable par des programmes d’analyse automatique de textes. Les travaux de formalisation qu’il a réalisés à partir de 2010 ont permis de le rendre exploitable par le programme d’analyse automatique NooJ . Le LVF a son origine dans le «Dictionnaire électronique des verbes français » (DEV) réalisé par les mêmes auteurs J. Dubois et F. Dubois-Charlier sous le programme dBase. Ce dictionnaire, a été terminé en 1992. C’est Denis Le Pesant qui s’est chargé de le diffuser à partir de 2007 dans sa forme informatisée via MoDyCo. Le LVF est construit comme un fichier au format MS-EXCEL.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

REMERCIEMENTS
LISTE DES FIGURES
LISTE DES TABLEAUX
INTRODUCTION GENERALE
CHAPITRE 1  SUR LES DICTIONNAIRES QUECHUA
1.1. Les origines de la langue
1.2. Caractéristiques remarquables de la langue
1.3. Les dictionnaires anciens (avant le XVIII siècle) et les dictionnaires contemporains
1.4. L’orthographe officielle de la variante quechua Ayacucho-Chanka 
1.5. État de l’art sur les dictionnaires français-quechua
1.6. Les dictionnaires français-quechua et quechua-français sur l’Internet
CONCLUSION DU CHAPITRE 1
CHAPITRE 2 GRAMMAIRE FORMALISEE DU QUECHUA
2.1 Grammaire et dictionnaire électronique du quechua 
2.2. L’ordinateur et la formalisation de la langue quechua
2.3. Les noms
2.4. Les adjectifs
2.5. Les pronoms
2.6. Le verbe
2.7. Les structures modifiées du temps non marqué 
2.8. Les suffixes verbaux
CONCLUSION DU CHAPITRE 2
CHAPITRE 3 LA PLATE-FORME NOOJ ET LE QUECHUA
3.1. Formaliser la flexion avec NooJ
3.2. Formaliser la dérivation avec NooJ
3.3. Les dictionnaires électroniques NooJ du français
3.4. Les dictionnaires électroniques DELA 
3.5. La flexion dans le DELA
3.6. Application des ressources (dictionnaire + grammaire) à un corpus
3.7. Application à la traduction des ULAV
CONCLUSION DU CHAPITRE 3
CHAPITRE 4 LE DICTIONNAIRE BILINGUE DE VERBES FRANÇAIS-QUECHUA
4.1. Aperçu sur le Dictionnaire LVF de Dubois et Dubois-Charlier
CONCLUSION DU CHAPITRE 4
CHAPITRE 5 MISE EN ŒUVRE INFORMATIQUE DU DICTIONNAIRE QUECHUA AVEC L’ENVIRONNEMENT NOOJ
5.1. Formalisation des modalités d’énonciation des suffixes nominaux 
5.2. Les paradigmes un suffixaux de flexion des noms 
5.3. La flexion nominale bi suffixale
5.4. Le dictionnaire Nquechua.dic
5.5. Flexion un suffixale d’adjectifs
5.6. La conjugaison des verbes 
5.7. Dérivation de verbes : les nominalisateurs
5.8. Les paradigmes des structures modifiées du temps non marqué PRM
5.9. Sur les traits sémantiques induits par les suffixes verbaux interposés SIP
5.10. Le traitement matriciel des formes agglutinées de suffixes verbaux
CONCLUSION DU CHAPITRE 5
CONCLUSION GENERALE
BIBLIOGRAPHIE
ANNEXE A
LVF_QU : LE DICTIONNAIRE DE VERBES FRANÇAIS-QUECHUA
ANNEXE B
LA MAQUETTE DE TRADUCTION DE QUECHUA EN FRANÇAIS
ANNEXE C
DICTIONNAIRE ELECTRONIQUE DICO_HOLGUIN.DIC
ANNEXE D
PROGRAMMES VISUAL BASIC POUR LA GENERATION DE COMBINAISONS DES SUFFIXES SIP

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *