Analyse par synthèse des contours intonatifs de l’anglais britannique

Télécharger le fichier pdf d’un mémoire de fin d’études

Résultats des différents travaux de recherche

Les différents auteurs se sont d’abord attachés à localiser les maxima de F0 dans le temps par rapport aux segments. Ces maxima locaux ont été étudiés en position nucléaire et non nucléaire. On s’est aussi penché sur des accents mélodiques particuliers comme la chute, la montée pour localiser et tenter de mettre à jour des régularités dans leur formation. Nous pouvons donc commencer par passer en revue les différents travaux portant sur l’alignement de H*.

Alignement de H* en position nucléaire

En ce qui concerne la langue espagnole, Pilar Prieto, Jan van Santen et Julia Hirschberg ont mené un projet commun en 1994. Il s’agissait de l’étude d’un corpus oral de 810 énoncés déclaratifs lus par deux locuteurs parlant l’espagnol mexicain. Les phrases contenaient toutes neuf syllabes-cibles associées à un sommet mélodique haut (H*) et placées dans différents contextes prosodiques (à la fin d’un syntagme intonatif), et l’on changeait systématiquement la position de la syllabe dans le mot et la distance en syllabes qui sépare les syllabes accentuées des syllabes inaccentuées. Les données ont montré qu’il était important de prendre en compte les variations de durée intra syllabique, les facteurs prosodiques, la nature des frontières et les « clash » accentuels c’est-à-dire les configurations où l’on trouve plusieurs syllabes accentuées dans un environnement proche ou plus précisément quand la syllabe nucléaire est suivie d’autres syllabes accentuées.
Les mesures extraites des expériences menées furent les suivantes : La durée des segments comprenant la syllabe accentuée et les syllabes inaccentuées qui la suivent ; La valeur maximale de F0 dans l’accent mélodique cible ; La distance mesurée en unité de temps entre le maximum de F0 et l’attaque de la syllabe accentuée (pour évaluer les délais possibles) ; La valeur minimale de F0 au début de la montée ; La distance en unité de temps entre le début de la montée de F0 et l’attaque de la syllabe accentuée ; Est-ce que la syllabe accentuée suivant la cible accentuelle étudiée portait aussi un accent mélodique ?
À la lumière des résultats des tests sur l’effet de la durée de la syllabe accentuée, il apparaît que l’allongement de l’attaque et de la voyelle provoque un déplacement du ton H* qui se décale vers la droite. Ainsi le début de la rime semble être un point de référence pertinent pour l’alignement des éléments de F0.
De plus, de façon générale, la proximité d’une frontière de groupe intonatif majeur implique plus d’effet de rétraction vers la gauche de H* que celle d’une frontière mineure ou intermédiaire. De même les sommets de F0 ont tendance à se rétracter vers la gauche alors que leurs syllabes associées se rapprochent de la fin du mot.
En 1995, T.Rietveld et C.Gussenhoven publient les résultats de leurs recherches portant sur l’alignement des cibles de F0 dans la synthèse de la parole et les effets de la structure syllabique. Ils travaillent sur le contour « flat hat » (LH*L) en néerlandais, qui peut avoir une chute finale avancée ou tardive. Ils pensent que c’est la variation de la structure de la syllabe accentuée qui en est le principal moteur. Ils étudient plus précisément l’influence des segments sur l’alignement de H*. Les segments voisés dans l’attaque de la syllabe et dans la coda semblent décaler la cible H* tantôt vers la gauche, tantôt vers la droite alors que les segments non voisés dans l’attaque exercent une attraction vers la gauche. Leur originalité vient de l’utilisation d’un facteur non mentionné jusqu’ici nommé le « centre-p » ou « p-centre ». Ce facteur fait référence à la perception des phénomènes d’alignement. Le centre p est le point d’ancrage que l’on décèle intuitivement pour un accent mélodique. L’étude des données montre que ce centre est sensible aux variations ayant lieu au niveau de l’attaque et de la coda. Ainsi une attaque voisée correspond à un centre p tardif alors qu’une attaque plus longue tend à provoquer l’avancement du centre p.
Cependant les derniers résultats diminuent la pertinence de ce point d’ancrage. D’après les auteurs de cette recherche l’alignement de H* varie plutôt en fonction de la longueur de l’attaque et de la présence ou absence dans l’attaque et la coda de consonnes voisées ou non voisées.

Alignement de H* : H* en position prénucléaire

Une des premières recherches sur le sujet est l’oeuvre de Silverman et Pierrehumbert (1990). Le schéma étudié est le suivant : H* HL. Deux adultes de sexe masculin ont enregistré le corpus composé de noms du type : « Ma Lemm, Mom le Mann, Mamalie, Mamalie Lemonick et Mama Lemonick ». Ces noms ne contiennent que des consonnes voisées sonores pour minimiser les perturbations segmentales à un niveau micro-prosodique de F0.
En résumé des résultats obtenus, on peut avancer que : à la fois la vitesse de production de la parole et le contexte droit influencent le placement de H* mais de façon qualitativement différente. Quand une syllabe est allongée du fait que l’on parle plus doucement, H* apparaît plus tard aussi. En revanche, quand cela est dû au contexte prosodique droit, la dernière partie de la syllabe subit un allongement nettement plus conséquent et H* apparaît plus tôt dans la rime syllabique. En ce qui concerne la distinction généralement admise entre les accents nucléaires et prénucléaires, on affirme ici que la distinction n’a pas lieu d’être. Tout comme dans les accents nucléaires, H* est aligné proportionnellement à la durée de la syllabe associée plutôt qu’à une distance fixe dans la voyelle. Dans les deux positions, le débit de parole et le contexte droit exercent différents effets. Dans les deux cas, H* est aligné plus tard quand le nombre de syllabes suivant la syllabe portant l’accent augmente.
Dans les travaux de House et Wichmann (1996), la distinction entre les deux types d’accents est aussi mentionnée. Leur étude s’appuie sur l’analyse d’extrait du journal de la BBC appartenant au corpus SEC (Spoken English Corpus). Le début du schéma intonatif ou IO (intonational onset) correspondait à la première syllabe accentuée de chaque groupe intonatif tels qu’ils étaient notés dans la transcription du corpus. Pour chaque IO la location de H* dans le temps a été calculée comme un pourcentage de la durée totale de la syllabe accentuée. Dans quelques cas le maximum de F0 associé à la syllabe accentuée se situait plus tard dans le pied donnant alors des valeurs supérieures à 100%. Tous les facteurs autres que le tempo, identifiés pour leur effet de rétraction ou avancement du sommet furent pris en compte. Les facteurs définis par leur tendance à rétracter le sommet vers la gauche étaient les suivants : Une voyelle brève ; Le nombre de consonnes constituant l’attaque de la syllable ; La présence d’un segment voisé dans l’attaque ; La présence de deux accents consécutifs ; Les frontières du mot précédent ; Les frontières intonatives précédentes.
Les facteurs reconnus pour pousser le sommet vers la droite étaient : Une longue voyelle ou une diphtongue ; Une coda de la syllabe sonore ; Un pied polysyllabique.
Au niveau segmental, tous les facteurs attirant le sommet vers la gauche ont confirmé leur effet dans l’expérience. Ensuite la structure du discours et du développement du thème ou « topic » ont montré des effets comparables en exerçant une poussée vers la gauche au point que le sommet pouvait apparaître à l’extérieur des limites de la syllabe accentuée elle-même.
En ce qui concerne la distinction établie entre l’alignement des accents nucléaires et celui des accents non nucléaires, les auteurs de ces travaux proposent une autre interprétation. Il a été dit que le ton H* est aligné plus tard dans la syllabe accentuée quand il s’agit d’un accent non nucléaire et serait avancé dans le cas où il se trouverait en position finale. On suppose ici que les différences d’alignement qui ont été expliquées par la distinction entre les contours nucléaires et non nucléaires pourraient plus probablement s’expliquer par les effets de la position initiale et de la position finale (« initiality vs finality »).
Enfin les chercheurs ne se sont pas contentés d’étudier l’alignement du maximum de F0, mais se sont aussi intéressés aux contours intégralement décrits par F0, ce qui a permis notamment de révéler des points fixes d’ancrage en ce qui concerne l’alignement du minimum L* dans les montées.

Alignement des contours mélodiques complets

Bruce (1990) souligne l’importance d’aller plus loin dans la recherche sur l’alignement en s’intéressant aussi au chronométrage du mouvement mélodique en entier. En étudiant les deux types d’accents suédois : accent I = (H)L* et accent II = H*L, Bruce a constaté que c’était bel et bien la différence d’alignement des maxima et minima de F0 dans ces accents qui différenciait les deux sortes d’accents. Toutefois il ajoute que quand les contours de F0 pour l’accent H*LH sont étudiés dans différents environnements sans aucune référence segmentale autre que le début de la syllabe accentuée, le mouvement H*LH a un alignement stable. Alors que le ton H* a un alignement plus tardif dans les contextes droits plus longs, le mouvement H*LH est étonnamment constant dans son alignement.
Prieto et al. (1995) se sont aussi penchés sur la question dans leur recherche sur l’alignement en espagnol. Ils voulaient observer le comportement du mouvement en entier lorsqu’on le soumettait à des variations prosodiques contextuelles, quand le sommet H* se rétractait. On observe ici un effet de déclin du mouvement mélodique épousant la diminution du maximum de F0 lorsque l’on passe d’une position initiale à une position médiane puis une position finale. En revanche les valeurs minimales L semblent bien ancrées au niveau de l’attaque de la syllabe, ces valeurs semblent aussi diminuer plus on s’approche de la fin de l’énoncé. Le minimum de F0 de L* dans une montée est localisé précisément au niveau de l’attaque de la syllabe, ou quelques millièmes de secondes après. On ajoute aussi que la pente décrite dans une montée dépend du déplacement vers la droite du maximum de F0.
Enfin, des travaux de recherche sur l’alignement en néerlandais et en anglais ont été entrepris et les résultats en ont été publiés le 28 novembre 2003. Ceux-ci correspondent à l’aboutissement d’un projet de recherche nommé « target alignment project » financé par l’ESRC. Il s’agissait alors d’étudier en néerlandais et en anglais l’alignement des contours montants-descendants, les chutes ainsi que les montées. Le corpus était en partie constitué de textes lus et préparés puis de dialogues orientés (« The […] Map Task », Anderson et al., 1991). Dans les accents montant-descendant, la cible minimale s’alignait avec l’attaque de la syllabe accentuée. De même, en néerlandais, L* se trouve être sensible à la location des frontières des mots. En néerlandais, on a découvert que si toutes les syllabes suivant la syllabe nucléaire étaient réduites, alors la montée finale dans les schémas H*LH commençait au début de la dernière syllabe. En revanche, si une syllabe forte apparaît après la syllabe nucléaire, le début de la montée s’aligne avec l’attaque de cette syllabe : tôt dans la syllabe s’il n’y a plus d’autres syllabes et plus tard si cette syllabe est suivie d’une autre syllabe accentuée.
Ainsi on a vu au travers de ces travaux que les facteurs définis par G. Bruce influençaient bien l’alignement des maxima et des minima de F0. L’alignement du maximum H* ne semble pas être ancré de manière régulière en un point fixe du pied métrique, bien qu’il soit attiré par la tête du pied. Sa localisation varie selon le contexte prosodique droit et gauche ainsi que selon les facteurs micro-prosodiques. En revanche plusieurs chercheurs s’accordent à dire que le minimum L* de F0 précédant une montée a un point d’ancrage invariant qui est l’attaque de la syllabe accentuée et ceci dans plusieurs langues dont l’espagnol et l’anglais. De plus G. Bruce constate qu’en suédois, alors que le ton H* est inconstant, le mouvement mélodique intégral H*LH est aligné de façon stable, ce qui laisse penser qu’il est pertinent d’étudier l’alignement d’un schéma mélodique dans son ensemble et pas seulement comme une suite d’éléments discrets indépendants les uns des autres.
Les résultats de nos propres travaux expérimentaux sur l’alignement des contours creusés ou descendants-montants en anglais britannique (cf. Ali, 2004) offrent aussi quelques points de repère.
Deux hypothèses d’alignement sont mises à l’épreuve dans l’analyse statistique : la première postulant que la cible tonale étudiée est localisée à une distance fixe d’une unité « point de repère », la seconde postulant au contraire que la cible tonale étudiée s’aligne proportionnellement à la durée d’une unité segmentale. Les résultats sont les suivants.
D’une part les cibles tonales H1 (début de la chute) et H2 (fin de la montée finale) s’alignent de la même façon. Chacune de ces cibles peut être localisée par rapport à un point d’ancrage semblant fixe : l’attaque de la rime pour le pic mélodique H1 et la fin du groupe accentuel pour H2.
D’autre part, L1 et L2 représentant la fin de la chute et l’attaque de la montée montrent un comportement différent. L1 s’aligne en fonction de H1 auquel il est très fortement lié. L2 est d’une part très lié au maximum final qui explique la plupart de ses variations, et d’un autre côté, son alignement varie en fonction de la durée du groupe accentuel. Il est ainsi plus évident de prédire l’alignement du contour en entier que de se concentrer sur les différents points cibles ce qui rejoint les résultats de Bruce (1990) mentionnés plus haut.

Perception de l’alignement des cibles

D’Imperio (2002a) propose une alternative à l’analyse strictement acoustique de l’alignement. Cette analyse stipule que les cibles tonales sont des constructions issues de la perception, qui sont dépendantes des contraintes psycho-acoustiques et des contraintes spécifiques à la langue étudiée.
D’après les résultats des expériences menées dans cette recherche, il apparaît que, dans certains cas, la position des cibles tonales est difficile à déceler (cf. le cas des plateaux). Parfois, ce sont les perturbations occasionnées par les consonnes non voisées par exemple qui masquent la cible. Dans ces cas-là, l’étude de l’interaction entre les contraintes psycho-acoustiques et la perception peut être pertinente. Les expériences menées sur des configurations complexes de F0 comme les chutes, les montées, ont montré que les mouvements n’étaient pas perçus dans leur intégralité et que la cible de F0 perçue correspondait à la valeur de F0 aux deux tiers de la montée ou de la chute. De plus, quand un mouvement mélodique est précédé ou suivi d’un plateau, la valeur de F0 détectée est celle du plateau. La recherche sur l’alignement tonal du point de vue de la perception pourrait aussi aider à mieux comprendre la production.
D’après ses travaux portant sur l’italien napolitain, D’Imperio affirme que la structure de la syllabe conditionne la perception des cibles mélodiques. L’étude porte sur l’alignement des cibles avec les syllabes ouvertes et fermées. Les résultats confortent l’hypothèse de l’existence d’un point d’ancrage fixe au niveau de la frontière gauche de la syllabe. La seconde variable mise en jeu est la distinction entre les énoncés interrogatifs et les énoncés affirmatifs. L’hypothèse testée était la suivante : les différences de structure syllabique dans les deux cas ne provoqueraient pas de déplacement des cibles vers d’autres frontières. Cette hypothèse fut en effet vérifiée. Cela permet de supposer que l’élément perceptif est déjà influent au niveau de la production de F0. De plus il y a un fossé entre les résultats trouvés pour l’italien et ceux correspondant à d’autres langues telle que le néerlandais. Par exemple en néerlandais, la présence de segments voisés dans la coda et dans l’attaque modifie la perception des points cibles dans le schéma montant-descendant (en chapeau). Cela confirme l’importance de la spécificité de chaque langue.
Ainsi, on constate que l’alignement de F0 répond non seulement à des contraintes liées à l’articulation et la production mais aussi à des contraintes d’ordre perceptif et dépendantes de la langue sur laquelle on travaille.

Un système de transcription intégrée

D’après Faure, aucun système de transcription ne peut fournir une représentation rigoureuse « des durées, intensités et hauteurs manifestées par une voix donnée au cours d‟un énoncé quelconque » (p.171).
Faure veut donc développer une transcription de type phonologique qui ne décrira pas les variations ou variantes d’un même contour qui ne seraient pas distinctives : « Les oppositions significatives, qu‟elles soient démarcatives, accentuelles ou distinctives, sur l‟un quelconque des trois plans du signifié psychologique, retenant seules notre attention. » Faure (1962, p. 171).
La spécificité de ce système de transcription vient du fait qu’il s’intègre au texte si bien que toutes les informations nécessaires à la compréhension sont présentes : « La transcription s‟intègre au texte imprimé, afin que ce dernier constitue pour l‟oeil, comme pour l‟oreille et pour la pensée, une unité cohérente, solidement structurée, dans laquelle sont étroitement intégrés à la fois les éléments phonématiques et des éléments musicaux. » Faure (1962, p.172).
L’annotation des contours mélodiques principaux est associée aux syllabes accentuées comme dans les têtards. Les signes diacritiques sont tout simplement introduits dans le texte imprimé, au niveau du début de chaque syllabe accentuée : « He can dis \solve the _parliament. »
De plus, le système de Faure présente des enrichissements considérables au niveau de la représentation des variations de registre. Il distingue cinq niveaux de registre significatifs :
1. Le niveau suraigu pour annoter un ton statique (« ¯When ») et le point de départ ou le point d’arrivée d’un contour mélodique : « \ When (descendant) » ou « /When (montant) » .
2. Le registre aigu noté par un trait horizontal ou un point de départ ou d’arrivée de mouvement mélodique au niveau du sommet des majuscules : « -—When » .
3. Le registre médium noté par un trait horizontal ou un point de départ ou d’arrivée au niveau des minuscules : « –When » .
4. Le registre grave noté par un trait horizontal ou un point de départ ou d’arrivée de mouvement mélodique sur la ligne de l’écriture : « When » .
5. Le registre infra-grave noté en dessous de la ligne d’écriture : « When ».
Les quatre premiers niveaux correspondent aux niveaux définis pas Pike, mais la figuration est plus parlante que les chiffres. Le cinquième niveau est associé à la fonction accentuelle et est très répandu en anglais britannique d’après Faure. Le fait de produire ce ton qui se situe nettement au-dessous du grave normal pour une voix donnée, exige un effort important qui lui confère une valeur nettement accentuelle. On peut l’illustrer dans l’exemple suivant : « -Did you _like it ? »
C’est le saut vers le bas effectué sur « like » qui rend ce mot proéminent au niveau de cet énoncé. Enfin, les systèmes les plus utilisés dans les travaux récents portant sur l’anglais sont les TSM et TOBI.

Tonetic Stress Marks : TSM

Les TSM ont été développées à partir des régularités découvertes dans les représentations en têtards. Kingdon (1958), O’Connor & Arnold (1961), Crystal (1969) et Svartvik & Quirk (1980) font usage de cette codification.
Les TSM sont des marques diacritiques de formes variées, ajoutées au texte avec deux types de barres pour marquer les frontières. Cette codification a été créée en pensant aux besoins des apprenants étrangers à l’origine, plutôt que pour véhiculer ou représenter une théorie de l’intonation en particulier. L’accent lexical est représenté de manière explicite et il n’y a pas de nombre fixe de niveaux mélodiques. Le registre n’est pas explicitement représenté dans la codification originale, mais Crystal (1969) utilise par exemple les guillemets pour indiquer un registre élargi ou compressé sur une portion de texte et dans une autre version des TSM, les signes « > » et « < » sont utilisés pour indiquer un registre élargi ou compressé localement. Les différentes versions de TSM proposées reposent sur les convictions théoriques de leurs auteurs.
La plupart des versions distinguent les accents nucléaires des accents non nucléaires (les « glides » n’apparaissent qu’en position nucléaire). Il y a en général un seul accent nucléaire par unité intonative (porté par la dernière syllabe accentuée mélodiquement). On distingue des syllabes accentuées du point de vue mélodique (accented), des syllabes accentuées du point de vue rythmique (stressed) et des syllabes inaccentuées.
D’autre part, on distingue deux niveaux de frontières prosodiques : les frontières majeures et les frontières mineures. La frontière majeure est accompagnée d’une pause remarquable, elle marque la fin d’un énoncé complet. La frontière mineure peut apparaître à un niveau syntaxique inférieur, elle peut n’être marquée que par une rupture rythmique (cf. Roach, 1994 et Knowles, 1996).
Le système comprend donc un groupe intonatif majeur marqué par deux barres à la fin de celui-ci (//) et un groupe intonatif mineur noté « / ».

Étude comparative des notations TSM et TOBI

À l’heure actuelle, seul Peter Roach (1994) a essayé d’établir des règles de conversion automatique entre le système TOBI et les TSM. Il ne prétend pas toutefois trouver des équivalences exactes entre les deux systèmes, car ceux-ci représentent deux théories de l’intonation distinctes.
Les TSM utilisées dans le SEC (Spoken English Corpus) permettent de distinguer dix accents nucléaires alors que l’on en compte seulement cinq dans TOBI. Deux niveaux de frontières sont pris en considération dans les TSM alors que dans TOBI on en compte quatre. D’après Roach (1994), bien qu’une entreprise de conversion automatique semble difficile, une telle tentative permet de mieux comprendre les deux systèmes et l’information qu’ils représentent.
Tout d’abord, d’après les travaux de Roach (1994), on peut considérer une équivalence entre le niveau de frontière noté 4 dans le système TOBI et la frontière mineure dans les TSM. C’est-à-dire que la frontière mineure serait équivalente à une frontière d’unité intonative dans TOBI (« full intonation phrase boundary »). Ceci étant, le niveau de frontière majeure ne trouve donc pas d’équivalent dans le système TOBI. Roach propose alors d’ajouter un niveau 5 au système TOBI qu’il met ensuite à l’épreuve dans une série de tests de perception. À l’issue de ceux-ci, il conclut qu’un système d’annotation scalaire ou graduel semble plus approprié pour décrire ce que perçoivent les sujets, ce qui conduirait à un système à cinq niveaux de frontières plutôt que seulement deux dans les TSM. Toutefois il remarque aussi que les quatre niveaux de frontières de TOBI sont définis de manière bien spécifique et qu’une analyse plus approfondie devrait être menée sur cette question.
Une équivalence partielle est aussi établie pour l’annotation des phénomènes d’abaissement dans les deux systèmes. La flèche descendante serait donc le symbole le plus proche du diacritique « ! ». Cependant, la flèche peut être utilisée dans tout contexte alors que dans TOBI, on utilise ce signe que pour indiquer un ton H qui serait plus bas que la valeur par défaut.
Enfin, un problème de taille se pose lorsque l’on se propose de trouver un équivalent à la chute-montée non finale dans l’annotation de Pierrehumbert. En effet, si Roach parvient à trouver un équivalent à tous les contours nucléaires britanniques en se plaçant au niveau de la frontière de l’unité intonative, c’est-à-dire à l’aide de l’accent mélodique, de l’accent de syntagme et du ton de frontière combinés, il n’en est pas de même au niveau du ton de phrase. Au niveau de la frontière intermédiaire, la solution évidente de l’accent H* + LH n’est pas permise. Une chute+montée ne peut apparaître qu’avant une frontière d’unité intonative. Une autre expérience de perception est entreprise et montre qu’en anglais britannique, la chute+montée non finale a sa place, ce qui laisse penser que les systèmes de transcription doivent être adaptés à chaque langue ou même dialecte étudié.

Les limites et critiques apportées à TOBI

Bien que largement adopté par la communauté des chercheurs en linguistique ce système d’annotation prosodique fait l’objet de quelques remarques et critiques. Dix ans après la création de ce système, certains chercheurs font un bilan sur les apports et les limites de TOBI.
Tout d’abord certains chercheurs soulignent le fait que c’est un système développé à partir d’une étude de l’anglais américain. Il ne s’agit donc pas d’un alphabet prosodique international permettant de rendre compte des phénomènes linguistiques appartenant à d’autres langues. Des précautions sont de rigueur avant de tenter d’appliquer ce système à d’autres langues d’où la création d’un « Greek TOBI » et d’un « German TOBI ».
Ensuite ce système est l’expression d’une théorie phonologique particulière que tous n’adoptent pas. Les difficultés rencontrées dans la tentative de conversion menée par Roach montrent que chaque système se base sur des aprioris théoriques qui estent pour certains encore à mettre à l’épreuve dans l’étude d’un grand corpus de données.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
Motivation et présentation du sujet de l’étude
Objectifs et méthodologie
Plan de la thèse
PARTIE Ι CONTEXTE SCIENTIFIQUE
Chapitre 1 Fonctions généralement attribuées à la prosodie
1.1 La fonction lexicale
1.2 La fonction grammaticale
1.3 Prosodie et discours : la fonction discursive
1.4 Prosodie et information : la fonction de focalisation
1.5 Prosodie, attitude et émotion : la fonction expressive
1.6 Fonction identificatrice
1.7 Conclusion
Chapitre 2 Représentation des formes prosodiques de l’anglais : les différents modèles
2.1 Les modèles britanniques des formes prosodiques
2.1.1 The « tune approach »
2.1.2 The « English nuclear tones approach »
2.1.3 « Prosodic features »
2.1.4 Problèmes non résolus dans les approches britanniques de l’intonation
2.2 Le modèle autosegmental
2.2.1 Origines et fondements de la théorie autosegmentale
2.2.2 Les modèles standards américains
2.3 La question de l’alignement tonal
2.3.1 Prémisses à l’analyse de l’alignement tonal chez les premiers théoriciens de l’intonation
2.3.2 Facteurs influençant l’alignement des tons mélodiques
2.3.3 Le domaine d’association des tons
2.3.4 Résultats des différents travaux de recherche
2.4 Conclusion
Chapitre 3 Principaux systèmes d’annotation prosodique de l’anglais : illustration de la relation entre formes et fonctions prosodiques
3.1 Les systèmes de transcription des formes prosodiques
3.1.1 Les portées musicales
3.1.2 Les niveaux
3.1.3 Le « crazy type » et les tracés curvilignes
3.2 Les systèmes représentant formes et fonctions prosodiques
3.2.1 Les têtards
3.2.2 Un système de transcription intégrée
3.2.3 Tonetic Stress Marks : TSM
3.2.4 TOBI
3.2.5 Etude comparative des notations TSM et TOBI
3.2.6 Les limites et critiques apportées à TOBI
3.3 Vers une annotation distincte des formes et fonctions prosodiques
3.3.1 Fondations théoriques du modèle quadratique
3.3.2 Annotation automatique des formes prosodiques : INTSINT et MOMEL
3.3.3 Annotation des fonctions prosodiques : StarBI et IF
3.4 Conclusion
Chapitre 4 Différentes approches de l’articulation forme/fonction
4.1 Les approches théoriques : « Top down approaches »
4.1.1 L’approche syntaxique ou grammaticale
4.1.2 Approches discursives et pragmatiques
4.1.3 L’approche compositionnelle
4.2 Les approches expérimentales: « Bottom up approaches »
4.2.1 L’approche perceptive
4.2.2 Les approches physiologiques et articulatoires
4.2.3 L’approche probabiliste
4.2.4 L’analyse par synthèse
4.3 Conclusion
CONCLUSION GENERALE
PARTIE II TRAVAIL EXPERIMENTAL
Chapitre 5 Choix des corpus et de l’annotation
5.1 Le corpus EUROM1
5.2 Le corpus Aix-MARSEC
5.3 Développements de l’annotation du corpus EUROM1
Chapitre 6 Analyse par synthèse des contours intonatifs de l’anglais britannique
6.1 Méthode d’analyse
6.2 Modèles d’analyse par synthèse de l’intonation de l’anglais
6.2.1 Le modèle « nul »
6.2.2 Le modèle « IU »
6.2.3 Le modèle « accent»
6.2.4 Le modèle « terminal »
6.2.5 Le modèle « emphatique »
6.3 Evaluation des résultats
Chapitre 7 Phases d’optimisation des modèles de synthèse
7.1 Premières phases d’optimisation : modèle des pauses
7.1.1 Optimisation de la séquence de tons INTSINT
7.1.2 Optimisation de l’alignement des points cibles
7.2 Optimisation des représentations formelles au niveau de l’unité intonative
7.3 Optimisation des représentations formelles au niveau des unités tonales
7.3.1 Optimisation de l’évaluation objective des modèles
7.3.2 Optimisation de la séquence de tons en fonction de l’unité tonale
7.3.3 Optimisation de l’alignement des points cibles
7.4 Optimisation de la représentation des fonctions
7.4.1 Détections des frontières d’IU dans les modèles des pauses et des IU
7.4.2 Détection des types de TU
7.4.3 Détection des frontières d’IU dans le modèle des TU
7.4.4 Résultats des détections des fonctions
7.5 Conclusions
7.5.1 Evaluation des modèles
7.5.2 Modèles des formes prosodiques
7.5.3 Détection automatique et réinterprétation des fonctions prosodiques
Chapitre 8 Optimisation de la relation forme/fonction à partir du corpus Aix-MARSEC
8.1 Introduction
8.2 Hypothèses et questions de départ
8.2.1 Les questions liées aux fonctions prosodiques
8.2.2 Les questions liées aux représentations formelles
8.3 Annotations fonctionnelles
8.3.1 Conversion des TSM en IF : vers un IF « British School »
8.3.2 Unité nucléaire et accents mélodiques : un IF « britannique adapté »
8.4 Annotation des formes
8.4.1 Optimisation du codage INTSINT
8.5 Description des modèles à tester
8.6 Résultats de l’optimisation des représentations formelles modèle par modèle ..
8.6.1 Le modèle des pauses
8.6.2 Le modèle des IU
8.6.3 Les modèles basés sur les unités tonales
8.6.4 Evaluation des modèles d’optimisation des séquences INTSINT
8.7 Analyse et évaluation des résultats de l’optimisation de l’alignement
8.7.1 Alignement de P1 dans les modèles basés sur l’unité tonale
8.7.2 Effet de la position du TU sur l’alignement de P1
8.7.3 Effet de la position du nucléus sur l’alignement de P1
8.7.4 Alignement de P1 en fonction du contour
8.7.5 Alignement de P2 dans les modèles basés sur l’unité tonale
8.7.6 Alignement de P2 en position finale en fonction du contour
8.7.7 Alignement des points cibles dans les modèles basés sur l’unité tonale élargie (TTU)
8.7.8 Effet de la position du TTU sur l’alignement de P1 dans les modèles basés sur l’unité tonale élargie
8.7.9 Effet de la position du nucléus sur l’alignement de P1 dans les modèles basés sur l’unité tonale élargie
8.7.10 Alignement de P2 dans un TTU
8.7.11 Alignement de P3 dans un TTU
8.7.12 Conclusion provisoire
8.7.13 Evaluation objective des modèles d’optimisation de l’alignement
8.8 Evaluation des modèles finaux
8.9 Grammaires formes/fonctions
8.9.1 Grammaires à partir du modèle 11
8.10 Optimisation des représentations fonctionnelles dans les différents modèles ….
8.10.1 Détection des types d’IU
8.10.2 Détection des types de TU
8.10.3 Détection jointe des types de TU-IU
8.10.4 Détection des frontières de TTU
8.10.5 Détection des frontières d’unités intonatives (IU)
8.10.6 Conclusion provisoire sur les détections de fonctions
8.11 Retour sur les données et évaluation des modèles par analyse par synthèse
8.11.1 Hypothèses expliquant les échecs de modélisation
8.11.2 Relevé de problèmes de modélisation à partir des modèles 11 et 24
8.11.3 Exemple de détections de fonctions problématiques
Chapitre 9 Conclusion et synthèse des résultats
9.1 Annotations fonctionnelles
9.2 Codage des formes et alignement tonal
9.3 Tentatives de reconnaissance automatique des fonctions prosodiques
9.4 Perspectives et limites
RÉFÉRENCES BIBLIOGRAPHIQUES

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *