Méthodes utilisées dans la réalisation des arbres phylogénétiques

Méthodes utilisées dans la réalisation des arbres phylogénétiques

Les arbres ont été réalisés avec le logiciel MEGA 4 (Kumar et al. 2004), selon la méthode de regroupement des plus proches voisins (Neighbour-Joining ; (NJ)) (Saitou & Nei 1987). Cette méthode est une bonne méthode heuristique pour estimer l’évolution minimale entre les allèles et elle est couramment employée car elle est rapide. Pour les arbres nucléotidiques, le calcul des distances utilise le modèle de substitutions défini par Tamura et Nei (Tamura & Nei 1993). Ce modèle prend en compte les différences entre probabilité de passage entre les 4 bases nucléotidiques en distinguant les taux de transition (mutation de base purine (A ou G) en base purine ou base pyrimidine (C ou T) en pyrimidine) des taux de transversion (base purine vers base pyrimidine et inversement). Pour la reconstitution phylogénétique basée sur les séquences en acides aminés, la méthode utilisée pour calculer les distances est celle basée sur la Matrice de Jones (Jones et al. 1992). Cette matrice décrit les probabilités de remplacement d’un acide aminé par un autre à partir de l’observation de 59190 mutations sur 16300 protéines chez la drosophile.

Indices de diversité

Les analyses et le calcul des indices de diversité ont été réalisés avec le logiciel DNAsp 4.20.2 (Rozas et al. 2003).

Le premier indice est celui du nombre de sites polymorphes. Il s’agit du nombre de sites polymorphes dans un échantillon de séquences (population ou espèce). Cet estimateur, noté S, dépend de la longueur de la séquence et de la taille de l’échantillon. Il est donc difficilement comparable entre locus et entre échantillons.

Tests moléculaires

Tests de neutralité

Ces tests sont des méthodes indirectes pour détecter l’effet de la sélection naturelle sur les gènes. Le principe de base est de comparer le niveau d’ajustement entre la diversité observée pour certains gènes, et des valeurs théoriques attendues sous l’hypothèse de l’évolution sous un modèle neutraliste (à l’équilibre mutation dérive).

D de Tajima
L’estimateur d’un écart à l’évolution neutre défini par Tajima (Tajima 1989a) permet de tester l’écart au modèle neutre sous l’hypothèse d’équilibre mutation dérive, à partir des données de polymorphisme nucléotidique d’une espèce. Cet estimateur, noté D, est basé sur la comparaison des deux mesures de diversité nucléotidique énoncées dans le paragraphe précédent : π et θw. Sous l’hypothèse de neutralité des mutations et de l’équilibre entre mutation et dérive, ces deux mesures de la diversité sont des estimateurs du même paramètre θ=4Ne, ils doivent être identiques et le D de Tajima, qui est la différence entre les deux divisée par la variance attendue, égal à zéro. On peut alors tester si la différence observée entre les deux estimateurs s’écarte significativement de zéro soit en utilisant la variance de cette différence entre les sites nucléotidiques (si la séquence considérée est suffisamment longue pour fournir une distribution normale des différences observées : test Z), soit en effectuant un ré-échantillonnage aléatoire des séquences par bootstraps pour obtenir un nombre suffisant de pseudo-valeurs de cette différence permettant d’effectuer le test Z.

Un excès de mutations en faible fréquence (singletons) va être préférentiellement détecté par l’estimateur θw et la valeur de D sera alors négative. Cet excès de mutations, lorsqu’il est significatif, peut être le résultat (i) d’un goulot d’étranglement suivi d’une expansion démographique, (ii) d’un balayage sélectif (perte de la diversité nucléotidique puis début de re-diversification), ou (iii) d’un effet légèrement délétère des mutations polymorphes observées. Au contraire, une valeur positive du D indique un excès de mutations en fréquences intermédiaires pouvant s’expliquer comme (i) la marque d’une structure populationnelle, (ii) le résultat d’un goulot d’étranglement récent et suffisamment faible pour avoir permis la subsistance de plusieurs lignées ou (iii) l’action de la sélection balancée. Les effets démographiques vont affecter de manière semblable l’ensemble des gènes des populations concernées, alors que les effets sélectifs ne vont en affecter qu’un nombre limité. Ainsi, l’une des solutions pour faire la part des choses est d’utiliser une approche multi-locus qui nous permet de trancher au final pour l’une des hypothèses.

Test de Hudson-Kreitman-Aguadé
Ce test, nommé test HKA (Hudson et al. 1987), compare les niveaux de variation intra et inter-spécifiques pour un gène d’intérêt et un autre locus supposé neutre. Il est également possible de mener cette analyse au sein des différentes régions des gènes (comme comparaison des variations entre régions codantes et régions introniques, bien qu’idéalement les deux régions comparées doivent avoir des généalogies indépendantes).

L’idée du test HKA est d’utiliser la divergence qui ne dépend que du taux de mutation et le polymorphisme qui ne dépend que de la taille efficace et du taux de mutations sous le modèle neutre. Ainsi, un gène ayant subi un balayage sélectif ou soumis à une contrainte sélective aura un ratio polymorphisme / divergence inférieur à celui des locus neutres.

Test de McDonald et Kreitman
Ce test, appelé test MK (McDonald & Kreitman 1991) vérifie si les ratios entre mutations non-synonymes et mutations synonymes diffèrent entre les données de polymorphisme interspécifique (θN/θS) et les données de divergence entre espèces (KN/KS). Un simple test d’homogénéité permet de détecter l’écart à l’hypothèse de neutralité Si les deux classes de mutations sont neutres, alors leur taux de fixation est déterminé uniquement par la force de la sélection purifiante et n’a pas de raison de différer entre polymorphisme et divergence.

Si (KN/KS) > (θN/θS), cela signifie qu’il y a eu de la sélection positive dans au moins l’une des branches conduisant à l’une au l’autre des espèces. Au contraire, si (KN/KS) < (θN/θS), cela indique un maintien d’un excès de polymorphisme non-synonyme à l’intérieur des espèces par rapport à la fraction qui est finalement fixée. Cela pourrait être le cas pour des mutations légèrement délétères. Ce test suppose que le taux de mutation neutre est partagé entre les deux catégories de mutations (synonymes et non-synonymes). Ce test nécessite aussi l’hypothèse d’une taille de population constante, mais pour des raisons différentes de celles des tests de sélection indirecte (comme le D de Tajima ou le test HKA). L’effet d’un changement de taille efficace va jouer sur l’efficacité de la sélection et l’intensité de la contrainte sélective. Si la taille efficace a été plus faible pendant la divergence, certaines mutations délétères ont pu se fixer alors que d’autres mutations tout aussi délétères ne sont plus observées dans le polymorphisme actuel d’une population de plus grande taille (EyreWalker et al. 2006).

Quelques questions techniques

Estimation et caractérisation des singletons

La technique de clonage par marquage-recapture est une méthode quantitative. Les allèles séquencés sont tirés au hasard parmi l’ensemble des allèles de la population (en théorie, tous les allèles sont présents lors du clonage). Cependant, l’un des effets collatéraux de cette méthode est le nombre variable d’individus recapturés d’un clonage à l’autre dont les allèles ont été séquencés et le nombre variable de recaptures pour un allèle donné au sein de chaque individu. Cette méthode nous permet donc d’avoir accès à des individus dont les allèles ont été séquencés plusieurs fois. Ces recaptures mettent en évidence le caractère « artéfactuel » de certaines mutations révélant un polymorphisme que l’on pourrait appeler « intra-individuel ».

Le taux d’erreurs induites par la méthode de PCR (Polymerase Chain Reaction), a déjà été estimé précédemment (Saiki et al. 1988, Lundberg et al. 1991). Ce taux d’erreurs associé à des mutations artéfactuelles a pu être estimé pour différentes polymérases et il varie de 2.0 × 10⁻⁵ pour la Taq polymerase à 1.6 × 10⁻⁶ pour la Pfu. Ce phénomène se traduit par l’apparition de singletons artéfactuels et a été souvent négligé dans les études de génétique des populations ou de phylogénie car l’erreur induite est inférieure au niveau de divergence moyen qui peut être observé entre deux haplotypes de la même espèce (Kwiatowski et al. 1991). Ces singletons ont pour conséquence d’augmenter la diversité allélique observée ou l’hétérozygotie observée mais ce biais reste négligeable (Kwiatowski et al. 1991, Palumbi & Baker 1994).

Un autre type d’erreur peut être induit par l’amplification par PCR, il s’agit de la recombinaison in vitro (Cronn et al. 2002). Ces recombinants sont néanmoins facilement identifiables par notre méthode grâce à l’identification des allèles par les ‘queues’ nucléotidiques. En effet, ces recombinants forment une troisième classe d’allèles issue des 2 allèles initiaux qui peuvent être facilement identifiables lorsque la recapture est conséquente. Ils peuvent alors être supprimés de notre jeu de données.

Enfin, il est possible que les singletons observés correspondent à des mutations somatiques induites par les conditions extrêmement mutagènes du milieu hydrothermal (fort niveau de radioactivité naturelle dans les tissus des organismes : (Cherry et al. 1992, Kadko 1996), concentrations cellulaires élevées en métaux lourds (Cosson et al. 2008), nombreux radicaux libres générés par l’oxydation des composés souffrés : (Pruski & Dixon 2003, Marie et al. 2006).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1. Notion d’espèce et spéciation
2. Mécanismes d’isolement reproductif
3. Modes de Spéciation
4. Théorie de la coalescence
5. Comportement des gènes en condition d’hybridation
6. Intérêt des bivalves marins pour la génétique
7. Les environnements marins réduits
8. Un milieu contrasté, riche en microhabitats et potentiellement favorable à la sélection diversifiante
9. Le peuplement associé aux sources hydrothermales
9.1. Les polychètes
9.2. Les bivalves
9.3. Le milieu hydrothermal: un milieu fragmenté et instable
10. Dispersion larvaire dans le milieu hydrothermal.
11. Zones d’étude et objectifs de la thèse
11.1. La dorsale est pacifique
11.2. La dorsale Atlantique
12. Objectifs de la thèse
13. Déroulement du manuscrit
Chapitre I. Matériel et Méthodes Générales
I.1. Stratégie d’échantillonnage
I.1.1. Préparation des échantillons.
I.1.2. Choix des marqueurs génétiques.
I.1.3. Informations sur les gènes étudiés
I.2. Amplification, marquage/recapture, clonage et séquençage
I.2.1. Amplification des marqueurs
I.2.2. Traitement des séquences avant analyse
I.2.3. Alignement et correction des séquences
I.2.4. Correction des jeux de données
I.3. Méthodes d’analyse
I.3.1. Méthodes utilisées dans la réalisation des arbres phylogénétiques
I.3.2. Indices de diversité
I.4. Tests moléculaires
I.4.1. Tests de neutralité
I.4.2. Mesures de différenciation génétique entre populations
I.5. Quelques questions techniques
I.5.1. Estimation et caractérisation des singletons
I.5.2. Première étude méthodologique
I.5.3. Deuxième étude : basée sur les attendus théoriques entre mutations synonymes et non-synonymes
I.6. Mise en évidence de gènes paralogues au niveau des arbres étudiés
I.6.1. Un exemple simple : le cas du GF1.
I.6.2. Deux exemples compliqués : le cas du lysozyme et du collagène
Chapitre II : Phylogénie des Bathymodiolinae
II.1. Introduction
II.2. Matériels et méthodes
II.2.1. Choix des marqueurs
II.2.2. Acquisition des séquences
II.2.3. Traitement des séquences
II.2.4. Tests de saturation sur les deux locus
II.2.5. Définition des standards de notation des noms d’espèce
II.2.6. Analyse sous PAML
II.3. Résultats
II.3.1. Reconstructions phylogénétiques
II.3.2. Phylogénie avec le marqueur COI
II.3.3. Phylogénie avec le marqueur ITS2
II.3.4. Analyse bayésienne et maximum de vraisemblance sur les données du CO1
II.4. Discussion
II.4.1. Diversité génétique chez les Bathymodiolinae : relations avec l’habitat (profondeur, symbiose et milieux)
II.4.2. Causes probables à la diversité des Mytilidae des environnements réduits
II.4.3. Evolution du gène mitochondrial COI chez les Bathymodiolinae : évidence d’une convergence adaptative associée à la symbiose?
II.4.4. Histoire évolutive des Bathymodiolinae et colonisation des dorsales océaniques
II.4.5. Evolution et histoire régionales des espèces de Bathymodiolinae.
II.4.6. Polyphylie au niveau du marqueur ITS2 et possibilités d’hybridation chez certaines espèces
II.5. Conclusion
Chapitre III. Contact secondaire en milieu profond : analyse multi-locus de la divergence et des flux géniques entre deux espèces proches de Bathymodiolus.
III.1. Résumé
III.2. Annexe du chapitre III: présentation de l’article près à etre soumis: “Secondary contact zone in the deep sea: a multi-locus analysis of divergence and gene flow between two closely-related species of Bathymodiolus”
III.2.1. Introduction / introduction
III.2.2. Matériel et méthode / Materiel and methods
III.2.3. Résultats / Results
III.2.4. Discussion / Discussion
III.2.5. Conclusion / conclusion
Remerciements / Acknowledgments
Chapitre IV. Structure génétique des populations de Bathymodiolus thermophilus et mise en évidence d’une zone hybride sur la Dorsale Est-Pacifique (EPR)
IV.1. Introduction
IV.2. Matériel et méthodes
IV.2.1. Echantillons biologiques
IV.2.2. Extraction des protéines et visualisation sur gel d’amidon
IV.2.3. Séquençage des locus nucléaires et mitochondrial
IV.2.4. Descripteurs génétiques associés à l’analyse en fréquence des allozymes
IV.2.5. Descripteurs génétiques associés à l’analyse des séquences.
IV.3. Résultats
IV.3.1. Structure génétique des populations de Bathymodiolus thermophilus au niveau de l’EPR sud
IV.3.2. Recherche d’allèles introgressés à partir d’une analyse de coalescence de huit gènes
IV.4. Discussion
IV.4.1. Structure génétique des populations
IV.4.2. Détection de zones de contact secondaire avec hybridation entre deux espèces cryptiques de B. thermophilus au sud et au nord de la dorsale EPR.
IV.4.3. Mise en évidence d’un processus de spéciation allopatrique avec formation d’un contact secondaire récent (le cas de la microplaque de l’île de Pâques)
IV.4.4. Influence de l’introgression sur la différenciation génétique des populations de B. thermophilus
IV.4.5. Zone d’hybridation : contact secondaire entre espèces vicariantes ou colonisation de la dorsale EPR par une espèce issue du Pacifique Ouest ?
IV.4.6. Dynamique de la colonisation de la dorsale
IV.5. Conclusion
Conclusion