Intégration de l’information moléculaire dans l’évaluation génétique

Détection de QTL

Un QTL est caractérisé par sa position sur le génome (ou l’intervalle de confiance de sa position), la part de variance génétique du caractère qu’il explique et, dans les cas les plus simples, le nombre d’allèles et leurs effets.
Chez les bovins laitiers, Weller et al. (1990) a proposé d’utiliser la structure de population existante dans le cadre des programmes de sélection classique pour détecter les QTL. À cette époque, seules des cartes de marqueurs à faible densité sont envisageables et le dispositif petites-filles est constitué de familles de taureaux demi-frères de père.
Comme expliqué précédemment, les taureaux sont évalués sur descendance et ces index sont une excellente prédiction de leur valeur génétique. Ces index sur descendance sont utilisés comme phénotype en détection de QTL. Grâce à une forte réduction de la variance environnementale (du moins quand le nombre de petites-filles est suffisant), les dispositifs petites-filles présentent une bonne puissance en dépit de leurs défauts intrinsèques (le dispositif n’est que partiellement informatif car seule une partie des grands-pères est hétérozygote aux QTL ; l’analyse est intra-famille de père et les méioses maternelles ne sont pas utilisées ; la taille des familles, contrainte par les choix des sélectionneurs, est souvent en dessous de l’optimum).
Ces dispositifs sont en général analysés par régression intra père du phénotype sur la probabilité d’avoir reçu l’un ou l’autre segment chromosomique paternel à un locus donné, conditionnellement à l’information marqueurs. Pour maximiser l’information disponible, cette probabilité est estimée à partir des marqueurs informatifs flanquant la position testée, après avoir reconstitué les phases des pères, c’est-à-dire la répartition des allèles des marqueurs sur les deux chromosomes du père (Knott, 1994).
Après les travaux pionniers de Georges et al. (1995), de nombreux pays ont conduit des programmes de ce type, avec des dispositifs variant de quelques centaines à plusieurs milliers de taureaux. En France, le programme conduit de 1996 à 1999 comprend 1554 taureaux (Boichard et al., 2003). On peut se référer à la synthèse de Khatkar et al. (2004) pour une revue des dispositifs en bovins laitiers et de leurs résultats.
Les résultats issus de ces programmes peuvent être résumés comme suit :
Des QTL sont détectés en très grand nombre : plusieurs centaines de QTL sont décrits, ce qui contraste avec le petit nombre de mutations causales identifiées.
Les parts de variance génétique estimées sont assez élevées mais généralement fortement surestimées. Les analyses plus récentes avec de très gros dispositifs donnent des estimations beaucoup plus réduites, confirmant ainsi que le nombre de QTL pour un caractère donné est plus élevé qu’initialement supposé.
Mis à part quelques QTL majeurs retrouvés dans de nombreuses analyses, beaucoup de résultats semblent spécifiques à chaque étude et/ou à chaque race.
La précision de localisation des QTL est très mauvaise, souvent de l’ordre de plusieurs dizaines de cM. Conséquence directe, ces premiers résultats ont été suivis par des travaux importants de cartographie fine, en vue de réduire l’intervalle de confiance de la localisation.
La stratégie utilisée repose avant tout sur un enrichissement en marqueurs, sur des méthodes d’analyse extrayant plus d’information (Bolard et Boichard, 2002) et parfois (mais pas assez souvent) sur une augmentation des effectifs. En France, le programme de sélection assistée par marqueurs a largement alimenté l’augmentation de taille du dispositif.

Modèles de sélection génomique

La disponibilité de puce pangénomique de SNP, a ouvert de nouvelles perspectives pour la sélection, parmi lesquelles la plus étudiée est sûrement la sélection génomique. Ce type d’évaluation regroupe en fait un ensemble de méthodes et modèles assez différents mais ayant en commun la prise en compte d’informations moléculaires couvrant l’ensemble du génome de façon dense. Cette idée a été émise par Visscher et Haley (1998), mais la première étude de faisabilité d’une évaluation génomique n’est apparue que plus tard (Meuwissen et al., 2001). Par analogie aux méthodes d’évaluation précédemment présentées, le modèle utilisé considère que tout fragment du génome est un QTL (dont l’effet peut cependant être nul). De plus, du fait de la taille réduite des fragments chromosomiques, on suppose qu’il existe un déséquilibre de liaison entre fragment chromosomique et gène sous jacent au QTL. L’ensemble des effets de gène étant évalué par le biais des fragments chromosomiques, la composante polygénique devient a priori inutile (Habier et al., 2007).
Deux idées sont alors sous-jacentes au concept de sélection génomique : la majeure partie de la variance génétique est expliquée par des QTL à petits effets ; on peut obtenir une bonne prédiction de la valeur génétique d’un individu (définie comme la somme de l’effet de tous ses QTL) sans connaître précisément les effets individuels des QTL

Quelle différence entre sélection assistée par marqueurs et sélection génomique ?

Dans son principe, la sélection génomique repose sur des concepts proches de la sélection assistée par marqueurs. Mais, alors que la SAM ne s’intéresse qu’à un nombre limité de QTL à effet important pour la prédiction de la valeur génétique, chaque QTL étant préalablement cartographié, la sélection génomique considère un nombre inconnu et a priori élevé de QTL. Leur nombre n’étant pas spécifié, leur localisation et leur effet sont a fortiori inconnus. L’idée est donc de laisser parler la statistique pour détecter les marqueurs les plus prédictifs. En pratique, les marqueurs à plus fort effet ne sont pas forcément les plus proches du QTL (Villumsen et al., 2009).
En effet, les marqueurs sélectionnés sont ceux en plus fort déséquilibre de liaison avec le QTL, leur distance important peu. Une autre différence forte entre SAM et sélection génomique est la nature de l’information moléculaire prise en compte. En SAM, de plus en plus, les QTL sont suivis par des haplotypes denses, l’idée étant de constituer un marqueur composite présentant un nombre suffisant d’allèles pour obtenir le déséquilibre de liaison voulu, mais un nombre pas trop élevé pour éviter la perte de précision de l’estimation de son effet. Au contraire, la sélection génomique considère classiquement un QTL par intervalle, donc un QTL pour un ou deux marqueurs SNP.
On peut imaginer une convergence progressive entre sélection génomique et SAM, dès lors que la SAM prend en compte plus de QTL (détectés à partir de dispositifs de plus en plus puissants), la sélection génomique se base sur des haplotypes de marqueurs (Villumsen et al., 2009) ; et, pourquoi pas, la sélection génomique pilote le choix des SNP retenus en forçant ceux qui sont placés sur les QTL connus.

Cartographie de QTL

Tout d’abord, les résultats de détection de QTL ont radicalement changé en l’espace de quelques années grâce à l’apport des données de typage à haut débit . Les différences observées sont dues d’une part à l’information marqueurs beaucoup plus abondante et d’autre part aux méthodes de détection de QTL, dont les hypothèses sous-jacentes, avec l’apport du déséquilibre de liaison, réduisent l’auto-corrélation entre tests et fournissent une bien meilleure résolution (Tarres et al., 2009). Avant la disponibilité de puces de SNP, la détection de QTL suivait un processus en deux étapes : une première couverture du génome avec des marqueurs à basse densité permettait une primolocalisation des QTL dans des régions larges (généralement quelques dizaines de cM pour des QTL d’effet moyen) ; cette primolocalisation était suivie d’une étape de cartographie fine par densification en marqueurs afin d’affiner la localisation du QTL, si possible dans un intervalle suffisamment restreint pour orienter efficacement le choix de gènes candidats. Avec les puces de haute densité, les deux phases sont maintenant confondues puisque la primolocalisation est d’emblée très précise. Rançon du succès, le nombre de QTL est maintenant très élevé, demandant de nouvelles stratégies pour l’identification des gènes et mutations causales, par exemple par capture de séquence et séquençage massif. En attendant, des stratégies sont nécessaires pour limiter le nombre de faux positifs et exploiter au mieux l’ensemble des régions QTL détectées. D’un point de vue pratique, les volumes de données à traiter et les temps de calculs deviennent des facteurs très limitants. À titre d’illustration, l’ensemble des détections LDLA du projet CartoFine représente plus d’un an de calcul. Paradoxalement, la réduction du volume de données à traiter devient donc primordiale. Ainsi, lors de la préparation des données de génotypage, il est d’usage de supprimer les marqueurs trop peu informatifs ou n’étant pas en équilibre de Hardy-Weinberg. Les impacts que peuvent avoir ces pratiques sur les résultats n’ont pas été analysés. Lors de la détection de QTL, afin de réduire le nombre de tests à effectuer, un marqueur sur deux a été testé, faisant l’hypothèse que du fait de l’utilisation de probabilités IBD sur 10 marqueurs, des tests consécutifs sont très corrélés. En pratique, on constate que le profil de la statistique de vraisemblance est très erratique, le choix de ne traiter qu’un marqueur sur deux est donc discutable. De façon plus générale, l’ensemble des simplifications faites lors des analyses devront être revisitées pour en mesurer l’importance réelle.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction 
2 Méthodes de sélection assistée par marqueurs 
2.1 Détection de QTL
2.2 Sélection assistée par marqueurs en déséquilibre de liaison familial
2.2.1 Modèles de description
2.2.2 Résultats
2.3 Évaluation assistée par gènes
2.3.1 Modèle de description
2.3.2 Résultats
2.4 Modèles de sélection génomique
2.4.1 Modèle de description
2.4.2 Résultats
2.5 Quelle différence entre sélection assistée par marqueurs et sélection génomique ?
2.6 Programme français de sélection assistée par marqueurs
2.6.1 Programme de détection de QTL
2.6.2 Description du programme SAM
2.6.3 Évolutions du programme français
2.7 Conclusion de partie
3 Validations du programme SAM de première génération 
3.1 Introduction
3.2 Article 1
3.3 Article 2
3.4 Conclusion
4 Travaux de cartographie fine 
4.1 Introduction
4.2 Article 3
4.3 Article 4
4.4 Conclusion
5 Utilisation d’haplotypes pour la sélection assistée par marqueurs 
5.1 Introduction
5.2 Article 5
5.3 Conclusion
6 Discussion générale 
6.1 Cartographie de QTL
6.2 Bilan du premier programme SAM
6.3 Évaluation SAM2 et évolutions possibles
6.4 Évolutions des programmes de sélection
6.5 Application de la sélection assistée par marqueurs aux races à petits effectifs et autres espèces
6.6 Conclusion

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *