Analyses génomiques de données sur le vieillissement cutané

L’Acide Désoxyribonucléique

   Dans une cellule eucaryote, le génome d’un individu, soit l’ensemble de ses gènes, est réparti au sein du noyau en molécules compactes d’ADN appelées chromosomes. Un être humain possède 23 paires de chromosomes : 22 paires d’autosomes numérotées de 1 à 22 par taille décroissante et une paire de chromosomes sexuels (XX pour les femmes et XY pour les hommes). Chaque molécule d’ADN est constituée d’une succession de molécules appelées nucléotides. Un nucléotide est formé par l’association d’une base azotée, d’un désoxyribose et d’un groupement phosphate. Il existe quatre nucléotides différents : l’Adénine (A), la Cytosine (C), la Guanine (G) et la Thymine (T). Durant la seconde moitié du XXème siècle, les nombreuses recherches sur l’ADN vont permettre la découverte de sa structure. La première propriété majeure a été énoncée en 1949 par le chimiste autrichien Erwin Chargaff [1, 2]. Elle stipule que la quantité de A et de C dans n’importe quel segment d’ADN est sensiblement égale à celle de T et de G respectivement, seule la quantité de A et de C (et donc de T et de G) diffère. Ce résultat suggère alors une complémentarité des nucléotides. La seconde propriété, publiée en 1953 par James Watson et Francis Crick [3], établit que l’ADN a une structure hélicoïdale à double brins (Figure 1). Cette structure et la complémentarité des nucléotides assurent une stabilité cruciale à l’ADN permettant une réplication fiable de cette molécule lors de la division cellulaire. Les deux brins de l’ADN étant complémentaires, il suffit donc de ne connaître qu’un seul de ces deux brins pour disposer de la totalité de l’information génétique. Ainsi, cet acide est représenté par une séquence non aléatoire de nucléotides correspondant à un des deux brins.

L’ADN est le support de l’information génétique

   L’ADN contient toutes les informations nécessaires à la formation et à la vie de l’organisme. En effet, selon le dogme central de la biologie moléculaire, certaines portions de l’ADN, les gènes, sont à l’origine de la synthèse des protéines. Les régions codantes des gènes, dites exons, sont transcrites en Acide RiboNucléique messagers (ARNm) qui sont ensuite traduits en protéines (Figure 2). L’ARNm correspond au brin complémentaire de la séquence d’ADN transcrite à l’exception du T qui est remplacé par l’Uracile (U). Lors de la traduction, la succession de codons, triplets de nucléotides de l’ARNm, définit la succession d’acides aminés formant la protéine. En effet, à chaque codon correspond un acide aminé. Cette table de correspondance s’appelle le code génétique.

Définition du déséquilibre gamétique

   Lorsque l’étude de la diversité génétique se focalise sur un gène, la fréquence d’un allèle est égale à la fréquence du gamète portant cet allèle. Cette égalité ne tient plus quand deux gènes ou plus sont étudiés simultanément. Considérons :
 un gène A dont les allèles sont A1 de fréquence p et A2 de fréquence q
 un gène B dont les allèles sont B1 de fréquence u et B2 de fréquence v
Quatre types de gamètes différents portant chacun une combinaison d’allèles de chaque gène sont potentiellement observables :
 le gamète (A1, B1) de fréquence f11
 le gamète (A1, B2) de fréquence f12
 le gamète (A2, B1) de fréquence f21
 le gamète (A2, B2) de fréquence f22
Nécessairement, il existe une relation entre les fréquences gamétiques et les fréquences alléliques de chaque gène, bien que celle-ci ne soit pas évidente.

Polymorphismes génétiques et pathologies

   L’influence de la génétique sur le développement ou la réponse à certaines pathologies est désormais un phénomène connu. Les polymorphismes génétiques sont associés à des modifications de la structure des protéines ou de leur niveau d’expression et par conséquent à une perte de fonction plus ou moins importante. De nombreux polymorphismes génétiques associés à des pathologies ont d’ores et déjà été identifiés. Par exemple, la mucoviscidose peut être due à une délétion dans un exon du gène CFTR [19] et la maladie de Huntington a été associée à des répétitions en grand nombre d’un microsatellite localisé dans le premier exon du gène HTT [20]. Cependant, de nombreuses maladies communes comme les cancers, les diabètes ou les maladies auto-immunes entre autres ne sont pas seulement causées par une seule mutation génétique. Pour ces maladies dites multifactorielles, plusieurs facteurs génétiques peuvent exister et ils sont difficiles à identifier puisqu’ils sont nombreux et interagissent de plus avec des facteurs environnementaux. Par exemple, le gène ApoE a été identifié dans la maladie d’Alzheimer [21], les gènes BRCA1 et BRCA2 dans le cancer du sein [22] ou encore les gènes de la région HLA dans le SIDA [23].

Le génotypage et les puces à ADN

   Le génotypage vise à déterminer les génotypes d’un polymorphisme chez un individu. Des puces à ADN, permettant de génotyper un nombre croissant de SNPs ont été développées depuis 10 ans. Schématiquement, une puce est une plaque sur laquelle se trouvent des microbilles, chacune spécifique d’un SNP, recouvertes de fragments d’ADN, appelés oligonucléotides. Ces oligonucléotides correspondent à la séquence située en amont du SNP. L’ADN, préalablement amplifié et segmenté, est ensuite mis en contact avec les microbilles et les fragments se fixent sur les oligonucléotides correspondants. La plaque est ensuite lavée afin d’éliminer les fragments d’ADN qui ne se sont pas fixés. Des nucléotides associés à des fluorochromes, rouge ou vert selon la base, sont ensuite déposés sur la plaque et vont s’additionner à l’oligonucléotide de manière complémentaire à l’ADN génomique, la couleur rouge ou vert permettra ainsi d’indiquer l’allèle observé. La plaque est scannée pour analyser la fluorescence et déterminer les génotypes des SNPs de la puce. Depuis 10 ans, le nombre de SNPs caractérisés sur les puces ADN a été multiplié et il est désormais possible d’analyser jusqu’à 2,5 millions de polymorphismes (SNPs et quelques CNVs) par puce. De même, une même plaque peut servir au génotypage de plusieurs individus simultanément, réduisant ainsi le coût des procédures expérimentales. Le développement des projets HapMap [12] et 1000 Génomes [4] a largement contribué à l’augmentation de la couverture des puces. En effet, bien qu’utilisant des stratégies différentes, les deux grandes sociétés de génotypage, Affymetrix et Illumina, ont utilisé les SNPs identifiables à l’aide du projet HapMap. Affymetrix a initialement basé le choix des SNPs présents sur les puces en fonction de leur position sur le génome et de leur fréquence dans la population d’intérêt pour essayer d’assurer une couverture homogène du génome alors que la stratégie développée par Illumina utilise les tagSNPs permettant de capturer le plus de variabilité génétique possible.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Remerciements
Résumé
Résumé en anglais
Table des matières
Liste des tableaux
Liste des figures
Liste des abbréviations
Première partie Introduction
1 Introduction à la génétique
1.1 L’Acide Désoxyribonucléique
1.1.1 L’ADN est le support de l’information génétique
1.1.2 L’ADN est aussi le support de l’hérédité
1.2 Les différents polymorphismes génétiques
1.2.1 Les polymorphismes chromosomiques
1.2.2 Les séquences répétées en tandem
1.2.3 Les indels
1.2.4 Les Single Nucleotide Polymorphisms
1.2.5 Les Copy Number Variations
2 Notions de génétique des populations
2.1 Modèle de Hardy-Weinberg
2.1.1 Enoncé de l’équilibre d’Hardy-Weinberg
2.1.2 Influence des hypothèses
2.2 Déséquilibre gamétique et déséquilibre de liaison
2.2.1 Définition du déséquilibre gamétique
2.2.2 Evolution temporelle du déséquilibre gamétique
2.2.3 Déséquilibre de liaison
2.2.4 Les différentes mesures du déséquilibre de liaison
2.3 Haplotypes
3 Introduction à la génétique épidémiologique
3.1 Polymorphismes génétiques et pathologies
3.2 Les différents types d’études génétiques et génomiques
3.2.1 Etudes de liaison et études d’association
3.2.2 Etude gène ou SNPs candidats et étude génome entier
3.2.3 Etude longitudinale et étude transversale
4 Outils génomiques et bioinformatiques
4.1 Le génotypage et les puces à ADN
4.2 Bases de données bioinformatiques
4.2.1 dbSNP
4.2.2 Le projet HapMap
4.2.3 Le projet 1000 Genomes
4.3 Reconstruction des haplotypes
4.4 Imputation
5 Recherche d’association dans les études génome-entier
5.1 Contrôle qualité
5.1.1 Génotypage
5.1.2 Cohorte
5.2 Facteurs de confusion
5.3 Mesure statistique de l’association entre le polymorphisme et le phénotype
5.3.1 Tests statistiques d’hypothèses
5.3.2 Correction des tests multiples
5.3.3 Analyse d’un phénotype quantitatif
5.3.4 Analyse d’un phénotype qualitatif
5.3.5 Qualité des résultats
5.4 Analyses complémentaires
5.5 Nouvelles approches d’exploitation des données de GWAS
6 Peau et vieillissement
6.1 La peau, organe essentiel
6.1.1 Epiderme
6.1.2 Derme
6.1.3 Hypoderme
6.2 Vieillissement général
6.2.1 Modifications métaboliques
6.2.2 Vieillissement cellulaire
6.2.3 Perte de fonction moléculaire
6.3 Vieillissement cutané
6.3.1 Caractérisation du vieillissement cutané
6.3.2 Facteurs impactant le vieillissement cutané
6.3.3 Génétique du vieillissement cutané
7 Objectifs de ma thèse
Deuxième partie Matériels et Méthodes
1 Etudes d’association génome-entier
1.1 Population étudiée
1.1.1 La cohorte SU.VI.MAX
1.1.2 Cohorte des femmes étudiées pour le vieillissement cutané
1.2 Phénotypes analysés
1.3 Covariables utilisées dans l’analyse statistique
1.4 Génotypage
1.5 Contrôle qualité du génotypage
1.6 Etude de la stratification de la population
1.7 Analyses statistiques
1.8 Déséquilibre de liaison
1.9 Imputation
1.10 Exploration bioinformatique
2 Analyse des voies de signalisation
2.1 Voies de signalisation analysées
2.2 Assignation des SNPs aux gènes
2.3 Assignation des p-valeurs aux gènes
2.4 Description de la méthode GSEA / Analyse statistique
2.5 Analyse statistique
Troisième partie Résultats
1 Etude “génome entier” sur une cohorte de femmes caucasiennes à la recherche de gènes associés à l’apparition des lentigines
2 Etude “génome entier” sur une cohorte de femmes caucasiennes à la recherche de gènes associés à l’affaissement de la paupière
3 Recherche de voies de signalisation biologiques significativement associées avec des indicateurs de vieillissement cutané
3.1 Contexte
3.2 Résultats
Quatrième partie Discussion et perspectives
1 Bilan des études d’association réalisées sur le vieillissement cutané
1.1 Travaux portant sur les lentigines
1.1.1 Rappels des résultats
1.1.2 Comparaison avec la littérature
1.1.3 Interprétation biologique
1.2 Travaux portant sur l’affaissement de la paupière
1.2.1 Rappels des résultats
1.2.2 Comparaison avec la littérature
1.2.3 Interprétation biologique
1.3 Recherche des voies de signalisation associées aux différents indicateurs de vieillissement cutané
1.3.1 Rappels des résultats principaux
1.3.2 Interprétation systémique des résultats précédents
2 Critique des méthodes utilisées
2.1 Critique des études « génome-entier »
2.1.1 Intérêt
2.1.2 Limites
2.2 Critique des analyses des voies de signalisation
2.2.1 Intérêt
2.2.2 Limites
3 Perspectives
3.1 Analyse des CNVs
3.2 Différence entre l’âge chronologique et l’âge perçu par la peau sur le visage
3.3 Réplication des résultats des voies de signalisation
3.4 Réplications et méta-analyse
3.5 Dynamique du vieillissement cutané
3.6 Approches multi-marqueurs
3.6.1 Haplotypes
3.6.2 Epistasie
3.7 Nouvelles technologies de séquençage
3.8 Biologie des systèmes
Conclusion
Bibliographie
Liste des publications
Liste des communications orales
Posters

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *