Modèles stochastiques de l’expression génique

Stochasticité de l’expression génique

L’expression d’un gène est contrôlée par les concentrations, activités et localisations de nombreuses molécules comme les polymérases, les facteurs de transcriptions ou encore les ribosomes. Ces espèces chimiques ainsi que l’ADN porteur de l’information génétique évoluent dans le cas des cellules procaryotes dans le cytoplasme et sont soumis à l’agitation thermique. Leur localisation résulte donc d’une marche aléatoire en 3D. Ainsi la rencontre entre ces différentes espèces chimiques se fait de manière aléatoire ou stochastique. Considérons deux cellules bactériennes d’une population monoclonale, donc génétiquement identiques. A un instant donné, si nous nous intéressons à un gène en particulier, il est possible que pour une des cellules, le promoteur de ce gène soit occupé par une polymérase, permettant l’initiation de la transcription, tandis que pour l’autre cellule le promoteur soit libre. Ainsi le nombre de protéines dans les deux cellules sera différent. La nature probabiliste des rencontres entre espèces chimiques conduit également à des fluctuations du nombre de protéines au cours du temps au sein d’une même cellule. En particulier, les concentrations en polymérases et ribosomes peuvent fluctuer au sein d’une même cellule. Ces fluctuations peuvent se propager et ainsi entraîner des fluctuations dans le nombre de protéines entre cellules génétiquement identiques. L’expression des gènes est donc fondamentalement stochastique. La physique statistique réconcilie le caractère discret et stochastique des échelles microscopiques au caractère continu et déterministe des échelles macroscopiques (Erwin Schrödinger, Qu’est-ce que la vie ?). On peut citer par exemple le paramagnétisme où à l’échelle microscopique chaque molécule s’oriente aléatoirement à cause de l’agitation thermique mais du fait de leur grand nombre,  elles produisent une orientation prépondérante dans la direction du champ appliqué. Pour la bactérie Escherichia coli, les nombres d’ARN polymérases et de ribosomes sont assez élevés, respectivement de l’ordre de 5000 et 27000 par cellules (Bremer & Dennis, 1996). Mais dans le cas de l’expression génétique, le facteur limitant reste la très faible quantité d’ADN dans une cellule, qui est présent en nombre de copies de l’ordre de l’unité. Le nombre de transcrits dépend beaucoup du gène considéré et particulièrement de l’efficacité du promoteur à recruter les ARN polymérases : de 1500 transcrits par génération à 1 transcrit par génération (Leroy, 2010). Ainsi, le caractère fondamentalement aléatoire de l’expression des gènes conduit à une variabilité facilement détectable entre cellules génétiquement identiques au vu des niveaux de fluctuations relatives dans la quantité de ces acteurs principaux. Une population d’individus génétiquement identiques et partageant le même environnement manifeste donc une diversité résiduelle appelée variabilité phénotypique ayant pour origine le caractère aléatoire de l’expression des gènes. Un autre terme employé pour désigner cette variabilité est celui de bruit.

Bruit intrinsèque et bruit extrinsèque

Dans leurs travaux pionniers, Elowitz et al. et Swain et al. proposent de diviser les sources de bruit dans l’expression des gènes en deux catégories : le bruit intrinsèque et le bruit extrinsèque (Elowitz et al, 2002 ; Swain et al, 2002). Comme nous l’avons vu précédemment, l’expression de chaque gène est contrôlée par la concentration, l’activité et la localisation de nombreuses molécules, comme les polymérases, les ribosomes ou d’éventuelles protéines régulatrices. Ainsi, les fluctuations dans les concentrations de ces molécules vont entraîner des fluctuations dans l’expression génique. Elles représentent donc une source de bruit qui est globale à une cellule donnée et est catégorisée comme extrinsèque.

Si on suppose deux copies du même gène dans une cellule donnée, ces fluctuations extrinsèques à ces gènes devraient affecter de la même manière l’expression des deux copies tandis qu’elles affecteraient de manière différentes deux gènes identiques mais dans deux cellules différentes (caractérisés par des variables extrinsèques différentes). D’une manière générale, on regroupe dans le bruit extrinsèque tous les phénomènes indépendants du gène considéré et global à une cellule donnée, dont les fluctuations peuvent se propager à l’expression de notre gène. Maintenant, considérons deux cellules ne montrant aucune différence dans leurs variables extrinsèques. Nous avons déjà énoncé le fait que les rencontres entre polymérases et promoteurs ou encore entre ribosomes et RBS se font de manière aléatoire du fait de l’agitation thermique. Ainsi les initiations de la transcription et de la traduction n’auront pas lieu au même moment dans les deux cellules. Cette stochasticité résiduelle, inhérente au processus d’expression est catégorisée comme intrinsèque.

La distinction entre bruit intrinsèque et bruit extrinsèque a été formalisée mathématiquement par Swain et al (Swain et al, 2002). Dans cette étude, Swain et al base cette distinction sur la formule de la variance totale. Pour deux variables aléatoires Y et X, la variance de Y peut s’écrire selon :

𝑉𝑎𝑟(𝑌) = 𝐸(𝑉𝑎𝑟(𝑌|𝑋)) + 𝑉𝑎𝑟(𝐸(𝑌|𝑋))

Où 𝐸( ) représente l’espérance mathématique. Swain et al applique cette formule lorsque la variable aléatoire Y est égale au nombre de protéines à un instant donné et X est égale à un vecteur des variables extrinsèques qui spécifie l’environnement cellulaire (état du cycle cellulaire, nombres d’ARN polymérases, ribosomes…) à un instant donné. Ainsi, en notant 𝑃(𝐼, 𝐸) le nombre de protéines comme une fonction du vecteur 𝐼 des variables intrinsèques et du vecteur 𝐸 des variables extrinsèques, on peut écrire :

𝑉𝑎𝑟(𝑃(𝐼, 𝐸)) = 𝐸(𝑉𝑎𝑟(𝑃(𝐼, 𝐸)|𝐸)) + 𝑉𝑎𝑟(𝐸(𝑃(𝐼, 𝐸)|𝐸))

En définissant le bruit intrinsèque comme

𝜂²𝑖𝑛t = 𝐸(𝑉𝑎𝑟(𝑃(𝐼, 𝐸)|𝐸))/𝐸(𝑃(𝐼, 𝐸))²

Et le bruit extrinsèque comme

𝜂²𝑒𝑥t = 𝑉𝑎𝑟(𝐸(𝑃(𝐼, 𝐸)|𝐸))/𝐸(𝑃(𝐼, 𝐸))²

En parallèle de cette approche mathématique, Elowitz et al. ont mesuré les contributions intrinsèques et extrinsèques dans le bruit d’expression génétique chez E. coli (Elowitz et al 2002). Pour ce faire, ils ont introduit dans le chromosome d’E. coli les gènes de deux protéines fluorescentes CFP et YFP, respectivement de couleur bleue et jaune, contrôlés par le même promoteur et localisés de façon symétrique par rapport à l’origine de réplication du chromosome. Cette localisation permet d’éviter les différences d’expression causées par les fluctuations du nombre de copies de gènes liées au cycle cellulaire. Ainsi, une corrélation entre les nombres de protéines YFP et CFP par cellule indique la présence de bruit extrinsèque, tandis que le bruit intrinsèque tend à décorréler les deux signaux. Grâce à cette technique, Elowitz et al. ont montré que les deux sources de stochasticité, intrinsèque et extrinsèque contribuent de façon substantielle au bruit total. Dans leurs expériences, le niveau d’expression des gènes CFP et YFP pouvait être modulé grâce à l’usage d’un promoteur inductible. En modulant ainsi le niveau d’expression, ils ont montré que le bruit intrinsèque décroit avec le niveau d’expression tandis que le bruit extrinsèque évolue de façon non monotone et est maximal pour des niveaux d’induction intermédiaire. Ce comportement peut s’expliquer par les fluctuations dans la concentration d’inducteur, qui sont plus importantes pour des niveaux d’induction intermédiaires. A la suite de cette étude, une approche similaire a été utilisée pour évaluer l’importance relative du bruit extrinsèque et intrinsèque dans l’expression des gènes chez les eucaryotes (Raser and O’Shea, 2004). Raser et al. ont construit des souches de levure Saccharomyces cerevisiae exprimant la protéine CFP et la protéine YFP, à partir de gènes localisés sur le même locus sur des chromosomes homologues et contrôlés par le même promoteur. Comme pour les travaux de Elowitz et al., la corrélation entre les signaux de YFP et CFP reflète l’importance relative des sources extrinsèques et intrinsèques de bruit. Raser et al. ont utilisé plusieurs promoteurs et ont montré que le bruit était dominé par sa composante extrinsèque.

Conséquences biologiques du bruit dans l’expression génétique

L’utilisation du terme « bruit » est assez révélatrice de la vision négative associée à cette stochasticité, notamment en biologie synthétique. Le but de la biologie synthétique est d’étendre ou de modifier le comportement des organismes et de les concevoir pour accomplir de nouvelles tâches (E. Andrianantoandro, 2006), par exemple la synthèse de nouvelles molécules d’intérêt. Dans ce contexte, différents gènes sont mis en réseaux, une protéine synthétisée par un de ces gènes jouant un rôle dans l’expression d’une autre. Ainsi, le bruit généré au niveau d’une protéine donnée aura des répercussions sur la synthèse d’autres protéines avec lesquelles elle interagit. Cette propagation du bruit ne peut donc que nuire à la performance du processus de synthèse d’une protéine d’intérêt puisqu’on veut sa production prévisible, fiable et uniforme. Aussi, loin de ce contexte industriel, le bon fonctionnement d’une cellule nécessite des réactions biochimiques avec une stœchiométrie précise. Ainsi le bruit dans l’activité ou la quantité de ces réactants semble à première vue préjudiciable et force la cellule à développer des stratégies pour le combattre. Cependant, il a été montré récemment que le bruit pouvait également être exploité par les organismes vivants pour permettre à une population monoclonale de se diversifier phénotypiquement. Bien que la génération de phénotypes non parfaitement optimaux puisse être préjudiciable, certains de ces phénotypes peuvent être plus adaptés dans d’autres environnements et la maintenance d’une certaine diversité phénotypique peut permettre ainsi à la population de survivre dans des environnements fluctuants (stratégie dite de « bet hedging », par analogie aux stratégies de réduction des risques sur les marchés financiers). Dès lors, si le caractère probabiliste de l’expression génétique peut s’avérer être dangereux pour la cellule dans certains cas et bénéfique dans d’autres, il convient alors à celle-ci de pouvoir le contrôler : le minimiser pour s’en protéger ou l’amplifier pour en tirer profit.

Mesurer et quantifier la stochasticité dans l’expression génétique

L’un des principaux objectifs des récentes recherches sur la stochasticité de l’expression génétique a été d’identifier et de quantifier ses différentes sources. Ceci a été rendu possible d’une part par les progrès en biologie moléculaire et d’autre part par l’accessibilité grandissante des outils quantitatifs. Ainsi, presque toutes les expériences visant à caractériser le bruit d’expression génétique débutent par l’insertion d’un gène rapporteur codant pour une protéine fluorescente dans le génome de l’organisme étudié. Le niveau d’expression de ce gène pouvant être modulé suivant la force du promoteur ou du RBS situés en amont de la partie codante. Finalement, les signaux de fluorescence de nombreuses cellules isogéniques sont quantifiés par microscopie de fluorescence (Elowitz et al, 2002 ; Golding et al, 2005 ; Cai et al, 2006 ; Yu et al, 2006 ; Choi et al, 2008 ; Taniguchi et al, 2010) ou cytométrie en flux (Ozbudak et al, 2002 ; Blake et al, 2003 ; Raser & O’Shea, 2004 ; Newman et al, 2006 ; Bar-Even et al, 2006).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
I Expression des gènes
I.1 Transcription
I.2 Traduction
II Stochasticité de l’expression génique
II.1 Bruit intrinsèque et bruit extrinsèque
II.2 Conséquences biologiques du bruit dans l’expression génétique
II.3 Mesurer et quantifier la stochasticité dans l’expression génétique
III Modèles stochastiques de l’expression génique
III.1 Modèle stochastique à deux niveaux de l’expression génique
III.2 Modèle stochastique à trois niveaux de l’expression génique
III.3 Limites des deux modèles de l’expression génique
IV Mise en évidence expérimentale de la stochasticité dans l’expression génique
IV.1 Effets de la transcription et de la traduction sur le bruit d’expression : Etude sur un gène unique
IV.2 Etude sur une gamme de gènes comparable à la taille du génome
QUESTION POSEE ET STRATEGIE ADOPTEE
MATERIELS ET METHODES
I Organisme d’étude : Bacillus subtilis
II Banque de mutant de B. subtilis
II.1 Banque originale de B. subtilis
II.2 Constructions de nouvelles souches
III Quantification des signaux de fluorescence par cytométrie en flux
III.1 Préparation des cultures
III.2 Cytométrie en flux
IV Quantification des signaux de fluorescence par microscopie de fluorescence
IV.1 Préparation des échantillons pour la microscopie
IV.2 Le microscope
IV.3 Suivi de la croissance par imagerie en contraste de phase
IV.4 Acquisition du signal de fluorescence
IV.5 Traitement du signal de fluorescence des images de microscopie
IV.6 Expériences de quantification du Photobleaching
IV.7 Normalisation des signaux de fluorescence
RESULTATS
I Présentation et interprétation des signaux de cytométrie en flux et de microscopie
I.1 Données issues de la microscopie de fluorescence
I.2 Données issues de la cytométrie en flux
I.3 Correction de l’autofluorescence
I.4 Suivi de la croissance par imagerie en contraste de phase
I.5 Reproductibilité des expériences et correspondance entre les expériences de cytométrie en flux et de microscopie
II Caractérisation de la banque de souches
II.1 Niveau d’expression moyen des souches
II.2 Niveau du bruit d’expression de l’ensemble des souches
III Effets de la traduction et de la transcription sur le bruit d’expression génique
III.1 Effets de la traduction sur le bruit d’expression génique
III.2 Effets de la transcription sur le bruit d’expression génique
III.3 Effets de la transcription sur le bruit d’expression génique: Etude sur des souches avec TSS “identiques”
III.4 Comparaison des différentes stratégies de modulation de l’expression génique (promoteurs, TSS, {promoteur-TSS}, modules TIR)
IV Hypothèse d’explication des comportements obtenus : présence du bruit extrinsèque
V Décomposition du bruit d’expression total en bruit extrinsèque et intrinsèque
V.1 Construction des souches exprimant les deux fluorophores
V.2 Quantification de la contribution des sources de bruit extrinsèque et intrinsèque
V.3 Evolution du bruit intrinsèque et extrinsèque en fonction de la force des promoteurs
V.4 Evolution du facteur Fano intrinsèque et extrinsèque en fonction de la force des promoteurs
DISCUSSION
I Résultats de notre étude
II Bruit extrinsèque et validité du modèle à deux niveaux
II.1 Temps de maturation des fluorophores
II.2 Interprétation de la formule de la variance totale
III Origine du bruit extrinsèque
IV Pertinence biologique de la variabilité phénotypique et conséquences des résultats obtenus
CONCLUSION

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *