Exploitation de la séquence du génome des bactéries Cours de Bactériologie
La détermination de la séquence d'un
génome bactérien permet de préciser les
fondamentaux de la bactérie :
taille du
génome, GC%, nombre de phases de
lecture potentielles, fraction codante du
génome et enfin nombre de pseudogènes,
qui s'il est important (Mycobacterium leprae
et Rickettsia prowazeki) témoigne d'une
réduction génomique en cours.
L'analyse de
la séquence permet aussi de préciser les
voies métaboliques présentes et leur bonne
concordance avec la physiologie connue de
la bactérie.
Mais la seule analyse de la
séquence nucléotidique n'apporte que des
informations limitées et les seules données
de séquence sont loin de résoudre toutes les
questions concernant la biologie d'un
microorganisme.
Différentes possibilités
s'ouvrent alors aux microbiologistes pour
pousser les investigations.
Comparaison de génomes
:
La comparaison est une façon simple de Mycobacterium « faire parler » les génomes.
Dans l'idéal, on dispose de la séquence
nucléotidique de plusieurs souches
appartenant à la même espèce ou à des
espèces proches, il est alors possible de
comparer leur séquence et de rattacher les
différences à des phénotypes spécifiques
d'une souche, tel que le pouvoir pathogène
par exemple.
Ainsi la séquence nucléotique
d'une souche d'Escherichia coli K-12, souche de laboratoire non
virulente, a été comparée à la séquence d'une souche d'Escherichia coli O157/H7 responsable
d'entérites hémorragiques.
Cette
comparaison a révélé qu'il existe un
squelette commun de 4100 kb à ces deux
souches et que les gènes de ce squelette
sont très proches voire identiques (98%
d'identité).
En revanche, un nombre
important de séquences sont spécifiques à
chacune des deux souches.
Ainsi la souche
virulente possède 1340 Kb d'ADN répartis en
177 îlots sur le chromosome ; dont certains
étaient connus (gènes codant pour le
système de sécrétion de type III permettant
l'adhésion intime et la disparition des
microvillosités) mais d'autres inconnus
jusque là et qui pourraient contribuer au
pouvoir pathogène.
De façon surprenante,
530 kb d'ADN sont spécifiques de Escherichia coli K-12 et ne sont pas
retrouvés dans la souche pathogène.
Des
comparaisons similaires entre Mycobacterium tuberculosis et leprae ont
apporté une explication à l'impossibilité de M.leprae de se diviser en dehors de
l'homme.
En effet alors que le génome de M.tuberculosis a une taille de 4,4 Mb celui de
M.leprae n'est que de 3,3 Mb.
A cette perte
de 1000 kb s'ajoute le fait que la séquence
codante de ces 3,3 Mb est très faible ceci en
raison du nombre important de pseudogènes. On estime ainsi que M.leprae
a la capacité de produire 2000 protéines de
moins que M.tuberculosis.
Cette réduction de
génome explique qu'un nombre important de
voies métaboliques manquent chez ce
pathogène et empêchent sa croissance in
vitro.
Dans certaines circonstances, la
comparaison de génome n'apporte que des
informations limitées, notamment lorsqu'il
existe de fréquents transferts horizontaux.
Dans ce cas, les différences observées
peuvent être spécifiques de la souche dont
la séquence est connue et ne pas refléter
une différence phénotypique propre au
groupe bactérien étudié.
Ceci est le cas de Neisseria meningitidis, pathogène pour
lequel il est intéressant de connaître les
différences avec Neisseria gonorrhoeae
compte tenu des différences évidentes de
pouvoir pathogène.
A ce jour, la séquence
génomique de 2 souches de N.meningitidis a
été réalisée, une souche de sérogroupe A
(Z2491) et une souche de sérogroupe B
(MC58), ainsi que la séquence d'un isolat de N.gonorrhoeae (FA1090).
Des comparaisons
de génomes montrent que 17% des
phases de lecture de Z2491 ne sont pas
dans la souche de gonocoque, mais 8% du
génome de Z2491 n'est pas non plus dans
l'autre souche de méningococque (MC58),
cette importante variabilité de génome entre
les souches de Neisseria interdit de porter
des conclusions quant à l'intérêt des 17% de
séquences de Z2491 absentes chez le
gonocoque quant à leur rôle dans la
spécificité du pouvoir pathogène de N.meningitidis.
Le seul moyen de pallier à
ceci est de comparer plusieurs isolats de
N.meningitidis avec plusieurs souches de
N.gonorrhoeae pour ne garder que les
séquences communes à tous les
méningocoques et absentes des
gonocoques.
Le moyen le plus efficace pour
ceci est l'emploi « arrays ».
Pour ce faire, la totalité des gènes d'une
bactérie est amplifiée et déposée à l'aide de
robots sur une membrane d'hybridation
(macroarrays) ou sur une glace de verre
(microarrays ou puces à ADN).
Ces
dernières sont beaucoup plus petites que les macroarrays et permettent le dépôt de
plusieurs dizaines de milliers de gènes pour
seulement quelques milliers avec les
macroarrays.
Ces
supports solides sont ensuite hybridés avec l'ADN chromosomique des
souches dont on désire réaliser la comparaison.
La
lecture et l'interprétation sont réalisées à l'aide d'une
informatique appropriée.
Les
gènes pour lesquels aucune hybridation n'est détectée sont absents
de la souche testée.
Bien
entendu cette information n'apporte que des renseignements négatifs
dans la mesure où il ne tient pas compte d'éventuelles séquences
présentes dans l'ADN testé mais cette fois absentes de la souche
avec laquelle l'array a été construit.
De telles
comparaisons portant sur un grand nombre
de souches appartenant au même genospecies mais exprimant différents
niveaux de virulence apporteront des
renseignements quant aux mécanismes du
pouvoir pathogène.
Étude du transcriptome
:
Le transcriptome est l'identification de
l'ensemble des gènes qui sont exprimés dans une situation donnée.
L'emploi d' arrays permet de quantifier le niveau
d'expression de chaque gène.
Pour ce faire,
les supports solides sont hybridés non plus
avec l'ADN génomique d'une souche mais
avec l'ARN extrait de la souche.
En
comparant le profil d'expression dans deux
conditions différentes, il est possible
d'obtenir des informations importantes sur la
régulation des gènes.
En fonction de
l'environnement dans lequel la bactérie se
développe, le transcriptome varie et permet
ainsi de préciser les gènes
préférentiellement exprimés.
Le
regroupement de ces gènes permet
l’identification des « clusters » dont
l'expression est nécessaire dans tel ou tel
environnement.
Étude du protéome
Le but est d'identifier l'ensemble des
protéines produites par une bactérie et de
rattacher chaque protéine à une phase de
lecture.
Là encore, il existe une variabilité en
fonction des conditions de croissance.
La
comparaison protéome-transcriptome sera
nécessaire.