Biologie moléculaire : méthodes et applications aux maladies respiratoires
Cours de pneumologie
Apport des nouvelles technologies : puces à ADN en cancérologie pulmonaire
:
Introduction :
Si le cancer à petites cellules (CPC) constitue une entité ayant ses
caractéristiques propres, il n’en est pas de même pour les carcinomes
non à petites cellules (CNPC) pour lesquels une nouvelle
classification histopathologique a proposé un découpage en plus
de 25 catégories dont on ne peut, pour l’instant, évaluer l’aide dans
la prise en charge thérapeutique.
D’autres approches associant de
nouveaux critères découlant des progrès de la biologie moléculaire
sont en cours d’évaluation sous l’appellation de « carte génétique
des tumeurs » ou de « dissection moléculaire des tumeurs ».
Cette
taxinomie moléculaire est en cours de développement à partir de
l’évaluation de l’expression concomitante d’un très grand nombre
de gènes, ou étude du transcriptome.
Avant l’utilisation de tels outils, différentes tentatives de
classification moléculaire ont été entreprises.
Ainsi, parmi les
adénocarcinomes, plusieurs approches ont concerné les gènes de la
p53 ou de ras ainsi que les anomalies chromosomiques.
Selon Koga
et al, la présence d’ une mutation localisée entre les exons 2 et 9
du gène de la p53 est variable selon le sous-type histologique du
bronchioloalvéolaire : absente des non invasifs, sa fréquence a été
de 11 à 53 % dans les autres sous-types.
De même, dans les bronchioloalvéolaires inférieurs à 2 cm, Aoyagi et al ont retrouvé
une perte allélique de huit loci, avec une fréquence d’autant plus
importante que le grade histopronostique était élevé.
Ainsi, les
pertes concernant 5q, 9p, 11q et 13q ont été retrouvées dans tous les
groupes alors que les pertes pour 2p, 17q, 18q et 22q n’existaient
que dans le groupe le plus péjoratif.
Ces pertes alléliques seules ne
permettent donc pas d’isoler différents sous-types mais sont plutôt
liées au caractère évolutif.
De ce fait, d’autres approches plus
exhaustives se sont révélées nécessaires.
Technologie des puces à acide
désoxyribonucléique (ADN) :
Les « puces à ADN » appartiennent à la technologie des microarrays
(microréseaux) (DNA arrays, DNA chips, biochips, genechips, biopuces,
ou « puces à ADN »), exploitant l’hybridation préférentielle de
séquences simple brin d’acides nucléiques complémentaires
(ADNc) : un échantillon de contenu inconnu est hybridé à une
matrice recouverte, dans un ordre déterminé, de molécule d’ADN
dont la séquence est connue ou d’oligonucléotides.
A - PUCES À ADNc :
Pour les puces à ADNc, des ADNc sont soit sélectionnés au sein de
banques de séquences, appelées expressed sequence tag (EST :
séquence partielle d’ADNc d’environ quelques centaines de
nucléotides, suffisante pour identifier une séquence entière d’ADNc),
soit générés à partir de tissus préalablement choisis.
Ces séquences
sont amplifiées par polymerase chain reaction (PCR) et fixées sur une
lame de petite taille (verre ou Nylon) avec une grande densité :
1 000 spots/cm².
B - PUCES À OLIGONUCLÉOTIDES :
Pour les puces à oligonucléotides, les plus récentes, des
oligonucléotides de 25 à 60 mers (mers : nombre de nucléotides) sont
directement synthétisés sur le support (verre ou silicium), leur
nombre pouvant être supérieur à 10 000 spots/cm² (voire jusqu’à
250 000 dans certains prototypes).
C - TRAITEMENT DES PUCES ET COLLECTE DES RÉSULTATS :
Dans les deux cas, les puces sont hybridées avec les acides
ribonucléiques messagers (ARNm) extraits des tissus, après
rétrotranscription en ADNc lesquels vont être marqués par un
fluorochrome ou un radionucléide.
L’intensité des signaux recueillis
à l’aide d’un capteur approprié au mode de révélation est
proportionnelle à l’intensité de fixation de l’ADNc.
Cette intensité
est évaluée pour chaque séquence par rapport à un étalon servant
aussi à effectuer des comparaisons entre différents échantillons pour
un même support.
D - ANALYSE DES RÉSULTATS :
Ces puces fournissent dans un même temps des résultats pour un
très grand nombre de gènes dont l’interprétation nécessite une
gestion informatique appropriée, établissant ainsi une classification
comparative des échantillons en fonction des ARNm présents.
1- Méthode de classification hiérarchique non
supervisée
:
Cette approche est une classification hiérarchique « non supervisée »
regroupant les échantillons selon les profils d’expression des gènes
les plus proches, ces profils étant regroupés puis reliés à d’autres
selon leur degré de similitude, formant ainsi un dendrogramme en
fonction des parentés transcriptionnelles.
Un des outils
informatiques les plus utilisés, pour cette méthode, est le logiciel
« Cluster » développé par Eisen.
2- Méthode supervisée
:
La seconde approche est de comparer les profils d’expression selon
une « méthode supervisée », c’est-à-dire à partir de critères
préalablement définis en utilisant un groupe d’échantillons de
calibrage ou training set réparti en N classes servant à établir et
évaluer le regroupement de gènes dont l’expression peut être
considérée comme « prédicteur ».
Une des méthodes les plus
employées est celle du « plus proche voisin » (nearest neighbor
classifier), sachant qu’à chaque échantillon est attribué une position
dans un espace à K dimensions, K : nombre de gènes considérés, en
fonction de l’expression pour ces gènes.
La distance entre les
échantillons dans l’espace à K dimensions défini précédemment sert
à identifier les plus proches voisins. Le nombre de gènes nécessaires
à la classification est choisi parmi les plus discriminants au sein des
sous-groupes.
Premiers résultats obtenus
dans les carcinomes pulmonaires :
A - RÉSULTATS ANALYSÉS PAR LA MÉTHODE
NON SUPERVISÉE :
Certains auteurs ont d’abord tenté de regrouper différentes tumeurs
selon la méthode « non supervisée ».
Garber et al ont étudié le
profil d’expression de tumeurs pulmonaires de patients ayant un
suivi de 5 ans en utilisant une puce de 23 100 ADNc correspondant
à 17 108 gènes établie avec les ARN provenant d’un panel de lignées
cellulaires.
De ces ADNc, 918 seulement ont été retenus, représentant
835 gènes dont l’expression est la plus discriminante mettant en
évidence une diversité au sein des adénocarcinomes contrairement
aux carcinomes épidermoïdes et carcinomes à petites cellules
beaucoup plus homogènes.
1- Carcinomes à grandes cellules :
Dans cette étude, les carcinomes à grandes cellules ont une forte
expression d’un groupe de gènes incluant par exemple HMGI(Y),
FOS-related antigen 1 et l’activateur tissulaire du plasminogène.
En
revanche, ces tumeurs ont un faible niveau d’expression des
molécules d’adhérence épithéliale et des gènes hautement exprimés
dans les cellules épithéliales, suggérant un phénotype de transition épithéliomésenchymateux.
2- Carcinomes à petites cellules et carcinomes épidermoïdes :
Pour les carcinomes à petites cellules, l’expression de gènes
correspondant à une différenciation neuroendocrine a bien été
retrouvée. Les carcinomes épidermoïdes montrent, eux, des
caractéristiques d’épithéliums épidermoïdes comme l’expression des
cytokératines 5, 13 et 1.
Cette approche moléculaire n’a pas permis
d’isoler de sous-groupes parmi les carcinomes à petites cellules, les
carcinomes à grandes cellules et les carcinomes épidermoïdes.
3- Adénocarcinomes :
Il n’en est pas de même des adénocarcinomes parmi lesquels trois
groupes différents ont pu être distingués selon leurs profils
d’expression : deux exprimant un ensemble de gènes impliqués dans
le métabolisme du surfactant dont TTF1, le troisième exprimant des
gènes impliqués dans le remodelage tissulaire et l’angiogenèse.
Cette
première étude a également montré, dans le groupe des
adénocarcinomes, une possibilité de sous-typage moléculaire avec
une dissociation entre les critères reconnus comme classiquement
péjoratifs, en particulier morphologiques, et ceux retenus par
l’analyse des patrons d’expression de groupes de gènes.
B - RÉSULTATS AVEC LA CLASSIFICATION HIÉRARCHIQUE
SELON LES SÉQUENCES LES PLUS EXPRIMÉES :
Dans une autre étude, de Bhattacharjee et al, une classification
hiérarchique des échantillons de différents types de carcinomes non
à petites cellules reposant sur les 3 312 séquences les plus exprimées
a été établie grâce à une puce à oligonucléotides.
1- Carcinomes à petites cellules et tumeurs carcinoïdes
:
Dans les carcinomes à petites cellules et les tumeurs carcinoïdes, des
gènes neuroendocrines sont retrouvés fortement exprimés et pour
les cancers à petites cellules, d’autres gènes en plus tel que le gène
de la thymosin-b ou de l’inhibiteur du cycle cellulaire C18-ink7.
2- Carcinomes épidermoïdes :
Dans les carcinomes épidermoïdes, sont retrouvés des marqueurs
de kératinisation ainsi qu’une surexpresion de p63 et p53.
3- Adénocarcinomes
:
Une évaluation isolée des adénocarcinomes et de tissus non
tumoraux, en prenant en compte les 675 transcrits les plus exprimés,
a abouti à la subdivision des adénocarcinomes en quatre sousgroupes,
C1 à C4.
Le groupe C2 est caractérisé par la présence de
marqueurs neuroendocrines.
Dans le groupe C3, il existe une
coexistence d’expression de gènes exprimés dans le groupe C2 (par
exemple l’ornithine decarboxylase 1, la glutathion transferase…) et de
gènes exprimés par les pneumocytes de type II, également retrouvés
dans le groupe C4 (TTF-1, gènes des protéines du surfactant B, D et
C).
Le groupe C4, en plus de ces gènes exprimés dans les pneumocytes de type II, coexprime d’autres gènes tels que le
cytochrome B5, la cathepsine H et MUC 1.
En plus de l’orientation
vers des mécanismes biologiques propres à ces différents sous-types
tumoraux, à ces « sous-groupes moléculaires » sont associées des
caractéristiques, soit histomorphologiques, telles qu’un degré
d’indifférenciation dans le groupe C1 à l’inverse de C2 ou C3, soit
pronostique, la survie observée étant plus longue dans le groupe C2
et à l’inverse plus péjorative dans le groupe C1.
Il est donc possible
de concevoir, à partir de cette étude, la réalisation d’un modèle
simplifié par rapport aux puces actuelles applicable en clinique,
reprenant le travail original, et regroupant sur une membrane les
principaux gènes marqueurs de chaque sous-groupe.
C - IDENTIFICATION D’UN PROFIL
DES ADÉNOCARCINOMES PRIMITIFS ET SECONDAIRES :
Une autre question abordée par la technologie des puces est
l’identification d’un profil caractéristique des adénocarcinomes
primitifs pulmonaires par rapport aux adénocarcinomes d’autres
localisations.
1- Identification de marqueurs :
Ainsi, Giordano et al ont comparé les profils génétiques
d’adénocarcinomes primitifs du côlon, de l’ovaire et du poumon, en
utilisant une puce à oligonucléotides de 7 129 sets d’amorces pour
6 800 gènes provenant d’une banque d’EST.
Différents marqueurs
ont été identifiés pour chaque groupe tumoral en utilisant les gènes
qui ont la plus grande expression dans un type comparativement
aux deux autres ; ainsi, les résultats obtenus en utilisant les profils
des transcrits ont été meilleurs que ceux obtenus par la méthode
conventionnelle d’immunohistochimie.
2- Profil établi par classification supervisée :
L’autre approche dans ce domaine est la « classification supervisée »,
utilisée par Su et al déterminant le profil d’adénocarcinomes de 11 origines différentes, soit 100 tumeurs différentes. D’une puce à oligonucléotide correspondant à 12 523 gènes n’ont été gardés que
les 9 198 gènes ayant une intensité d’hybridation maximale.
Pour
chaque classe de tumeurs, les dix gènes les plus discriminants ont
pu être identifiés.
Pour certaines tumeurs, comme le poumon,
l’identification est plus difficile du fait de l’absence de marqueurs
hautement spécifiques.
La classification ainsi établie utilise 110 gènes
préalablement déterminés.
En appliquant cette classification à
75 échantillons, l’origine de 85 % des tumeurs a pu être déterminée,
incluant dans ces échantillons des métastases d’adénocarcinomes.
3- Difficultés
:
La plupart des gènes identifiés utilisés comme marqueurs sont
exprimés spécifiquement dans les épithéliums dont proviennent ces
adénocarcinomes ; cependant, il existe des difficultés dans cette
étude concernant les adénocarcinomes pulmonaires, car si parmi les
marqueurs « spécifiques » d’adénocarcinomes pulmonaires,
l’expression de gènes comme TTF-1 est bien retrouvée, en revanche,
d’autres marqueurs appartiennent aux cellules stromales, en
particulier inflammatoires tels que les lymphocytes T et B, les
macrophages ou les polynucléaires neutrophiles, cellules
ubiquitaires non spécifiques d’une tumeur donnée.
Cette étude
montre la difficulté de classer des tumeurs pour lesquelles manquent
des marqueurs génétiques spécifiques, ce qui est le cas des
adénocarcinomes pulmonaires.
Néanmoins, il faut espérer que
l’analyse de l’intégralité des transcrits humains permettra
d’identifier des gènes plus spécifiques de ces tumeurs.
Cette approche rejoint celle de Ramaswamy et al dans laquelle un
essai de typage moléculaire de différents types de cancers a été
effectué en utilisant le screening de l’expression de 4 030 gènes grâce
à une puce à oligonucléotides contenant 16 063 amorces.
Cette étude,
analysant 218 échantillons tumoraux provenant de 14 types
différents de cancer et 90 échantillons sains, montre que si pour
certaines tumeurs (lymphomes, leucémies, tumeurs du système
nerveux central) des regroupements caractéristiques peuvent être
obtenus, en revanche, pour d’autres tumeurs, la classification
moléculaire ne reconnaît pour l’instant que de l’ordre de 80 % des
types tumoraux.
Il s’agit de résultats préliminaires qui ont le mérite
de mettre en évidence des marqueurs non seulement déjà identifiés
mais d’autres non suspectés.
De ce fait, le panel de gènes testés
devenant plus important, l’outil va s’affiner rapidement permettant
une identification moléculaire des différents types tumoraux.
Par
ailleurs, dans cette étude, les tumeurs les moins différenciées n’ont
pas pu être classées en fonction de leur tissu d’origine, ce qui peut
laisser penser que ces tumeurs dérivent d’une population cellulaire
distincte avec une évolution propre.
Autres méthodes d’étude
de l’expression des gènes :
A - TECHNIQUE « SERIAL ANALYSIS OF GENE
EXPRESSION » : SAGE
À côté de l’utilisation des puces pour l’étude du transcriptome, il
existe d’autres méthodes et en particulier la technique SAGE qui
permet d’obtenir de courtes séquences de nucléotides (une dizaine
environ) pour chaque gène qui suffisent à son identification.
Ainsi, Natch et al ont étudié des carcinomes non à petites cellules, ainsi
que des lignées de cellules des petites voies aériennes (SAEC : small
airways epithelial cells), de cellules bronchiques (NHBE : normal
human bronchial cells) et une lignée d’adénocarcinomes pulmonaires
(A549) générant 374 634 séquences représentant 66 502 transcrits.
À
partir de ces données, un classement hiérarchique à partir des 3 921
séquences SAGE apparaissant au moins dix fois dans chacune des
librairies générées, sépare deux groupes, l’un contenant les lignées
épithéliales SAEC et NHBE et l’autre associant la lignée A549, les
adénocarcinomes et les carcinomes épidermoïdes.
Dès lors, en
prenant en compte la différence d’expression des gènes entre les
librairies, 58 gènes différencient les adénocarcinomes des SAEC et
71 gènes différencient les carcinomes épidermoïdes des NHBE.
Ces
115 gènes se répartissent en trois groupes : ceux présents dans les
carcinomes épidermoïdes en rapport avec une activité de
détoxification et antioxydante, ceux retrouvés dans les
adénocarcinomes en rapport avec le codage de protéines des petites
voies aériennes et des réactions immunologiques, enfin le dernier
groupe regroupant des gènes associés à une différenciation
épithéliale et sous-exprimés dans les adénocarcinomes.
Cependant,
si l’intérêt est ciblé vers les gènes ayant un rôle dans les carcinomes
non à petites cellules en comparant avec les tissus normaux, et non
plus dans le but de différencier uniquement les types cellulaires, un
nombre beaucoup plus important de gènes sont identifiés : 827
séquences séparent les carcinomes épidermoïdes et les NHBE dont
dix séquences avec une expression différentielle supérieure à dix, de
même 298 séquences séparent les adénocarcinomes des SAEC (20
séquences étant dix fois plus exprimées).
Cette approche montre donc l’importance des renseignements
pouvant être obtenus concernant la cancérogenèse et la biologie
tumorale en comparaison avec les tissus normaux.
B - ÉTUDE DU PROTÉOME (OU PROTÉOMIQUE)
:
L’étude du protéome est l’étude de l’ensemble des protéines
exprimées par une cellule ou un tissu à un instant donné.
Oh et
al ont élaboré un projet d’étude global d’analyse moléculaire du
cancer pulmonaire intégrant les caractéristiques cliniques et
morphologiques de chaque échantillon avec les données de l’étude
du protéome (gel 2D et spectrométrie de masse), du transcriptome
(utilisation de puces à oligonucléotides) et de l’étude du génome
par des enzymes de restriction.
Ils individualisent, comme étant
discriminantes, pour les carcinomes à petites cellules, des protéines
associées à la prolifération cellulaire (proliferating cell nuclear
antigen : PCNA et oncoprotein 18 : OP18) ; alors que pour les
épidermoïdes et adénocarcinomes, ils retrouvent plutôt une grande
quantité de protéines S100 ainsi que la 27 kDa heat shock protein sous
sa forme phosphorylée ou non.
Pour identifier de nouveaux marqueurs tumoraux, les auteurs
recherchent également les protéines induisant une réponse anticorps
détectable dans le sérum des patients ayant un cancer pulmonaire.
Conclusion
:
Il est encore trop tôt pour conclure sur une liste de paramètres fixant
une carte d’identité moléculaire pour chaque sous-type de cancer bronchopulmonaire.
Cependant, les progrès sont rapides dans ce
domaine et on peut prévoir très prochainement la mise en évidence de
molécules non seulement diagnostiques ou pronostiques mais
également permettant de prédire de la réponse aux traitements, en
particulier de chimiothérapie.
C’est dans ce dernier domaine que l’on
peut attendre les avancées les plus prometteuses, en particulier dans le
choix des agents cytotoxiques, résumé sous l’appellation de
« chimiothérapie à la carte ».