En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des publicités adaptées à vos centres d’intérêts, réaliser des statistiques ainsi qu’interagir avec des réseaux sociaux.

Pour en savoir plus et paramétrer les cookies

Identifiez-vous ou Créez un compte

gène

Représentation de l'ADN
Représentation de l'ADN

Segment d'ADN conditionnant la synthèse d'une ou de plusieurs protéines et, donc, la manifestation et la transmission d'un caractère héréditaire déterminé.

Les gènes sont des segments de molécules d'ADN. Ils peuvent être groupés en unités fonctionnelles (opérons). On trouve des gènes chez tous les êtres vivants. Chez les virus dont le matériel génétique est constitué d’ARN et non d’ADN, ce sont des segments de molécules d'ARN. Chez les eucaryotes, les gènes sont essentiellement portés par les chromosomes contenus dans le noyau cellulaire, mais il en existe aussi dans les mitochondries et, chez les végétaux, dans les chloroplastes (ces gènes sont portés par les ADN respectivement mitochondrial et chloroplastique).

1. Le génotype détermine le phénotype

Les gènes sont situés à des endroits bien spécifiques des chromosomes, que l'on appelle locus. Cette localisation est toujours identique d'une génération à la suivante. L'être humain possède environ 25 000 gènes différents, répartis sur les 23 paires de chromosomes, l'ensemble des gènes d'un individu constituant son génotype. L'ensemble du matériel génétique, c'est-à-dire toutes les molécules d'ADN d'une cellule, est appelé génome. Les chromosomes allant par paires, chaque cellule possède chaque gène en double. Seuls les gènes portés par les chromosomes X et Y chez l'individu de sexe masculin sont uniques.

Les gènes gouvernent la synthèse d'ARN de plusieurs types, et par là de protéines, qui sont directement ou indirectement responsables de tous les caractères, visibles ou invisibles, de l'organisme (le phénotype). Les gènes subissent spontanément des transformations, les mutations, qui peuvent aussi être induites par des rayonnements (rayons X, rayons ultraviolets) ou des substances chimiques et entraînent la modification du caractère déterminé par le gène. (Ne sont connus, d'ailleurs, que les gènes qui ont muté.)

→ génétique.

2. Les formes alléliques d'un gène

Les différentes versions d'un gène (le gène « couleur des yeux », par exemple) sont appelées allèles (yeux bleus, yeux bruns, yeux verts, etc.). Lorsque l'allèle est le même sur les deux chromosomes, le sujet est dit homozygote. Si les deux allèles sont différents, il est dit hétérozygote. Lorsque chaque allèle a subi une mutation différente, le sujet est dit double hétérozygote, ou hétérozygote composite.

Une maladie héréditaire qui se manifeste seulement si les deux allèles du gène en cause sont mutés est dite à transmission récessive. Si, au contraire, un seul allèle muté suffit pour que la maladie se manifeste, elle est dite à transmission dominante.

3. La transcription des gènes

La transcription correspond à la synthèse d’une molécule d’ARN à partir d’un modèle ADN. L'ADN est formé d'une suite linéaire de millions de nucléotides formés chacun de l'enchaînement d'un groupement phosphate et d'un sucre, le désoxyribose, portant une base pouvant être une adénine, une cytosine, une guanine ou une thymine (A, C, G ou T) ; l'information réside dans la suite des bases (la séquence nucléotidique). L'ADN comporte en réalité deux brins complémentaires de directions opposées enroulés l'un autour de l'autre (structure en double hélice élucidée par Watson et Crick en 1953). On peut la décrire comme un escalier en colimaçon, où les deux chaînes sucres-phosphates constituent les rampes, et les bases, tournées vers l'intérieur et se faisant face deux à deux, les marches. La complémentarité s'exprime par le fait qu'une adénine s'apparie toujours avec une thymine, et une guanine toujours avec une cytosine (on ne trouve donc que des « marches » A-T, T-A, C-G ou G-C). Elle constitue le fondement, non seulement de la perpétuation de l'information génétique (lors de la réplication), mais aussi de la transcription : la double hélice est alors juste déroulée transitoirement pour permettre à l'ARN polymérase de synthétiser selon les règles de l'appariement un brin d'ARN messager complémentaire du brin non codant, qui sert de matrice sur toute la région codante du gène considéré. L'ARN messager possède la même séquence que le brin codant d'ADN de départ, mais comporte des riboses au lieu des désoxyriboses et l'uracile (U) à la place de la thymine.

La question est de savoir ce qui détermine le début et la fin de la transcription par la polymérase. Pour le démarrage, des séquences signal, présentes au niveau du promoteur (partie du gène située en amont de la région codante), servent à positionner la polymérase. Chez les bactéries, les promoteurs contiennent très souvent la séquence TTGACA à 35 paires de bases et la séquence TATAAT à 10 paires de bases en amont du point de départ. Chez les eucaryotes, dans la très grande majorité des cas, la polymérase est positionnée par la fixation de la protéine TBP (en anglais, TATA-binding protein) à un court segment du promoteur contenant aussi la séquence TATA (la « boîte TATA »), mais situé cette fois à 25 paires de bases en amont du point de départ. Au point de départ proprement dit se trouve un autre élément de signalisation, le site initiateur, mais dont la séquence est beaucoup moins conservée. Une fois initiée, la transcription continue par élongation de l'ARN messager jusqu'au terminateur, situé juste après la région codante, et qui contient un signal de fin d'élongation.

3.1. La régulation de la transcription

Cette tâche est dévolue aux régulateurs de transcription, que l'on peut classer en deux grands groupes : les répresseurs et les activateurs. Chacun contrôle toute une catégorie de gènes possédant dans la région régulatrice une même séquence de reconnaissance à laquelle il se lie spécifiquement. Chez les bactéries, la régulation est souvent fondée sur la répression : un répresseur est fixé sur son site de liaison, l'opérateur, situé à proximité du promoteur, gênant ainsi la fixation de la polymérase. La répression est levée par la présence d'un inducteur dans le milieu, qui agit en dissociant le répresseur de l'opérateur, permettant à la transcription de démarrer.

La situation est beaucoup plus complexe chez les eucaryotes, où le niveau de transcription d'un gène résulte de l'interaction globale de l'ensemble des activateurs et des répresseurs qui le contrôlent avec la machinerie transcriptionnelle. Les activateurs facilitent l'assemblage d'un complexe de préinitiation comprenant une dizaine d'entités multi-protéiques appelées « facteurs de transcription ». Les répresseurs empêchent l'ARN polymérase de démarrer la transcription, entre autres par compétition avec les facteurs de transcription ou les activateurs pour la liaison à l'ADN. La transcription de chaque gène est contrôlée spécifiquement, chacun étant régulé par une combinaison unique d'activateurs et de répresseurs.

De plus, chez les eucaryotes, l'ADN est stocké de manière très compacte au sein du noyau sous forme de fibre de chromatine, long chapelet de grains de forme cylindrique, les nucléosomes, constitués chacun d'un cœur de protéines basiques, les histones, autour duquel la double hélice est elle-même enroulée sur deux tours. Au sein de la chromatine, les facteurs de transcription et les protéines régulatrices n'ont pas accès aux séquences d'ADN qu'elles reconnaissent spécifiquement, ce qui constitue une manière basale de réprimer l'expression des gènes. Il faut l'intervention de protéines capables de remodeler la chromatine au niveau de ces sites régulateurs pour les rendre accessibles à la machinerie transcriptionnelle.

3.2. La reconnaissance de sites spécifiques de l'ADN

Comment les régulateurs de transcription reconnaissent-ils leurs gènes cibles au sein d'un génome qui en compte plus d'une centaine de milliers ? Des études de mutagenèse ont montré que chacune de ces protéines se lie à l'ADN, le plus souvent en amont de la partie codante des gènes dont elle contrôle l'expression, grâce à la présence d'une séquence d'une dizaine de paires de bases qui lui sert à la fois de site de reconnaissance spécifique et de point d'ancrage. Pour favoriser la formation du complexe ADN-protéine au niveau de la séquence correcte par rapport à toutes les autres, il faut une complémentarité structurale et une stabilisation énergétique, réalisée essentiellement au moyen de liaisons hydrogène et de Van der Waals. La mutation d'une seule paire de bases du site de liaison ou d'un seul aminoacide de la protéine peut suffire à diminuer considérablement l'association sélective des deux.

La double hélice présente, entre les deux chaînes enroulées l'une autour de l'autre, un petit et un grand sillon ; le second, plus large, offrant un meilleur accès aux bases enfouies au cœur de la structure et un plus grand pouvoir discriminant entre les différentes paires de bases, est utilisé le plus souvent dans l'interaction avec la protéine. Dans de très nombreux cas, la protéine utilise un élément de sa propre structure, une hélice alpha : celle-ci va se loger dans le grand sillon à la manière d'une « tête de lecture », les chaînes latérales de certains aminoacides de l'hélice contactant directement les bases de la séquence cible. Cette « hélice de reconnaissance » fait toujours partie d'un motif structural (le « domaine de liaison ») permettant de la stabiliser et de renforcer l'association avec le bon segment d'ADN, en particulier grâce à des liaisons électrostatiques avec les groupements phosphates.

Actuellement, plus d'une centaine de structures de complexes entre un domaine de liaison à l'ADN et un fragment d'ADN contenant la séquence reconnue ont été déterminées expérimentalement, essentiellement par cristallographie aux rayons X et dans quelques cas par résonance magnétique nucléaire (RMN). Il est apparu que les modes de reconnaissance étaient variés, en particulier qu'ils n'étaient pas limités aux hélices alpha, mais faisaient parfois intervenir des feuillets bêta (autre grand type d'élément de structure secondaire rencontré dans les protéines), et aussi le petit sillon de la double hélice plutôt que le grand sillon, comme dans le cas de la TBP. Différents motifs structuraux lient l'ADN, les plus fréquemment rencontrés étant l'« hélice-coude-hélice » et les « doigts de zinc ». Dans les seconds, des ions zinc servent à stabiliser la structure du domaine protéique par liaison à quatre aminoacides disséminés le long de la chaîne polypeptidique, des cystéines ou des histidines.

Un domaine de liaison à l'ADN reconnaît de 3 à 6 paires de bases, ce qui est trop court pour assurer la spécificité de la séquence cible. Pour résoudre ce problème, certains régulateurs de transcription contiennent plusieurs domaines de liaison à l'ADN, mais, le plus souvent, deux molécules de protéines s'associent pour former un dimère. Dans les deux cas, le site reconnu est plus long et la spécificité (discrimination) est donc accrue considérablement, mais l'autre avantage du dimère est l'augmentation importante de la force de liaison du complexe (affinité). Par ailleurs, la possibilité d'association en hétérodimère (deux protéines différentes) permet une combinatoire plus élevée qu'en homodimère et donc une régulation plus complexe.

Un autre facteur important dans la formation et la stabilisation des complexes ADN-protéine est la courbure de l'ADN. Celle-ci peut être intrinsèque (due à la séquence nucléotidique elle-même), ou bien encore induite par l'interaction avec la protéine. Dans ce cas, une adaptation mutuelle des deux partenaires permet d'optimiser leur association. Ainsi, le dimère de la protéine CAP (catabolite activator protein) coude la double hélice à plus de 90° pour s'y fixer plus facilement. La courbure de l'ADN est parfois essentielle à l'activité de la protéine; ainsi, les activateurs de transcription pourraient agir en facilitant l'assemblage du complexe de préinitiation par le rapprochement de ses différents composants.