En lisant ce qui suit, vous aurez une base solide pour comprendre la façon dont les produits génétiques fonctionnent, depuis les tests d’ethnicité jusqu’à la recherche de parents ou d’enfants biologiques, et plus.
ARN
L’acide ribonucléique (ARN) est similaire à l’ADN de plusieurs manières. C’est aussi une molécule composée de 4 nucléotides – A, U, G et C. A et U sont complémentaires tout comme A et T le sont dans l’ADN, et G et C sont complémentaires comme dans l’ADN. La fonction principale de l’ARN est de « lire » l’ADN. Pensez à l’ADN comme l’ensemble des instructions originales écrites à l’encre, et l’ARN sont les notes prises au crayon. Des copies de sections d’ADN sont réalisées dans l’ARN – un processus appelé transcription ; à leur tour, les protéines sont assemblées sur la base de ces notes – un processus appelé traduction.
Régulation de l’ARN
L’ARN est instable. Dès que la protéine est assemblée, les notes sont effacées, c’est-à-dire que la molécule d’ARN tombe en morceaux. Cette instabilité de l’ARN est une caractéristique importante car tant que l’ARN reste en contact, de plus en plus de protéines seront assemblées (c’est l’expression de l’ADN). En se décomposant relativement rapidement, l’ARN est capable de réguler la quantité de protéines traduites. Si beaucoup de protéines sont nécessaires, davantage de molécules d’ARN seront transcrites à partir de la même section d’ADN, entraînant la traduction de nombreuses protéines.
L’ARN subit un épissage alternatif. Une autre façon dont l’ARN régule l’exécution des instructions dans le manuel d’ADN est un mécanisme appelé épissage alternatif. Cela signifie qu’une seule instruction dans l’ADN peut être transcrite en ARN puis, avant la traduction, différentes sections peuvent être effacées ou découpées ; les sections restantes sont ensuite assemblées.
Pour fonctionner, notre corps a besoin de nombreuses protéines différentes. Si chaque protéine avait sa propre instruction, nous aurions beaucoup plus d’ADN que les 3 milliards de paires de nucléotides que nous avons déjà ! Il y a une limite à la quantité de matériel pouvant être contenue et entretenue. Dans le même temps, si chaque morceau d’ADN ne pouvait produire qu’une seule protéine, nous n’aurions pas toutes les protéines dont nous avons besoin pour remplir les fonctions essentielles. Le fait que l’intermédiaire entre l’ADN et les protéines, l’ARN, puisse être modifié, est une solution ingénieuse.
Types d’ARN
Examinons de plus près deux types d’ARN : ARNm et ARNt.
L’ARNm sont les « notes au crayon » que nous avons décrites ci-dessus. C’est l’ARN qui semble presque identique à une section originale d’ADN et qui, après traduction, se démonte relativement rapidement.
L’ARNt est un type spécial d’ARN qui lit l’ARNm et collecte en conséquence les blocs de construction appropriés pour les protéines. Il existe 20 acides aminés possibles pour la fabrication de protéines. Chacun des acides aminés est reconnu par une molécule d’ARNt unique. Chaque groupe de 3 nucléotides – codons – est reconnu par un ARNt, qui ajoute son acide aminé respectif à la chaîne en croissance, jusqu’à ce que la longueur totale de la protéine ait été assemblée.
Les protéines
Une fois que les protéines sont assemblées, elles subissent des modifications supplémentaires, comme si elles étaient pliées correctement. Elles sont ensuite transportées à l’intérieur ou à l’extérieur de la cellule où elles sont censées exécuter l’instruction initiale.
Si des erreurs sont commises et que les protéines ne sont pas correctes, elles sont éliminées dans des poubelles cellulaires appelées protéasomes. Sinon, elles vont remplir leur mission.
Variabilité entre ethnicités
Il est intéressant de noter que, dans certains cas, l’expression des gènes, ou des niveaux de protéines, diffèrent d’une ethnicité à l’autre.
Pour vous donner une estimation d’ethnicité MyHeritage, nous lisons votre ADN et produisons un fichier de données avec les informations. Nous ne lisons pas chaque partie de votre ADN, ce qui représente environ 3 milliards de points. Il s’agit d’une méthode coûteuse appelée séquençage du génome entier, actuellement réservée à des applications cliniques et de recherches spécifiques. Au lieu de cela, nous nous concentrons sur la lecture d’environ 700 000 sites de votre ADN, connus pour varier d’un individu à l’autre, appelés polymorphismes mononucléotidiques (SNP, prononcés « snips »). Cette méthode s’appelle le génotypage et produit un fichier de données qui répertorie chaque SNP que nous lisons, sa position dans votre ADN et les deux allèles que nous y avons trouvés (c’est-à-dire les A, T, G ou C hérités de chaque parent). En analysant vos génotypes pour certains SNP, nous pouvons estimer quel pourcentage de votre ADN provient de chaque groupe ethnique.
La fréquence allélique de certains SNP, par exemple la probabilité d’avoir un A ou un T dans des positions données, est associée à différentes ethnicités. Certains SNP sont associés à la quantité d’un gène donné qui a tendance à être exprimée. Pour ne donner qu’un exemple, il existe une protéine spécifique qui se trouve généralement en différentes quantités chez les Caucasiens britanniques et chez les Jamaïcains en raison de différents génotypes associés à l’appartenance ethnique.
Le dogme central
Le processus d’expression des gènes – de l’ADN à l’ARN en protéines – est appelé « Le Dogme » par les scientifiques. Si vous avez suivi la série des notions de base de l’ADN depuis le début, vous maîtrisez parfaitement les bases de l’ADN. Nous espérons que vous resterez avec nous pour continuer à explorer des concepts d’ADN intéressants.