Des scientifiques pourraient enfin avoir séquencé l’intégralité du génome humain
En 2003, après un financement de près de 3 milliards de dollars (2,5 millions d’euros) et 13 ans de minutieuses recherches, les scientifiques du Projet génome Humain (HGP pour Human Genome Project) ont annoncé qu’ils avaient finalement établi la première séquence du génome humain. Il s’agissait d’une percée importante dans la science qui allait révolutionner la génomique. Toutefois, le projet initial et les mises à jour de la séquence du génome humain qui ont suivi n’étaient pas complets à 100 %. Aujourd’hui, enfin cette semaine, les scientifiques du consortium Telomere-to-Telomere (T2T) affirment avoir résolu le problème des 8 % du génome humain qui manquaient encore.
Selon les scientifiques dans une étude en prépublication (lien plus bas), qui n’a pas encore fait l’objet d’un examen par les pairs :
Le consortium Telomere-to-Telomere (T2T) a terminé la première séquence véritablement complète de 3,055 milliards de paires de bases (pb) d’un génome humain, ce qui représente la plus grande amélioration de celui de référence depuis sa publication initiale.
Le génome est la somme de toutes les séquences d’ADN et d’ADN mitochondrial (ADNmt) de la cellule. Il contient toutes les instructions dont un être vivant a besoin pour survivre et se répliquer. Il est constitué de blocs de construction chimiques ou « bases » (A, T, C et G), dont l’ordre code l’information biologique.
Chez les organismes diploïdes, comme l’humain, la taille du génome est considérée comme le nombre total de bases dans une copie de son ADN nucléaire. Les êtres humains et les autres mammifères contiennent des copies doubles de presque tout leur ADN. Par exemple, nous avons des paires de chromosomes, un chromosome de chaque paire étant hérité de chaque parent. Mais les scientifiques ne s’intéressent qu’au séquençage de la somme des bases d’une copie de chaque paire de chromosomes. Le génome réel d’une personne fait environ six milliards de bases, mais une seule copie « représentative » du génome humain fait environ trois milliards de bases.
En raison de la taille du génome humain, ses bases ne peuvent être lues dans l’ordre de bout en bout en une seule étape. Pour séquencer le génome, les scientifiques du HGP ont d’abord décomposé l’ADN en petits morceaux, chaque morceau étant ensuite soumis à diverses réactions chimiques qui ont permis de déduire l’identité et l’ordre de ses bases. Ces morceaux ont ensuite été réassemblés pour en déduire la séquence du génome de départ.
Bien que la technologie de séquençage du génome ait beaucoup progressé depuis que le HGP a annoncé la première ébauche du génome humain en 2001, une séquence complète du génome entier n’a jamais été réalisée. Il manquait environ 8 % du génome, ce qui correspond à des zones où les séquences d’ADN sont constituées de longs motifs répétitifs. Certains, comme ceux que l’on trouve dans les centromères des chromosomes (le « nœud » qui relie les chromosomes entre eux), jouent un rôle biologique important, mais la technologie actuelle n’a pas permis de les décoder correctement.
Grâce à une nouvelle technologie révolutionnaire, les scientifiques affiliés au T2T affirment désormais avoir comblé ces manques.
Selon Karen Miga, chercheuse à l’université de Californie à Santa Cruz, qui a codirigé le consortium international :
Vous essayez simplement de fouiller dans cette dernière inconnue du génome humain. Cela n’a tout simplement jamais été fait auparavant et la raison en est que c’est très difficile.
Selon Miga et ses collègues, la percée du génome a été rendue possible grâce aux nouvelles technologies de séquençage de l’ADN développées par les sociétés de biotechnologies Pacific Biosciences en Californie aux Etats-Unis et Oxford Nanopore au Royaume-Uni. Ces technologies ne découpent pas l’ADN en petits morceaux pour les assembler ultérieurement, ce qui peut entraîner des erreurs. Au contraire, la technologie d’Oxford Nanopore fait passer la molécule d’ADN par un trou nanoscopique, ce qui permet d’obtenir une longue séquence. Parallèlement, les lasers mis au point par Pacific Biosciences lisent la même séquence d’ADN encore et encore, ce qui rend la lecture beaucoup plus précise que les technologies précédentes.
Les deux technologies se sont complétées pour révéler les parties manquantes du génome qui échappent aux scientifiques depuis près de deux décennies. Le nombre de bases d’ADN est passé de 2,92 milliards à 3,05 milliards, marquant une amélioration de 4,5 %. Cependant, le nombre de gènes n’a augmenté que de 0,4 %, pour atteindre 19 1969. Cela s’explique par le fait que la grande majorité des séquences d’ADN ne codent pas pour des protéines, mais régulent plutôt l’expression et l’activité de ces gènes.
Selon les chercheurs :
L’assemblage complet, de télomère à télomère, d’un génome humain marque une nouvelle ère de la génomique où aucune région du génome n’est hors de portée. Les précédentes mises à jour du génome humain de référence ont été progressives et le coût élevé du passage à un nouvel assemblage a dépassé les gains marginaux pour de nombreux chercheurs. En revanche, l’assemblage T2T-CHM13 présenté ici comprend cinq bras chromosomiques entièrement nouveaux et constitue l’ajout le plus important de nouveau contenu au génome humain au cours des 20 dernières années.
Ces 8% du génome n’ont pas été négligés en raison de leur manque d’importance, mais plutôt en raison des limitations technologiques. Le séquençage de haute précision à longue lecture a finalement éliminé cette barrière technologique, permettant des études complètes de la variation génomique sur l’ensemble du génome humain. De telles études nécessiteront nécessairement un génome de référence humain complet et précis, ce qui conduira finalement à l’adoption de l’assemblage T2T-CHM13 présenté ici.
Le génome que les chercheurs ont séquencé ne provenait pas d’une personne, mais d’une môle hydatiforme, une masse ou une excroissance rare qui se forme à l’intérieur de l’utérus au début d’une grossesse. Ce tissu se forme lorsque le sperme féconde un ovule dépourvu de noyau. Il ne contient donc que 23 chromosomes, tout comme un gamète (sperme ou ovule), au lieu des 46 que l’on trouve dans l’ADN d’une cellule humaine. Ces cellules rendent le travail de calcul plus simple, mais peuvent constituer une limite.
Nous en saurons plus une fois que cette étude aura fait l’objet d’une évaluation par les pairs et d’un examen approfondi par la communauté scientifique internationale. Si les résultats sont confirmés, ils pourraient marquer une nouvelle ère de la génomique, une ère où aucun recoin de l’ADN n’est laissé inexploré.
L’étude en prépublication dans BioRxiv : The complete sequence of a human genome via le Telomere-to-Telomere (T2T) consortium.
Bonjour Gourou,
Une petite erreur s’est glissée en début d’article sur la conversion dollar / euro.
Continuez comme ça, vous faites un travail extraordinaire !
Bonjour Gaëtan, Merci pour votre remarque et vos encouragements ! Ah ! et c’est Guru et non Gourou 😉