Projet pangénome humain : cette nouvelle carte du génome tente de capturer toutes les variations génétiques humaines
La première version d’un « pangénome » humain, qui cartographie les différentes variations de l’ADN dans nos gènes, a été publiée. Cette nouvelle version s’appuie sur le génome humain de référence existant en y ajoutant plus de 1 000 nouvelles mutations génétiques et près de 120 millions de paires de bases, ce qui constitue une ressource inestimable pour le futur de la recherche génétique.
En 2001, le Human Genome Project ou projet Génome humain a publié la première version de son génome humain de référence, avec des mises à jour ajoutant davantage de détails au cours des années suivantes jusqu’à ce qu’il atteigne sa version actuelle, connue sous le nom de GRCh38. Ce n’est qu’en 2022 qu’un génome humain complet a été publié, mais même cela ne révèle pas toute l’histoire.
Selon Adam Phillippy, coauteur de la nouvelle étude :
Chaque personne a un génome unique, de sorte que l’utilisation d’une séquence de référence unique pour chaque personne peut entraîner des inégalités dans les analyses génomiques. Par exemple, la prédiction d’une maladie génétique pourrait ne pas fonctionner aussi bien pour une personne dont le génome est plus différent du génome de référence.
Pour remédier à cette situation, un groupe appelé le Human Pangenome Reference Consortium travaille à l’élaboration d’un atlas plus complet de la variété génétique humaine, connu sous le nom de pangénome, dont la première ébauche vient d’être publiée (liens plus bas).
Cette première ébauche du pangénome a été assemblée à partir de l’ADN de 47 personnes d’origines diverses. Par rapport au génome humain principal de référence actuel, il ajoute 119 millions de paires de bases et 1 115 nouvelles mutations de duplication génétique, offrant ainsi de multiples options pour la même portion d’ADN.
Une représentation du pangénome humain réimaginé comme un plan de métro, mettant en évidence tous les chemins/ variations possibles. (Darryl Leja, NHGRI)
Selon Mobin Asri, coauteur de l’étude :
En utilisant le pangénome de référence, nous pouvons identifier avec une plus grande précision des variantes génomiques plus importantes appelées variantes structurelles. Nous sommes en mesure de trouver des variantes qui n’ont pas été identifiées par les précédentes méthodes qui dépendent de séquences de référence linéaires.
Ces variantes structurelles peuvent s’étendre sur plusieurs milliers de bases et jouer un rôle essentiel dans les gènes d’un individu, notamment en ce qui concerne les risques de maladie. Mais il est difficile de les identifier avec un seul génome de référence principal. L’utilisation de cette ébauche de pangénome a déjà permis aux scientifiques de plus que doubler le nombre de variantes structurelles identifiées dans le GRCh38.
Et bien sûr, ce n’est qu’un début. Cette première version ne contient que les informations génétiques de 47 personnes, mais le Human Pangenome Reference Consortium prévoit de porter ce nombre à 350 dans la version finale, attendue pour le milieu de l’année 2024.
Présentation des travaux par l’Université de Californie à Santa Cruz :
L’étude, ainsi que trois autres documents qui explorent les premières applications des données, publiée dans Nature : A draft human pangenome reference et présentée sur le site du National Institutes of Health : Scientists release a new human “pangenome” reference et sur le site de l’Université de Californie à Santa Cruz : Human pangenome reference will enable more complete and equitable understanding of genomic diversity.