Les scientifiques réalisent le premier assemblage complet du chromosome X humain

Les scientifiques réalisent le premier assemblage complet du chromosome X humain

génome

Crédits: CC0 Public Domain

Bien que le génome humain de référence actuel soit le génome vertébré le plus précis et le plus complet jamais produit, il existe encore des lacunes dans la séquence d’ADN, même après deux décennies d’améliorations. Maintenant, pour la première fois, les scientifiques ont déterminé la séquence complète d’un chromosome humain d’un bout à l’autre («télomère à télomère») sans lacunes et avec un niveau de précision sans précédent.


La publication de l’assemblage télomère à télomère d’un chromosome X humain complet le 14 juillet La nature est une réalisation historique pour les chercheurs en génomique. L’auteur principal Karen Miga, chercheur à l’UC Santa Cruz Genomics Institute, a déclaré que le projet a été rendu possible par de nouvelles technologies de séquençage qui permettent des « lectures ultra-longues », telles que la technologie de séquençage des nanopores mise au point à l’UC Santa Cruz.

Les séquences d’ADN répétitives sont courantes dans tout le génome et ont toujours posé un défi pour le séquençage car la plupart des technologies produisent des « lectures » relativement courtes de la séquence, qui doivent ensuite être reconstituées comme un puzzle pour assembler le génome. Les séquences répétitives donnent beaucoup de lectures courtes qui semblent presque identiques, comme une grande étendue de ciel bleu dans un puzzle, sans aucun indice sur la façon dont les pièces s’assemblent ou sur le nombre de répétitions.

« Ces séquences riches en répétitions étaient autrefois jugées intraitables, mais maintenant nous avons fait des sauts et des limites dans la technologie de séquençage », a déclaré Miga. « Avec le séquençage des nanopores, nous obtenons des lectures ultra-longues de centaines de milliers de paires de bases qui peuvent s’étendre sur une région entière de répétition, ce qui contourne certains des défis. »

Combler les lacunes restantes dans la séquence du génome humain ouvre de nouvelles régions du génome où les chercheurs peuvent rechercher des associations entre les variations de séquence et la maladie et d’autres indices sur des questions importantes sur la biologie humaine et l’évolution.

« Nous commençons à constater que certaines de ces régions où il y avait des lacunes dans la séquence de référence sont en fait parmi les plus riches pour la variation des populations humaines, donc nous avons manqué beaucoup d’informations qui pourraient être importantes pour comprendre la biologie humaine et maladie « , a déclaré Miga.

Miga et Adam Phillippy de l’Institut national de recherche sur le génome humain (NHGRI), les deux auteurs correspondants du nouveau document, ont cofondé le consortium Telomere-to-Telomere (T2T) pour poursuivre un assemblage complet du génome après avoir travaillé ensemble sur un document de 2018 qui a démontré le potentiel de la technologie des nanopores pour produire une séquence complète du génome humain. Cet effort a utilisé le séquenceur MinION d’Oxford Nanopore Technologies, qui séquence l’ADN en détectant le changement du flux de courant lorsque des molécules d’ADN uniques traversent un petit trou (un «nanopore») dans une membrane.

Le nouveau projet s’est appuyé sur cet effort, combinant le séquençage de nanopores avec d’autres technologies de séquençage de PacBio et Illumina, et des cartes optiques de BioNano Genomics. À l’aide de ces technologies, l’équipe a produit un assemblage de génome entier qui dépasse tous les assemblages de génome humain antérieurs en termes de continuité, d’exhaustivité et de précision, dépassant même le génome humain de référence actuel par certaines mesures.

Néanmoins, il y avait encore plusieurs interruptions dans la séquence, a déclaré Miga. Pour terminer le chromosome X, l’équipe a dû résoudre manuellement plusieurs lacunes dans la séquence. Deux duplications segmentaires ont été résolues avec des lectures de nanopores ultra-longues qui couvraient complètement les répétitions et étaient ancrées de manière unique de chaque côté. La rupture restante était au centromère, une région notoirement difficile d’ADN répétitif trouvée dans chaque chromosome.

Dans le chromosome X, le centromère englobe une région d’ADN hautement répétitif couvrant 3,1 millions de paires de bases (les bases A, C, T et G forment des paires dans la double hélice d’ADN et codent les informations génétiques dans leur séquence). L’équipe a pu identifier des variantes dans la séquence de répétition pour servir de marqueurs, qu’ils ont utilisés pour aligner les longues lectures et les connecter ensemble pour couvrir tout le centromère.

« Pour moi, l’idée que nous pouvons créer une répétition en tandem de 3 mégabase est époustouflante. Nous pouvons maintenant atteindre ces régions de répétition couvrant des millions de bases qui étaient auparavant jugées intraitables », a déclaré Miga.

L’étape suivante a été une stratégie de polissage utilisant les données de plusieurs technologies de séquençage pour garantir la précision de chaque base de la séquence.

« Nous avons utilisé un processus itératif sur trois plates-formes de séquençage différentes pour peaufiner la séquence et atteindre un haut niveau de précision », a expliqué Miga. « Les marqueurs uniques fournissent un système d’ancrage pour les lectures ultra-longues, et une fois que vous avez ancré les lectures, vous pouvez utiliser plusieurs ensembles de données pour appeler chaque base. »

Le séquençage des nanopores, en plus de fournir des lectures ultra-longues, peut également détecter des bases qui ont été modifiées par méthylation, un changement « épigénétique » qui ne modifie pas la séquence mais a des effets importants sur la structure de l’ADN et l’expression des gènes. En cartographiant les profils de méthylation sur le chromosome X, l’équipe a pu confirmer les observations précédentes et révéler certaines tendances intrigantes des profils de méthylation dans le centromère.

La nouvelle séquence du génome humain, dérivée d’une lignée cellulaire humaine appelée CHM13, comble de nombreuses lacunes dans le génome de référence actuel, connu sous le nom de Genome Reference Consortium build 38 (GRCh38).

Le consortium T2T continue de travailler à l’achèvement de tous les chromosomes CHM13. « C’est un consortium ouvert, donc à bien des égards, c’est un projet mené par la communauté, avec beaucoup de gens qui y consacrent du temps et des ressources », a déclaré Miga.


Les scientifiques se rapprochent de la cartographie du génome humain entier


Plus d’information:
Karen H. Miga et al, Assemblage télomère à télomère d’un chromosome X humain complet, La nature (2020). DOI: 10.1038 / s41586-020-2547-7

Fourni par l’Université de Californie – Santa Cruz

Citation: Les scientifiques réalisent le premier assemblage complet du chromosome X humain (2020, 14 juillet) récupéré le 14 juillet 2020 sur https://phys.org/news/2020-07-scientists-human-chromosome.html

Ce document est soumis au droit d’auteur. Hormis toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.