L’apprentissage automatique révèle une recette pour construire des protéines artificielles

L'apprentissage automatique révèle une recette pour construire des protéines artificielles

protéine

Crédit: Unsplash / CC0 Public Domain

Les protéines sont essentielles à la vie des cellules, effectuant des tâches complexes et catalysant des réactions chimiques. Les scientifiques et les ingénieurs cherchent depuis longtemps à exploiter ce pouvoir en concevant des protéines artificielles capables d’exécuter de nouvelles tâches, comme traiter des maladies, capturer du carbone ou récolter de l’énergie, mais bon nombre des processus conçus pour créer de telles protéines sont lents et complexes, avec un échec élevé. taux.


Dans le cadre d’une percée qui pourrait avoir des implications dans les secteurs de la santé, de l’agriculture et de l’énergie, une équipe dirigée par des chercheurs de la Pritzker School of Molecular Engineering (PME) de l’Université de Chicago a développé un processus basé sur l’intelligence artificielle qui utilise le big data pour concevoir de nouvelles protéines.

En développant des modèles d’apprentissage automatique capables d’examiner les informations protéiques extraites des bases de données génomiques, les chercheurs ont trouvé des règles de conception relativement simples pour la construction de protéines artificielles. Lorsque l’équipe a construit ces protéines artificielles en laboratoire, ils ont constaté qu’elles exécutaient si bien les chimies qu’elles rivalisaient avec celles trouvées dans la nature.

«Nous nous sommes tous demandé comment un processus simple comme l’évolution pouvait conduire à un matériau aussi performant qu’une protéine», a déclaré Rama Ranganathan, professeur Joseph Regenstein au Département de biochimie et biologie moléculaire, Pritzker Molecular Engineering et au Collège. «Nous avons découvert que les données génomiques contiennent d’énormes quantités d’informations sur les règles de base de la structure et de la fonction des protéines, et maintenant nous avons pu mettre en bouteille les règles de la nature pour créer nous-mêmes des protéines.

Les résultats ont été publiés le 24 juillet dans la revue Science.

Utiliser l’intelligence artificielle pour apprendre les règles de conception

Les protéines sont constituées de centaines ou de milliers d’acides aminés, et ces séquences d’acides aminés spécifient la structure et la fonction de la protéine. Mais comprendre comment construire ces séquences pour créer de nouvelles protéines a été un défi. Les travaux antérieurs ont abouti à des méthodes qui peuvent spécifier la structure, mais la fonction a été plus insaisissable.

Ce que Ranganathan et ses collaborateurs ont réalisé au cours des 15 dernières années, c’est que les bases de données génomiques – qui se développent de façon exponentielle – contiennent d’énormes quantités d’informations sur les règles de base de la structure et du fonctionnement des protéines. Son groupe a développé des modèles mathématiques basés sur ces données, puis a commencé à utiliser des méthodes d’apprentissage automatique pour révéler de nouvelles informations sur les règles de conception de base des protéines.

Pour cette recherche, ils ont étudié la famille des enzymes métaboliques de la chorismate mutase, un type de protéine important pour la vie de nombreuses bactéries, champignons et plantes. À l’aide de modèles d’apprentissage automatique, les chercheurs ont pu révéler les règles de conception simples derrière ces protéines.

Le modèle montre que la simple conservation aux positions des acides aminés et les corrélations dans l’évolution des paires d’acides aminés sont suffisantes pour prédire de nouvelles séquences artificielles qui auraient les propriétés de la famille des protéines.

«Nous supposons généralement que pour construire quelque chose, vous devez d’abord comprendre profondément comment cela fonctionne», a déclaré Ranganathan. « Mais si vous disposez de suffisamment d’exemples de données, vous pouvez utiliser des méthodes d’apprentissage en profondeur pour apprendre les règles de conception, même si vous comprenez comment cela fonctionne ou pourquoi il est construit de cette façon. »

Lui et ses collaborateurs ont ensuite créé des gènes synthétiques pour coder les protéines, les ont clonés en bactéries et ont observé que les bactéries fabriquaient ensuite les protéines synthétiques en utilisant leur machinerie cellulaire normale. Ils ont découvert que les protéines artificielles avaient la même fonction catalytique que les protéines chorismate mutase naturelles.

Une plateforme pour comprendre d’autres systèmes complexes

Parce que les règles de conception sont si relativement simples, le nombre de protéines artificielles que les chercheurs pourraient potentiellement créer avec elles est extrêmement important.

« Les contraintes sont beaucoup plus petites que nous n’aurions jamais imaginé qu’elles le seraient », a déclaré Ranganathan. « Il y a une simplicité dans les règles de conception de la nature, et nous pensons que des approches similaires pourraient nous aider à rechercher des modèles de conception dans d’autres systèmes complexes en biologie, comme les écosystèmes ou le cerveau. »

Bien que l’intelligence artificielle ait révélé les règles de conception, Ranganathan et ses collaborateurs ne comprennent toujours pas pleinement pourquoi les modèles fonctionnent. Ensuite, ils travailleront pour comprendre comment les modèles sont arrivés à cette conclusion. « Il y a encore beaucoup de travail à faire », a-t-il déclaré.

En attendant, ils espèrent également utiliser cette plateforme pour développer des protéines capables de résoudre des problèmes sociétaux urgents, comme le changement climatique. Ranganathan et Assoc. Le professeur Andrew Ferguson a créé une société appelée Evozyne qui commercialisera cette technologie avec des applications dans les domaines de l’énergie, de l’environnement, de la catalyse et de l’agriculture. Ranganathan a travaillé avec le Polsky Center for Entrepreneurship and Innovation d’UChicago pour déposer des brevets et octroyer une licence de propriété intellectuelle à l’entreprise.

« Ce système nous donne une plate-forme pour l’ingénierie rationnelle des molécules de protéines d’une manière que nous avons toujours rêvé de pouvoir », a-t-il déclaré. «Non seulement cela peut nous apprendre la physique du fonctionnement des protéines et de leur évolution, mais cela peut nous aider à trouver des solutions à des problèmes tels que la capture du carbone et la récupération d’énergie. De manière encore plus générale, les études sur les protéines pourraient même nous aider à nous apprendre comment le neural profond les réseaux derrière l’apprentissage automatique moderne fonctionnent réellement.  »


Une course pour résoudre le casse-tête des protéines COVID


Plus d’information:
Un modèle basé sur l’évolution pour la conception d’enzymes chorismate mutase, Science (2020). DOI: 10.1126 / science.aba3304

Fourni par l’Université de Chicago

Citation: L’apprentissage automatique révèle une recette pour construire des protéines artificielles (24 juillet 2020) récupéré le 25 juillet 2020 sur https://phys.org/news/2020-07-machine-reveals-recipe-artificial-proteins.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.