"Mieux vaut tard que jamais" ! Google DeepMind a dévoilé aujourd'hui sa dernière technologie à une communauté universitaire enthousiasteCode source du logiciel de prédiction des protéines de l'intelligence artificielle. Bien que certains scientifiques aient exprimé leur mécontentement face au fait qu'il ait fallu six mois à DeepMind pour publier le code, la grande majorité des chercheurs l'ont salué.


Le 8 mai, DeepMind a publié un article dans le magazine Nature annonçant le lancement d'AlphaFold3, une technologieCapacité à prédire non seulement la structure des protéines, mais également les interactions avec l'ADN, l'ARN et d'autres protéines, ce qui revêt une grande importance pour des domaines tels que la découverte de médicaments.

Cependant, ils ont critiqué la façon dont la technologie a été publiée : malgré les directives éditoriales de Nature exigeant que les recherches publiées fournissent un code informatique, l'articleSeul le "pseudocode" est fourni— une description des étapes d'exécution du programme — et un lien vers un portail en ligne qui n'autorise qu'un nombre limité de prédictions par jour. Cela contraste fortement avec AlphaFold2, que DeepMind a publié dans Nature en 2021 et a fourni le code complet.Viole les normes acceptées d’ouverture, de reproductibilité et d’examen par les pairs. Dans une lettre ouverte de soutien signée par des centaines de personnes, les chercheurs l’ont clairement indiqué.

Face à la résistance, DeepMind s'engage à publier son article dans les six mois suivant sa publication.Exposez tout le code aux utilisateurs non commerciaux. Aujourd’hui, il tient cette promesse.

Le modèle informatique est disponible dans le référentiel de codePublié publiquement sur GitHub sous une licence non commerciale, et les « poids » (valeurs numériques) utilisés pour ajuster le modèle d’IA sont également disponibles pour les chercheurs qui remplissent un court formulaire de candidature.

"Nous apprécions la patience de la communauté", a déclaré Pushmeet Kohli, vice-président scientifique de DeepMind. Bien que lui et son équipe croient fermement que le programme qu'ils ont publié est correct, Kohli a reconnu que la communauté souhaite travailler directement avec le code. Il a ajouté qu'ils avaient passé des mois à préparer et à tester le modèle pour le lancement public d'aujourd'hui.

Les chercheurs s’en réjouissent. Erik Lindahl, biophysicien à l'Université de Stockholm et l'un des signataires de la lettre ouverte, a déclaré : « Je suis très heureux de voir l'équipe DeepMind tenir sa promesse de rendre le code public, ce qui signifie qu'un examen approfondi d'un article important peut enfin commencer. » Vander Stephanie Vankowitz, biologiste structuraliste à l'Université de Pennsylvanie et l'un des organisateurs de la lettre ouverte, a ajouté : "Les modèles et les poids publiés sont importants à la fois pour l'évaluation et pour des recherches ultérieures basées sur eux." Mais elle a également souligné qu'"un retard de six mois est inacceptable".

AlphaFold3 est la dernière version d'AlphaFold, c'est unPrédiction de la structure des protéines IA basée sur la séquence d'acides aminés, qui a valu plus tôt cette année à deux chercheurs de DeepMind, John Zimmer et Demis Hassabis, des nominations pour le prix Nobel de chimie pour cette technologie. Cependant, jusqu'à aujourd'hui, les chercheurs ne pouvaient utiliser le programme que via le portail en ligne de DeepMind, qui était limité à 10 (maintenant 20) requêtes par jour et ne pouvait gérer qu'un ensemble limité de molécules.

Dans un communiqué publié en mai, Magdalena Skipper, rédactrice en chef de Nature, n'a pas précisé pourquoi elle avait abandonné sa demande de partage du code complet, mais elle a déclaré que les éditeurs avaient pris en compte « les implications potentielles de la biosécurité et les défis éthiques qui en découlent ». Pendant ce temps, un article paru dans Nature citait Koch disant que l'équipeL'accès à AlphaFold3 a été restreint pour éviter d'avoir un impact sur les programmes de développement de médicaments de la filiale commerciale de DeepMind, IsomorphicLabs.. Colley a déclaré au magazine Science que l'équipe de DeepMind avait donné la priorité au développement du portail plutôt qu'à la publication du code "afin de garantir que nous disposions de l'interface la plus simple pour le plus grand nombre". Zimmer a déclaré que les chercheurs ont réalisé un « travail incroyable » via le portail, et que ce travail n'a pas changé après les nouvelles d'aujourd'hui. Il soupçonne que la plupart des scientifiques continueront à travailler de cette façon, car cela est plus pratique pour les équipes disposant d'une puissance de calcul limitée.

Les chercheurs de DeepMind ont également contesté les affirmations de certains critiques selon lesquelles l'article de Nature étaitPeut être répété, car plusieurs équipes ont développé leurs propres versions d'AlphaFold3 basées sur un pseudocode. Des entreprises axées sur l'IA telles que Baidu, LigoBiosciences et ChaiDiscovery ont publié les résultats de ces efforts. Daniel Buchan, chercheur en bioinformatique à l'University College de Londres, souligne que ces « implémentations » alternatives peuvent encore être utiles maintenant que le code d'AlphaFold3 est désormais public. "C'est bien et important de pouvoir reproduire la méthode", dit-il. Vankowitz a ajouté que la comparaison de ces modèles pourrait conduire à des améliorations à l’avenir. Selon les chercheurs, la mise en œuvre de licences d'utilisation illimitées telles que celles développées par l'organisation à but non lucratif OpenFold Alliance est particulièrement importante. Sinon, "si j'aide un collègue à concevoir un tout nouveau ligand qui pourrait être un médicament anticancéreux potentiel, et qu'un jour il souhaite travailler avec une société pharmaceutique pour le commercialiser, les choses deviennent très compliquées", explique Roland Dunbrack, biologiste structural computationnel au Fox Chase Cancer Center. On lui a initialement demandé de réviser un manuscrit DeepMind pour Nature, mais il n'a jamais reçu le code à réviser. Certaines équipes de recherche envisagent déjà de travailler avec le code d’AlphaFold3.

Les auteurs d'un article publié aujourd'hui dans la revue Nature Computational Science disent espérer intégrer AlphaFold3 dans leur propre logiciel. Le programme, appelé MassiveFold, aide les utilisateurs à tirer parti du calcul parallèle pour réduire le temps nécessaire à l'exécution d'un grand nombre de prédictions sur AlphaFold2, de plusieurs mois à quelques heures.

Guillaume Brysbaert, chercheur en bioinformatique au Centre national français de la recherche scientifique et développeur de MassiveFold, a déclaré qu'en intégrant le nouveau code de DeepMind, "les utilisateurs peuvent obtenir les meilleurs résultats de prédiction d'AlphaFold2 ou AlphaFold3". Zhu Mo a déclaré que l'équipe DeepMind attend avec impatience que les résultats soient rendus publics aujourd'hui. "Dans AlphaFold2, nous avons constaté beaucoup de créativité", a-t-il déclaré. « Je suis vraiment impatient de voir comment la communauté découvrira le fonctionnement d'AlphaFold3 – comment peut-il être appliqué à de nouveaux problèmes ?

Références :https://www.science.org/content/article/google-deepmind-releases-code-behind-its-most-advanced-protein-prediction-program