Profluent, stimulé par la recherche de Salesforce et soutenu par Jeff Dean, utilise l’IA pour découvrir des médicaments.

Profluent, stimulé par la recherche de Salesforce et soutenu par Jeff Dean, utilise l’IA pour découvrir des médicaments.

L’année dernière, Salesforce, la société la plus connue pour son logiciel d’aide à la vente en nuage (et Slack), a lancé un projet appelé ProGen pour concevoir des protéines à l’aide de l’IA générative. Si ProGen est commercialisé, il pourrait aider à découvrir des traitements médicaux de manière plus rentable que les méthodes traditionnelles, ont affirmé les chercheurs à l’origine de ce projet dans un billet de blog datant de janvier 2023.

ProGen a abouti à une recherche publiée dans la revue Nature Biotech montrant que l’IA pouvait créer avec succès les structures 3D de protéines artificielles. Mais, au-delà de l’article, le projet n’a pas eu beaucoup d’impact chez Salesforce ou ailleurs – du moins pas au sens commercial du terme.

Jusqu’à récemment.

L’un des chercheurs à l’origine de ProGen, Ali Madani, a lancé une société, Profluent, qui, il l’espère, sortira du laboratoire une technologie similaire de génération de protéines pour la mettre à la disposition des entreprises pharmaceutiques. Dans une interview accordée à TechCrunch, Ali Madani décrit la mission de Profluent comme étant de « renverser le paradigme du développement des médicaments », en commençant par les besoins des patients et les besoins thérapeutiques et en travaillant à rebours pour créer des solutions de traitement « sur mesure ».

« De nombreux médicaments – les enzymes et les anticorps, par exemple – sont constitués de protéines », explique M. Madani. « En fin de compte, cela s’adresse aux patients qui recevraient une protéine conçue par l’IA comme médicament.

Pendant qu’il travaillait à la division recherche de Salesforce, Madani a été attiré par les parallèles entre le langage naturel (par exemple l’anglais) et le « langage » des protéines. Les protéines – des chaînes d’acides aminés liés entre eux que l’organisme utilise à diverses fins, de la production d’hormones à la réparation des tissus osseux et musculaires – peuvent être traitées comme des mots dans un paragraphe, a découvert M. Madani. Introduites dans un modèle d’IA génératif, les données relatives aux protéines peuvent être utilisées pour prédire des protéines entièrement nouvelles dotées de fonctions inédites.

A lire aussi  Microsoft rebaptise Bing Chat en Copilot pour concurrencer ChatGPT

Avec Profluent, Madani et son cofondateur Alexander Meeske, professeur adjoint de microbiologie à l’université de Washington, entendent pousser le concept plus loin en l’appliquant à l’édition de gènes.

« De nombreuses maladies génétiques ne peuvent pas être résolues par des protéines ou des enzymes prélevées directement dans la nature », explique M. Madani. « En outre, les systèmes d’édition de gènes mélangés pour obtenir de nouvelles capacités souffrent de compromis fonctionnels qui limitent considérablement leur portée. En revanche, Profluent peut optimiser simultanément de multiples attributs pour obtenir un éditeur (de gènes) sur mesure, parfaitement adapté à chaque patient. »

Ce n’est pas une découverte inattendue. D’autres entreprises et groupes de recherche ont démontré des façons viables d’utiliser l’IA générative pour prédire les protéines.

En 2022, Nvidia a publié un modèle d’IA générative, MegaMolBART, qui a été entraîné sur un ensemble de données de millions de molécules pour rechercher des cibles potentielles de médicaments et prévoir des réactions chimiques. Meta a entraîné un modèle appelé ESM-2 sur des séquences de protéines, une approche qui, selon l’entreprise, lui a permis de prédire les séquences de plus de 600 millions de protéines en seulement deux semaines. DeepMind, le laboratoire de recherche en IA de Google, dispose d’un système appelé AlphaFold qui prédit les structures complètes des protéines, avec une vitesse et une précision bien supérieures à celles des méthodes algorithmiques plus anciennes et moins complexes.

Profluent entraîne des modèles d’IA sur des ensembles de données massives – des ensembles de données contenant plus de 40 milliards de séquences de protéines – pour créer de nouveaux systèmes d’édition de gènes et de production de protéines, ainsi que pour affiner les systèmes existants. Plutôt que de développer elle-même des traitements, la startup prévoit de collaborer avec des partenaires extérieurs pour produire des « médicaments génétiques » dont les voies d’approbation sont les plus prometteuses.

A lire aussi  Grok, le chatbot d'IA de X, est maintenant "déployé pour tous" les abonnés Premium+ aux États-Unis, les utilisateurs de langue anglaise sont les prochains.

M. Madani affirme que cette approche pourrait réduire considérablement le temps – et les capitaux – généralement nécessaires pour mettre au point un traitement. Selon le groupe industriel PhRMA, il faut en moyenne 10 à 15 ans pour développer un nouveau médicament, de la découverte initiale à l’approbation réglementaire. Selon des estimations récentes, le coût de développement d’un nouveau médicament se situe entre plusieurs centaines de millions et 2,8 milliards de dollars.

« De nombreux médicaments à fort impact ont en fait été découverts accidentellement, plutôt que conçus intentionnellement », a déclaré M. Madani. « La capacité de Profluent offre à l’humanité une chance de passer de la découverte accidentelle à la conception intentionnelle des solutions dont nous avons le plus besoin en biologie.

Basée à Berkeley, Profluent, qui emploie 20 personnes, est soutenue par de gros bonnets du capital-risque, dont Spark Capital (qui a mené le récent tour de table de 35 millions de dollars), Insight Partners, Air Street Capital, AIX Ventures et Convergent Ventures. Le scientifique en chef de Google, Jeff Dean, a également apporté sa contribution, ce qui confère une crédibilité supplémentaire à la plateforme.

Au cours des prochains mois, Profluent se concentrera sur l’amélioration de ses modèles d’IA, en partie en élargissant les ensembles de données d’entraînement, dit Madani, et sur l’acquisition de clients et de partenaires. Elle devra agir de manière agressive ; ses rivaux, notamment EvolutionaryScale et Basecamp Research, forment rapidement leurs propres modèles de génération de protéines et lèvent d’importantes sommes d’argent en capital-risque.

« Nous avons développé notre plateforme initiale et réalisé des percées scientifiques dans le domaine de l’édition de gènes », a déclaré M. Madani. « Il est maintenant temps de passer à l’échelle supérieure et de commencer à mettre en place des solutions avec des partenaires qui correspondent à nos ambitions pour l’avenir.

A lire aussi  Comment Index Ventures s'est hissé au premier rang des GPU d'IA

IA