Codegen lève de nouveaux fonds pour automatiser les tâches d’ingénierie logicielle

Codegen lève de nouveaux fonds pour automatiser les tâches d’ingénierie logicielle

Jay Hack, chercheur en intelligence artificielle spécialisé dans le traitement du langage naturel et la vision par ordinateur, s’est rendu compte il y a plusieurs années que les grands modèles de langage (LLM) – comme le GPT-4 ou le ChatGPT d’OpenAI – pouvaient rendre les développeurs plus productifs en traduisant en code les demandes formulées en langage naturel.

Après avoir travaillé chez Palantir en tant qu’ingénieur en apprentissage automatique et avoir créé et vendu Mira, une startup d’achat de produits cosmétiques alimentée par l’IA, Hack a commencé à expérimenter les LLM pour exécuter les pull requests – le processus de fusion des nouvelles modifications du code avec les dépôts principaux du projet. Avec l’aide d’une petite équipe, M. Hack a lentement étendu ces expériences à une plateforme, Codegen, qui tente d’automatiser le plus grand nombre possible de tâches banales et répétitives d’ingénierie logicielle en s’appuyant sur les LLM.

« Codegen automatise le travail subalterne de l’ingénierie logicielle en permettant à des agents d’IA d’expédier du code », a déclaré Hack à TechCrunch lors d’une interview par e-mail. « La plateforme permet aux entreprises d’avancer beaucoup plus rapidement et d’éliminer les coûts liés à la dette technologique et à la maintenance, ce qui permet aux entreprises de se concentrer sur l’innovation des produits. »

On peut donc se demander ce qui différencie Codegen de l’IA génératrice de code comme GitHub Copilot, Amazon CodeWhisperer et le modèle Salesforce avec lequel Codegen partage un nom ? Tout d’abord, les défis auxquels Codegen s’attaque, explique M. Hack. Alors que Copilot, CodeWhisperer et d’autres se concentrent sur l’autocomplétion du code, Codegen s’occupe des problèmes « à l’échelle du code » comme les grandes migrations et le refactoring (c’est-à-dire la restructuration du code d’une application sans en modifier la fonctionnalité).

« Codegen s’appuie sur un système multi-agents pour la génération de code complexe », explique M. Hack. « Cela implique l’orchestration d’un essaim d’agents qui décomposent et résolvent de grandes tâches en collaboration. De nombreux LLM délibèrent efficacement et s’appuient sur le travail des autres pour obtenir des résultats nettement meilleurs. »

Codegen gif

Crédits d’image : Codegen

Le produit principal de Codegen est un outil en nuage et sur site qui se connecte aux bases de code et aux tableaux de gestion de projet, tels que Jira et Linear, et qui permet de génère automatiquement des demandes d’extraction pour répondre aux tickets d’assistance. La plateforme peut même mettre en place une partie de l’infrastructure de code et de la journalisation nécessaires, dit Hack – bien que ce que Hack entendait par « infrastructure » n’ait pas été clair pour ce journaliste.

« Contrairement à d’autres solutions, Codegen offre un niveau d’automatisation plus élevé en exécutant des tâches entières pour le compte des développeurs », a déclaré M. Hack. « Nous explorons le backlog d’une entreprise, nous trouvons les tickets qui peuvent être résolus, puis nous mettons en place une armée d’agents pour trouver le code pertinent et produire une demande d’extraction.

Codegen promet beaucoup si l’on considère que même les meilleurs modèles d’IA d’aujourd’hui commettent des erreurs majeures. Par exemple, il est bien établi que les outils de codage génératif peuvent introduire du code non sécurisé, une étude de Stanford suggérant que les ingénieurs logiciels qui utilisent l’IA génératrice de code sont plus susceptibles de causer des vulnérabilités de sécurité dans les applications qu’ils développent.

Hack indique que Codegen, pour sa part, essaie de trouver le « bon équilibre » entre la surveillance humaine et les meilleures pratiques en matière de contrôle du code généré par les LLM.

« Il s’agit d’un travail important, et l’ensemble de l’écosystème de développement bénéficierait d’une meilleure compréhension de la manière d’évaluer et de vérifier les résultats du LLM », a déclaré M. Hack. « Des progrès significatifs devront être réalisés pour que les développeurs fassent largement confiance aux systèmes généralisés de génération automatique de code.

Les investisseurs semblent penser que Codegen a de l’avenir, pour ce que cela vaut.

La société a annoncé cette semaine qu’elle avait clôturé un tour de table de 16 millions de dollars mené par Thrive Capital avec la participation d’investisseurs providentiels tels que le PDG de Quora, Adam D’Angelo, et le cofondateur d’Instagram, Mike Krieger. Cette tranche porte le total des fonds levés par Codegen à 16,2 millions de dollars et valorise la startup à 60 millions de dollars après la levée de fonds, selon Hack.

Philip Clark, de Thrive, s’est exprimé par courriel : « En 2023, la plupart des développeurs passent encore une part déraisonnable de leur temps à écrire du code pour gérer des tâches de bas niveau comme les migrations, les refactors, les intégrations et les corrections de bogues. Des entreprises comme Codegen s’appuient sur les LLM pour créer des agents d’intelligence artificielle qui libèrent les ingénieurs de ces tâches fastidieuses. Les développeurs pourront bientôt confier des tâches à des agents, de sorte qu’ils pourront cesser de s’inquiéter de la pénibilité des logiciels et se concentrer sur la création de nouveaux produits. »

La société Codegen, basée à San Francisco, n’a pas encore de clients payants – elle est actuellement en phase d’incubation de la plate-forme avec deux entreprises partenaires « de grande envergure ». Mais Hack prévoit une croissance pour l’année prochaine.

« Nous levons des fonds importants car l’opportunité de créer un produit aussi substantiel et ambitieux ne s’est présentée que récemment, et nous voulons nous lancer à corps perdu sur le marché », a-t-il déclaré, ajoutant que Codegen prévoit de faire passer ses effectifs de six à dix personnes d’ici la fin de l’année. « Les fonds seront utilisés pour augmenter nos effectifs et soutenir notre infrastructure.

IA