GitHub rend Copilot Chat accessible à tous, permettant aux développeurs de poser des questions sur le code.

GitHub rend Copilot Chat accessible à tous, permettant aux développeurs de poser des questions sur le code.

Au début de l’année, GitHub a lancé Copilot Chat, un chatbot de type ChatGPT centré sur la programmation pour les organisations abonnées à Copilot for Business. Plus récemment, Copilot Chat a été mis à la disposition des clients individuels de Copilot – ceux qui paient 10 $ par mois – en version bêta. Et maintenant, GitHub lance Chat en disponibilité générale pour tous les utilisateurs.

Dès aujourd’hui, Copilot Chat est disponible dans la barre latérale des IDE de Microsoft, Visual Studio Code et Visual Studio – inclus dans les niveaux payants de GitHub Copilot et gratuit pour les enseignants, les étudiants et les mainteneurs de certains projets open source vérifiés.

« En tant que foyer des développeurs du monde entier, nous avons mis sur le marché ce qui est maintenant l’outil de développement d’IA le plus largement adopté de l’histoire », a déclaré Shuyin Zhao, vice-président de la gestion des produits chez GitHub, à TechCrunch lors d’une interview par courrier électronique. « Et code complete n’était que le début ».

Peu de choses ont changé dans Copilot Chat depuis la version bêta.

Le chatbot est toujours alimenté par GPT-4, le modèle d’IA générative phare d’OpenAI, affiné spécifiquement pour les scénarios de développement. Les développeurs peuvent demander à Copilot Chat en langage naturel de les guider en temps réel, par exemple en leur demandant d’expliquer des concepts, de détecter des vulnérabilités ou d’écrire des tests unitaires.

Comme tous les modèles d’IA générative, le modèle qui sous-tend Copilot Chat, GPT-4, a été entraîné sur des données accessibles au public – dont certaines sont protégées par des droits d’auteur ou soumises à une licence restrictive. Les fournisseurs, dont GitHub, affirment que la doctrine de l’utilisation équitable les protège des réclamations en matière de droits d’auteur. Mais cela n’a pas empêché les codeurs de déposer des recours collectifs contre GitHub, Microsoft (la société mère de GitHub) et OpenAI pour ce qu’ils allèguent être des violations de la licence open source et de la propriété intellectuelle.

J’ai demandé à Mme Zhao si les propriétaires de bases de code auraient la possibilité de se retirer de la formation, au cas où ils le souhaiteraient. Elle a répondu qu’il n’y avait pas de nouveau mécanisme pour cela avec le lancement plus large de Copilot Chat et a suggéré à la place que les propriétaires de bases de code rendent leurs référentiels privés pour éviter qu’ils ne soient inclus dans les futurs ensembles de formation.

J’imagine que les propriétaires de bases de code ne verront pas cette suggestion d’un très bon œil – il y a de nombreuses raisons de garder public un code protégé par des droits d’auteur, la moindre d’entre elles étant la recherche de bogues par le crowdsourcing. Mais GitHub n’est manifestement pas disposé à changer d’avis sur l’exclusion des données d’entraînement – ou du moins pas encore.

Les modèles d’IA générative, dont GPT-4, ont également tendance à halluciner ou à inventer des faits en toute confiance, ce qui est particulièrement problématique dans le domaine du codage. Selon une étude récente de Stanford, les développeurs qui utilisent des assistants d’IA pour coder ont tendance à produire un code moins sûr que ceux qui n’utilisent pas d’assistants d’IA, en partie parce que les assistants d’IA introduisent des bouts de code bogués ou obsolètes.

Zhao a déclaré que GPT-4 est « plus performant » contre les hallucinations que l’ancien modèle qui alimentait Copilot et a souligné les fonctions d’atténuation des exploits telles que les filtres pour les modèles de code non sécurisés, qui informent les utilisateurs de Copilot Chat des vulnérabilités telles que les identifiants codés en dur, les injections SQL et les injections de chemin d’accès. Elle a toutefois souligné l’importance d’un examen humain minutieux de tout code suggéré par l’IA.

« GitHub Copilot est alimenté par les modèles d’OpenAI, que nous avons trouvés être les meilleurs modèles pour les services que nous offrons aujourd’hui », a déclaré Zhao. « Nous sommes en position de force pour continuer à fournir aux développeurs les outils d’IA dont ils ont besoin pour créer des logiciels de meilleure qualité et plus sûrs à grande échelle, tout en s’amusant.

En octobre, le PDG de Microsoft, Satya Nadella, a déclaré aux analystes que Copilot comptait 1 million d’utilisateurs payants et ~37 000 entreprises clientes. Mais il incombe à GitHub de rendre Copilot encore plus attrayant, de peur de perdre du terrain par rapport à ses concurrents et, par conséquent, de perdre de l’argent.

Selon un article du Wall Street Journal, Copilot perd en moyenne 20 dollars par mois et par utilisateur, certains clients coûtant à GitHub jusqu’à 80 dollars par mois. Le prix élevé de l’exécution des modèles d’IA sous-jacents serait en cause – un problème auquel la startup de codage GenAI Kite a également été confrontée et qui l’a contrainte à fermer ses portes début décembre dernier.

Alors que GitHub s’efforce de rentabiliser Copilot, Amazon continue d’améliorer CodeWhisperer, peut-être le rival le mieux doté de Copilot.

En avril, Amazon a rendu CodeWhisperer gratuit pour les développeurs, sans aucune restriction d’utilisation. Ce mois-là a également vu le lancement de CodeWhisperer Professional Tier, qui a ajouté l’authentification unique avec l’intégration d’AWS Identity and Access Management, ainsi que des limites plus élevées pour l’analyse des vulnérabilités en matière de sécurité. Un plan d’entreprise pour CodeWhisperer a été lancé en septembre. Et en début novembre, Amazon a « optimisé » CodeWhisperer pour fournir des suggestions « améliorées » pour le développement d’applications sur MongoDB, le programme de gestion de base de données open source.

Outre CodeWhisperer, Copilot est en concurrence avec des startups comme Magic, Tabnine, Codegen et Laredo, ainsi qu’avec des modèles open source comme Code Llama de Meta, Hugging Face et StarCoder de ServiceNow.

IA