Anthropic lance une version améliorée de son LLM d’entrée de gamme

Anthropic lance une version améliorée de son LLM d’entrée de gamme

Anthropic, la startup d’IA cofondée par d’anciens cadres d’OpenAI, a lancé une version mise à jour de son modèle de génération de texte, plus rapide et moins cher, disponible par le biais d’une API, Claude Instant.

La mise à jour de Claude Instant, Claude Instant 1.2, incorpore les points forts du modèle phare d’Anthropic récemment annoncé, Claude 2, montrant des gains « significatifs » dans des domaines tels que les mathématiques, le codage, le raisonnement et la sécurité, selon Anthropic. Lors de tests internes, Claude Instant 1.2 a obtenu un score de 58,7 % sur un test de codage, contre 52,8 % pour Claude Instant 1.1, et 86,7 % sur une série de questions mathématiques, contre 80,9 % pour Claude Instant 1.1.

« Claude Instant génère des réponses plus longues et plus structurées et suit mieux les instructions de formatage », écrit Anthropic dans un billet de blog. « Instant 1.2 montre également des améliorations dans l’extraction de citations, les capacités multilingues et la réponse aux questions.

Claude Instant 1.2 est également moins susceptible d’halluciner et plus résistant aux tentatives de jailbreaking, affirme Anthropic. Dans le contexte des grands modèles de langage comme Claude, on parle d' »hallucination » lorsqu’un modèle génère un texte incorrect ou absurde, tandis que le « jailbreaking » est une technique qui utilise des messages intelligemment rédigés pour contourner les dispositifs de sécurité placés sur les grands modèles de langage par leurs créateurs.

Claude Instant 1.2 dispose d’une fenêtre contextuelle de la même taille que celle de Claude 2, soit 100 000 tokens. La fenêtre contextuelle fait référence au texte que le modèle prend en compte avant de générer du texte supplémentaire, tandis que les jetons représentent le texte brut (par exemple, le mot « fantastique » serait divisé en jetons « fan », « tas » et « tic »). Claude Instant 1.2 et Claude 2 peuvent analyser environ 75 000 mots, soit à peu près la longueur de « The Great Gatsby ».

D’une manière générale, les modèles dotés de grandes fenêtres contextuelles sont moins susceptibles d' »oublier » le contenu des conversations récentes.

Comme nous l’avons indiqué précédemment, l’ambition d’Anthropic est de créer un « algorithme de nouvelle génération pour l’auto-apprentissage de l’IA », comme elle le décrit dans un pitch deck destiné aux investisseurs. Un tel algorithme pourrait être utilisé pour créer des assistants virtuels capables de répondre aux courriels, d’effectuer des recherches et de générer des œuvres d’art, des livres et bien d’autres choses encore – dont nous avons déjà eu un aperçu avec GPT-4 et d’autres grands modèles de langage.

Mais Claude Instant n’est pas cet algorithme. Il est plutôt destiné à concurrencer les offres d’entrée de gamme similaires d’OpenAI ainsi que des startups telles que Cohere et AI21 Labs, qui développent et produisent leurs propres systèmes d’IA générateurs de texte – et dans certains cas d’images.

À ce jour, Anthropic, lancée en 2021 et dirigée par l’ancien vice-président de la recherche d’OpenAI, Dario Amodei, a levé 1,45 milliard de dollars pour une valorisation à un chiffre. Bien que cela puisse sembler beaucoup, c’est loin de ce que l’entreprise estime nécessaire – 5 milliards de dollars au cours des deux prochaines années – pour créer le chatbot qu’elle a imaginé.

Anthropic affirme avoir actuellement des « milliers » de clients et de partenaires, dont Quora, qui donne accès à Claude et à Claude Instant par le biais de son application d’IA générative Poe, basée sur un abonnement. Claude alimente l’outil DuckAssist récemment lancé par DuckDuckGo, qui répond directement aux requêtes de recherche simples des utilisateurs, en combinaison avec le ChatGPT d’OpenAI. Et sur Notion, Claude fait partie du backend technique de Notion AI, un assistant d’écriture IA intégré à l’espace de travail de Notion.

IA