Anthropic dévoile Claude 3 : Haiku, Sonnet, Opus. Benchmarks supérieurs à GPT-4, fenêtre contexte 200K tokens, tarification compétitive. Claude 3 Opus disponible avec Claude Pro 20$/mois.

Anthropic présente ses modèles multimodaux Claude 3 plus performants

Mar 5, 2024 | LLMs

Le rival d'OpenAI, Anthropic, a présenté ses modèles multimodaux Claude 3, qui sont plus performants, plus précis et offrent une tarification compétitive.

Anthropic a dévoilé Claude 3, une gamme de trois modèles de langage IA similaires à ceux qui alimentent ChatGPT. Anthropic affirme que ces modèles établissent de nouveaux repères dans l'industrie pour une gamme de tâches cognitives, frôlant même des capacités « quasi humaines » dans certains cas. Ils sont désormais disponibles sur le site web d'Anthropic, le modèle le plus puissant étant uniquement sur abonnement.

La suite Claude 3 : Haiku, Sonnet et Opus

La suite de modèles Claude 3 se décline en trois versions aux compétences et configurations évolutives : Haiku, Sonnet et Opus. Le modèle intermédiaire, Sonnet, alimente actuellement et sans frais le chatbot de Claude.ai, accessible après une inscription simple via e-mail. Opus, le modèle le plus avancé, n'est accessible que via l'interface de chat d'Anthropic et nécessite un abonnement mensuel de 20 dollars pour Claude Pro.

Ces modèles partagent une fenêtre de contexte capable de gérer jusqu'à 200 000 tokens, permettant une analyse linguistique détaillée.

Performances supérieures

Claude 3 se distingue par ses aptitudes supérieures dans une variété de fonctions cognitives, incluant le raisonnement, l'expertise dans des domaines de connaissance spécifiques, les compétences mathématiques et l'aisance linguistique. Selon Anthropic, Opus atteint des seuils de compréhension et d'aisance dans l'exécution de tâches complexes qui rivalisent avec les capacités humaines.

Comparaison avec GPT-4

Selon Anthropic, Claude 3 Opus bat GPT-4 sur 10 benchmarks d'IA :

MMLU (connaissances niveau licence) : 86,8% vs 86,4%
GSM8K (mathématiques niveau primaire)
HumanEval (programmation) : 90,7% vs 67,0%
HellaSwag (connaissance commune)

Plusieurs de ces victoires sont serrées, mais certains écarts sont importants, notamment sur HumanEval.

Fenêtre de contexte et capacités

Anthropic a indiqué que les trois modèles disposent initialement d'une fenêtre de contexte de 200 000 tokens mais sont capables de traiter plus d'un million de tokens, disponibles pour certains clients ayant besoin d'une puissance de traitement supplémentaire.

Tarification et comparaison

Opus

Le plus cher : 15 dollars par million de tokens (MTok) pour l'entrée et 75 dollars/MTok pour la sortie. En comparaison, GPT-4 Turbo d'OpenAI est moins cher à 10 dollars/MTok pour l'entrée et 30 dollars/MTok pour la sortie, mais avec une fenêtre de contexte plus petite de 128k.

Sonnet

Bat GPT-3.5 et est au même niveau que GPT-4 sur plusieurs mesures. Coûte 3 dollars/MTok pour les entrées et 15 dollars/MTok pour les sorties.

Haiku

Le modèle le moins cher à 25 cents/MTok pour l'entrée et 1,25 dollar/MTok pour la sortie. Bat confortablement GPT-3.5 et Gemini Pro mais pas GPT-4 ou Gemini Ultra.

Données d'entraînement et disponibilité

Les modèles Claude 3 ont été entraînés sur des données jusqu'en août 2023 mais peuvent accéder à des applications de recherche pour obtenir des informations à jour.

Opus et Sonnet sont disponibles dès aujourd'hui sur claude.ai et l'API Claude dans 159 pays (pas en Europe initialement), Haiku arrivant prochainement. Opus est disponible dans la version payante Claude Pro. Il n'y a malheureusement pas eu de date initiale pour la disponibilité de ces LLMs en Europe.