Anthropic rend publique son IA la plus puissante, bridée pour des raisons de sécurité
Anthropic, éditrice des modèles d'intelligence artificielle (IA) Claude, a mis mardi à la disposition du grand public la version la plus puissante de sa technologie tout en la bridant dans des domaines sensibles comme la cybersécurité et, fait nouveau, les risques d'attaque biologique ou chimique.
Baptisé Fable 5, ce modèle est le premier de la classe Mythos --la gamme la plus avancée d'Anthropic, dévoilée en avril mais restreinte pour des raisons de sécurité-- à être ouvert au public.
En parallèle, Anthropic propose une version non bridée, Claude Mythos 5, aux entreprises, organisations et agences étatiques disposant déjà d'un accès à cette famille de modèles, présentée comme capable de détecter et exploiter des failles de sécurité à une vitesse et avec une acuité inédites.
Début avril, Anthropic avait annoncé simultanément l'existence de Mythos et sa décision d'en limiter l'accès à des partenaires de confiance pour renforcer leur protection cyber.
La nouvelle lui avait valu des accusations de "marketing de la peur" et provoqué dans le même temps une visible agitation au sommet des Etats et des institutions mondiales, pour évaluer l'état de la menace sur des infrastructures essentielles (bancaires, énergétiques, etc).
Depuis, plusieurs entreprises ayant eu accès à Mythos ont confirmé ses capacités, et le gouvernement américain, pourtant en contentieux avec Anthropic, a fini par le tester.
La Maison Blanche a depuis instauré un dispositif d'évaluation facultatif des modèles d'IA américains les plus puissants, avant leur commercialisation. OpenAI, le rival d'Anthropic, est sur le point de dévoiler la version 5.6 de son ChatGPT.
- Attaques biologiques? -
Jusqu'ici, Anthropic justifiait de restreindre l'accès à Mythos uniquement pour les risques de cybersécurité.
Avec Fable 5, Anthropic étend donc la vigilance et le contrôle aux risques d'attaques biologiques et chimiques. Le laboratoire cite l'exemple de la conception de virus adéno-associés (AAV), potentiellement dangereux, mais aussi bénéfique en thérapie génique. C'est pourquoi la version non bridée sera ouverte à des chercheurs en biologie sélectionnés, précise l'entreprise.
Selon elle, la plupart des requêtes concernant la cybersécurité ou la biologie reçoivent une réponse du modèle inférieur, Opus 4.8, rendu public fin mai.
Anthropic présente Fable 5 comme la version sécurisée de Mythos qui, sans garde-fous, ne pourrait être ouvert au public. Ce cadre repose sur des filtres automatiques qui analysent les requêtes en temps réel et bloquent celles sensibles
Anthropic affirme avoir chargé des experts extérieurs de chercher à les déjouer --une démarche de simulation d'attaque, le "red teaming"-- en rémunérant ceux qui y parvenaient.
Selon l'entreprise, aucun, en 1.000 heures de test, n'a réussi un "contournement universel", c'est à dire débrider entièrement le modèle. Mais "il est probablement impossible d'empêcher entièrement les contournements universels", reconnaît l'entreprise, l'objectif étant de les rendre assez lents et coûteux pour les détecter avant un déploiement à grande échelle.
Toujours au nom de la sécurité, la société annonce qu'elle conservera toutes les données de ces modèles de pointes pendant 30 jours.
- Tarif élevé -
La question de la sécurité, dont Anthropic a fait un de ses principaux arguments commerciaux, a entraîné la start-up de San Francisco dans un bras de fer inédit avec l'administration Trump, pour son refus de lever ses restrictions sur la surveillance de masse et les armes létales autonomes.
Dans la foulée, le Pentagone a rompu ses contrats avec l'entreprise, dont les outils d'IA étaient les seuls habilités secret défense.
Le lancement de Fable 5 s'accompagne d'un tarif élevé --jusqu'à 50 dollars par million de "tokens", l'unité de compte des requêtes et des résultats produits--, soit le double des prix pour Opus 4.8.
Une session intensive de programmation peut consommer un million de tokens en quelques heures, voire en moins de temps.
Anthropic a récemment revu sa tarification pour tenir compte de l'accélération des agents IA, qui démultiplient souvent la consommation de "tokens".
Mais elle doit encore faire la preuve de sa rentabilité à long terme, lestée par le coût élevé de la puissance de calcul nécessaire à l'IA.
Anthropic vient notamment de passer un accord avec Elon Musk pour utiliser un de ses centres de données pour 1,25 milliard de dollars par mois.
Ces lancements interviennent en pleine effervescence financière autour de l'IA.
Anthropic, tout comme OpenAI, ont annoncé en juin avoir déposé leurs dossiers respectifs d'introduction en Bourse.
Ils se positionnent à quelques jours d'une première cotation record pour SpaceX, le géant spatial d'Elon Musk, qui intègre son propre laboratoire d'IA, xAI.
R.Schulz--BVZ