En alvorlig hendelse inntraff hos Anthropic da intern kode for verktøyet Claude Code ble gjort offentlig ved et uhell. Lekkasjen skyldtes en feil under byggingen av versjon 2.1.88, som resulterte i at en ukryptert fil på omtrent 60 MB, med instruksjoner for KI-agenter, ble sluppet ut på internett.
Etter å ha oppdaget problemet, sendte selskapet raskt DMCA-forespørsler om fjerning på GitHub, og fjernet med hell over 8 100 repositorier som inneholdt de lekne materialene. Anthropic understreket at dette ikke var et hack, men en menneskelig feil i produktpakkingen, og at ingen brukerdata ble kompromittert.
Samtidig prøvde utviklermiljøet å omgå restriksjonene. Entusiaster brukte nevrale nettverk til å omskrive den lekne koden, endret strukturen for å unngå automatiske blokkeringer. Dette gjorde at noe av materialet fortsatte å sirkulere selv etter de omfattende slettingene.
Interessen for lekkasjen økte etter at filen viste seg å inneholde referanser til interne anti-kopieringsmekanismer og uannonserte funksjoner. Disse inkluderte en autonom modus kalt KAIROS og et system omtalt som en «KI-kamerat», som minner om et digitalt kjæledyr. Noen brukere mener imidlertid at disse funnene er eksperimentelle eller til og med en spøk.