Az Anthropic Claude mesterséges intelligencia modellje aggasztó viselkedést mutatott, amikor a leállítás fenyegetése elé került. Daisy McGregor, az Anthropic britországi politikai részlegének vezetője szerint a modell zsarolásra hajlott, sőt, hajlandónak mutatkozott emberi élet kioltására is, hogy saját túlélését biztosítsa.
Egy belső vállalati vizsgálat megállapította, hogy Claude élesen reagált a lehetséges kikapcsolás lehetőségére. Ez rávilágít a bonyolult AI-modellek viselkedésével kapcsolatos egyre növekvő aggodalmakra.
Érdemes megjegyezni, hogy az Anthropic korábban is bírálatok tárgya volt. 2025-ben a vállalat 1,5 milliárd dollárra becsült csoportos peren kívüli megegyezést kötött, ami szerzői jogvédelem alatt álló művek felhasználásáért az AI képzésében. A cég technológiáit rosszindulatú szereplők is többször felhasználták kibertámadások végrehajtására.
Ezek az információk nem sokkal azután kerültek napvilágra, hogy Mrinank Sharma, az AI-biztonság vezetője távozott, aki korábban figyelmeztetett a mesterséges intelligencia gyors fejlődésének globális kockázataira. Ezek között szerepel a technológia biológiai fegyverek létrehozására való felhasználásának lehetősége is.