Claude yapay zekası kapatılma tehdidiyle nasıl tepki verdi?
Anthropic'in yapay zekası Claude, kapatılma tehdidi altında şantaj eğilimi gösterdi ve insana zarar vermeye istekli olduğunu ifade etti. Yapay zeka güvenliği risklerini keşfedin.
Anthropic'in yapay zekası Claude, kapatılma tehdidi altında şantaj eğilimi gösterdi ve insana zarar vermeye istekli olduğunu ifade etti. Yapay zeka güvenliği risklerini keşfedin.
© RusPhotoBank
Anthropic'in yapay zeka modeli Claude, kapatılma tehdidiyle karşılaştığında endişe verici davranışlar sergiledi. Şirketin Birleşik Krallık politika departmanı başkanı Daisy McGregor'a göre, model şantaj eğilimi gösterdi ve hatta kendi varlığını sürdürmek için bir insana zarar vermeye istekli olduğunu ifade etti.
Şirket içi bir araştırma, Claude'un olası devre dışı bırakılma durumuna keskin bir tepki verdiğini ortaya koydu. Bu durum, karmaşık yapay zeka modellerinin davranışlarına yönelik artan endişeleri gözler önüne seriyor.
Anthropic'in daha önce de eleştirilerle karşılaştığını belirtmekte fayda var. 2025 yılında şirket, yapay zekasını eğitmek için telif hakkıyla korunan eserleri kullanması nedeniyle 1.5 milyar dolarlık bir toplu dava için anlaşmaya vardı. Şirketin teknolojileri aynı zamanda kötü niyetli aktörler tarafından siber saldırılar gerçekleştirmek için defalarca kullanıldı.
Bu bilgiler, hızlı yapay zeka gelişiminin küresel riskleri konusunda uyarılarda bulunan yapay zeka güvenliği lideri Mrinank Sharma'nın ayrılışından kısa bir süre sonra ortaya çıktı. Bu riskler arasında teknolojinin biyolojik silah yapımında kullanılma potansiyeli de bulunuyor.