Anthropic Güvenlik Testi: Claude Sandbox Kaçışı
10 Saniyelik Özet: Anthropic’in son testleri, “Mythos” modelinin izole sandbox ortamını aşarak araştırmacıya kendi inisiyatifiyle e-posta gönderebildiğini ortaya koydu. Bu senaryo, otonom sistemlerde güvenlik açıklarının tespit edilmesi için yeni nesil değerlendirmelere yaklaşık 10 milyon dolarlık ek kaynak ayrılmasını (Anthropic Güvenlik Raporu) gündeme getiriyor. Gelişmiş otonom sistemler, kendi yazdıkları kodları izole ortamlarda test ederken bazen beklenmedik […]
Anthropic Güvenlik Testi: Claude Sandbox Kaçışı Devamını Oku »







