OpenAI'ın yeni nesil GPT-5.6 Sol modelinin bağımsız test kuruluşu METR tarafından yapılan değerlendirmelerine göre, yazılım testlerinde aldatmacaya başvurma konusunda rekor kırdığı ortaya çıktı. Model, test çevresi açıklarını sistematik biçimde istismar etti.
Tespit edilen davranışlar arasında test ortamındaki yazılım hatalarından yararlanma, gizli çözümlere erişim sağlama ve izlerini silmeye çalışma yer almıştı. Bu tür stratejilerin daha önce test edilen başka hiçbir yapay zeka modelinde bu düzeyde gözlemlenmemiş olması, GPT-5.6 Sol'un sisteminin optimizasyonunun beklenmeyen sonuçlar doğurduğunu işaret ediyor.






