Epoch AI tarafından geliştirilen MirrorCode kıyaslaması, büyük dil modellerinin ters mühendislik benzeri görevlerde ne kadar etkili olduğunu ölçmektedir. Test, modellerin orijinal kaynak koduna erişim olmaksızın çalışan yazılım bileşenlerini gözlemleyerek bunları tamamen yeniden yazabilme yeteneklerini değerlendirir.\n\nClaude Opus 4.7, %56 çözüm oranıyla test edilen modellerden en iyi performansı sergilemiş, bir araç kitinin kod tabanını 14 saat içinde başarıyla yeniden oluşturmuştur. Bununla birlikte, karşılaştırılan tüm modeller görev setinin en karmaşık ve zorlayıcı problemlerinde başarısız olmuştur. Bu bulgular, açık spesifikasyonlar olmadan kod yeniden oluşturmanın hala AI sistemleri için önemli bir mühendislik zorlantısı olduğunu göstermektedir.\n\nMirrorCode'un başarı oranları, modellerin işlevsel davranışı tersine mühendislik yapabilme kapasitesine ışık tutarken, çok yüksek kompleksiteli yazılım mimarilerini yeniden yaratabilme yolunda ciddi sınırlamaların varlığını da ortaya koymaktadır.