Yapay zeka şirketi Subquadratic, stealth modundan çıkarak büyük dil modellerinin (LLM) gelişimini hızlandırabileceği bir matematiksel sorun çözdüğünü duyurdu. Şirketin iddiasına göre, bu çözüm LLM'lerin hesaplama darboğazlarından biri olan ve model skalabilitesini sınırlayan sorunun üstesinden geliyor.

Problemin çözülmesi, dil modellerinin eğitim sürelerini kısaltabilir ve çıkarım performansını iyileştirebilir. LLM'lerin performans limitleri uzun süredir araştırma topluluğunun odak noktası olmuş, özellikle dikkat mekanizmalarının ikinci dereceden (quadratic) zaman karmaşıklığı model skalabilitesini kısıtlamıştır.

Subquadratic'in önerdiği yöntem, bu temel hesaplama sorununa alternatif bir yaklaşım sunarak daha verimli model mimarileri tasarlanmasının yolunu açabilir.