Tether, yapay zeka modellerinin bellek tüketimini beş kata azaltan TurboQuant'ı açık kaynak yaptı

5 Haziran 2026 06:30

Tether AI Araştırma Grubu, Google Research kaynaklı TurboQuant bellek sıkıştırma algoritmasını açık kaynak olarak kullanıma sundu. Teknoloji, yapay zeka modellerinin cihazlarda daha uzun bağlamlar ve büyük dosyalar işlemesini sağlayarak bulut bağımlılığını azaltıyor.

Tether AI Araştırma Grubu, KV Cache belleğini beş kata kadar sıkıştıran TurboQuant algoritmasını açık kaynaklı hale getirdi. Teknoloji, dizüstü bilgisayarlar, akıllı telefonlar ve tüketici sınıfı GPU'larda çalışan yapay zeka modellerinin bellek ayak izini önemli ölçüde azaltırken model performansını büyük oranda koruyuyor.

Yapay zeka asistanlarının yerel cihazlarda çalışmasının önündeki temel engel, konuşma ilerledikçe büyüyen KV Cache belleğidir. 262 bin token uzunluğunda yaklaşık 32 GB bellek kapasitesi gerektiren dört eşzamanlı oturum, TurboQuant sayesinde çok daha düşük donanım gereksinimleriyle mümkün hale geliyor. Tether, algoritmasını QVAC Fabric altyapısıyla entegre ederek yaygın yapay zeka çerçeveleriyle uyumlu tam optimizasyon paketini sunuyor.

Teknoloji sayesinde kullanıcılar hassas veriler, hukuki belgeler ve araştırma raporları gibi geniş dosyaları bulut desteği olmadan cihazda işleyebiliyor. Bu, gizlilik ve veri güvenliğinin kritik olduğu senaryolarda yapay zekanın yerel çalışmasını pratik hale getiriyor.

Etiketler

Yapay Zeka DonanımıTurboQuantKV Cache sıkıştırmayerel yapay zekaTether AIbellek optimizasyonu

Tether, yapay zeka modellerinin bellek tüketimini beş kata azaltan TurboQuant'ı açık kaynak yaptı

BRICS Ülkeleri Kuantum Teknolojileri Forumunu Moskova'da Gerçekleştirdi

Schneider Electric, TeraWulf'un New York'taki yapay zekâ veri merkezine 290 milyon dolarlık altyapı sağlıyor

Huawei, Kurumsal Yapay Zeka Altyapısı için Bütünleşik Çözüm Paketi Sundu