Sina'nın VibeThinker-3B modeli: Mantıksal akıl yürütme küçük modellere sıkıştırılabiliyor

28 Haziran 2026 07:44

Sina Weibo tarafından açık kaynak olarak yayınlanan VibeThinker-3B, sadece 3 milyar parametre ile DeepSeek V3.2 ve Kimi K2.5 gibi 333 kata kadar daha büyük modellere eşit matematik ve kodlama performansı gösteriyor. Araştırıcılar, çok aşamalı eğitim yöntemi sayesinde bu başarıyı elde ettiklerini ve mantıksal akıl yürütmenin küçük modellere sıkıştırılabileceğini, ancak genel dünya bilgisinin sıkıştırılamadığını öne sürüyor.

Sina Weibo tarafından geliştirilen VibeThinker-3B, minik bir model mimarisiyle dikkat çekici bir başarı ortaya koymaktadır. Sadece 3 milyar parametreye sahip model, 333 kata kadar daha büyük olan DeepSeek V3.2 ve Kimi K2.5 gibi modellerle benzer performans sergileyerek matematik ve kodlama görevlerinde önemli sonuçlar elde etmiştir.

Model boyutu açısından bu fark yaratıcı bir yaklaşımla kapatılmıştır: multi-stage post-training (çok aşamalı son eğitim). Araştırıcılar bu yöntem aracılığıyla modeli daha etkili hale getirmiş ve boyutu azaltıp performansı korumayı başarmıştır.

Elde edilen bulgular, yapay zeka modellerinin tasarımına ilişkin önemli bir hipotez ortaya koymaktadır. Araştırma ekibine göre, mantıksal akıl yürütme yetenekleri küçük parametre sayısına sahip modellere başarılı bir şekilde sıkıştırılabilir. Buna karşın, geniş yelpazdeki gerçek dünya bilgisinin (faktüel bilgi) bu şekilde sıkıştırılması mümkün değildir. Bu bulgu, modellerin içeriğe göre farklı sıkıştırma oranları gösterebileceğini göstermektedir.

Bu haber The Decoder ↗ kaynağındaki içerikten derlenerek hazırlanmıştır.

Etiketler

Dil Modelleri (LLM)VibeThinker-3Bküçük dil modellerimodel sıkıştırmamantıksal akıl yürütmepost-trainingSina Weibo

Sina'nın VibeThinker-3B modeli: Mantıksal akıl yürütme küçük modellere sıkıştırılabiliyor

Anthropic anketi: Claude kullanıcılarının yarısı yapay zekanın işlerinin yarısını halledebileceğini düşünüyor

Anthropic, kritik altyapı uygulamaları için Claude Mythos 5'i yeniden devreye almaya yetkili

Gemini 3.5 Flash'a Computer Use özelliği entegre edildi

OpenAI, GPT-4o Mini'nin Niyet Tanımasını ve Bağlam Yönetimini İyileştirdi

Zhipu AI'nin GLM-5.2 Modeli Anthropic'in Opus 4.7'ye Kıyasla Beşte Bir Fiyatla Rekabet Ediyor

Dil Modelleri Tekrarlayan Argümanlarla Kendilerini Ele Veriyor