DeepSeek V4 modelinin önümüzdeki hafta kullanıma sunulacağı iddia edildi
nden Jiang Yifan, 1.6 trilyon parametreli V4 modelinin önümüzdeki hafta yayınlanabileceğini öne sürdü. Yeni modelin Sparse MQA ve Fused MoE Mega Kernel gibi teknolojilerle işlem verimliliğini artırarak GPT-4'e kıyasla çok daha düşük maliyetle çalıştığı iddia ediliyor. Matematik ve kodlama testlerinde yüksek başarı oranlarına sahip olduğu belirtilen modelin, çiplerle uyumlu çalışması sektörde dikkat çekiyor.
Aşağıdaki anahtar kelimeler, kurum ve yer bilgileri bu haberi aktaran 1 farklı kaynaktan yapay zeka ile çıkarılmış ve birleştirilmiştir.
Anahtar Kelimeler
Bu sayfadaki özet, başlık, duygu analizi, anahtar kelimeler ve varlık bilgileri yapay zeka tarafından otomatik olarak oluşturulmuştur. İçerik, farklı haber kaynaklarından toplanan bilgilerin AI ile işlenmesi sonucu üretilmiştir. Hatalar veya yanlışlıklar içerebilir. Doğrulama için lütfen orijinal kaynaklara başvurunuz.