ChatGPT’den yüzde 97 daha ucuz: İşte yeni DeepSeek modeli hakkında tüm ayrıntılar

ChatGPT’den yüzde 97 daha ucuz: İşte yeni DeepSeek modeli hakkında tüm ayrıntılar
Haber Merkezi

Çin merkezli yapay zeka firması DeepSeek, yeni jenerasyon R2 yapay zeka modelini geliştiriyor ve bu modelle ilgili ortaya çıkan birinci söylentiler epeyce savlı.

En dikkat alımlı argüman ise, DeepSeek R2 modelinin eğitim maliyetinin, dal devi OpenAI’nin GPT-4 modeline kıyasla yüzde 97 oranında daha düşük olabileceği tarafında.

Üstelik bu eğitimin büsbütün Huawei’nin Ascend 910B yapay zeka GPU’ları (grafik süreç birimleri) üzerinde gerçekleştirildiği belirtiliyor.

MALİYET AVANTAJI

DeepSeek R2’nin, evvelki R1 modelinin parametre sayısını ikiye katlayarak toplamda 1.2 trilyon parametreye sahip olacağı söyleniyor.

Maliyet açısından ise GPT-4o modeline kıyasla yüzde 97,3 oranında daha ucuz olduğu argüman ediliyor.

Eğer bu sayılar doğruysa, DeepSeek R2 piyasadaki en ucuz maliyetli yapay zeka modellerinden biri olabilir ve bilhassa kurumsal kullanım için son derece cazip bir seçenek haline gelebilir.

Söylentilere nazaran DeepSeek R2’nin eğitimi sırasında Huawei’nin Ascend 910B yapay zeka çip kümesinden yüzde 82 oranında bir kullanım verimliliği elde edildi.

Bu durum, DeepSeek’in yeni yapay zeka modeli için şirket içi yahut en azından yerli (Çin menşeili Huawei) kaynakları faal bir biçimde kullandığını gösteriyor.

Huawei yapay zeka çiplerinin kullanılması, Çinli firmanın yapay zeka tedarik zincirini kendi modeline “dikey olarak entegre etmesine” imkan tanıyor ve dışa bağımlılığı azaltıyor.

administrator

Related Articles

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir