

Çin merkezli yapay zeka araştırma laboratuvarı DeepSeek, son büyük tanıtımının üzerinden bir yıldan fazla bir süre geçmesinin ardından, ABD'li rakiplerine meydan okuma niteliği taşıyan yeni büyük dil modelini önümüzdeki hafta duyurmayı planlıyor. Bu adım, Çin'in yapay zeka alanındaki küresel rekabet taleplerinin yeni bir sınavla karşılaşacağı anlamına geliyor.
İngiliz Financial Times'ın bugün yayımladığı bilgilere göre, merkezi Hangzhou'da bulunan DeepSeek, V4 adı verilen yeni “çok modlu” modelini açıklamaya hazırlanıyor. İki kaynağın verdiği bilgiye göre V4, görsel, video ve metin üretme yeteneklerini bir arada sunacak.
Söz konusu kaynaklar, DeepSeek'in bu modeli, Çinli yapay zeka çip üreticileri olan Huawei ve Cambricon'un en yeni ürünleriyle uyumlu hale getirmek için bu şirketlerle iş birliği yaptığını belirtiyor. Bu hareket, Washington'un Çin'in teknoloji alanındaki yükselişini sınırlamak amacıyla uyguladığı ihracat kontrollerine tabi olan Nvidia'nın pazar lideri yapay zeka çiplerine olan bağımlılığı azaltmayı amaçlayan daha geniş çabaların bir parçası olarak değerlendiriliyor.
Parlamento Toplantıları Öncesi Önemli Bir Zamanlama
DeepSeek'in yeni model lansmanı, 4 Mart'ta başlayacak olan yıllık “İki Oturum” parlamento toplantılarına denk geliyor. Bu yüksek profilli siyasi etkinliğin, DeepSeek'in “ulusal yapay zeka şampiyonu” statüsünü daha da güçlendirmesi bekleniyor.
Bu duyuru, DeepSeek'in Ocak 2025'te R1 adlı akıl yürütme modelini açıklamasından bu yana gerçekleştireceği ilk büyük model tanıtımı olacak. Şirket, o dönem Silikon Vadisi'ndeki lider modellere kıyasla çok daha az hesaplama gücü kullanarak bir sistem geliştirdiğini öne sürmüştü.
R1 lansmanı, bazı uzmanlar tarafından Çin'in yapay zeka alanındaki hızlı ilerleyişini simgeleyen bir “Sputnik anı” olarak anılmış ve ABD teknoloji hisselerinde dalgalanmalara yol açmıştı.
DeepSeek, o günden beri tam kapsamlı yeni bir model yerine küçük güncellemeler sunmayı tercih etti; bu da Alibaba ve Moonshot gibi yerli rakiplerin düşük maliyetli, açık kaynaklı modellerine yönelik talep yakalamasına olanak tanımıştı.
ABD'li Çip Üreticilerinden Uzaklaşma Süreci
V4'ün Çin yapımı çipler için optimize edilmesi, yerli yarı iletkenlere olan talebi artıracak; özellikle eğitilmiş bir modelden yanıt sağlama süreci olan “çıkarım” aşamasında Nvidia ve AMD gibi ABD'li çip üreticilerinden uzaklaşma sürecini hızlandırabilir.
DeepSeek’in Huawei ve Cambricon ile olan iş birliği ilk kez Reuters tarafından haberleştirildi.
Konuya yakın bir başka kaynak, DeepSeek'in modelini Nvidia ürünleri için optimize etmek amacıyla bu şirketle herhangi bir çalışma yürütmediğini aktardı. Ancak Nvidia, büyük veri kümeleri üzerinde çalışan modellerin ön eğitimi sırasında pazar liderliğini sürdürmeye devam ediyor.
Financial Times daha önce, DeepSeek'in bu ilk eğitim sürecini Huawei donanımı üzerinde gerçekleştirmeye çalıştığını fakat teknik zorluklarla karşılaştığını bildirmişti.
Yöntemlerini Paylaştı
Geçen yılki R1 lansmanı, DeepSeek'in Nvidia çiplerini eğitim ve çalışma süreçlerinde daha verimli kullanmaya yönelik mühendislik tekniklerini ayrıntılı şekilde açıkladığı kapsamlı bir teknik raporla birlikte yapılmıştı. Şirket, geliştirdiği “akıl yürütme modeli”nin eğitim yöntemlerini paylaşarak övgü toplamış; bu sayede diğer laboratuvarlar da bahse konu bulguları inceleme ve uygulama fırsatı bulmuştu. Akıl yürütme modelleri, karmaşık problemleri daha küçük parçalara bölerek çözme amacı taşımaktadır.
DeepSeek'in, V4 ile birlikte önümüzdeki hafta daha kısa bir teknik not yayımlaması bekleniyor; yaklaşık bir ay sonra ise daha kapsamlı bir teknik rapor paylaşması planlanıyor.
Öte yandan bu hafta başında Anthropic, DeepSeek ve iki diğer Çinli yapay zeka laboratuvarını “damıtma saldırıları” yapmakla itham etti. Bu yöntem, daha gelişmiş sistemlerin çıktıları üzerinden daha küçük modeller eğitilerek aynı hesaplama kaynakları kullanılmadan benzer bir performans elde etmeyi amaçlamaktadır.
Huawei, DeepSeek ve Cambricon ise kendilerine yöneltilen yorum taleplerine cevap vermedi.


