Ezber Bozan Bir Atılım: DeepSeek
AIME 2024 matematik kıyaslama testinde DeepSeek-R1 %79,8 başarı oranına ulaşırken, OpenAI-o1 %79,2'de kaldı. DeepSeek’in düşük maliyetli ve verimli yapay zekâ modeli, ekosistemde büyük bir paradigma değişikliğine yol açabilir

Çincesi Shendu Tansuo (深度探索) yani “Derinlemesine Keşif” olarak bilinen DeepSeek yapay zekâ şirketi, Şanghay’a 1,5 saat uzaklıkta bulunan ve Çin’in en önemli bilişim merkezlerinden birisi olan Hangzhou şehrinde 2023 yılında kuruldu. Şirket, büyük dil modelleri (LLM-Large Language Model) ve ileri yapay zekâ teknolojileri geliştirmeye odaklanıyor. DeepSeek’in geliştirdiği DeepSeek-R1 modeli, OpenAI'nin en güçlü modelleriyle rekabet edebilecek seviyeye ulaştı. Bunun üzerine ABD Devlet Başkanı Trump, bu bir “uyandırma çağrısı” diyerek süreci yakından takip ettiklerini açıkladı.[1]
DEEPSEEK-R1 HANGİ NOKTALARDA ÜSTÜN?
DeepSeek’in düşük maliyetli ve verimli yapay zekâ modeli, yapay zekâ ekosisteminde büyük bir paradigma değişikliğine yol açabilir. Çünkü DeepSeek, yapay zekâ geliştirmek için “devasa çip gücü” ve “yüksek maliyet” şarttır anlayışını değiştirdi. Rakipleri milyarlarca dolar çip ve altyapı yatırımları yaparken DeepSeek-R1’in geliştirme maliyeti sadece 6 milyon dolar olarak açıklandı.
Token, doğal dil işleme (NLP) ve yapay zekâ modellerinde bir dil birimi olarak kullanılan temel yapı taşlarından biridir. Bir kelime, harf, sayı, noktalama işareti veya kelime öbeği token olabilir ve yapay zekâ teknolojisinin temel yapı taşlarından birisidir. OpenAI-o1 için 1 milyon token işleme maliyeti 15 dolar iken, DeepSeek için sadece 0,55 dolarda kalması[2] ABD merkezli yapay zekâ şirketlerinin hisselerinde büyük düşüşler olmasına neden oldu. Nvidia gibi dünyanın en büyük yapay zekâ şirketleri borsada %17’ye kadar değer kaybetti.[3] DeepSeek uygulaması Apple Store’de ChatGPT’yi geçerek zirveye ulaştı. Başkan Donald Trump'ın destekçilerinden ve dünyanın önde gelen teknoloji yatırımcılarından Marc Andreessen, X'te yayınlanan bir yazısında DeepSeek'i “şimdiye kadar gördüğü en şaşırtıcı ve etkileyici buluşlardan biri” olarak nitelendirdi.[4]
NVIDIA H100’ÜN YERİNİ ALABİLİR
Yapay zekâ konusu büyük bir uzmanlık alanı gerektiği için, işin teknik ve bilimsel kısmını ilgili uzmanlara bırakıyoruz. ABD'li şirketler, Nvidia H100 veya daha üst düzey GPU'ları kullanarak daha fazla bellek bant genişliği ve daha yüksek AI işlem gücü elde ediyor. Çin yapay zekâ şirketleri ise, ABD’nin ambargosundan dolayı H100 veya daha üst GPU’lar kullanamıyor. Yapay zekâ modellerinin eğitilmesi ve çalıştırılması büyük miktarda veri işleme ve hesaplama gücü gerektirir.
Daha yüksek GPU gücü ve daha geniş bant genişliği, AI modelinin daha hızlı, daha verimli ve daha büyük ölçekli çalışabilmesi anlamına gelir. Fakat Çin merkezli DeepSeek şirketi bu ezberi bozdu.
AIME 2024 matematik kıyaslama testinde DeepSeek-R1 %79,8 başarı oranına ulaşırken, OpenAI-o1 %79,2'de kaldı. Ayrıca, sınırlı donanıma rağmen, ABD ambargoları nedeniyle Nvidia H100 yerine Nvidia’nın H800 GPU kümelerinde eğitildi. Bununla beraber, DeepSeek bu hizmetin tamamen açık kaynak olarak kullanılacağını ve kullanıcıların kendi modelini değiştirmesine ve türev çalışmalar yapmasına izin verileceği duyuruldu.
ÇİN’DE AÇAN BİR ÇİÇEK DÜNYANIN HER YERİNDE GÜZEL KOKAR
Çinli kullanıcılar, “Çin’de açan bir çiçek, dünyanın her yerinde güzel kokar.” sözüyle gelişmeyi değerlendirirken, DeepSeek’in kurucusu ise “Çin’in yapay zekâsı sonsuza kadar takipçi kalamaz… Çin teknolojinin ön saflarında durması gereken birileri olmalı.” dedi.[5]
Çin, yapay zekâ konusunda ABD’yi geçebilir mi? Elbette bunun cevabını vermek oldukça güç olacaktır. ABD’nin yapay zekâya yaptığı yatırımın Çin’in neredeyse 10 katı olması[5], yenilikçi fikirlerin önemli bir kısmının hâlâ ABD merkezli olması ABD’yi üstün kılarken, Çin’in teknolojik ve bilimsel alanlarda yaptığı yatırım ve ilerleme oldukça hızlı bir şekilde artıyor. Yazımızı ise yazıyı yazarken oldukça faydalandığım ve Çince çevirisini yaptığım sitenin editörünün anlamlı sözleriyle tamamlayalım.
“Atom bombası ve bir uydu projesinden Beidou Navigasyon Sistemi’ne, rüzgar tüneli teknolojisinden kuantum iletişimine… Hangi noktada adım adım ilerleyerek başarmadık ki? Hangi noktada defalarca düşüp yeniden ayağa kalkmadık? Bu farkı kabul edip sıkı çalışmayla ilerlememiz, ‘Yol ne kadar uzun olsa da yürümeye devam edilirse varılır.’ sözünü doğruluyor ve ‘Başarıya ulaşıldığında herkesle paylaşılır.’ anlayışını ortaya koyuyor.”
KAYNAKLAR
[1] https://www.theguardian.com /technology/2025/jan/28/donald-trump-china-deepseek-ai-chatbot-shares
[2] https://baijiahao.baidu.com /s?id=1822444794434949501&wfr=spider&for=pc
[3] https://www.reuters.com/technology/tech-stock-selloff-deepens-deepseek-triggers-ai-rethink-2025-01-28/
[4] https://edition.cnn.com/ 2025/01/27/tech/deepseek-stocks-ai-china/index.html
[5] https://www.163.com/dy/article /JN3CRL4305199NPP.html
Not: Bu yazı teoridergisi.com’dan alınmıştır.