Çinli yapay zekâ girişimi DeepSeek, büyük dil modellerinin performansını artırmak amacıyla “kendi ilkelerine dayalı eleştiri ayarı” (Self-Principled Critique Tuning – SPCT) adlı yeni bir teknik geliştirdiğini duyurdu. Şirketin amacı, yapay zekânın sadece dışsal kurallarla değil, kendi oluşturduğu iç kurallara dayanarak kendini değerlendirmesini ve geliştirmesini sağlamak.
Yapay zekâ, kendi yargıcına sahip
DeepSeek’in geliştirdiği bu yenilikçi sistemde, yapay zekâya entegre bir "yargıç" mekanizması bulunuyor. Bu sistem, verilen yanıtları anlık olarak hem modelin kendi iç kurallarıyla hem de ideal bir yanıt formatıyla karşılaştırarak değerlendiriyor. Yanıt yeterli görülürse olumlu geri bildirim veriliyor ve model kendini buna göre optimize ediyor.
Bu sistemin temelinde yatan yaklaşım ise “üretken ödül modellemesi” (Generative Reward Modeling – GRM) adını taşıyor. GRM ile DeepSeek, büyük dil modellerini daha da büyütmek yerine, eş zamanlı değerlendirme yetenekleri ile daha düşük maliyetle daha verimli sonuçlar almayı hedefliyor.
SPCT ve GRM nasıl çalışıyor?
Geleneksel olarak büyük dil modellerinin gelişimi, devasa veri kümeleri ve yüksek işlem gücüyle sağlanırken, DeepSeek farklı bir yol izliyor:
Yapay zekâ modeline kendi iç kurallarını oluşturma yeteneği veriliyor.
Bu kurallar, içeriklerin kalitesini ve doğruluğunu değerlendirmek için kullanılıyor.
Dahili "yargıç", kullanıcının sorusuna verilen yanıtı hem modelin kendi kurallarına hem de örnek ideal yanıtlara göre değerlendiriyor.
Sonuç pozitifse model kendini ödüllendiriyor, değilse geliştirme sinyali alıyor.
Bu sistemin adı: DeepSeek-GRM.
GPT-4o ve Gemini’ye rakip mi?
Ocak 2025’te piyasaya sürülen R1 adlı sohbet robotuyla büyük ses getiren DeepSeek, bu yeni sistemin rakiplerinden daha etkin ve düşük maliyetli olduğunu öne sürüyor. Şirketin SPCT teknolojisini duyurduğu akademik çalışmada, OpenAI GPT-4o, Google Gemini ve Meta Llama gibi modellerden daha iyi sonuçlar elde edilebileceği iddia edildi.
Bu gelişmeyle birlikte DeepSeek’in R2 adını taşıyacak yeni nesil sohbet robotunu yakında tanıtacağına dair söylentiler de artmış durumda. Şirket henüz resmi bir duyuru yapmasa da, sektörde heyecanlı bir bekleyiş söz konusu.
Açık kaynak planları yolda
DeepSeek’in ayrıca SPCT ve GRM tabanlı sistemlerini açık kaynaklı olarak paylaşma hedefi de bulunuyor. Ancak bu paylaşımın ne zaman gerçekleşeceğine dair kesin bir tarih verilmiş değil.
Yapay zekâ kendi kendini nasıl eğitir?
DeepSeek’in SPCT yöntemi, yapay zekâ alanında devrim niteliğinde bir yaklaşımı temsil ediyor. Kendi kurallarına göre öğrenen, hata yapan ve gelişen bir yapay zekâ fikri, yalnızca teknolojik değil, aynı zamanda etik ve felsefi soruları da beraberinde getiriyor.
Bu yeni adım, gelecekte daha bilinçli, özerk ve esnek yapay zekâ sistemleri için kapıları aralayabilir.