Teknoloji

Yapay zekada ‘akıl yürütme’ modelleri tıkanmanın eşiğinde

Mühendisler zekayı makinelere öğretmeye çalışırken, yapay zeka araştırmaları adeta bir satranç oyununa dönüştü: her hamle daha akıllı modeller üretirken, oyun tahtası daralıyor. Akıl yürütme (reasoning) yeteneğine sahip modeller giderek daha karmaşık hale gelse de, bu ilerlemenin yakıtı olan işlem gücü ve araştırma kaynakları sınırlı. Yeni bir analiz, bu stratejik oyunda, yakında gelişimin değil işlem gücü sınırlarının konuşulacağını söylüyor.

Bilindiği üzere yapay zeka dünyasının son yıllardaki en büyük sıçramalarından biri, akıl yürütme yeteneğine sahip modellerin geliştirilmesiydi. Ancak bu sıçrayış da sınıra yaklaşıyor. Bağımsız araştırma kuruluşu Epoch AI tarafından yayımlanan rapora göre, “reasoning” yani akıl yürütme modellerinin performans kazanımları, önümüzdeki yıl gibi kısa bir sürede önemli ölçüde yavaşlayabilir.

Gelişim yavaşlayacak

Akıl yürütme modelleri, özellikle matematiksel problem çözme ve programlama becerilerini ölçen testlerde gösterdikleri üstün başarıyla dikkat çekmişti. OpenAI’ın geliştirdiği “o3” ile Deepseek, Anthropic ve Google’ın benzer modelleri, daha fazla hesaplama gücü kullanarak geleneksel yapay zeka modellerine kıyasla daha isabetli sonuçlar verebiliyor. Ancak bu yüksek doğruluk oranının bedeli, işlem süresindeki uzama ve maliyetlerin ciddi biçimde artması oluyor.

Bu tür modellerin geliştirilmesi, iki temel aşamaya dayanıyor: Öncelikle model büyük veri kümeleri üzerinde eğitiliyor, ardından takviyeli veya pekiştirmeli öğrenme adı verilen bir süreçle zor problemler karşısında doğru çözümler üretmesi için geribildirim veriliyor. Epoch AI’nın bulgularına göre, bugüne dek önde gelen yapay zeka laboratuvarları bu ikinci aşamada sınırlı bir işlem gücü kullanıyordu.

Ancak bu durum değişiyor. OpenAI, o3 modelini geliştirirken, bir önceki sürümü olan o1’e kıyasla yaklaşık 10 kat daha fazla işlem gücü kullandığını açıkladı. Epoch’un tahminlerine göre, bu artışın büyük bölümü takviyeli öğrenme sürecine ayrıldı. OpenAI araştırmacısı Dan Roberts ise, gelecekteki modellerde bu sürece çok daha fazla kaynak ayrılacağını belirtti.

Hesaplama gücü sonsuz değil

Fakat burada bir sınır var. Epoch analisti Josh You, geleneksel model eğitimiyle elde edilen performans artışlarının yılda yaklaşık dört kat arttığını, buna karşılık takviyeli öğrenme kaynaklı kazançların her 3 ila 5 ayda bir on katına çıktığını söylüyor. Ancak bu ivmenin sonsuza dek süremeyeceğini vurgulayan You, 2026 yılına kadar bu iki alanın performans kazanımlarında bir dengeye ulaşacağını öngörüyor. Raporda yalnızca işlem gücü değil, araştırma maliyetleri gibi faktörlerin de göz önünde bulundurulması gerektiği belirtiliyor. Bu modellerde aynı zamanda başka bir sorun da var. Bu modeller ne kadar akıllandıkça o kadar yalan söylemeye, yani “halüsinasyon” üretme eğiliminde oluyorlar. Bunları bastırmak da yine dolaylı bir maliyet yaratacak. Dolayısıyla endüstri, bir sonraki “iPhone” anını bekliyor desek yanlış olmayacaktır.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu