OpenAI Sora ve Unreal Engine

3 min readFeb 18, 2024

Merhaba,

Bugün hayatımızda yeni bir teknoloji devrimi yaratan OpenAI şirketinin son ünününden, Sora’dan bahsedeceğim. Bu yeni teknolojinin mevcut text-to-video teknolojileriyle arasında ne gibi farkları olduğunu açıklamaya çalışacak, ben ve benim gibi birkaç kişinin şüphelendiği bir mesele olan oyun motoru AI ilişkisine değineceğim.

Geleneksel text-to-video teknolojileriyle uğraşan farklı şirketler de vardı, Benim bildiğim ve denediğim RunwayML de bunlardan birisi. Ancak bu şirketlerin hiçbirisi Sora kadar uzun süreli bir sonuç üremediği gibi , Sora’nın ürettiği detayların yanına bile yaklaşamamıştı. En fazla 3 veya 4 saniyelik sonuçlar üretiliyorlardı ve ürettikleri videolardaki detay hatalarını düzeltmek için ayrıca efor sarfetmek gerekiyordu.

İşte Sora hem bu devamlılık problemini çözdü ve video süresini 1 dakikaya çıkardı hem de detaylar şaşırtıcı derecede başarılıydı. Şimdi artık ciddi ciddi AI ile yapabileceğimiz filmleri düşünebiliyor hale geldik.

Peki bu devrimin mihenk taşları neler olabilir? OpenAI nasıl aniden ortaya çıkmış ve bu konuda rakiplerine fark atmayı başarmış olabilir? Şimdi biraz bu konudaki teorilerimi yazmak istiyorum;

ChatGPT’den sonra beklentiler yükselmiş ve literatüre OpenAI tarafından kazandırılmış olan AGI(Artificial General Intelligence) kavramı ortaya atılmıştı. Yani Yapay Genel Zeka. Bunun anlamı ise insan aklından ayırt edilemeyecek şekilde gelişmiş bir Yapay Zeka. Yani OpenAI bu mesele üzerinde uzun bir süredir kafa patlatıyor diyebiliriz. Bu cepte kalsın, sonra birleştireceğiz.

ChatGPT’nin özünü oluşturan LLM’ları geliştirerek bir AGI yaratılmasının mümkün olmadığını muhtemelen çözmüş olmalılar ve bu yüzden(Sora için yaptıkları teknik açıklamalardan da öğrenebileceğimiz üzere) farklı çözümler, farklı algoritmalar üzerinde çalışmışlar. Bence buna mecburlardı. Ve ardından Sora bombasını patlattılar.

Benimle beraber birçok kişi bu başarının ortaklarından birisinin oyun motorları(muhtemelen unreal engine) olabileceğinden şüphelendi. Çünkü şimdiye kadar hiçbir AI, gölgeler, derinlik, devamlılık gibi konularda bu kadar ileri gidememişti. Hesaplamalara bir parametre daha edilmesi gerekiyordu, derinlik parametresi. Derinlik parametresinin çıktıları da 2 boyutlu veri üzerinde çalıştığınız zaman düzgün çalışmıyordu, bu yüzden mevcut diğer teknolojiler fazla ileri gidememişti. Bir şekilde 3. boyut olan derinlik parametresinin farklı bir şekilde işlenmesi ve bu sorunların çözülmesi gerekiyordu.

Çözümü de bence sisteme oyun motorlarını entegre ederek buldular. Bu içeriği AI bir oyun motoru tarafından 3 boyutlu hale getirip öyle render ederse ancak bu sayede istenilen sonuca ulaşabilir ve mevcut sorunları çözebilirdi. Bu teorik olarak mümkün ve muhtemelen böyle bir şey yaptılar. Zaten açıklamalarda az buçuk ipuçları veriyorlar. Oyun motoru veya ona çok benzeyen bir şey olmalı.

Yine OpenAI’nin açıklamalarına göre Sora, AGI hedefine ulaşmak için bir kilometre taşı, ki bu konuda haklılar.

Burada, oyun motorlarının, 3D tasarımların oyuna dahil olmasıyla önemli bir kilometre taşına ulaşıyor OpenAI, yani AGI’ye giden yolun fiziksel bağımlılıktan geçtiği farkına varıyorlar.

Benim burada yazdığım teori, insan aklının ve bilincinin nasıl simüle edilebileceği, yani bir AGI’nin nasıl yaratılabileceği ile ilgili bir teori. Benim teorime göre insan aklının simüle edilebilmesi veya AGI’nin yaratılabilmesi iki temel ön koşula bağlıdır. İşlem gücü ve ona atanmış bir fiziksel varlık, bir beden. İşlem gücü ve ona atanmış beden sentezi sürekli pozisyon üretir, sürekli evrende yer kaplayacağı bir sonraki pozisyonun ne olması gerektiğini hesaplar, bilincin özü de bu görece basit algoritmadır. İşte Yapay Zeka araştırmacıları bu denklemin farkına varmış görünüyor. Çünkü oyun motorlarında da, tıpkı gerçek dünyada olduğu gibi hesaplamalar 3 boyutlu bir evren üzerinde yapılır. Bir odak(yani sanal beden) ve onun pozisyonu vardır.

Ancak bu yeterli değil, çünkü bu işlemin oyun motorlarında çalışabilmesi için sürekli içerideki simülasyonu beslemek büyütmek zorundalar, AGI amacına ulaşmak için burada bizim evrenimizin birebir bir kopyasını yaratmak zorundalar. Bu bir yere kadar göğüslenebilir bir maliyet, ama amaç AGI yaratmak ise bunun altından kalkamazlar. Çünkü tüm evreni, bırakın evreni bu dünyayı bile simüle etmek kolay iş değil, Sam Altman’ın o çok istediği 7 trilyon doları verseler bile bu mümkün değil.

Peki çözüm nedir derseniz; eldeki hazır derlenmiş simülasyonu kullanmak zorundalar. Yani gerçek dünyayı ve evreni. Bu sayede bu maliyetlerden kurtulup zekanın kendisine odaklanabilirler. Bu teoride mümkün ve bunu da yazdım kitabımda.

Tahminlerim ne kadar doğru çıkacak, göreceğiz. Ama her ne olursa olsun çılgın gelişmeler bizi bekliyor. (:

OpenAI Sora ve Unreal Engine

Written by Serdar Kuş

No responses yet