OpenAI, bugün “Sora” ismini verdiği metinden video oluşturma aracını tanıttı. Şimdilik güvenlik uzmanları tarafından test edilen model, korkutucu derecede gerçekçi 60 saniyelik görüntüler oluşturabiliyor.

ChatGPT’nin geliştiricisi OpenAI, bugün dünyayı kasıp kavuran yapay zekâ modellerine bir yenisini daha ekledi. “Sora” ismi verilen model, metinden video oluşturabiliyor. Şirketin paylaştığı örnek görüntüler ise modelin korkutucu derecede iyi olduğunu gösteriyor.
Sora, şimdi dezenformasyon, nefret içerikleri ve ön yargı gibi hususlarda uzman olan şahıslar tarafından test ediyor. Şirket, modeli kullanıma sunmadan önce gerekli güvenlik adımlarını atmak istediğini ifade ediyor.
Sora, metin komutlarıyla 60 saniyelik gerçekçi görüntüler oluşturabiliyor
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
“Güzel, karlı ve hareketli Tokyo kenti. Kamera, hoş karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ederek kentin hareketli caddesinde ilerliyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgarda uçuyor.”
*Videoyu görüntüleyemiyorsanız buradaki kontağa tıklayın.
Başta da belirttiğimiz aynıi Sora bir metinden video oluşturma modeli. Yani yazdığınız bir metin komutunu görüntüye çevirebiliyor. OpenAI, Sora’nın 60 saniye, yani bir dakikaya kadar video oluşturabildiğini açıkladı.
Bu görüntülerin görsel kalitesinin yüksek kalabildiği, son derece detaylı olduğu, karmaşık hareketleri içerdiği ve canlu hislere sahip birden fazla karaktere yer verebildiği ifade edildi. Aslında görüntülere baktığımızda korkutucu derecede gerçekçi olduğunu görebiliyoruz. OpenAI’ın yaptığı açıklama şu şekilde:
Sora, güvenlik için test edenlerin yanı sıra sanatkarlar, sinemacılar ve dizayncılar aynıi bireylere de açılacak. Bu şahıslar, yapay zekâ aracını kullanarak geri bildirim sağlayacaklar ve modelin daha gelişmiş hâle gelmesine katkıda bulunacaklar.
Görsellerden de video üretebiliyor
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Bunun dışında OpenAI, yalnızca metinden değil, görsellerden de video oluşturabildiğini ekledi. Şirketin Açıklamasına göre hâlihazırdaki bir görseli alıp ondan video üretebiliyor. Bu görüntüde da küçük ayrıntılara ve detaylara dikkat ediyor.
Bazı zayıf istikametleri de yok değil
Tabii ki model şimdi test etaplarında olduğu için zayıf istikametleri de var. OpenAI da bunu kabul ediyor. Şirket, bazen karmaşık sahnelerin fiziğini doğru bir şekilde simüle etmekte zorlanabileceğini ve neden-sonuç örneklerini anlayamayabileceğini söylüyor.
Mesela oluşturulan bir görüntüde bir kişinin kurabiye ısırdığını lakin sonrasında bu kurabiyede herhangi bir ısırık izi kalmadığını görebiliriz. Ayrıyeten sol ve sağ ayrıntıları karıştırabileceğini ve kameranın gidişini takip etmek gibi zaman içinde meydana gelebilecek olayları açıklamada zorlanabileceği söyleniyor.
Yine de örnek görüntülere baktığımızda Sora’nın ne kadar çok potansiyele sahip olduğunu görebiliyoruz. Yapay zekâ modelleri konusunda ihtilal yaratma potansiyeline sahip olduğu aşikar. Herkese geldiğinde neler yapabildiğini göreceğiz.
Sora ile üretilen diğer video örnekleri
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024