Sihirli ve tüyler ürpertici: AI kısa filmi, teknolojinin güçlü ve zayıf yönlerini gösteriyor

Bayburtgüzeli

Global Mod
Global Mod
“The Frost” filminin ürkütücü ve ürkütücü atmosferi daha ilk karelerden belli oluyor. Donmuş dağlar, derme çatma bir askeri kamp, ateşin etrafına toplanmış insanlar, havlayan köpekler görüyorsunuz, artan bir korku duygusu yaratıyorsunuz: burada bir sorun var.


“Bana aleti ver,” diyor bir ses. Yakın plan, ateşin yanında bir parça sarsıntılı kemiren bir adamı gösterir. Dudaklarının hareket şekli pek doğru değil. Bir an donmuş dilinizi çiğniyormuşsunuz gibi gelir.

AI filmlerinin grotesk dünyasına hoş geldiniz. The Frost’un arkasındaki Detroit merkezli video prodüksiyon şirketi Stephen Parker, “Bir noktada fotoğraf doğruluğu konusunda ısrar etmeyi bıraktık ve DALL-E’nin tuhaflığını benimsemeye başladık” diyor. Sonuç, her karenin bir yapay zeka tarafından oluşturulduğu 12 dakikalık bir film (yalnızca Amerikan sitesi MIT Technology Review’da görülebilir). Bu garip yeni türün bugüne kadarki en etkileyici – ve tuhaf – örneklerinden biri.


“The Frost”un prodüksiyonu için Waymark, şirketin sorumlu yapımcılarından Josh Rubin’den bir senaryo aldı ve onu DALL-E 2 AI görüntü oluşturucuya besledi. Yapımcılar memnun oldukları tarzda, her ek çekimi “çekmek” için DALL-E’yi kullandılar. Ardından, durağan görüntüleri canlandırmak için kullanılabilecek bir araç olan D-ID’yi kullandılar. Bu, perdelerin rüzgarda sallanmasını ve konuşurken dudakların hareket etmesini sağlar.

Yapay zeka filmleri yükselişte


Bağımsız film yapımcısı ve yaratıcı bir teknoloji danışmanlığı olan Bell & Whistle’ın kurucu ortağı Souki Mehdaoui, “Bu kesinlikle tarzın tutarlı göründüğü ilk yapay zeka filmi” diyor. “Hareketsiz görüntülerin oluşturulması ve ardından gelen kuklalar, filme özel bir kolaj hissi veriyor.”

Son aylarda üretken yapay zeka kullanılarak çekilen tek kısa film “The Frost” değil. En iyi modeller bile şu anda birkaç saniyelik video ile sınırlıdır. Sonuç olarak, pek çok film, “The Frost”ta olduğu gibi storyboard benzeri dizilerden birçok farklı video klibin vahşi yan yana dizilmesine kadar çok çeşitli stiller ve teknikler sergiliyor.


Video prodüksiyonu için AI araçları yapan bir ABD şirketi olan Runway, Şubat ve Mart aylarında New York’ta bir AI film festivali düzenledi. Öne çıkan özellikler arasında Laen Sanches’in Midjourney Image Generator kullanılarak oluşturulan, plastiğe sarılı garip deniz yaratıklarından oluşan baş döndürücü bir sekans olan “PLSTC”si yer alıyor. 2D fotoğrafları sanal 3D nesnelere dönüştüren NeRF (nöral parlaklık alanları) adlı bir teknolojiyi kullanan Jake Oleson tarafından “Given Again”. Ve Sam Lawton’ın “Genişletilmiş Çocukluk” filminin gerçeküstü nostaljisi, Lawton’ın DALL-E 2’yi sınırlarının ötesine genişletmek için kullandığı eski aile fotoğraflarından oluşan bir slayt gösterisi, eski görüntülerin yarı hatırlanan ayrıntılarıyla oynamasına olanak tanıyor.


Önerilen editoryal içerik



İzninizle, buraya harici bir YouTube videosu (Google Ireland Limited) yüklenecek.



Her zaman YouTube videoları yükleyin

YouTube videosunu şimdi yükleyin




Genişletilmiş Çocukluk – Sam Lawton




hızlı ve ucuz


Sanatçılar genellikle yeni teknolojileri ilk deneyenlerdir. Ancak reklam sektörü de genellikle ön plandadır. Waymark, şirketin üretken yapay zekayı ürünlerine nasıl entegre edebileceğini öğrenmek için “The Frost”u da geliştirdi. Waymark, işletmelerin reklamları hızlı ve uygun maliyetle oluşturmak için kullanabilecekleri video prodüksiyon yazılımı yapar.

Waymark’ın bu yılın başlarında kullanıma sunulan mevcut teknolojisi, yalnızca birkaç adımda bir reklam oluşturmak için dil modelleri, görüntü tanıma ve metinden konuşmaya dahil olmak üzere çeşitli yapay zeka tekniklerini bir araya getiriyor. Waymark ayrıca önceki müşterileri için oluşturulan geleneksel reklamlardan oluşan geniş veri kümesinden de yararlanır. CEO Alex Persky-Stern, “Yüz binlerce videomuz var” diyor. “En iyilerini seçtik ve onlara iyi bir videonun nasıl olduğunu göstermek için yapay zekayı eğittik.”

Kullanıcılar, ayda 25 ABD dolarından başlayan kademeli bir aboneliğin parçası olarak sunulan Waymark aracını kullanmak için şirket web sitelerini veya sosyal medya hesaplarını tanımlar. Yazılım daha sonra bulabildiği tüm metin ve resimleri toplar. Daha sonra bu verilerden, GPT-3’ün şirketi vurgulayan seçilmiş görüntüler üzerinden sentetik bir sesle yüksek sesle okunan uygun bir komut dosyası yazmasıyla bir reklam oluşturulur. Bir dakikalık bir reklam saniyeler içinde oluşturulur. Müşteriler, senaryoyu değiştirerek, görüntüleri değiştirerek veya farklı bir ses seçerek sonucu istedikleri gibi değiştirebilirler. Waymark, aracı şimdiye kadar 100.000’den fazla kişinin kullandığını söylüyor.



Haberin Sonu
 
Üst