Meta’nın Make-a-Video’ya göre: Rekabetçi model daha uzun videolar üretebilir

Bayburtgüzeli · 10 Şub 2023

Artık pek çok kişi kararlı difüzyona aşinadır: Bu AI teknolojisi ile metin girişinden gerçekçi görüntüler oluşturulabilir. Bu teknolojinin geliştirilmesinde kilit rol oynayan bir şirket olan start-up Runway, şimdi de video üretebilen üretken bir yapay zeka modeli geliştirdi. Gen-1 adlı yazılımla mevcut bir filmi alıp herhangi bir tarzda başka bir videoya dönüştürebilirsiniz. Metin biçiminde bir istek (istem) yazmak veya sistemin daha sonra kullanacağı bir referans resim belirtmek yeterlidir.

Runway, web sitesinde yaptığı bir gösteride, Gen-1’in sokaktaki insan kliplerini nasıl plastikten bebeklere veya bir masanın üzerine yığılmış kitapları gece şehir manzarasına nasıl dönüştürebileceğini gösteriyor. Runway, Gen-1’in video için, Stable Difüzyon’un görüntüler için ne anlama geldiğini umuyor. Runway’in CEO’su ve kurucu ortağı Cristóbal Valenzuela, “Az önce görüntü oluşturma modellerinde bir patlama gördük,” diyor. “2023’ün video yılı olacağına inanıyorum.”

2018’de kurulan Runway, birkaç yıldır yapay zeka destekli video düzenleme yazılımı geliştiriyor. Şirketin araçları, TikTokers ve YouTubers ile büyük film ve TV stüdyoları tarafından kullanılıyor. Başrolünü Stephen Colbert’in oynadığı ‘The Late Show’un yaratıcıları, dizinin grafiklerini değiştirmek için pist yazılımını kullandılar; Gişe rekorları kıran “Everything Everywhere All at Once” filminin arkasındaki görsel efekt ekibi, eksiksiz sahneler yaratmak için şirketin teknolojisini kullandı.

Münih araştırmacıları finanse etti

2021’de Runway, Stable Diffusion’ın ilk sürümünü geliştirmek için Münih Üniversitesi’nden araştırmacılarla ortaklık kurdu. Bir İngiliz kuruluşu olan Stability AI, daha sonra çok daha fazla veriyle modelin eğitim maliyetini karşıladı. Son olarak, 2022’de Stability AI, onu bir araştırma projesinden küresel bir fenomene dönüştürerek istikrarlı yayılımı ana akım haline getirdi.

Ancak, iki şirket bugün artık birlikte çalışmıyor. Bunun Getty Images gibi hak sahiplerinin şu anda Stability AI’ye karşı yasal işlem başlatmasıyla da ilgisi var. AI şirketinin Getty’s gibi telif hakkıyla korunan görselleri izinsiz kullandığını iddia ediyorlar. Eğitim verilerinde bulunabilecekleri açık görünüyor. Pist şu anda Stability Ai’den uzak durmaya çalışıyor.

Ve Gen-1, her ikisi de video (çok) kısa olan Meta’nın Make-a-Video ve Google’ın Phenaki’si de dahil olmak üzere geçen yılın sonlarında tanıtılan bir dizi rakip metinden videoya modeli izleyen Runway için yeni bir başlangıcı işaret ediyor. klipler sıfırdan oluşturulabilir. Aynı zamanda, belirli stilleri uygulayarak mevcut videolardan yeni videolar oluşturabilen, Google’ın geçen hafta tanıttığı üretken bir AI olan Dreamix’e benzer.

Google ve Meta’dan daha yüksek kalite

En azından Runway demosuna bakılırsa, Gen-1 video kalitesi açısından hızlanıyor gibi görünüyor. Mevcut görüntüleri dönüştürdüğü için önceki modellerin çoğundan çok daha uzun videolar da üretebilir. (Runway, önümüzdeki günlerde web sitesinde daha fazla Gen-1 teknik detayı yayınlayacağını söyledi.)

Meta ve Google’dan farklı olarak Runway, modelini film endüstrisi müşterilerini düşünerek geliştirdi. Valenzuela, “Bu, bir video yapımcıları topluluğuyla yakın işbirliği içinde geliştirilen ilk modellerden biri” diyor. “Yönetmenlerin ve görsel efekt editörlerinin post prodüksiyonda gerçekte nasıl çalıştıklarını yıllardır biliyoruz.” Runway’in web sitesi aracılığıyla bulutta çalışan Gen-1, şu anda bir avuç yüklenmiş kullanıcı tarafından kullanılabilir ve bir bekleme listesi aracılığıyla birkaç hafta içinde kademeli olarak kullanıma sunulması planlanıyor.

Üretken yapay zekanın geçen yılki patlayıcı yükselişi, milyonlarca insanın güçlü yaratıcı araçlara ilk kez el atması ve sonuçlarını dünyayla paylaşmasıyla alevlendi. Valenzuela, Gen-1’in yaratıcı profesyonellere tanıtılmasının yakında video üzerinde benzer bir etki yaratacağını umuyor. Ve bu sadece başlangıç. “Tam uzun metrajlı filmler yapmaya gerçekten çok yakınız” diyor. Çevrimiçi gördüğünüz içeriğin çoğunun AI video oluşturuculardan gelmesi çok uzun sürmeyecek.

(jle)

Haberin Sonu

Meta’nın Make-a-Video’ya göre: Rekabetçi model daha uzun videolar üretebilir

Bayburtgüzeli

Global Mod