2024'te yapay zekada bizi neler bekliyor?

Bayburtgüzeli · 9 Ocak 2024

2024'te yapay zekada bizi neler bekliyor?

Geçen yıl bu zamanlarda cesur bir şey yaptık. Hiçbir şeyin yerinde duramadığı bir sektörde yapay zekanın (AI) geleceğini tahmin etmeye çalıştık. İlk olarak yakıcı soru: Bunu nasıl başardık?

Duyuru

2023 için dört büyük bahisimiz şunlardı:

Sohbet robotlarındaki bir sonraki büyük şey çok modluluk olacak
Kontrol: İşte böyle oldu. Mevcut en güçlü geniş dil modelleri olan OpenAI'nin GPT-4'ü ve Google DeepMind'ın Gemini'si metin, resim ve sesle çalışır.

Şimdi yine aynı adımı atıyoruz. Bunu yaparken bariz olanı görmezden gelmeye karar verdik. Büyük dil modellerinin hakim olmaya devam edeceğini biliyoruz. Düzenleyiciler daha cesur olacak. Önyargıdan telif haklarına ve cehalete kadar yapay zeka sorunları, yalnızca 2024'te değil, önümüzdeki yıllarda da araştırmacıların, düzenleyicilerin ve kamuoyunun gündemine hakim olacak.

Bunun yerine, bu sefer 2024'te dikkat edilmesi gereken birkaç spesifik trendi daha seçtik. (Gelecek yıl bunu nasıl yaptığımızı tekrar açıklayacağız.)

1. Kişiye özel sohbet robotu

2024 yılında üretken yapay zekaya yoğun yatırım yapan teknoloji şirketleri, ürünlerinden kâr elde edebileceklerini kanıtlama konusunda baskı altında kalacak. Bu amaçla, yapay zeka devleri Google ve OpenAI “küçük olma” konusunda büyük yatırım yapıyor: Her ikisi de insanların güçlü dil modellerini özelleştirmelerine ve herhangi bir programlama bilgisi gerektirmeden kendi ihtiyaçlarına göre uyarlanmış kendi mini sohbet robotlarını oluşturmalarına olanak tanıyan kullanıcı dostu platformlar geliştiriyor. . . Her ikisi de herkesin üretken yapay zeka uygulamaları geliştiricisi olmasına olanak tanıyan web tabanlı araçları piyasaya sürdü.

2024 yılında üretken yapay zeka sıradan, teknik bilgisi olmayan insanlar için bile faydalı hale gelebilir ve milyonlarca küçük yapay zeka modelini kurcalayan insan sayısı giderek artacak. GPT-4 ve Gemini gibi modern yapay zeka modellerinin çok modluluğu (yalnızca metni değil aynı zamanda görüntüleri ve hatta videoyu da işleyebilirler) birçok yeni uygulamanın kilidini açabilir. Örneğin, bir emlakçı önceki ilanlardan metin yükleyebilir, basit bir fare tıklamasıyla benzer metinler oluşturmak için güçlü bir modele ince ayar yapabilir, yeni ilanların videolarını ve fotoğraflarını yükleyebilir ve özel yapay zekadan bir ilan açıklaması oluşturmasını isteyebilir.' duyuru. mülk.

Ancak açıkçası bu planın başarısı bu modellerin güvenilirliğine bağlı. Dil modelleri çoğu zaman bir şeyleri uydurur ve üretken modeller önyargıya maruz kalır. Ayrıca, özellikle internette gezinebiliyorlarsa, hacklenmeleri de kolaydır. Teknoloji şirketleri bu sorunların hiçbirini çözemedi. Yenilik geçerliliğini yitirdiğinde müşterilerine bu sorunları çözmenin yollarını sunmaları gerekir.

2. Üretken yapay zekanın ikinci dalgası video olacak

Fantastik olanın bu kadar çabuk tanıdık hale gelmesi şaşırtıcı. Fotogerçekçi görüntüler üreten ilk üretken modeller 2022'de ana akım sahneye çıktı ve hızla sıradan hale geldi. OpenAI'nin DALL-E'si, Stability AI'nin Stable Diffusion'ı ve Adobe'nin Firefly'ı gibi araçlar, İnternet'i Balenciaga'daki Papa'dan ödüllü sanat eserlerine kadar çarpıcı görüntülerle doldurdu. Ancak bu sadece eğlence değil: Ponpon sallayan her boksöre karşılık, başka bir sahte fantezi sanatı veya cinsiyetçi cinsel klişe var.

Yeni hedef, metnin videoya dönüştürülmesidir. Metinden görsele geçişte iyi, kötü ya da çirkin olan her şeyin, yaşamdan daha büyük boyutlar kazanmasını bekleyebilirsiniz. Bir yıl önce, üretken modellerin neler yapabileceğine dair ilk deneyimimizi, birden fazla hareketsiz görüntüyü yalnızca birkaç saniye süren klipler halinde birleştirme konusunda eğitildiklerinde tattık. Sonuçlar çarpık ve sarsıntılıydı. Ama teknoloji hızla gelişti.

Üretken video modelleri yapan ve ortak geliştirilen Stable Diffusion'ı üreten bir girişim olan Runway, araçlarının yeni sürümlerini birkaç ayda bir yayınlıyor. En yeni Gen 2 modeli hâlâ yalnızca birkaç saniye süren videolar üretiyor ancak kalite artık etkileyici. THE en iyi klipler Pixar'ın yayınlayabileceğinden çok da uzak değiller.

Runway, çeşitli yapay zeka araçları kullanılarak yapılan deneysel filmlerin yer aldığı yıllık bir yapay zeka film festivali başlattı. Bu yılki festivalde 60.000 dolar para ödülü verilecek ve en iyi on film New York ve Los Angeles'ta gösterilecek.

Büyük film stüdyolarının projeyi dikkate alması sürpriz değil. Paramount ve Disney gibi film devleri artık üretim hatlarında üretken yapay zekanın olanaklarını araştırıyor. Bu teknik, oyuncuların daha sonra mikslenen ses kayıtları olan çeşitli yabancı dil overdub'larıyla dudak senkronizasyonu yapması için kullanılıyor. Bunu yapmak için özel efektlerin olanaklarını yeniden icat edin. Geçtiğimiz yıl Indiana Jones ve Wheel of Fortune, Harrison Ford'un dijital olarak yenilenmiş deepfake'inde rol aldı. Ve bu sadece başlangıç.

Deepfake teknolojisi aynı zamanda pazarlama ve eğitim amaçlı olarak beyazperdede de yükselişe geçiyor. Örneğin İngiliz şirketi Synthesia, bir oyuncunun benzersiz performansını, bir düğmeye basılarak önceden belirlenmiş senaryoları okuyan sonsuz bir deepfake avatar akışına dönüştürebilen bir yazılım üretiyor. Şirkete göre teknolojisi şu anda Fortune 100 şirketlerinin %44'ü tarafından kullanılıyor.

Bu kadar az çabayla bu kadar çok şeyi başarabilme yeteneği, oyuncular için ciddi soruları gündeme getiriyor. Yapay zekanın film stüdyoları tarafından kullanılması ve kötüye kullanılmasıyla ilgili endişeler geçen yılki SAG-AFTRA grevlerinin merkezinde yer alıyordu. SAG-AFTRA (Screen Actors Guild-Amerikan Televizyon ve Radyo Sanatçıları Federasyonu), film ve televizyon aktörleri, seslendirme sanatçıları, dansçılar ve diğer profesyonellerden oluşan Amerikan birliğidir. Teknolojinin film endüstrisi üzerindeki gerçek etkisi ancak şimdilerde netleşiyor. Bağımsız film yapımcısı ve yaratıcı teknoloji konusunda uzmanlaşmış danışmanlık şirketi Bell & Whistle'ın kurucu ortağı Souki Mehdaoui, “Film yapma sanatı dramatik bir şekilde değişiyor” diyor.

3. Yapay zekanın ürettiği seçim dezenformasyonu her yerde olacak

Son seçim deneyimlerine göre, 2024'te rekor sayıda insan sandık başına gittiğinde, seçim dezenformasyonu ve yapay zeka tarafından oluşturulan deepfake'ler muhtemelen büyük bir sorun olacak. Politikacıların bu araçları zaten silah olarak kullandığını görüyoruz. Arjantin'de iki başkan adayı, rakiplerine saldırmak için yapay zeka tarafından oluşturulan görüntüler ve videolar oluşturdu. Slovakya'da seçimler sırasında liberal, Avrupa yanlısı bir parti liderinin bira fiyatlarını artırmakla tehdit ettiği ve çocuk pornografisi hakkında şakalar yaptığına dair sahte sahtekarlıklar hızla yayıldı. Son olarak ABD'de Donald Trump, yapay zekayı kullanarak ırkçı ve cinsiyetçi ifadeler içeren memler yaratan bir grubu alkışladı.

Bu örneklerin seçim sonuçlarını ne ölçüde etkilediğini söylemek zor olsa da bunların yaygınlığı endişe verici bir eğilimi temsil ediyor. Çevrimiçi ortamda neyin gerçek olduğunu söylemek her zamankinden daha zor hale geliyor. Zaten hararetli ve kutuplaşmış bir siyasi iklimde bunun ciddi sonuçları olabilir.

Sadece birkaç yıl önce, deepfake oluşturmak gelişmiş teknik beceriler gerektiriyordu, ancak üretken yapay zeka bunu son derece kolay ve erişilebilir hale getirdi. Sonuçlar giderek daha gerçekçi görünüyor. Güvenilir kaynaklar bile yapay zeka tarafından oluşturulan içerik tarafından kandırılabilir. Örneğin, İsrail-Gazze krizini tasvir ettiği iddia edilen kullanıcılar tarafından gönderilen yapay zeka tarafından oluşturulan görüntüler, Adobe gibi fotoğraf ajanslarına akın etti.

Önümüzdeki yıl bu tür içeriklerin yayılmasına karşı mücadele edenler için çok önemli olacak. Tespit ve etkisiz hale getirme teknikleri henüz geliştirme aşamasındadır. Google DeepMind'ın SynthID'si gibi filigranlar hâlâ büyük ölçüde isteğe bağlıdır ve tamamen kusursuz değildir. Ek olarak, sosyal medya platformları yanlış bilgilerin kaldırılması konusunda oldukça yavaştır. Yapay zekanın ürettiği sahte haberlerle mücadele etmek için önemli bir gerçek zamanlı deneye hazır olun.

4. Çok görevli robotlar

Üretken yapay zekada patlamayı başlatan bazı temel tekniklerden ilham alan robot bilimi uzmanları, daha geniş görev yelpazesine sahip genel amaçlı robotlar üzerinde çalışıyor.

Son yıllarda yapay zeka; görüntü tanıma, çizim ve açıklama ekleme gibi bireysel görevler için eğitilmiş daha küçük modellerden, tüm bu görevler ve daha fazlası için eğitilmiş yekpare modellere dönüştü. Araştırmacılar, OpenAI'nin GPT-3'üne birkaç ek örnek (ince ayar olarak bilinir) göstererek onu programlama görevlerini çözme, film senaryoları yazma ve lise biyoloji sınavlarını geçme konusunda eğitebilirler. GPT-4 ve Google DeepMinds Gemini gibi multimodal modeller hem görsel hem de dilsel görevleri çözebilir.

Aynı yaklaşım robotlar için de kullanılabilir, böylece bir robotu krepleri çevirmek ve diğerini kapıları açmak için eğitmeye gerek kalmaz: herkese uyan tek boyutlu bir model, robotlara çoklu görev yapma yeteneği verebilir. Geçtiğimiz yıl bu alanda çok sayıda çalışma örneği sunuldu.

Haziran ayında DeepMind, belirli bir kolun olağan kontrolü yerine birçok robot kolunu kontrol etmeyi öğrenmek için deneme yanılma yoluyla kendi verilerini üreten Robocat'ı (2022 Gato güncellemesi) yayınladı. Ekim ayında şirket, 33 üniversite laboratuvarıyla işbirliği içinde başka bir genel amaçlı robot modeli olan RT-X'i ve yeni, büyük bir genel amaçlı eğitim veri kümesini piyasaya sürdü. Kaliforniya Berkeley Üniversitesi'ndeki RAIL (Robotik Yapay Zeka ve Öğrenme) gibi diğer büyük araştırma grupları da benzer yöntemler üzerinde çalışıyor.

Ancak sorun veri eksikliğidir. Üretken yapay zeka, İnternet boyutunda metin ve görsellerden oluşan bir veri kümesine dayanır. Karşılaştırıldığında robotların, arzuladığımız endüstriyel veya ev işlerinin çoğunu nasıl gerçekleştireceklerini öğrenebilecekleri çok az iyi veri kaynağı var.

Lerrel Pinto'nun New York Üniversitesi'ndeki ekibi bu sorunla mücadele ediyor. Robotların kendi eğitim verilerini elde ederken deneme yanılma yoluyla öğrenmelerine olanak tanıyan teknikler geliştirin. Daha da düşük profilli bir projede Pinto, çevreden video verileri toplamak için çöp toplayıcılara bağlı iPhone'ları kullanacak gönüllüleri işe aldı. Son yıllarda büyük şirketler bile robotların eğitimi için büyük veri setleri yayınlamaya başladı. Bunun bir örneği Meta'nın Ego4D'sidir.

Bu yaklaşım sürücüsüz araçlarda şimdiden umut vaat ediyor. Wayve, Waabo ve Ghost gibi start-up'lar, belirli sürüş görevlerini kontrol etmek için birden fazla küçük model yerine bir aracı kontrol etmek için tek bir büyük model kullanan, kendi kendini yöneten yapay zekanın yeni dalgasına öncülük ediyor.

Bu, küçük işletmelerin Cruise ve Waymo gibi devlerle rekabet etmesine olanak tanır. Wayve, sürücüsüz arabalarını halihazırda Londra'nın dar ve kalabalık caddelerinde test ediyor. Benzer bir iyileşme her yerde robotları bekliyor.

(Jle)

Haberin Sonu

2024'te yapay zekada bizi neler bekliyor?

Bayburtgüzeli

Global Mod