Chatbotlar sayesinde otonom arabalar nasıl daha akıllı hale geliyor?
Otonom bir arabada ChatGPT mi? İngiliz start-up Wayve, tüm bunların çok özel bir şekilde birbirine uyduğunu düşünüyor: Şirket, sürücüsüz bir araca neden sürüş kararı verdiğini doğrudan sormak için kullanılabilecek bir dil modeli kullanıyor. Bu da eğitimin önemli ölçüde iyileştirilmesine olanak sağlamalıdır.
Duyuru
Bunu başarmak için şirket, mevcut otonom sürüş yazılımını geniş bir dil modeliyle birleştirerek LINGO-1 adı verilen hibrit bir sistem oluşturdu. Yolculuklardan elde edilen video verilerini, otomobilin saniye saniye gerçekleştirdiği eylemlerle senkronize eder ve bunu, otomobilin “gördüğünü” veya “yaptığını” yakalayan doğal dil açıklamalarıyla birleştirir.
Son yıllarda Wayve, otonom sürüş alanında çok sayıda ilerleme kaydetti. 2021’de, Londra sokaklarında eğitilen yapay zekanın diğer dört Britanya şehrinde arabaları kontrol etmek için kullanılabileceğini gösterdi; bu da tipik olarak kapsamlı bir yeniden eğitim gerektiren bir zorluktur. Wayve, 2022 yılında aynı sistemi birden fazla araç tipini kontrol etmek için kullandı ve sektörde bir ilk daha gerçekleştirdi. Artık araba bir sohbet robotuna dönüşüyor.
Araba çevreyi açıklıyor
Bir gösteri sırasında şirket CEO’su Alex Kendall, Jaguar I-PACE test araçlarından birinin kamera görüntülerini oynatıyor, videonun herhangi bir noktasına atlıyor ve ardından şu soruları yazmaya başlıyor: “Hava nasıl?” Cevap: “Hava bulutlu.” Sonraki soru: “Hangi tehlikeleri görüyorsunuz?” Cevap: “Solda bir okul var.” Soru: “Neden durdun?” Cevap: “Çünkü trafik ışığı kırmızıdır.”
Kendall, “Son birkaç haftada inanılmaz şeyler yaşadık” diyor. “Bir arabaya böyle bir şey soracağımı hiç düşünmezdim ama şuna bak.” Daha sonra sağdaki bina kaç katlı sorusunu yazın. Araç cevap verir: Üç. Bu doğru. “Sistemi asla böyle bir şey yapacak şekilde eğitmedik. Bu bizi gerçekten şaşırttı. Bunu yapay zeka tabanlı trafik güvenliğinde bir atılım olarak görüyoruz.”
Berkeley’deki Kaliforniya Üniversitesi’nde robot bilimi araştırmacısı ve robot bilimi şirketi Covariant’ın kurucu ortağı Pieter Abbeel, “LINGO-1’in yeteneklerinden etkilendim” diyor. Wayve’in teknolojisini zaten bir gösteride inceledik. LINGO-1’e trafik ışığı yeşil olduğunda ne yapılacağı gibi çeşitli “ya olursa” soruları sordu. “Neredeyse her seferinde çok spesifik bir cevap vardı” diyor.
Kaza meydana gelene kadar iyi sürün
Wayve, otonom sürüş yazılımına her aşamada meydan okuyarak, arabalarının belirli kararları neden ve nasıl verdiğine dair daha derin bir anlayış kazanmayı umuyor. Çoğu durumda arabalar iyi gidiyor. Ancak bunu yapmazlarsa, Cruise ve Waymo gibi sektör öncülerinin kazalarda keşfettiği gibi bu bir sorun demektir.
Her iki şirket de bazı ABD şehirlerinin sokaklarına küçük robotaksi filoları yerleştirdi. Ancak teknoloji mükemmel olmaktan uzaktır. Cruise ve Waymo arabaları birkaç küçük çarpışmaya karıştı – Waymo araçlarının bir köpeği öldürdüğü bile söyleniyor – ve bazen kontrol sistemi çöktüğünde trafiği engelliyor. San Francisco’daki yardım çalışanları ayrıca, Ağustos ayında iki Cruise aracının, daha sonra hastanede ölen yaralı bir adamı taşıyan ambulansa çarptığını söyledi. (Cruise bu açıklamaya karşı çıkıyor.) Wayve artık araçlarından yanlış bir şey yaptıklarında kendilerini açıklamalarını istemenin, hataları video tekrarlarının uzun süre incelenmesinden veya yalnızca hata raporlarının okunmasından daha hızlı ortaya çıkaracağını umuyor.
Abbeel, “Otonom sürüşteki en önemli zorluk güvenliktir” diyor. “LINGO-1 gibi bir sistemle, sistemin dünyada sürüşü ne kadar iyi anladığı konusunda çok daha iyi bir fikre sahip olduğunuzu düşünüyorum.” Bunun güvenlik açıklarını tespit etmeyi kolaylaştırdığını söylüyor. Kendall, bir sonraki adımın arabalara gerçek dili öğretmek olduğunu söylüyor. Wayve, LINGO-1’i eğitmek için, bazıları eski sürücü eğitmeni olan deneyimli sürücülerden oluşan ekibinden, araç kullanırken ne yaptıklarını ve neden yaptıklarını mikrofona yüksek sesle açıklamalarını istedi. Örneğin neden daha hızlı veya daha yavaş araç kullandıkları ya da hangi tehlikeleri algıladıkları. Şirket daha sonra bu verileri, bir sürücü eğitmeninin öğrenen bir insan sürücüye nasıl talimat vereceğine benzer şekilde rehberlik sağlayarak modele ince ayar yapmak için kullanıyor. Kendall, bir arabaya bir şeyi basitçe göstermek yerine nasıl yapılacağını söylemenin eğitimi çok hızlandırdığını söylüyor.
İlk uygulama değil
Wayve, robot biliminde büyük dil modellerini kullanan ilk şirket değil. Google ve Abbeel şirketi Covariant’ın da aralarında bulunduğu diğer şirketler, evsel veya endüstriyel robotlara talimat vermek veya onları sorgulamak için doğal dili kullanıyor. Hibrit sistemlerin zaten bir adı var: Görsel Dil Eylem Modeli veya kısaca VLAM. Ancak Wayve, otonom sürüş için VLAM’leri kullanan ilk şirkettir. Kendall, “Bir resmin bin kelimeye bedel olduğu sıklıkla söylenir, ancak makine öğreniminde durum tam tersidir” diyor.
“Burada birkaç kelime bin resimden daha değerli olabilir.” Çünkü bir kayıt, gereksiz olabilecek çok fazla veri içerir. “Araba sürerken gökyüzünü, önünüzdeki arabanın rengini veya diğer küçük şeyleri umursamazsınız” diyor. “Kelimeler önemli bilgilere odaklanmanıza yardımcı olur.”
New York Üniversitesi’nden robot bilimi araştırmacısı Lerrel Pinto, “Wayve’nin yaklaşımı kesinlikle ilginç ve günümüze özgü” diyor. Özellikle LINGO-1’in eylemlerini açıklama şeklini beğeniyor. Ancak model halüsinasyon görmeye başladığında ne olacağını da merak ediyor. “Harika dilsel modellerin her zaman gerçeklere sadık kaldığını düşünmüyorum” diyor. “Bu yüzden arabamı kullanma konusunda onlara güvenebileceğimden emin değilim.”
Araba halüsinasyon gördüğünde
Georgia Teknoloji Enstitüsü’nde yapay zekanın kararlarını insanlara açıklamasını sağlamanın yolları üzerinde çalışan araştırmacı Upol Ehsan’ın da benzer çekinceleri var. Ehsan, “Büyük dil modelleri – teknik terim de budur – büyük saçmalıktır” diyor. “İşe yarayan tek şey, ürettikleri konuşmanın halüsinasyon olabileceği konusunda bizi uyaran büyük, parlak bir uyarı işaretidir.”
Wayve bu sınırlamaların farkında ve LINGO-1’i mümkün olduğunca doğru hale getirmek için çalıştığını söylüyor. Kendall, “Herhangi bir büyük dil modeliyle aynı zorlukları görüyoruz” diye itiraf ediyor. “Kesinlikle mükemmel değil.” LINGO-1’in hibrit olmayan modellere göre bir avantajı, yanıtlarının eşlik eden video verileriyle desteklenmesidir. Teorik olarak bu, LINGO-1’i salt metinsel dil modellerinden daha doğru kılmalıdır.
Kendall, işin sadece arabalarla ilgili olmadığını söylüyor. “İnsanların dili geliştirmesinin bir nedeni var: karmaşık konuları iletmenin bildiğimiz en etkili yolu bu. Ve bunun akıllı makineler için de geçerli olacağını düşünüyorum.” Gelecekte robotlarla etkileşim kurma şeklimiz dil aracılığıyla olacak. Robot araştırmacısı Abbeel de aynı fikirde: “Robot biliminde bir devrimin eşiğinde olduğumuza inanıyorum.”

(bsc)
Haberin Sonu