Oyunun yapay zekası DeepMind hızlı bir şekilde kodlamayı öğreniyor

Bayburtgüzeli · 21 Haz 2023

Oyunun yapay zekası DeepMind hızlı bir şekilde kodlamayı öğreniyor

DeepMind’ın bilim fethi devam ediyor. Geçen yıl, Google’ın sahibi olduğu şirket, çok önemli bir matematiksel hesaplamayı hızlandırmak için oyun yapay zekasının bir sürümü olan AlphaZero’yu kullandı ve birçok farklı kod türünü destekleyerek 50 yıllık bir rekor kırdı.

Duyuru

Şimdi şirket aynı şeyi tekrar yaptı, tam olarak iki kez. Birleşik Krallık merkezli şirket (kısa süre önce ana şirketinin AI laboratuvarıyla Nisan ayında birleştikten sonra Google DeepMind olarak yeniden adlandırıldı), AlphaDev adlı AlphaZero’nun yeni bir sürümüyle, bir listedeki öğeleri mevcut en iyiden %70’e kadar daha hızlı sıralamanın bir yolunu buldu. yöntem olabilir.

Ayrıca kriptografide kullanılan bir anahtar algoritmasını yüzde 30 hızlandırmanın bir yolunu buldu. Bu algoritmalar, yazılımın en yaygın yapı taşları arasındadır. Küçük hız artışları, maliyetleri düşürerek ve enerji tasarrufu sağlayarak büyük bir fark yaratabilir. Google DeepMind araştırmacısı Daniel Mankowitz, “Moore Yasası sona eriyor ve çipler temel fiziksel sınırlarına yaklaşıyor” diyor. “Veri işlemeyi kolaylaştırmak için yeni ve yenilikçi yollar bulmamız gerekiyor.”

Yeni yaklaşım için övgü

Karlsruhe Teknoloji Enstitüsü’nde (KIT) verimli algoritmaların tasarımı ve uygulanması üzerinde çalışan ve çalışmaya dahil olmayan Peter Sanders, “Bu ilginç bir yeni yaklaşım” diyor. “Sıralama, bilgisayar biliminde hala en çok kullanılan alt programlardan biridir.”

DeepMind yakın zamanda sonuçlarını özel bir dergide yayınladı. Doğa yayınlanan. Ancak AlphaDev tarafından keşfedilen teknikler şimdiden milyonlarca yazılım geliştiricisi tarafından kullanılıyor. Geçen yılın Ocak ayında DeepMind, dünyanın en popüler programlama dillerinden biri olan C++ yönetiminden sorumlu kuruluşa yeni sıralama algoritmalarını sunmuştu. İki aylık zorlu bağımsız testlerden sonra AlphaDev’in algoritmaları dile dahil edildi. Bu, on yılı aşkın bir süredir C++ sıralama algoritmalarında yapılan ilk değişiklikti ve yapay zekanın yardımıyla keşfedilen bir algoritmayı içeren ilk güncellemeydi.

DeepMind, diğer yeni algoritmalarını, C++ ile programlama yapan herkesin ücretsiz olarak kullanabileceği, önceden oluşturulmuş C++ algoritmalarının açık kaynaklı bir koleksiyonu olan Abseil’e ekledi. Bu kriptografik algoritmalar, tüm veri türleri için benzersiz tanımlayıcılar olarak işlev gören karmaları hesaplar. DeepMind, yeni algoritmalarının artık günde trilyonlarca kez kullanıldığını tahmin ediyor.

Duyuru

Git, satranç, programlama

AlphaDev, DeepMind’in Go ve satranç gibi oyunlarda ustalaşmak için eğittiği bir pekiştirmeli öğrenme modeli olan AlphaZero’ya dayalıdır. Şirketin atılımı, daha hızlı bir algoritma bulma sorununu bir oyun olarak ele almak ve ardından yapay zekayı onu kazanmak için eğitmekti, geçen yıl matris çarpımını hızlandırmak için kullandığı yaklaşımın aynısı.

AlphaDev örneğinde oyun, bilgisayar komutlarının seçilmesinden ve bunların sonuçta ortaya çıkan kod satırlarının bir algoritma oluşturacak şekilde düzenlenmesinden oluşur. Algoritma doğru olduğunda ve mevcut algoritmalardan daha hızlı olduğunda AlphaDev oyunu kazanır. Kulağa basit geliyor, ancak iyi oynamak için AlphaDev’in çok sayıda olası hamleyi araştırması gerekiyor.

DeepMind, donanımla ilgili programlama dili Assembler’ı tercih etti. Bugün çok az kişi birleştirici ile yazıyor. C++ gibi diğer dillerde yazılmış kodlar çalıştırılmadan önce o dile çevrilir. Birleştiricinin avantajı, algoritmaların ince dereceli adımlara bölünebilmesidir. Burası kısayol ararken başlamak için iyi bir yerdir.

AlphaDev, oluşturduğu algoritmaya yeni bir derleyici talimatı ekleyerek bir hamle yapar. Başlangıçta, AlphaDev rastgele talimatlar ekledi ve çalışmayan algoritmalar oluşturdu. Zamanla tıpkı tahta oyunları gibi AlphaZero da kazandıran hamleler oynamayı öğrendi. Yalnızca çalışan değil aynı zamanda doğru ve hızlı olan algoritmalara yol açan talimatlar ekledi.

DeepMind, üç ila beş öğelik kısa listeleri sıralamak için algoritmalara odaklandı. Bu tür algoritmalar, daha uzun listeleri sıralayan programlarda tekrar tekrar çağrılır. Bu nedenle, bu kısa algoritmalardaki hız artışlarının kümülatif bir etkisi vardır.

Ancak kısa algoritmalar bile insanlar tarafından onlarca yıldır inceleniyor ve optimize ediliyor. Konseptlerini test etmek için Mankowitz ve meslektaşları, en az üç öğe içeren bir listeyi sıralamak için bir algoritma geliştirmeye başladılar. Bu algoritmanın en iyi insan yapımı versiyonu 18 talimata sahiptir.

Mankowitz, “Dürüst olmak gerekirse, daha iyi bir şey elde etmeyi beklemiyorduk” diyor. “Ama algoritmayı daha hızlı hale getirmeyi başardığımızda şaşırdık. Başlangıçta bunun bir hata olduğunu düşündük, ancak programı analiz ettiğimizde, AlphaDev’in burada gerçekten bir şey tespit ettiğini fark ettik.”

İnsan, diğer algoritmalarla şimdilik yenilmez

AlphaDev, üç maddelik bir listeyi 18 ifade yerine 17’ye ayırmanın bir yolunu buldu. AI, bazı adımların atlanabileceğini keşfetmişti. Mankowitz, “Daha sonra izlediğimizde, ‘Vay canına, bu kesinlikle mantıklı’ dedik” diyor. “Ama böyle bir şey [ohne AlphaDev] öğrenmek için bir sürü montajcıya ihtiyacın var.”

AlphaDev, 28 talimat alan dört maddelik bir listeyi sıralamak için algoritmanın en iyi insan versiyonunu geçemedi. Bununla birlikte, beş girişle, talimat sayısını 46’dan 42’ye düşürerek en iyi insan versiyonunu yendi.

Bu önemli bir hızlanma anlamına gelir. Beş öğelik bir listeyi sıralamak için mevcut C++ algoritması, tipik bir Intel Skylake çipinde yaklaşık 6,91 nanosaniye sürdü. AlphaDev bunu 2.01 nanosaniyede, yaklaşık %70 daha hızlı yaptı.

Uzman: Fazla tahminde bulunma

DeepMind, AlphaDev’in keşfini, AlphaGo’nun 2016’da Grandmaster Lee Sedol’a karşı oynadığı Go maçındaki garip ama başarılı hamlelerinden biriyle karşılaştırıyor. Mankowitz, “Bütün uzmanlar ona baktı ve ‘Bu doğru hareket değil. Yanlış hareket’ dediler.” “Ama aslında doğru hamleydi ve AlphaGo oyunu sonunda kazanmakla kalmadı, aynı zamanda profesyonel Go oyuncularının kullanmaya başladığı stratejileri de etkiledi.”

Sanders etkilendi, ancak sonuçların abartılmaması gerektiğine inanıyor. “Makine öğrenimi tekniklerinin programlamayı giderek daha fazla dönüştürdüğüne katılıyorum ve herkes yapay zekanın yakında yeni ve daha iyi algoritmalar oluşturabileceğini bekliyor” diyor. “Ama henüz orada değiliz.”

İlk olarak Sanders, AlphaDev’in montaj dili programlamasında bulunan talimatların yalnızca bir alt kümesini kullandığına dikkat çekiyor. Mevcut birçok sıralama algoritması, AlphaDev’in denemediği talimatları kullanır. Bu, AlphaDev’i en iyi rakip yaklaşımlarla karşılaştırmayı zorlaştırır.

Aslında, AlphaDev’in sınırlamaları vardır. En uzun algoritması, beş öğeye kadar bir listeyi sıralamak için 130 ifade uzunluğundaydı. AlphaDev, her adımda 297 olası montaj talimatı arasından seçim yaptı. Mankowitz, “297’den fazla talimat ve 130’dan fazla talimattan daha uzun ‘oyunlar’ ile öğrenme yavaşladı” diyor.

Bir noktada yavaş olacak

Bunun nedeni, 297 talimat (veya hamle) ile bile, AlphaDev’in oluşturabileceği olası algoritma sayısının olası satranç oyunlarının sayısından (10120) ve evrendeki atomların sayısı (10 olduğuna inanılıyor)80 yalanlar).

Ekip, daha uzun algoritmalar için AlphaDev’i derleyici yerine C++ yönergeleriyle çalışacak şekilde uyarlamayı planlıyor. Daha az parçalı kontrol ile AlphaDev bazı kısayolları kaçırabilir, ancak yaklaşım daha geniş bir algoritma yelpazesine uygulanabilir.

Sanders ayrıca, özellikle daha uzun algoritmalar için insan tarafından geliştirilen en iyi fikirlerle daha kapsamlı bir karşılaştırma görmek istiyor. DeepMind’a göre bu zaten planlanmış durumda. Mankowitz, AlphaDev’i insan yöntemleriyle birleştirmek ve yapay zekanın sıfırdan başlamak yerine sezgileri üzerine inşa etmesini istiyor.

Son olarak, işleri hızlandırmanın başka yolları da olabilir. Mankowitz, “Bir kişinin bunu yapması için, bu programları gözden geçirmek ve iyileştirmeler bulmak için çok fazla deneyim ve çok fazla saat – belki günler, belki haftalar – gerekir” diyor. “Bu yüzden daha önce denenmedi.”

(vsz)

Haberin Sonu

Oyunun yapay zekası DeepMind hızlı bir şekilde kodlamayı öğreniyor

Bayburtgüzeli

Global Mod