Açık kaynaklı yapay zeka: teknoloji endüstrisi neden bunun ne olduğunu tartışıyor

Bayburtgüzeli · 6 Nis 2024

Yapay zekanın yeni moda sözcüğü “açık kaynak” gibi görünüyor. Meta ve Google gibi şirketler açık kaynak dil modelleri geliştirmek zorunda olduklarını hissederken Elon Musk, GPT-4 ve haleflerini yayınlamak istemediği için OpenAI'ye dava açıyor. Aynı zamanda giderek daha fazla yapay zeka girişimi ve ünlüsü kendilerini açık kaynak savunucusu olarak konumlandırıyor. Temel sorun: Hiç kimse “açık kaynaklı yapay zeka”nın ne anlama geldiği konusunda hemfikir değil ve bu, alanın geleceği ve belki de tüm insanlık için hayati öneme sahip olabilir.

Duyuru

Açık kaynaklı yapay zeka, ilk bakışta herkesin ileri teknolojilerin geliştirilmesine katılabileceği bir gelecek vaat ediyor. Bu, inovasyonu hızlandırabilir, şeffaflığı artırabilir ve kullanıcılara, yakında hayatımızın birçok yönünü değiştirebilecek sistemler üzerinde daha fazla kontrol sağlayabilir. Peki bu ne anlama geliyor? Bir yapay zeka modelini açık kaynak yapan nedir ve ne yapmaz? Teknoloji endüstrisi bir tanım üzerinde mutabakata varıncaya kadar, güçlü şirketler konsepti kendi ihtiyaçlarına uyacak şekilde kolayca değiştirebilecek ve hatta günümüzün büyük oyuncularının hakimiyetini sınırlamak yerine pekiştiren bir araç haline gelebilir.

Açık Kaynak Girişimi (OSI) bir nevi hakem görevi görüyor. Açık kaynak düşüncesinin koruyucusu olarak kabul edilir. 1998 yılında kurulan kar amacı gütmeyen kuruluş, yazılımın açık kaynak olarak kabul edilip edilemeyeceğini belirleyen, geniş çapta kabul gören bir dizi kural oluşturdu. Grup yakın zamanda araştırmacılar, avukatlar, politikacılar, aktivistler ve Meta, Google ve Amazon gibi büyük teknoloji şirketlerinin temsilcilerinden oluşan 70 kişilik bir ekip oluşturdu. Birlikte açık kaynaklı yapay zeka için işe yarar bir tanım geliştirmek istiyorlar.

Açık kaynak topluluğu çok çeşitlidir. Küçük hacktivistlerden Fortune 500 şirketlerine kadar neredeyse tüm seviyeleri kapsıyor. OSI CEO'su Stefano Maffulli, genel ilkeler üzerinde geniş bir fikir birliği olmasına rağmen “şeytanın ayrıntıda gizli olduğu”nun giderek daha açık hale geldiğini söylüyor. Ergo: Birbiriyle çatışan bu kadar çok çıkar varken herkesi tatmin edecek ve aynı zamanda daha büyük şirketlerin adil oynamasını sağlayacak bir çözüm bulmak kolay bir iş değil. Açık bir tanımın bulunmaması, şirketlerin bu terimi benimsemesini ve genişletmesini engellemedi.

Kafa karıştırıcı kriterler

Örneğin geçen yılın temmuz ayında Meta, şirketin açık kaynak olarak tanımladığı Llama 2 modelini ücretsiz olarak erişilebilir hale getirdi ve o zamandan beri aynı şekilde başka birçok yapay zeka aracını da piyasaya sürdü. Meta Legal'in Yapay Zeka, Açık Kaynak ve Lisanslamadan Sorumlu Başkan Yardımcısı Jonathan Torres, “OSI'nin yapay zekayı açık kaynak olarak tanımlama çabalarını destekliyoruz” dedi. “Dünya çapındaki açık kaynak topluluğunun yararına” bu sürece katılmaya devam etmeyi sabırsızlıkla bekliyorlar. Bu, yıllar geçtikçe amiral gemisi modelleri hakkında giderek daha az teknik ayrıntı ortaya çıkaran ve her zaman güvenlik kaygılarını öne süren rakibi OpenAI ile tam bir tezat oluşturuyor. Bir sözcü, “Güçlü yapay zeka modellerini ancak faydalarını ve risklerini dikkatlice değerlendirdikten sonra yayınlıyoruz” dedi. Bu, istismar olasılıkları ve toplum üzerindeki etkileri için de geçerlidir.

Stability AI ve Alman şirketi Aleph Alpha gibi diğer büyük AI şirketleri de açık kaynak olarak tanımlanan modelleri piyasaya sürerken Hugging Face, ücretsiz olarak kullanılabilen AI modellerinden oluşan geniş bir kütüphane sunuyor. Google, Gemini ve PaLM 2 gibi en güçlü modellerini kapalı bir şekilde sunuyor ancak artık Gemma'yı da ücretsiz olarak erişilebilir hale getirdi. Metas Llama 2 ile rekabet edecek şekilde tasarlandı. Ancak Google, Gemma'yı “açık kaynak” olarak adlandırmıyor, internet devine göre model “açık”.

Burada açıklığın ne anlama geldiği konusunda önemli bir anlaşmazlık var. Öncelikle hem Llama 2 hem de Gemma, kullanıcıların yapabileceklerini sınırlayan lisanslarla geliyor. Bu, açık kaynak ilkelerinin temel bir çelişkisidir: OSI tanımının temel maddelerinden biri, kullanım senaryolarına dayalı kısıtlamaların uygulanmasını yasaklamaktadır. Ve bu koşullara bağlı olmayan modeller için bile kriterler oldukça belirsiz. Açık kaynak kavramı sonuçta geliştiricilerin yazılımı kısıtlama olmadan kullanabilmesini, kaynak kodunu inceleyebilmesini, değiştirebilmesini ve dağıtabilmesini sağlamak için geliştirildi. Ancak yapay zeka sistemleri temelde farklı çalışıyor. Maffulli, açık kaynak sektöründeki temel kavramların bu nedenle yapay zekaya kolayca aktarılamayacağını söylüyor.

En büyük engellerden biri günümüzün yapay zeka modellerinde yer alan çok sayıda teknik bileşendir. Normal yazılımla uğraşmanız gereken tek şey, temeldeki kaynak kodudur. Ancak hedefe bağlı olarak bir yapay zeka modeli üzerinde çalışmak, önceden eğitilmiş modele, onun eğitim verilerine veya bu verilerin ön işlenmesi için kaynak koduna erişimi içerebilir. Ayrıca eğitim sürecinin kendisi için kod, modelin arkasındaki mimari ve daha birçok ince ayrıntı da vardır. Maffulli, “Genel bir vizyon ve modellerde anlamlı bir değişiklik için hangi bileşenlerin gerekli olduğu yoruma bırakılmıştır. Ancak hangi temel özgürlükleri veya hakları kullanmak istediğimizi belirledik” diyor. Ama uygulama henüz net değil.

Bütün bir ekosistem

OSI şefi, yapay zeka topluluğunun geliştiricilerin “normal” açık kaynaklı yazılımdan elde ettiği faydaların aynısını elde etmek istemesi durumunda bu tartışmanın çözülmesinin hayati önem taşıyacağını söylüyor. Bu, terimin anlamı konusunda geniş bir fikir birliğine dayanmaktadır. “Bir [Definition]Sektörün büyük bir kısmı tarafından saygı duyulan ve kabul edilen , netlik yaratıyor” diyor. Ve netlik, bu açık kaynak düzenlemelerine uyumda daha düşük maliyetler, daha az anlaşmazlık ve teknoloji konusunda ortak bir anlayış anlamına geliyor. Sorun: Muhtemelen yeterli, hayır. “En büyük kritik nokta verilerdir. Tüm büyük yapay zeka şirketleri, üzerinde eğitim aldıkları veri kümeleri olmadan, önceden eğitilmiş modelleri piyasaya sürdü.” Açık kaynaklı yapay zekanın daha katı bir tanımını savunanlar için bu, kullanımını büyük ölçüde sınırlıyor. Hatta bazıları bunun artık açık olmadığını söylüyor. kaynak.

Diğer topluluk üyeleri, verilerin basit bir açıklamasının genellikle bir modeli anlamak için yeterli olduğunu savunuyor. Değişiklik yapmak için onu sıfırdan eğitmenize gerek yok. Tamamlanan modeller, ince ayar olarak bilinen bir süreç aracılığıyla zaten düzenli olarak ayarlanıyor; burada bazen daha küçük, çoğunlukla uygulamaya özel bir veri kümesi üzerinde daha fazla eğitiliyorlar. Açık kaynaklı AI şirketi Ainekko'nun CEO'su ve OSI sürecine dahil olan Apache Yazılım Vakfı'nın hukuk işlerinden sorumlu başkan yardımcısı Roman Shaposhnik, Metas Llama 2'nin buna iyi bir örnek olduğunu söylüyor. Meta yalnızca önceden eğitilmiş bir model yayınlamış olsa da, gelişen bir geliştirici topluluğu modeli indirdi, özelleştirdi ve ardından değişiklikleri başkalarıyla paylaştı. “İnsanlar bunu her türlü projede kullanıyor. Lama 2'nin etrafında koca bir ekosistem var” diyor. “O halde onu yeniden tanımlamamız gerekiyor. Belki 'yarı açık'tır?”

Orijinal eğitim verileri olmadan bir modelin yerleştirilmesi teknik olarak mümkün olabilir. Ancak aynı zamanda OSI tanımı üzerinde çalışan kar amacı gütmeyen Open Future'ın araştırma direktörü Zuzanna Warso, önemli bir yazılım parçasına erişimi sınırlamanın açık kaynak ruhuna uygun olmadığını söylüyor. Ayrıca kişinin, bir modeli hangi bilgi üzerine inşa edildiğini bilmeden daha ayrıntılı olarak inceleme özgürlüğüne sahip olup olmadığı da sorgulanabilir. “Bu, tüm sürecin çok önemli bir parçası” diyor. “Açıklığı önemsiyorsak eğitim verilerinin açıklığını da önemsemeliyiz.”

Haberin Sonu

Açık kaynaklı yapay zeka: teknoloji endüstrisi neden bunun ne olduğunu tartışıyor

Bayburtgüzeli

Global Mod