Apple'ın yapay zekası: MM1 dil modeli ne gibi avantajlar sunuyor?

Bayburtgüzeli

Global Mod
Global Mod
Son zamanlarda Apple'ın yapay zeka (AI) planlarına ilişkin açık sorular olduğu kadar çok söylenti de ortaya çıktı. WWDC'nin dahili geliştirici konferansı gibi halka açık katılımlarda Apple şefi Tim Cook, yapay zeka yerine “makine öğrenimi” teknik terimini tercih etti. Ancak artık işler daha da somutlaşıyor: Geçen hafta, Apple'ın kendi uygulamaları için Google'ın büyük Gemini dil modelini lisanslamak isteyebileceğine dair haberler çıktı. Apple, bir araştırma makalesinde ayrıca gelecekte iPhone'larda ve Siri gibi uygulamalarda kullanılabilecek, özel olarak geliştirilmiş bir dil modelleri ailesini de sundu.

Duyuru



MM1 adı verilen model, Apple'ın yapay zeka konusunda aktif olarak araştırmalar yürüttüğünü göstermesinin yanı sıra nispeten küçük boyutu ve yapısı nedeniyle de oldukça ilgi çekici. MM1, hem metin sorgularını hem de görsel talimatları içeren multimodal bir modeldir.

Küçük boyutuna rağmen “rekabetçi performans”


MM1 makalesi büyük ölçüde araştırmacıların modeli geliştirirken elde ettiği bulgulara odaklanıyor. Örneğin, ön eğitim için kullanılan görüntülerin çözünürlüğü, sonraki performans üzerinde en büyük etkiye sahiptir. Veya eğitim verilerinin doğru kompozisyonunun önemli olduğunu. MM1 için Apple, farklı görüntü-metin çiftleri, karışık görüntü-metin verileri (serpiştirilmiş) ve saf metin kombinasyonlarını deniyor. Sonuçta ekip modeli üç, yedi ve 30 milyar parametreye uyarladı. 30B'nin benzer çok modlu modellerle karşılaştırıldığında “tüm kategorilerde rekabetçi performans” elde ettiğini söylüyor.

30 milyar parametrelik model boyutuyla MM1, diğer önde gelen şirketlerin büyük dil modellerinden daha küçük olacaktır: Meta'nın LLaMA-2'si 70 milyara sahip, Alman şirketi Aleph Alpha'nın Luminous modeli 300 milyara genişletilecek ve hatta GPT4 bunu tahmin ediyor. bir trilyondan fazla parametreye sahiptir. Ancak bağımsız gözlemciler MM1 modelinin küçük boyutunda tam tersine herhangi bir dezavantaj görmüyor.

Siri yakında büyük bir AI güncellemesi alacak mı?


Boston Üniversitesi'nden bilgisayar bilimcisi Kate Saenko, Wired dergisine modelin küçük boyutunun, Apple mühendislerinin modelin boyutunu kademeli olarak artırmadan önce farklı eğitim yöntemleri ve iyileştirmeler denemelerine olanak tanıdığını söyledi. Saenko, bunun “fotoğrafları, belgeleri veya diyagramları tanımlayabilen ve bunlarla ilgili soruları yanıtlayabilen” çok modlu bir asistana doğru ilk adım olabileceğini söylüyor.

Apple'ın en önemli ürünü iPhone'a gelince, şu sıralar fonksiyon yelpazesi açısından biraz modası geçmiş görünen mevcut Siri, elbette multimodal bir asistan olarak değerlendirilebilir. Google ve Amazon gibi diğer üreticiler de dil modelleri biçimindeki yapay zekayı sanal asistanlarıyla birleştirmeyi planlıyor. Orta vadede multimodal olarak çalışacaklarını, yani doğrudan akıllı telefon kamerasındaki görüntüleri de işleyeceklerini söylemeye gerek yok.

ChatGPT gibi daha büyük dil modelleri veya Dall-E gibi görüntü oluşturucular bilgi işlem güçleri nedeniyle şu anda bulut erişimi gerektirirken, MM1 gibi daha küçük dil modelleri de teorik olarak iPhone gibi cihazlarda doğrudan çalışabilir. Bunun Apple için iki avantajı olacaktır: Bir yandan, Apple bazı veri koruma sorunlarından kaçınabilir ve mümkün olduğu kadar çok veriyi yalnızca “cihazda” işleme ihtiyacına kendini adamaya devam edebilir, böylece bu veriler erişime karşı korunur. üçüncü kişiler . Öte yandan Apple, teknolojiyi nispeten kolay bir şekilde yüz milyonlarca kullanıcısına çekici hale getirebilir.

Giderek artan dil modelleri hakkındaki kamuoyu tartışmasında, “küçük” yapay zekanın da son derece önemli bir alan olduğu ve verimli modellerin geliştirilmesinin giderek daha önemli hale geldiği – Apple'ın da fark etmiş olabileceği bir şey – hızla unutuluyor. Şirketin MM1'in araştırmasını ürünlerine dahil edip etmeyeceği ve nasıl dahil edeceği henüz belli değil. Ancak artık en azından bir soruya biraz daha iyi yanıt verilebilir: Apple yapay zekadan yoksun değil. Ve belki Tim Cook birkaç hafta içinde WWDC'nin dahili geliştirici konferansında bu iki mektubu gerçekten söyleyecektir.







(Jle)



Haberin Sonu
 
Üst