AI, laboratuvar testlerinde yeni bakteri öldürücü proteinler tasarlar
ProGen adlı bir yapay zeka (AI), laboratuvar testlerinde patojenleri başarıyla öldüren yeni antibakteriyel proteinler tasarladı. Tasarlanan proteinler, lizozim enzim grubuna dayalıdır. Doğal modeller, bakterilerin hücre duvarını deler ve gözyaşı, tükürük ve anne sütünde bulunur.
ABD’de Salesforce AI Research tarafından tasarlanan enzim varyantları doğada mevcut değildir. Bununla birlikte, biyolojik modelleriyle büyük yapısal benzerlikleri var, Salesforce AI Research geliştiricileri, Kaliforniya biyoteknoloji şirketi Profluent ve San Francisco’daki California Üniversitesi’nin işbirliği ortaklarıyla birlikte “Nature Biotechnology” dergisinde yazıyorlar.
Yeni üretilen bir milyon lizozim arasından, sentez için özellikle doğaya benzer 100 amino asit dizisi seçtiler ve bunların 90’ını daha da test ettiler. çalışmada kullanılan doğal proteinler (90 üzerinden 53). Özellikle etkili iki aday enzim de canlı Escherichia coli bakterisini öldürdü.

protein katlama sanatı
Enzimler gibi proteinler de yüzlercesi bir inci dizisinde birbirine bağlanmış toplam 20 farklı amino asidin kombinasyonlarından oluşur. Amino asitler farklı yan gruplar ve yükler taşıdıkları için, sıraları zincirin üç boyutta nasıl katlanacağını belirler. Hangi amino asitlerin birbirini çektiğini veya ittiğini belirler. Nihai şekil daha sonra proteinlerin işlevini ve etkinliğini belirler.
Bununla birlikte, yeni lizozimleri tasarlamak için Salesforce’un derin öğrenme dil modelinin, amino asitlerin hangi fizikokimyasal özelliklere sahip olduğunu ve birbirleriyle nasıl etkileşime girdiklerini bilmesi gerekmiyordu. Bunun yerine, ekip lideri Nikhil Naik’e göre, metin üreten ve makaleler gibi proteinlere bakan yapay zekalara benzer şekilde çalışıyor.

Nikhil Naik, Salesforce’ta AI araştırmasına liderlik ediyor.
(Resim: Salesforce Yapay Zeka Araştırması)
Naik, makaleler için bir dil modelinin şiir, siyaset ve spor gibi konulardaki metinlerle eğitileceğini söylüyor. Naik, “Yani onlardan tamamen yeni bir spor metni yazmalarını isteseydiniz, sonuç büyük olasılıkla sporla ilgili olurdu” diyor. Tipik kelime dağarcığı, bir spor makalesi ile bir siyasi makale arasındaki farkı yaratır.
Dil modelini amino asitler üzerinde eğitin
ProGen’de de durum aynı. Naik, “Yeni bir şey üretirse, ilgilendiğiniz ve belirttiğiniz enzim aileleriyle aynı özelliklere sahip olacaktır” diye açıklıyor Naik. Ekibi, dil modelini beş farklı lizozim ailesinden yaklaşık 56.000 amino asit dizisiyle eğitmiş ve ona hangi özellikleri öğrettiğini öğretmişti. kısa amino asit dizileri, hangi aile için ve zincirin hangi pozisyonlarında tipiktir.

(Resim: Salesforce Yapay Zeka Araştırması)
Bundan önce, 19.000’den fazla aileden 280 milyon proteinin amino asit dizileriyle dil modelini daha da kapsamlı bir şekilde eğitmişlerdi. Her diziye ayrıca “antibakteriyel” ve lizozim aile tipi gibi protein özellikleri için sınıflandırma etiketleri (etiketleri) atanmıştır. Sonunda, yapay zekanın uygun amino asit zincirlerini doğrusal olarak yeniden bağlaması için yalnızca birkaç etiket özelliği gerekiyordu. ProGen, bir sonraki en olası amino asidi tahmin etmek için artan diziyi kullandı.
İlaç geliştirmek için kullanılır
ProGen yöntemi, başka ilaçların geliştirilmesi için de faydalı olabilir. Örneğin, AI Research, romatoid artrit ve multipl skleroz ile savaşmak için ilaç geliştirmek için zaten kullanıldığını söylüyor.
Yönetmen Naik’e göre, diğer protein odaklı AI’lardan temel farkı, ProGen’in amino asit dizilerini yalnızca okuyabilmesi değil, aynı zamanda yeniden yazabilmesidir. Geçen yıl, Google’ın Alphafold AI’sı, bilimin bildiği neredeyse tüm 200 milyon proteinin 3D yapısını yalnızca amino asit dizisinden tahmin etti. Yine AI, protein katlanmasının fiziksel yasalarını bilmiyordu. Sadece yaklaşık 200.000 protein yapısı deneysel olarak doğrulanmıştır. Bu, proteinlerin karmaşık sentezini ve kristalografik yapı belirlemesini gerektirir.
Diğer ekipler, istenen şekil ve özelliklere sahip bazen çok büyük proteinler için tasarımlar oluşturmak için üretken AI’lar olarak sözde difüzyon modellerini kullanır. İyi bilinen üç boyutlu protein yapılarına dayanırlar. Boston merkezli start-up Generate Biomedicines geçen Kasım ayında bir program başlattı renk şirketin “biyolojinin DALL-E 2’si” olarak adlandırdığı tanıtıldı. Pikselleri manipüle etmek yerine, rastgele amino asit zincirlerini alır ve bunları istenen özelliklere sahip yapılar halinde birleştirir. Bunu yaparken, tabiri caizse net bir resim ortaya çıkana kadar verilerden istenmeyen “gürültüyü” kaldırır.
Buna paralel olarak, biyolog David Baker liderliğindeki Washington Üniversitesi’nden bir ekip, RoseTTAFold Difüzyon adlı benzer bir program geliştirdi. İkinci bir yapay zekanın yardımıyla, nihai yapıyı tahmin etmek için belirli protein parçalarının nasıl bir araya geldiği hakkındaki bilgileri kullanır.

(vsz)
Haberin Sonu