Meta ayrıca bir protein kehanetine sahiptir

Bayburtgüzeli

Global Mod
Global Mod
Yeni bir yapay zeka (AI), yüksek çözünürlüklü protein yapılarının tahminini önemli ölçüde hızlandırabilir. Mart ortasında, Meta teknoloji grubu (Facebook), Google’ın önceki DeepMind AI “AlphaFold 2.0” Tutma Alfabesinden altmış kata kadar daha hızlı üç boyutlu (3B) şekilleri belirleyebilen “ESMFold” adlı büyük bir dil modelini tanıttı. ESMFold’un yanlış sonuçlar vermesi beklenirken, uzmanlara göre sapmalar nispeten küçük.


Proteinlerin 3 boyutlu yapısı, biyoloji ve eczacılıktaki en önemli bilgilerden biridir. Proteinler, vücudumuzu şekillendiren ve örneğin saç ve tırnaklar için yapı malzemesi, hormonlar ve antikorlar gibi çalışmasını sağlayan küçük biyo-makineler gibidir. Proteinlerin şeklini bilmek, vücuttaki biyolojik işlevlerini aydınlatmaya, ilaç olarak etkilerini belirlemeye ve ilaç hedefleri olarak uygunluklarını test etmeye yardımcı olur. ProGen dahil diğer dil modelleri gibi, ESMFold da 3B yapıyı doğrudan amino asit yapı taşları dizisinden belirler. Hangi amino asitlerin takip ettiği, DNA’nın baz dizilişinde kodlanır. Amino asitlerin dizisi, zincirin üç boyutlu olarak nasıl katlanacağını belirler, çünkü her bir amino asit, birbirini çeken veya iten farklı yüklere sahip farklı yan gruplar taşır.

Dil kalıbı, amino asit dizilerindeki kalıpları bulur


Bununla birlikte, dil modelinin amino asitlerin birbirleriyle nasıl etkileşime girdiğini bilmesi gerekmez. Bunun yerine, büyük protein veritabanlarından 138 milyon protein içeren eğitim seanslarında, belirli yapılarla ilgili amino asit dizilerinde kalıplar bulmayı öğrenmişti. AI ayrıca amino asit zincirlerindeki boşlukları doldurmayı ve eksik pozisyonlar için en olası amino asidi belirlemeyi de öğrendi.

Yeni olan şey, ESMFold’un, protein yapısını benzerliklerden belirlemek için artık çalışılan amino asit dizisini bilinen bir 3D yapıya (çoklu dizi hizalaması, MSA) sahip diğer amino asit dizileriyle karşılaştırmasına gerek kalmamasıdır. Forschungszentrum Jülich’te ‘Hesaplamalı Yapısal Biyoloji’ araştırma grubuna başkanlık eden Gunnar Schröder, “ESMFold’un çok ilginç bir yönü, bu bilginin artık açıkça kullanılmaması, bunun yerine dil modelinden dolaylı olarak öğrenilmiş olmasıdır” diyor. Barselona Süper Hesaplama Merkezi’nden Alfonso Valencia, “Harika görünüyor,” diye ekliyor. “Bilinen proteinlerdeki amino asit dizisinin mantığı, belirli bir işlevi yerine getirdikleri belirli bir yapıya sahip olmalarına yol açan evrimsel bir sürecin sonucudur.”

3B yapıların tahminlerini içeren ücretsiz erişilebilir veritabanı


Google’ın Washington Üniversitesi tarafından geliştirilen “AlphaFold” ve “RoseTTAFold”, yukarıda belirtilen “çoklu dizi hizalamasına” dayanmaktadır. Al’ler, incelenecek yeni proteinin amino asit dizisini, bilinen bir 3D yapıya sahip proteinlerin dizileriyle karşılaştırır. Benzer yerlerde, aynı sırayla birçok benzer dizi bulunursa, bu, proteinler arasında yapısal veya işlevsel bir ilişkiyi gösterir. Bundan, artık atomik hassasiyetle incelenen proteinin 3 boyutlu yapısı hakkında sonuçlar çıkarılabilir. Geçen yıl AlphaFold, bilim tarafından bilinen hemen hemen her protein için – hayvanlardan, bitkilerden ve diğer organizmalardan yaklaşık 200 milyon protein – 3 boyutlu yapı tahminlerini derlediği, ücretsiz olarak erişilebilen bir veritabanı yayınladı. O zamanlar, bu yapıların yalnızca 190.000’i deneysel olarak, yani X-ışını kristalografisi veya kriyo-elektron mikroskobu kullanılarak belirlenmişti.


Alexander Rives liderliğindeki ESMFold araştırmacıları “Science” dergisinde yazdığı gibi, artan hız sayesinde çok daha fazla protein yapısını tahmin edebildiler. Meta AI, AlphaFold veritabanından üç kat daha fazla yapı olan 617 milyon yüksek çözünürlüklü 3D yapı simülasyonu içeren sözde “ESM Metagenomics Atlası”nı yayınladı. Araştırmacılar kendi ifadelerine göre yaklaşık 225 milyonu “yüksek güvenilirlikle” tahmin edebildiler. Bu da Valencia’yı ikna etti. Tam veri setinin sonuçları, diğer yöntemlerle elde edilenlerden kalite olarak biraz daha düşük olsa da, en azından bu 225 milyon yapı için karşılaştırılabilir.

ESMFold yönteminin ikinci bir büyük avantajı da önceden bilinmeyen proteinlerin yapısının çevresel örneklerden tahmin edilebilmesine izin vermesidir. Ayrıca, ‘yeni yöntem, önceki yöntemlerin kapsamı dışında olan ve biyomedikal uygulamalar için doğrudan etkileri olan nokta mutasyonlarının sonuçlarının tahminine doğrudan uygulanabilir’ diye devam ediyor Valencia.



MIT Technology Review'dan daha fazlası



MIT Technology Review'dan daha fazlası




(mak)



Haberin Sonu
 
Üst