Co umí AlphaFold 3, nástroj na predikci proteinů?

TLDR: Umí toho víc než dřív, ale neznamená to, že nemá řadu omezení různého charakteru. Zdroj na konci.

Možná jste si všimli, že se na X objevily ve středu 8.5. informace o novém AlphaFoldu 3 – AI modelu, který dle firmy DeepMind „předpovídá strukturu a interakce všech molekul života”. Pojďme se mu podívat na zoubek.

Proč již třetí?

Začněme otázkou, proč by nás to mělo vlastně zajímat – no, především proto, že z těch molekul jsme složeni a že umí být pěkně rozmanité a my vesměs chceme vědět, jak s nimi pracovat, či zjistit, co dělají a jak je můžeme využívat.

Předchozí verze AlphaFold 2 nám do této oblasti ukázala cestu – dosáhla modelů kvality podobné, jakou poskytují experimentální metody (Xray krystalografie, CryoEM, či NMR), kterými podobné molekuly sledujeme už přes 50 let v PDB – máme jich přes 219tisíc.

AlphaFold2 nám ale poskytnul možnost jít dál – v podstatě ke všem známým proteinům – a to díky dvěma krokům – otevřenému kódu, který umožňoval lokální instalace, v ČR např. na Metacentru či pomocí usergalaxy. Další možností je využití Alpha FoldDB na PDBeurope, kde se postupně doplňovaly struktury známých proteinů nejprve modelových organismů a posléze ověřených proteinů, pro které máme sekvence v databázi UniProt – těch už je dnes přes milion.

Alee slabostí AlphaFold2 byl fakt, že předpovídal jen struktury proteinů samotných, nikoliv jejich úpravami posttranslačními modifikacemi, či interakcemi s kofaktory, ligandy, ionty, membránami, nebo nukleovými kyselinami.

Částečně to nahrazovaly akademické nástroje. Pro ligandy a hlavně kofaktory skvěle funguje např. AlphaFill, pro membránové proteiny pak třeba TmAlphaFold Transmembrane Protein Structure Database, pro komplexy pak AF2-Multimer.

Ale ligandy prostě chyběly, zvlášť když jeden z úspěšných konkurenčních týmů. UW Protein Design přišel s programem RoseTTAFold-AA, která do návrhu proteinů přidala možnost interagujících látek – NA, kovů, ligandů, či kovalentních modifikací. A teď tedy přichází AlphaFold3 a slibuje vylepšení predikcí interakcí proteinů a dalších molekul.

Zdroj: Netflix
Zdroj: Netflix

Jak na to jde?

AF2 používal koevoluční závislosti v MSA kombinované se strukturními templáty a to vše spojené dohromady metodou deep learning, která pak tyto data použila k tvorbě modelu proteinu. AF3 přidal difuzní modul k tvorbě interakcí.

Difuzní modely se už v predikcích struktur objevily při návrzích nových proteinů – např. Chroma umí vytvořit protein podle specifikovaných požadavků – třeba, aby vypadal jako písmena abecedy.

Zdroj Ingraham et al.

AlphaFold3 tedy tuto technologii přináší také a honosí se tím, že je lepší, než předchozí verze. Jenže tady se ukrývá háček, který docela rozhýbal vědeckou komunitu – AF2 má otevřený kód a to umožnilo na něm dále stavět. AF3 přichází jen s webserverem.

Ten umožňuje pouštět jen 20 jobů denně do s omezením na 5000 tokenů. A také zřejmě filtruje některé virální sekvence (např. pro Ebolu). I výběr ligandů je omezený na 19 biologických molekul (ATP,hem..).

Ale má intuitivní rozhraní, které lze snadno používat. A to vědci rádi.

Zdroj: DeepMInd
Zdroj: DeepMInd

Evoluce, ne revoluce

A tak už se ukázalo, že predikce jsou rychlejší než s AF2. A jsou minimálně stejně dobré. A to i pro komplexy s peptidy (což je klíčové např. pro návrh protilátek). Ukázal jsem, že lze odhalovat membránové proteiny a pozicování membrán pomocí mastných kyselin, které jsou mezi ligandy.

Výsledky s nukleovými kyselinami už tak veselé nejsou. ale to není zas až tak překvapivé – nukleové kyseliny se zatím nedaří predikovat moc nikomu.

Zajímavé chování poskytují ionty – docela pěkně odpovídají známé fyzice elektrolytů a zesilují micelizaci lipidů, případně mění konformace proteinů u tzv. switch proteinů. Post translační modifikace zřejmě fungují u glykosylací, ale už nijak zázračně u fosforylací.

Takže – je AlphaFold3 opět zázračný průlom, jakým byli jeho předchozí verze? AF1 byl ve své době taky nejlepší, ale uzavřený kód. Také AF3 je velmi dobrý, ale značně omezený v otevřeném použití. Článek hovoří o možnostech použití pro návrh léčiv, ale ty nejsou veřejně dostupné.

Sdíleno se svolením z vlákna zde.

[Karel Berka & ELIXIR CZ & PřF UPOL, LL]

Vědátor vzniká v dílně spolku studentů a popularizátorů vědy UP Crowd za podpory MUDRstart, který tvoří přípravné testy pro studenty vysokých škol. Krom různých autorů projekt jako šéfredaktor vede Ladislav Loukota – jeho kontaktní mail je vedatororg@seznam.cz

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Reklama