Rok ve vědě: Strojová učení predikují proteiny, kreslí obrazy, píšou úkoly

TLDR: Strojové učení letos nejvíce prorazilo do mainstreamu za posledních mnoho let. Jeho největší kousek ale možná neznáte – také totiž za dva roky odemklo možnosti rychle a (většinou) přesně odhalit strukturu proteinů – základních makromolekul, na nichž funguje život. Oznámení tuna.

Proteiny jako nahé

Věnujme se nejprve tomu nejvýznamnějšímu ze světa biochemie. Byla to společnost DeepMind, která v roce 2020 představila takzvaný AlphaFold – nástroj, který do roku 2022 předpověděl struktury téměř všech známých proteinů, které známe.

Ve své databázi od letošního léta nabízí více než 200 milionů proteinů pro každého zdarma. Sotva dva roky od oznámení AlphaFold tak dosáhl fenomenálního úspěchu.

Vědci již léta věnují čas a energii tomu, aby pochopili, jak jsou proteiny strukturovány. Proteiny alias komplexní makromolekuly jsou v zásadě základní stavební kostičky provádějící mechanismy – i slavná DNA je v zásadě sérií plánů proteinů. Poznání struktury proteinů nezbytných pro život bylo proto úkolem, který biologie považovala za jednu z „velkých výzev“, na které se pracovalo postupně po dekády.

A pak přišla umělá inteligence. V loňském roce společnost DeepMind zveřejnila zdrojový kód AlphaFold a na svých stránkách AlphaFold Protein Structure Database zpřístupnila struktury 1 milionu proteinů, včetně téměř všech proteinů v lidském těle. Ten byl vytvořen společně s Evropskou laboratoří pro molekulární biologii. Ale pozor, tím nekončíme – vlastně tím teprve začínáme

No schválně se zamyslet! Zdroj: Public Domain
No schválně se zamyslet! Zdroj: Public Domain

A co ty maintreamové?

Databáze je denně aktualizována, a tak se k letošnímu létu rozrostla na 200 milionů proteinů, které jsou dostupné komukoli. Takto rozsáhlá databáze může (a v dnešní době již slouží) vědcům k pochopení různých nemocí, a tím vede k inovacím v objevování léků a pokroku v biologii.

Ale co ty slíbené další algoritmy? Nejspíše jste od léta slyšeli o umělých inteligencích, které „umějí kreslit“ anebo „umějí psát„. Tyto tzv. „generativní strojová učení“ (nebo pro zjednodušení generativní AI, čili GAI) letos skutečně prorazily do světa běžné veřejnosti, a otestovat si je může každý!

I když na jejich vývoj docházelo postupně několik posledních let, jejich letošní nárůst byl doslova raketový. Ještě v březnu se mluvilo o tom, že GAI bude využíván ve velkém „do konce dekády„. Co na jaře vypadalo jako sci-fi, by o půlrok později už nikdo nezpochybňoval jako reálnou možnost…

Budoucí úskalí

To ale neznamená, že příchod GAI bude univerzální a snadný. V první řadě GAI jenom variuje jiné existující výtvory. Umí nakreslit leccos, ale inspiruje se lidmi. A s tím se pojí jak nutná redukčnost z hlediska stylu, tak především rizika pro poručování autorských práv.

Je pravděpodobné, že v nejbližších měsících a letech budou různé GAI čelit mnoha soudním přím – první se již objevila. Bude třeba nadefinovat zcela nové rámce, jak zacházet s autorskými právy lidí, jejichž duševní vlastnictví slouží pro tréning a „inspiraci“ strojových učení.

A není vůbec jasné, jestli se toho dnešní GAI projekty dožijí. Kdo by konec konců v roce 2000 čekal, že budoucnost hudby na internetu se bude jmenovat Spotify a nikoliv Napster…

Technologie GAI ale nikam neodejde, a ačkoliv ji v budoucnu dost možná budeme používat o dost jinak než tomu bylo letos, jde o něco, co tu s námi v nějaké podobě skoro zcela jistě zůstane. A s tím se budou muset chca nechca smířit programátoři, grafici a konec konci i pisálci, jako jsem já.

[Nina Kadašová, Ladislav Loukota]

Vědátor vzniká v dílně spolku studentů a popularizátorů vědy UP Crowd za podpory MUDRstart, který tvoří přípravné testy pro studenty vysokých škol. Krom různých autorů projekt jako šéfredaktor vede Ladislav Loukota – jeho kontaktní mail je [email protected]

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Reklama