Strojové učení napomohlo zjistit, jaké nové materiály stojí za to zkoumat

TLDR verze: Vědátoři dali do kupy stovky materiálových studií a nechali strojové učení, aby zjistilo, které matroše zkoumat, abychom získali kýžené vlastnosti. Studie tu

Jáchyme, hoď ho do zdroje

Umělá inteligence a strojové učení je stále významnějším vynálezem! Ačkoliv si příběhy scifáren od inteligentních strojů slibovaly hlavně nové možnosti, jak vraždit lidi, zatím mašiny nabízejí spíše novinky jiného druhu. Od implikací po vzdělávání přes nové možnosti v medicíně až po možnost vykydlit Protossy ve StarCraftu mění algoritmy lecasco. Nyní se objevuje i studie, podle které by nesupervizovaný samoučící algoritmus mohl přinést i významné novinky do toho, jak vůbec probíhá věda.

Autoři pod vedením Vahe Tshitoyana se ve své práci inspirovali docela známou technikou Word2vec, která přiřazuje slovům mnohadimenzionální vektory. Takové vektory mají kromě toho, že to jsou vektory (a tak se na ně dá aplikovat všechny možné znalosti, které o vektorech máme) i něco, co by se dalo nazvat jako „podobnost“. Vektory slov „černá“ a „bílá“ budou mít zřejmě jednu souřadnici prakticky stejnou, protože obě slova jsou barvy, ale protože reprezentují protikladné, pak jinou souřadnici naopak velmi rozdílnou.

Důsledkem toho je relativně snadná kvantifikovatelnost. V takovém vektorovém prostoru lze (nakolik je pro běžného smrtelníka o IQ nižším než má 9000 HALů velmi obtížně představitelné) možné pozorovat, že vektory antonym jsou si blízká asi jako Dave Lister a Usain Bolt. Obdobně slova jen velmi málo se lišící, jsou si vektorově velmi blízká. Nojo, ale co s takovým bazmekem?

Materiáloví inženýři se rozhodli tuto techniku aplikovat na chemické vzorce v abstraktech tisíců a tisíců článků z jejich oboru. Jak sami uznávají, nových materiálů dnes vzniká tolik, že pomalu přestává být v moci člověka sledovat všechny novinky v oboru. Vzali tedy publikace z různých materiálových kategorií (polovodiče, fotovoltaické, piezoelektrické, kvantově vodivé a podobně) a z jejich abstraktů si nasbírali jaké látky se v každé z publikací studují.


A materiálovci nebudou mít co škrábat

Tím zaprvé získali docela krásnou vizualizaci toho, jaké prvky či jejich sloučeniny se ukazují jako zajímavé ke studiu patřičných kategorií. Organické látky obsahují především uhlík, v bateriích se hodně pracuje s Lithiem a tak dále. A zadruhé získali také přehled o tom, jak moc se některá konkrétní látka studuje.

Je tak možné vzít hodně studovanou látku (protože o té můžeme tvrdit, že má zajímavé vlastnosti) a zaměřit se na některou s podobnými vlastnostmi, která ale zatím tak moc studována nebyla. A k tomu se díky vektorům dá použít strojový algoritmus.

Stroj: Vahe Tshitoyan et al.

Aby to vědátoři udělali ještě napínavější, publikace si rozdělili do roků – od roku 2000 do roku 2018 a sestavili si vizualizaci pro každý rok. Poté provedli meziroční srovnání. Ukázalo se, že velká část látek, které vytipovali jako kandidáty na možný další výzkum BYLA V DALŠÍM ROCE SKUTEČNĚ ZKOUMÁNA mnohem více. A nejen to – především se ukázali, zdali se u ní při zkoumání prokázaly žádané vlastnosti. U materiálů vypíchnutých algoritmem byla prostě vyšší úspěšnost.

Analýza tedy ukázala, že pokud se objeví látka se zajímavými vlastnostmi, začne se v dohledné době studovat i látka ji podobná. Protože – co kdyby ty vlastnosti měla ještě o chlup lepší? Do budoucna tak tento proces může přinést poměrně efektivní způsob, jak vybírat další látky ke studiu. Přeci jen ve vizualizacích bylo patrné značné množství látek, které se zdály být slepou uličkou výzkumů.

Stroj: Vahe Tshitoyan et al.

Užitečný pomocník

Netvrdím že strojové učení materiálové inženýry z masa a krve pošle do… tenkých vrstev. Ale v kombinaci s automatizovaným prováděním testů může ušetřit vědcům nudné drobné upravování parametrů látek a jejich testování. Pořád je zde ruka vědy, protože podobná látka s lepšími vlastnostmi ještě pořád neznamená nejlepší z nejlepších. A tak stejně bude potřeba mít v labu někoho kdo přijde a řekne: „Dost bylo Lithia, budoucnost patří Aluminiu!“

Nebo tak něco. #lokální_maximum_nemusí_být_globální

Na každý pád by aplikace podobné srandy mohla být výrazným pomocníkem vědy nejen materiálové. Pokud se najdou podobné algoritmy pro jiné obory, mohlo by to ušetřit finance na výzkum, nakopnout studium vstříc lepším výsledkům a vůbec všeobecné utopii! Dost bylo Terminátorů, konečně přišel čas obléknout mašiny do bílých plášťů a bezpečnostních brýlí.

[MJ, TK, LL]

MJ popsal i to, proč poslední řešení Reimannovy hypotézy nejspíše vyřešilo kulové. 

Vědátor vzniká v dílně spolku studentů a popularizátorů vědy UP Crowd za podpory MUDRstart, který tvoří přípravné testy pro studenty vysokých škol – podpořte i vy drobákem mojí snahu informovat o vědě věčně & vtipně a přispějte mi v kampani na Patreonu.

A sledujte mojí snahu případně i na Facebooku či YouTube!

Diskuze