Umělé inteligence dovedou zostřit i velmi rozostřené snímky

TLDR: Spolupráce dvojice algoritmů dovede odhadnout, čí obličej vězí i na tom nejvíc rozmazaném snímku. Nejde sice o skutečné „zostřování“, ale spíše „domýšlení si“ obrázků, jedná se ale o krok kupředu v dané technologii. Studie tu.

Zoom it more!

Odstranění šumu z fotek je v televizních kriminálkách tak prostě, že se už stalo předmětem pro řadu vtipů. Možná však jejich autorům ještě zmrzne úsměv na tváří – dorazila totiž již několikátá práce, která překvapivě dobře zvládla – zjednodušeně řečeno – rozpixelovaný snímek zostřit do ostré tváře! Není to něco, čím by se měli v dohledné době asi usvědčovat zločinci. Ale nynější práce týmu Sachita Menona z Duke University k aplikovatelnosti rozhodně udělala krok kupředu.

Možná si pamatujete, že o podobném výzkumu jsem psal už, wow, víc jak tři roky nazpět! Také tentokrát je princip podobný, ale došlo na jistý pokrok v mezích zákona. Takže strojové učení může z rozkostičkovanýho obrázku vyplivnout obrázek v až 64x vyšším rozlišení, tj. 8x vyšší a širší než starší práce.

Další novinkou je trochu jiný přístup. Starší umělí inteligence v zásadě tipovala nejpravděpodobnějších pixelů tak, aby „seděly“ do původního rozkostičkovanýho obrázku. To celé s tím, že se sít učívala nad reálnými obrázky lidí. Autoři nové práce e namísto toho využili hned dvou umělých inteligencí, které se vzájemně doplňovaly.

Jedna na základě naučených obličejů produkuje „náhodné“ obličeje neexistujících lidí (podobně jako tady). Výsledky přitom sype do druhé umělé inteligence, která si z nich vybírá ty, které sedí na vstupní, rozkostičkovaný obrázek.

Zdroj: Duke University, Kriminálka Miami/CBS

Znovu a lépe

Druhá AI pak v zásadě jen slepě vybere a vyplivne jeden obrázek z těch navržených. Osobně mi přijde smysluplnější, kdyby druhá AI třeba současně s tím korigovala tu první a říkala ji věci typu: „takovýhle ne, tenhle má moc velkou pusu“, „ne, to má bejt blondýn(a)“). Ale to nejspíše bude až na budoucích studiích, které kooperaci mezi mašinami poladí.

Prozatím se zdá, že strojová učení mezi obrázky počítají s nějakou míru shody – a pokud je tato dostatečně vysoká, tak daný patřičný obrázek prostě spatří světlo světa. A to bez ohledu na to, že by mohl následovat ještě 3x přesnější. Na druhou stranu (a to je v animaci v článku ukázano), nemusí takhle vyplivnout jen jeden obrázek, ale „všechny, které k tomu vstupu pasují“.

Zdroj: Duke University

Každopádně, asi je třeba ještě zmínit, že nalezený obličej je vygenerovaný náhodně. I kdyby v trénovacích datech byl obličej patřičného člověka, jenž je posléze předhozen jako vstupní rozostřený obrázek, AI si vygeneruje zcela nový. Jinými slovy, policie nejspíše tuhle srandu nejspíše jen tak nebude používat pro lapení zločinců – a i kdyby ji použila, z logiky věci nepůjde ani o důkaz. Alespoň teda doufám, právník nejsem.

Ve srovnání se starší prací z dřevního roku 2017 je nynější metoda každopádně efektivnější, rychlejší a přesnější. Rozhodně nelze říct, že by neměla své mušky. Ty tři roky uplynulého vývoje jsou však znát. A svrbí mne na temeni, když si představím další tři roky do budoucna…

Artificial Intelligence Makes Blurry Faces Look More Than 60 Times Sharper
Zdroj: Duke University

Lekce z kyberpunku

Cílem práce nicméně není zásobovat detektivy novou hračkou na šmírování – spíše se autoři snaží o vylepšení jakýchkoliv méně ostrých snímků novými metodami. Aplikace takového výzkumu by samozřejmě jednou možná mohla být užívána i bezpečnostními složkami – ale stejně tak by ji zřejmě využíval i váš nový telefon v okamžiku, kdy uděláte neostrý snímek.

Konec konců, pár dní po původní zprávě se objevily informace o tom, že mašina má poněkud problém predikovat správný vzhled jiných než bělošských etnik. Což nejlépe ilustruje „predikce“ vzhledu bývalého amerického prezidenta Obamy. Podobný rozdíl nemusí příliš vadit, pokud si domyslí okolí vašeho snímku z narozenin. V Kriminálce Miami by už ale jaksi haroval. A proto k něčemu podobnému zatím vědátoři ani nemíří.

An artificial intelligence-powered tool that transforms pixelated images into clear photos has been accused of racial bias. It transformed a pixelated image of Barack Obama (left) into a white man (right)
Zdroj: Duke University

Na každý pád je zajímavé, že za ony uplynulé tři roky nedošlo jenom na prima pokrok v zostřování snímků, ale i obavách ze zneužití podobné technologie. Software na rozpoznávání obličejů se stal všudypřítomným strašákem, a stejně tak, jako vyhlížím pokrok technický, vyhlížím tak i pokrok etický.

Je tomu už přes 40 let, co se objevil Gibsonův kyberpunk, a řada jeho vynálezů zjevně stále nedošla. Mnohé z dnešních problémů – od zneužívání dat, přes rozpoznávání obličejů až po hoaxy mají společného jmenovatele v informačních technologiích. A společného předchůdce v cyberpunkové fikci.

Doposud si většina diváků z Blade Runnera a podobných bijáků brala spíše to, že „budoucnost bude vypadat krutě se všemi těmi neony, wow!“, ale pomalu je asi na čase, abychom si z lepší minulosti vzali i nějaké jiné poučení budoucnosti. Jsem ten poslední, který by volal po zákazu technologií, to ne! Ale i nové nástroje budou stejné jako dosavadní nástroje – a bude jen na nás, jestli budeme chtít i tuhle srandu používat s rozumem, anebo bez něj.

[Martin Jašek, LL]

O umělé inteligenci jsem si pokecal i tuna:

Vědátor vzniká v dílně spolku studentů a popularizátorů vědy UP Crowd za podpory MUDRstart, který tvoří přípravné testy pro studenty vysokých škol. Krom různých autorů projekt jako šéfredaktor vede Ladislav Loukota – jeho kontaktní mail je vedatororg@seznam.cz

Diskuze