Klíčové poznatky
- DALL·E je nová neuronová síť, která umí kreslit obrázky na základě textu.
- Síť je jedním z rostoucího počtu projektů umělé inteligence, které mohou napodobovat kreativní výstupy lidských bytostí.
- Odborníci tvrdí, že obrázky nakreslené umělou inteligencí nejsou originální výtvory.
Přesuň se, Picasso. Nová neuronová síť může kreslit obrázky na základě textu.
DALL·E, portmanteau jmen umělce Salvadora Dalího a Pixar’s WALL·E, dokáže vzít jakýkoli text a vytvořit z něj obrázek. Systém využívá neuronovou síť, která byla natrénována na miliardách obrázků a textových příkladů. Je to jeden z rostoucího počtu projektů umělé inteligence, které mohou napodobovat, ale ne replikovat, kreativní výstupy lidských bytostí.
„Protože se přirozený jazyk neustále vyvíjí a je velmi závislý na kontextových nuancích, naučit stroj rozumět jazyku natolik dobře, aby nakreslil obrázek, je velmi významný úspěch,“Tamara Schwartz, profesorka kybernetické bezpečnosti na York College of Pennsylvania, řekl v e-mailovém rozhovoru. "Představte si policejního kreslíře, to je vzácný talent, který umí vytvořit obrázek na základě popisu svědka."
Používání velkých dat k vytváření obrázků
DALL-E byl vytvořen společností OpenAI zabývající se výzkumem umělé inteligence a funguje na základě shromažďování obrovského množství dat z internetu. Data jsou poté zpracována modelem přirozeného jazyka a jsou trénována k vytváření obrázků z textu. DALL-E funguje podobně jako nedávno vydaný GPT-3, jazykový model vytvořený OpenAI, který může být vyzván ke generování originálních textových pasáží. GPT-3 byl trénován pomocí půl bilionu slov internetového textu a dokáže vytvořit překvapivě realistický text.
Naučit stroj rozumět jazyku natolik dobře, aby nakreslil obrázek, je velmi významný úspěch.
Michael Yurushkin, zakladatel a technický ředitel BroutonLab, společnosti zabývající se datovými vědami, v e-mailovém rozhovoru řekl, že DALL-E je „jedním z mála úspěšných zásahů lidstva při napodobování naší kreativity a představivosti“. Dodal: „Je snazší si uvědomit, jak umělá inteligence něco předpovídá tím, že projde relevantní data, ale porozumět tomu, jak je schopna generovat kresby z věcí, o kterých nikdy předtím ‚neslyšeli‘, je obtížnější.“
Schwartz dbá na to, aby si všiml, že AI nevytváří informace, ale bere jazyková data a převádí je na obrázky.
„Počáteční kreativita pochází od člověka, který úkol postavil,“řekl Schwartz. „Na straně umělé inteligence existuje určitá ‚kreativita‘, protože experimentuje s různými kombinacemi dat a poté vybírá z řady potenciálních výstupů. Člověk však zkoumá výstupy a učí AI, jak vybírat z mnoha kombinací."
Práce robotického detektiva?
Stroj může experimentovat s touto kombinací dat a objektů mnohem rychleji než lidský umělec. Schwartz poznamenal, že DALL-E by se jednoho dne mohl spojit s detektivem, který se snaží rekonstruovat místo činu pomocí náčrtu založeného na svědectví očitých svědků.
"Jak svědci poskytují své výpovědi, počítač by mohl vzít tyto mluvené informace v přirozeném jazyce a vytvořit kresbu scény nebo mnoho kreseb scény," řekla. "Tyto vizualizace by pak mohly být integrovány za účelem vytvoření přesnějšího obrazu ztracených důkazů. Tato vizualizace by mohla být obohacena integrací předchozích snímků místa před zločinem."
Umění může produkovat několik dalších programů řízených umělou inteligencí. Například Ai-Da používá k vytváření umění systém robotických paží a technologii rozpoznávání obličeje spárovanou s umělou inteligencí. Systém dokáže analyzovat obraz umístěný před strojem, který se vkládá do algoritmu pro vytváření pohybů paží robota.
Lidští umělci by se však neměli obávat, že je nahradí robotičtí vládci, argumentoval loni v The New York Times Ahmed Elgammal, ředitel laboratoře Art and Artificial Intelligence Lab na Rutgers University.
„I když se definice umění neustále vyvíjí, v jádru je to forma komunikace mezi lidmi,“napsal. "Bez lidského umělce za strojem umí umělá inteligence jen o málo víc než jen hru s formou, ať už to znamená manipulovat s pixely na obrazovce nebo s poznámkami v hudební účetní knize. Tyto aktivity mohou být poutavé a vnímavě zajímavé, ale postrádají smysl bez interakce mezi umělec a publikum."
Po zhlédnutí práce DALL-E chápu Elgammalův názor, že obrázky vytvořené AI nejsou uměním. Na druhou stranu jsou lepší než jakékoli umění, které bych mohl vytvořit. Takže, opravdu, jaký je rozdíl?