Amikor az emberek elkezdtek elmélkedni azon, hogy a mesterséges intelligencia hogyan fogja átalakítani a társadalmunkat, a legtöbben azt képzelték, hogy a fizikai, illetve a monoton szellemi munkák fognak először megszűnni, és a társadalom nagy része művészettel, alkotással foglalkozik majd. A művészek munkája tehát biztonságban van, hiszen az olyan emberi képességeket, mint a szépérzet és a kreativitás hogyan is tudna egy számítógép elsajátítani?
Miután megláttam mire képes az OpenAI legújabb projektje a Dall-E 2 szinte már nevetségesnek hangzik az előbb feltett kérdés. A Salvador Dali és Wall-E neveiből összerakott képgeneráló AI program (Artificial Intelligence – mesterséges intelligencia) második iterációja néhány napja készült el, és az eredményi láttán nem túlzok, amikor azt mondom, hogy leesett az állam.
A projekt a GPT-3 nevű folyószöveg értelmező modult veszi alapul, de ahelyett, hogy a beírt szöveg alapján kreatív szöveget írna vagy programozna, egy képet varázsol elénk – egészen hihetetlen minőségben.
A cikkben látható képek elkészítéséhez a program csak azt a rövid szöveges inputot kapta, ami a kép alatt látható, mindössze ennyi információ alapján hozta létre az alábbi alkotásokat.
“A Shiba Inu dog wearing a beret and black turtleneck”
“Egy Siba inu kutya svájcisapkát és fekete garbót visel”
Szkeptikusként mondhatnánk, hogy ez egyelőre nem nagy szám. A programot több millió képen tanították, és mindössze annyit csinál, hogy összevadássza a különböző képeken megjelenő részleteket, majd azokat ügyesen egy képre rendezi. Igen ám, de hozzá kell tenni, hogy a program egészen elvont képek létrehozására is képes.
“A dolphin in an astronaut suit on Saturn, artstation”
“Egy delfin űrhajós ruhában a Szaturnuszon, művészeti állomás”
Honnan vette az MI, hogy egy delfinen hogyan állna az űrruha? Hogyan rakta össze a kép teljesen konzisztens megvilágítását? A sisakon tükröződő nap fénye pontos összhangban van a delfin és a bolygó megvilágításával, pedig a Nap nem is jelenik meg a képen. Ilyen kreatív döntésekre képes program 10 éve még elképzelhetetlennek számított.
Ha ez a program széles körben elérhetővé válik, amivel ilyen minőségű illusztrációkat tudunk folyó szövegből pillanatok alatt létrehozni, annak egészen elképesztő – vagy más nézőpontból félelmetes – következményei lehetnek.
Az utolsó kép, amit csatolok egészen lenyűgöző alkotás lett, azonban ezen már látható egy kis pontatlanság. Zeusz hüvelykujján a körmöt nem sikerült a mesterséges intelligenciának teljesen jól ábrázolnia, de tekintve, hogy egy alig kétéves projektről van szó, úgy gondolom, ezek a hibák (egyelőre) beleférnek.
“A photograph of the earth being cradled by Zeus as if it were a marble”
“Fénykép a földről, amelyet Zeusz szorongat, mintha márvány lenne”
Ezen képek alkotásán kívül rengeteg egyéb dologra képes az MI, akit érdekel a téma nagyon ajánlom, hogy nézze végig a weboldalt, és játszadozzon el a különböző lehetőségekkel. A programmal egyszerűen lehet már előre elkészített képekhez is plusz elemeket hozzáadni, például egy rózsaszín flamingót a medencéről készült képünkre.
Az eszköz egyelőre nem elérhető még bárki számára. Az OpenAI kutatói óvatosan szeretnék a nagyközönséggel megosztani ezt a rendkívüli programot, a honlapon is csak limitált demonstráció található. Az óvatosságot szemlélteti még, hogy a képhalmaz, amin tanították az algoritmust, nem tartalmaz hírességekről készült képeket, erőszakot vagy pornográf tartalmat, így ilyen elemeket tartalmazó képek biztosan nem jelennek majd meg a mesterséges intelligencia alkotásaiban.
A Dall-E 2 rávilágít arra, hogy a kreatív iparágakban dolgozó munkavállalók sincsenek biztonságban. Az MI rengeteg ember munkáját fogja könyörtelenül elvenni a következő évtizedekben. A leghasznosabb, amit tehetünk, hogy megtanuljuk ezeknek az eszközöknek a használatát, és megpróbáljuk az MI-t nem ellenségnek, hanem segítségnek tekinteni, amivel a saját produktivitásunkat tudjuk megsokszorozni.
Technológia, ami véget vet az államnak és kripto, ami véget vet a papírpénznek és a jegybanknak
Képzeljük el, hogy nincs és nem is lesz szuverén, választott, demokratikus vagy diktatórikus államhatalom a technológiai cégek fölött. Képzeljük el, hogy ez utóbbiak és nem a demokraták, diktátorok fognak irányítani bennünket a jövőben. Mert a technológiai fejlődés legyőzi az államot és legyőzi a klasszikus pénzt. Ian Bremmer, a nagy, talán a legtekintélyesebb geopolitikai kockázatelemző cég, az Eurasia Group vezetője reális szcenáriónak tartja mindezt. Vele készült az interjúnk.