Hírek

Vége a Stockphoto-k uralmának? Az AI generálta képek fogják felváltani?

 Interjú: Kő Attila, prompt-artist-al. Hogyan működnek az AI képgenerátor szoftverek? Lehetséges felhasználási területek, pl.: webes tartalom?

Mesterséges intelligencia által előállított képek


Mit takar pontosan az, hogy Prompt-Artist?

  • Leegyszerűsítve az AI art prompt nem más, mint egy mesterséges intelligenciát futtató program kreatív használata, amiből részlet gazdag, látványos képek generálódnak. A legjobbakat  webshop-ban árulják. Ami úgy néz ki, hogy egy céggel szerződésben vagyok, akiknek a legjobban sikerült munkáimat átadom. Ezek a képek aztán kurátorok által elbírálásra kerülnek. Végül ezeket 3D nyomtatásban is elkészítjük. A 3D-t egyelőre úgy kell érteni, hogy van egy olyan nyomtatója a cégnek, ami natív, színes nyomtatásra képes. Tehát a képeknek sokkal szebb színnel, sokkal életgazdagabb képek készülnek, mint a sima nyomdaipari termékek esetében, mivel nem egyetlen rétegről, hanem akár 10-15-50 vagy 100 réteg mélységéből áll egy kép. Ezért közel sem úgy néz ki, mint általában a képek.

Úgy érted, hogy nem olyan, mint egy ember által elképzelt kép? Vagy is sokkal részletgazdagabb, mint egy ember által alkotott kép?

  • Abszolút, az AI teljesen más mértékben gondolkodik.

Mióta foglalkozol ezzel?

  • Másfél évvel ezelőtt, amikor elkezdtem ezzel foglalkozni, a kutya nem értette, hogy miről beszélek. Most már azért eléggé felkapott lett, meg hozzáférhető mindenkinek, de még ugyanúgy gyakorlatilag nincs teljesen meg a helye.

Rendben, de hogyan is működik ez? Megrendelek képeket egy adott témára?

  • Igen, így is működhet. Tehát megadott kulcsszavak, úgynevezett trombita alapján tudok képeket generálni. Ha esetleg van kifejezett igény a témáról, akkor ez vagy akár magyarul egynéhány szóban, vagy akár angolul. Elküldheted nekem, megmondhatod, hogy körülbelül mekkora felbontású képekre lesz szükséged, ha van megközelítőleg ötleted arról, hogy világosabb, sötétebb árnyalatú képek, vagy akár egy meghatározott színpaletta alapján.

Most csak egy egyszerű példával élve, tételezzük fel, hogy a te weboldalad kék, és te ehhez szeretnél egy komplementer színű sárga gumikacsákról szóló képet.  Mondjuk 1500*1300-as képméretben elkészült sorozatot egy sárga gumikacsáról; akár azt is megmondhatod, hogy inkább 3D-renderelt stílusban, vagy akár festészet stílusban készüljön a kép. Vagy akár egy művészt és az ő stílusát is megadhatod. Viszonylag rövid idő alatt 20-as, 50-es, 100-as sorozat elkészül, amiből aztán te kiválaszthatod a neked legjobban tetszőket.
 

Ebben a pillanatban ez még boszorkányság a számomra. Hogyan is működik ez részletesebben?

  • Lényegében vannak előre megírt gépi mechanizmusok, gépi tanulás, kép-tartalom definiált modellek. Ezek úgy készülnek, hogy egy őrületes mennyiségű, úgynevezett dataset-re, vagy magyarul adathalmazra gépi tanulási algoritmusokat ráengednek, amik meghatározott paraméterek alapján checkpointokat készítenek a látottakból. Tegyük fel, hogy tízezer képet kutyákról betöltünk egy dataset-be, és néhány kép alapján megtanítjuk a kutyák különböző fajtáit, akkor az AI meg fogja tudni különböztetni az újfundlandit a vizslától. A mélytanulási mechanizmus kiválogatja és rendszerezi ezeket a képeket. Így a szavak és a szűrők rendszerezett és értelmezett tartalmak között böngésznek. Az adatbázis hatalmas, néhol saját és virtuális szervert is igényel. 

 

Hogyan is kell ezt elképzelni? Én kipróbáltam párat az online AI képgenerátorokból. PL.: beírtam, hogy „Star Wars” "Steam punk" és „Forest” és kiadta ezt a képet. Amin egy négylábú robot harcol egy Wish-ről rendelt rohamosztagossal.

  • Itt nem egy google képkeresés fog történni a háttérben, hanem már egy definiált dataset-en fog keresést végrehajtani az általad megadott kulcsszavak checkpoint-jai alapján. Tehát amikor bármelyik cég vagy bármelyik mesterséges intelligenciájával létrehozott képkészítőjéről beszélünk, ők mind előre meghatározott dataset-ekkel dolgoznak. Most egy Midjourney például a 2022-ig fellelhető összes internetes, összes képnek a dataset-jét tartalmazza. Az Open Ai, aminek az egyik saját verzióját használom, ők úgy dolgoznak, hogy a modelljüket két-három hetente frissítik, és a Google-fotók, Art Station, Pinterest, 500 Cx és az összes ilyen stockfotó oldalt és tartalmazza.

És mi van akkor, hogyha absztrakt vagy elvont fogalmakat szeretnék? Például, hogy azt mondom, egy tartalommarketinges cégnek szeretnék képeket a weboldalára.

  • Nehezebb ügy, de megoldható csak persze tréningelni kell a beállított modellünket. Ez továbbra sem úgy működik, mint egy sima képkeresés. Minden íráshoz más vizuális tartalom illik és az AI igyekszik ezt kigenerálni. Csak egy példa: Queen - Bohemian Rhapsody című számághoz valaki egy egész klipre való AI képet generált és feltöltötte youtube-ra.

 

Beszéltem arról, hogy check pointokat keres a rendszer. Amikor elkezdi összerakni a képeket, akkor minden egyes úgynevezett keresés egy-egy lépésnek számít. Ezeket a lépéseket egytől ezerig lehet definiálni. Az első lépés az gyakorlatilag fehér zajt fog adni, mert a modell épphogy betöltötte a check pointokat. Az ezredik lépés valószínűleg egy túlságosan összetett képet eredményezne. Ezért témától függően nagyjából olyan 50 és 400 közötti értéket érdemes használni.

Most, ha jól látom azt adtad meg értéknek, hogy: "Wonder Woman fighting with stormtrooper punk city street"?

  • Igen, igen. Ez így eléggé kevés kritérium, tehát könnyen lehet, hogy valami béna végeredmény fog kijönni. De hát nem fogjuk tudni, amíg ki nem próbáljuk. Most mutatja, hogy betölti a modellt, és ott mutatja szépen a lépéseket egy control panelen. Jön is az első 5 kép.

wonderwoman ai által generált kép 1wonderwoman ai által generált kép 2

 

Wonder Womannek egy kicsit ijesztő arca van. Lehet, hogy megsérült a harcban... Hopp, ezek már elég jók. Adjunk hozzá több kritériumot. Mondjuk Wonder Woman harcoljon Vasemberrel Budapesten, de ködben ám!

  • Oké, de hozzáadok, még növelem a lépések számát egy kicsivel és állítok picit a kritériumok értelmezésén is. Illetve beállítok pár szűrőt, előszűrőt. Stílust, színvilágot. Íme, ezek a végeredmények születtek.
     

 

Szerinted ez művészet?

  • Nekem kreatív hobbi és önmegvalósítás. Készülnek képek, amiket kiállítanak, vagy éppen egy nappalit díszítenek valakinél. Az is előfordul, hogy ezek a képek hatalmas tapétaként meghatározzák egy üzlethelyiség dizájnját. Nem tudom, hogy művészet-e. Mindenki döntse el saját maga.

 

Kő Attila munkáit az alábbi Facebook oldalon nézhetitek meg: Kovakavics

HTML / CSS
31 Január
24 Február
5 Március
Python
2 Március
PHP
5 Február
10 Február
23 Április
Full-stack
31 Január
24 Február
5 Március
C#
19 Február
11 Március