AI-generált borítókép (Runway ML). Mit mondtunk a gépnek: artificial intelligence computer how it looks from the inside in analogue photo style
Nemrégiben jött a hír, miszerint a ChatGPT novemberi debütálása után 40 nappal elérte a 40 millió felhasználót. Tegyük hozzá: az Instagramnak ugyanehhez a teljesítményhez egy évre volt szüksége. 2023-at sokan már most az AI évének tekintik, de mi az, ami a hype-on túl van? Kötelező elméleti gyorstalpaló, szemlézzük a legforróbb AI alkalmazásokat, majd a korlátokról, a szürke zónákról is szó esik. A téma minél átfogóbb megértése végett pedig egyenesen a forráshoz mentünk: a ChatGPT véleményét is kikértük. Kísérlet következik!
Generatív genezis
Az okos társalkodó ChatGPT és a vizuális géniusz DALL-E alkalmazások elkezdték tavaly letarolni az internetet, de miért? Mire képesek és hogyan? Mindkét app generatív, előképzett mesterséges intelligenciát használ – innen jön a rövidítés is: generative pretrained transformer. Ez azt takarja, hogy a készítők gépi tanulás segítségével modelleket fejlesztenek, így a mesterséges intelligencia óriási adatbázisokon keresztül képes mintázatokat tanulni, elemezni. Az internet által elérhető óriási szöveges és képi anyagnak köszönhetően az AI egy óriási adatmerítésből képes tanulni, megfigyelni, amit aztán felhasznál a saját – legyen szó képes vagy szöveges – outputjai létrehozásában.
A generatív AI „varázsa” abban rejlik, hogy az AI-t eddig inkább leíró módon használták, mert képes volt a bevitt inputot – adatot, képet, bármit – azonosítani, kategorizálni. A generatív AI ezen eggyel túllép, mert már alkotni is képes. Ez pedig a leíró, deskriptív működéstől elmozdul a prediktív, vagyis előrejelző irányba. Az előbbi, leíró AI-ra kiváló például szolgálnak azon social media listening eszközök, amelyek képesek monitorozni a közösségi médiát egy előre beállított kulcsszóban, témában, és megállapítani, felcímkézni, hogy az adott bejegyzés pozitív vagy negatív, majd erről egy automatizált összefoglalót küldeni. A generatív AI ezzel szemben pár támpont bevitelével komplex válaszokat tud megfogalmazni, legyen szó kódról, esszéről, blog cikkről, versről vagy egy pop art stílusban megfestett szobanövényről.
Hogy definiálja magát a ChatGPT? Lássuk az ő válaszát:
Nem rossz, ugye? A rövid elméleti gyorstalpaló után haladjunk tovább a gyakorlat irányába, és nézzük meg, hol érezteti már most hatását a generatív AI.
1) Szövegírás és tartalomkészítés
Hirdetési szöveg, blog cikk, termék vagy meta leírás, ötletgyűjtés és inspirálódás – a támpontok megadása után böngészhetjük az AI variációit egy témára.
Vessünk egy pillantást a Chat GPT saját válaszára, hogy hol érdemes használni a marketingben:
- Chatbotok létrehozása ügyfélszolgálatra vagy értékesítési ügyekre
- Tartalom generálása, például blogbejegyzések, cikkek, leírások
- Keyword elemzés a keresőmotor-optimalizáláshoz
- Ügyfél- vagy vevői profil generálása a célzott reklámokhoz
- Analitikai adatok elemzése a marketingstratégia fejlesztéséhez.
Alkalmazások: ChatGPT, Jenni, Jasper, Tome
Korlátai: szerzői jogok, forrásellenőrzés, pontosság, megbízhatóság
2) Kreatívok készítése
Pár kulcsszó, rövid brief bevitelével az AI már generálja is nekünk a kért képeket, amiket használhatunk hirdetésekhez, landing oldalakhoz, prezentációkhoz. Ha nem tetszik a végeredmény, mehetünk tovább egyéb kulcsszavak megadásával, ami vonatkozhat stílusra, inspirációra, konkrét témára, és képméretre is – a lista tetszőlegesen bővíthető. Minél jobban briefeljük az adott szoftvert, annál könnyebben jutunk el a kívánt végeredményig. A szerkesztő eszközök között is nagyon intelligens alkalmazások vannak már, amikkel nem csak statikus képeket, hanem videós tartalmakat, hanganyagokat is gyorsan szerkeszthetünk, kiegészíthetünk, készíthetünk, testreszabhatunk – sőt, egyes esetekben automatizálhatjuk is. Például ha felvesszük saját hangunkat, a bevitt 10 percnyi hangminta alapján saját hanganyagokat gyárthatunk tetszőleges szövegekkel, amit már az AI rak össze helyettünk (Descript), és nem mi olvasunk fel.
Alkalmazások: StockAI, DALL-E, Super Meme, Runway ML, Tome, MidJourney, Descript, Stable Diffusion
Korlátai: szerzői jogok, forrásellenőrzés
A cikkhez szerettem volna készíteni egy borítóképet. Nézzük meg, hogy jutottam el a végső verzióig, melléjük téve a bevitt inputokat (promptokat) a Runway ML alkalmazás használatával:
“imagine how AI looks like in the style of a hyper-realistic Rembrandt painting”
“artificial intelligence in an analogue setting”
“artificial intelligence in the 80s and analogue style”
“artificial intelligence in the 80s in analogue photo style”
“artificial intelligence from the inside in the 80s in analogue photo style”
“artificial intelligence computer how it looks from the inside in the 80s in analogue photo style”
“artificial intelligence computer how it looks from the inside in analogue photo style”
3) Produktivitás
Kaptunk egy hosszú emailt? Megkérhetjük az AI-t, hogy foglalja össze nekünk röviden, mi áll benne, majd szedje pontokba, milyen további teendőket igényel az email (például számlát kell küldenünk, vagy fel kell hívnunk valakit). Sőt, a választ is megirathatjuk vele (Compose AI). Nem emlékszünk egy tartalomra, témára, és a böngésző előzményekből sem tudjuk visszafejteni? Nem gond, egy AI alkalmazás erre lett kitalálva – minden egyes lépésünket dokumentálja, és ha valamire nem emlékszünk, segít megtalálni (Rewind). A Browse AI segítségével weboldalakat monitorozhatunk anélkül, hogy nekünk magunknak rá kellene pillantanunk. Például ha várunk egy bizonyos frissítésre, elérhető raktárkészletre – ez lesz a megoldás. További időnyerő megoldások lehetnek az olyan AI alkalmazások, amelyek hosszú szövegekből csinálnak nekünk kivonatot, vagy hanganyagokból leiratot.
Alkalmazások: Compose AI, Rewind, Browse AI
Korlátai: adatvédelem, pontosság, automatizált döntéshozás veszélyei
Akadályok, rések
Könnyű ámulatba esni a fentiek láttán, hogy mire képes az AI. Ráadásul annak fényében, hogy ilyen magas szintű technológia ilyen tömegesen hozzáférhetővé és könnyen használhatóvá vált. Ahogy azonban Bodor mondja a Megáll az időben, észnél kell lenni.
Egyrészt vannak még vakfoltok, például nagyon rossz recepteket rak össze.
Komolyra fordítva a szót: az egyik legkézenfekvőbb probléma a szerzői jogok kérdésköre, ami két oldalról is felmerül. A legégetőbb probléma ezzel kapcsolatban jelenleg a képgeneráló AI-val van, mert ezek az AI-k olyan adatbázisok, könyvtárak képeiből dolgoznak saját vizuáljuk összerakásakor, amelyeket szerzői jogok védenek. Ezt úgy is elképzelhetjük, hogy képek amiken művészek állhatatosan dolgoztak, kialakítva saját stílusukat, világukat, kézjegyüket, az most pár kattintással összehozható az AI appok segítségével. Ezért indított a napokban pert a Getty Images az egyik ilyen alkalmazás mögött álló cég, a Stability AI ellen.
Menjünk tovább szerzői jogok kérdésköre mentén. Mi történik, ha egy népszerű online tech magazin százával kezdi publikálni az AI által írt cikkeket, és nem szól róla senkinek? Merthogy pontosan ez történt. Ez azt vetíti előre a szakértők szerint, hogy a kezdő újságírók munkájára így kevesebb szükség lesz, illetve a tény-és forrás ellenőrzés miatt a szerkesztői feladatok fognak felértékelődni. Az AI által adott tények, megoldások és érvelések nem feltétlenül pontosak, ezért az ellenőrzés elengedhetetlen része lesz az ilyen szövegek szerkesztésének. A tudományos folyóiratok egyelőre nem is engedélyezik az AI által szövegek használatát.
Lépjünk egyet hátra, és vizsgáljuk meg röviden a felmerülő etikai aggályokat. Az egyik legfontosabb az automatizált döntések kérdésköre, hiszen ha az AI hoz nekünk döntéseket, amit mi elfogadunk, a felelősség ugyanúgy minket terhel. Az AI kényelmessége, autopilóta üzemmódja miatt sokan átruházzák rá a döntéshozást – azonban ha ez rossz döntéshez vezet, akkor a felelősség nem a gépé, hanem az emberé. Az, hogy a gép milyen döntéseket hoz, nem a véletlen műve – mi tápláljuk bele a korábbi precedenseket, adatbázisokat, az elérhető emberi források alapján. Ugyanezen okból kifolyólag az AI gondolkodásában is visszatükröződnek az emberi gondolkodás korlátai: a torzítás, az elfogultság, az egyszerűsítés, az önkényesség – ami még veszélyesebbé teszi a túlzott ráhagyatkozást.
Megkérdeztük a Chat GPT-t is, hogy ő mit gondol, milyen veszélyeket hordoznak a mesterséges intelligencián alapuló eszközök:
1. Működési mód: Az AI-t és a chat GPT-t sokan még mindig egyfajta „varázslattal” vagy „csodával” azonosítják, amely képes dolgokat megoldani anélkül, hogy megértenék volna, hogyan működik.
2. Határok: Az AI-t és a chat GPT-t sokan túlságosan korlátlan lehetőségeknek tekintik, holott ennek sok korlátja van, például a megbízhatóság, a pontosság és a biztonság terén.
3. Tévedési lehetőségek: Az AI-t és a chat GPT-t sokan tévedhetetlennek tekintik, holott ennek is vannak tévedési lehetőségei, amelyek főként a bemeneti adatok minőségétől és pontosságától függenek.
4. Felelősség: Az AI-t és a chat GPT-t sokan egyszerűen csak eszközként tekintik, holott ennek is vannak felelősségi kérdései, amelyeket meg kell oldani, például a döntések felelősségét.
5. Tanulási folyamat: Az AI-t és a chat GPT-t sokan a tanulás folyamatának részleteiről és ennek korlátairól nem rendelkeznek megfelelő tudással.
Emlékeztetőül – az AI már a spájzban van
Források:
What is generative AI? – McKinsey
Liam James Key – 9 new AI tools that will blow your mind
Deep Learning Expert Says GPT Startups May Be in for a Very Rude Awakening – Futurism
Are A.I. Image Generators Violating Copyright Laws? – Smithsonian Magazine
First- and Second-Level Bias in Automated Decision-making – Ulrik Franke
12 AI Websites That Will Blow Your Mind – Medium
OpenAI’s Dall-E2 Is Impressive As F*ck – Medium
Op-Ed: AI flaws could make your next car racist – LA Times
The self-driving trolley problem: how will future AI systems make the most ethical choices for all of us? – The Conversation