Kétféle ember van: aki beszél a mesterséges intelligenciáról, és aki használja. Mivel most beszélni fogunk róla, nem fogjuk sokat használni. Legeslegelőször le kell szögeznünk, hogy a mesterséges intelligencia (MI) alatt a továbbiakban a ma divatos, nagy nyelvi modelleken alapuló generatív mesterséges intelligenciát fogjuk érteni. Amely újabban gyengébb, de legalább is más eredményt produkál, mint tavasszal. A magyarázatot nem tudjuk…
Lényegbevágó tény, hogy sokféle egyéb alapokon nyugvó mesterségesintelligencia-eszköz is létezik, és 2023 februárjánál jóval régebben, amikor a Microsoft 10 milliárdos befektetése és a ChatGPT nyilvánossá tétele „virálissá“, azaz önmagától is rohamosan terjedővé változtatta a mesterséges intelligenciát. Ez a virálisság egyébként hatékonyan át tudja alakítani a dolgot, ahogy például a webbel is történt, amelyet tudományos és műszaki dokumentumok egyszerű megosztására találtak ki, nem pedig arra, hogy az ember kultúra általános platformja legyen.

A mesterséges intelligencia bizony egy 60+ éve létező tudományterület. Egyik legismertebb eredménye a Garri Kaszparovot legyőző sakkprogram, a másik a hasonló, nem valamely nagy nyelvi modellre (angolul „large language modelre, LLM-re”) épülő Watson, amely 2011-ben megnyerte a legnépszerűbb amerikai műveltségi vetélkedőt, a Jepoardy-t. Amúgy pedig mindenki régóta használja a telefonja útvonaltervezőjét, az is MI, ahogy a Google Fordító is, és az sem LLM-alapú.
A generatív MI nem tudás
Most az a veszély fenyeget, hogy ezt a sokak által művelt, eredményes és értékes tudományterületet összemossák a generatív MI most közismertté vált, mondhatni népszerű formáival, lehetőségeivel és hibáival, és ezzel gyakorlatilag megfojtják, egyrészt, mert a befektetők a generatív MI-be öntik a milliárdjaikat, nem a „klasszikusba”, másrészt az MI, mint olyan, a hibák és botrányok miatt lejáratódik, és egyre kevésbé lesz népszerű befektetési cél.
Generatív mesterséges intelligencia: az új adatokat generál előzetesen megtanított adathalmazok felhasználásával. Működése a gépi tanulás egy speciális formáján, a mélytanuláson alapul, amelynek során a gépek nagy mennyiségű adatot tanulmányoznak és mintázatokat keresnek benne.
Ugyancsak lényeges, hogy a nagy nyelvi modellen, azaz LLM-en alapuló MI-nek nincs közvetlen köze a valósághoz, mert a generatív MI „kimenete” az utasítást jelentő bemenettől és betanításhoz használt adathalmazban levő szavak előfordulási statisztikáitól függ, nem a szavak jelentette tudástól.
Innentől érthető, hogy az MI gyakran „hallucinál”: a kimenet téves vagy eleve hamis. Legyen egy példa az az indítvány, amelyért az „elkövetőknek”, amerikai ügyvédeknek 5000 dollár (igen enyhe) büntetést kellett fizetni, mert a ChatGPT-vel íratták meg a vádemelési indítványukat, amely nem létező ügyeket hozott fel precedensekként – a precedens alapú amerikai jogrendszerben. E sorok szerzője megíratta az önéletrajzát a ChatGPT-vel. Több olyan fontos könyvről is szó esett benne, amelyeket én írtam volna, de sajnos nem léteznek, annak ellenére, hogy az önéletrajzban a könyvek egy könyvesbolt-weboldali (hamis) linkje is szerepelt.
A Chat GPT és a Bing Chat nem ugyanaz
Nehezen derül ki, hogy a ChatGPT és a Bing Chat nem ugyanaz. A ChatGPT betanító adathalmaza az interneten 2021 végéig fellelhető szövegek nem pontosan tudható szempontok szerint válogatott, és nem pontosan tudható méretű, de irdatlanul nagy, továbbá zárt, nem bővülő adathalmaza, a Bing Chat pedig az interneten aktuálisan fellehető szövegek folyamatosan növekvő méretű, még irdatlanabbul nagy adathalmaza.
Nyilván előbb-utóbb a ChatGPT forrását is bővíteni kell majd, amit remélhetőleg kellő körültekintéssel végeznek majd el az alábbiak miatt.
Kiderült, hogy egyes, (a megbízó számára) előnyös díjazású alvállalkozók, akik ellenőrzik a betanító adatbázisba gyűjtött szövegeket, magát a ChatGPT-t használják. Ez nyilvánvalóan az adatminőség gyors romlásához vezet.
Sok törekvés folyik arra, hogy minden, MI-eredetű tartalomnál fel legyen tüntetve – hogy MI eredetű. Az ősszel jogerőre emelkedő EU AI Act is konkrétan előírja ezt, sok egyéb, súlyos követelmény mellett. Így egyrészt elkerülhető a betanító tartalmak MI-szennyeződése, másrészt a befogadók is kellő kritikával fogadják a tartalmat.
Egy másik körülmény, hogy a gépi tanulás miatt maguk a fejlesztők sincsenek teljes mértékben tisztában azzal, hogy mi történik a mesterséges intelligencia működése során. Az OpenAI márciusban bevezette a GPT-4 verziójú LLM-et, a közzé tett tesztek szerint a GPT-4 megfejtette az ún. captcha-ábrákat: amikor egy képsorozaton meg kell jelölni azokat, amelyeken bicikli vagy zebra van. Le tudta olvasni a vérnyomás értékét egy műszer LCD-jéről kamera képe segítségével.

Egy kutatócsoport többek között prímszámokat kerestetett vele, 500 prímszámot adtak be neki, és megkérdezték, prímszámok-e. Akkor 97,6 százalékos gyakorisággal helyesen válaszolt. Nemrég megismételték a tesztet, és legnagyobb megdöbbenésükre csak 2,4 százalékos volt a teljesítménye… Az LLM-ek ugyanis nem gépek, statisztikai alapon működnek, ugyanarra a kérdésre mindig mást és mást válaszolnak. A GPT-4 nyárra rosszabbul teljesített a programozási feladatokban, s kevesebb „sikert” mutatott fel abban is, hogy miként lehet törvénysértéssel pénzt keresni.
Az egészen biztos, hogy a GPT-4 most másképpen működik most, mint márciusban, a különbség magyarázatával és értékelésével a fejlesztői és a felhasználói is adósak még.

A szerzői jogi krízis
Még mindig nem jutott nyugvópontra az a kérdés, hogy vajon a kreatív tartalmak használatáért az MI betanításánál kell-e fizetni, és ha igen, mennyit. Jelenleg úgy tűnik, nem a plágium a fő igénypont, hiszen az eredményben legtöbbször csak erősen módosított motívumok ismerhetők fel, ha egyáltalán. Az biztos követelési alap az eredeti szerzők részéről, hogy fizetős szolgáltatáshoz ingyen használták fel a műveiket. Valószínűleg lesz néhány olyan hír, hogy ez vagy az az MI-szolgáltató egyezségre jutott a fel- (ki-)használt művészekkel. Számos egyezségről nem is fogunk tudni.
Folyik egy nagy meccs a filmiparban: a sztori- és forgatókönyv-írók hosszan sztrájkoltak alacsony javadalmazásuk – és az MI használatának terjedése miatt. Legutóbb a komputergrafikusok csatlakoztak hozzájuk, foglalkoztatásukat féltve szakszervezetbe tömörültek. A legrosszabbul a legnépesebb középmezőny fog járni, mert a csúcson levő ismert nevekkel nem lehet packázni, de a másod-harmadvonalbeli, a nem a legsikeresebb filmekben, sorozatokban dolgozó grafikusok, zeneszerzők, szövegírók érdekérvényesítő képessége gyengébb, mint a sztároké.

Végül röviden szóljunk azokról, akik használják, és jól járnak vele. Nem teljesen kezdő, de nem is legfelső szintű tapasztalatú programozók íratnak a ChatGPT-vel viszonylag rövid, meghatározott tevékenységkörű szoftvereket – amelyeket „kézzel”, vagyis saját humán intelligenciájuk és tudásuk segítségével meglehetősen alaposan, sok szempontból leellenőriznek. És még így is alig több, mint fele idő alatt elkészülnek a feladattal, mint ha nulláról, kézzel kezdtek volna neki.
Bevallom, én is használok MI-t, gépi fordításnál több nyelvről, az eredményt tárgyi, stilisztikai és kognitív ellenőrzés – alapos szerkesztés – után adom tovább felhasználásra. Nem mellesleg azért is, hogy a szövegen később esetlegesen alkalmazott MI-ellenőrzés ne találja MI-eredetűnek, mert már nincsenek benne a jellegzetesen gépies szó- és mondatszerkezetek. Ha a gépi fordításon sokat is kell szerkeszteni, azért megéri.
Eközben valamiféle konszolidáció látszik a használatban. Sokan használják már, és mindenki alaposan ellenőrzi is a saját, jól felfogott érdekében, hiszen a felelősség a használóé, nem az MI-é.
Barabási Albert-László hálózattudós a Qubitnak ezt mondta: „…történt egy finom előrelépés, viszont az igazán nagy áttörés az volt, hogy most ekkora adatmennyiségen lehet tréningelni, úgyhogy nekem a sejtésem az, hogy most egy platóra értünk. Megtörtént ez a nagyon nagy ugrás, ez kétségtelen, hogy mindenki megijedt tőle, és most úgy képzeljük, hogy ez így fog menni tovább. Szerintem nem. Ezt most egy kicsit megszokjuk, és lehet, hogy 3 év, 10 év vagy 20 év múlva lesz még egy minőségi ugrás ebben a sztoriban.”
Cikkünket a szerző a Stable Doodle és a Deepdreamgenerator MI-képgenerálókkal előállított rajzaival illusztráltuk. A képek alatt feltüntettük a generáláshoz felhasznált utasítást, „promptot”.