Az MI gyakran hallucinál, ráadásul sok esetben gyengébb, mint tavasszal

Kétféle ember van: aki beszél a mesterséges intelligenciáról, és aki használja. Mivel most beszélni fogunk róla, nem fogjuk sokat használni. Legeslegelőször le kell szögeznünk, hogy a mesterséges intelligencia (MI) alatt a továbbiakban a ma divatos, nagy nyelvi modelleken alapuló generatív mesterséges intelligenciát fogjuk érteni. Amely újabban gyengébb, de legalább is más eredményt produkál, mint tavasszal. A magyarázatot nem tudjuk…

Lényegbevágó tény, hogy sokféle egyéb alapokon nyugvó mesterségesintelligencia-eszköz is létezik, és 2023 februárjánál jóval régebben, amikor a Microsoft 10 milliárdos befektetése és a ChatGPT nyilvánossá tétele „virálissá“, azaz önmagától is rohamosan terjedővé változtatta a mesterséges intelligenciát. Ez a virálisság egyébként hatékonyan át tudja alakítani a dolgot, ahogy például a webbel is történt, amelyet tudományos és műszaki dokumentumok egyszerű megosztására találtak ki, nem pedig arra, hogy az ember kultúra általános platformja legyen.

"Óriás patkány denevérszárnyszerű fülekkel egy esős városi éjszakában"
„Óriás patkány denevérszárnyszerű fülekkel egy esős városi éjszakában” (Stability AI)

A mesterséges intelligencia bizony egy 60+ éve létező tudományterület. Egyik legismertebb eredménye a Garri Kaszparovot legyőző sakkprogram, a másik a hasonló, nem valamely nagy nyelvi modellre (angolul „large language modelre, LLM-re”) épülő Watson, amely 2011-ben megnyerte a legnépszerűbb amerikai műveltségi vetélkedőt, a Jepoardy-t. Amúgy pedig mindenki régóta használja a telefonja útvonaltervezőjét, az is MI, ahogy a Google Fordító is, és az sem LLM-alapú.

A generatív MI nem tudás

Most az a veszély fenyeget, hogy ezt a sokak által művelt, eredményes és értékes tudományterületet összemossák a generatív MI most közismertté vált, mondhatni népszerű formáival, lehetőségeivel és hibáival, és ezzel gyakorlatilag megfojtják, egyrészt, mert a befektetők a generatív MI-be öntik a milliárdjaikat, nem a „klasszikusba”, másrészt az MI, mint olyan, a hibák és botrányok miatt lejáratódik, és egyre kevésbé lesz népszerű befektetési cél.

 Generatív mesterséges intelligencia: az új adatokat generál előzetesen megtanított adathalmazok felhasználásával. Működése a gépi tanulás egy speciális formáján, a mélytanuláson alapul, amelynek során a gépek nagy mennyiségű adatot tanulmányoznak és mintázatokat keresnek benne.

Ugyancsak lényeges, hogy a nagy nyelvi modellen, azaz LLM-en alapuló MI-nek nincs közvetlen köze a valósághoz, mert a generatív MI „kimenete” az utasítást jelentő bemenettől és betanításhoz használt adathalmazban levő szavak előfordulási statisztikáitól függ, nem a szavak jelentette tudástól.

Innentől érthető, hogy az MI gyakran „hallucinál”: a kimenet téves vagy eleve hamis. Legyen egy példa az az indítvány, amelyért az „elkövetőknek”, amerikai ügyvédeknek 5000 dollár (igen enyhe) büntetést kellett fizetni, mert a ChatGPT-vel íratták meg a vádemelési indítványukat, amely nem létező ügyeket hozott fel precedensekként – a precedens alapú amerikai jogrendszerben. E sorok szerzője megíratta az önéletrajzát a ChatGPT-vel. Több olyan fontos könyvről is szó esett benne, amelyeket én írtam volna, de sajnos nem léteznek, annak ellenére, hogy az önéletrajzban a könyvek egy könyvesbolt-weboldali (hamis) linkje is szerepelt.

A Chat GPT és a Bing Chat nem ugyanaz

Nehezen derül ki, hogy a ChatGPT és a Bing Chat nem ugyanaz. A ChatGPT betanító adathalmaza az interneten 2021 végéig fellelhető szövegek nem pontosan tudható szempontok szerint válogatott, és nem pontosan tudható méretű, de irdatlanul nagy, továbbá zárt, nem bővülő adathalmaza, a Bing Chat pedig az interneten aktuálisan fellehető szövegek folyamatosan növekvő méretű, még irdatlanabbul nagy adathalmaza.

Nyilván előbb-utóbb a ChatGPT forrását is bővíteni kell majd, amit remélhetőleg kellő körültekintéssel végeznek majd el az alábbiak miatt.

Kiderült, hogy egyes, (a megbízó számára) előnyös díjazású alvállalkozók, akik ellenőrzik a betanító adatbázisba gyűjtött szövegeket, magát a ChatGPT-t használják. Ez nyilvánvalóan az adatminőség gyors romlásához vezet.

Sok törekvés folyik arra, hogy minden, MI-eredetű tartalomnál fel legyen tüntetve – hogy MI eredetű. Az ősszel jogerőre emelkedő EU AI Act is konkrétan előírja ezt, sok egyéb, súlyos követelmény mellett. Így egyrészt elkerülhető a betanító tartalmak MI-szennyeződése, másrészt a befogadók is kellő kritikával fogadják a tartalmat.

Egy másik körülmény, hogy a gépi tanulás miatt maguk a fejlesztők sincsenek teljes mértékben tisztában azzal, hogy mi történik a mesterséges intelligencia működése során. Az OpenAI márciusban bevezette a GPT-4 verziójú LLM-et, a közzé tett tesztek szerint a GPT-4 megfejtette az ún. captcha-ábrákat: amikor egy képsorozaton meg kell jelölni azokat, amelyeken bicikli vagy zebra van. Le tudta olvasni a vérnyomás értékét egy műszer LCD-jéről kamera képe segítségével.

Óriás hangya egy Glock pisztollyal a felső lábában
Óriás hangya egy Glock pisztollyal a felső lábában, ami rám szegeződik. A „mellső láb“ kikötést sem itt, sem a címképen sem értette meg, és a rám mutatást se (Stability AI)

Egy kutatócsoport többek között prímszámokat kerestetett vele, 500 prímszámot adtak be neki, és megkérdezték, prímszámok-e. Akkor 97,6 százalékos gyakorisággal helyesen válaszolt. Nemrég megismételték a tesztet, és legnagyobb megdöbbenésükre csak 2,4 százalékos volt a teljesítménye… Az LLM-ek ugyanis nem gépek, statisztikai alapon működnek, ugyanarra a kérdésre mindig mást és mást válaszolnak. A GPT-4 nyárra rosszabbul teljesített a programozási feladatokban, s kevesebb „sikert” mutatott fel abban is, hogy miként lehet törvénysértéssel pénzt keresni.

Az egészen biztos, hogy a GPT-4 most másképpen működik most, mint márciusban, a különbség magyarázatával és értékelésével a fejlesztői és a felhasználói is adósak még.

Óriás rovar egy Glock pisztollyal
Óriás rovar egy Glock pisztollyal, ami rám szegeződik – teljesen eltévedt szegény AI. (Deepdreamgenerator.com)

A szerzői jogi krízis

Még mindig nem jutott nyugvópontra az a kérdés, hogy vajon a kreatív tartalmak használatáért az MI betanításánál kell-e fizetni, és ha igen, mennyit. Jelenleg úgy tűnik, nem a plágium a fő igénypont, hiszen az eredményben legtöbbször csak erősen módosított motívumok ismerhetők fel, ha egyáltalán. Az biztos követelési alap az eredeti szerzők részéről, hogy fizetős szolgáltatáshoz ingyen használták fel a műveiket. Valószínűleg lesz néhány olyan hír, hogy ez vagy az az MI-szolgáltató egyezségre jutott a fel- (ki-)használt művészekkel. Számos egyezségről nem is fogunk tudni.

Folyik egy nagy meccs a filmiparban: a sztori- és forgatókönyv-írók hosszan sztrájkoltak alacsony javadalmazásuk – és az MI használatának terjedése miatt. Legutóbb a komputergrafikusok csatlakoztak hozzájuk, foglalkoztatásukat féltve szakszervezetbe tömörültek. A legrosszabbul a legnépesebb középmezőny fog járni, mert a csúcson levő ismert nevekkel nem lehet packázni, de a másod-harmadvonalbeli, a nem a legsikeresebb filmekben, sorozatokban dolgozó grafikusok, zeneszerzők, szövegírók érdekérvényesítő képessége gyengébb, mint a sztároké.

Fekete cseresznye
Fekete cseresznye – fotórealisztikus stílus – hát nem igazán sikerült… (Stable Doodle)

Végül röviden szóljunk azokról, akik használják, és jól járnak vele. Nem teljesen kezdő, de nem is legfelső szintű tapasztalatú programozók íratnak a ChatGPT-vel viszonylag rövid, meghatározott tevékenységkörű szoftvereket – amelyeket „kézzel”, vagyis saját humán intelligenciájuk és tudásuk segítségével meglehetősen alaposan, sok szempontból leellenőriznek. És még így is alig több, mint fele idő alatt elkészülnek a feladattal, mint ha nulláról, kézzel kezdtek volna neki.

Bevallom, én is használok MI-t, gépi fordításnál több nyelvről, az eredményt tárgyi, stilisztikai és kognitív ellenőrzés – alapos szerkesztés – után adom tovább felhasználásra. Nem mellesleg azért is, hogy a szövegen később esetlegesen alkalmazott MI-ellenőrzés ne találja MI-eredetűnek, mert már nincsenek benne a jellegzetesen gépies szó- és mondatszerkezetek. Ha a gépi fordításon sokat is kell szerkeszteni, azért megéri.

Eközben valamiféle konszolidáció látszik a használatban. Sokan használják már, és mindenki alaposan ellenőrzi is a saját, jól felfogott érdekében, hiszen a felelősség a használóé, nem az MI-é.

Barabási Albert-László hálózattudós a Qubitnak ezt mondta: „…történt egy finom előrelépés, viszont az igazán nagy áttörés az volt, hogy most ekkora adatmennyiségen lehet tréningelni, úgyhogy nekem a sejtésem az, hogy most egy platóra értünk. Megtörtént ez a nagyon nagy ugrás, ez kétségtelen, hogy mindenki megijedt tőle, és most úgy képzeljük, hogy ez így fog menni tovább. Szerintem nem. Ezt most egy kicsit megszokjuk, és lehet, hogy 3 év, 10 év vagy 20 év múlva lesz még egy minőségi ugrás ebben a sztoriban.”

Cikkünket a szerző a Stable Doodle és a Deepdreamgenerator MI-képgenerálókkal előállított rajzaival illusztráltuk. A képek alatt feltüntettük a generáláshoz felhasznált utasítást, „promptot”.

 

További hírek