Napjaink MI-versenye kiélezettebb, mint valaha

A mesterséges intelligencia terjedése egyre fokozódik: a kínai MI-modellek száma egyre gyarapszik, és minősége is javul, ezzel mind jobban igényt formálva az Egyesült Államok vezető helyére, a csúcsmodellek különbsége pedig egyik napról a másikra csökken – derül ki egy az iparág helyzetéről szóló kimutatásból.

Az összefoglaló munka kiemeli, hogy az MI gyors fejlődésével egyetlen jelenleg még élen álló cég sem tudhatja magát biztonságban. A Chatbot Arena Leaderboardon, ahol a felhasználók szavazatai döntenek a különböző botok teljesítményéről, míg a legjobban rangsorolt modell 2024 elején mintegy 12 százalékkal magasabb pontszámot ért el, mint a tizedik helyezett, addig 2025 elején már csak 5 százalékkal többet. A számok csökkenése jelzi, hogy az egyes modellek között egyre nagyobb a verseny – és egyre nagyobb a zsúfoltság (a rengeteg felgyülemlő modell okán).

A kaliforniai Stanford Egyetem mesterséges intelligenciával foglalkozó intézete által most közétett 2025-ös mutató szerint a figyelemre méltó generatív AI (artifical intelligence, vagyis magyarul MI) modellek átlagosan még továbbra is egyre bővülnek, mivel több döntéshozó változót, nagyobb számítási teljesítményt és szélesebb gépi tanulást segítő adathalmazt használnak.

A generatív MI a mesterséges intelligencia olyan típusa, amely új tartalmak – például képek, szövegek, videók, zenék – létrehozására vagy módosítására képes gépi tanulási modellek és különféle algoritmusok segítségével.

Néhány fejlesztő rendkívüli ügyessége azonban bizonyítja, hogy a „karcsúbb” modellek is nagyszerű dolgokra képesek. A jobb algoritmusoknak köszönhetően egy korszerű, ám kisebb modell napjainkban már képes elérni azt a teljesítményt, melyet két évvel ezelőtt még csak egy százszor nagyobb modell tudott. 2024 tehát a „fapados” MI-modellek áttörésének éve volt – derül ki a felmérésből.

Bart Selman, a New York állambeli Ithacában található Cornell Egyetem informatikusa, aki bár nem vett részt az MI-index elkészítésében, azt mondta, jó látni, hogy az olyan viszonylag kicsi és olcsó erőfeszítések, mint a kínai DeepSeek, bizonyítják, hogy versenyképesek lehetnek. Sokak szerint ez a friss modell ugyanolyan szinten végez feladatokat, mint az Egyesült Államok egyik legismertebbje – és a legfontosabb, hogy a tudományos világ számára is nyitott hozzáférést biztosít a különféle elemzések, vizsgálatok elvégzéséhez. Ez a Kínában megalkotott nagy nyelvi modell globális szinten hatalmas port kavart mind a számítástechnikai ipar, mind a pénzpiacok területén, ugyanis megfizethetőbb, nyílt versenytársként férkőzött be az olyan „érvelő” modellek közé, mint amilyen az OpenAI remekműve.

A nagy nyelvi modell (angolul large language model, LLM) olyan számítási modell, amely óriási mennyiségű szövegből tanulva képessé válik nyelv(ek) létrehozására vagy más természetes nyelvi feldolgozási munka elvégzésére.

Fej-fej mellett

A mesterséges intelligencia napjainkban már inkább tekinthető iparágnak, mint informatikai tudományágnak: ez a helyzet a 2000-es évek elejinek a fordítottja, amikor a neurális hálók és a generatív mesterséges intelligencia még nem terjedtek el széles körben. 2006 előtt a figyelemre méltónak számító MI-modellek kevesebb mint 20 százalékát állította elő az ipar. 2023-ban viszont már a 60 százalékát, 2024-ben pedig közel 90 százalékát.

Az Egyesült Államok továbbra is az első helyen áll a jelentősebbnek számító modellek előállításában, Kína azonban folyamatosan zárkózik fel. Ezen kívül számos más régió is fokozatosan csatlakozik a versenyhez úgy mint Európa, a Közel-Kelet, Latin-Amerika és Délkelet-Ázsia.

A mesterségesintelligencia-modelleket fejlesztő cégek versenyfutása most bontakozik ki igazán
Forrás: Wikimedia Commons

A minőség tekintetében az Egyesült Államok korábbi előnye gyakorlatilag „elolvadt”. Kína, amely a legtöbb mesterséges intelligenciával kapcsolatos publikációt és szabadalmat jegyzi, most olyan modelleket fejleszt, amelyek teljesítményükben megfelelnek az amerikai versenytársaikénak. 2023-ban a kínaiak még közel 20 százalékponttal maradtak el a legjobb amerikai modelltől a Massive Multitask Language Understanding (MMLU) teszten, mely a nagy nyelvi modellek általános viszonyítási alapjául szolgáló felmérés. Ám a 2024-es év végére az amerikai előny már 0,3 százalékpontra apadt. Kína 2015 tájékán indult el azon az úton, hogy a mesterségesintelligencia-fejlesztések egyik vezető szereplője legyen, és ezt az oktatásba történő irdatlan mértékű befektetésekkel érte el. Most látjuk, hogy ez végül kifizetődő lett.

E fejlesztési területen döbbenetes módon felszaporodtak a nyílt forrású (amik persze vélhetően nem teljes egészében azok) modellek – például a már említett kínai DeepSeek, vagy az amerikai Meta vállalat által fejlesztett LLaMa – száma és teljesítménye is. A felhasználók szabadon megtekinthetik azokat a paramétereket, amelyeket ezek a modellek a gépi tanulás során elsajátítanak, és különböző becslések, előrejelzések készítésére használnak. Habár nyilvánvalóan bizonyos részletek titokban maradnak.

Eredetileg a zárt forrásúak, amelyeknél egyik tényezőt sem hozták nyilvánosságra, jelentősen hatékonyabbnak bizonyultak, ám a teljesítménykülönbség e kategóriák (vagyis a nyílt és a zárt) között 2024 elejére 8, 2025 elejére pedig mindössze 1,7 százalékra csökkent. Valószínűleg emiatt is, a kaliforniai San Franciscóban működő OpenAI vállalat, amely a ChatGPT nevű, népszerű „csevegőbotot” fejlesztette ki, azt tervezi, hogy a jövőben kiad egy nyíltabb forrású modellt.

A globális hírnevet szerzett ChatGPT komoly vetélytársakkal kénytelen szembenézni a jövőben
Forrás: Wikimedia Commons

Jobb, kisebb, olcsóbb

A ChatGPT 2022-es nyilvános bevezetése után a fejlesztők a legtöbb energiát a modellek jobbá tételére fordították. A kutatások szerint ez a tendencia folytatódik: egy napjainkban vezető szerepben lévő mesterségesintelligencia-modell betanításához felhasznált energia évente megduplázódik; a modellenként felhasznált számítási erőforrások mennyisége öthavonta ugyancsak megduplázódik; a betanított adathalmazok mérete pedig nyolchavonta szintén megduplázódik.

A cégek azonban kisebb, ám ugyanolyan jól alkalmazható modelleket is piacra dobnak. A legkisebb modell 2022-ben például 540 milliárd paramétert használt, 2024-ben ugyanazt a teljesítményt mindössze 3,8 milliárd paraméterrel érték el. A kisebb modellek előnyei, hogy rövidebb idő alatt létrehozhatók és kevesebb energiát használnak fel, mint a nagyobbak.

Habár az elemzők szerint például a hatalmas adatközpontok jelenleg a Föld éves villamosenergia-szükségletének csak kisebb részét használják fel, a mesterséges intelligencia robbanásszerű fejlődése ezt mindenképpen növelni fogja, így nem árt, ha olyan modellekkel is foglalkoznak, amelyeknél az energiahatékonyság is szempont. A Nemzetközi Energiaügynökség (International Energy Agency, IEA) becslése szerint az ilyen létesítmények által felhasznált villamos energia mennyisége 2022-ben 240-340 TWh (terawattóra) volt, azaz a világszükséglet 1-1,3 százaléka. Ha a kriptovaluta-bányászatot és az adatátviteli infrastruktúrát is beleszámítjuk, akkor ez az arány 2 százalék. (Összehasonlítva, például kifejezetten az épületek hűtésére alkalmazott légkondicionáló berendezések energiaszükségletével, ez az arány már 5 százalék felett jár, és a becslések szerint a jelenlegi ütemben haladva 2050-re a 12-13 százalékot is elérheti.)

Felülmúlni az elődöket

Egyes kisebb modellek képesek a nagyobbak viselkedését utánozni (emuláció), vagy a régebben megjelenteknél jobb algoritmusok és hardverek előnyeit kihasználni. A napvilágot látott friss index szerint az MI-t használó rendszerek által igénybe vett fizikai eszközök átlagos energiahatékonysága is évről évre javul.

A generatív mesterséges intelligencia bármilyen vad elképzelést képes vizuális formába önteni
Forrás: Wikimedia Commons

Annak ellenére, hogy számos gyakori teljesítményteszten szembetűnő fejlődést értek el, az elemzés rávilágít arra, hogy a generatív mesterséges intelligencia még továbbra is szenved olyan problémáktól, mint az implicit (rejtett) elfogultság és a „hallucinációra” való hajlam, vagyis a gép szerint is valóságosnak gondolt, ám igazából hamis információk szolgáltatása. Így bár sok szempontból e modellek lenyűgöző képességekkel rendelkeznek, más szempontból viszont kissé riasztó, milyen nevetséges hibákat képesek ejteni.

További hírek