A mesterséges intelligencia terjedése egyre fokozódik: a kínai MI-modellek száma egyre gyarapszik, és minősége is javul, ezzel mind jobban igényt formálva az Egyesült Államok vezető helyére, a csúcsmodellek különbsége pedig egyik napról a másikra csökken – derül ki egy az iparág helyzetéről szóló kimutatásból.
Az összefoglaló munka kiemeli, hogy az MI gyors fejlődésével egyetlen jelenleg még élen álló cég sem tudhatja magát biztonságban. A Chatbot Arena Leaderboardon, ahol a felhasználók szavazatai döntenek a különböző botok teljesítményéről, míg a legjobban rangsorolt modell 2024 elején mintegy 12 százalékkal magasabb pontszámot ért el, mint a tizedik helyezett, addig 2025 elején már csak 5 százalékkal többet. A számok csökkenése jelzi, hogy az egyes modellek között egyre nagyobb a verseny – és egyre nagyobb a zsúfoltság (a rengeteg felgyülemlő modell okán).
A kaliforniai Stanford Egyetem mesterséges intelligenciával foglalkozó intézete által most közétett 2025-ös mutató szerint a figyelemre méltó generatív AI (artifical intelligence, vagyis magyarul MI) modellek átlagosan még továbbra is egyre bővülnek, mivel több döntéshozó változót, nagyobb számítási teljesítményt és szélesebb gépi tanulást segítő adathalmazt használnak.
Néhány fejlesztő rendkívüli ügyessége azonban bizonyítja, hogy a „karcsúbb” modellek is nagyszerű dolgokra képesek. A jobb algoritmusoknak köszönhetően egy korszerű, ám kisebb modell napjainkban már képes elérni azt a teljesítményt, melyet két évvel ezelőtt még csak egy százszor nagyobb modell tudott. 2024 tehát a „fapados” MI-modellek áttörésének éve volt – derül ki a felmérésből.
Bart Selman, a New York állambeli Ithacában található Cornell Egyetem informatikusa, aki bár nem vett részt az MI-index elkészítésében, azt mondta, jó látni, hogy az olyan viszonylag kicsi és olcsó erőfeszítések, mint a kínai DeepSeek, bizonyítják, hogy versenyképesek lehetnek. Sokak szerint ez a friss modell ugyanolyan szinten végez feladatokat, mint az Egyesült Államok egyik legismertebbje – és a legfontosabb, hogy a tudományos világ számára is nyitott hozzáférést biztosít a különféle elemzések, vizsgálatok elvégzéséhez. Ez a Kínában megalkotott nagy nyelvi modell globális szinten hatalmas port kavart mind a számítástechnikai ipar, mind a pénzpiacok területén, ugyanis megfizethetőbb, nyílt versenytársként férkőzött be az olyan „érvelő” modellek közé, mint amilyen az OpenAI remekműve.
Fej-fej mellett
A mesterséges intelligencia napjainkban már inkább tekinthető iparágnak, mint informatikai tudományágnak: ez a helyzet a 2000-es évek elejinek a fordítottja, amikor a neurális hálók és a generatív mesterséges intelligencia még nem terjedtek el széles körben. 2006 előtt a figyelemre méltónak számító MI-modellek kevesebb mint 20 százalékát állította elő az ipar. 2023-ban viszont már a 60 százalékát, 2024-ben pedig közel 90 százalékát.
Az Egyesült Államok továbbra is az első helyen áll a jelentősebbnek számító modellek előállításában, Kína azonban folyamatosan zárkózik fel. Ezen kívül számos más régió is fokozatosan csatlakozik a versenyhez úgy mint Európa, a Közel-Kelet, Latin-Amerika és Délkelet-Ázsia.

Forrás: Wikimedia Commons
A minőség tekintetében az Egyesült Államok korábbi előnye gyakorlatilag „elolvadt”. Kína, amely a legtöbb mesterséges intelligenciával kapcsolatos publikációt és szabadalmat jegyzi, most olyan modelleket fejleszt, amelyek teljesítményükben megfelelnek az amerikai versenytársaikénak. 2023-ban a kínaiak még közel 20 százalékponttal maradtak el a legjobb amerikai modelltől a Massive Multitask Language Understanding (MMLU) teszten, mely a nagy nyelvi modellek általános viszonyítási alapjául szolgáló felmérés. Ám a 2024-es év végére az amerikai előny már 0,3 százalékpontra apadt. Kína 2015 tájékán indult el azon az úton, hogy a mesterségesintelligencia-fejlesztések egyik vezető szereplője legyen, és ezt az oktatásba történő irdatlan mértékű befektetésekkel érte el. Most látjuk, hogy ez végül kifizetődő lett.
E fejlesztési területen döbbenetes módon felszaporodtak a nyílt forrású (amik persze vélhetően nem teljes egészében azok) modellek – például a már említett kínai DeepSeek, vagy az amerikai Meta vállalat által fejlesztett LLaMa – száma és teljesítménye is. A felhasználók szabadon megtekinthetik azokat a paramétereket, amelyeket ezek a modellek a gépi tanulás során elsajátítanak, és különböző becslések, előrejelzések készítésére használnak. Habár nyilvánvalóan bizonyos részletek titokban maradnak.
Eredetileg a zárt forrásúak, amelyeknél egyik tényezőt sem hozták nyilvánosságra, jelentősen hatékonyabbnak bizonyultak, ám a teljesítménykülönbség e kategóriák (vagyis a nyílt és a zárt) között 2024 elejére 8, 2025 elejére pedig mindössze 1,7 százalékra csökkent. Valószínűleg emiatt is, a kaliforniai San Franciscóban működő OpenAI vállalat, amely a ChatGPT nevű, népszerű „csevegőbotot” fejlesztette ki, azt tervezi, hogy a jövőben kiad egy nyíltabb forrású modellt.

Forrás: Wikimedia Commons
Jobb, kisebb, olcsóbb
A ChatGPT 2022-es nyilvános bevezetése után a fejlesztők a legtöbb energiát a modellek jobbá tételére fordították. A kutatások szerint ez a tendencia folytatódik: egy napjainkban vezető szerepben lévő mesterségesintelligencia-modell betanításához felhasznált energia évente megduplázódik; a modellenként felhasznált számítási erőforrások mennyisége öthavonta ugyancsak megduplázódik; a betanított adathalmazok mérete pedig nyolchavonta szintén megduplázódik.
A cégek azonban kisebb, ám ugyanolyan jól alkalmazható modelleket is piacra dobnak. A legkisebb modell 2022-ben például 540 milliárd paramétert használt, 2024-ben ugyanazt a teljesítményt mindössze 3,8 milliárd paraméterrel érték el. A kisebb modellek előnyei, hogy rövidebb idő alatt létrehozhatók és kevesebb energiát használnak fel, mint a nagyobbak.
Habár az elemzők szerint például a hatalmas adatközpontok jelenleg a Föld éves villamosenergia-szükségletének csak kisebb részét használják fel, a mesterséges intelligencia robbanásszerű fejlődése ezt mindenképpen növelni fogja, így nem árt, ha olyan modellekkel is foglalkoznak, amelyeknél az energiahatékonyság is szempont. A Nemzetközi Energiaügynökség (International Energy Agency, IEA) becslése szerint az ilyen létesítmények által felhasznált villamos energia mennyisége 2022-ben 240-340 TWh (terawattóra) volt, azaz a világszükséglet 1-1,3 százaléka. Ha a kriptovaluta-bányászatot és az adatátviteli infrastruktúrát is beleszámítjuk, akkor ez az arány 2 százalék. (Összehasonlítva, például kifejezetten az épületek hűtésére alkalmazott légkondicionáló berendezések energiaszükségletével, ez az arány már 5 százalék felett jár, és a becslések szerint a jelenlegi ütemben haladva 2050-re a 12-13 százalékot is elérheti.)
Felülmúlni az elődöket
Egyes kisebb modellek képesek a nagyobbak viselkedését utánozni (emuláció), vagy a régebben megjelenteknél jobb algoritmusok és hardverek előnyeit kihasználni. A napvilágot látott friss index szerint az MI-t használó rendszerek által igénybe vett fizikai eszközök átlagos energiahatékonysága is évről évre javul.

Forrás: Wikimedia Commons
Annak ellenére, hogy számos gyakori teljesítményteszten szembetűnő fejlődést értek el, az elemzés rávilágít arra, hogy a generatív mesterséges intelligencia még továbbra is szenved olyan problémáktól, mint az implicit (rejtett) elfogultság és a „hallucinációra” való hajlam, vagyis a gép szerint is valóságosnak gondolt, ám igazából hamis információk szolgáltatása. Így bár sok szempontból e modellek lenyűgöző képességekkel rendelkeznek, más szempontból viszont kissé riasztó, milyen nevetséges hibákat képesek ejteni.