fbpx

Teljesen lecserélhetők lesznek a műsorvezetők a tévében, átveszi helyüket a mesterséges intelligencia?

Teljesen lecserélhetők lesznek a műsorvezetők? Nem csoda, hogy a kérdés felmerül, miután a Duna csatorna bemutatta a Delta tudományos rovatának virtuális műsorvezetőjét, Bíró Adát. A deep fake és a hangklónozás világában a tévés műsorvezetők virtualizálása szinte magától értetődő. Áttekintjük, miért is nem volt ez annyira nehéz.

A múlt évezred utolsó évében jelent meg a „Mátrix” című film, amely nemcsak Keanu Reeves lassított limbópóza miatt lett kultfilm, hanem mert a fősodorba emelte a digitális, virtuális valóságot – amelynek analóg változatát a tudatmódosítókkal életvitelszerűen élők már jól ismertek.

Az ipar beérett

A második részében jelent meg John Smith ügynök (Hugo Weaving) 100 különböző példányban, ez az effekt pedig Bíró Ada összetevőinek nagyobb részét már tartalmazta. Lássuk csak:

– élő, valódi színész,

– jelmezének digitalizált változatai,

– a színész testének digitális, kinematikailag eléggé helyes modellje,

– az ábrázolt mozgás felvétele úgy, hogy a modellre átvihető legyen (motion capture).

Ezek a komponensek az elmúlt 24 év összes sikeres filmjében jelen voltak, az idők során a technológia minden egyes elemét begyakorolták, tökéletesítették, optimalizálták, mondhatni az ipar beérett. A fejlesztőeszközök (szoftverek, számítógépek, a motion-capture segédeszközök stb. az egyedi, speciális jellegű, high-tech kategóriából átkerültek a kereskedelemben kapható, általánosan elérhető végfelhasználói termék kategóriába.

Az idevágó példa a harckocsik aktív lövegstabilizátorának technikáján alapuló ún „steadycam”, az a dolog, amely a szereplő mögött futó operatőr nyakában lógva mozdulatlanul tartja a kamerát – és ma „gimbal” néven 10-30 ezer forintért kapható a diszkontáruházak mobiltelefonos pop-up pultjainál. (Jó, nem egy profi stabilizátor, de három motor működik benne, hogy a rá szerelt okostelefon egyhelyben maradjon.)

Ahogy ez már annyiszor megtörtént, a high-tech eredmények fokozatosan átalakulnak a mindennapi állampolgárok által igénybe vehető szolgáltatássá. Így történt például a repüléssel, a számítógéppel, az internettel – és most a virtuális partnerekkel, személyekkel.

Az Avatar forradalmi változásokat hozott 15 éve
Az Avatar forradalmi változásokat hozott 15 éve
Forrás: Flickr

Megemlítjük a 2009-es „Avatar” című filmet, amely az arcjáték (mimika) felvételében és a virtuális karakterre való átvitelében volt forradalmi – 15 évvel ezelőtt.

Azóta a nézőnek fogalma sem lehet arról, hogy mi valódi a filmben, és mi származik a számítógépből, sejthetően az előbbi egyre kevesebb.

Elmeséljük azt a történetet, hogy az 1999-2003 között forgatott Gyűrűk Ura film egyik főszereplőjét, Gandalfot játszó Ian McKellan a forgatás egyik legnagyobb kihívásaként élte meg „nagy utazást” megelőző, törpöktől nyüzsgő és zajos vacsorajelenetet. Amelyet egyes-egyedül kellett eljátszania a zöld vászon előtt, minden egyes pillanatban a megfelelő irányba nézve és beszélve – mert a számítógép generálta törpök akkor még nem voltak ott.

Ian McKellen Galdalfként nehezen bírta a felvételt a virtuális törpökkel
Ian McKellen Galdalfként nehezen bírta a felvételt a virtuális törpökkel
Forrás: Flickr, / Colin Campbell

A tévéstúdiókba is virtuális bútorokat tesznek

Az is megér egy mondatot, hogy a videókonferencia-szoftverek háttérgenerálói mennyit javultak a járvány óta. Ha már itt tartunk: a tévéstúdiók háttere egyre nagyobb mértékben virtuális. Szó nincs arról, hogy azokat a futurisztikus, erősen designos bútorokat, berendezési tárgyakat a díszletezők és kellékesek legyártassák, elkészítsék, felépítsék. A grafikusok 3D-ben megrajzolják, és a digitális adásba a számítógépes modellek virtuálisan kerülnek bele – valós időben.

Amint az több, Bíró Adát méltató cikkben megjelent, nem ő az első virtuális bemondó: az „Ananova” nevű szoftvert említik, szintén 2000-2004 környékéről. Nem valós időben, az előre megírt szöveget mondta el a vonzó, női beszélő fej. Hasonló szolgáltatásokról folyamatosan érkeztek hírek, egyre javult a kép- és hangminőség.

Ananova - az egyik előzmény
Ananova – az egyik előzmény
Forrás: Wikipedia

2022-ben aztán beütött a generatív mesterséges intelligencia.

Az eltelt két év alatt egy sor nyílt forrású erőforrás keletkezett, ami azt jelenti, hogy gyakorlatilag bárki előállíthat MI-alapú végterméket, legyen az szöveg, fotó, elmondott szöveg, videófelvétel.

Nyilván sok hozzáértés kell a profi végeredményhez, a nem nagyon profihoz kevesebb… ha már itt tartunk, a nyílt forrású szoftver-szcéna egyik legnagyobb projektje a „Blender” nevű, több évtizede fejlődő 3D animációs alkalmazás, sok száz önkéntes hozzájárulóval és több tíz főállású alkalmazottal, és számtalan, a StarWars animációs sorozatéval egyenértékű technikai színvonalú filmmel.

Aki ismert, nem lesz virtuális

Szóval, Bíró Ada megjelenése szükségszerű volt. Nyilván élő szereplő „mozogta le”, nyilván élő nő bőre és valódi ruha nagy felbontású beszkennelésével készítették a felületi textúrákat. Az a bizonyos „uncanny valley”, a nyilvánvalóan virtuális személyek látványakor keletkező belső borzongás nem nagyon mély, azaz Ada meglehetősen valóságos. Igen, észrevehető, hogy ugyanazokkal a mozdulatokkal gesztikulál (abban a mintegy 40 másodpercnyi anyagban, amennyi eddig látható).

Igen, a szem-, száj- és arcbőr-mozgása nincs teljes szinkronban, mondhatni hál’ Istennek, egyébként valós személynek tartanánk.

Mindezek javulni fognak, nem mellékesen a kapott reakciók alapján: ez is megszokott a digitális világban, hogy egy nem teljesen kész verziót bocsátanak ki, hogy majd közösségi intelligencia vezérelje a véglegest.

Az is szokásos zsurnalizmus, hogy „Mi lesz a műsorvezetőkkel, ha mindenki virtuális lesz?” Nem lesz mindenki virtuális, mert az ismert személyek üzleti értékéről nem mondanak le a szerződött partnereik. Ha őróluk készül virtuális műsor, azt jelezni fogják, már csak azért is, mert azért nekik (és alkalmazójuknak) jogdíj jár majd.

A vesztesek a másod-harmadvonalbeli alkotók lesznek, ugyanúgy, mint a ponyva-krimik írói, a háttérzenék készítői, a nem drága mesekönyvek illusztrátorai.

Csak reménykedhetünk, hogy az MI kihasználói tömegesen rádöbbennek, hogy csak az az MI-tartalom használható, amely valódi tartalommal végzett „betanítással” keletkezett.

Keveset hangsúlyozott, de valódi veszély, hogy az MI-k minősége rohamosan csökken, ha a betanításhoz használt tartalomban nő az MI aránya: amikor az MI a saját farkába harap. Ezért életfontosságú, hogy az MI-eredetet jelezni kellene, hogy ne hasznosítsák újra. Az MI hosszú távú működtetéséhez elengedhetetlen a valódi, humán eredetű tartalom folyamatos keletkezése.

Keserű lezárás, de Bíró Ada megszületése mondhatni „valóságos” tartalommal tölti meg a „biodíszlet” szót…

További hírek