A mesterséges intelligencia vajon lefordítja a delfinek nyelvét?

Vajon a mesterséges intelligencia mennyire lesz használható az állatok beszédének megértésében? Elképzelhető, hogy a kutyák, delfinek, ámbráscetek nyelvét is értelmezi majd? De az is kérdés, szükség lesz-e még építészekre?

Évek óta velünk van a gépi fordítás.

A Google után a DeepL nevű online szolgáltatással barátkoztunk meg legjobban, amely 5000 karakteres darabokban egész jól lefordította a bele copy-paste-lt, német, angol stb. nyelvű szövegeket.

A karakterszám-korlát az ingyenes, nyilvános változat korlátja, amely

a legutóbbi hónapokban bizonyos hanyatlási jeleket mutat: rosszabbul fordít, mint annak előtte.

Eleve bajai voltak az egyeztetéssel: simán egyes számú mellékmondatot tett egy többes számú után, de mostanában az igevonzatokat is eltéveszti. (Példák: „Tegnap láttam kutyákat, amely hangosan ugatott.” Vagy: „Kata megharagudott Péterrel.” A valóban elrontott esetek ennél bonyolultabbak, de a hibák ugyanezek.)  Nehéz nem arra gondolni, hogy a ChatGPT és számos más generatív MI-alkalmazás mintájára „igazi” szolgáltatást csak a fizetős változattól lehet elvárni. A történelmi hitelesség miatt megjegyezzük, hogy a DeepL nem generatív MI-ként tűnt fel, de nem zárható ki, hogy működési modelljében megjelent, vagy meg fog jelenni ez a fajta technológia.

Nemcsak emberi nyelvről lehet fordítani.

Robert Merle „Állati elmék” című, 1967-es könyve nyomán sokunknak támadt az a véleménye, hogy nem a kozmikus háttérzajban kellene a galaktikus intelligencia nyomait keresni, előbb fejtsük meg az intelligens tengeri emlősök nyelvét.

Nos, ez eddig nem történt meg, mindenesetre a delfineket azóta sikerült betanítani aknakeresésre, de ezt, a 60-as években indult programot a delfinek magas tartási költségei miatt mintegy 10 éve beszüntették.

Megértjük valaha az ámbrásceteket?

Csakhogy nemcsak a delfinek beszélnek, hanem egyéb cetfélék is, például az ámbráscetek.

Egy amerikai kutatócsoport évek óta figyel egy ámbráscet-csoportot, amelynek dinamikája az elefántokéhoz hasonló: egymással rokonságban álló nőstényekből áll a „csorda”, a fiatal hímeket ivarérésük után elkergetik, és csak a párzási időszakban találkoznak hímekkel.

A csoportban megfigyelhető a hierarchia, és számos, társasági viselkedésforma, beleértve a hangalapú kommunikáció.

A megfigyelést nagymértékben nehezíti, hogy az ámbráscetek évente több tízezer kilométert tesznek meg, és egy-egy alkalommal több mint egy órát is akár több száz méter mélyen a víz alatt tartózkodnak, fő táplálékukat, a tintahalféléket üldözve – szóval a kutatócsoport kitartását nem lehet eléggé megbecsülni.

Tevékenységük egyik legnagyobb eredménye, hogy kiderült: nem az „énekük” a kommunikáció, hanem a korábban echolokációs tájékozódási célúnak gondolt „csattogás”. Ilyen céllal is csattognak, ahogy a denevérek füttyögnek vagy a delfinek szintén csattognak, de igen gyakran megfigyelhető náluk egyfajta ritmikus, változó hangminta, amely a lovak patájának a kövezeten való kopogásához hasonló.

Több, sok órányi hangfelvételt gyűjtöttek össze, az utóbbi években már úgy, hogy meglehetős nehézségek árán sikerült felvevőkészüléket rögzíteni az egyedekre – ami többek között lehetőséget nyújtott a felvételek helyének rögzítésére, és bizonyos tevékenységekhez kötni a hangcsoportokat.

Ámbrás cetek csoportja
Ámbrás cetek csoportja
Forrás: goodnewsnetwork.org, Vitaly Sokol

Kutatásukról nyilvánosságra került legfrissebb fejlemény, hogy be fogják táplálni a felvételeket az OpenAI cég ChatGPT nevű mesterségesintelligencia-megoldásába. Ehhez még körülbelül másfél évnyi hangfelvétel szükséges, mert a csattogásnak nem a hangmagassága hordozza az információt, hanem a csattanások közötti időközök váltakozása (a kommunikáció mondhatni frekvenciamodulált), ezért kicsi az információsűrűség. A generatív MI elegendő megbízhatóságú betanításához pedig sok (sok-sok-sok) információ szükséges.

Viszont az egyik kutatóban felmerült a következő kétely: a ChatGPT mindenképpen fel fog tárni mintákat az anyagban, ezek alapján fel fog állítani nyelvtani szabályokat, össze fog állítani „mondatokat”, le fogják játszani a ceteknek, és ők reagálni is fognak rá, sőt válaszolnak is, ezt az MI értelmezi, visszaválaszol stb. Épp csak mi emberek nem fogunk megérteni semmit mindebből…

A kétely a generatív MI egyik legnagyobb korlátjára világít rá: nemcsak a minták, a statisztika, a szabályok számítanak, hanem a kontextus is – amelynek az ámbráscetek életének tűpontos és részletes megismerése nélkül nem jutunk a birtokába.

Az építészet végének kezdete

Rengeteg építészeti fotó létezik. Az építészeti fotó az, amelyen egy ház része vagy egésze látható, az a fő téma.

Sok száz millió ilyen érhető el online – ideális betanító anyag egy tematikus generatív mesterségesintellegencia-szolgáltatáshoz, még az a szűk részhalmaza is, amelyek szerzői jogát megnyugtatóan lehet rendezni. Erre alapította üzletmenetét egy XKool Technologies nevű kínai startup Szencsenben. Nem pontos a helymeghatározás, mert ez a „város” mintegy 20 millió lakosú, a „szencseni különleges gazdasági körzet” székhelye.

Szóval, van egy webhely, ahol csekély díjazás fejében ilyen „promptokra”, hogy „tervezz hiperluxus villát Le Corbusier stílusában” néhány perc alatt az alábbi kép keletkezik:

Villa Le Corbusier stílusában
Villa Le Corbusier stílusában
Forrás: XKool

A dermesztő ebben az, hogy az építészeti szoftver a struktúrát is a látvány alá teszi bizonyos szintig, tehát a képen látható objektumot több-kevesebb eltéréssel fel is lehet építeni. További dermesztés, hogy a brit lapban leközölt, egészen valószínűtlen inputokra is szinte valóságos outputokat generál az intelligencia:

Középen látható az input, egy meggyűrt papírlap, balra az épület, egy szálloda, Frank Gehry, jobbra pedig ugyanaz Zaha Hadid sztárépítész stílusában.
Középen látható az input, egy meggyűrt papírlap, balra az épület, egy szálloda, Frank Gehry, jobbra pedig ugyanaz Zaha Hadid sztárépítész stílusában.
Forrás: XKool

Egyelőre az építészek nem vonultak be testületileg a tengerbe egy lankás parton, hanem a koncepciós, ajánlati tervezésben eredménnyel és hatékonyan alkalmazzák az XKoolt és hasonló szolgáltatásokat. Ahogy a szöveggeneráló GenMI-alkalmazásokat az újságírók, marketingesek, üzleti elemzők stb., az építészetieket is a megrendelő felé tanúsított válaszidő tetemes rövidítésére használják ki.

Lassan közismertté kell váljon, hogy a generatív MI outputját a „hallucinációk” és amiatt, hogy az eredményért az ember felelős, kizárólag alapos ellenőrzés és kritika mellett szabad felhasználni. Mint az szintén közismert, hogy hallucinációnak nevezik azt a jelenséget, amikor a GenMI kimenete nyelvileg teljesen helyes, érthető, csak éppen a tartalmának semmi köze a valósághoz.

További hírek