A mesterséges intelligencia vajon lefordítja a delfinek nyelvét?

Vajon a mesterséges intelligencia mennyire lesz használható az állatok beszédének megértésében? Elképzelhető, hogy a kutyák, delfinek, ámbráscetek nyelvét is értelmezi majd? De az is kérdés, szükség lesz-e még építészekre?

Évek óta velünk van a gépi fordítás.

A Google után a DeepL nevű online szolgáltatással barátkoztunk meg legjobban, amely 5000 karakteres darabokban egész jól lefordította a bele copy-paste-lt, német, angol stb. nyelvű szövegeket.

A karakterszám-korlát az ingyenes, nyilvános változat korlátja, amely

a legutóbbi hónapokban bizonyos hanyatlási jeleket mutat: rosszabbul fordít, mint annak előtte.

Eleve bajai voltak az egyeztetéssel: simán egyes számú mellékmondatot tett egy többes számú után, de mostanában az igevonzatokat is eltéveszti. (Példák: „Tegnap láttam kutyákat, amely hangosan ugatott.” Vagy: „Kata megharagudott Péterrel.” A valóban elrontott esetek ennél bonyolultabbak, de a hibák ugyanezek.) Nehéz nem arra gondolni, hogy a ChatGPT és számos más generatív MI-alkalmazás mintájára „igazi” szolgáltatást csak a fizetős változattól lehet elvárni. A történelmi hitelesség miatt megjegyezzük, hogy a DeepL nem generatív MI-ként tűnt fel, de nem zárható ki, hogy működési modelljében megjelent, vagy meg fog jelenni ez a fajta technológia.

Nemcsak emberi nyelvről lehet fordítani.

Robert Merle „Állati elmék” című, 1967-es könyve nyomán sokunknak támadt az a véleménye, hogy nem a kozmikus háttérzajban kellene a galaktikus intelligencia nyomait keresni, előbb fejtsük meg az intelligens tengeri emlősök nyelvét.

Nos, ez eddig nem történt meg, mindenesetre a delfineket azóta sikerült betanítani aknakeresésre, de ezt, a 60-as években indult programot a delfinek magas tartási költségei miatt mintegy 10 éve beszüntették.

Megértjük valaha az ámbrásceteket?

Csakhogy nemcsak a delfinek beszélnek, hanem egyéb cetfélék is, például az ámbráscetek.

Egy amerikai kutatócsoport évek óta figyel egy ámbráscet-csoportot, amelynek dinamikája az elefántokéhoz hasonló: egymással rokonságban álló nőstényekből áll a „csorda”, a fiatal hímeket ivarérésük után elkergetik, és csak a párzási időszakban találkoznak hímekkel.

A csoportban megfigyelhető a hierarchia, és számos, társasági viselkedésforma, beleértve a hangalapú kommunikáció.

A megfigyelést nagymértékben nehezíti, hogy az ámbráscetek évente több tízezer kilométert tesznek meg, és egy-egy alkalommal több mint egy órát is akár több száz méter mélyen a víz alatt tartózkodnak, fő táplálékukat, a tintahalféléket üldözve – szóval a kutatócsoport kitartását nem lehet eléggé megbecsülni.

Tevékenységük egyik legnagyobb eredménye, hogy kiderült: nem az „énekük” a kommunikáció, hanem a korábban echolokációs tájékozódási célúnak gondolt „csattogás”. Ilyen céllal is csattognak, ahogy a denevérek füttyögnek vagy a delfinek szintén csattognak, de igen gyakran megfigyelhető náluk egyfajta ritmikus, változó hangminta, amely a lovak patájának a kövezeten való kopogásához hasonló.

Több, sok órányi hangfelvételt gyűjtöttek össze, az utóbbi években már úgy, hogy meglehetős nehézségek árán sikerült felvevőkészüléket rögzíteni az egyedekre – ami többek között lehetőséget nyújtott a felvételek helyének rögzítésére, és bizonyos tevékenységekhez kötni a hangcsoportokat.

Ámbrás cetek csoportja
Forrás: goodnewsnetwork.org, Vitaly Sokol

Kutatásukról nyilvánosságra került legfrissebb fejlemény, hogy be fogják táplálni a felvételeket az OpenAI cég ChatGPT nevű mesterségesintelligencia-megoldásába. Ehhez még körülbelül másfél évnyi hangfelvétel szükséges, mert a csattogásnak nem a hangmagassága hordozza az információt, hanem a csattanások közötti időközök váltakozása (a kommunikáció mondhatni frekvenciamodulált), ezért kicsi az információsűrűség. A generatív MI elegendő megbízhatóságú betanításához pedig sok (sok-sok-sok) információ szükséges.

Viszont az egyik kutatóban felmerült a következő kétely: a ChatGPT mindenképpen fel fog tárni mintákat az anyagban, ezek alapján fel fog állítani nyelvtani szabályokat, össze fog állítani „mondatokat”, le fogják játszani a ceteknek, és ők reagálni is fognak rá, sőt válaszolnak is, ezt az MI értelmezi, visszaválaszol stb. Épp csak mi emberek nem fogunk megérteni semmit mindebből…

A kétely a generatív MI egyik legnagyobb korlátjára világít rá: nemcsak a minták, a statisztika, a szabályok számítanak, hanem a kontextus is – amelynek az ámbráscetek életének tűpontos és részletes megismerése nélkül nem jutunk a birtokába.

Az építészet végének kezdete

Rengeteg építészeti fotó létezik. Az építészeti fotó az, amelyen egy ház része vagy egésze látható, az a fő téma.

Sok száz millió ilyen érhető el online – ideális betanító anyag egy tematikus generatív mesterségesintellegencia-szolgáltatáshoz, még az a szűk részhalmaza is, amelyek szerzői jogát megnyugtatóan lehet rendezni. Erre alapította üzletmenetét egy XKool Technologies nevű kínai startup Szencsenben. Nem pontos a helymeghatározás, mert ez a „város” mintegy 20 millió lakosú, a „szencseni különleges gazdasági körzet” székhelye.

Szóval, van egy webhely, ahol csekély díjazás fejében ilyen „promptokra”, hogy „tervezz hiperluxus villát Le Corbusier stílusában” néhány perc alatt az alábbi kép keletkezik:

Villa Le Corbusier stílusában
Forrás: XKool

A dermesztő ebben az, hogy az építészeti szoftver a struktúrát is a látvány alá teszi bizonyos szintig, tehát a képen látható objektumot több-kevesebb eltéréssel fel is lehet építeni. További dermesztés, hogy a brit lapban leközölt, egészen valószínűtlen inputokra is szinte valóságos outputokat generál az intelligencia:

Középen látható az input, egy meggyűrt papírlap, balra az épület, egy szálloda, Frank Gehry, jobbra pedig ugyanaz Zaha Hadid sztárépítész stílusában.
Forrás: XKool

Egyelőre az építészek nem vonultak be testületileg a tengerbe egy lankás parton, hanem a koncepciós, ajánlati tervezésben eredménnyel és hatékonyan alkalmazzák az XKoolt és hasonló szolgáltatásokat. Ahogy a szöveggeneráló GenMI-alkalmazásokat az újságírók, marketingesek, üzleti elemzők stb., az építészetieket is a megrendelő felé tanúsított válaszidő tetemes rövidítésére használják ki.

Lassan közismertté kell váljon, hogy a generatív MI outputját a „hallucinációk” és amiatt, hogy az eredményért az ember felelős, kizárólag alapos ellenőrzés és kritika mellett szabad felhasználni. Mint az szintén közismert, hogy hallucinációnak nevezik azt a jelenséget, amikor a GenMI kimenete nyelvileg teljesen helyes, érthető, csak éppen a tartalmának semmi köze a valósághoz.

A szexrobotok hamarosan eláraszthatják a világot

Miért nem Rubik Ernőé a Rubik-kocka joga?

Hogyan vált Irán a Közel-Kelet Nyugatot fenyegető konfliktusforrásává?

A leggazdagabb magyar családok

A mesterséges intelligencia vajon lefordítja a delfinek nyelvét?

Kapcsolódó cikkek

További hírek

A szexrobotok hamarosan eláraszthatják a világot

Miért nem Rubik Ernőé a Rubik-kocka joga?

Hogyan vált Irán a Közel-Kelet Nyugatot fenyegető konfliktusforrásává?

A leggazdagabb magyar családok

Sarki fényt fotóztak Nagykanizsán – Nézze meg!

Franciaországban nagyon nő az antiszemita cselekmények száma