Vajon a mesterséges intelligencia mennyire lesz használható az állatok beszédének megértésében? Elképzelhető, hogy a kutyák, delfinek, ámbráscetek nyelvét is értelmezi majd? De az is kérdés, szükség lesz-e még építészekre?
Évek óta velünk van a gépi fordítás.
A Google után a DeepL nevű online szolgáltatással barátkoztunk meg legjobban, amely 5000 karakteres darabokban egész jól lefordította a bele copy-paste-lt, német, angol stb. nyelvű szövegeket.
A karakterszám-korlát az ingyenes, nyilvános változat korlátja, amely
a legutóbbi hónapokban bizonyos hanyatlási jeleket mutat: rosszabbul fordít, mint annak előtte.
Eleve bajai voltak az egyeztetéssel: simán egyes számú mellékmondatot tett egy többes számú után, de mostanában az igevonzatokat is eltéveszti. (Példák: „Tegnap láttam kutyákat, amely hangosan ugatott.” Vagy: „Kata megharagudott Péterrel.” A valóban elrontott esetek ennél bonyolultabbak, de a hibák ugyanezek.) Nehéz nem arra gondolni, hogy a ChatGPT és számos más generatív MI-alkalmazás mintájára „igazi” szolgáltatást csak a fizetős változattól lehet elvárni. A történelmi hitelesség miatt megjegyezzük, hogy a DeepL nem generatív MI-ként tűnt fel, de nem zárható ki, hogy működési modelljében megjelent, vagy meg fog jelenni ez a fajta technológia.
Nemcsak emberi nyelvről lehet fordítani.
Robert Merle „Állati elmék” című, 1967-es könyve nyomán sokunknak támadt az a véleménye, hogy nem a kozmikus háttérzajban kellene a galaktikus intelligencia nyomait keresni, előbb fejtsük meg az intelligens tengeri emlősök nyelvét.
Nos, ez eddig nem történt meg, mindenesetre a delfineket azóta sikerült betanítani aknakeresésre, de ezt, a 60-as években indult programot a delfinek magas tartási költségei miatt mintegy 10 éve beszüntették.
Megértjük valaha az ámbrásceteket?
Csakhogy nemcsak a delfinek beszélnek, hanem egyéb cetfélék is, például az ámbráscetek.
Egy amerikai kutatócsoport évek óta figyel egy ámbráscet-csoportot, amelynek dinamikája az elefántokéhoz hasonló: egymással rokonságban álló nőstényekből áll a „csorda”, a fiatal hímeket ivarérésük után elkergetik, és csak a párzási időszakban találkoznak hímekkel.
A csoportban megfigyelhető a hierarchia, és számos, társasági viselkedésforma, beleértve a hangalapú kommunikáció.
A megfigyelést nagymértékben nehezíti, hogy az ámbráscetek évente több tízezer kilométert tesznek meg, és egy-egy alkalommal több mint egy órát is akár több száz méter mélyen a víz alatt tartózkodnak, fő táplálékukat, a tintahalféléket üldözve – szóval a kutatócsoport kitartását nem lehet eléggé megbecsülni.
Tevékenységük egyik legnagyobb eredménye, hogy kiderült: nem az „énekük” a kommunikáció, hanem a korábban echolokációs tájékozódási célúnak gondolt „csattogás”. Ilyen céllal is csattognak, ahogy a denevérek füttyögnek vagy a delfinek szintén csattognak, de igen gyakran megfigyelhető náluk egyfajta ritmikus, változó hangminta, amely a lovak patájának a kövezeten való kopogásához hasonló.
Több, sok órányi hangfelvételt gyűjtöttek össze, az utóbbi években már úgy, hogy meglehetős nehézségek árán sikerült felvevőkészüléket rögzíteni az egyedekre – ami többek között lehetőséget nyújtott a felvételek helyének rögzítésére, és bizonyos tevékenységekhez kötni a hangcsoportokat.

Forrás: goodnewsnetwork.org, Vitaly Sokol
Kutatásukról nyilvánosságra került legfrissebb fejlemény, hogy be fogják táplálni a felvételeket az OpenAI cég ChatGPT nevű mesterségesintelligencia-megoldásába. Ehhez még körülbelül másfél évnyi hangfelvétel szükséges, mert a csattogásnak nem a hangmagassága hordozza az információt, hanem a csattanások közötti időközök váltakozása (a kommunikáció mondhatni frekvenciamodulált), ezért kicsi az információsűrűség. A generatív MI elegendő megbízhatóságú betanításához pedig sok (sok-sok-sok) információ szükséges.
Viszont az egyik kutatóban felmerült a következő kétely: a ChatGPT mindenképpen fel fog tárni mintákat az anyagban, ezek alapján fel fog állítani nyelvtani szabályokat, össze fog állítani „mondatokat”, le fogják játszani a ceteknek, és ők reagálni is fognak rá, sőt válaszolnak is, ezt az MI értelmezi, visszaválaszol stb. Épp csak mi emberek nem fogunk megérteni semmit mindebből…
A kétely a generatív MI egyik legnagyobb korlátjára világít rá: nemcsak a minták, a statisztika, a szabályok számítanak, hanem a kontextus is – amelynek az ámbráscetek életének tűpontos és részletes megismerése nélkül nem jutunk a birtokába.
Az építészet végének kezdete
Rengeteg építészeti fotó létezik. Az építészeti fotó az, amelyen egy ház része vagy egésze látható, az a fő téma.
Sok száz millió ilyen érhető el online – ideális betanító anyag egy tematikus generatív mesterségesintellegencia-szolgáltatáshoz, még az a szűk részhalmaza is, amelyek szerzői jogát megnyugtatóan lehet rendezni. Erre alapította üzletmenetét egy XKool Technologies nevű kínai startup Szencsenben. Nem pontos a helymeghatározás, mert ez a „város” mintegy 20 millió lakosú, a „szencseni különleges gazdasági körzet” székhelye.
Szóval, van egy webhely, ahol csekély díjazás fejében ilyen „promptokra”, hogy „tervezz hiperluxus villát Le Corbusier stílusában” néhány perc alatt az alábbi kép keletkezik:

Forrás: XKool
A dermesztő ebben az, hogy az építészeti szoftver a struktúrát is a látvány alá teszi bizonyos szintig, tehát a képen látható objektumot több-kevesebb eltéréssel fel is lehet építeni. További dermesztés, hogy a brit lapban leközölt, egészen valószínűtlen inputokra is szinte valóságos outputokat generál az intelligencia:

Forrás: XKool
Egyelőre az építészek nem vonultak be testületileg a tengerbe egy lankás parton, hanem a koncepciós, ajánlati tervezésben eredménnyel és hatékonyan alkalmazzák az XKoolt és hasonló szolgáltatásokat. Ahogy a szöveggeneráló GenMI-alkalmazásokat az újságírók, marketingesek, üzleti elemzők stb., az építészetieket is a megrendelő felé tanúsított válaszidő tetemes rövidítésére használják ki.
Lassan közismertté kell váljon, hogy a generatív MI outputját a „hallucinációk” és amiatt, hogy az eredményért az ember felelős, kizárólag alapos ellenőrzés és kritika mellett szabad felhasználni. Mint az szintén közismert, hogy hallucinációnak nevezik azt a jelenséget, amikor a GenMI kimenete nyelvileg teljesen helyes, érthető, csak éppen a tartalmának semmi köze a valósághoz.