Itt a ChatGPT és tényleg mindenki evvel foglalkozik. Egyesek szerint minden meg fog változni, a Google az Altavista sorsára jut, mások szerint a Kodak-sztori ismétlődik meg és van aki szerint a Google LaMDA nyelvmodellje érző lény. Joggal merül fel a lakossági kérdés; akkor most mi van?

Minden valamikor tavaly nyáron kezdődött, amikor a Google bejelentette a LaMDA nagy nyelvmodellen alpuló chatbotot. Egy Google mérnök bejelentette, meggyőződése hogy érzéssel bíró lény az új mesterséges intelligencia. Ez a mérnök ma már nem dolgozik a cégnél… Mindeközben a Google egyik vezető mérnöke arról publikált a The Economist-ban, hogy a LaMBDA-val beszélgetve már-már úgy érzi hogy értelmes társalgást folytat. Azután jött az OpenAI és a ChatGPT és azóta egyre halmozódnak a képességeit magasztaló hírek. Pl:
- képes átemenni MBA kurzusoknál használt teszteken
- képes átmenni orvosi egyetemek tesztjein
- olyan jó esszéket ír, hogy több helyen már betiltották a használatát, a tanárok félnek, hogy a felnövekvő generációk már nem fognak önállóan írni
- a programozók munkáját is el fogja venni hamarosan
- a keresésnek, ahogyan azt ma ismerjük, vége

Nem akarjuk tagadni, hogy nagy dolog a ChatGPT. Az azonban biztos, hogy nem önmagában indított egy forradalmat és nem ennek a forradalomnak a végső állomása. Alább pontokba szedtük röviden, hogy miért érdemes fenntartásokkal kezelni az elmúlt hónapok bejelentéseit és a következő hónapokban várható újabb csodákat.
- A névben a GPT feloldása Generative Pre-trained Transformer, azaz egy transformer modellel van dolgunk. Ezekkel már egy ideje együtt kell élnünk és sok már most is pl. a Google eszköztárának a része.
- Nagyon sok adattal dolgoznak a nagy nyelvmodellek (LLM, large language model) ezért nehéz frissen tartani a tudásukat. Habár a Bing és a Neeva ezt okosan megoldotta. A szinkrónia és diakrónia újra fel lett fedezve…
- A nagy nyelvmodellek hallucinálnak, azaz a válaszaik nem faktuálisak, hanem “kitalációk”. Legutóbb pl. a Facebook-nak kellett lelőnie Galactica nevű tudományos chatbotját. Bővebben erről a On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜tanulmányban lehet olvasni.
- A chatbotok fantasztikus képességei mögött többszáz, vagy akár ezer harmadik világbeli ember gyakran megalázó, kimerítő és alulfizetett munkája van. A képgenerátorok tanítóadataiból valahogy ki kell gyomlálni a felnőtt tartalmat, meg az annál is durvább dolgokat. Ugyanez a helyzet a szövegnél is. Ki akarnak hónapokig munkaidőben gyűlöletbeszédet olvasni óránként úgy bruttó 800 forintért? Az OpenAI pont ezt tette a ChatGPT tanítása során.
- Az Economist információi szerint egy ChatGPT keresés kb két centes költséget jelent, egy hagyományos Google keresés ennek a hetedébe kerül. Ha csak a jelenlegi keresési volumen tíz százalékát végezné egy chatbot, az az üzemeltetési költségek 1-14 százalékos növekedését hozná.
- A Google keresések java, úgy kb 80%, egyszerű információ keresés, melyekhez nem kötődik hirdetés. A chatbotok pont ezeket a kereséseket váltják ki a legjobban.
- A navigációs és vásárlásokkal kapcsolatos keresések (“Naszály Tej”, “legjobb bio tejek”) hoznak igazán bevételt. Az erre adott válaszokba értelmesen és etikusan kell(ene) beágyazni a fizetett hirdetéseket.
- A technológiai verseny megint ráereszt valamit a felhasználókra anélkül, hogy komolyan törődne a szándékolatlan következményekkel. Persze lehet azt mondani, hogy ez csak bölcsész okoskodás, de de a Facebook is csak egy app volt arra hogy közelebb hozza az embereket, ehhez képes a rohingya népirtás, az álhírek terjesztése, Cambridge Analytica, kitudja mennyi választási manipuláció és miegymás gerjesztője lett. A schumpeteriánus átalakulás veszteségekkel jár, mondhatnónk. Akarjuk, hogy egy szűk réteg hasznát szolgálva engedjük útjára ezt?
- Ha a nyelvmodellek szabadon elérhető korpuszokból tanulnak és a keresők már nem is vezetnek el az információ forrásához, akkor mi értelme van szabadon publikálni bármit? Az ingyenes minőségi tartalom mindig is illúzió volt – leszámítva talán a tudományt és a technikát. A Forbes, a Financial Times, vagy akár hazánkban a HVG és a hozzá hasonló lokális oldalak tartalmai, melyek hiteles, ellenőrzött információt közvetítenek nem hozzáférhetőek sem a keresőknek, sem a chatbotoknak. A digitalizált tartalmakat (pl a Google Books, vagy az Amazon ekönyvei), amiko jogdíjasok, de a cégek rendelkezésére állnak be lehet-e vonni a tanítókorpuszokba?
- Jelenleg is már működnek újságcikkeket és pénzügyi beszámolókat író programok. Ezek nem az oknyomozó újságírók, a véleménycikkek vagy a mélyelemzések íróinak munkáját vették el, hanem a napi robotot, a mínuszos híreket, az ismétlődő feladatokat vették át (erről bővebben ebben a könyvben). Saját mesekönyvet írt egy magyar anyuka a ChatGPT segítségével. De ha jobban elmélyülünk a linkelt cikkben kiderül, hogy a generált szöveg javításra és szerkesztésre szorult, no meg általában több szövegváltozat közül került kiválasztásra a végső verzió. Hasonló a helyzet a kódgeneráló nyelvmodellekkel. Magát a ChatGPT-t is többen kipróbálták már és a tapasztalat szerint a kód amit specifikáció szerint generál egész használható, egy kompetens programozó által gyorsan jóvá is alakítható (l. pl itt és itt). Saját tapasztalatunk szerint a GitHub Copilot nevű, kifejezetten programozási nyelveken betanított nyelvmodellje nagyon jól használható, de nem helyettesít egy kollégát. Úgy tűnik, a Superminds jóslata válik inkább be és a nagy nyelvmodellekkel sokkal hatékonyabban tudunk dolgozni.
Úgy gondoljuk, jelenleg a legokosabb dolog kivárni és tudatosan megkövetelni a terület szabályozását. A Galactica példája mutatja, hogy nagyon gyorsan földbe tud állni egy-egy LLM alapú chatbot. De amíg aktív, addig konkrét hülyeségeket tud terjeszteni.
Make a one-time donation
Make a monthly donation
Make a yearly donation
Choose an amount
Or enter a custom amount
Your contribution is appreciated.
Your contribution is appreciated.
Your contribution is appreciated.
DonateDonate monthlyDonate yearlyDo you like our visualizations? Buy them for yourself!
Visit our shop on Society6 to get a printout of our vizs.


This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.