A ChatGPT mindent megváltoztat?

Itt a ChatGPT és tényleg mindenki evvel foglalkozik. Egyesek szerint minden meg fog változni, a Google az Altavista sorsára jut, mások szerint a Kodak-sztori ismétlődik meg és van aki szerint a Google LaMDA nyelvmodellje érző lény. Joggal merül fel a lakossági kérdés; akkor most mi van?

Minden valamikor tavaly nyáron kezdődött, amikor a Google bejelentette a LaMDA nagy nyelvmodellen alpuló chatbotot. Egy Google mérnök bejelentette, meggyőződése hogy érzéssel bíró lény az új mesterséges intelligencia. Ez a mérnök ma már nem dolgozik a cégnél… Mindeközben a Google egyik vezető mérnöke arról publikált a The Economist-ban, hogy a LaMBDA-val beszélgetve már-már úgy érzi hogy értelmes társalgást folytat. Azután jött az OpenAI és a ChatGPT és azóta egyre halmozódnak a képességeit magasztaló hírek. Pl:

képes átemenni MBA kurzusoknál használt teszteken
képes átmenni orvosi egyetemek tesztjein
olyan jó esszéket ír, hogy több helyen már betiltották a használatát, a tanárok félnek, hogy a felnövekvő generációk már nem fognak önállóan írni
a programozók munkáját is el fogja venni hamarosan
a keresésnek, ahogyan azt ma ismerjük, vége

Nem akarjuk tagadni, hogy nagy dolog a ChatGPT. Az azonban biztos, hogy nem önmagában indított egy forradalmat és nem ennek a forradalomnak a végső állomása. Alább pontokba szedtük röviden, hogy miért érdemes fenntartásokkal kezelni az elmúlt hónapok bejelentéseit és a következő hónapokban várható újabb csodákat.

A névben a GPT feloldása Generative Pre-trained Transformer, azaz egy transformer modellel van dolgunk. Ezekkel már egy ideje együtt kell élnünk és sok már most is pl. a Google eszköztárának a része.
Nagyon sok adattal dolgoznak a nagy nyelvmodellek (LLM, large language model) ezért nehéz frissen tartani a tudásukat. Habár a Bing és a Neeva ezt okosan megoldotta. A szinkrónia és diakrónia újra fel lett fedezve…
A nagy nyelvmodellek hallucinálnak, azaz a válaszaik nem faktuálisak, hanem „kitalációk”. Legutóbb pl. a Facebook-nak kellett lelőnie Galactica nevű tudományos chatbotját. Bővebben erről a On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜tanulmányban lehet olvasni.
A chatbotok fantasztikus képességei mögött többszáz, vagy akár ezer harmadik világbeli ember gyakran megalázó, kimerítő és alulfizetett munkája van. A képgenerátorok tanítóadataiból valahogy ki kell gyomlálni a felnőtt tartalmat, meg az annál is durvább dolgokat. Ugyanez a helyzet a szövegnél is. Ki akarnak hónapokig munkaidőben gyűlöletbeszédet olvasni óránként úgy bruttó 800 forintért? Az OpenAI pont ezt tette a ChatGPT tanítása során.
Az Economist információi szerint egy ChatGPT keresés kb két centes költséget jelent, egy hagyományos Google keresés ennek a hetedébe kerül. Ha csak a jelenlegi keresési volumen tíz százalékát végezné egy chatbot, az az üzemeltetési költségek 1-14 százalékos növekedését hozná.
A Google keresések java, úgy kb 80%, egyszerű információ keresés, melyekhez nem kötődik hirdetés. A chatbotok pont ezeket a kereséseket váltják ki a legjobban.
A navigációs és vásárlásokkal kapcsolatos keresések („Naszály Tej”, „legjobb bio tejek”) hoznak igazán bevételt. Az erre adott válaszokba értelmesen és etikusan kell(ene) beágyazni a fizetett hirdetéseket.
A technológiai verseny megint ráereszt valamit a felhasználókra anélkül, hogy komolyan törődne a szándékolatlan következményekkel. Persze lehet azt mondani, hogy ez csak bölcsész okoskodás, de de a Facebook is csak egy app volt arra hogy közelebb hozza az embereket, ehhez képes a rohingya népirtás, az álhírek terjesztése, Cambridge Analytica, kitudja mennyi választási manipuláció és miegymás gerjesztője lett. A schumpeteriánus átalakulás veszteségekkel jár, mondhatnónk. Akarjuk, hogy egy szűk réteg hasznát szolgálva engedjük útjára ezt?
Ha a nyelvmodellek szabadon elérhető korpuszokból tanulnak és a keresők már nem is vezetnek el az információ forrásához, akkor mi értelme van szabadon publikálni bármit? Az ingyenes minőségi tartalom mindig is illúzió volt – leszámítva talán a tudományt és a technikát. A Forbes, a Financial Times, vagy akár hazánkban a HVG és a hozzá hasonló lokális oldalak tartalmai, melyek hiteles, ellenőrzött információt közvetítenek nem hozzáférhetőek sem a keresőknek, sem a chatbotoknak. A digitalizált tartalmakat (pl a Google Books, vagy az Amazon ekönyvei), amiko jogdíjasok, de a cégek rendelkezésére állnak be lehet-e vonni a tanítókorpuszokba?
Jelenleg is már működnek újságcikkeket és pénzügyi beszámolókat író programok. Ezek nem az oknyomozó újságírók, a véleménycikkek vagy a mélyelemzések íróinak munkáját vették el, hanem a napi robotot, a mínuszos híreket, az ismétlődő feladatokat vették át (erről bővebben ebben a könyvben). Saját mesekönyvet írt egy magyar anyuka a ChatGPT segítségével. De ha jobban elmélyülünk a linkelt cikkben kiderül, hogy a generált szöveg javításra és szerkesztésre szorult, no meg általában több szövegváltozat közül került kiválasztásra a végső verzió. Hasonló a helyzet a kódgeneráló nyelvmodellekkel. Magát a ChatGPT-t is többen kipróbálták már és a tapasztalat szerint a kód amit specifikáció szerint generál egész használható, egy kompetens programozó által gyorsan jóvá is alakítható (l. pl itt és itt). Saját tapasztalatunk szerint a GitHub Copilot nevű, kifejezetten programozási nyelveken betanított nyelvmodellje nagyon jól használható, de nem helyettesít egy kollégát. Úgy tűnik, a Superminds jóslata válik inkább be és a nagy nyelvmodellekkel sokkal hatékonyabban tudunk dolgozni.

Úgy gondoljuk, jelenleg a legokosabb dolog kivárni és tudatosan megkövetelni a terület szabályozását. A Galactica példája mutatja, hogy nagyon gyorsan földbe tud állni egy-egy LLM alapú chatbot. De amíg aktív, addig konkrét hülyeségeket tud terjeszteni.

Make a one-time donation

Make a monthly donation

Make a yearly donation

Choose an amount

¤5,00

¤15,00

¤100,00

¤5,00

¤15,00

¤100,00

¤5,00

¤15,00

¤100,00

Or enter a custom amount

Your contribution is appreciated.

Donate Donate monthly Donate yearly

Do you like our visualizations? Buy them for yourself!

Visit our shop on Society6 to get a printout of our vizs.

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

A ChatGPT mindent megváltoztat?

Make a one-time donation

Make a monthly donation

Make a yearly donation

Do you like our visualizations? Buy them for yourself!

Like this:

More posts

RAG a gyakorlatban – áprilisi meetup videók

Ki a fene az az Alan Turing?

Papagáj vagy orákulum?

Könyvismertető: Neumann János – Az ember a jövőből

A ChatGPT mindent megváltoztat?

Make a one-time donation

Make a monthly donation

Make a yearly donation

Do you like our visualizations? Buy them for yourself!

Oszd meg:

Like this:

More posts

RAG a gyakorlatban – áprilisi meetup videók

Ki a fene az az Alan Turing?

Papagáj vagy orákulum?

Könyvismertető: Neumann János – Az ember a jövőből