Meet the Board – Nyelvi modellekkel egy jobb életért?
Formabontó módon, az IVSZ éves közgyűlésén zajlott le Meet the Board rendezvénysorozatunk évadzárója. A témát a nyelvi modellek megjelenése, térnyerése, illetve a mesterséges intelligencia általános hatása szolgáltatta, amit olyan szakemberekkel jártunk körbe, akik elsősorban üzleti szempontból segítettek megérteni és elemezni a jelenséget.
Valószínűleg senki sem fog meglepődni év végén, ha az év szava, illetve kifejezése a „ChatGPT”, a „mesterséges intelligencia”, vagy a „nyelvi modell” lesz. A generatív előképzett transzformátor (generative pre-trained transfomator) elsősorban az Open AI által fejlesztett ChatGPT révén vált a laikus közönség számára is közismertté, de a nyelvi modell, illetve az abban rejlő lehetőségek legalább ennyire lázban tartják a nagyvállalatokat, befektetőket, vagy akár a társadalomtudósokat is.
A téma az IVSZ és annak tagvállalatai számára is kiemelten fontos, mivel olyan lehetőségeket vetít előre, amelyekkel növelhető a hatékonyság, gyorsíthatók a folyamatok, javítható az ügyfélélmény. Az elsősorban angol nyelvre épülő ChatGPT mellett épülnek, készülnek egy-egy nyelvre alapozó specifikus modellek is; ilyen az a projekt is, ami az OTP Bank és a magyar kormány együttműködésében fut, a célja pedig egy olyan magyar nyelvi modell tartalom-előállító létrehozása, amely az ügyfélkiszolgálás területén korszakváltó újításnak számít.
Nyelvi szupermodellek
A projekt kapcsán számos kérdés, kétség merülhet fel, ezek egy részét igyekeztünk a beszélgetés során megválaszolni, amit Csányi Péter, az IVSZ digitalizációért felelős alelnöke, az OTP Bank Digitális divíziójának vezérigazgató-helyettese vezetett fel egy rövid előadással. Ebből kiderült, hogy az első GPT –3 modellhez képest a GPT-4 már egy trillió karakterrel rendelkezik, 50 oldalnyi szöveget tud összefoglalni. Ezeket a technológiai ugrásokat az Open AI rendszere mindössze 5 év alatt tette meg, a fejlődés ívéből, illetve tempójából pedig az is kiolvasható, hogy a köztes időszakok egyre rövidülnek.
“Az elkövetkező időszak legnagyobb kihívása az, hogy a rendelkezésre álló adatokból a technológiai és nem technológiai vállalatok miként tudnak hasznos tudásra szert tenni.” – hangzott el az előadásban.
Szabó Péter, a Microsoft Magyarország ügyvezetője azt jegyezte meg, hogy mára elérhető az az erőforrás, amit e folyamatok mögé lehet tenni, ennek is köszönhető az a robbanásszerű ugrás, amit a szóban forgó modellek mutattak az utóbbi hónapokban.
A nyelvi modell(ek) mibenlétét, jelentőségét Schin Lotár, az OTP Bank AI csapatának szakmai vezetője világította meg. A szakember az olvasáshoz hasonlította a folyamatot, illetve ahhoz, ahogy az ember olvas. Kiemelte, hogy a korábbi, szóról szóra történő gépi értelmezéssel ellentétben az új, transzformatív modellek már a szöveget egységként, összefüggéseiben értelmezik, sokkal gyorsabb és hatékonyabb működést elérve ezzel. Ezzel együtt az is fontos körülmény, hogy az új típusú transzformer modellek már képesek a szöveg lényegi mondanivalójára figyelni és azt hosszú ideig megtartani. Ehhez persze hatalmas számítási kapacitás (és természetesen rengeteg programozás) szükséges, ezt biztosítja az a szuperszámítógép, ami második éve az OTP szakemberei rendelkezésére áll és aminek az eredményeit az ország összes iparági szereplője élvezhet a jövőben.
Egyelőre még kicsi, de a miénk
Felmerülhet a kérdés, hogy ha van már egy emberi ésszel szinte felfoghatatlan paramétert tartalmazó, akár magyarul is használható nyelvi modell, mi szükség van egy kifejezetten itthon fejlesztettre. Schin Lotár válasza szerint egy-egy ilyen rendszer abból az adatbázisból dolgozik, amit beletápláltak, „mert az, hogy mi jön ki egy-egy modellből attól függ, hogy mit látott, hallott, milyen adatokat adtak meg neki”. Egy pénzintézet szeretne törekedni arra, hogy a folyamataiban használt modell semmilyen meglepetést, érzékeny adatot ne tartalmazzon, de egy másik faktor a nyelvi modell használatának költsége is a későbbiekben. A cég most arra törekszik, hogy a pénzügyi ágazatban ez egy megbízható modell legyen, bár az is igaz, hogy a ChatGPT-hez képest ez egyelőre egy jóval kisebb számú paraméterekkel bíró modell.
Csányi Péter a kérdésre elsősorban a magyar nyelv specifikusságát említette, valamint azt, hogy amennyiben nagyvállalatok által fejlesztett rendszereket építenek be a folyamatokba, azzal létrejön egy olyan nem kívánt kitettség, amit igyekeznek elkerülni. Emellett a fejlesztés maga arra is rávilágított, hogy a magyar nyelv mennyire nincs reprezentálva a digitális térben, így ez egyfajta társadalmi felelősségvállalás is.
Szabó Péter arra mutatott rá a kérdés kapcsán, hogy a magyar gazdaság számára nem feltétlenül csak az a jó, ami itthon teremtődik meg, bár az mindig árnyalja a képet, amikor például egy bank szenzitív adatairól van szó. Hozzátette: a szoftvercég megoldásaiba, rendszereibe beprogramozott nyelvi megoldások, funkciók csak a vállalat által megadott adatokkal dolgoznak.
Mit és miért tesz jobbá?
A válaszokból elsősorban az jött át, hogy valójában el sem tudjuk egyelőre képzelni, hogy mi mindenben lehet segítségünkre, egy olyan (vagy bármilyen másik) nyelvi modell, ami az OTP szervertermeiben dolgozik. Csányi Péter szerint ez az alapja annak, hogy egy üzleti folyamatot, szolgáltatást fel- és tovább építsünk. Bármilyen üzleti környezetben jól hasznosítható – banki területen az ügyfélszolgálati, jogi, szerződéskötési folyamatokba építhető be azzal a fontos kitétellel, hogy ezzel nem az emberek munkáját helyettesítve, hanem segítve, előkészítve azt.
„Nem tudnék olyan területet mondani, ahol nem, hasznos” – ezek már Schin Lotár szavai, aki példaként említette a fejlesztők világát, ahol már most óriási segítséget nyújtanak a nyelvi modellek bizonyos kódrészletek megírásában, de jó példa lehet az automatikus ügyfélazonosítás személyi adatok alapján. A szakember asszisztensi szerephez hasonlította a modellek működését: egy segédpilótáról beszélünk inkább (utalva a Microsoft Copilot nevű megoldására), ami könnyebbé teszi a navigációt, de a gépet továbbra is a pilóta vezeti.
A beszélgetés összes szereplője szerint a hatékonyságnövelésben van, illetve lesz óriási hatása a nyelvi modelleknek. Szabó Péter a kibervédelem területét említette, ahol a logok, adatok elemzésében, értelmezésében olyan sebességnövekedést lehet így elérni, amire a hús-vér emberek, de a jelenlegi rendszerek sem képesek. A Microsoft vezetője hozzátette, hogy komoly ígéretei vannak már most ezeknek a rendszereknek, és aki nem készül fel ennek hatására, az menthetetlenül lemarad a versenyben. Ezért is lenne fontos már az oktatási szinteken foglalkozni ezekkel a trendekkel, hogy a jövő szakemberei befogadóbbak legyenek az új technológiákkal kapcsolatban, de legalább ennyire fontos lesz a megfelelő infrastruktúra és szabályozói környezet kialakítása.
Kapcsolódó
Ezek is érdekelhetnek
Alakítsuk közösen a DIMOP pályázati kiírásokat – véleményezés szeptember 14-ig!
Az IVSZ a GINOP Plusz, DIMOP Plusz, RRF és további operatív programok monitoring bizottságában aktívan dolgozik azért, hogy minél több fejlesztési forrás álljon a cégek rendelkezésére digitális ...