Köztünk szólva
Hamarosan valóság: itt a web 3.0?
A nyelv és a beszéd modern technológiái
A beszéd- és nyelvtechnológiai fejlesztések összehangolására, bemutatására és hasznosításuk előmozdítására létrejött hazai Nyelv- és Beszédtechnológiai Platform idén októberben rendezett konferenciája kapcsán e technológiák fejlődéséről Simon Esztert, az MTA Nyelvtudományi Intézetének tudományos segédmunkatársát, a platform titkárát kérdeztük.
Milyennek látja ma a nyelv- és a beszédtechnológia helyzetét?
A nyelv- és beszédtechnológiák alkalmazása megkerülhetetlen, vagy rövid időn – néhány éven – belül azzá fog válni. Ha megnézzük, hogy melyek azok a termékek vagy szolgáltatások, amelyek emblematikusan jelenítik meg a 21. század társadalmi és életmódváltozásait, akkor mindenki elsősorban a web „fellegváraira”, a Google-ra, a Wikipédiára, a Facebookra, a Twitterre fog gondolni. A web megalkotója, Tim Berners-Lee szerint a jelenlegi folyamatok mind egy irányba konvergálnak, és ez a szemantikus web.
Egyes elragadtatott geekek azt jósolják, hogy a web 2.0 után verziószámugrás következik be, vagyis a szemantikus web létrejöttével már web 3.0-ról beszélhetünk majd. A szemantikus – más néven értő – web esetében a megértés elsősorban olyan virtuális ágensek létrehozását jelenti, amelyek kiterjesztik az emberek képességeit a virtuális világban. Ez pedig nem passzív weblapokból, hanem aktív, a kívánságainkat értő ágensekből fog állni. A nyelv- és beszédtechnológia ennek a jövőképnek a központi eleme.
A beszélő és az embert megértő számítógép a sci-fi világából lassan átvonul a hétköznapi életbe. Ma már nehéz úgy információt szerezni, hogy első körben ne számítógéppel kerülnénk kapcsolatba. Miközben szöveges dokumentumokat írunk, automatikusan ellenőrizzük a helyesírást. Internetes keresőt használva több nyelv- és beszédtechnológiai alkalmazást is mozgósítunk, mint például a szótövezést vagy az információkinyerést. Ezek az alkalmazások láthatatlanul dolgoznak a háttérben, és jelentősen megkönnyítik a munkánkat.
Mi az, ami különlegesnek vagy nehézségnek számít Magyarországon?

A másik gátló tényező a technológiai dömping. Itt elsősorban az olyan multik „ingyenes” szolgáltatásaira gondolok, mint a Google és a Microsoft. Ez azért veszélyes, mert az ingyenes szolgáltatásokkal a kevésbé tőkeerős vállalatok nem tudják felvenni a versenyt. A magyar piac ráadásul elég kicsi, a magyar nyelv pedig erősen ragozó volta miatt speciális. Azok a technológiák, amelyek a világ nagy nyelveire jól használhatók, a magyarra alkalmazva rendre megbuknak. Ebből adódik, hogy a magyarországi nyelvtechnológusok leginkább követő szerepben vannak: a „nagyok” által kifejlesztett technológiák magyarra való adaptációja az egyik legfontosabb dolgunk.
Az iparvállalatok számára milyen lehetőségeket hozhatnak a beszédtechnológiai alkalmazások?
A vállalatok számára a hatékony tudásbeszerzés, konkurencia- és trendanalízis, a nyelvalapú multimédia- és tudásmenedzsment milliárdokban mérhető realizált hasznot jelenthet. Ezek az alkalmazások mind intenzíven építenek a nyelv- és beszédtechnológiai fejlesztésekre. Hasonlóak mondhatók el az üzleti intelligenciát, döntéshozást támogató szoftverekről is. Információkinyerő alkalmazásokat használhatnak a sajtófigyelő cégek, a webes szolgáltatásokat nyújtó kkv-k, amivel emberi munkaerőt, időt és pénzt spórolhatnak meg. Az automatikus gépi fordítási megoldások segítségével saját anyanyelvünkön, nagyjából érthető módon olvashatjuk a különböző tartalmakat, és mint felhasználók jelentős segítséget kaphatunk például az e-kereskedelemben.
A beszédtechnológia lehetővé teszi a bármikor és bárhonnan történő telefonos ügyintézés általános elterjedését, illetve segít minden olyan esetben, amikor a vizuális információ nem adható át hatékonyan. A nyelv- és beszédtechnológia az állampolgárok számára alapjaiban megváltoztathatja a mindennapi ügyintézést. Gépi beszédfelismerésen alapuló telefontudakozók, beszédalapú call centerek, komplex (mobil)telefonos ügyfélkiszolgáló rendszerek, természetes nyelvi interfészek válthatják fel a humán operátorokat, és könnyíthetik meg a formanyomtatvány-kitöltésen alapuló kezdetleges elektronikus ügyintézést.
Hogyan alakulhat át ez a technológiai terület a következő években?
Reményeink szerint a nyelv- és beszédtechnológiában rejlő lehetőségek minél több emberhez, céghez, döntéshozóhoz eljutnak a jövőben, ami által egyre több gépi szolgáltatás tud beépülni hétköznapjainkba. Igazán nagy változás csak akkor várható, ha az oktatás, a kutatásszervezés és a technológiatranszfer terén jelentős előrelépések történnek. Kulcsfontosságú a kutatói és az ipari szféra közötti kellő mértékű tudásáramlás.
A konkrét kutatási irányokat illetően szerintem a jövőben egyre nagyobb szerepet fog kapni a beszédtechnológia a nyelvtechnológiával szemben. A most keletkező digitális tartalmak ugyanis egyre nagyobb része hangzó vagy multimédia anyag, amelyekből az információ kinyerése, egyáltalán a bennük való keresés lehetősége kulcsfontosságú lesz. Elképzelni is nehéz, milyen mértékű információs „robbanás” következhet be, ha a képi, hangzó és film anyagok is kereshetővé válnak. Ezek a technológiák és az erre irányuló kutatások mind erőteljesen fejlődni fognak, akár szöveges, akár hangzó anyagról legyen szó.
Mit hoz a jövő a platform számára?
A Nyelv- és Beszédtechnológiai Platform projektideje hivatalosan idén október 31-ig tartott. Ez azonban nem jelenti azt, hogy ezzel minden véget ért. A kiépített jó kapcsolatokat a jövőben is ápoljuk, fenntartjuk. A platform kötelékében összejött cégek és kutatóműhelyek együtt, konzorciumként tudnak pályázni. Tovább folytatjuk az egyeztető tárgyalásokat a többi Nemzeti Technológiai Platformmal, és együttműködési lehetőségeket keresünk.
Természetesen a már futó projektjeinken dolgozunk tovább, de vannak újabb projektek is a láthatáron. Jövő februárban indul például egy újabb nagy európai projekt, szintén az MTA Nyelvtudományi Intézetének vezetésével, amelynek célja a kelet-európai régió már elkészült nyelvi erőforrásainak és nyelvfeldolgozó eszközeinek egységesítése, és mindenki számára könnyen használhatóvá és elérhetővé tétele – ez a CESAR projekt.