hirdetés
hirdetés

Köztünk szólva

Hamarosan valóság: itt a web 3.0?

A nyelv és a beszéd modern technológiái

A beszéd- és nyelvtechnológiai fejlesztések összehangolására, bemutatására és hasznosításuk előmozdítására létrejött hazai Nyelv- és Beszédtechnológiai Platform idén októberben rendezett konferenciája kapcsán e technológiák fejlődéséről Simon Esztert, az MTA Nyelvtudományi Intézetének tudományos segédmunkatársát, a platform titkárát kérdeztük.

hirdetés

Milyennek látja ma a nyelv- és a beszédtechnológia helyzetét?

A nyelv- és beszédtechnológiák alkalmazása megkerülhetetlen, vagy rövid időn – néhány éven – belül azzá fog válni. Ha megnézzük, hogy melyek azok a termékek vagy szolgáltatások, amelyek emblematikusan jelenítik meg a 21. század társadalmi és életmódváltozásait, akkor mindenki elsősorban a web „fellegváraira”, a Google-ra, a Wikipédiára, a Facebookra, a Twitterre fog gondolni. A web megalkotója, Tim Berners-Lee szerint a jelenlegi folyamatok mind egy irányba konvergálnak, és ez a szemantikus web.

Egyes elragadtatott geekek azt jósolják, hogy a web 2.0 után verziószámugrás következik be, vagyis a szemantikus web létrejöttével már web 3.0-ról beszélhetünk majd. A szemantikus – más néven értő – web esetében a megértés elsősorban olyan virtuális ágensek létrehozását jelenti, amelyek kiterjesztik az emberek képességeit a virtuális világban. Ez pedig nem passzív weblapokból, hanem aktív, a kívánságainkat értő ágensekből fog állni. A nyelv- és beszédtechnológia ennek a jövőképnek a központi eleme.

A beszélő és az embert megértő számítógép a sci-fi világából lassan átvonul a hétköznapi életbe. Ma már nehéz úgy információt szerezni, hogy első körben ne számítógéppel kerülnénk kapcsolatba. Miközben szöveges dokumentumokat írunk, automatikusan ellenőrizzük a helyesírást. Internetes keresőt használva több nyelv- és beszédtechnológiai alkalmazást is mozgósítunk, mint például a szótövezést vagy az információkinyerést. Ezek az alkalmazások láthatatlanul dolgoznak a háttérben, és jelentősen megkönnyítik a munkánkat.

Mi az, ami különlegesnek vagy nehézségnek számít Magyarországon?

Simon Eszter
Simon Eszter: Gátló tényező a technológiai dömping
 A magyarországi helyzet összetett. E szakterület hazai ismertsége nem megfelelő. Javarészt azért, mert a nyelv- és beszédtechnológia még mindig nem igazán illeszkedik bele a hazai tudományos intézményrendszerbe. Az egyik gátló tényező a tömegtájékoztatással kapcsolatos: a sajtó a nyelvtechnológiai fejlesztéseket sokszor bulvártémává teszi, ami árt a fejlesztéseknek, ugyanis vagy késznek ítélik azt, ami nem az, vagy örökre használhatatlannak azt, ami még nincs kész. Időnként megjelennek olyan hírek, hogy a Google vagy „a japánok” megoldottak valamilyen problémát – anélkül, hogy a megoldás kontextusáról, peremfeltételeiről szó esne.

A másik gátló tényező a technológiai dömping. Itt elsősorban az olyan multik „ingyenes” szolgáltatásaira gondolok, mint a Google és a Microsoft. Ez azért veszélyes, mert az ingyenes szolgáltatásokkal a kevésbé tőkeerős vállalatok nem tudják felvenni a versenyt. A magyar piac ráadásul elég kicsi, a magyar nyelv pedig erősen ragozó volta miatt speciális. Azok a technológiák, amelyek a világ nagy nyelveire jól használhatók, a magyarra alkalmazva rendre megbuknak. Ebből adódik, hogy a magyarországi nyelvtechnológusok leginkább követő szerepben vannak: a „nagyok” által kifejlesztett technológiák magyarra való adaptációja az egyik legfontosabb dolgunk.

Az iparvállalatok számára milyen lehetőségeket hozhatnak a beszédtechnológiai alkalmazások?

A vállalatok számára a hatékony tudásbeszerzés, konkurencia- és trendanalízis, a nyelvalapú multimédia- és tudásmenedzsment milliárdokban mérhető realizált hasznot jelenthet. Ezek az alkalmazások mind intenzíven építenek a nyelv- és beszédtechnológiai fejlesztésekre. Hasonlóak mondhatók el az üzleti intelligenciát, döntéshozást támogató szoftverekről is. Információkinyerő alkalmazásokat használhatnak a sajtófigyelő cégek, a webes szolgáltatásokat nyújtó kkv-k, amivel emberi munkaerőt, időt és pénzt spórolhatnak meg. Az automatikus gépi fordítási megoldások segítségével saját anyanyelvünkön, nagyjából érthető módon olvashatjuk a különböző tartalmakat, és mint felhasználók jelentős segítséget kaphatunk például az e-kereskedelemben.

A beszédtechnológia lehetővé teszi a bármikor és bárhonnan történő telefonos ügyintézés általános elterjedését, illetve segít minden olyan esetben, amikor a vizuális információ nem adható át hatékonyan. A nyelv- és beszédtechnológia az állampolgárok számára alapjaiban megváltoztathatja a mindennapi ügyintézést. Gépi beszédfelismerésen alapuló telefontudakozók, beszédalapú call centerek, komplex (mobil)telefonos ügyfélkiszolgáló rendszerek, természetes nyelvi interfészek válthatják fel a humán operátorokat, és könnyíthetik meg a formanyomtatvány-kitöltésen alapuló kezdetleges elektronikus ügyintézést.

Hogyan alakulhat át ez a technológiai terület a következő években?

Reményeink szerint a nyelv- és beszédtechnológiában rejlő lehetőségek minél több emberhez, céghez, döntéshozóhoz eljutnak a jövőben, ami által egyre több gépi szolgáltatás tud beépülni hétköznapjainkba. Igazán nagy változás csak akkor várható, ha az oktatás, a kutatásszervezés és a technológiatranszfer terén jelentős előrelépések történnek. Kulcsfontosságú a kutatói és az ipari szféra közötti kellő mértékű tudásáramlás.

A konkrét kutatási irányokat illetően szerintem a jövőben egyre nagyobb szerepet fog kapni a beszédtechnológia a nyelvtechnológiával szemben. A most keletkező digitális tartalmak ugyanis egyre nagyobb része hangzó vagy multimédia anyag, amelyekből az információ kinyerése, egyáltalán a bennük való keresés lehetősége kulcsfontosságú lesz. Elképzelni is nehéz, milyen mértékű információs „robbanás” következhet be, ha a képi, hangzó és film anyagok is kereshetővé válnak. Ezek a technológiák és az erre irányuló kutatások mind erőteljesen fejlődni fognak, akár szöveges, akár hangzó anyagról legyen szó.

Mit hoz a jövő a platform számára?

A Nyelv- és Beszédtechnológiai Platform projektideje hivatalosan idén október 31-ig tartott. Ez azonban nem jelenti azt, hogy ezzel minden véget ért. A kiépített jó kapcsolatokat a jövőben is ápoljuk, fenntartjuk. A platform kötelékében összejött cégek és kutatóműhelyek együtt, konzorciumként tudnak pályázni. Tovább folytatjuk az egyeztető tárgyalásokat a többi Nemzeti Technológiai Platformmal, és együttműködési lehetőségeket keresünk.

Természetesen a már futó projektjeinken dolgozunk tovább, de vannak újabb projektek is a láthatáron. Jövő februárban indul például egy újabb nagy európai projekt, szintén az MTA Nyelvtudományi Intézetének vezetésével, amelynek célja a kelet-európai régió már elkészült nyelvi erőforrásainak és nyelvfeldolgozó eszközeinek egységesítése, és mindenki számára könnyen használhatóvá és elérhetővé tétele – ez a CESAR projekt.

Kelemen Szilvia
a szerző cikkei

hirdetés
Ha hozzá kíván szólni, jelentkezzen be!
 
Hamarosan valóság: itt a web 3.0
hirdetés
hirdetés
hirdetés

Kiadónk társoldalai

hirdetés