Vijenac 595 - 596

Matica hrvatska

SREDIŠNJICA

Mario Essert, redoviti profesor na Fakultetu strojarstva i brodogradnje, i Marko Orešković, voditelj Odjela informacijske tehnologije u Nacionalnoj i sveučilišnoj knjižnici u Zagrebu, 8. prosinca u Matici hrvatskoj održali su predavanje Hrvatsko rječoslovlje u računalnom modelu prirodnoga jezika. Predstavili su računalno rješenje jezikoslovnog modela koje se tiče svih važnih područja prirodnoga jezika – morfologije, sintakse i semantike. Zahvaljujući rješenju automatskog oblikovanja rječnika i morfološkog generatora gramatičkih oblika promjenljivih vrsta riječi, moguće je oblikovati i održavati hrvatski mrežni tezarij. Deterministički osmišljen model zaobilazi računalno zahtjevne postupke lematizacije koji uključuju velike statističke pogreške, napose za fleksijske jezike poput hrvatskoga. Umjesto klasičnih statističkih obrazaca za traženje riječi, tezarij toga modela ima rješenje preko poveznica s riječima istih ili sličnih značenja, čak i u drugim repozitorijima. Sintaksna se analiza ostvaruje na razini slogova, morfova i povezanosti riječi u rečenice, oblikujući sintaktičke uzorke. Takvim se uzorcima omogućuje raščlamba rečenica na bilo kojem korpusu uz uvjet da su riječi iz toga korpusa već obrađene i pohranjene u tezarij. Model se može primijeniti i na semantičke kategorije – sinonimiju, homonimiju, na stilske figure itd. (Jasna Šego)

Vijenac 595 - 596

595 - 596 - 22. prosinca 2016. | Arhiva

Klikni za povratak