Vijenac 764

Kolumne

O jeziku rode da ti pojem

Hrvatski se brani i perilicom

Piše Marijan Lipovac

Ne samo radi sebe nego i radi drugih malih jezika ne možemo si dopustiti zapostavljanje jezičnih tehnologija jer u EU postoje konstantne silnice i ideje da se mali jezici otklone i da ne budu službeni jezici, ili da barem ne budu operativni, rekao je Tadić

Dok je u počecima izlaženja Vijenca, u doba Augusta Šenoe, budućnost hrvatskog kao sredstva komunikacije uvelike ovisila o tome hoće li Hrvati međusobno, kod kuće i u javnosti, razgovarati materinskim jezikom ili nekim od jezika stranih vladara hrvatskih zemalja, u 21. stoljeću funkcionalnost hrvatskog jezika u konačnici ovisi i o tome hoće li Hrvati moći razgovarati na hrvatskom sa svojom perilicom. Koliko god to zvučalo apsurdno, takva je sudbina hrvatskog, ali i drugih jezika, u digitalno doba kada se kućanskim aparatima naredbe mogu davati glasom i kada na raspolaganju imamo niz jezičnih tehnologija kojih nismo ni svjesni, iako nam svakodnevno olakšavaju život, od provjere pravopisa u Microsoft Wordu, do sustava koji dopunjava riječi tijekom pisanja poruka na mobitelu i sustava za strojno prevođenje, poput Google translatora kojim se primjerice u pripremi javnih govora služio i Tihomir Orešković, kratkotrajni hrvatski premijer nevješt u službenom jeziku države kojom je upravljao.


Računalni lingvist Marko Tadić

Zanimljivo, priprema hrvatskog jezika za digitalno doba započela je upravo 1967, iste godine kada je Deklaracijom o nazivu i položaju hrvatskog književnog jezika započela borba za pravo Hrvata za samobitnost svog nacionalnog jezika u tadašnjoj Jugoslaviji, okončana 1990. unošenjem hrvatskog jezika u Ustav Republike Hrvatske, uskoro samostalne i međunarodno priznate države, i slanjem „hrvatskog ili srpskog“ u ropotarnicu povijesti. Kako je na tribini Lingvistika s povodom u Matici hrvatskoj podsjetio Marko Tadić, predstojnik Katedre za algebarsku i računalnu lingvistiku Odsjeka za lingvistiku Filozofskoga fakulteta u Zagrebu, upravo 1967, kada je u SAD-u napravljen prvi milijunski računalni korpus za engleski jezik, iste godine anglist Željko Bujas izradio je prvi hrvatski računalni korpus, zasnovan na Gundulićevu Osmanu, sa 110 tisuća pojavnica, a već 1968. Rudolf Filipović, također anglist, nabavlja američki sustav koji prepolavlja i prevodi na hrvatski i tako nastaje prvi paralelni računalni korpus u povijesti lingvistike. Zatim su Bujas i Milan Moguš pokrenuli računalnu obradu starih hrvatskih pisaca, uključujući sva djela Marka Marulića te djela dubrovačkih, hvarskih i zadarskih pisaca, da bi 1976. Moguš pokrenuo stvaranje milijunskoga korpusa hrvatskoga književnog jezika, prvog takva nekoga slavenskog jezika, na osnovi kojeg je 1999. objavljen Hrvatski čestotni rječnik, u kojem su hrvatske riječi navedene po učestalosti.

 Godinu prije, 1998, pod Tadićevim vodstvom započela je izrada Hrvatskoga jezičnog korpusa koji se sastavlja od odabranih tekstova na hrvatskom jeziku iz svih područja, struka, žanrova i stilova, od književnih i znanstvenih djela do udžbenika, novinskih tiskovina, internetskih portala i pričaonica te od 2005. ima 105 milijuna pojavnica. Prema Tadićevim riječima, nakon što je hrvatski jezik 2013. postao jedan od 24 službena jezika Europske Unije, time je preuzeta i dodatna razina odgovornosti za prilagodbu hrvatskog jezika digitalnom dobu. „Kao pripadnici maloljudne jezične zajednice obavezni smo održavati civilizacijsku razinu al pari svim ostalim službenim jezicima Europske Unije, ići ukorak i s njemačkim i francuskim, talijanskim, ali i češkim, slovačkim, bugarskim… Ne samo radi sebe nego i radi drugih malih jezika ne možemo si dopustiti zapostavljanje jezičnih tehnologija jer u EU postoje konstantne silnice i ideje da se mali jezici otklone i da ne budu službeni jezici, ili da barem ne budu operativni, što u nekim tijelima Unije i nisu jer radni jezici Europske komisije su engleski i francuski, nema čak ni njemačkog. Jako je bitno održavati razinu razvijenosti i pomagala koja omogućuju da hrvatski bude ravnopravan u toj skupini službenih jezika“, ističe Marko Tadić, koji upozorava što bi se hrvatskom moglo dogoditi ne bude li pratio suvremene tehnologije.

„Jezične su tehnologije novi oblik pismenosti i ako za hrvatski ne budemo imali razvijene tehnologije koje će svima nama omogućiti olakšanu uporabu prirodnog jezika, onda će govornici iz komocije posegnuti za drugim jezikom za koji te tehnologije postoje. Time hrvatski postaje djelomično funkcionalno nepismen jer se ne upotrebljava u tim kanalima. Za svaki jezik koji idućih sto godina želimo sačuvati moramo imati pomagalo da ne nude marginaliziran. Jezik ne možemo sačuvati tako da ga konzerviramo, već samo tako da mu omogućimo fleksibilnu funkcionalnost u današnjim komunikacijskim uvjetima i komunikacijskim kanalima“, kaže Tadić. Jedan od najplodnijih hrvatskih računalnih i korpusnih lingvista iznimno važnim smatra digitaliziranje tekstova, posebno knjiga i novina, i to u formatu pretraživa teksta, što već niz godina rade primjerice Nacionalna i sveučilišna knjižnica u Zagrebu i Knjižnica HAZU, no Tadić upozorava da se u Hrvatskoj još dosta kasni u računalnoj obradi govora koja bi omogućila sustave za automatsko spikiranje i diktiranje na hrvatskom jeziku, pa i davanje hrvatskih uputa perilici s početka teksta jer s perilicom već se može razgovarati na engleskom, francuskom ili talijanskom. Utješno je što, prema Tadićevim riječima, u Hrvatskoj na burzi rada nema nezaposlenih računalnih lingvista jer se njihove stručne kompetencije očito traže zbog neprestanoga razvoja novih digitalnih alata.

Vijenac 764

764 - 15. lipnja 2023. | Arhiva

Klikni za povratak