Na centru za jezikovne vire in tehnologije predstavili Gigafido 2.0

Ljubljana, 13. junija - Center za jezikovne vire in tehnologije Univerze v Ljubljani je danes predstavil novo različico korpusa Gigafida, Gigafida 2.0. Posodobljena različica je referenčni korpus pisne slovenščine, ki zajema dnevne časopise, revije, izbrani nabor spletnih besedil in knjižne publikacije različnih vrst. Vsebuje 1,1 milijarde besed.

Ljubljana
Na Centru za jezikovne vire in tehnologije so predstavili posodobljeno različico korpusa Gigafida, Gigafida 2.0: korpus pisne standardne slovenščine.
Foto: Center za jezikovne vire in tehnologije

Ljubljana
Na Centru za jezikovne vire in tehnologije so predstavili posodobljeno različico korpusa Gigafida, Gigafida 2.0: korpus pisne standardne slovenščine.
Foto: Center za jezikovne vire in tehnologije

Kot so sporočili s centra, so besedila izbrali in strojno obdelali z namenom, da bi korpus kot vzorec sodobne standardne slovenščine lahko služil za jezikoslovne in druge humanistične raziskave, izdelavo sodobnih slovarjev, slovnic, učnih gradiv in razvoj jezikovnih tehnologij za slovenščino. Namenjena je širši rabi.

Kot so sporočili s centra, je korpus nastal v okviru projekta nadgradnje korpusov, ki ga je financiralo ministrstvo za kulturo.

nd/ako
© STA, 2019