Kaj je STIKit?

STIKit je spletno orodje, namenjeno raziskovanju popravkov in jezikovnih različic v korpusu STIKit. Omogoča iskanje po besednih oblikah in osnovnih oblikah (lemah) ter pregledovanje popravkov v kontekstu.

Ime korpusa, STIKit, izhaja iz besedne zveze 'stik slovenščine z italijanščino'. Je zbirka besedil, ki so bila ročno popravljena in anotirana s ciljem proučevanja rabe jezika v stiku in procesa normalizacije.

Zakaj STIKit?

Na stičišču kultur in jezikov se jezik ne le ohranja, temveč se na edinstven način prilagaja in razvija. Korpus STIKit pripoveduje to zgodbo o slovenščini na obmejnem območju z Italijo.

V svojem bistvu je korpus velika, strukturirana zbirka besedil. Toda STIKit je več kot le zbirka; je ključen arhiv delovanja jezikovne skupnosti. Zajemamo pristen glas govorcev slovenščine na območju, kjer se jeziki prepletajo že več generacij.

STIKit je tudi razvojni korpus. To pomeni, da ne hrani le končnih, popravljenih besedil, temveč tudi njihove izvirne različice. Z beleženjem izbrisov in vstavkov nam omogoča natančen vpogled v proces jezikovnega urejanja. Takšni korpusi so izjemno dragoceni, saj ne pokažejo le, kaj je pravilno, temveč tudi, katere so najpogostejše napake in kako jih odpraviti. To znanje je ključno za jezikoslovce, učitelje in za urjenje naprednih orodij, kot je LORIS.

Ne napake, temveč razvoj

Besedila v korpusu STIKit vsebujejo številne popravke, opombe in odstopanja od knjižne norme. Na te pojave zlahka gledamo kot na napake, vendar s tem spregledamo širšo sliko. To niso znaki razpadanja jezika, temveč znaki njegove živosti.

Kaj lahko izvemo in zgradimo iz korpusa STIKit?

  • Ogledalo skupnosti: Jezik, ki ga ljudje uporabljajo, je ogledalo njihovega življenja in identitete. STIKit nam omogoča edinstven vpogled v vsakdan slovensko govoreče skupnosti v Italiji.
  • Jezik v praksi: Popravki v korpusu – sledeni izbrisi in vstavitve – so okno v delovanje jezika. Vidimo lahko, kako se govorci odločajo in usklajujejo med različnimi narečji, jeziki in formalnimi pravili.
  • Gradnja tehnologije za skupnost: Korpus STIKit je ključni vir za gradnjo sodobne jezikovne tehnologije v manjšinskem kontekstu. Podatki o popravkih se uporabljajo za urjenje in izboljšanje spletnega svetovalca LORIS, ki je zasnovan posebej za pomoč tej skupnosti pri pisanju.
  • Vir za prihodnost: Razumevanje, kako se jezik prilagaja, je ključno za njegovo prihodnost. STIKit zagotavlja pomembne podatke za izobraževalce in jezikovne načrtovalce.
STIKit v številkah

Pregled korpusa

Skupno število tokenov (končna različica) 381 627
Unikatne leme (type) 25 312

Število popravkov

Tip Število
Vstavitve (ins) 23 448
Izbrisi (del) 19 139

Porazdelitev popravkov po kategorijah

Kategorija Število
povezani popravki – oblika 2 329
povezani popravki – skladnja 1 682
zapis – ločila – splošno 1 613
oblika – splošno 1 520
besedišče – glagoli – splošno 1 412
besedišče – samostalniki – splošno 1 115
povezani popravki – zapis 1 093
besedišče – menjava prek meja besedne vrste – splošno 914
zapis – mala in velika začetnica – splošno 238
besedišče – samostalniki – stik 208
besedišče – pridevniki 152
črkovanje – konzonanti 139
besedišče – prislovi 127
zapis – skupaj/narazen – nerazvrščeno 102
oblika – stik 101
črkovanje – vokali 88
besedišče – predlogi – splošno 74
besedišče – ostale besedne vrste 71
zapis – krajšave 60
besedišče – zaimki – splošno 50
besedišče – glagoli – stik 47
oblika – nerazvrščeno 43
zapis – števila 43
zapis – ločila – stik 39
besedišče – glagoli – nerazvrščeno 36
besedišče – samostalniki – nerazvrščeno 33
črkovanje – sklop 22
besedišče – menjava prek meja besedne vrste – nerazvrščeno 21
zapis – ločila – nerazvrščeno 19
besedišče – zaimki – nerazvrščeno 14
besedišče – menjava prek meja besedne vrste – stik 10
besedišče – zaimki – stik 10
besedišče – zaznamovano 9
skladnja – splošno 8
besedišče – predlogi – stik 5
zapis – mala in velika začetnica – nerazvrščeno 4
zapis – mala in velika začetnica – stik 4
besedišče – predlogi – nerazvrščeno 3
besedišče – vezniki – nerazvrščeno 3
besedišče – vezniki – stik 2
skladnja – nerazvrščeno 2

Podatki temeljijo na različici korpusa 1.0 (junij 2025).

Kako navajati vir

Pri uporabi podatkov ali orodja STIKit vas prosimo, da navedete ustrezen vir.

Podatkovna baza

Popič, D., Kalc, A., Grgič, M., Androjna, N., Zver, Z., & Franza, J. (2025). Podatkovna baza, korpus STIKit 1.0 [Podatkovna zbirka]. SLORI. https://jeziknaklik.it/stikit.
Popič, Damjan, et al. Podatkovna baza, korpus STIKit 1.0. SLORI, 2025, jeziknaklik.it/stikit.
Popič, Damjan, Andreja Kalc, Matejka Grgič, Neža Androjna, Zarja Zver, in Jasmin Franza. 2025. "Podatkovna baza, korpus STIKit 1.0." Trst: SLORI. https://jeziknaklik.it/stikit.
Kopirano v odložišče!

Konkordančnik

Popič, D. (2025). Konkordančnik STIKit [Računalniški program]. SLORI. https://jeziknaklik.it/stikit.
Popič, Damjan. Konkordančnik STIKit. SLORI, 2025, jeziknaklik.it/stikit.
Popič, Damjan. 2025. Konkordančnik STIKit. Trst: SLORI. https://jeziknaklik.it/stikit.
Kopirano v odložišče!