STIKit je spletno orodje, namenjeno raziskovanju popravkov in jezikovnih različic v korpusu STIKit. Omogoča iskanje po besednih oblikah in osnovnih oblikah (lemah) ter pregledovanje popravkov v kontekstu.
Ime korpusa, STIKit, izhaja iz besedne zveze 'stik slovenščine z italijanščino'. Je zbirka besedil, ki so bila ročno popravljena in anotirana s ciljem proučevanja rabe jezika v stiku in procesa normalizacije.
Na stičišču kultur in jezikov se jezik ne le ohranja, temveč se na edinstven način prilagaja in razvija. Korpus STIKit pripoveduje to zgodbo o slovenščini na obmejnem območju z Italijo.
V svojem bistvu je korpus velika, strukturirana zbirka besedil. Toda STIKit je več kot le zbirka; je ključen arhiv delovanja jezikovne skupnosti. Zajemamo pristen glas govorcev slovenščine na območju, kjer se jeziki prepletajo že več generacij.
STIKit je tudi razvojni korpus. To pomeni, da ne hrani le končnih, popravljenih besedil, temveč tudi njihove izvirne različice. Z beleženjem izbrisov in vstavkov nam omogoča natančen vpogled v proces jezikovnega urejanja. Takšni korpusi so izjemno dragoceni, saj ne pokažejo le, kaj je pravilno, temveč tudi, katere so najpogostejše napake in kako jih odpraviti. To znanje je ključno za jezikoslovce, učitelje in za urjenje naprednih orodij, kot je LORIS.
Besedila v korpusu STIKit vsebujejo številne popravke, opombe in odstopanja od knjižne norme. Na te pojave zlahka gledamo kot na napake, vendar s tem spregledamo širšo sliko. To niso znaki razpadanja jezika, temveč znaki njegove živosti.
| Skupno število tokenov (končna različica) | 381 627 |
| Unikatne leme (type) | 25 312 |
| Tip | Število |
|---|---|
| Vstavitve (ins) | 23 448 |
| Izbrisi (del) | 19 139 |
| Kategorija | Število |
|---|---|
| povezani popravki – oblika | 2 329 |
| povezani popravki – skladnja | 1 682 |
| zapis – ločila – splošno | 1 613 |
| oblika – splošno | 1 520 |
| besedišče – glagoli – splošno | 1 412 |
| besedišče – samostalniki – splošno | 1 115 |
| povezani popravki – zapis | 1 093 |
| besedišče – menjava prek meja besedne vrste – splošno | 914 |
| zapis – mala in velika začetnica – splošno | 238 |
| besedišče – samostalniki – stik | 208 |
| besedišče – pridevniki | 152 |
| črkovanje – konzonanti | 139 |
| besedišče – prislovi | 127 |
| zapis – skupaj/narazen – nerazvrščeno | 102 |
| oblika – stik | 101 |
| črkovanje – vokali | 88 |
| besedišče – predlogi – splošno | 74 |
| besedišče – ostale besedne vrste | 71 |
| zapis – krajšave | 60 |
| besedišče – zaimki – splošno | 50 |
| besedišče – glagoli – stik | 47 |
| oblika – nerazvrščeno | 43 |
| zapis – števila | 43 |
| zapis – ločila – stik | 39 |
| besedišče – glagoli – nerazvrščeno | 36 |
| besedišče – samostalniki – nerazvrščeno | 33 |
| črkovanje – sklop | 22 |
| besedišče – menjava prek meja besedne vrste – nerazvrščeno | 21 |
| zapis – ločila – nerazvrščeno | 19 |
| besedišče – zaimki – nerazvrščeno | 14 |
| besedišče – menjava prek meja besedne vrste – stik | 10 |
| besedišče – zaimki – stik | 10 |
| besedišče – zaznamovano | 9 |
| skladnja – splošno | 8 |
| besedišče – predlogi – stik | 5 |
| zapis – mala in velika začetnica – nerazvrščeno | 4 |
| zapis – mala in velika začetnica – stik | 4 |
| besedišče – predlogi – nerazvrščeno | 3 |
| besedišče – vezniki – nerazvrščeno | 3 |
| besedišče – vezniki – stik | 2 |
| skladnja – nerazvrščeno | 2 |
Podatki temeljijo na različici korpusa 1.0 (junij 2025).
Pri uporabi podatkov ali orodja STIKit vas prosimo, da navedete ustrezen vir.