Loris je prosto dostopno spletno orodje za samodejno pregledovanje besedil v slovenščini, namenjen pa je predvsem govorcem in govorkam na območju jezikovnega stika med slovenščino in italijanščino. To pomeni, da se osredotoča zlasti na jezikovne elemente, ki so značilni za slovenščino v Italiji ali blizu Italije, obenem pa zna poskrbeti še za nekatere druge jezikovne težave.
Loris je nastal kot plod sodelovanja med Slovenskim raziskovalnim inštitutom (SLORI) in Centralnim uradom za slovenski jezik pri Avtonomni deželi Furlaniji - Julijski krajini, namen orodja pa je podati hipne in čim bolj obsežne informacije o besedilih, pri tem pa združiti čim več obstoječih in novih jezikovnih virov in tehnologij. To pomeni, da poskušamo na enem mestu zbrati čim več jezikovnih orodij, ki so sicer razpršena po različnih infrastrukturnih centrih in repozitorijih, nenehno dodajati nove opcije in ob tem posodabljati spletno aplikacijo.
Loris je torej dober ravno toliko, kot so dobri njegovi viri, tehnologija in pa nenazadnje tudi naše tehnično znanje, zato je ključnega pomena, da se vsi ti vidiki tudi nenehno izboljšujejo in bogatijo. Iz tega razloga Loris ni zgolj jezikovno orodje, temveč projekt s povsem konkretnim ciljem. Danes je Loris torej najboljši, kot je lahko glede na obstoječe vire, tehnologije in znanje – naš cilj pa je, da bo vedno služil kot zrcalo novih dognanj in znanj ter da bo vedno čim bolje nagovarjal potrebe svojih uporabnikov in uporabnic.
Loris je zasnovan kot spletna aplikacija za pregledovanje besedil. Vse, kar morate storiti, je, da v okence prilepite ali vpišete besedilo in kliknete gumb Loris, svetuj!. Loris celotno besedilo pregleda in ga primerja s svojimi seznami, posamezne elemente pa nato označi, če zna o njih kaj povedati. Če na primer najde kakšno besedo ali besedno zvezo, ki je lahko razumljiva zgolj na področju jezikovnega stika med slovenščino in italijanščino, jo pobarva takole, zraven pa na levi strani zaslona poda dodatne informacije, tako da lahko vidimo, ali nam svetuje pravilno ali ne. Besede ali zveze, pri katerih kot vzroka ne moremo določiti (nujno) jezikovnega stika, bo Loris obarval s splošno slogovno oznako.
Opozori nas tudi na to, da obstajajo slovenska imena za nekatera italijanska zemljepisna imena, in nam pove, kako pravimo prebivalcem in prebivalkam tega kraja ter kako tvorimo pridevnike iz teh imen. Loris pa se spozna tudi na pravopis, in sicer prepozna besede oz. oblike, ki so v Slovenskem pravopisu 2001 označene kot nepravilne, prepovedane ali odsvetovane. Prav tako pa prepozna in označi oblike, označene kot nepravilne v oblikoslovnem leksikonu Sloleks.
Seveda pa Loris ni vedno zgolj strog – zato nam zna pri nekaterih besedah tudi svetovati potencialne sopomenke, ki bi morda prav tako prišle v poštev, mi pa ga lahko upoštevamo ali povsem ignoriramo. Pri sopomenkah si pomaga z bazo orodja Sopomenke 1.0 Centra za jezikovne vire in tehnologije (CJVT), ki je Lorisu v uporabo prijazno odstopil tudi orodji Vejica 1.0 in EssayHelper, tako da zna svetovati tudi pri vejicah, sklonih (rodilnik in tožilnik) ter pri morebitnih težavah pri dvojini in množini, za takrat, ko se zatipkamo, pa nam je na voljo tudi povsem novi, novi nevronski črkovalnik..
Spodnja preglednica ponazarja Lorisovo podatkovno bazo, tako da lahko iščemo po njej in vidimo, kaj Loris trenutno že zna in kateri izrazi so trenutno v delu ( ), pri tem pa lahko izbiramo med različnimi kategorijami (privzeto so pri iskanju vklopljene vse kategorije).
Vsi izrazi, ki so obravnavani tudi v Zvezku normiranih terminov, so označeni z ikono
Vodja projekta
Damjan Popič (Filozofska fakulteta Univerze v Ljubljani, SLORI)
Priprava leksikografske baze
Matejka Grgič (Filozofska fakulteta Univerze v Ljubljani, SLORI)
Andreja Kalc (SLORI)
Jasmin Franza (SLORI)
Izdelava portala
Luka Bezgovšek
David Bordon (Filozofska fakulteta Univerze v Ljubljani, SLORI)
Damjan Popič
Zasnova, testiranje
Laura Sgubin (Centralni urad)
Jana Černe (Centralni urad)
Fedra Paclich (Centralni urad)
Tanja Sternad (Centralni urad)
Maja Melinc Mlekuž (SLORI)
Devan Jagodic (SLORI)
Erika Hrovatin (Centralni urad)
Eva Srebrnič (Centralni urad)
Martina Pettirosso (SLORI)
Nevenka Pernarčič (SLORI)
Marjanka Ban (Centralni urad)
Priprava podatkovnih baz
David Bordon
Damjan Popič
Luka Bezgovšek
V različico 1.1 je vključena nova različica sistema Vejica 1.0 (CJVT). Poleg izboljšanega delovanja in natančnejšega popravljanja vejic bo Loris odslej deležen tudi rednih posodobitev, tako da bodo posodobitve orodja takoj preslikane tudi v Lorisa.
Nov, nevronski črkovalnikOdslej se lahko Loris lahko pohvali tudi z najnaprednejšim nevronskim črkovalnikom za slovenščino. Model za vsako besedo oceni verjetnost, da je ta črkovana napačno, in če je verjetnost dovolj visoka, jo označi kot napačno črkovano. Črkovalnik uspešno prepoznava napake v različnih vrstah besedil in deluje bolje od obstoječih rešitev za slovenščino. Pri oceni uporabnosti orodja v šolskem okolju je bila dodatna pozornost posvečena lažno zaznanim napakam in zmanjšanju njihove pogostosti. Ker model temelji na statistični analizi, pa se vseeno lahko zmoti – za vsak slučaj smo ga zato tudi povezali z našim prejšnjim črkovalnikom, ki temelji na vgrajenem slovarju.
Novi terminiLoris se z vašo pomočjo nenehno uči in spoznava svoje uporabnike. V nadaljevanju so besede in zveze, pri katerih so uporabniki potrebovali pomoč, odslej pa jim bo Loris pri tem znal tudi pomagati.
Loris je nastal kot plod dolgoletnega raziskovalnega dela različnih inštitucij in raziskovalcev, tako da je plod znanj različnih strokovnjakov z različnih področij. V nadaljevanju so predstavljena nekatera znanstvena dela, na katerih temelji Loris, in viri, iz katerih črpa.
Božič, Martin (2020): Globoke nevronske mreže za postavljanje vejic v slovenskem jeziku. Diplomsko delo. Univerza v Ljubljani. https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=119034
Bufon, Milan in Aleksej Kalc (1990): Krajevni leksikon Slovencev v Italiji : topografski, zemljepisni, zgodovinski, kulturni, gospodarski in turistični podatki o krajih v Italiji, ki jih naseljujejo Slovenci. Knj. 1, Tržaška pokrajina. Trst: Založništvo Tržaškega tiska
Campigotto, Sandro in Pavle Merkù (2005): I paîs de patrie: dizionariut toponomastic: furlan, italiano, slovensko, deutsch. Glemone: La Patrie dal Friûl.
Davčni terminološki slovar. https://doi.org/10.3986/9789610506744.
ePravopis: Slovar slovenskega pravopisa 2014–. https://fran.si/.
eSSKJ: Slovar slovenskega knjižnega jezika 2016–. https://fran.si/.
Fabjan Bajc, Diomira (1994): Lažni prijatelji: slovensko-italijanski slovar paronimov / I falsi amici: vocabolario italiano-sloveno dei paronimi. Trst: Mladika.
Fabjan Bajc, Diomira (1995): Dve muhi na en mah: slovensko-italijanski frazeološki slovar / Due piccioni con una fava : vocabolario fraseologico sloveno-italiano. Gorica: Goriška Mohorjeva družba.
Gigafida 2.0: Korpus pisne standardne slovenščine. https://viri.cjvt.si/gigafida/.
Grgič, Matejka (2016): Lo sloveno in Italia: fenomeni di contatto linguistico tra pragmatica, percezione e ideologia. Ricerche slavistiche. 14=60. 387–415.
Grgič, Matejka (2017): Italijansko-slovenski jezikovni stik med ideologijo in pragmatiko. Jezik in slovstvo. 62, 1. 89–98.
Hipsis – hiperslovar italijanskega in slovenskega jezika. Amebis. https://hipsis.amebis.si/.
Jezikovna svetovalnica. https://svetovalnica.zrc-sazu.si.
Klemen, Matej, Martin Božič, Špela Arhar Holdt in Marko Robnik Šikonja (2024): Neural Spell-Checker: Beyond Words with Synthetic Data Generation. Elmar Nöth, Aleš Horák in Petr Sojka (ur.): Text, Speech, and Dialogue. TSD 2024. Lecture Notes in Computer Science, vol 15048. Cham: Springer. https://doi.org/10.1007/978-3-031-70563-2_7.
Kolokacije 1.0: Kolokacijski slovar sodobne slovenščine. https://viri.cjvt.si/kolokacije/slv/#.
Merkù, Pavle (1999): Slovenska krajevna imena v Italiji: priročnik = Toponimi sloveni in Italia: manuale. Trst: Založba Mladika.
Merkù, Pavle (2006): Krajevno imenoslovje na slovenskem zahodu. Ljubljana: Založba ZRC.
Ožbot, Martina (2009): Nekaj kontrastivnih beležk o italijanščini in slovenščini in nekaj opažanj o jezikovni produkciji pri govorcih slovenščine v Italiji. Jezik in slovstvo. 54, 1. 25–47.
Petrič, Timotej (2022): Predlogi jezikovnih popravkov v slovenščini z modelom SloBERTa [na spletu]. Diplomsko delo. Univerza v Ljubljani. https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=139688.
Popič, Damjan (2022): Digitalna podpora jeziku v stiku. Nataša Pirih Svetina, Ina Ferbežar (ur.). Obdobja 41: Na stičišču svetov: slovenščina kot drugi in tuji jezik. https://centerslo.si/wp-content/uploads/2022/11/Popic_Obdobja-41.pdf
Rupel, Aldo (1995): Krajevni leksikon Slovencev v Italiji : topografski, zemljepisni, zgodovinski, kulturni, gospodarski in turistični podatki o krajih v Italiji, ki jih naseljujejo Slovenci ali sodijo v isto upravno enoto. Knj. 2, Goriška pokrajina. Trst: NŠK in SLORI.
Sloleks 2.0: Slovenski oblikoslovni leksikon. https://viri.cjvt.si/sloleks/slv/.
Slovar slovenskega knjižnega jezika, druga, dopolnjena in deloma prenovljena izdaja. https://fran.si/.
Slovenski pravopis. https://fran.si/.
Sopomenke 1.0: Slovar sopomenk sodobne slovenščine. https://viri.cjvt.si/sopomenke/slv/.
Šlenc, Sergij (2009): Veliki italijansko-slovenski slovar / Grande dizionario italiano-sloveno. Ljubljana: DZS.
Vejice 1.0. https://orodja.cjvt.si/vejice/.
Aplikacija za samodejno preverjanje besedila v slovenščini Trst, Ljubljana, 2024
Vodja projekta Damjan Popič
Avtorji in avtorice: Loris 1.1, podatkovna zbirka – pojavi italijansko-slovenskega jezikovnega stikanja Matejka Grgič, Jasmin Franza Loris 1.1, podatkovna zbirka – toponimi Andreja Kalc, Jasmin Franza Loris 1.1, programska oprema in spletni vmesnik za aplikacijo Damjan Popič, David Bordon, Luka Bezgovšek
Izdajatelj Slovenski raziskovalni inštitut (SLORI), Trst
Citiranje Loris 1.1: Aplikacija za samodejno preverjanje besedila v slovenščini, https://www.jeziknaklik.it/loris/, dostop [datum dostopa].