Latvijas Universitātes Humanitāro zinātņu fakultātes Latvistikas un baltistikas nodaļā kopš 2023. gada aprīļa uzsākta jauna Latvijas Zinātnes padomes finansēta Fundamentālo un lietišķo pētījumu projekta “Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze (LVMVMD)” īstenošana (Nr. lzp-2022/1-0013, īstenošanas laiks – 01.04.2023.–31.03.2026., finansējums – 300 000 EUR). Projekta vadītāja ir Dr. philol. Andra Kalnača, LU HZF Latvistikas un baltistikas nodaļas profesore un vadošā pētniece.
Projekta “Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze” mērķis ir izveidot digitālu pamatresursu (datubāzi) ar vispusīgiem strukturētiem datiem par mūsdienu latviešu valodas vārdu sastāvdaļām (saknēm, galotnēm, piedēkļiem, priedēkļiem u.c.) un vārdu darināšanas sistēmas likumībām. Pētījumā risināmo jautājumu loks ir saistīts ar vārda sīkāko daļu – morfēmu –, to funkciju un saistīšanās principu apzināšanu, klasificēšanu un analīzi latviešu valodas sistēmas kontekstā.
Iecerētajai “Latviešu valodas morfēmu un vārddarināšanas modeļu datubāzei” paredzētas divas sadaļas:
- anotēts latviešu valodas vārdu sastāvdaļu (sakņu, galotņu, piedēkļu u.c.) saraksts;
- alfabētiski pēc saknēm sakārtotas radniecīgu vārdu grupas, kur katram atvasinātam un/vai saliktam vārdam fiksēta tā sastāvdaļu struktūra.
Datubāzes kodols (radniecīgu vārdu grupu saraksts) veidots, balstoties uz “Līdzsvarotajā mūsdienu latviešu valodas tekstu korpusā LVK2018” iekļautajiem vārdiem. Kā datubāzes pamats izmantotas 165 090 lemmas, kas izgūtas no "Līdzsvarotā mūsdienu latviešu valodas korpusa LVK2018" 2023. gada aprīlī.
Projekta paredzamie rezultāti:
- interneta repozitorijā publicēta brīvpieejas datubāze;
- zinātniski raksti (SCOPUS/WOS), rakstu krājums (SCOPUS).
Projekta īstenošanas gaitā blakus zinātniskām un pētījuma rezultātu publiskošanas aktivitātēm (zinātniskiem semināriem, konferencēm, publikācijām) iecerētas arī trīs publiskas lekcijas par latviešu valodas vārdu sastāvdaļām, to saistīšanās likumībām, vārdu darināšanu, morfēmu un vārddarināšanas modeļu datubāzes veidošanu.
Projekta “Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze” rezultāti būs noderīgi ne tikai dažādu jomu valodniekiem (t. sk. korpusa un datorlingvistikas pētniekiem), bet jo īpaši tulkotājiem, informācijas tehnoloģiju speciālistiem, vārdnīcu sastādītājiem, latviešu valodas skolotājiem un latviešu valodas apguvējiem Latvijā un ārpus tās. Iecerētā datubāze nodrošinās arī respektējamu pamatu turpmākiem datos balstītiem latviešu valodas vārddarināšanas pētījumiem un dažādu valodas apguves un lietojuma mācību līdzekļu un rokasgrāmatu izstrādei, jo šai jomā šobrīd trūkst digitālu valodas resursu. Bez vispusīga vārddarināšanas sistēmas modeļa apzināšanas nav iespējama pilnvērtīga izpratne par pārējām valodas apakšsistēmām (gramatiku, vārdu krājumu, pragmatiku, semantiku) un to lietojumu. Tādējādi kopumā projekts dos vitāli svarīgu ieguldījumu gan latviešu valodas pētniecībā, gan humanitāro zinātņu attīstībā Latvijā.
Projekta dalībnieki ir Latvijas un Japānas valodnieki. Kā projekta vadošais eksperts un galvenais izpildītājs piedalās Dr. philol. Daiki Horiguči (Daiki Horiguchi), Kioto Universitātes (Kyoto University, Japan) docents. Latvijas zinātniekus pārstāv LU HZF Latvistikas un baltistikas nodaļas vadošās pētnieces un Dr. philol. prof. Andra Kalnača (projekta vadītāja) un Dr. philol. asoc. prof. Ilze Lokmane (galvenā izpildītāja), kā arī projekta ekspertes un izpildītājas Dr. philol. doc. Inta Urbanoviča, Mg. hum. Tatjana Pakalne, Mg. hum. Kristīne Levāne-Petrova (LU matemātikas un informātikas institūta pētniece), Mg. hum., LU Valodu un kultūru studiju doktorantūras studente Ieva Auziņa (LU Latviešu valodas institūta asistente), LU Baltu filoloģijas maģistrantūras studentes Bc. hum. Paula Kļaviņa un Bc. hum. Vanesa Balmane.
Plašāka informācija par projektu pieejama: https://www.dlmdm.lu.lv/