LaVA Meklēt korpusā Vārdu biežuma saraksts
Latviešu valodas apguvēju korpuss
Korpusā iekļauti to Latvijas augstākajās mācību iestādes studējošo ārvalstnieku darbi, kuri latviešu valodu apgūst kā svešvalodu pirmo vai otro semestri. Teksti ir automātiski morfoloģiski marķēti, un tajos ir manuāli marķētas valodas apguvēju kļūdas.
Publikācija, uz kuru atsaukties:
R. Dargis and I. Auzina and K. Levane-Petrova and I. Kaija
Quality Focused Approach to a Learner Corpus Development
Proceedings of The 12th Language Resources and Evaluation Conference (LREC), 392-396, 2020
PDF
Quality Focused Approach to a Learner Corpus Development
Proceedings of The 12th Language Resources and Evaluation Conference (LREC), 392-396, 2020
Korpusa apjoms | 192 000 vārdlietojumi (241 000 tekstvienību) |
Izstrādes periods | 2018–2021 |
Izstrādātājs | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | LZP Fundamentālo un lietišķo pētījumu programa (lzp-2018/1-0527) |
Mājaslapa | http://lava.korpuss.lv/lv/ |
CLARIN | http://hdl.handle.net/20.500.12574/49 |
Citas publikācijas |
K. Levane-Petrova and I. Auzina and K. Pokratniece
Latviešu valodas apguvēju korpusa datu ieguves un apstrādes metodoloģijas izstrāde Valodu apguve: problēmas un perspektīva, 16, 299-309, 2020 |