LVK2018 Meklēt korpusā

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

Vispārīgs automātiski morfoloģiski marķēts latviešu valodas tekstu korpuss (apm. 10 milj. vārdlietojumu)., kurā iekļauti dažādu žanru mūsdienu (kopš 1991. gada) autentiski teksti ar metadatiem. Korpusā ir iekļauta periodika (60%), daiļliteratūra (20%), zinātniski teksti (10%), normatīvie akti (8%) un Saeimas stenogrammas (2%). Detalizētāka informācija par korpusa uzbūvi atrodama šeit.

Izstrādes periods 2016–2018
Korpusa apjoms 10 milj. vārdlietojumu
Izstrādātājs LU MII