LVK2013 Meklēt korpusā

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

Vispārīgs automātiski morfoloģiski marķēts latviešu valodas tekstu korpuss (apm. 4,5 milj. vārdlietojumu)., kurā iekļauti dažādu žanru mūsdienu (kopš 1991. gada) autentiski teksti ar metadatiem. Korpusā ir iekļauta periodika (55%), daiļliteratūra (20%), zinātniski teksti (10%), normatīvie akti (8%), citi teksti (5%) un Saeimas stenogrammas (2%). Detalizētāka informācija par korpusa uzbūvi atrodama šeit.

Izstrādes periods 2007–2013
Korpusa apjoms 4,5 milj. vārdlietojumu
Izstrādātājs LU MII