LVK2018 

Meklēt korpusā

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

Vispārīgs latviešu valodas tekstu korpuss, kurā iekļauti dažādu žanru mūsdienu (kopš 1991. gada) autentiski teksti ar metadatiem: periodika (60%), daiļliteratūra (20%), zinātniski teksti (10%), normatīvie akti (8%), Saeimas stenogrammas (2%). Korpuss satur automātisku morfoloģisko marķējumu.
Detalizētāka informācija par korpusa uzbūvi: Levāne-Petrova (2019).

Korpusa apjoms     10 milj. vārdlietojumu
Izstrādes periods     2016–2018
Izstrādātājs     LU MII
Finansējuma avots     ERAF praktiskas ievirzes pētījumu programmas projekts Nr. 1.1.1.1/16/A/219