Korpusi ar birku reprezentatīvs (8)

LVK2018

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

2016–2018, 10 milj. vārdlietojumu (12 milj. tekstvienību)

LVK2013

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

2007–2013, 4,5 milj. vārdlietojumu (5,5 milj. tekstvienību)

LVTB

Latviešu valodas sintaktiski marķētais korpuss

2010-2019, 13 643 teikumi (220 116 tekstvienību) (v2.5)

UDLV

Latviešu valodas universālo atkarību korpuss

2015-2019, 13 643 teikumi (220 536 tekstvienības) (v2.5)

FullStack-LV

Daudzslāņu valodas resursu kopa

2017–2019, 12 691 teikums

ITKC

Latviešu valodas runas atpazīšanas korpuss

2013, 100 stundas

LiLa

Lietuviešu-latviešu-lietuviešu paralēlo tekstu korpuss

2011–2013, 8 milj. vārdlietojumu

MuLa

Mūsdienu latgaliešu tekstu korpuss

2011–2013, 1 milj. vārdlietojumu (1,3 milj. tekstvienību)