UDLV-LVTB  Meklēt korpusā Vārdu biežuma saraksts

Latviešu valodas universālo atkarību korpuss

Korpuss ir marķēts atbilstoši Universal Dependencies (UD) gramatikas modelim. UDLV dati ir automātiski atvasināti no LVTB datiem.
Detalizētāka informācija par korpusa uzbūvi: Pretkalniņa et al. (2018).

Publikācija, uz kuru atsaukties:
L. Pretkalnina, L. Rituma, B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
PDF DOI
Korpusa apjoms 16 803 teikumi (282 671 tekstvienība) (v2.10)
Izstrādes periods 2015-2022
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188); VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)
Mājaslapa http://sintakse.korpuss.lv/
CLARIN http://hdl.handle.net/11234/1-4611
Citas publikācijas
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
L. Pretkalnina, L. Rituma, B. Saulite
Universal Dependency treebank for Latvian: A pilot
IOS Press, 2016
PDF DOI