UDLV-LVTB  Meklēt korpusā Vārdu biežuma saraksts

Latviešu valodas universālo atkarību korpuss

Korpuss ir marķēts atbilstoši Universal Dependencies (UD) gramatikas modelim. UDLV dati ir automātiski atvasināti no LVTB datiem.
Detalizētāka informācija par korpusa uzbūvi: Pretkalniņa et al. (2018).

Publikācija, uz kuru atsaukties:
L. Pretkalnina and L. Rituma and B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Text, Speech, and DialogueSpringer, 11107, 95-105, 2018
PDF DOI
Korpusa apjoms 15 984 teikumi (265 722 tekstvienības) (v2.9)
Izstrādes periods 2015-2021
Izstrādātājs Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188); VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001)
Mājaslapa http://sintakse.korpuss.lv/
CLARIN http://hdl.handle.net/11234/1-4611
Citas publikācijas
N. Gruzitis and L. Pretkalnina and B. Saulite and L. Rituma and G. Nespore-Berzkalne and A. Znotins and P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC), 4506-4513, 2018
PDF
L. Pretkalnina and L. Rituma and B. Saulite
Universal Dependency treebank for Latvian: A pilot
Human Language Technologies - The Baltic Perspective, 289, 2016
PDF DOI