LVTB  Meklēt korpusā

Latviešu valodas sintaktiski marķētais korpuss

Latviešu valodas sintaktiski marķētais korpuss ir līdzsvarots manuāli gramatiski marķēts tekstu korpuss. Teikumu sintaktiskās struktūras attēlošanai izmantots hibrīds atkarību-frāžu gramatikas modelis.

Atsauces
Publikācija
L. Rituma, B. Saulite, G. Nespore-Berzkalne
Latviešu valodas sintaktiski marķētā korpusa gramatikas modelis
Language: Meaning and Form (The grammar model of Latvian Treebank), 10, 200-216, 2019
Dati
L. Rituma, L. Pretkalniņa, B. Saulīte, G. Nešpore-Bērzkalne, N. Grūzītis
Latviešu valodas sintaktiski marķētais korpuss (LVTB)
CLARIN-LV digitālā bibliotēka, 2023
http://hdl.handle.net/20.500.12574/91
Korpusa apjoms 18 295 teikumi (310 000 tekstvienību) (v2.13)
Datu publicēšanas periods 1991–2020
Izstrādes periods 2010–2023
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); VPP "Nacionālā identitāte"; VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)
Mājaslapa http://sintakse.korpuss.lv/
CLARIN http://hdl.handle.net/20.500.12574/91
Citas publikācijas
L. Pretkalnina, L. Rituma, B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
L. Pretkalnina and L. Rituma
Constructions in Latvian Treebank: the impact of annotation decisions on the dependency parsing performance
IOS Press, 2014
L. Pretkalnina and L. Rituma
Syntactic issues identified developing the Latvian treebank
IOS Press, 2012