FullStack-LV  Skatīt CLARIN-LV

Daudzslāņu valodas resursu kopa

Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā ievietoti no LVK2018 atlasīti teksta paragrāfi noteiktās reprezentatīvās proporcijās. Datu kopa marķēta, izmantojot šādos daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.

Publikācija, uz kuru atsaukties:
N. Gruzitis and L. Pretkalnina and B. Saulite and L. Rituma and G. Nespore-Berzkalne and A. Znotins and P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC), 4506-4513, 2018
PDF
Korpusa apjoms 12 691 teikums
Izstrādes periods 2017–2019
Izstrādātājs LU MII
Finansējuma avots ERAF praktiskas ievirzes pētījumu programmas projekts Nr. 1.1.1.1/16/A/219, PostDoc grants Nr. 1.1.1.2/VIAA/1/16/188
Citas publikācijas
N. Gruzitis and G. Nespore-Berzkalne and B. Saulite
Creation of Latvian FrameNet based on Universal Dependencies
Proceedings of the International FrameNet Workshop (IFNW), 23-27, 2018
PDF
G. Nespore-Berzkalne and B. Saulite and N. Gruzitis
Latvian FrameNet: Cross-Lingual Issues
Human Language Technologies - The Baltic Perspective, 307, 96-103, 2018
PDF DOI
N. Gruzitis and R. Dargis and L. Rituma and G. Nespore-Berzkalne and B. Saulite
Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora
Proceedings of the International FrameNet Workshop 2020: Towards a Global, Multilingual FrameNet, 63-69, 2020
PDF