UDLV

Sintaktiski marķēts latviešu valodas UD korpuss

Atbilstoši universālo atkarību (UD v2.0) vadlīnijām marķēts latviešu valodas sintaktiskais korpuss (apm. 4000 teikumu), kas regulāri tiek labots un papildināts. UD dati iegūti, automātiski transformējot atbilstoši hibrīdajam sintakses modelim marķētos tekstus.

Izstrādes periods 2016–
Korpusa izmērs 2017 okt.: 3916 teikumu
Izstrādātāji LU MII