ITKC 

Meklēt korpusā

Latviešu valodas runas atpazīšanas korpuss

Korpusā ir iekļauti audioieraksti un to atšifrējumi ortogrāfiskajā transkripcijā. Katram audioierakstam ir pievienoti metadati: ziņas par ieraksta vietu, ieraksta ilgums, runātāja vecums, dzimums un latviešu valodas valodas prasme. Daļa korpusa (apm. 4 stundas) ir marķēta fonētiskajā transkripcijā. Korpuss galvenokārt tiek izmantots runas atpazīšanas risinājumu izstrādei. Nav publiski pieejams.
Detalizētāka informācija par korpusa uzbūvi: Pinnis et al. (2014).

Korpusa apjoms     100 stundas
Izstrādes periods     2013
Izstrādātājs     LU MII, Tilde, LETA
Finansējuma avots     IT kompetences centra (ITKC) projekts Nr. KC/2.1.2.1.1/10/01/001