Runas korpuss

Latviešu valodas runas atpazīšanas korpuss

Korpusā (apm. 100 stundas) ir iekļauti audioieraksti un to atšifrējumi ortogrāfiskajā transkripcijā. Katram audiofailam ir pievienota metainformācija: ziņas par ieraksta vietu, audiofragmenta ilgumu, runātāja vecumu, dzimumu un latviešu valodas valodas prasmi. Neliela korpusa daļa (apm. 4 stundas) ir dota fonētiskajā transkripcijā. Korpuss galvenokārt tiek izmantots runas tehnololģiju izstrādei, nav publiski pieejams.

Izstrādes periods 2013
Korpusa apjoms 100 stundas
Izstrādātājs LU MII, LETA, "Tilde"