Subtitri  Meklēt korpusā Vārdu biežuma saraksts

Latvijas sabiedrisko mediju subtitru korpuss

Korpusā apkopoti subtitri no dažādām Latvijas sabiedrisko mediju pārraidēm (2015-2020) - raidījumiem, šoviem, filmām un seriāliem. Katrai ir pievienots nosaukums, publicēšanas datums un URL, kur to var noskatīties. Tāpat visiem ierakstiem ir norādīta pārraides audio valoda un tas, vai pārraide ir oriģināli ierakstīta norādītajā valodā vai arī uz to ir dublēts.

Korpusa apjoms 1200 stundu (10,8 milj. tekstvienību)
Izstrādes periods 2020-2022
Izstrādātājs Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-Letonika-2021/1-0006)