Datoriem māca saprast latviešu valodu 0
“Firefox” tīmekļa pārlūka izstrādātājs “Mozilla” nācis klajā ar jaunu projektu “Mozilla Common Voice”. Tā mērķis ir savākt balss ierakstus dažādās valodās no dažādiem cilvēkiem, lai pēc tam tos apkopotu brīvi pieejamā datu kopā, ko dažādi izstrādātāji varētu izmantot savos produktos.
Pasaules lielajās valodās šādi ieraksti ir savākti un tehnoloģijas ir pieejamas, bet tādās mazās valodās kā latviešu par iespēju sazināties ar iekārtām balss režīmā (piemēram, “Google Home”) varēja tikai sapņot.
“Common Voice” mājas lapā ikviens brīvprātīgais var ierakstīt īsus balss ierakstus. Lapa strādā arī no mobilajām iekārtām. Lai dalībniekiem būtu interesantāk darboties, lapā ir iestrādāti spēles elementi, piemēram, dalībnieki var sacensties savā starpā, noskaidrojot to, kurš kopējam mērķim ir izdarījis visvairāk.
Ierunājamie teksti ir veidoti no latviešu sakāmvārdiem un dažādām ikdienas frāzēm populārās filmās. Jaunu ierunājamo tekstu pievienošana, tāpat kā ierunāto tekstu pārbaude ir lapas lietotāju kopienas pārziņā. Dati rāda, ka līdz šim 45 cilvēki latviešu valodā ierunājuši tekstus piecu stundu un 10 minūšu garumā, bet kā gana labi apstiprināti teksti trīs stundu un 39 minūšu garumā.
Igauņu valodā 12 stundu garus apstiprinātus tekstus ierunājuši 226 runātāji, bet lietuviešu valodā pagaidām nav bijis pietiekami daudz tekstu ierunātāju, lai tā kvalificētos projektam.