Кампанія Mozilla уключыла беларускую мову ў распрацоўку тэхналёгіі распазнаваньня маўленьня

Ілюстрацыйнае фота

Дапамагчы ў стварэньні мэханізму распазнаваньня беларускага маўленьня заклікаюць валянтэраў.

Common Voice — адна з ініцыятыў Mozilla, прысьвечаных таму, каб навучыць машыны голасу сапраўдных людзей. Гэты праект — спроба па выпраўленьні хібаў у сфэры лічбавых маўленчых тэхналёгіяў, піша Onliner. Праект заклікае ўсіх беларусаў далучыцца да «маратону» агучваньня невялікіх сказаў на роднай мове.

Па меркаваньні стваральнікаў, праект пойдзе на карысьць разьвіцьця тэхналёгій распазнаваньня беларускага маўленьня. Далучыцца да праекту можа кожны ахвочы.

ГЛЯДЗІЦЕ ТАКСАМА: Слоўнічак: птушкі (1). Як па-беларуску „ворон“ і што кажа зязюля. ВІДЭА

Праграмістам патрабуецца велізарны аб’ём галасавых дадзеных для распрацоўкі прыкладаньняў па распазнаваньні маўленьня. Стваральнікі праекту хочуць зрабіць галасавыя дадзеныя свабоднымі і агульнадаступнымі, а таксама забясьпечыць іх разнастайнасьць, як у сапраўдным жыцьці.

«Мы пайшлі праз паўаўтаматычны шлях. Зь беларускай „Вікіпэдыі“ намі было выгружана блізу 85 000 сказаў. Далей адбылася праверка выпадковай падвыбаркі ў 4000 сказаў мовазнаўцамі-валянтэрамі. Выявілася, што каля 7% усіх сказаў беларускай „Вікіпэдыі“ зьмяшчаюць граматычныя, артаграфічныя, маўленчыя або іншыя памылкі, але гэта знаходзіцца ў прымальных межах нормы і дазволіла тэхпадтрымцы Mozilla Common Voice актывізаваць беларускую мову і распачаць працэс агучваньня!» — распавялі стваральнікі ініцыятывы.

Працэс для ўдзелу ў праекце агучваньня:

  • зайсьці на сайт, націснуць на мікрафон;
  • пачаць начытваць сказы. Можна з тэлефону, можна без рэгістрацыі.

Таксама можна правяраць ужо начытаныя іншымі людзьмі сказы. Падчас агучваньня голас мусіць гучаць натуральна, нібы адбываецца звычайная размова.

ГЛЯДЗІЦЕ ТАКСАМА: ТБМ патрабуе спыніць перасьлед зьняволеных за ўжываньне беларускай мовы ў турмах
ГЛЯДЗІЦЕ ТАКСАМА: Спэцдакладчыца ААН апублікавала даклад аб Беларусі. Асноўныя тэзісы