Як беларуская мова матэрыялізуецца ў сфэрах інфармацыйных тэхналёгій, і ў прыватнасьці – наколькі пасьпяховыя намаганьні ў стварэньні кампутарных праграмаў, якія чытаюць уголас беларускі тэкст (па-ангельску text to speech, TTS)?
Што сёньня могуць сынтэзатары мовы, ці навучыліся яны гаварыць па-беларуску, хто мае найбольшую патрэбу ў такой службе – пра гэта Алена Ціхановіч і Франак Вячорка гутарылі з гасьцямі эфіру – навуковым супрацоўнікам Аб'яднанага інстытуту праблем інфарматыкі НАН Беларусі, кандыдатам тэхнічных навук Юрыем Гецэвічам і навучэнцам гарадзенскага музычнага каледжу, інвалідам па зроку Валянцінам Станкевічам.
Алена Ціхановіч: Валянцін, вы толькі што вярнуліся са свайго каледжу. Ці ёсьць у вас асыстэнт? Хто вам дапамагае арыентавацца?
Валянцін Станкевіч: Арыентуюся па каледжы сам. А па горадзе... Калі ведаю дакладна маршрут, я саджуся ў аўтобус і еду. Але часьцей бацькі мяне аднаго не адпускаюць і ці самі едуць са мной ці пасылаюць са мной бабулю.
Ціхановіч: Што вас падштурхнула да перапраграмаваньня расейскай гаварылкі? І як доўга вы гэтым займаліся?
Станкевіч: Справа ў тым, што ўсё ж хочацца чытаць ў арыгінале, а значыць, па-беларуску. Хаця я роднай мовай лічу расейскую, але таксама мне па-беларуску прыемна размаўляць і чытаць, але амаль што няма на чым. Быў нейкі сынтэзатар – голас Ірына ад Сакрамэнту, але гэта не зусім якасны голас. Я спрабаваў нешта больш якаснае і зручнае ў выкарыстаньні. Гэта расейскі голас Юры ад кампаніі Вакалайзэр.
Юры Гецэвіч: Вынік цікавы. Рады пачуць новы сынтэз беларускага маўленьня. Канечне, ёсьць хібы. Націскі не заўсёды прастаўленыя. Але і ёсьць плюсы, што вельмі добрая фанэтычная база пад гэты голас зробленая.
Ціхановіч: Як доўга ваш інстытут займаўся гэтай праблемай, ад каго прыйшла заяўка на беларускую гаварылку?
Гецэвіч: Калі я прыйшоў у лябараторыю каля 6 гадоў таму, то ўжо былі пэўныя напрацоўкі ў галіне сынтэзу маўленьня. Ці хіба ня нашая лябараторыя дала ўсёй Усходняй Эўропе пэўныя стандарты ў сынтэзе маўленьня. Доктар Барыс Мятодавіч Лабанаў быў флягманам у гэтым. Былі распрацаваныя агульныя працэсы сынтэзу маўленьня, якія падышлі да ўсіх славянскіх моваў, у тым ліку для беларускай, польскай, украінскай, расейскай, чэскай. Калі я прыйшоў, расейскі голас быў зроблены, беларускі таксама, але патрабаваў пэўных дапрацовак і я займаўся лінгвістычнай апрацоўкай тэксту для сынтэзу маўленьня.
Ціхановіч: Давайце паслухаем, як гучыць пачатак паэмы Якуба Коласа «Новая зямля».
Ціхановіч: Франак, як вам бачацца магчымасьці сынтэзу маўленьня ў шырэйшым кантэксьце? Чым, дзе, каму яшчэ гэты накірунак навукі можа паслужыць?
Франак Вячорка: Інфармацыйна-даведкавыя сыстэмы, праграмы абслугі сьляпых і нямых, аўтамабільныя навігатары, аўтаадказьнікі. Напрыклад, аб'явы пра адпраўленьне цягнікоў – таксама сынтэзаванае маўленьне. Можа выкарыстоўвацца ў ваеннай і авіякасьмічнай тэхніцы, у робататэхніцы, у акустычным дыялёгу чалавека з кампутарам. Тое самае SIRI, якое цяпер выкарыстоўваецца ў айфонах, ці экранны дыктар у Windows 8. Вы можаце пісаць смс-кі, чытаць пошту і нават лазіць па інтэрнэце пры дапамозе голасу. Часта сынтэзаванае маўленьне выкарыстоўвацца як гукавы эфэкт у музыцы.
Ціхановіч: У якія сфэры ІТ яшчэ не дайшла беларусізацыя?
Вячорка: На мой погляд, цяпер прыярытэт – поўная беларусізацыя Windows, Mac Os, праверка беларускай артаграфіі (тарашкевіца і наркамаўка), электронныя перакладнікі.
Цалкам слухаць гутарку тут:
Што сёньня могуць сынтэзатары мовы, ці навучыліся яны гаварыць па-беларуску, хто мае найбольшую патрэбу ў такой службе – пра гэта Алена Ціхановіч і Франак Вячорка гутарылі з гасьцямі эфіру – навуковым супрацоўнікам Аб'яднанага інстытуту праблем інфарматыкі НАН Беларусі, кандыдатам тэхнічных навук Юрыем Гецэвічам і навучэнцам гарадзенскага музычнага каледжу, інвалідам па зроку Валянцінам Станкевічам.
Алена Ціхановіч: Валянцін, вы толькі што вярнуліся са свайго каледжу. Ці ёсьць у вас асыстэнт? Хто вам дапамагае арыентавацца?
Валянцін Станкевіч: Арыентуюся па каледжы сам. А па горадзе... Калі ведаю дакладна маршрут, я саджуся ў аўтобус і еду. Але часьцей бацькі мяне аднаго не адпускаюць і ці самі едуць са мной ці пасылаюць са мной бабулю.
Ціхановіч: Што вас падштурхнула да перапраграмаваньня расейскай гаварылкі? І як доўга вы гэтым займаліся?
Станкевіч: Справа ў тым, што ўсё ж хочацца чытаць ў арыгінале, а значыць, па-беларуску. Хаця я роднай мовай лічу расейскую, але таксама мне па-беларуску прыемна размаўляць і чытаць, але амаль што няма на чым. Быў нейкі сынтэзатар – голас Ірына ад Сакрамэнту, але гэта не зусім якасны голас. Я спрабаваў нешта больш якаснае і зручнае ў выкарыстаньні. Гэта расейскі голас Юры ад кампаніі Вакалайзэр.
Юры Гецэвіч: Вынік цікавы. Рады пачуць новы сынтэз беларускага маўленьня. Канечне, ёсьць хібы. Націскі не заўсёды прастаўленыя. Але і ёсьць плюсы, што вельмі добрая фанэтычная база пад гэты голас зробленая.
Ціхановіч: Як доўга ваш інстытут займаўся гэтай праблемай, ад каго прыйшла заяўка на беларускую гаварылку?
Гецэвіч: Калі я прыйшоў у лябараторыю каля 6 гадоў таму, то ўжо былі пэўныя напрацоўкі ў галіне сынтэзу маўленьня. Ці хіба ня нашая лябараторыя дала ўсёй Усходняй Эўропе пэўныя стандарты ў сынтэзе маўленьня. Доктар Барыс Мятодавіч Лабанаў быў флягманам у гэтым. Былі распрацаваныя агульныя працэсы сынтэзу маўленьня, якія падышлі да ўсіх славянскіх моваў, у тым ліку для беларускай, польскай, украінскай, расейскай, чэскай. Калі я прыйшоў, расейскі голас быў зроблены, беларускі таксама, але патрабаваў пэўных дапрацовак і я займаўся лінгвістычнай апрацоўкай тэксту для сынтэзу маўленьня.
Ціхановіч: Давайце паслухаем, як гучыць пачатак паэмы Якуба Коласа «Новая зямля».
Ціхановіч: Франак, як вам бачацца магчымасьці сынтэзу маўленьня ў шырэйшым кантэксьце? Чым, дзе, каму яшчэ гэты накірунак навукі можа паслужыць?
Франак Вячорка: Інфармацыйна-даведкавыя сыстэмы, праграмы абслугі сьляпых і нямых, аўтамабільныя навігатары, аўтаадказьнікі. Напрыклад, аб'явы пра адпраўленьне цягнікоў – таксама сынтэзаванае маўленьне. Можа выкарыстоўвацца ў ваеннай і авіякасьмічнай тэхніцы, у робататэхніцы, у акустычным дыялёгу чалавека з кампутарам. Тое самае SIRI, якое цяпер выкарыстоўваецца ў айфонах, ці экранны дыктар у Windows 8. Вы можаце пісаць смс-кі, чытаць пошту і нават лазіць па інтэрнэце пры дапамозе голасу. Часта сынтэзаванае маўленьне выкарыстоўвацца як гукавы эфэкт у музыцы.
Ціхановіч: У якія сфэры ІТ яшчэ не дайшла беларусізацыя?
Вячорка: На мой погляд, цяпер прыярытэт – поўная беларусізацыя Windows, Mac Os, праверка беларускай артаграфіі (тарашкевіца і наркамаўка), электронныя перакладнікі.
Цалкам слухаць гутарку тут: