Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. «Ваш телефон вам больше не принадлежит». Как беларуска перехитрила мошенников
  2. Девочке с СМА, которой собрали 1,8 млн долларов на самый дорогой в мире укол, врачи сказали: «Не показано». Как так?
  3. Сильный ветер валил деревья, срывал крыши, обрывал провода, есть пострадавшие. В МЧС рассказали о последствиях разгула стихии
  4. Евросоюз принял 20-й пакет санкций против России — туда попали и две беларусские компании
  5. «Хочу перестать быть в конфронтации с ГУБОПиКом». Поговорили с правозащитницей Настой Лойко, которую отпустили после последнего визита Коула
  6. В районе минского мотовелозавода снесут «малоценную застройку», жильцы уже отселены. Что там построят
  7. Лукашенко — чиновникам: «Ребята, вы просто одной ногой в тюрьме»
  8. Ввели валютное ограничение для населения
  9. Этого классика беларусской литературы расстреляли в 45 лет, но он успел сделать столько, сколько удалось немногим. Вот о ком речь
  10. Строящаяся линия метро в Минске изменит направление — что известно о новом маршруте
  11. В мае повысят некоторые пенсии — кто получит прибавку
  12. В Беларуси выросли ставки утилизационного сбора
  13. Чернобыль ни при чем? Почему в Беларуси так много людей имеют проблемы со щитовидной железой
  14. Женщина пожаловалась на четыре часа очереди в поликлинику. Там провели расследование и дали ответ — задело многих
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.