В Кыргызстане представили открытую эмоциональную модель синтеза кыргызской речи
KG

В Кыргызстане представили открытую эмоциональную модель синтеза кыргызской речи

Все самое интересное в Telegram

В Кыргызстане создана и представлена первая эмоциональная модель синтеза речи на кыргызском языке, находящаяся в открытом доступе (open source). Разработка позволит внедрять кыргызоязычные голосовые технологии в частный и государственный секторы.

Проект реализован командами Nineninesix и "Акылай" при поддержке Парка высоких технологий КР. Модель способна генерировать речь с естественными интонациями и эмоциональными оттенками, что делает ее применимой для создания локализованных голосовых ассистентов, контакт-центров, образовательных платформ и сервисов озвучивания контента.

По данным разработчиков, модель работает в реальном времени и не требует дорогостоящего оборудования:

  • на видеокарте RTX 3060 синтез речи происходит с задержкой около 0,5 секунды;
  • на RTX 4080 - примерно 0,2 секунды.

Это делает технологию доступной для большинства пользователей и организаций, включая школы, университеты и медиакомпании.

"Мы верим, что открытая экосистема вокруг Kani TTS ускорит появление новых сервисов на кыргызском языке - от голосовых интерфейсов в госсекторе до локализованных решений для бизнеса", - отмечают разработчики.

Открытая модель доступна для тестирования и внедрения:

протестировать;

скачать.

Разработчики проекта: Уланбек Абдуразаков, Денис Павлов, Нурсултан Бакашов.

Есть тема? Пишите Kaktus.media в Telegram и WhatsApp: +996 (700) 62 07 60.
url: https://oper.kaktus.media/534618