В Кыргызстане представили открытую эмоциональную модель синтеза кыргызской речи
В Кыргызстане создана и представлена первая эмоциональная модель синтеза речи на кыргызском языке, находящаяся в открытом доступе (open source). Разработка позволит внедрять кыргызоязычные голосовые технологии в частный и государственный секторы.
Проект реализован командами Nineninesix и "Акылай" при поддержке Парка высоких технологий КР. Модель способна генерировать речь с естественными интонациями и эмоциональными оттенками, что делает ее применимой для создания локализованных голосовых ассистентов, контакт-центров, образовательных платформ и сервисов озвучивания контента.
По данным разработчиков, модель работает в реальном времени и не требует дорогостоящего оборудования:
- на видеокарте RTX 3060 синтез речи происходит с задержкой около 0,5 секунды;
- на RTX 4080 - примерно 0,2 секунды.
Это делает технологию доступной для большинства пользователей и организаций, включая школы, университеты и медиакомпании.
"Мы верим, что открытая экосистема вокруг Kani TTS ускорит появление новых сервисов на кыргызском языке - от голосовых интерфейсов в госсекторе до локализованных решений для бизнеса", - отмечают разработчики.
Открытая модель доступна для тестирования и внедрения:
Разработчики проекта: Уланбек Абдуразаков, Денис Павлов, Нурсултан Бакашов.
