Сервис синтеза речи

Электронная очередь QOne предлагает собственный сервис синтеза речи для развертывания голосового помощника в дополнение к системам автоматизации клиентских потоков. Наше решение — это высокоэффективный кэширующий сервис с возможностью автоматического пополнения базы сообщений через внешние сервисы синтеза речи (Google Text-to-Speech или Responsive Voice).

Преимущества сервиса синтеза речи

  • Низкая стоимость генерации новых файлов. Например, для базы звуковых файлов на основе Google Text-to-Speech цена составляет 16 USD за 1 млн. символов
  • Снижение стоимости владения сервисом за счет сегментирования сообщений. Каждый уникальный сегмент озвучивается только один раз
  • Собственные алгоритмы нормализации сообщений, которые позволяют еще больше снизить обращения к внешним сервисам

Google Text-to-Speech

  • Поддержка 120+ языков и языковых разновидностей
  • Точное произношение, форматирование фраз в зависимости от языковой ситуации (например, даты, номера телефонов)
  • Высокий уровень имитации речи, приближенный к реальной жизни
  • Поддержка Языка разметки синтеза речи (Speech Synthesis Markup Language), основанного на XML

Responsive Voice

  • Сервис звукового анализа от компании Responsive Voice
  • Поддержка 42 языка
  • Преобразование текста в речь на базе скрытых марковских моделей
  • Интонация задается нейросетью, обученной на множестве примеров из реальной жизни

Сервис на базе предзаписанных текстовок

При необходимости наша электронная очередь может использовать сервис на базе предзаписанных текстовок.

Такой подход находит применение в компаниях, у которых полностью закрытые контуры. Актуально для банков и прочих организаций с высокими требованиями к безопасности.

Используемый в системе Электронной очереди QOne сервис представляет простой и мощный API, который позволяет получать сформированные на основе сторонней голосовой платформы mp3 голосовые сообщения. 

Голосовые сообщения передаются в режиме реального времени или формируются в виде предварительно созданного кэша из звуковых файлов. Кэш строится на основе собственных алгоритмов и внутренней базы сервиса.

Современные голосовые сервисы на сравнительно высоком уровне решают вопрос имитации произношения, приближенного к естественному — устранены проблемы по воссозданию тембра голоса, плавности звучания и интонации. Созданное нами решение использует все преимущества современных технологий по распознаванию и озвучиванию от крупнейших мировых разработчиков.

Отправить заявку

Оставьте заявку в формате обратной связи и наши специалисты свяжутся с Вами

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.