Speech: различия между версиями
Msp (обсуждение | вклад) |
Msp (обсуждение | вклад) |
||
Строка 13: | Строка 13: | ||
=== Механизм унифицированной работы с речевыми синтезаторами === | === Механизм унифицированной работы с речевыми синтезаторами === | ||
Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ. | Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ. | ||
При рассмотрении вопросов речевого вывода уделяется особое внимание: | |||
* '''расширяемости''' - добавление в систему нового синтезатора или программы-источника не должно требовать модификаций всей системы речевого вывода; | |||
* '''управляемость''' - у пользователя должен быть единый инструмент управления параметрами вывода речи. | |||
=== Речевой сервер VoiceMan === | === Речевой сервер VoiceMan === | ||
В '''ALT Linux''' вывод речи выполняет речевой сервер <tt>VoiceMan</tt>. Описание внутреннего устройства <tt>VoiceMan</tt> можно прочитать в [ftp://ftp.altlinux.org/pub/people/msp/VoiceManArchitecture.pdf документе] с описанием архитектуры вывода речи на его основе. | В '''ALT Linux''' вывод речи выполняет речевой сервер <tt>VoiceMan</tt>. Описание внутреннего устройства <tt>VoiceMan</tt> можно прочитать в [ftp://ftp.altlinux.org/pub/people/msp/VoiceManArchitecture.pdf документе] с описанием архитектуры вывода речи на его основе. |
Версия от 23:52, 12 ноября 2008
Речевые технологии
На этой странице рассматриваются основные вопросы работы с речевыми синтезаторами с точки зрения их применения как средства вывода информации при работе на компьютере без зрительного контроля. Сейчас подготовлены к работе следующие синтезаторы:
- festival;
- espeak;
- flite;
- mbrola;
- freetts;
- ru_tts.
Не все из приведённых синтезаторов удовлетворяют описанной ниже схеме.
Механизм унифицированной работы с речевыми синтезаторами
Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ.
При рассмотрении вопросов речевого вывода уделяется особое внимание:
- расширяемости - добавление в систему нового синтезатора или программы-источника не должно требовать модификаций всей системы речевого вывода;
- управляемость - у пользователя должен быть единый инструмент управления параметрами вывода речи.
Речевой сервер VoiceMan
В ALT Linux вывод речи выполняет речевой сервер VoiceMan. Описание внутреннего устройства VoiceMan можно прочитать в документе с описанием архитектуры вывода речи на его основе.
Speech Dispatcher
Также для этих задач может применяться Speech Dispatcher. Любые идеи о том, как можно интегрировать Speech Dispatcher в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную.