Speech: различия между версиями

Версия от 23:44, 12 ноября 2008

Речевые технологии

На этой странице рассматриваются основные вопросы работы с речевыми синтезаторами с точки зрения их применения как средства вывода информации при работе на компьютере без зрительного контроля. Сейчас подготовлены к работе следующие синтезаторы:

festival;
espeak;
flite;
mbrola;
freetts;
ru_tts.

Не все из приведённых синтезаторов удовлетворяют описанной ниже схеме.

Механизм унифицированной работы с речевыми синтезаторами

Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ.

Речевой сервер VoiceMan

В ALT Linux вывод речи выполняет речевой сервер VoiceMan. Описание внутреннего устройства VoiceMan можно прочитать в документе с описанием архитектуры вывода речи на его основе.

Speech Dispatcher

Также для этих задач может применяться Speech Dispatcher. Любые идеи о том, как можно интегрировать Speech Dispatcher в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную.

@@ Строка 13: / Строка 13: @@
 === Механизм унифицированной работы с речевыми синтезаторами ===
-Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ. В '''ALT Linux''' вывод речи выполняет речевой сервер <tt>VoiceMan</tt>. Также для этих задач может применяться <tt>Speech Dispatcher</tt>. Любые идеи о том, как можно интегрировать <tt>Speech Dispatcher</tt> в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную. Описание внутреннего устройства <tt>VoiceMan</tt> можно прочитать в [ftp://ftp.altlinux.org/pub/people/msp/VoiceManArchitecture.pdf документе] с описанием архитектуры вывода речи на его основе.
+Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ.
+=== Речевой сервер VoiceMan ===
+В '''ALT Linux''' вывод речи выполняет речевой сервер <tt>VoiceMan</tt>. Описание внутреннего устройства <tt>VoiceMan</tt> можно прочитать в [ftp://ftp.altlinux.org/pub/people/msp/VoiceManArchitecture.pdf документе] с описанием архитектуры вывода речи на его основе.
+===Speech Dispatcher ===
+Также для этих задач может применяться <tt>Speech Dispatcher</tt>. Любые идеи о том, как можно интегрировать <tt>Speech Dispatcher</tt> в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную.