Участник:VladimirKamarzin/speech

Материал из ALT Linux Wiki
< Участник:VladimirKamarzin
Версия от 00:26, 10 марта 2009; VladimirKamarzin (обсуждение | вклад)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)

Некоторые записи по распознованию речи.

Итак, для построения системы распознавания требуется: sphinx3 или pocketsphinx (последний у меня падает, так что я пока остановился на 3-м).

http://voxforge.org/home/downloads - Acoustic models. Тарбол включает в себя непосредственно AM, LM, dictionary.

По словам nshm, мне для построения специализирванной системы оттуда требуется только AM. Непосредственно мне нужно построить jsgf (Finite state grammar) http://sphinx.subwiki.com/sphinx/index.php/Finite_state_grammar и создать словарь (dictionary). Последний имеет формат

слово транскрипция

, например

Вася v aa ss a
Петя pp ee tt a

Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60