Участник:VladimirKamarzin/speech
Некоторые записи по распознованию речи.
Итак, для построения системы распознавания требуется: sphinx3 или pocketsphinx (последний у меня падает, так что я пока остановился на 3-м).
http://voxforge.org/home/downloads - Acoustic models. Тарбол включает в себя непосредственно AM, LM, dictionary.
По словам nshm, мне для построения специализирванной системы оттуда требуется только AM. Непосредственно мне нужно построить jsgf (Finite state grammar) http://sphinx.subwiki.com/sphinx/index.php/Finite_state_grammar и создать словарь (dictionary). Последний имеет формат
слово транскрипция
, например
Вася v aa ss a Петя pp ee tt a
Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60