Участник:VladimirKamarzin/speech: различия между версиями
(Новая: Некоторые записи по распознованию речи. Итак, для построения системы распознавания требуется: sphinx3 и...) |
Нет описания правки |
||
Строка 13: | Строка 13: | ||
Вася v aa ss a | Вася v aa ss a | ||
Петя pp ee tt a | Петя pp ee tt a | ||
Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian | Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60 | ||
[[Категория:Распознавание речи]] |
Текущая версия от 00:26, 10 марта 2009
Некоторые записи по распознованию речи.
Итак, для построения системы распознавания требуется: sphinx3 или pocketsphinx (последний у меня падает, так что я пока остановился на 3-м).
http://voxforge.org/home/downloads - Acoustic models. Тарбол включает в себя непосредственно AM, LM, dictionary.
По словам nshm, мне для построения специализирванной системы оттуда требуется только AM. Непосредственно мне нужно построить jsgf (Finite state grammar) http://sphinx.subwiki.com/sphinx/index.php/Finite_state_grammar и создать словарь (dictionary). Последний имеет формат
слово транскрипция
, например
Вася v aa ss a Петя pp ee tt a
Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60