VoxForge
Скачал акустическую модель с http://www.repository.voxforge1.org/downloads/Russian/Trunk/AcousticModels/.
Скачал 5prealplha pocketsphinx, sphinxbase. Установил, pocketsphinx_continuous -inmic yes работает нормально. Но
pocketsphinx_continuous
-lm /home/crazymax/Desktop/AcousticModels/etc/msu_ru_nsh.lm.dmp -hmm /home/crazymax/Desktop/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000 -dict /home/crazymax/Desktop/AcousticModels/etc/msu_ru_nsh.dic -inmic yes
Выдает ошибку и ворнинг при обработке языковой модели:
INFO: ngram_model_arpa.c(77): No \data\ mark in LM file
INFO: ngram_model_dmp.c(142): Will use memory-mapped I/O for LM file
INFO: ngram_model_dmp.c(196): ngrams 1=30086, 2=849050, 3=1790728
INFO: ngram_model_dmp.c(242): 30086 = LM.unigrams(+trailer) read
WARN: "ngram_model_dmp.c", line 250: -mmap specified, but trigram index is not word-aligned. Will not memory-map.
INFO: ngram_model_dmp.c(288): 849050 = LM.bigrams(+trailer) read
INFO: ngram_model_dmp.c(314): 1790728 = LM.trigrams read
INFO: ngram_model_dmp.c(339): 11663 = LM.prob2 entries read
INFO: ngram_model_dmp.c(359): 7054 = LM.bo_wt2 entries read
INFO: ngram_model_dmp.c(379): 8028 = LM.prob3 entries read
INFO: ngram_model_dmp.c(407): 1659 = LM.tseg_base entries read
INFO: ngram_model_dmp.c(463): 30086 = ascii word strings read
ERROR: "ngram_search.c", line 205: Language model/set does not contain </s>, recognition will fail
Если я заменю языковую модель на языковую модель VoxForge с CMUSphinx портала (http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Russian%20Voxforge/) то все работает нормально.
Нужно ли преобразовывать языковую модель с VoxForge каким-то особым способом и если да, то как это сделать?
ОС: Ubuntu 14.04
Pocketsphinx, sphinxbase: 5prealpha