VoxForge
Использую voxforge 0.2 и pockesphinx 0.7. В комплекте с voxforge был тестовый wav файл с фразой "не слишком толст, не слишком тонок".
Запускаю пример:
pocketsphinx_continuous.exe -hmm model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000 -dict etc/msu_ru_nsh.dic -lm etc/msu_ru_nsh.lm.dmp
получаю результат:
чем не слишком толстые не слишком долго
С одной стороны видно, что работает, с другой - странно, что даже на штатном тесте не всё гладко. Скажите, у всех так или я что-то недонастроил?
> С одной стороны видно, что работает, с другой - странно, что даже на штатном тесте не всё гладко. Скажите, у всех так или я что-то недонастроил?
У всех так. Для повышения качества распознавания речи и создан этот сайт.
Спасибо большое за ответ. Хотя бы понятно, что я не один такой безрукий.
Подскажите пожалуйста, может ли кто-нибудь выложить рабочую сборку Sphinx4 с русским языком? Я видел ссылки на mediafire, но они все умерил.
> Подскажите пожалуйста, может ли кто-нибудь выложить рабочую сборку Sphinx4 с русским языком? Я видел ссылки на mediafire, но они все умерил.
Я Вам советую сделать сборку самому. Это не сложно.
А что ещё можно сделать, чтобы произошёл релиз следующей версии моделей для покетсфинкса с улучшенным распознаванием? :)
А то, на сколько я могу видеть, последний релиз (0.2) был без малого два года назад, в то время, как аудиоданные люди периодически загружают даже в этом году...
P.S. А ещё, можно ли что-нибудь сделать с тем, что pocketsphinx не хочет распознавать короткие слова/фразы? (Или сие тоже связано базой данных для распознавания? Хотя против этого пункта говорит то, что короткие слова Сфинкс не особо распознаёт и в английском режиме...)
Например:
mva@note voxforge-ru-0.2 % echo '1 1 1 1 1 1 1 1 1 1 1' | RHVoice > tst.wav
mva@note voxforge-ru-0.2 % ./tst.sh
000000000: один один один один один один один один один один один
mva@note voxforge-ru-0.2 % echo '1 1 1 1 1 1 1 1 1 1' | RHVoice > tst.wav
mva@note voxforge-ru-0.2 % ./tst.sh
mva@note voxforge-ru-0.2 % echo 'Включить свет!' | RHVoice > tst.wav
mva@note voxforge-ru-0.2 % ./tst.sh
mva@note voxforge-ru-0.2 % echo 'абракадабра абракадабра абракадабра абракадабра абракадабра' | RHVoice > tst.wav
mva@note voxforge-ru-0.2 % ./tst.sh
000000000: оба когда добра как добра брака добра добра добра брака добра