VoxForge
Посмотрел, почитал я про модели русского и решил попробовать насколько оно вообще работоспособно...
Linux, поставил Sphinxbase/Sphinx3, скачал акустическую модель, попробовал запустить...
Ругается... Много много строчек вида:
ERROR: "wid.c", line 282: ????? is not a word in dictionary and it is not a class tag
Такое очущение, что сфинксу русский в словаре не нравится... Что не так ?
И при чем тут это ? Я не с ЛОРа... И не аналитик. И глаза у меня нормального цвета. Более того сервера у меня везде на FreeBSD. Просто для одного своего хобби-проекта (а он на убунте) подумывал сделать голосовое управление. Почитал-посмотрел и попытался поднять сфинкс с русской моделью чтобы посмотреть как оно будет работать в условиях зашумления (авто). Ну и обломался.
А можно подробнее про кодировку ? Это на компиляции задается или ключами ? Вроде в доках ничего похоже не нашел :(
Тут дело не в том, чтобы задать кодировку, а в том чтобы кодировки в словаре и в модели языка совпадали.
В простейшем случае, чтобы протестировать распознавание нужно задать словарь:
да d aa
нет nn ee t
и модель языка в формате jsgf:
#JSGF V1.0;
grammar answer;
public <answer> = (да | нет);
После этого можно запустить тест:
pocketsphinx_continuous -hmm model_parameters/msu_ru_nsh.cd_cont_1000 -jsgf yesno.jsgf -dict yesno.dict -dictcase yes
Так.... Простите, был напуган. Оказывается покет работает и на десктопе. И очень неплохо работает как оказалось. Так что я принял решение использовать его. Я так понимаю благодарности вы берете борзыми щенками ? :) В смысле записями...
Какой текст лучше записывать ? Литературный или можно любой ? :)))
По хорошему нужно помочь в написании транскрипции к записям дикторов с http://abook-club.ru/forum/index.php?showtopic=3537. Нужно написать текст для каждой записи. Список не обработанных выложу позднее.
Также можно записать любой текст, хоть литературный хоть нет.
Кстати, для работы в зашумлённых условиях надо будет делать шумодавилку, она пока ещё не реализована.
Про транскрипции надо будет подробнее объяснить что там и как делать - чем могу помогу. Текст попробую записать на праздниках.
А шумодавилка это часть акустической модели или это код сфинкса ? Вроде у меня в шуме адекватно реагирует. Даже в движении с открытыми окнами. Тут я так понял важно правильно микрофон разместить.
> Про транскрипции надо будет подробнее объяснить что там и как делать - чем могу помогу. Текст попробую записать на праздниках.
Хорошо, спасибо.
> А шумодавилка это часть акустической модели или это код сфинкса ? Вроде у меня в шуме адекватно реагирует. Даже в движении с открытыми окнами. Тут я так понял важно правильно микрофон разместить.
Код. Декодер хорошо работает, пока слов мало, если будет их больше, начнутся проблемы.