Russian

Flat
Sphinx3
User: Alex
Date: 5/6/2009 7:31 pm
Views: 11880
Rating: 6

Посмотрел, почитал я про модели русского и решил попробовать насколько оно вообще работоспособно...

Linux, поставил Sphinxbase/Sphinx3, скачал акустическую модель, попробовал запустить...

Ругается... Много много строчек вида: 

ERROR: "wid.c", line 282: ????? is not a word in dictionary and it is not a class tag

Такое очущение, что сфинксу русский в словаре не нравится... Что не так ?

Re: Sphinx3
User: nsh
Date: 5/7/2009 1:57 am
Views: 100
Rating: 5

> насколько оно вообще работоспособно...


Аналитик с ЛОРа?

> Такое очущение, что сфинксу русский в словаре не нравится... Что не так ?


Кодировка

Re: Sphinx3
User: Visitor
Date: 5/7/2009 3:39 am
Views: 144
Rating: 6

И при чем тут это ? Я не с ЛОРа... И не аналитик. И глаза у меня нормального цвета. Более того сервера у меня везде на FreeBSD. Просто для одного своего хобби-проекта (а он на убунте) подумывал сделать голосовое управление. Почитал-посмотрел и попытался поднять сфинкс с русской моделью чтобы посмотреть как оно будет работать в условиях зашумления (авто). Ну и обломался.

А можно подробнее про кодировку ? Это на компиляции задается или ключами ? Вроде в доках ничего похоже не нашел :(

Re: Sphinx3
User: nsh
Date: 5/7/2009 5:02 pm
Views: 84
Rating: 8

Тут дело не в том, чтобы задать кодировку, а в том чтобы кодировки в словаре и в модели языка совпадали.


В простейшем случае, чтобы протестировать распознавание нужно задать словарь:

да d aa
нет nn ee t

и модель языка в формате jsgf:

#JSGF V1.0;
grammar answer;

 

public <answer> = (да | нет);


После этого можно запустить тест:

 pocketsphinx_continuous -hmm model_parameters/msu_ru_nsh.cd_cont_1000 -jsgf yesno.jsgf  -dict yesno.dict -dictcase yes

 

Re: Sphinx3
User: Visitor
Date: 5/7/2009 10:01 pm
Views: 99
Rating: 5

Sphinx3 jsgf модель не понимает... В исходниках даже упоминания нету про jsgf. Покет мне негде запустить :(

Re: Sphinx3
User: nsh
Date: 5/8/2009 12:33 am
Views: 101
Rating: 6

В каком смысле "негде"? Это такой же декодер, как и sphinx3.

Re: Sphinx3
User: Visitor
Date: 5/8/2009 1:00 am
Views: 159
Rating: 5

Так.... Простите, был  напуган. Оказывается покет работает и на десктопе. И очень неплохо работает как оказалось. Так что я принял решение использовать его. Я так понимаю благодарности вы берете борзыми щенками ? :) В смысле записями...

Какой текст лучше записывать ? Литературный или можно любой ? :)))

Re: Sphinx3
User: nsh
Date: 5/8/2009 1:12 am
Views: 85
Rating: 6

По хорошему нужно помочь в написании транскрипции к записям дикторов с http://abook-club.ru/forum/index.php?showtopic=3537. Нужно написать текст для каждой записи. Список не обработанных выложу позднее.

Также можно записать любой текст, хоть литературный хоть нет.

Кстати, для работы в зашумлённых условиях надо будет делать шумодавилку, она пока ещё не реализована.

Re: Sphinx3
User: Alex
Date: 5/8/2009 1:41 am
Views: 93
Rating: 5

Про транскрипции надо будет подробнее объяснить что там и как делать - чем могу помогу. Текст попробую записать на праздниках.

А шумодавилка это часть акустической модели или это код сфинкса ? Вроде у меня в шуме адекватно реагирует. Даже в движении с открытыми окнами. Тут я так понял важно правильно микрофон разместить.

 

Re: Sphinx3
User: nsh
Date: 5/8/2009 1:55 am
Views: 113
Rating: 7

> Про транскрипции надо будет подробнее объяснить что там и как делать - чем могу помогу. Текст попробую записать на праздниках.


Хорошо, спасибо.

> А шумодавилка это часть акустической модели или это код сфинкса ? Вроде у меня в шуме адекватно реагирует. Даже в движении с открытыми окнами. Тут я так понял важно правильно микрофон разместить.

Код. Декодер хорошо работает, пока слов мало, если будет их больше, начнутся проблемы.

PreviousNext