
Hilfe mit ein effizient Deutsch acoustic model
User: bsnayak
Date: 1/17/2014 9:21 am
Hallo Zusammen

Ich bin Nayak aus Indien und einem student in Deutschland. Ich interessieren mich an dem sprache kennung software. Gerade Ich suche fur Deutsch Acoustic model dass kann ich in meinem projekt zu verbinden.

Die Acoustic model hier ist nicht sehr effizient in einem applikation zu verbinden. z.b..wenn ich pruefe "zwei" kommt immer "Es bei" und es ist gleich mit verschidnen worte.

Darf ich fragen, Wenn jemand von euch kann mir ein sehr efficient Deutsch Acoustic model mit limited Dictionary (mit nummer oder mit limited vocable). Ich werde versuchen mit meinem erfahrung es zu verbessern ud erweitern. Es wird mein Problem zu lösen

Ich danke ihnen fur die hilfe.

Re: Hilfe mit ein effizient Deutsch acoustic model
User: Dr_Grilli
Date: 1/21/2014 4:22 am
Hallo Nayak,

die deutschen akustischen Modelle sind verglichen mit den englischen nicht besonders gut. Eventuell müsstest du dir nochmal selber ein Modell berechnen. Im Thread "Organizing controlling/tagging of german audio material" ( ) wird gerade versucht die Qualität der akustischen Modelle durch eine gezielte Auswahl der Training-Dateien zu steigern.

Ich bin kein 100%-iger Experte auf dem Gebiet aber vielleicht musst du auch nochmal am Language-Model arbeiten. Was genau bedeutet bei dir "limited vocabulary"? Vielleicht hilft es, wenn du den Wortschatz weiter eingrenzt.

Viele Grüße


Re: Hilfe mit ein effizient Deutsch acoustic model
User: bsnayak
Date: 1/22/2014 7:12 am
Hallo Dr Grilli

danke für die antwort und die referenz.

Ich habe leider nicht so gut erfahrung mit dem acoustic model. Aber ja versuche ich meinem best ein neue acoustic model zu bauen.

wenn ich ein gute deutsch acoustic model findet kann, werde ich  versuchen weiter zu verbesseren. Die Wortschatz für meinem Applikation sind

1) die Nummer (0...99)

2) Charakter ( RM/FM/RAM/ZBB)

3) Vorauswahl RM /....

4) Türen Zwangsfreigabe Rechts/Links

5)Lasche Nachrichten/ Türen/ Vorschau

6) RM Geschwindigkeit  40

Ihre beratung wird hilferich sein

mit freundlichen Grußen







Re: Hilfe mit ein effizient Deutsch acoustic model
User: Dr_Grilli
Date: 1/24/2014 8:59 am
I don't know much of your scenario but: In case of a limited vocabulary and a predefined order in which the words of your vocabulary are combined it might help to restrict your recognition to a certain set of words or a certain grammatical structure specified in a JSGF file. At least in CMU/Sphinx it is possible to do that. This should prevent the recognizer from detecting "Es bei" because there are no entries for that phrase in the vocabulary.

The backside: Your recognition will then force your grammar on everything that is said. In case you have a way to distinguish between command and some other utterance by for example a push-to-talk-button this solution should still work fine.

Re: Hilfe mit ein effizient Deutsch acoustic model
User: bsnayak
Date: 1/27/2014 5:59 am
Darf ich dir fragen meine dictionary zu überprüfen!!  Bitte sag mir auch wie kann mann die LM file für deutsch entwickeln?? Danke schön !

Re: Hilfe mit ein effizient Deutsch acoustic model
User: Dr_Grilli
Date: 1/27/2014 6:43 am
Looks good at the first view. But I'm not an expert on this topic. I'm not sure if special characters like "@" or ":" are allowed or actually available as phonemes in the voxforge-german dictionary. There is another issue about this "qq". The "qq" models the glottal stop.

In my opinion this does not make sense at the end of a word. Whether it should be modeled at all or not I don't know. I erase the qq-phoneme from the dictionary. But as I said I'm no expert in any means and haven't built my own acoustic or language model yet.

Concerning the language model, have a look at the German Parole Corpus here: For building the LM you can either build it statistically with said corpus or by specifying a JSGF file. There's plenty of ressources for JSGF and Sphinx-4 on the internet. You can use JSGF for PocketSphinx as well.

Re: Hilfe mit ein effizient Deutsch acoustic model
User: bsnayak
Date: 2/11/2014 5:27 am
what are the different factors i need to take care when i expect my sppech recognition to be done in a noisy environment?

how much audio datafiles should i take for training a system of 100 words?

what should be the minimum length of each files?



Bhabani Nayak


