VoxForge
Having a look at the sphinx voxforge transcription dictionary (I downloaded from here: http://www.voxforge.org/de/Downloads ) I read this "qq" all the time. According to a previous thread here in this forum this:
A qq aa:
AB qq a p
ABBEDINGUNG qq a p b @ d ii nn uu nn )
seems to be correct but why is there a qq sometimes at the beginning or sometimes at the end once or even twice like in 2000?
2000 t s v ai t au z @ n t qq qq
2002 t s v ai t au z @ n t qq t s v ai qq
I could not find any entry in the phoneset at http://www.dev.voxforge.org/projects/de/wiki/PhoneSet . Do these lists correspond? Or did I simply miss something?
Cheers
Grilli
> seems to be correct but why is there a qq sometimes
No, qq must be dropped from a phoneset and the dictionary.
Dictionary has many other problems beside qq, it also fails to convert words with umlauts properly.
The dictionary has to be created from scratch from espeak and the issues mentioned above must be fixed.
Mit dem qq wurde scheinbar versucht den Glottalverschluss abzubilden, der häufig vor deutschen Vokalen gebildet wird. Teilweise sind damit auch kurze Pausen simuliert worden.Ich vermute mal das dies die qqs am Ende sein sollen.
Ob dieser wirklich ins Phonemset gehört oder nicht stell ich jetzt einfach mal so hin.
Thank you for the quick reply. So it's this phenomenon: http://de.wikipedia.org/wiki/Stimmloser_glottaler_Plosiv#Glottisschlag_im_Vokalanlaut
I'm not an expert but IMO modeling glottal stop as a separate phoneme "qq" is likely to confuse the recognizer. At the moment I'm not sure if glottal stop should be modeled at all. If so maybe one could model it as "aq eq iq oq uq".
Eine sehr interessante Frage, ob der glottal stop ein Phonem ist?
Für den Anfang würde ich ihn weglassen, langfristig gehört er meiner Meinung nach dazu.