guenter-20131126-xck - voxforge.org

German Speech Files

Flat

guenter-20131126-xck

User: speechsubmission
Date: 2/5/2014 8:03 am

Views: 924
Rating: 0

User Name:guenter

Speaker Characteristics:

Gender: Männlich
Age Range: Erwachsener
Language: DE
Pronunciation dialect: Südwestdeutschland

Recording Information:

Microphone make: n/a
Microphone type: Headset-Mikro (am Kopfhörer)
Audio card make: unknown
Audio card type: unknown
Audio Recording Software: VoxForge Speech Submission Application
O/S:

File Info:

File type: wav
Sampling Rate: 48000
Sample rate format: 16
Number of channels: 1

Prompts:

de5-001 Die Spracherkennung ist ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik
de5-002 Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren
de5-003 Die Spracherkennung ist zu unterscheiden von der Stimm bzw Sprechererkennung
de5-004 Allerdings ähneln sich die Realisierungen dieser Verfahren
de5-005 Die Forschung an Spracherkennungssystemen begann in den 1960er Jahren
de5-006 Die von privaten Firmen entwickelten Systeme ermöglichten die Erkennung von einigen Dutzend Einzelwörtern
de5-007 Dies lag einerseits an dem begrenzten Wissen in diesem neuen Forschungsgebiet
de5-008 Erst Mitte der 1980er Jahre kam die Entwicklung weiter voran
de5-009 In dieser Zeit entdeckte man, dass man durch Kontextprüfungen Homophone unterscheiden konnte
de5-010 Indem man die Häufigkeit bestimmter Wortkombinationen auswertete konnte man entscheiden, welches Wort gemeint war
de5-011 Diese so genannten Trigrammstatistiken wurden anschließend ein wichtiger Bestandteil aller Spracherkennungssysteme
de5-012 1984 stellte IBM ein erstes Spracherkennungssystem vor
de5-013 Das System brauchte für einen Erkennungsvorgang jedoch mehrere Minuten
de5-014 Fortschrittlicher war dagegen ein von Dragon Systems entwickeltes System
de5-015 Dieses ließ sich auf einem tragbaren PC verwenden
de5-016 1991 stellte IBM erstmals auf der CeBIT ein Spracherkennungssystem vor
de5-017 Ende 1993 stellte IBM das erste für den Massenmarkt entwickelte Spracherkennungssystem vor
de5-018 Das System lief auf normalen PCs und kostete unter 1000 Dollar
de5-019 2004 gab IBM Teile seiner Spracherkennungsanwendungen als Open Source frei
de5-020 Branchenkenner vermuteten als Grund taktische Maßnahmen
de5-021 Derzeit kann grob zwischen zwei Arten der Spracherkennung unterschieden werden
de5-022 Sprecherunabhängige Spracherkennung
de5-023 Sprecherabhängige Spracherkennung
de5-024 Der Wortschatz ist jedoch auf einige tausend Wörter begrenzt.
de5-025 Sprecherabhängige Spracherkenner müssen vor der Verwendung auf die eigenen Besonderheiten der Aussprache trainiert werden
de5-026 Ein Einsatz in Anwendungen mit häufig wechselnden Benutzern ist damit nicht möglich
de5-027 Der Wortschatz ist im Vergleich sehr viel größer als der der sprecherunabhängigen Erkenner
de5-028 Zu unterscheiden ist ferner zwischen
de5-029 Solche Systeme sind insbesondere im medizinischen Bereich noch verbreitet
de5-030 Neue Verbreitung können sie beim Einsatz auf Smartphones und ähnlichen Mobilgeräten finden
de5-031 Sprecherunabhängige Spracherkennung wird bevorzugt im technischen Einsatz verwendet
de5-032 So erreichen Systeme zur Erkennung der gesprochenen englischen Ziffern eine nahezu 100% Erkennungsquote
de5-033 Selbst eine Treffsicherheit von 95 Prozent ist indes zu gering
de5-034 Daher profitieren z. B. Dichter und Journalisten weniger vom Einsatz der Spracherkennung
de5-035 Neben der Größe des Wörterbuches spielt auch die Qualität der akustischen Aufnahme eine entscheidende Rolle
de5-036 Dies entspricht Beobachtungen bei der menschlichen Spracherkennung
de5-037 Auf die gleiche Weise kann der Benutzer auch zu einer erneuten Spracheingabe aufgefordert werden
de5-038 Bei einem Satz in der Alltagssprache werden die einzelnen Wörter ohne wahrnehmbare Pause dazwischen ausgesprochen
de5-039 Als Mensch kann man sich intuitiv an den Übergängen zwischen den Wörtern orientieren
de5-040 Moderne Systeme sind jedoch auch fähig, kontinuierliche Sprache zu verstehen
de5-041 Bei der diskreten Sprache erkennt man deutlich die Pausen zwischen den Wörtern
de5-042 Bei der kontinuierlichen Sprache gehen die einzelnen Wörter ineinander über
de5-043 Dies ist für die Größe des Wortschatzes von Bedeutung
de5-044 Die Größe des Wörterbuchs hängt stark von der Sprache ab
de5-045 In vielen Sprachen gibt es Wörter oder Wortformen
de5-046 So klingen die Wörter Meer und mehr zwar identisch haben jedoch trotzdem nichts miteinander zu tun
de5-047 Solche Wörter nennt man Homophone
de5-048 Die Frage nach der Groß- oder Kleinschreibung fällt auch in diesen Bereich
de5-049 Auf akustischer Ebene spielt insbesondere die Lage der Formanten eine Rolle
de5-050 Die tiefere Frequenz liegt im Bereich von 200 bis 800 Hertz
de5-051 Über die Lage dieser Frequenzen lassen sich die einzelnen Vokale unterscheiden
de5-052 Konsonanten sind vergleichsweise schwierig zu erkennen
de5-053 Andere Konsonanten sind durchaus an charakteristischen spektralen Mustern erkennbar
de5-054 Ein Spracherkennungssystem besteht aus folgenden Bestandteilen
de5-055 Anschließend findet die tatsächliche Erkennung mit Hilfe akustischer Modelle, Wörterbücher und Sprachmodellen statt
de5-056 Bei der Abtastung wird das diskrete Signal digitalisiert
de5-057 Die wichtigste Aufgabe des Arbeitsschrittes Filterung ist die Unterscheidung von Umgebungsgeräuschen
de5-058 Dazu wird zum Beispiel die Energie des Signals oder die Nulldurchgangsrate herangezogen
de5-059 Für die Spracherkennung ist nicht das Zeitsignal, sondern das Signal im Frequenzbereich relevant
de5-060 Aus dem Resultat, dem Frequenzspektrum, lassen sich die im Signal vorhandenen Frequenzanteile ablesen
de5-061 Zur eigentlichen Spracherkennung wird ein Merkmalsvektor erstellt
de5-062 Dieser besteht aus voneinander abhängigen oder unabhängigen Merkmalen

License:

Copyright 2011 Free Software Foundation

These files are free software: you can redistribute them and/or modify
them under the terms of the GNU General Public License as published by
the Free Software Foundation, either version 3 of the License, or
(at your option) any later version.

These files are distributed in the hope that they will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
GNU General Public License for more details.

You should have received a copy of the GNU General Public License
along with these files. If not, see http://www.gnu.org/licenses/.

guenter-20131126-xck.tgz

Previous • Next •


Username	Password