Spracherkennung

 

Es werden Kenntnisse über die grundlegende Struktur von Systemen zur automatischen Erkennung der in Sprachsignalen enthaltenen Inhalte vermittelt. Damit werden die Studierenden in die Lage versetzt, die eingesetzten Verfahren zur Signalverarbeitung, zur Modellierung von Sprachsignalen und zur Mustererkennung verstehen und eigenständig anwenden zu können.

 

 

Es wird vorgestellt, wie man

 

  • Kenntnisse über die Arbeitsweise des menschlichen Gehörs dazu benutzt, die für die Erkennung relevanten akustischen Parameter mit Hilfe einer Kurzzeit-Spektralanalyse aus dem Sprachsignal zu extrahieren,
  • die zur Erkennung benötigten Referenzmuster mit dem statistischen Ansatz des Hidden Markov Modells (HMM) erzeugen kann, mit dem sprachliche Abschnitte wie ganze Wörter oder einzelne Laute modelliert werden,
  • zur Mustererkennung mit Hilfe des Viterbi Algorithmus die Wahrscheinlichkeit berechnen kann, dass ein HMM eine extrahierte Folge von Merkmalsparametern generieren kann,
  • die Spracherkennung zum Aufbau von Sprachdialogsystemen, z.B. mit VoiceXML, einsetzen kann.

 

Die Vermittlung der theoretischen Inhalte wird durch rechnerische Übungen an konkreten Anwendungsbeispielen und durch praktische Experimente im Labor ergänzt.

Zur Durchführung der praktischen Experimente steht eine Sammlung einfach zu bedienender graphischer Benutzer-Oberflächen zur Verfügung, mit denen die Vorgehensweisen zur Analyse der Sprachsignale und zur Mustergenerierung und -erkennung erarbeitet werden können und erfahrbar gemacht werden. Zudem programmieren die Studierenden eigenständig einzelne Funktionen unter Matlab, die das Verständnis der einzelnen Verarbeitungsschritte fördern.

Die Entwicklung der graphischen Oberflächen und der dahinter liegenden Signalverarbeitung erfolgte mit Hilfe der Programmierumgebung von Matlab und den unter Matlab vorhandenen Bibliotheken. Zur Spracherkennung mit Hidden Markov Modellen wird eine Programmbibliothek verwendet, die unter der Bezeichnung "Hidden Markov Model Toolkit" (HTK) an der Universität von Cambridge entwickelt wurde. HTK wird zur Generierung der Hidden Markov Modelle eingesetzt.