Sie können zur Simulation der akustischen Umgebung bei einer Spracheingabe zur Spracherkennung verschiedene Parameter auf einer nachfolgenden Internetseite einstellen. Mit den gewählten Parametern können Sie eine eigene Sprachaufnahme bearbeiten und sich das Ergebnis als Sprachdatei im WAV Format auf Ihren Rechner herunterladen und anhören. Sollten Sie keine eigene Sprachprobe zur Verfügung haben, so wird die Simulation mit einer auf dem Simulationsrechner vorhandenen Sprachprobe vorgenommen. Das Auswahlfeld zur Selektion der eigenen Sprachprobe braucht in diesem Fall nicht ausgefüllt zu werden.
Es können Sprachaufnahmen, die mit 8 oder mit 16 kHz abgetastet wurden, bearbeitet werden. In Abhängigkeit der Abtastfrequenz wird dann unter anderem die entsprechende Sprachcodierung und Simulation der Mobilfunkübertragung eingesetzt. Zum korrekten Aufbau der Auswahlmenüs ist nun die Angabe der Abtastfrequenz erforderlich:
Es können Sprachdateien, bei denen nur die Abtastwerte als 16 Bit (Short) Werte abgespeichert wurden (RAW Format), oder Dateien im WAV Format bearbeitet werden. Im Fall von RAW Dateien ist zudem die Angabe der Byte Reihenfolge erforderlich. Auf einem PC sind die Bytes normalerweise in der als "little endian" bezeichneten, auf einer SUN in der als "big endian" bezeichneten Reihenfolge abgespeichert . Bitte geben Sie nachstehend das Format Ihrer Sprachdatei an:
Es kann die Übertragung des Sprachsignals entweder über GSM oder UMTS simuliert werden. Bitte wählen Sie den gewünschten Modus:
Die aus der Simulation resultierende Sprachdatei wird im WAV-Format zur Verfügung gestellt.
Hinweise zur Bedienung der graphischen Oberfläche:
Detailliertere Informationen zu der Simulation können einer Veröffentlichung entnommen werden.
Simulation of acoustic environments including the transmission over telephone channels
Different parameters can be defined on a succeeding Web page to simulate the acoustic environment during the speech input to a recognition system. An own speech recording can be processed with the selected parameter settings. If you do not have an own speech recording available, the simulation will be carried out with a speech file that is available on the computer running the simulation. In this case there is no need to fill out the field for selecting your own speech recording. The result can be downloaded as speech file (WAV format) for listening to it on your computer.
Speech recordings can be processed that have been sampled at rates of 8 or 16 kHz. Depending on the sampling frequency, the corresponding speech coding and the corresponding simulation of the cellular channel will be applied. The sampling frequency has to be defined here to show the right menus:
Speech files can be processed where only the speech samples have been stored as 16 bit (short) values in RAW format or files in the WAV format. In case of RAW files the byte order within each short value has to be defined. Bytes are usually ordered as "little endian" on a PC and as "big endian" on a SUN computer. Please, define the format of your speech file:
Please select either GSM or UMTS mode for the simulation of the transmission in a mobile network.
The result of the simulation will be a speech file in WAV format.
Hints for controlling the graphical interface:
Details about the simulation can be found in a separate paper.
back