Peham, T. M. (2011). Binaural cue coding of stereo audio signals [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/159886
Binaural Cue Coding (BCC) ist ein verlustbehaftetes Audio Komprimierungsverfahren welches sich die Art und Weise, wie das menschliche Gehör Stereo- Audio-Signale wahrnimmt, zunutze macht. Die BCC Methode besteht aus einem Analyse- und einem Synthese-Teil. Die Idee besteht darin, den linken und den rechten Anteil eines Stereo-Signales einzeln zu analysieren. Dadurch erhält man spezielle Informationen (binaural side information), welche den Stereo- Hörereindruck der beiden Audio-Signale charakterisieren. Die Datenrate dieser Zusatzinformation ist, verglichen mit dem originalen Stereo-Audio-Signal, gering. Nachdem die Analyse der Signale stattgefunden hat, wird das original Stereo- Signal in ein Mono-Signal umgewandelt. Damit wird eine Komprimierung um 50 Prozent erreicht. Mittels der BCC Synthese wird nun versucht, unter Verwendung der binauralen Zusatzinformation, aus dem Mono-Signal das original Stereo-Signal zu rekonstruieren. In dieser Arbeit wurde eine BCC Methode entwickelt und mittels MATLAB umgesetzt. Für die Umsetzung wurden Schätzwerte für den interauralen Pegel, die interaurale Korrelation sowie für die interaurale Laufzeitverzögerung verwendet. Zusätzlich unterstützt das entwickelte Konzept Blockverarbeitung, um Streaming zu ermöglichen. Für die Umsetzung der BCC Methode wurde eine Cochlea-Filter-Bank (CFB) welche aus IIR(Infinite Impulse Response)-Filtern besteht, entwickelt. IIR-Filter wurden verwendet, um die Komplexität der CFB möglichst gering zu halten. Die für das BCC Konzept benötigte Signalverarbeitung wird zur Gänze im Zeitbereich ausgeführt. Um die Leistungsfähigkeit der entwickelten Komprimierungsmethode bei Verwendung von Kopfhörern zu evaluieren, wurde ein standardisiertes Audio-Testverfahren durchgeführt und ausgewertet.
Binaural Cue Coding (BCC) is a lossy audio compression method taking advantage of how the human auditory system perceives stereo audio signals. BCC consists of an analysis and a synthesis part. The main concept is to analyze the left and the right channel of a stereo audio signal and obtain binaural side information. Compared to the original audio signal, the binaural side information has a low data rate. After that, the stereo signal is converted into a mono signal. This means that the original audio signal gets compressed by 50 percent. Then, the BCC synthesis reconverts the mono audio signal back into a stereo audio signal using the binaural side information. As an integral part of this thesis a BCC method was developed and implemented in MATLAB which includes interaural level estimates, interaural correlation estimates, and interaural time delay estimates. Additionally, block processing is provided to permit streaming. For the implementation of the BCC concept a cochlear filter bank (CFB) was created consisting of infinite impulse response (IIR) filters to permit low complexity. The whole signal processing is carried out in time domain. Besides, a standardized listening test was realized to evaluate the performance over headphones of the BCC method.