Hölzel, C. (2014). Audio inpainting - a comparison between methods of autoregressive modeling and compressive sampling [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2014.24036
Audiosignal Processing; Signal Interpolation; Compressive Sampling
en
Abstract:
Diese Diplomarbeit evaluiert die Leistungsfähigkeit von Algorithmen zu Rekonstruktion von impulsartig gestörten Samples und Aussetzern in digitalen Audiosignalen. Das Hauptaugenmerk liegt dabei auf dem Vergleich von Methoden aus dem relativ neuen Gebiet des Compressive Sampling mit einer klassischen Technik aus den 80ern, die auf autoregressiver Modellierung beruht. Bei beiden Ansätzen wird mittels der Informationen, die in den ungestörten Daten enthalten sind, ein Signalmodell generiert, welches anschließend für die Schätzung der unbekannten Samplewerte benutzt wird. Letztere werden als fehlend und ihre Positionen als von vornherein bekannt angenommen. Es müssen dabei keine weiteren Kenntnisse miteinbezogen werden. Die nötigen Grundlagen aus der Theorie der digitalen Signalverarbeitung werden umrissen und ein detaillierter Einblick in die speziellen algorithmischen Abläufe gegeben. Für die autoregressive Modellierung setzen wir schnelle Methoden zur adaptiven Schätzung der Modellparameter und der darauffolgenden Berechnung der unbekannten Samples ein, die die Levinson-Durbin-Rekursion und Cholesky-Zerlegung verwenden. Die Methoden des Compressive Sampling stützen sich auf die Annahme, dass Audiosignale in einer passenden Domäne durch einen schwachbesetzten Vektor repräsentiert werden können. Wir verwenden dazu ein redundantes Discrete Cosine Transform Dictionary. Die betrachteten Algorithmen beinhalten Orthogonal Matching Pursuit, Least Angle Regression und Iterative Soft Thresholding. In einer Reihe von umfangreichen computerbasierten Experimenten wird der Signal-Rausch-Abstand der resultierenden Näherungswerte berechnet und verglichen, wobei verschiedenartige Fehlerszenarien mit mehreren Sets von Sprach- und Musiksignalen getestet werden.
de
This diploma thesis evaluates the performance of restoration algorithms for the recovery of impulsively distorted samples and gaps in digital audio signals. The focus specifically lies on the comparison of methods from the recently very active field of compressive sampling with a classical technique from the 80s that is based on autoregressive modeling. Both approaches rely on the generation of a signal model from the reliable data to estimate the values of the defective samples. The latter are treated as missing and their locations are assumed to be known a priori. No additional information has to be incorporated. The corresponding theoretical basics of digital signal processing are outlined and some detailed insight into the specific algorithmic steps is given. For autoregressive modeling, we apply fast methods for the adaptive estimation of the model parameters and subsequent calculation of the unknown samples that utilize the Levinson-Durbin recursion and Cholesky decomposition. The compressive sampling methods are backed by the assumption that audio signals can be represented by a sparse vector in conjunction with a proper dictionary of basis functions. For this purpose, we employ a redundant discrete cosine transform dictionary. The examined reconstruction algorithms comprise of Orthogonal Matching Pursuit, Least Angle Regression and Iterative Soft Thresholding. In a series of extensive numerical experiments, the signal-to-noise-ratio of the resulting approximations is computed and compared, considering various kinds of error scenarios for multiple sets of speech and music signals.
en
Additional information:
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers Zsfassung in dt. Sprache