Nemethova, O. (2007). Error resilient transmission of video streaming over wireless mobile networks [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-17291
video streaming; UMTS; error resilience; error concealment; H.264
en
Abstract:
The third generation of mobile systems brought higher data rates that allow for provisioning of multimedia services containing also the video parts. The real-time services like video call, conferencing, and streaming are particularly challenging for mobile communication systems due to the wireless channel quality variations. The mechanism for video compression utilizes a hybrid of temporal and spatial prediction, transform coding and variable length coding. The combination of these methods provides high compression gain, but at the same time makes the encoded stream more prone to errors.<br />In this thesis, techniques for error resilient transmission of video streaming over wireless mobile networks are investigated. Focus is given to the recent H.264/AVC standard, although the majority of the proposed method apply to other video coding standards, too. First part is dedicated to exploiting the residual redundancy of the received video stream at the decoder. The redundancy is used for error localization within a damaged packet that would be discarded otherwise. Error detection using syntax analysis and detection of impairments in the picture domain do not require any additional rate while reducing the resulting distortion. As their detection performance is limited, alternative methods assisted by an encoder are further proposed. The experimental results show that particularly the resynchronization of the variable length code, facilitated by out-of-stream signalized side information, improves the performance considerably.<br />In the second part of the thesis, error concealment methods are reviewed, compared, improved and proposed. There is no single error concealment method performing best in all situations. Temporal interpolation typically performs better than spatial, unless scene change occurs. Therefore, an adaptive mechanism is proposed that chooses from several temporal and spatial methods according to the situation. A scene change detector based on dynamic thresholding, working independently of encoder settings, is also a part of the proposal. In spite of its low complexity, the proposed mechanism provides an impressive quality gain.<br />The final part handles the cross-layer design for UMTS (Universal Mobile Telecommunications System). It is shown that utilizing the radio link information at the application layer of the receiver can substantially improve the quality at practically no costs (no rate increase, no additional complexity). Moreover, it is shown, that UMTS radio link layer errors are predictable. Differentiation between the intervals with high and low probability of error allows for assignment of different priority level to the video packets of one user, based on semantic information or expected distortion. The scheduler disposing with such information considerably improves the resulting video quality.<br />
de
Durch die Einführung der dritten Mobilfunkgeneration und die damit verbundenen höheren Datenübertragungraten wurde die Anwendung von Multimedia Diensten möglich. Echtzeit-Dienste, wie zum Beispiel Videostreaming und Videotelephonie, stellen hierbei für Mobilfunksysteme eine besondere Herausforderung dar, vor allem wegen der zeitlich veränderlichen Qualität des Funkkanals. Das Videokompressionsverfahren benutzt eine Kombination aus zeitlicher und räumlicher Prädiktion, sowie transformierender und längenvariierender Kodierung. Dies erlaubt zwar eine höhere Datenkompression, jedoch steigt dadurch die Fehleranfälligkeit.<br />Diese Arbeit beschäftigt sich mit der Widerstandsfähigkeit der Videoübertragung über Mobilfunknetze. Das Hauptaugenmerk richtet sich auf den neuesten H264/AVC Standard, obwohl sich die vorgeschlagenen Methoden auch auf andere Videokodierungsstandards anwenden lassen. Teil der Arbeit beschäftigt sich mit dem Ausnutzen der Restredundanz des empfangenen Videostroms im Dekoder. Die Redundanz wird zur Fehlerlokalisierung in einem beschädigtem Datenpaket verwendet, das sonst verworfen werden würde. Fehlererkennung durch Syntaxanalyse und Artefakterkennung erfordert keine Erhöhung der Datenrate bei gleichzeitiger Reduktion der Verzerrung. Aufgrund der limitierten Erkennungsfähigkeit, werden auch zusätzliche Encoder-unterstützte Maßnahmen vorgeschlagen. Experimentelle Ergebnisse zeigen, dass speziell die Resynchronisierung des längenvariierenden Kodes, die Übertragung verbessert. Im zweiten Teil der Arbeit werden Fehlerverdeckungsmethoden miteinander verglichen, verbessert und neu vorgeschlagen. Es gibt keine universelle Fehlerverdeckungsmethode, die optimale Ergebnisse in jeder Situation liefert. Die zeitliche Interpolation verhält sich im allgemeinen besser als die räumliche, außer im Falle eines Szenenwechsels. Deshalb wird ein adaptiver Mechanismus vorgeschlagen, der aus mehreren zeitlichen und räumlichen Methoden, je nach Situation, auswählt. Dazu gehört ein mit einer dynamischen Schwelle funktionierender Szenenwechseldetektor, der unahbhängig von Enkodereinstellungen arbeitet. Trotz seiner Einfachheit liefert die vorgeschlagene Methode eindrucksvolle Ergebnisse. Der Schlußteil behandelt ein Cross-Layer-Design für UMTS. Es wird gezeigt, dass die Verwendung der Radio Link Control (RLC) Information in der Applikationsschicht eine klare Qualitätsverbesserung bringt ohne neue Kosten (kein Datenratenzuwachs, keine zusätzliche Komplexität) zu verursachen.<br />Es wird außerdem gezeigt, dass Fehler in der RLC Schicht vorhersagbar sind. Die Unterscheidung zwischen Intervallen hoher und niedriger Fehlerwahrscheinlichkeit erlaubt die Zuordnung unterschiedlicher Prioritätsklassen zu den Videopaketen eines Benutzers. Ein Scheduler, der über solche Informationen verfügt, verbessert die Videoqualität erheblich.