Gruber, G. J. P. (2017). Design-Space von Audio Sample Browsern [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2017.36111
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2017
-
Number of Pages:
131
-
Keywords:
Information Retrieval; Music Information Retrieval; Contentbased Feature Extraction; Dimensionreduction; Information Visualization
de
Abstract:
Für Musiker, Gamesound-Designer und Toningenieure, die sich mit der Vertonung von Filmen und Videos beschäftigen, ist Sample-Browsing ein Bestandteil des täglichen Arbeitsablaufes. Während sich die Methoden und Benutzeroberflächen mit denen die genannten Berufsgruppen ihre Samplesuche durchführen kaum verändert haben, ist der Umfang der zur Verfügung stehenden Samples in den letzten 15 Jahren exponentiell gestiegen. Das kreative Potential derartig großer Sample-Mengen kann weder mit listenbasierten Interfaces noch mit einer Stichwortsuche ausgeschöpft werden. Als Alternative zu listenbasierten Interfaces und Stichwortsuchen sind in den letzten 15 Jahren mehrere Forschungsprototypen entwickelt worden, die die psychoakustische Ähnlichkeit von Samples algorithmisch berechnen. In den meisten Fällen stellen diese Anwendungen einzelne Samples als grafische Objekte auf einer 2D Karte dar. Die Ähnlichkeit der Samples wird durch den Abstand der grafischen Objekte visualisiert. Nach 15 Jahren universitärer Forschung und einer Vielzahl an vorgestellten Forschungsprototypen bleibt der Befund, dass sich dieses Designkonzept (=ähnlichkeitsbasierter Sample-Browser) in der Praxis nicht durchgesetzt hat. Die zentrale Fragestellung dieser Arbeit ist daher die Identifikation jener Faktoren, welche die Usability dieses Ansatzes beinträchtigen. Die bisher vorgestellten Forschungsprototypen wurden häufig durch relative kurze, pro Anwenderin einmalige User-Tests evaluiert. Ähnlichkeitsbasierte Sample-Browser unterscheiden sich in vielen Aspekten deutlich von listenbasierten Interfaces und erfordern eine Lernphase um das volle Potential dieser Interfaces auszuschöpfen. In einem mehrmonatigen, partizipativen Designprozess wurde daher im Rahmen dieser Diplomarbeit ein ähnlichkeitsbasierter Sample-Browser entwickelt und zwei Anwender über einen längeren Zeitraum mit dem Designkonzept „ähnlichkeitsbasierter Sample-Browser“ vertraut gemacht. Im Laufe des Designprozesses wurden jene Faktoren identifiziert, die eine weitreichende Verwendung von ähnlichkeitsbasierten Sample-Browsern durch die genannten Berufsgruppen verhindern. Drei Faktoren beinträchtigen die Usability von ähnlichkeitsbasierten Sample-Browsern wesentlich. Einer dieser Faktoren ist die Diskrepanz zwischen der algorithmisch ermittelten und durch Abstand visualisierten Ähnlichkeit der Samples und dem subjektiven Ähnlichkeitsempfinden der Anwenderinnen. Weiters ergeben die Berechnungen und Visualisierungen von ähnlichkeitsbasierten Sample-Browsern für in der Praxis verwendete Sample-Sammlungen zumeist nur eine einzige, diffuse Punktwolke ohne erkennbare Gruppen ähnlicher Samples. Damit sind für den realen Anwendungsfall die optische Ähnlichkeitswahrnehmung, die systematische Navigation, sowie die Erstellung und Memorisierung eines mentalen Bildes, wo auf der 2D Karte Samples mit bestimmten akustischen und klanglichen Eigenschaften zu finden sind, stark beeinträchtigt. Drittens wurde die für jede ähnlichkeitsbasierte 2D Karte unterschiedliche semantische Struktur als gravierende Schwäche identifiziert. Anwenderinnen gelingt es grundsätzlich die semantische Struktur der Karten durch Anhören der Samples zu ermitteln. Ein Memorisieren der semantischen Struktur gelingt den Anwenderinnen aber in der Regel nicht. Eine zielgerichtete Suche in Karten, deren semantische Struktur bereits einmal ermittelt wurde, ist daher nicht möglich. Jeder erneute Zugriff auf eine Karte gleicht (-wie bei einem listenbasierten Interface-) eher einem zufallsgesteuerten „Try and Error“ Prozess.
de
Sample-Browsing is a part of musicians, gamesound-designers and filmsound-designers daily workflow. While the methods and user interfaces that the named above professions use while searching for samples hardly changed, the number of available samples increased exponentially during the last 15 years. The full, creative potential of such a huge number of samples cannot be tapped with list-based interfaces or a keyword search. As an alternative to list-based interfaces and keyword searches several research prototypes, that calculate the psychoacoustic similarity of samples algorithmically, have been developed during the last 15 years. In most of cases these applications depict single samples as graphical objects on a 2D map. The similarity of samples is visualized by the distance between these graphical objects. After 15 years of scientific research and a multitude of proposed research prototypes the finding is that this design concept (= similarity-based sample-browser) is not widely used in practice. Therefore, the central issue of this thesis is the identification of factors that impair the usability of this approach. In many cases the research prototypes proposed so far have been evaluated with comparatively short and for each user one-off user tests. Similarity-based sample-browsers differ significantly in many aspects from list-based interfaces and a learning phase is needed to tap the full potential of these user interfaces. Therefore, in a participatory design process lasting several months a smiliaritybased sample-browser was developed as part of this thesis and two users were acquainted with the design concept of „similiaritybased sample-browsing “. During the design process factors that forestall the wide-ranging use by the named above professional guilds were identified. Three factors impair the usability of similarity-based sample-browsers significantly. One of these factors is the discrepancy between the algorithmically calculated similarity (-visualized by distance) and the resemblance of samples subjectively perceived by users. Furthermore, the calculations and visualizations of similarity based sample-browsers show only a single, diffuse cloud of points without any recognizable groups of similar samples for real world sample-collections. Thereby the visual perception of similarity, the systematic navigation as well as the creation and memorizing of a mental picture where on the map samples with specific acoustic und tonal properties are to be found are severely jeopardized for the realistic case of application. Thirdly the semantic structure differing for each simlaritybased 2D map was identified as a severe weakness. Principally users mange to identify the semantic structure while listening to the samples on the map but generally fail to memorize the semantic structure. Therefore, a targeted search on maps, the semantic structure of which was already identified beforehand is not possible. Each access on the 2D maps is (-similar to a list-based interface-) a try and error process.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers