Kirim, A. (2019). Automatische Kategorisierung von e-Commerce Produkten durch Multimodale Klassifikation [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.41022
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2019
-
Number of Pages:
67
-
Keywords:
data mining; multimodal classification; neural networks
en
Abstract:
Das Organisieren von Produkten in die Produktkategorien ist ein wesentlicher Bestandteil der E-Commerce-Anwendungen. Allerdings in einigen Second-Hand-Marktplatzanwendungen, bei denen Benutzer keine professionellen Verkäufer sind, wird die Eingabe einer Kategorie optional gehalten, um die Erstellung der Inserate zu vereinfachen. Diese Elemente müssen dann von einem internen Team kategorisiert werden, damit sie gefunden werden können, wenn Suchergebnisse nach Kategorien gefiltert werden. Das Ziel dieser Arbeit ist es, das Potenzial eines multimodalen Klassifikators als Alternative zu der manuellen Kategorisierung, die von einem internen Team eines Unternehmens im Second-Hand-Marktplatz-Geschäft betrieben wird, zu evaluieren. Da einige nicht-professionelle Benutzer Gegenstände ohne relevanten Text oder mit Bildern von schlechter Qualität auflisten, wird ein multimodaler Ansatz gewählt, um das System robuster zu machen. Zunächst wird die Leistung des Inhouse-Teams untersucht. Nach der Analyse und Vorverarbeitung der verfügbaren Daten wird ein multimodaler Klassifikator entwickelt und ausgewertet, der die Leistung des internen Teams erreichte. Neben der Entwicklung und Evaluierung eines Klassifikators werden mögliche Einsatzund Überwachungsstrategien diskutiert.
de
Organising products into product categories is an integral part of e-commerce applications. However in user-driven secondhand marketplace applications, where users are not professional sellers, input of a category is kept optional to make the listing process easier. These items must then be categorized by an in-house team so that they can be found when search results are filtered by categories. The goal of this thesis is to investigate the potential of a multimodal classifier as an alternative to the manual categorization done by an in-house team at a company in the secondhand marketplace business. Since some non-professional users tend to list items without descriptive text or with bad quality images, a multimodal approach is chosen to make the system more robust. Initially performance of the in-house team is evaluated. After analyzing and preprocessing the available data, a multimodal classifier is developed and evaluated which reaches the performance of the in-house team. In addition to the development and evaluation of a classifier, possible deployment and monitoring strategies are discussed.