<div class="csl-bib-body">
<div class="csl-entry">Gabriel, M. (2020). <i>Distributed factorization machines for next-track music recommendation</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2020.66381</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2020.66381
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/1118
-
dc.description.abstract
Die automatische Empfehlung von passenden nächsten Musikstücken für Playlists oder Nutzer ist ein wichtiges Problem in Musikstreaming-Plattformen. Für dieses Problem wurden bereits verschiedene Ansätze präsentiert, unter ihnen der Ansatz der Matrixfaktorisierung welcher ein Modell trainiert, das Musikstücke von ähnlichen Playlists oder Nutzern empfiehlt. Eine bekannte Generalisierung von Matrixfaktorisierung sind Faktorisierungsmaschinen. Diese erlauben die Aufnahme beliebiger Features in das Modell und wurden noch nicht im Detail für die Empfehlung passender Musikstücke evaluiert. Eine im Rahmen dieser Arbeit durchgeführte Evaluierung zeigt, dass durch die Nutzung von Faktorisierungsmaschinen und die Einbindung von Features wie Nutzerdemographie, Album, Künstler, Jahr des Musikstücks und vorheriges Musikstück eine Verbesserung der Empfehlungen erreicht werden kann. Da in realen Anwendungen Features von Millionen an Playlists, Nutzern und Musikstücken in das Modell eingebunden werden müssen und das Modell so eine beachtliche Größe erreichen kann, wird weiters eine Methode für ein verteiltes Training von solchen Modellen präsentiert. Durch eine bedeutende Reduktion des Netzwerkverkehrs wird ein effizientes verteiltes Training von über mehrere Maschinen verteilten großen Modellen möglich. Die präsentierte Methode wurde in Apache Spark implementiert und ebenfalls evaluiert.
de
dc.description.abstract
Recommending the next tracks for a playlist or a users listening history is an important problem in music streaming platforms. Various approaches have been presented for this problem. Among them is matrix factorization which trains a model to recommend tracks of similar playlists or users. A common generalization of matrix factorization are factorization machines. They allow incorporating arbitrary features into the model and have not yet been evaluated in detail for next-track music recommendation. An evaluation carried out as part of this thesis shows that recommendations can be improved through the incorporation of features like, among others, user demographics, album, artist, the track year and the previous track. Since real-world systems have to handle millions of playlists, users and tracks and the factorization model can reach a remarkable size, a distributed training method is presented. This method allows the network-efficient distributed training of large factorization machine models which are themselves distributed over multiple machines. The method was implemented on top of Apache Spark and also evaluated.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Machine Learning
en
dc.subject
Distributed Machine Learning
en
dc.subject
Recommender Systems
en
dc.subject
Next-Track Music Recommendation
en
dc.subject
Playlist Continuation
en
dc.subject
Factorization Machines
en
dc.subject
Maschinelles Lernen
de
dc.subject
Skalierbares Maschinelles Lernen
de
dc.subject
Empfehlungsdienste
de
dc.subject
Automatische Musikempfehlung
de
dc.subject
Faktorisierungsmaschinen
de
dc.title
Distributed factorization machines for next-track music recommendation
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2020.66381
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Markus Gabriel
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E194 - Institut für Information Systems Engineering
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC15655450
-
dc.description.numberOfPages
102
-
dc.identifier.urn
urn:nbn:at:at-ubtuw:1-138327
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
tuw.advisor.orcid
0000-0003-3906-1292
-
item.languageiso639-1
en
-
item.openairetype
master thesis
-
item.grantfulltext
open
-
item.fulltext
with Fulltext
-
item.cerifentitytype
Publications
-
item.mimetype
application/pdf
-
item.openairecristype
http://purl.org/coar/resource_type/c_bdcc
-
item.openaccessfulltext
Open Access
-
crisitem.author.dept
E194 - Institut für Information Systems Engineering