Brendler, S. (2017). Visual detection of anti-adblocking software [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2017.39548
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2017
-
Number of Pages:
71
-
Keywords:
privacy; security; adblocking; anti-adblocking
en
Abstract:
Adblocker erfreuen sich zunehmender Beliebtheit, weswegen Webseitenbetreiber begonnen haben, mit Anti-Adblockern Adblock-Benutzern den Zugang zu ihren Webseiten zu versperren. Daraus ist ein Wettrüsten entstanden, welches nicht klar entschieden ist. In dieser Arbeit werden die technischen Möglichkeiten, welche beiden Seiten zur Verfügung stehen, analysiert. In einer Fallstudie werden die Anti-Adblock Implementierungen von drei bekannten Webseiten und Gegenreaktionen der Adblock-Community untersucht. Des Weiteren wurde ein Webcrawler zur automatischen Erkennung von Webseiten, die Anti-Adblocker einsetzen implementiert. Die Erkennung basiert auf visuellen Merkmalen von Screenshots und verwendet diese um mit Algorithmen für machinelles Lernen Modelle zu generieren. Mit diesen Modellen wird ein zufällig gewählter Datensatz von 300 Webseiten aus der Alexa Topliste analysiert.
de
The number of adblock users has been on the rise throughout the last years, with the consequence that publishers have started using anti-adblocking software to deny adblock users access to their websites. This has lead to an ongoing arms race between the advertising industry and adblock users from which no winner has emerged. In this thesis the technical possibilities, which both sides have at their disposal, are analyzed. In a case study the implementations of anti-adblocking scripts and the adblocking community’s reactions and countermeasures are compared. Furthermore a webcrawler for automatically detecting websites, which use anti-adblocking scripts was implemented. The detection is based on visual features of screenshots and uses them with machine learning algorithms to generate models. With those models, a random sample of 300 websites from the Alexa top 1 million websites is analyzed.