Heil, E. (2011). Wissenserwerb und Data Mining anhand von österreichischen Sozialversicherungsdaten am Beispiel des touristischen Arbeitsmarktes [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/160804
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2011
-
Number of Pages:
166
-
Keywords:
data mining; tourismus; kdd; knowledge discovery in databases; wissenserwerb; sozialversichungsdaten
de
data mining; tourism; kdd; knowledge discovery in databases; social data
en
Abstract:
Durch die rasante technische Entwicklung der letzten Jahre und den Umstand, dass heutzutage fast jede Handlung durch ein elektronisches Gerät erfasst und als Eintrag in einer Datenbank gespeichert wird, gibt es in unserer Zeit eine Vielzahl an elektronischen Informationen über jede Person. Mit der Arbeitsmarktdatenbank (AMDB) des bmask /AMS steht wissenschaftlichen Institutionen in Österreich eine äußerst umfangreiche und detaillierte Datenquelle für Analysen und zur Visualisierung des österreichischen Arbeitsmarktes zur Verfügung. In der AMDB sind die sozialversicherungsrechtlich relevanten Arbeitsmarktpositionen der Österreicherinnen und Österreicher verzeichnet. Dadurch ist es möglich den Verlauf von Arbeitsmarktkarrieren auf Individualebene nachzuvollziehen. Es kann zum Beispiel der Wechsel von Arbeitslosigkeit in Beschäftigung, der Wechsel von einer Branche in die andere oder auch das erzielte Einkommen eines Individuums ausgemacht und analysiert werden.<br />In dieser Arbeit wird der KDD Prozess auf einen Ausschnitt dieser Daten angewandt, um die Beschäftigung im Tourismus zu beleuchten. Schrittweise werden relevante Daten aus der Datenbank selektiert, Datenfehler und Ausreißer bereinigt und die Rohdaten in ein, für Data Mining Algorithmen nutzbares Format aggregiert und transformiert. Als letzer Punkt wird ein K-Means Algorithmus verwendet, um Gruppen in den Neueinsteigern und den Beschäftigten der Tourismusbranche eines Kalenderjahres zu finden.
de
Because of rapid technical development in recent years and the fact that nowadays almost every action is recorded by an electronic device and stored as an entry in a database, there is variety of electronic information available for every person.<br />The job market database (AMDB) of the "Bundesministerium für Arbeit, Soziales und Konsumentenschutz" /"Arbeitsmarktservice", offers scientific institutions in Austria, the most comprehensive and detailed source of data for analysis and visualization of the Austrian labor market. The AMDB stores a continuous classification of the Austrian population in well-defined labor market positions. Therefore it is possible to track the labor market career of each individual. The transition from unemployment to employment, the change from one industry to another, or even an individual's income can be identified, tracked and analyzed.<br />In this paper, the Knowledge Discovery in Databases process is applied on a portion of the AMDB's data, in order to shed light on the employment structure of the tourism sector. Relevant data is selected from the database, data errors are eliminated, outliers are cleaned, and the raw data is aggregated into a data mining usable format. As a final point, a K-means algorithm is used to find groups in the new entrants into the tourism sector. Furthermore the workforce of a year is analyzed.<br />
en
Additional information:
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers Zsfassung in engl. Sprache