Bălăceanu, O. G. (2019). Professional migration analysis through wikidata linked open data [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.56462
E194 - Institut für Information Systems Engineering
-
Date (published):
2019
-
Number of Pages:
104
-
Keywords:
Professional Migration; Data Visualization; Statistical Analysis; Linked Open Data
en
Abstract:
The focus of this research is analyzing the patterns of migration depending on the profession, gender, and country of origin while using the sources offered by Linked Open Data. The aim is to compare 15 different countries from both within and outside Europe in order to understand their distribution according to the distance transcended during migration (short, medium, medium-long, and long-distance), the gender ratios, the level of same-country migration, the spreading and degree internationalization. Time-wise, the interval between 500 BC and present has been analyzed together with the range between 1945 and present, in order to understand if recent technological advancements in traveling and communication have in any way impacted the migration flows. Due to its position as a source to Wikipedia and due to its growing community and documentation support, Wikidata was the Linked Open Data repository of choice as a data source. The processing techniques applied to the analyzed data include typical statistical methods in which specific data is fetched, distributions are calculated, and trends are analyzed through visualization methods in order to find similarities. The fetched data includes data describing the total number of entities, total number per length of migration, total number of cities of birth and death, data on the source and destination locations, data count for each year and individual information in order to populate a "personality" profile. The application developed as a result of this thesis also generates additional visualization means in order to emphasize the impact that maps, graphs, charts, and diagrams have in understanding and extracting valuable insight from raw data. The result of the research has confirmed that there are many similarities in trend between various countries and professions when migrating (e.g., Austria with Italy and Spain, Germany with France), that gender plays an active role when choosing long-distance over short-distance, that the last decades have, against intuition, made notable people more settled, that there is a strong country bias when fetching linked data, and that in all the cases, the number of places of birth is smaller than the number of places of death.
en
Der Schwerpunkt dieser Forschung liegt auf der Analyse der Migrationsmuster in Bezug auf Beruf, Geschlecht und Herkunftsland. Als Datensatz wurden die Linked Open Data angebotenen Quellen verwendet. Ziel ist es, 15 verschiedene Länder, innerhalb und außerhalb Europas, zu vergleichen. Dabei werden migrierte Entfernungen (kurze, mittlere und lange Entfernungen), Geschlechterverhältnisse, Tendenzen in das selbe Land zu migrieren sowie die Verbreitung und Internationalisierung als Kriterien genauer betrachtet. Der Zeitraum zwischen 500 v. Chr. und der Gegenwart wird gemeinsam mit dem Zeitraum zwischen 1945 und der Gegenwart analysiert, mit dem Ziel um zu ob die technologischen Fortschritte der Mobilität sowie der Kommunikation die Migrationsströme beeinflusst haben. Ich habe Wikidata als Datenquelle verwendet, das es auch Quelle für Wikipedia ist und über eine sehr hilfreiche Dokumentation und Unterstützung über Mitglieder verfügt. Als Analysetechnik wurden gängige statistische Verfahren angewandt, bei denen bestimmte Daten gezielt abgerufen werden um Tendenzen durch Visualisierungsmethoden darzustellen und Ähnlichkeiten hervorzuheben. Die herangezogenen Daten umfassen die Gesamtzahlen der Entitäten, Migrationsdauern, Geburts-/ und Todes-Orte, Quell-/ und Ziel-Orte, Häufigkeiten pro Jahr sowie individuelle Informationen die eine Erstellung eines “Personalität” ermöglichen. Die als Ergebnis dieser Arbeit entwickelte Anwendung generiert auch zusätzliche Visualisierungsmittel, um den Einfluss von Diagrammen auf das Verständnis und die Gewinnung wertvoller Erkenntnisse aus Rohdaten hervorzuheben. Das Ergebnis der Forschung hat bestätigt, dass es viele Ähnlichkeiten im Trend zwischen verschiedenen Ländern und Berufstätigkeiten bei der Migration gibt (z. B. Österreich zeigt Ähnlichkeiten zu Italien und Spanien, Deutschland zu Frankreich). Auch das Geschlecht weist eine starken Einfluss bei der Wahl einer großen Entfernung gegenüber der kleinen Entfernung auf. Eine überraschende Erkenntnis ist, dass die Menschen in den letzten Jahrzehnten deutlich sesshafter geworden sind. Weiters ist zu erkennen, dass es eine starke länderspezifische Tendenz besteht und dass in allen Fällen die Anzahl der Geburtsorte im Vergleich zur Anzahle der Todesart zurückgegangen ist.