Cserpes, B. (2018). Applicability of social media analysis for spatial planning [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.55245
Migration; GIS; Social Media Analyse; Bildung; Visualisierung; Web-Mapping; Datenaufbereitung; Datenvisualisierung
de
Migration; GIS; Social media analysis; Education; Visualisation; Web-based cartography; Data preparation; Data Visualisation
en
Abstract:
Die fortschreitende technologische Entwicklung übt einen starken Einfluss auf die Wahrnehmung und Planung von Städten aus. Einen ausschlaggebenden Faktor bildet die reichliche Verfügbarkeit von Daten. Die Menge an Informationen, die jeden Tag generiert werden, wächst exponentiell und beinhaltet zahlreiche Aspekte des Alltags. Für viele ForscherInnen stellt das Phänomen Big Data eine potenzielle Bereicherung für die Wissenschaft dar. Durch die Anwendung neuer Technologien können potenziell auch PlanerInnen tiefe und genaue Einblicke in das komplexe System der Städte erhalten. Allerdings stellen solche Technologien auch einen starken Eingriff in die Privatsphäre der Menschen dar. Viele KritikerInnen deuten auf missbräuchliche Verwendungsmöglichkeiten solcher Daten hin. Außerdem kann die Überschätzung der Potenziale von Big Data zur Ziehung von falschen Schlussfolgerungen führen. Die Potenziale sind trotzdem vielversprechend, daher lohnt es sich, neue Datenquellen zu untersuchen. Eine solche neue Quelle stellen Social-Media-Portale dar, die von Millionen von Menschen weltweit genutzt werden. Die NutzerInnen solcher Seiten generieren Daten, die für die Raumplanung eine bedeutende Bereicherung darstellen können. Social Media Geographic Information (SMGI) beinhaltet nicht nur Informationen darüber, wo sich Menschen wann aufhalten, sondern gewährt auch Einblicke in Diskussionen und subjektiven Wahrnehmungen von bestimmten Phänomenen. Dadurch kann sie helfen, die Dynamiken des komplexen Systems der Städte zu verstehen. Allerdings ist die Verarbeitung von SMGI aufgrund ihrer fehlenden Strukturiertheit, ihrem Mangel an Reliabilität und Validität, sowie der daraus resultierenden Anfälligkeit für Fehler, erschwert. Jedoch stehen wertvolle Potenziale demgegenüber, die aus der räumlichen, zeitlichen und thematischen Flexibilität dieser Daten stammen. Ein wichtiges Ziel der vorliegenden Arbeit ist, die Methoden zur Aufbereitung von Big Data darzustellen. Insbesondere wird auf Natural Language Processing (NLP) eingegangen, mit Schwerpunkt auf Topic Modelling (zur Erkennung der Inhalte der Texte) und Sentiment Analysis (zur Erkennung des subjektiven Empfindens). Das Hauptaugenmerk dieser Arbeit liegt bei der Definition und Bewertung der konkreten Potenziale von Social-Media-Analysis für RaumplanerInnen. Das Projekt beschäftigt sich mit der Frage, wie man derartige Informationen in der Raumplanung in einer sinnvollen, anwendungsorientierten und ethisch korrekten Weise nutzen kann. Dazu wurden im Rahmen einer Fallstudie zwischen Mai und Oktober 2018 über die Streaming API von Twitter 8,3 Millionen Tweets erfasst. Diese wurden im Anschluss mithilfe der oben angeführten NLP-Methoden auf ihren Inhalt, sowie mithilfe von GIS auf ihrer räumlichen Verteilung analysiert. Dabei stand die Qualität und Nützlichkeit für die Raumplanung im Vordergrund. Trotz der beträchtlichen Größe des Datensatzes, war die Menge an wertvoller Information sehr niedrig. Die Tweets konnten in einigen Fällen der Realität korrekt widerspiegelten, beispielsweise ist eine Anhäufung von Nachrichten in der Nähe zu Schulen und Universitäten zu erkennen, die sich mit dem Thema Bildung beschäftigten. Allerdings standen andere (für Raumplanung relevante) Indikatoren nicht mit validierten statistischen Daten im Einklang. Aus diesem Grund schätzt die vorliegende Arbeit die Nützlichkeit von Twitter-Daten in der Raumplanung als niedrig ein. Obwohl die Daten ein großes Themenspektrum abdecken und eine hohe Flexibilität aufweisen, sind sie in der Regel nicht valide. Des Weiteren kann die Überbewertung von Big Data auch zu einem Wiederaufkommen des „Gott-Vater-Modells“ von Planung führen. Daher ist es bedeutend, als PlanerIn sich mit dem Phänomen Big Data kritisch auseinanderzusetzen, um die Gefahren und Potenziale realistisch abwägen zu können.
de
The ongoing technological advancement has a huge effect on the ways how we view and plan our cities. A key factor in these developments is the abundant availability of data. The amount of information we generate every day grows exponentially and covers more and more aspects of our lives. Various researchers agree that Big Data has the potential to become a rich and fruitful asset for spatial planning. Planners might become able to monitor multiple aspects of our cities in real-time, making it possible to set measures or interventions immediately. On the other hand, these developments also propose a threat to privacy of peoples lives. Risks of misusing the recorded data have been addressed my many critical thinkers. Besides, even when having good intentions, the excitement surrounding Big Data may easily lead to drawing false conclusions. Still, new technologies and Big Data have some enormous potentials which can help us to secure and enhance many aspects of quality of life in our cities. A novel data source are social media sites, used by millions of people worldwide. Users of these portals also generate data having the potential of becoming highly valuable for spatial planning. Social Media Geographic Information (SMGI) contains not only information about the location of people at certain times, but enables to localise discussions and sentiments of people towards specific topics. Therefore it might help us to understand the dynamics of cities and unveil some knowledge we had no access to before. By its nature SMGI also often conveys many challenging characteristics of Big Data. It is vaguely structured, very diverging in quality, and cannot be assessed by traditional methods. Furthermore it is heavily biased, lacks validity, and representativeness. Still, when applying the correct pre-processing and analysis steps, its spatial and temporal flexibility, together with the broad range of its content promise to become a highly valuable source of information for spatial planning. A main aim of the project was to show how data processing works and to present Natural Language Processing methods currently mostly unknown in the domain of spatial planning, such as topic modelling and sentiment analysis. The masters thesis tries to define and assess the concrete value of social media analysis for urban planners. It deals with the questions of how to make use of such data in a clear, correct, ethical and useful way. To answer these questions, a case study was conducted by recording all tweets from May to October 2018 in London through Twitters Streaming API. The 8.3 million captured tweets were analysed on their spatial and temporal distribution, their content and their sentiment measures, and the combinations of these factors. Then, the results were assessed on their quality and the usefulness for spatial planning. In conclusion, the amount of valuable, valid and useful information that could be extracted from these 8 million tweets was very little. In many cases, Twitter data did reflect real world phenomena, for example by showing that there is a higher activity of tweets dealing with the topic education around schools and universities. Still, topics and themes being potentially more useful for spatial planning, such as crime, social controversies or users sentiment scores, didnt reflect real-world indicators. For this reason the following assesses work the value of Twitter data for spatial planning to be relatively low. Although the downloaded data displays an enormous flexibility regarding space, time and content, it is generally not reliable enough. Furthermore leads the overassessment of new technologies to the reappearance of the God-Father-Model of planning. Therefore it becomes crucial for planners to evaluate the qualities, dangers, and potentials of Big Data critically.