Big Data Analyse für die Bodenseeregion am Beispiel der Social Media Plattform Flickr.
ProjektDurchführung
Zehui Wang
Forschungsgruppe Data Science, Institut für Digitalen Wandel (IDW)
Einführung
Bodenseeregion mit einer Vielzahl beliebter touristische Ziele und hohen Besucherzahlen
Attraktivität touristischer Ziele und typische Bewegungs- muster als wertvoller Input für die Tourismus- und Gast- gewerbebranche der Region
Zielsetzung
Extraktion touristisch relevanter Foto-Uploads für die Bodenseeregion von der Social Media Plattform Flickr
Bestimmung beliebter Ausflugsziele und Attraktionen der Bodenseeregion
Erkennung typischer Bewegungsmuster und Reiserouten
Methodik
Datenbeschaffung
Datenbereinigung
Entfernen von Fotos mit ungültiger Aufnahmezeit
Filtern touristischer Aktivitäten
Fotos wurden aufgenommen
1. Überwiegend während des Wochenendes
2. In einem gewissen geographischen Abstand
3. In einen Zeitraum von nicht mehr als 30 Tagen (pro Kalender Jahr)
Clusteranalyse
Geographische Gruppierung der Fotos zu Points of Interests (POIs):
Clusteranalyse mit DBSCAN-Algorithmus
1. Entfernen von Ausreißern
2. Filtern populärer Cluster
3. Optimierung des Verfahrens zur Erhöhung der Anzahl populärer Cluster
Assoziationsanalyse
Assoziationsregeln
Konstanz --> Lindau
Wenn ein Besucher Konstanz besucht, besucht er mit hoher Wahrscheinlichkeit auch Lindau
Verfahren
FG-Growth-Algorithmus
Umsetzung
Python-Package: MLXTEND
Ergebnis
Clustering
10.451 Foto-Uploads von 2018 - 2020, 48 Cluster durch DBSCAN gebildet, 27 POIs erkannt (populäre Cluster)
Abb.1: Populäre Cluster / POIs in der Bodenseeregion
Assoziationsanalyse
Abb.2: Assoziationsregeln zwischen POIs
Glaubwürdigkeit der Assoziationsregeln zwischen POIs
Tab.1: Glaubwürdigkeit der Assoziationsregeln zwischen POIs
Zusammenfassung
Beliebte Ziele von Touristen (POIs) in der Bodenseeregion konnten auf Basis von Foto-Uploads der Social Media Plattform Flickr identifiziert werden
Interessante Bewegungsmuster von Touristen konnten erkannt werden
Big Data wertvoller Input für Echtzeitanalysen
Literatur
Höpken, W., Müller, M., Fuchs, M., Lexhagen, M. (2020): Flickr data for analysing tourists’ spatial behaviour and movement patterns: A comparison of clustering techniques. Journal of Hospitality and Tourism Technology, 11(1), pp. 69-82. https://doi.org/10.1108/JHTT-08-2017-0059.
Höpken, W., Fuchs, M., Menner, Th., Lexhagen, M. (2017): Sensing the Online Social Sphere - the Sentiment Analytical Approach. In: Xiang, Z., Fesenmaier, D. R. (eds.) Analytics in Smart Tourism Design, Springer, pp. 129-146.
Vu, Q., Li, G., Law, R., Zhang, Y. (2017): Travel diaries analysis by sequential rule mining. Journal of Travel Research, DOI: 10.1177/0047287517692446.
Zheng, Y.-T., Zha, Z.-J., Chua, T.-S. (2012): Mining travel patterns from geotagged photos. ACM Transactions on Intelligent Systems and Technology, Vol. 3 No. 3, pp. 1-18.