Big Data Analyse für die Bodenseeregion am Beispiel der Social Media Plattform Flickr.
ProjektDurchführung
Zehui Wang
Forschungsgruppe Data Science, Institut für Digitalen Wandel (IDW)
Einführung
- Bodenseeregion mit einer Vielzahl beliebter touristische Ziele und hohen Besucherzahlen
- Attraktivität touristischer Ziele und typische Bewegungs- muster als wertvoller Input für die Tourismus- und Gast- gewerbebranche der Region
Zielsetzung
- Extraktion touristisch relevanter Foto-Uploads für die Bodenseeregion von der Social Media Plattform Flickr
- Bestimmung beliebter Ausflugsziele und Attraktionen der Bodenseeregion
- Erkennung typischer Bewegungsmuster und Reiserouten
Methodik
Datenbeschaffung
Datenbereinigung
- Entfernen von Fotos mit ungültiger Aufnahmezeit
- Filtern touristischer Aktivitäten
Fotos wurden aufgenommen
1. Überwiegend während des Wochenendes
2. In einem gewissen geographischen Abstand
3. In einen Zeitraum von nicht mehr als 30 Tagen (pro Kalender Jahr)
Clusteranalyse
- Geographische Gruppierung der Fotos zu Points of Interests (POIs):
Clusteranalyse mit DBSCAN-Algorithmus
1. Entfernen von Ausreißern
2. Filtern populärer Cluster
3. Optimierung des Verfahrens zur Erhöhung der Anzahl populärer Cluster
Assoziationsanalyse
- Assoziationsregeln
Konstanz --> Lindau
Wenn ein Besucher Konstanz besucht, besucht er mit hoher Wahrscheinlichkeit auch Lindau - Verfahren
FG-Growth-Algorithmus - Umsetzung
Python-Package: MLXTEND
Ergebnis
Clustering
10.451 Foto-Uploads von 2018 - 2020, 48 Cluster durch DBSCAN gebildet, 27 POIs erkannt (populäre Cluster)
Assoziationsanalyse
Glaubwürdigkeit der Assoziationsregeln zwischen POIs
Zusammenfassung
- Beliebte Ziele von Touristen (POIs) in der Bodenseeregion konnten auf Basis von Foto-Uploads der Social Media Plattform Flickr identifiziert werden
- Interessante Bewegungsmuster von Touristen konnten erkannt werden
- Big Data wertvoller Input für Echtzeitanalysen
Literatur
- Höpken, W., Müller, M., Fuchs, M., Lexhagen, M. (2020): Flickr data for analysing tourists’ spatial behaviour and movement patterns: A comparison of clustering techniques. Journal of Hospitality and Tourism Technology, 11(1), pp. 69-82. https://doi.org/10.1108/JHTT-08-2017-0059.
- Höpken, W., Fuchs, M., Menner, Th., Lexhagen, M. (2017): Sensing the Online Social Sphere - the Sentiment Analytical Approach. In: Xiang, Z., Fesenmaier, D. R. (eds.) Analytics in Smart Tourism Design, Springer, pp. 129-146.
- Vu, Q., Li, G., Law, R., Zhang, Y. (2017): Travel diaries analysis by sequential rule mining. Journal of Travel Research, DOI: 10.1177/0047287517692446.
- Zheng, Y.-T., Zha, Z.-J., Chua, T.-S. (2012): Mining travel patterns from geotagged photos. ACM Transactions on Intelligent Systems and Technology, Vol. 3 No. 3, pp. 1-18.
- Yin, Z., Cao, L., Han, J., Luo, J., Huang, Th. (2011): Diversified trajectory