Verbesserung durch Big Data und neuronale Netze
Ziel des Projekts war die Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten) sowie die Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA).
ProjektTeam
Prof. Dr. Wolfram Höpken, Tobias Eberle,
Forschungsgruppe Internet of Things (IoT), Institut für Digitalen Wandel (IDW), Amadeus Airport IT
Einführung
- Akkurate Vorhersage touristischer Nachfrage aufgrund hoher Volatilität sehr wichtig für touristische Entscheider
- Suchverhalten im Web (repräsentiert durch Google-Trends-Daten) als interessanter Input zur Verbesserung der Vorhersage
Zielsetzung
- Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten)
- Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA)
Methodik
Datenbeschaffung und -aufbereitung
- Touristische Ankünfte in Schweden von 2008 – 2016 für 5 Sendeländer
- Statistische Aufbereitung der Ankunftsdaten und Herstellung von Stationarität
Konstruktion aggregierter Suchindizes
- Identifikation relevanter Suchbegriffe mittels des Google Keyword Planner
- Extraktion zugehöriger Google-Trends-Daten für die Kategorie Travel and Tourism
- Normalisierung der Suchbegriffe und Konstruktion aggregierter Suchindizes (mit unterschiedlichem Time Lag für unterschiedliche Suchbegriffe)
Vorhersagemodelle für touristische Ankünfte
- ARIMA-Modelle (Autoregressive Integrated Moving Average) (1) autoregressiv d.h. nur mit vergangenen touristischen Ankünften und (2) zusätzlich mit Suchindizes
- Neuronale Netze (MLP = Multilayer Perceptron) (1) autoregressiv und (2) zusätzlich mit Suchindizes
Validierung der Vorhersagemodelle
- Mittelfristiger Vorhersagehorizont von 6 Monaten
- Out-of-Sample-Validierung (83 Monate Trainingsdaten und 6 Monate Testdaten)
Ergebnisse
Monatliche touristische Ankünfte und Suchindex (gestrichelte Linie) für Sendeland Dänemark
Ergebnisse aller vier Vorhersagemodelle und Sendeländer
- Verringerung des Vorhersagefehlers durch Google Trends Daten um fast 50%
- Neuronales Netz liefert bessere Ergebnisse als ARIMA bei Hinzunahme von Google-Trends-Daten
Tatsächliche Ankünfte vs. vorhergesagte Ankünfte (gestrichelte Linie) mit neuronalem Netz und Google-Trends-Daten
Zusammenfassung
- Google-Trends-Daten ermöglichen deutliche Verbesserung der Vorhersage touristischer Ankünfte
- Neuronale Netze liefern genauere Vorhersagen als ARIMA-Modelle bei Verwendung von Google-Trends-Daten als zusätzlicher Input für die Vorhersage
Literatur
- Box, G. E., and G. M. Jenkins. 1970. Time series analysis, forecasting and control. San Francisco: Holden Day.
- Fuchs, M., W. Höpken, and M. Lexhagen. 2014. „Big data analytics for knowledge generation in tourism destinations – A case from Sweden”. Journal of Destination Marketing and Management, 3 (4):198-209.
- Höpken, W., D. Ernesti, M. Fuchs, K. Kronenberg, and M. Lexhagen. 2017b. „Big data as input for predicting tourist arrivals.” In Information and Communication Technologies in Tourism 2017, edited by R. Schegg and B. Stangl, 187-200. New York: Springer.
- Höpken, W., T. Eberle, M. Fuchs, and M. Lexhagen. 2019. „Google trends data for analysing tourists‘ online search behavior and improving demand forecasting: The case of Åre, Sweden. Information Technology & Tourism, 21 (1): 45-62.