Vorhersage touristischer Ankünfte

Verbesserung durch Big Data und neuronale Netze

Ziel des Projekts war die Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten) sowie die Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA).

ProjektTeam

Prof. Dr. Wolfram Höpken, Tobias Eberle,

Forschungsgruppe Internet of Things (IoT), Institut für Digitalen Wandel (IDW), Amadeus Airport IT

Einführung

Akkurate Vorhersage touristischer Nachfrage aufgrund hoher Volatilität sehr wichtig für touristische Entscheider
Suchverhalten im Web (repräsentiert durch Google-Trends-Daten) als interessanter Input zur Verbesserung der Vorhersage

Zielsetzung

Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten)
Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA)

Methodik

Datenbeschaffung und -aufbereitung

Touristische Ankünfte in Schweden von 2008 – 2016 für 5 Sendeländer
Statistische Aufbereitung der Ankunftsdaten und Herstellung von Stationarität

Konstruktion aggregierter Suchindizes

Identifikation relevanter Suchbegriffe mittels des Google Keyword Planner
Extraktion zugehöriger Google-Trends-Daten für die Kategorie Travel and Tourism
Normalisierung der Suchbegriffe und Konstruktion aggregierter Suchindizes (mit unterschiedlichem Time Lag für unterschiedliche Suchbegriffe)

Vorhersagemodelle für touristische Ankünfte

ARIMA-Modelle (Autoregressive Integrated Moving Average) (1) autoregressiv d.h. nur mit vergangenen touristischen Ankünften und (2) zusätzlich mit Suchindizes
Neuronale Netze (MLP = Multilayer Perceptron) (1) autoregressiv und (2) zusätzlich mit Suchindizes

Validierung der Vorhersagemodelle

Mittelfristiger Vorhersagehorizont von 6 Monaten
Out-of-Sample-Validierung (83 Monate Trainingsdaten und 6 Monate Testdaten)

Ergebnisse

Monatliche touristische Ankünfte und Suchindex (gestrichelte Linie) für Sendeland Dänemark

Grafik 1 Monatliche touristische Ankünfte

Ergebnisse aller vier Vorhersagemodelle und Sendeländer

Tabelle Vorhersagemodelle — *RMSE = Root Mean Squared Error (Vorhersagefehler), Shapiro-Wilk = Test auf Normalverteilung der Residuen*

Verringerung des Vorhersagefehlers durch Google Trends Daten um fast 50%
Neuronales Netz liefert bessere Ergebnisse als ARIMA bei Hinzunahme von Google-Trends-Daten

Tatsächliche Ankünfte vs. vorhergesagte Ankünfte (gestrichelte Linie) mit neuronalem Netz und Google-Trends-Daten

Grafik 2 Tatsächliche Ankünfte vs. vorhergesagte Ankünfte (gestrichelte Linie) mit neuronalem Netz und Google-Trends-Daten

Zusammenfassung

Google-Trends-Daten ermöglichen deutliche Verbesserung der Vorhersage touristischer Ankünfte
Neuronale Netze liefern genauere Vorhersagen als ARIMA-Modelle bei Verwendung von Google-Trends-Daten als zusätzlicher Input für die Vorhersage

Literatur

Box, G. E., and G. M. Jenkins. 1970. Time series analysis, forecasting and control. San Francisco: Holden Day.
Fuchs, M., W. Höpken, and M. Lexhagen. 2014. „Big data analytics for knowledge generation in tourism destinations – A case from Sweden”. Journal of Destination Marketing and Management, 3 (4):198-209.
Höpken, W., D. Ernesti, M. Fuchs, K. Kronenberg, and M. Lexhagen. 2017b. „Big data as input for predicting tourist arrivals.” In Information and Communication Technologies in Tourism 2017, edited by R. Schegg and B. Stangl, 187-200. New York: Springer.
Höpken, W., T. Eberle, M. Fuchs, and M. Lexhagen. 2019. „Google trends data for analysing tourists‘ online search behavior and improving demand forecasting: The case of Åre, Sweden. Information Technology & Tourism, 21 (1): 45-62.

Downloads

Showcase-Forecast.pdf (PDF, 254.2 KB)
Paper-Improving tourist arrival prediction.pdf (PDF, 688.3 KB)