Direkt zum Inhalt

Vorhersage touristischer Ankünfte

Verbesserung durch Big Data und neuronale Netze

Ziel des Projekts war die Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten) sowie die Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA).

ProjektTeam

Prof. Dr. Wolfram Höpken, Tobias Eberle,

Forschungsgruppe Internet of Things (IoT), Institut für Digitalen Wandel (IDW), Amadeus Airport IT

Einführung

  • Akkurate Vorhersage touristischer Nachfrage aufgrund hoher Volatilität sehr wichtig für touristische Entscheider
  • Suchverhalten im Web (repräsentiert durch Google-Trends-Daten) als interessanter Input zur Verbesserung der Vorhersage

Zielsetzung 

  • Erweiterung autoregressiver Vorhersagemodelle (allein auf Basis vergangener Ankünfte) um Suchverhalten im Web (Google-Trends-Daten)
  • Verwendung neuronaler Netze (als Verfahren des maschinellen Lernens) anstelle klassischer Zeitreihenmodelle (ARIMA)

Methodik

Datenbeschaffung und -aufbereitung

  • Touristische Ankünfte in Schweden von 2008 – 2016 für 5 Sendeländer
  • Statistische Aufbereitung der Ankunftsdaten und Herstellung von Stationarität

Konstruktion aggregierter Suchindizes

  • Identifikation relevanter Suchbegriffe mittels des Google Keyword Planner
  • Extraktion zugehöriger Google-Trends-Daten für die Kategorie Travel and Tourism
  • Normalisierung der Suchbegriffe und Konstruktion aggregierter Suchindizes (mit unterschiedlichem Time Lag für unterschiedliche Suchbegriffe)

Vorhersagemodelle für touristische Ankünfte

  • ARIMA-Modelle (Autoregressive Integrated Moving Average) (1) autoregressiv d.h. nur mit vergangenen touristischen Ankünften und (2) zusätzlich mit Suchindizes
  • Neuronale Netze (MLP = Multilayer Perceptron) (1) autoregressiv und (2) zusätzlich mit Suchindizes

Validierung der Vorhersagemodelle

  • Mittelfristiger Vorhersagehorizont von 6 Monaten
  • Out-of-Sample-Validierung (83 Monate Trainingsdaten und 6 Monate Testdaten)

Ergebnisse

Monatliche touristische Ankünfte und Suchindex (gestrichelte Linie) für Sendeland Dänemark

Grafik 1 Monatliche touristische Ankünfte

 

Ergebnisse aller vier Vorhersagemodelle und Sendeländer
 

Tabelle Vorhersagemodelle
RMSE = Root Mean Squared Error (Vorhersagefehler), Shapiro-Wilk = Test auf Normalverteilung der Residuen

 

  • Verringerung des Vorhersagefehlers durch Google Trends Daten um fast 50%
  • Neuronales Netz liefert bessere Ergebnisse als ARIMA bei Hinzunahme von Google-Trends-Daten
     

Tatsächliche Ankünfte vs. vorhergesagte Ankünfte (gestrichelte Linie) mit neuronalem Netz und Google-Trends-Daten

Grafik 2 Tatsächliche Ankünfte vs. vorhergesagte Ankünfte (gestrichelte Linie) mit neuronalem Netz und Google-Trends-Daten

 

Zusammenfassung

  • Google-Trends-Daten ermöglichen deutliche Verbesserung der Vorhersage touristischer Ankünfte
  • Neuronale Netze liefern genauere Vorhersagen als ARIMA-Modelle bei Verwendung von Google-Trends-Daten als zusätzlicher Input für die Vorhersage

 

Literatur

  1. Box, G. E., and G. M. Jenkins. 1970. Time series analysis, forecasting and control. San Francisco: Holden Day.
  2. Fuchs, M., W. Höpken, and M. Lexhagen. 2014. „Big data analytics for knowledge generation in tourism destinations – A case from Sweden”. Journal of Destination Marketing and Management, 3 (4):198-209.
  3. Höpken, W., D. Ernesti, M. Fuchs, K. Kronenberg, and M. Lexhagen. 2017b. „Big data as input for predicting tourist arrivals.” In Information and Communication Technologies in Tourism 2017, edited by R. Schegg and B. Stangl, 187-200. New York: Springer.
  4. Höpken, W., T. Eberle, M. Fuchs, and M. Lexhagen. 2019. „Google trends data for analysing tourists‘ online search behavior and improving demand forecasting: The case of Åre, Sweden. Information Technology & Tourism, 21 (1): 45-62.