Direkt zum Inhalt

Schätzung touristischer Nachfrage

Dieses Projekt ging der Frage nach, ob sich die Anzahl touristischer Ankünfte auf Basis des Volumens von Kundenfeedback in sozialen Medien schätzen lässt.

Projektdurchführung

Nadine Liedtke
Forschungsgruppe Forschungsgruppe Data Science, Institut für Digitalen Wandel (IDW)

Einführung

  • Statistiken zur touristischen Nachfrage stehen i.d.R. erst mit größer zeitlicher Verzögerung zur Verfügung
  • Kundenfeedback im Internet stellt eine alternative Möglichkeit dar, das Reiseaufkommen abzuschätzen
  • Mittels Data Mining können Erkenntnisse gewonnen werden, welche sich auf die Planung vorteilhaft auswirken

Zielsetzung 

  • Schätzung der Anzahl (vergangener) touristischer Ankünfte auf Basis des Volumens von Kundenfeedback in sozialen Medien

  • Bewertung, ob Schätzungsverfahren mittels Kundenrezessionen einen Mehrwert gegenüber klassischen Prognoseverfahren aufweisen

     

Methodik

Datenextraktion & Aufbereitung:

  • Extraktion und Abspeicherung der relevanten Kundenbewertungen mittels Web-Crawling und RPA
  • Text-Preprocessing: Beseitigung von Fehlwerten, Zusammenführen von Datensätzen, Anpassung von Datentypen, etc.
  • Aufbereitung von Datensätzen für „normale“ und „Krisen“-Zeiten
    • Zeitraum von 2010 bis 2017
    • Zeitraum von 2010 bis 2020

Komponentenmodell:

  • Zerlegung der Zeitreihen (touristische Ankünfte und Kundenbewertungen über obige Zeiträume) in Trend-, Saison- und Restkomponente

Lineare Regression:

  • Analyse der Korrelation zwischen touristischen Ankünften und Kundenbewertungen
  • Schätzung der touristischen Ankünfte auf Basis von Kundenbewertungen mittels linearer Regression

Validierung der Ergebnisse:

  • Gegenüberstellung der Ergebnisse mit alternativen Verfahren (Lineare Trend- und Saisonvorhersage als Basisverfahren)
  • Ermittlung des Mehrwerts einer Schätzung touristischer Ankünfte anhand von Kundenbewertungen

Ergebnis


Anwendungsfall-1

 


Anwendungsfall-2

Correlation: Korrelation zwischen Ankünften und touristischem Feedback
Squared Correlation: Güte des Modells zur Schätzung der Ankünfte auf Basis des Feedbacks
RMSE: Fehlermaß der Abschätzung der Ankünfte auf Basis des Feedbacks

 

Schätzung


Schätzung: Schätzung der Kundenankünfte durch Miteinbindung des Kundenfeedbacks
Prognose: Prognose der Ankünfte über Trend- und Saisonkomponente

 

  • Das Modell bietet in normalen Zeiten keine Verbesserung gegenüber klassischen Prognoseverfahren – die Restkomponente ist wertlos und Ankünfte können vollständig aus Trend und Saison abgeleitet werden
  • In Krisenzeiten bietet das Modell jedoch eine Verbesserung gegenüber klassischer Prognoseverfahren und kann Besucherzahlen rund 27 % genauer prognostizieren

 

Zusammenfassung

  • Schätzung auf Basis von Kundenfeed-back führt in „normalen Zeiten“ zu keinem Mehrwert, da Ankünfte besser aus Trend- und Saisondaten erklärt werden können
  • In Krisensituationen allerdings können Ankünfte zeitnah abgeschätzt werden und dies wesentlich besser als klassische Prognoseansätze.

 

Downloads