Dieses Projekt ging der Frage nach, ob sich die Anzahl touristischer Ankünfte auf Basis des Volumens von Kundenfeedback in sozialen Medien schätzen lässt.
Projektdurchführung
Nadine Liedtke
Forschungsgruppe Forschungsgruppe Data Science, Institut für Digitalen Wandel (IDW)
Einführung
- Statistiken zur touristischen Nachfrage stehen i.d.R. erst mit größer zeitlicher Verzögerung zur Verfügung
- Kundenfeedback im Internet stellt eine alternative Möglichkeit dar, das Reiseaufkommen abzuschätzen
- Mittels Data Mining können Erkenntnisse gewonnen werden, welche sich auf die Planung vorteilhaft auswirken
Zielsetzung
-
Schätzung der Anzahl (vergangener) touristischer Ankünfte auf Basis des Volumens von Kundenfeedback in sozialen Medien
-
Bewertung, ob Schätzungsverfahren mittels Kundenrezessionen einen Mehrwert gegenüber klassischen Prognoseverfahren aufweisen
Methodik
Datenextraktion & Aufbereitung:
- Extraktion und Abspeicherung der relevanten Kundenbewertungen mittels Web-Crawling und RPA
- Text-Preprocessing: Beseitigung von Fehlwerten, Zusammenführen von Datensätzen, Anpassung von Datentypen, etc.
- Aufbereitung von Datensätzen für „normale“ und „Krisen“-Zeiten
- Zeitraum von 2010 bis 2017
- Zeitraum von 2010 bis 2020
Komponentenmodell:
- Zerlegung der Zeitreihen (touristische Ankünfte und Kundenbewertungen über obige Zeiträume) in Trend-, Saison- und Restkomponente
Lineare Regression:
- Analyse der Korrelation zwischen touristischen Ankünften und Kundenbewertungen
- Schätzung der touristischen Ankünfte auf Basis von Kundenbewertungen mittels linearer Regression
Validierung der Ergebnisse:
- Gegenüberstellung der Ergebnisse mit alternativen Verfahren (Lineare Trend- und Saisonvorhersage als Basisverfahren)
- Ermittlung des Mehrwerts einer Schätzung touristischer Ankünfte anhand von Kundenbewertungen
Ergebnis
Correlation: Korrelation zwischen Ankünften und touristischem Feedback
Squared Correlation: Güte des Modells zur Schätzung der Ankünfte auf Basis des Feedbacks
RMSE: Fehlermaß der Abschätzung der Ankünfte auf Basis des Feedbacks
Schätzung: Schätzung der Kundenankünfte durch Miteinbindung des Kundenfeedbacks
Prognose: Prognose der Ankünfte über Trend- und Saisonkomponente
- Das Modell bietet in normalen Zeiten keine Verbesserung gegenüber klassischen Prognoseverfahren – die Restkomponente ist wertlos und Ankünfte können vollständig aus Trend und Saison abgeleitet werden
- In Krisenzeiten bietet das Modell jedoch eine Verbesserung gegenüber klassischer Prognoseverfahren und kann Besucherzahlen rund 27 % genauer prognostizieren
Zusammenfassung
- Schätzung auf Basis von Kundenfeed-back führt in „normalen Zeiten“ zu keinem Mehrwert, da Ankünfte besser aus Trend- und Saisondaten erklärt werden können
- In Krisensituationen allerdings können Ankünfte zeitnah abgeschätzt werden und dies wesentlich besser als klassische Prognoseansätze.