[vc_row][vc_column][vc_column_text]C.M. Talleyrand schrieb „Man muß die Zukunft im Sinn haben und die Vergangenheit in den Akten.“ – besser kann man Data Analytics nicht beschreiben. Erforschen Sie mit uns gemeinsam, welcher Mehrwert in Ihren Daten steckt!

case study

Erkennen von steuerungsrelevanten Informationen aus unbekannten Domänen – New Yorker Taxi Business

  • Würde man in New York ein Taxiunternehmen gründen, wo und wann sollte man starten?
  • Sollte man ein Green Cab oder eine Yellow Cab fahren?
  • Welche Zonen sind am attraktivsten?
  • Wie verändert sich die Nachfrage an verschiedenen Zeiten?
  • Welchen Einfluss hat das Wetter auf die Fahrten?

Im Wandel der Zeit

Die Analyse und Aufbereitung von Daten schafft neue Potenziale für Innovation und Weiterentwicklung. Die Digitalisierung von Daten und Prozessen in allen Bereichen schreitet laufend voran. Daten sind heute, durch moderne Technologien, effizienter erfassbar und lassen eine neue Sicht auf etablierte Prozesse und Geschäftsfelder zu. In den meisten Branchen stellt dieses neue Thema einen wichtigen Teil der Unternehmensstrategie dar.

Dabei muss bei den meisten dieser Unternehmen ein Umbruch vollzogen werden. Weg von trägen Abläufen und arbeitsintensiven Einzelarbeiten und hin zu datengetriebenen Prozessen und strukturierten Lösungen. Diese müssen innovativ sein und das Unternehmen in sich näher zusammenbringen und vernetzen.

Egal ob es sich dabei um Kundendaten, Daten zur Einhaltung von Branchenvorschriften oder Detaileinblicke in Produktionsprozesse handelt – die Verarbeitung von Daten ist zu einem wichtigen Bestandteil jedes Unternehmens geworden. Es ist ein Umdenken notwendig um das spannende Abenteuer Big Data anzugehen. Es benötigt innovative Ideen und Akteure um mit fundiertem Wissen den nachhaltigen Switch zu schaffen.

Methoden

Um diese Themen erfolgreich umzusetzen gilt es zu klären, wie in diesem herausfordernden Bereich die Lösung eines konkreten Problems aufgebaut sein sollte. Zum einen muss sie einen klaren, wohldefinierten Zweck verfolgen und diesen transparent, wiederholbar und nachvollziehbar modellieren.

Zum anderen muss die technische Grundlage geschaffen werden. Dazu benötigt man Expertenwissen im Bereich der Datenintegration, Datenqualität, Reporting und Visualisierung sowie statistischer Analysen.

Case Study – Taxifahren in New York

Wir gehen hier der Fragestellung auf den Grund, wie gut sich steuerungsrelevante Informationen durch state oft the art analytics Methoden unbekannter Domänen ableiten lassen. Da die Datenmengen moderner Prozesse immer größer werden und selbst mit geschultem Auge nur mehr schwer zu analysieren sind, wird data science als Disziplin immer wichtiger.

„Wie gut lassen sich, an Hand von state of the art analytics Methoden, steuerungsrelevante Informationen aus unbekannten Domänen erzeugen?“

Datenquellen

Die erste Frage, die sich bei der Bearbeitung solcher Themen stellt, ist, welche Daten benötige ich für meine Aufgabenstellung. Daten können aus vielen unternehmensinternen Quellen bezogen werden, so können sie zum Beispiel aus Kundeninteraktionen oder Prozessabläufen abgeleitet werden oder aber auch über verbundene Dienste bezogen werden.

Darüber hinaus bieten öffentliche Register eine immer wichtigere Datenquelle für Datenanreicherungen oder eigene neue Analyseszenarien. Unter dem Schlagwort Open Data stellen immer mehr Verwaltungseinheiten wie Länder, Städte oder Gemeinden Daten zur freien Verfügung. Dieses speziell in Großstädten bereits sehr verbreitete System erfreut sich wachsender Beliebtheit.

Wir haben uns als Beispiel für öffentliche Daten die Einzelfahrtdaten der Taxi & Limousine Commision (TLC) von New York City als Case Study angesehen.

Die TLC veröffentlicht zu jeder in New York City vorgenommenen Taxifahrt Einzelfahrtdaten, so kommen innerhalb eines Jahres Daten über 150 Millionen Fahrten zustande. Weiter bietet sie Shapefiles (Dateien der Taxizonen von NYC) an, um die Daten besser kategorisieren zu können.

Erkenntnisse

Grafik 1

Grafik 1

Grafik 2

Grafik 2

Grafik 1 zeigt, dass die Green Cabs die Grenze immer exakt einhalten, dass die Yellow Cabs genau bis zu dieser Grenze stark vertreten sind und die Bereiche danach vernachlässigen.

Anhand Grafik 2 sehen wir die Endpunkte der Fahrten
beschränkt auf Green Cabs.

Hier wird auch das Problem für die Green Cabs klar: Viele ihrer Fahrten enden in der gelben Sperrzone in Manhattan Green Cabs, die solche Fahrtenmachen, müssen danach wieder aus der Stadt heraus in ein äußeres Viertel fahren und verlieren dadurch wichtige Zeit.

Die Hauptknotenpunkte im Taxinetz werden in Grafik 3 sichtbar. Manhattan ist weiterhin das Kerngeschäft für Taxis. Über 77% aller Fahrten starten und enden in diesem Viertel. Davon werden 96% dieser Fahrten von Yellow Cabs durchgeführt.

Durch eine Vertiefung in Form von Zeitreihenanalysen wird nun sichtbar um welche Uhrzeit an verschiedenen Wochentagen welcher Bedarf an Taxis gegeben ist.

Die Grafiken 4a und 4b zeigen auch eine klare Verschiebung unter Tags an verschiedenen Wochentagen. So sehen wir, wann die Nachfrage am Wochenende in der Nacht höher ist und wann es sich wieder lohnt in der Früh ins Taxi zu steigen.

Durch solche Geo-Analysen kann das Verhalten von Kunden noch besser studiert werden und relevante Aussagen für das Unternehmen getroffen werden. Entscheidungsträger haben in Summe durch vielfältige Drill-Downs in den Daten und Detailreports eine Basis für eine datenbasierte Entscheidung.

Wir sind nun als ortsunkundiges und domänfremdes Unternehmen in der Lage, Taxis mit hoher Wahrscheinlichkeit einen guten Return on Business zu verschaffen![/vc_column_text][/vc_column][/vc_row]