Deutsche Bahn

Analyse

Transparenz über Muster und Zusammenhänge

Mit statistischen Methoden und Big Data-Technologien unterstützen wir alle Bereiche der Deutschen Bahn darin, Transparenz über ihre Geschäftsaktivitäten und das Marktumfeld zu gewinnen. Für komplexe Fragestellungen nutzen wir hierzu die komplette Bandbreite an Verfahren aus der Statistik und dem Machine Learning. Für eher deskriptive Analysen entwickeln und konfigurieren wir je nach Fragestellung Self-BI-Systeme und Dashboards, um Datenanalysen interaktiv durchzuführen und durch starke Visualisierung zu unterstützen. Flankiert werden diese Analysethemen durch ein leistungsfähiges Datenmanagement und vielfältige Sekundär- und Umfelddaten.

Mit unseren Big-Data-Analysen schaffen wir Transparenz über statistische Verteilungen, zeitliche und räumliche Strukturen, Treiber und Wechselwirkungen, Cluster und Ausreißer. Hierzu wenden wir Data-Mining-Verfahren wie z.B. Clusteranalyse oder multidimensionale Skalierung an. Für die Analyse von Zusammenhängen kommen u.a. Faktorenanalyse, multivariate Regression oder Baumverfahren zum Einsatz. Die Anwendungsbreite der Verfahren ist sehr groß und setzt primär eine valide Datenbasis voraus. Typische Einsatzfelder sind Verkaufsdaten, Sensordaten oder Betriebsdaten aber auch Logfiles und Videodaten.

Nicht alle Analysen müssen von erfahrenen Data-Scientisten durchgeführt werden. Insbesondere deskriptive Analysen typischer Geschäftsprozesse lassen sich durch moderne Self-BI-Systeme unterstützen. Durch leistungsfähige Filter und drill-downs lassen sich auch größere Datenmengen und umfangreichere KPI-Sets effizient analysieren. Wir entwerfen und konfigurieren solche Systeme sowohl auf der Backendseite für eine leistungsfähige Datenversorgung als auch auf der Frontendseite, um eine intuitive Benutzerführung zu unterstützen. Dieses Information Design ist insbesondere bei großen Dashboards von Bedeutung, um in der Vielfalt der Daten nicht die relevanten Informationen aus dem Auge zu verlieren. Für ein Verkehrsunternehmen wie die Deutsche Bahn ist hier insbesondere die Einbindung von thematischen Kartendarstellungen relevant.

Zentrale Voraussetzung für viele Analysen ist die technische und inhaltliche Integration verschiedener Datenquellen. Hierbei unterstützen wir mit leistungsfähigen ETL-Prozessen das Auslesen der Daten aus den Quellsystemen und das anschließende Bereinigen und Transformieren der Daten auf die Zielstruktur. Auch Feature-Extraction zur Strukturierung unstrukturierter Daten ist hierbei natürlich ein Teil unserer Leistung. Wir greifen auf eine Vielfalt von algorithmischen Zuordnungsverfahren zurück, um Daten auch ohne passende Schlüssel bestmöglich zu integrieren.  Für die Ablage der Daten haben wir langjährige Erfahrung in komplexen DWH-Strukturen, nutzen aber auch verteilte Systeme zur Datenablage und -verarbeitung.

Mit einem breiten Portfolio externer und interner Daten unterstützen wir viele Analyse-, Prognose- und Planungsprozesse. Insbesondere bei Analysen über Wirkungszusammenhänge ist die Einbindung vielfältiger Sekundärdaten als potenzielle erklärende Variable von großer Bedeutung, um Zusammenhänge einerseits und Scheinkorrelationen andererseits aufzudecken. Hierzu nutzen wir intensiv Daten über Wetter und Klima, zeitliche Strukturen wie Ferien und Feiertage sowie Verkehrsmarktdaten über alle Verkehrsträger. Darüber hinaus sind das soziodemographische Umfeld und die Flächennutzung naheliegenderweise eine zentrale Erklärungsgröße für Verkehrs- und Transportvorgänge. Auch detaillierte digitale und routingfähige Infrastruktur- und Netzmodelle stellen ein wichtiges Element unserer Datenbasis dar.