Übersicht

Data Science trifft Open Data: Studienprojekte im Einstein Center Digital Future

Offene Daten können die Grundlage für spannende Forschungsprojekte sein, wie Studierenden am Einstein Center eindrucksvoll zeigen.

Professor Dr. Felix Biessmann begrüßt die Teilnehmenden
Auf dieser Seite

Zu Besuch im Einsten Center

Orte wie das Einstein Center Digital Future belegen eindrucksvoll, wie in Berlin an der digitalen Zukunft gearbeitet und geforscht wird. So freuten wir uns gemeinsam mit Denes Jäger von der OKFN über die Einladung an der Präsentation von Studierendenprojekte des Studiengangs Data Science teilzunehmen. Wir waren neugierig darauf, wie Studierende (offene) Daten nutzen, welche Fragestellungen entwickelt wurden und welche Erfahrungen die Studierenden bei der Datennutzung machten.

Von Luftqualität und Verspätungen im ÖPNV: Vielfältige Projekte auch dank offener Daten

Besteht ein direkter Zusammenhang zwischen Luftqualität und dem Umfang an Grünflächen in den Berliner Bezirken? Führt ein hohes Verkehrsaufkommen zu mehr Verkehrsunfällen? Und auf welchen Bus sollte man sich in der Rush Hour besser nicht verlassen?

Diese und noch einige Fragestellungen mehr versuchten die Studierenden auch dank offener Daten zu beantworten. Dabei nutzten sie unter anderem offene Daten aus dem Geoportal und dem Berliner Open Data Portal. In einigen Forschungsprojekten wendeten die Studierenden Daten an, um zum Beispiel gesellschaftliche Gegensätze sichtbar zu machen. So konnte ein Student anhand soziodemographischer Daten zu Arbeitslosigkeit, Wohnsituation und Alter anschaulich aufzeigen, wie in einem Planungsraum deutliche soziale Gegensätze links und recht einer Hauptstraße sichtbar werden.

Einige Studierende nutzten die Daten, um Algorythmen zu berechnen und Vorhersagen oder Prognosen zu erstellen. So wollte eine Studierende zum Beispiel wissen, ob ein direkter Zusammenhang besteht zwischen Luftqualität und einer Erweiterung der Park- oder Grünflächen in einem bestimmten Bezirk.

Ein Student stellt Ergebnisse seiner Datenanalyse auf Grundlage des offenen Datensatz zu Fahrradiebstählen vor.
Ein Student stellt Ergebnisse seiner Datenanalyse auf Grundlage des offenen Datensatz zu Fahrradiebstählen vor.

Fragen der Studierenden an die Daten

Die Studierenden berichteteten auch über Herausforderungen und Schwierigkeiten, die ihnen bei der Projektarbeit in puncto Datenqualität und -nutzung begegneten. Einige Daten, etwa der BVG, werden zwar als API bereitgesetllt, allerdings nicht zentral über das Berliner Datenportal. So musste eine Studierende einen Zugang zu den Daten beantragen. In den Daten selbst gab es dann Unklarheiten, wie genau Verspätungen definiert werden. Eine genaue Beschreibung der Methodik bzw. Metadaten ist also gerade für Datennutzende unerlässlich. Herausfordernd war für die Studierenden zudem Geodaten aus dem Geodatenportal zu nutzen. Diese Daten liegen in einem bestimmten Geoformat vor, können allerdings nicht als CSV-Datei heruntergeladen werden. CSV-Dateien sind wiederum das gängige Format für Softwareprogramme für Datenanalyse oder Datenverarbeitung. Insgesamt sollte, so der Tenor der Studierenden, es leichter gemacht werden, Daten insbesondere mit räumlichen Bezug miteinander zu vergleichen.

Es war sehr inspirierend, so viele motivierte Studierende zu treffen und mit ihnen über Datenauffindbarkeit, Datenqualität und Wege der Datenvisualisierung zu diskutieren. Wir haben viele Anregungen mitgenommen und freuen uns auf den Gegenbesuch bei uns im CityLAB Berlin.