Springe direkt zu Inhalt

Ausbildung für die Datenanalyse von morgen

Bis 15. August: Bewerbung für neuen Masterstudiengang Data Science

24.07.2019

Die Datenmenge nimmt immer mehr zu – der neu eingerichtete Masterstudiengang Data Science will für die Analyse von Daten ausbilden.

Die Datenmenge nimmt immer mehr zu – der neu eingerichtete Masterstudiengang Data Science will für die Analyse von Daten ausbilden.
Bildquelle: PublicDomainPictures/Pixabay.com 

Daten sind ein wertvoller Schatz. Aber ohne Spezialisten, die mit den Datenmassen umgehen können, kann der Schatz nicht gehoben werden. An der Freien Universität wird daher vom Wintersemester 2019/2020 an der Masterstudiengang Data Science angeboten. Tim Conrad, Professor für Medizinische Bioinformatik am Institut für Mathematik, hat den neuen Studiengang mitentwickelt. Im Gespräch mit campus.leben erklärt er, wie weitgefächert der Anwendungsbereich für Datenwissenschaftler ist. Bewerbungen für den Studiengang sind bis zum 15. August möglich.

Herr Professor Conrad, was ist Data Science – und wie grenzt sich der Bereich zur Informatik ab?

Ein typischer Datenwissenschaftler – oder Data Scientist – beschäftigt sich mit der Aufbereitung, Verarbeitung und Analyse von Daten. Das Interessante dabei ist, dass die dafür notwendigen Verfahren aus verschieden wissenschaftlichen Bereichen stammen, eben zum Beispiel aus der Informatik, aber auch aus der Mathematik oder den Sozialwissenschaften. Insofern kann man sagen, dass die Informatik sich mit grundlegenderen Themen beschäftigt und typischerweise weniger anwendungsorientiert ist.

Der neue Masterstudiengang ist aus diesen Gründen interdisziplinär angelegt. Die Dozentinnen und Dozenten werden aus so verschieden Bereichen wie Mathematik, Bioinformatik, Informatik und Psychologie kommen, aber auch aus den Rechtswissenschaften und Ethik.

Prof. Dr. Tim Conrad

Prof. Dr. Tim Conrad
Bildquelle: Privat

Juristisch geht es etwa um die ebenso einfache wie entscheidende Frage, ob man überhaupt im Besitz bestimmter Daten sein darf. Bei medizinischen Daten dürfen beispielsweise die Klarnamen von Patienten nicht sichtbar sein. Im Bereich der Ethik werden wir über Fragen diskutieren, die sich um die mögliche Diskriminierung durch Algorithmen oder die Konsequenzen des eigenen Handelns drehen: Darf man mithilfe eines Algorithmus‘ eine medizinische Diagnoseempfehlung abgeben, selbst wenn die Datenqualität fragwürdig ist? Auch der Fall um das Unternehmen Cambridge Analytica berührt ethische Fragen. Das Unternehmen hatte damals Daten von Facebooknutzern gekauft, um diese durch gezielte Wahlwerbung zu manipulieren. Im Ethikseminar werden wir uns mit solchen Fällen auseinandersetzen.

Wie ist die Idee zum Studiengang entstanden, und warum wird er gebraucht?

Der Anstoß kam aus der Universität, meine Kollegin Katinka Wolter, Professorin am Institut für Informatik, mein Kollege Dirk Ostwald, Professor für Computergestützte kognitive Neurowissenschaften, und ich haben das grundlegende Konzept für den Masterstudiengang entwickelt.

Weshalb wir den Studiengang für wichtig erachten? Datenanalysen werden heute in den unterschiedlichsten Bereichen gebraucht, aber die Menschen, die dort arbeiten, wurden in der Regel nicht speziell für die Arbeit mit ihnen ausgebildet. Das möchten wir ändern.

Im Studiengang werden wir vor allem mit Anwendungsbeispielen aus den Bereichen Psychologie und Bioinformatik arbeiten. Oft geht es in der Datenanalyse um die Vorhersagbarkeit von Entwicklungen und Ereignissen oder das Erkennen von Zusammenhängen. In der Wirtschaft gibt es zahlreiche mögliche Anwendungsfälle, die häufig mithilfe vorhandener Daten beantwortet werden können: Wann wird eine Maschine voraussichtlich kaputtgehen? Wie lässt sich eine Gebäudesteuerung optimieren? Lässt sich an der Häufigkeit der Verwendung eines Begriffs in Fashion-Blogs der Modetrend für die nächste Saison ablesen? Das sind Fragen, die mit den Methoden der Data Science beantwortet werden können.

Der neue Studiengang wird einen starken Praxisbezug haben – wie soll dieser aussehen?

Aus meiner bisherigen Erfahrung aus der Lehre weiß ich, dass Studierende davon profitieren, wenn ihnen nicht nur Theorie vermittelt wird, sondern sie das Gelernte in möglichst realistischen Situationen anwenden können. Durch die praktische Arbeit entwickeln die Studierenden ein ganz anderes Bewusstsein für Möglichkeiten, die sich ergeben, aber auch für Probleme, die sich stellen. So sind beispielsweise immer noch viele Studierende überrascht, wenn sie einen Datensatz bearbeiten sollen, der Fehler oder Lücken enthält. Das ist in der Praxis ganz normal – in einer herkömmlichen Übungsaufgabe aber eher nicht.

Die Praxisseminare werden so ähnlich aussehen wie in unserem MODAL-G-RIPS-Programm, einem Kooperationsprojekt der Freien Universität und dem Zuse-Institut Berlin. G-RIPS steht für Graduate-level Research in Industrial Projects for Students. Jedes Jahr im Sommer arbeiten internationale studentische Teams an einem realen Problem von Industriepartnern des MODAL-Forschungscampus‘ – zuletzt etwa eines großen Transportdienstleisters, der immer wieder gezwungen ist, kurzfristige Notfallpläne auszuarbeiten, beispielsweise wenn Mitarbeiterinnen und Mitarbeiter des Unternehmens streiken. Es ging um die Frage, wie ein Algorithmus auf Grundlage der bestehenden Daten einen solchen Plan berechnen könnte.

Was sollten Interessierte mitbringen, die Data Science studieren möchten?

Voraussetzung sind 15 Leistungspunkte in mathematischen Kursen und fünf Leistungspunkte in Programmierkursen. Unterrichtssprache ist Englisch, erforderlich sind deshalb Sprachkenntnisse auf dem Niveau B2. Umfangreiche IT-Kenntnisse braucht man für die Bewerbung nicht. Wichtig ist aber ein grundsätzliches Interesse, sich in die Datenanalyse einzuarbeiten und komplexe Fragen zu beantworten. Oder einfach gesagt: Man sollte Lust darauf haben, sich einen Datenberg vorzunehmen, um die darin versteckten Zusammenhänge zu erkennen und daraus Wissen abzuleiten.

Die Fragen stellte Peter Schraeder