SoSe 25  
Mathematik und ...  
Data Science  
Lehrveranstaltung

Data Science

Data Science

0590b_MA120
  • Mobilkommunikation

    0089cA3.3
    • 19303901 Vorlesung
      Mobilkommunikation (Jochen Schiller)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      Das Modul „Mobile Communications“ präsentiert die wichtigsten Themen der mobilen und drahtlosen Kommunikation - die treibenden Kräfte hinter der heutigen Kommunikationsindustrie, die das tägliche Leben aller beeinflussen.

      Die gesamte Vorlesung findet auf ENGLISCH statt und konzentriert sich auf eine Systemperspektive und gibt viele Hinweise auf reale Systeme, Standardisierung und aktuelle Forschung.

      Das Format der Vorlesung ist das Flipped Classroom, d.h. Sie sollten die Videos einer Vorlesung ANSCHAUEN, BEVOR Sie an der Q&A-Sitzung teilnehmen. Während der Q&A-Sitzung werden dann alle offenen Fragen und Probleme diskutiert und beantwortet.

      Die Hauptthemen der Vorlesung sind:

      • Grundlagen der drahtlosen Übertragung: Frequenzen, Signale, Antennen, Multiplexing, Modulation, Spreizspektrum

      • Mediumzugriff: SDMA, FDMA, TDMA, CDMA

      • Drahtlose Telekommunikationssysteme: GSM, TETRA, IMT-2000, LTE, 5G

      • Drahtlose lokale Netzwerke: Infrastruktur/Ad-hoc, IEEE 802.11/15, Bluetooth, ZigBee

      • Mobile Vernetzung: Mobile IP, Ad-hoc-Netze

      • Mobiler Transportschicht: traditionelles TCP, zusätzliche Mechanismen

      • Ausblick: 5 bis 6G, drahtlose Niedrigenergienetzwerke

      Literaturhinweise

      Jochen Schiller, Mobilkommunikation, Addison-Wesley, 2.Auflage 2003

      Alle Unterlagen verfügbar unter http://www.mi.fu-berlin.de/inf/groups/ag-tech/teaching/resources/Mobile_Communications/course_Material/index.html

  • Applied Machine Learning in Bioinformatics

    0262cD1.12
    • 19403613 Praxisseminar
      Machine Learning and AI in the Life Sciences: Methods and Applications (Tim Conrad, Christoph Tycowicz)
      Zeit: Fr 08:00-12:00 (Erster Termin: 25.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen:

      Vorlesung Statistik im Master Bioinformatik (oder äquivalente Veranstaltungen)

      Kommentar

      Machine Learning and AI in the Life Sciences: Methods and Applications

      This course introduces key machine learning and AI techniques with a strong focus on their applications in the life sciences. You will learn how to analyze complex biomedical data, from pre-processing to model selection and interpretation, using techniques such as dimensionality reduction, feature selection, supervised and unsupervised learning, visual analysis, and deep learning.

      Through hands-on projects based on real-world datasets, you will gain practical experience in selecting and applying the right methods to tackle key challenges in the life sciences and bioinformatics, such as disease prediction, biomarker discovery, and patient (status) classification.  These projects will reinforce your learning while also helping you develop both technical expertise and scientific communication skills through presentations.

      By the end of the course, you will be able to process and model life science data, evaluate AI-driven insights, and effectively communicate your findings. Prior experience in programming (e.g., in R, Python, Java, or C/C++) is highly recommended.


      Dieser Kurs führt in die wichtigsten Techniken des maschinellen Lernens und der künstlichen Intelligenz ein, wobei der Schwerpunkt auf deren Anwendungen in den Lebenswissenschaften liegt. Sie werden lernen, wie man komplexe biomedizinische Daten analysiert, von der Vorverarbeitung bis zur Modellauswahl und Interpretation, unter Verwendung von Techniken wie Dimensionsreduktion, Feature Selection, überwachtes und unüberwachtes Lernen, visuelle Analyse und Deep Learning.

      Durch praktische Projekte, die auf realen Datensätzen basieren, werden Sie praktische Erfahrungen in der Auswahl und Anwendung der richtigen Methoden sammeln, um wichtige Herausforderungen in den Lebenswissenschaften und der Bioinformatik zu bewältigen, wie z. B. die Vorhersage von Krankheiten, die Entdeckung von Biomarkern und die Klassifizierung des Patienten(-status). Diese Projekte werden Ihre Kenntnisse vertiefen und Ihnen helfen, sowohl technisches Fachwissen als auch wissenschaftliche Kommunikationsfähigkeiten durch Präsentationen zu entwickeln.

      Am Ende des Kurses werden Sie in der Lage sein, biowissenschaftliche Daten zu verarbeiten und zu modellieren, KI-gesteuerte Erkenntnisse zu bewerten und Ihre Ergebnisse effektiv zu kommunizieren. Vorkenntnisse in der Programmierung (z. B. in R, Python, Java oder C/C++) werden dringend empfohlen.

       

    • 60103513 Praxisseminar
      Computer vision for biomedical images (Sören Lukassen)
      Zeit: Do 14:00-18:00 (Erster Termin: 17.04.2025)
      Ort: A6/017 Frontalunterrichtsraum (Bioinf) (Arnimallee 6)

      Kommentar

      Imaging techniques have become an integral component of both biomedical research and clinical practice. At the same time, automated image analysis has experienced significant progress, driving technologies ranging from image search to autonomous vehicles. This automation is increasingly applied to biomedical images. However, adapting computer vision algorithms for biomedical images introduces unique challenges due to their distinct properties uncommon in other imaging datasets.

      In this course, you will explore the prevalent imaging modalities within biomedicine, including CT scans, MRI, ultrasound, and whole-slide microscopy images. We will investigate the common data formats for these images, understanding what distinguishes them from typical jpeg or png files, and how these distinctions can facilitate their efficient analysis. After an introduction to basic computer vision algorithms, we will trace the evolution of classification and segmentation models in this domain over the last decade, starting with convolutional neural networks and culminating with cutting-edge architectures such as vision transformers. Through practical exercises, you will apply your knowledge to a dataset of histology slide images from cancer patients, aiming to predict the tumor's stage and location. Additionally, we will investigate how your models arrive at their predictions, identifying the data patterns they consider informative and connecting these insights to the pathophysiological alterations within tumor tissues.

      Our models will be built using the pytorch package in Python. While familiarity with coding neural networks is not a prerequisite, prior experience in general Python programming is expected.

      By the conclusion of this course, you will be equipped to develop segmentation and classification models for biomedical images, recognize common pitfalls and artifacts, explain how your models arrive at their predictions, and effectively communicate your findings.

  • Machine Learning in Bioinformatics

    0262cD1.7
    • 19405701 Vorlesung
      Machine Learning in Bioinformatics (Philipp Florian Benner, Hugues Richard)
      Zeit: Mo 08:00-10:00 (Erster Termin: 14.04.2025)
      Ort: A6/SR 025/026 Seminarraum (Arnimallee 6)

      Kommentar

      Dieser Kurs führt Schlüsselkonzepte des maschinellen Lernens ein und wird von Tutorien und Übungsaufgaben begleitet, in denen Methoden des maschinellen Lernens auf aktuelle Probleme der Bioinformatik angewendet werden. Nach einer kurzen Wiederholung der Wahrscheinlichkeitstheorie stellen wir probabilistische Methoden zur Klassifikation und Sequenzanalyse vor (Naive Bayes, Mixture Models, Hidden Markov Models). Wir diskutieren die Erwartungs-Maximierung (EM) aus probabilistischer Perspektive und verwenden sie für die Sequenzanalyse. Lineare und logistische Regression dienen als Einstiegspunkt für komplexere Methoden des maschinellen Lernens, einschließlich Kernel-Methoden und neuronale Netze. Die Vorlesung behandelt mehrere neuronale Netzwerkarchitekturen (CNNs, GNN, Transformers), die derzeit in der Bioinformatik-Community und anderen Forschungsbereichen verwendet werden. In den Tutorien und im Rahmen von Übungsaufgaben werden ausgewählte Machine-Learning-Modelle mit scikit-learn und pytorch in Python implementiert. Der Kurs soll es den Studierenden ermöglichen, alle gängigen Techniken des maschinellen Lernens zu verstehen und State-of-the-Art-Klassifizierungsstrategien zu entwickeln, die dann auf Probleme in der Bioinformatik und verwandten Bereichen angewendet werden können.   Inhalte:
      - Naive Bayes
      - Clustering und Mixture Models
      - Hidden Markov Models
      - Regression und Partial Least Squares
      - Kernel Methods
      - Neural Networks und Architekturen
      - Regularization und Model Selection   Voraussetzungen:
      - Lineare Algebra (einfache Vector- and Matrixalgebra)
      - Analysis (mathematische Optimierung, Lagrange)
      - Programmierkenntnisse in Python -- einschließlich objektorientierte Programmierung
      - Grundlegende Kenntnisse oder starkes Interesse in molekularer Biologie und Anwendungen in der Bioinformatik

    • 19405702 Übung
      Übung zu Machine Learning in Bioinformatics (Philipp Florian Benner, Hugues Richard)
      Zeit: Mi 08:00-10:00 (Erster Termin: 16.04.2025)
      Ort: A7/SR 031 (Arnimallee 7)
  • Data Science in Life Sciences

    0590bB1.1
    • 19405606 Seminaristischer Unterricht
      Data Science in the Life Sciences (Katharina Jahn)
      Zeit: Mo 10:00-14:00 (Erster Termin: 14.04.2025)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)

      Kommentar

      This course offers an introduction to various types of data and analysis techniques which are typically used in the life sciences (e.g. omics technologies). The goal is to get a deeper understanding of advanced concepts and data analytical methods in the area of life sciences.

      The focus will be on the following topics:

      • acquisition and pre-processing of data from the area of life sciences,
      • explorative analysis techniques,
      • concepts and tools for reproducible research,
      • theory and practice of methods and models for the analysis of data from the life sciences (statistical inference, regression models, methods of machine learning),
      • introduction to methods of big data analysis.

      After successful completion of this course, participants are able to evaluate, plan and conduct investigations in the life sciences using common methods.

       

    • 19405612 Projektseminar
      Projektseminar zu Data Science in the Life Sciences (Katharina Jahn)
      Zeit: Mi 10:00-14:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 031 Seminarraum (Arnimallee 6)
  • Interdisziplinäre Zugänge im Rahmen von Data Science A

    0590bB1.27
    • 24206501 Vorlesung
      V - Geographische Informationssysteme I: Grundlagen (Fabian Faßnacht)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.04.2025)
      Ort: G 202 Hörsaal Geographie (Malteserstr. 74-100 G)

      Kommentar

      Die Studierenden verfügen über kartographisches Basiswissen insbesondere im Hinblick auf verschiedene Karten-
      typen, die Projektionen, Koordinatensysteme, den Kartenaufbau sowie Kartenwerke und sind in der Lage, Karten
      zu interpretieren. Sie besitzen die Fähigkeit, geowissenschaftliche Fragestellungen eigenständig mittels Geogra-
      phischen Informationssystemen computergestützt zu bearbeiten und Ergebnisse zu präsentieren.
      Inhalte:
      Die Studierenden erhalten eine Einführung in die Kartographie mit den Themenbereichen allgemeine Grundlagen der
      Kartographie, thematische/topographische Karten, Kartennetzentwürfe und Koordinatensysteme, Partizipative Geogra-
      phische Informationssystems (PGIS), Generalisierung sowie Karteninterpretation. Anhand ausgewählter Anwendungs-
      beispiele werden grundlegende Konzepte von Geographischen Informationssystemen und der Geoinformationsverar-
      beitung computergestützt vermittelt: Struktur und Anwendungen von Geoinformationssystemen, grundlegende Konzepte
      wie Datenmodelle, Erfassung von Geodaten, Methoden und Probleme der Abbildung des Georaumes, Georeferenzie-
      rung, Extraktion und Verarbeitung räumlicher Daten, Methoden der räumlichen und geostatistischen Analyse und Inter-
      polationsverfahren, Erstellung und Analyse digitaler Geländemodelle, Visualisierung von Geodaten einschließlich Karten.

  • Ethical Foundations of Data Science

    0590bB1.3
  • Spezielle Aspekte der Data Science in Life Sciences

    0590bB1.4
    • 19304701 Vorlesung
      Robotik (Daniel Göhring)
      Zeit: Mi 12:00-14:00 (Erster Termin: 16.04.2025)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen:

      Interesse an Robotik mit Anwendungen an autonomen Fahrzeugen. Grundwissen in Mathematik, insbesondere Lineare Algebra und Optimisierung. Die Studierenden werden mit einem echten Modellauto im Robotiklabor arbeiten.

      Kommentar

      Inhalt:

      Die Vorlesung gibt eine Einführung in die Robotik. Sie ist in folgende Themenschwerpunkte untergliedert:

      • Bewegungserzeugung und dynamische Regelungsverfahren: Dieser Schwerpunkt beschäftigt sich mit Koordinatensystemen, nichtholonomen Bewegungsmodellen wie Ackermannmodellen (analog zu Automobilen) sowie PID-Reglern.
      • Planungsverfahren: Planung mit Hindernissen, Finden von Pfaden, Dijkstra, A*, Hindernisse im Konfigurationsraum, RRT, lattice planner, Gradientenabstieg, Potenzialfeldmethoden, Splines
      • Localisierung und Mapping: Zustandsabschätzung, Bayesfilter, Odometrie, Partikelfilter, Kalmanfilter, SLAM-Verfahren.
      • Vision und Umgebungswahrnehmung: SIFT, HOG-features, Deformable parts models, hough transform, Spurerkennung, 3d-Punktwolken, RANSAC .

      Nach dieser Vorlesung werden die Studenten in der Lage sein, einfache Algorithmen zur Bewegungserzeugung und Zustandsabschätzung für Roboter zu erzeugen.

      Die VL wird in deutscher Sprache gehalten, Folien und Begleitmaterial sind größtenteils auf Englisch.

       

      Literaturhinweise

      Literatur:


      John J Craig: Introduction to Robotics: Mechanics and Control; Steven LaValle: Planning Algorithms; Sebastian Thrun, Wolfram Burgard, Dieter Fox: Probabilistic Robotics

       

    • 19321101 Vorlesung
      Advanced Data Structures (László Kozma)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Die Schwerpunkte dieser Vorlesung sind Design, Analyse, und Anwendungen von Datenstrukturen.

      (Die Vorlesung wird in der englischen Sprache gehalten. Zusätzliche Details zu den Kursinhalten finden Sie in der englischen Beschreibung.)

       

      Literaturhinweise

      D. E. Knuth, The Art of Computer Programming, Volume 4A: Combinatorial Algorithms, Part 1. (Addison-Wesley, 2011), xv+883pp. ISBN 0-201-03804-8

    • 19333101 Vorlesung
      Cybersecurity and AI II: Erklärbarkeit (Gerhard Wunder)
      Zeit: Mo 12:00-14:00, Di 10:00-12:00, Fr 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: 1.3.21 Seminarraum T1 (Arnimallee 14)
    • 19336901 Vorlesung
      Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)

      Kommentar

      Die Vorlesung über fortgeschrittene Datenvisualisierung für künstliche Intelligenz ist eine umfassende Erkundung der modernsten Techniken und Tools zur Erstellung und Validierung komplexer Visualisierungen für die Vermittlung von Dateneinblicken und Geschichten, mit einem besonderen Schwerpunkt auf Anwendungen in der Verarbeitung natürlicher Sprache (NLP) und erklärbarer KI. Der Vortrag führt die Teilnehmer in das verschachtelte Modell der Visualisierung ein, das vier Ebenen umfasst: Charakterisierung der Aufgabe und der Daten, Abstrahierung in Operationen und Datentypen, Entwurf visueller Kodierungs- und Interaktionstechniken und Erstellung von Algorithmen zur effizienten Ausführung von Techniken. Dieses Modell dient als Rahmen für den Entwurf und die Validierung von Datenvisualisierungen.

      Darüber hinaus wird in der Vorlesung die Anwendung der Datenvisualisierung im Bereich NLP behandelt, wobei der Schwerpunkt auf der Visualisierung von Worteinbettungen und Sprachmodellen liegt, um die Erforschung semantischer Beziehungen zwischen Wörtern und die Interpretation des Verhaltens von Sprachmodellen zu unterstützen. Im Kontext von Explainable AI liegt der Schwerpunkt auf der Verwendung von Visualisierungen zur Erklärung von Modellvorhersagen und der Bedeutung von Merkmalen, wodurch die Interpretierbarkeit von KI-Modellen verbessert wird. Durch die Nutzung des verschachtelten Modells der Visualisierung und die Fokussierung auf NLP und erklärbare KI zielt der Vortrag darauf ab, die Teilnehmer mit den wesentlichen Fähigkeiten auszustatten, um fortschrittliche Datenvisualisierungen zu entwerfen und zu validieren, die auf diese spezifischen Anwendungen zugeschnitten sind. So können sie letztendlich komplexe Datenmuster effektiv kommunizieren und tiefere Einsichten aus ihren Daten gewinnen.

    • 60102501 Vorlesung
      Resampling Techniken und deren Anwendungen (Frank Konietschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)

      Kommentar

      Beschreibung liegt auf Englisch vor.

    • 60102701 Vorlesung
      Complex Data Analysis in Physiology (Dorothee Günzel)
      Zeit: Mo 14:30-18:30 (Erster Termin: 14.04.2025)
      Ort: keine Angabe

      Kommentar

      Gemeinsame Veranstaltung des Instituts für Klinische Physiologie und des Instituts für Physiologie der Charité.

      Theoretische und praktische Aspekte der Daten-Akquise, real-time Daten-Verarbeitung und automatisierte Mustererkennung in der Biomedizin. Es werden vertieft Themen aus folgenden Gebieten behandelt:

      • Datenerfassung und Prozessierung von Bilddateien in Forschung und Klinik (z. B. Live Cell Imaging, Super-Resolution-Mikroskopie, bildgebende Verfahren in der Medizin)
      • Elektrophysiologische Verfahren (z. B. Impedanzspektroskopie, Microarrays, EEG, EKG)
      • Verfahren und Anwendung automatisierter Mustererkennung (z. B. automatisierte Tumorerkennung, real-time Analyse biologischer Signale im Brain-Computer Interface oder in Retinaimplantaten, Vorhersage von individuellen Arrhythmierisiken)

      Der Kurs ist zeitlich geteilt: die ersten sieben Termine im Semester finden am Institut für Physiologie statt, die zweiten sieben Termine am Instituts für Klinische Physiologie.

      Weitere Informationen zur Veranstaltung: http://klinphys.charite.de/bioinfo/ oder bei Dorothee Günzel

    • 19304702 Übung
      Übung zu Robotik (Daniel Göhring)
      Zeit: Do 12:00-14:00 (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)
    • 19321102 Übung
      Übung zu Advanced Data Structures (N.N.)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      Übungen

    • 19333102 Übung
      Übung zu Cybersecurity and AI II (Gerhard Wunder)
      Zeit: Mo 14:00-16:00 (Erster Termin: 28.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 19336902 Übung
      Ü: Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)
    • 60102502 Übung
      Übung zu Resampling Techniken und deren Anwendungen (Frank Konietschke)
      Zeit: Mi 16:00-18:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 60102702 Übung
      Übung zu Complex Data Analysis in Physiology (Dorothee Günzel)
      Zeit: s. Vorlesung
      Ort: keine Angabe
  • Aktuelle Forschungsthemen der Data Science in Life Sciences

    0590bB1.5
    • 19321101 Vorlesung
      Advanced Data Structures (László Kozma)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Die Schwerpunkte dieser Vorlesung sind Design, Analyse, und Anwendungen von Datenstrukturen.

      (Die Vorlesung wird in der englischen Sprache gehalten. Zusätzliche Details zu den Kursinhalten finden Sie in der englischen Beschreibung.)

       

      Literaturhinweise

      D. E. Knuth, The Art of Computer Programming, Volume 4A: Combinatorial Algorithms, Part 1. (Addison-Wesley, 2011), xv+883pp. ISBN 0-201-03804-8

    • 19325301 Vorlesung
      Cluster Computing (Barry Linnert)
      Zeit: Di 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe

      • MSc

      Anforderungen

      • Erfahrung mit Computern und Software sowie Programierkenntnisse

      Sprache

      • Die Kurssprache ist Deutsch (oder Englisch wenn benötigt).
      • The exam will be formulated in German, but answers may be given in English, too.

      Credits & Klausur

      • aktive Teilnahme an den Übungen: regelmäßige Vorbereitung von Übungsaufgaben & Präsentation der Ergebnisse in den Übungen
      • Bestehen der Klausur

      Webseite

      https://www.mi.fu-berlin.de/w/SE/VorlesungClusterComputing

      Kommentar

      Cluster-Computer bilden die zur Zeit vorherrschende Klasse paralleler Hochleistungsrechner. Sie bestehen aus konventionellen Prozessorknoten, die über ein Hochgeschwindig­keitsnetzwerk miteinander verbunden sind. Obwohl meistens räumlich integriert, handelt es sich um verteilte Systeme mit jeweils lokalen Betriebssystemen. Das enorme Leistungspotential dieser Rechnerklasse kann nur ausgeschöpft werden, wenn Programmcode und Daten optimal über die Knoten verteilt werden. Die einge­setzten Verfahren müssen insbesondere skalierbar sein, also auch bei Tausenden von Rechnerknoten noch effizient arbeiten. Gleichzeitig soll aber die Programmiererin bzw. der Programmierer von diesen Aufgaben entlastet werden. Die Vorlesung gibt einen Überblick über die auftretenden Probleme und stellt Algorithmen zu ihrer Lösung vor.

      Literaturhinweise

      • Heiss, H.-U.: Prozessorzuteilung in Parallelrechnern, BI-Verlag, Mannheim, 1996
      • Andrews, G. A.: Foundations of Multithreaded, Parallel and Distributed Programming, Addison-Wesley, 2000
      • Pfister, G.: In Search of Clusters 2nd ed., Prentice Hall, 1998
      • Zomaya, A.: Parallel and distributed computing handbook, McGraw Gill, 1995
      • Buyya, R.: High Performance Cluster Computing, Vol. 1+2, Prentice Hall, 1999

    • 19333101 Vorlesung
      Cybersecurity and AI II: Erklärbarkeit (Gerhard Wunder)
      Zeit: Mo 12:00-14:00, Di 10:00-12:00, Fr 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: 1.3.21 Seminarraum T1 (Arnimallee 14)
    • 60102701 Vorlesung
      Complex Data Analysis in Physiology (Dorothee Günzel)
      Zeit: Mo 14:30-18:30 (Erster Termin: 14.04.2025)
      Ort: keine Angabe

      Kommentar

      Gemeinsame Veranstaltung des Instituts für Klinische Physiologie und des Instituts für Physiologie der Charité.

      Theoretische und praktische Aspekte der Daten-Akquise, real-time Daten-Verarbeitung und automatisierte Mustererkennung in der Biomedizin. Es werden vertieft Themen aus folgenden Gebieten behandelt:

      • Datenerfassung und Prozessierung von Bilddateien in Forschung und Klinik (z. B. Live Cell Imaging, Super-Resolution-Mikroskopie, bildgebende Verfahren in der Medizin)
      • Elektrophysiologische Verfahren (z. B. Impedanzspektroskopie, Microarrays, EEG, EKG)
      • Verfahren und Anwendung automatisierter Mustererkennung (z. B. automatisierte Tumorerkennung, real-time Analyse biologischer Signale im Brain-Computer Interface oder in Retinaimplantaten, Vorhersage von individuellen Arrhythmierisiken)

      Der Kurs ist zeitlich geteilt: die ersten sieben Termine im Semester finden am Institut für Physiologie statt, die zweiten sieben Termine am Instituts für Klinische Physiologie.

      Weitere Informationen zur Veranstaltung: http://klinphys.charite.de/bioinfo/ oder bei Dorothee Günzel

    • 19321102 Übung
      Übung zu Advanced Data Structures (N.N.)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      Übungen

    • 19325302 Übung
      Übung zu Cluster Computing (Barry Linnert)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: T9/K44 Rechnerpoolraum (Takustr. 9)
    • 19333102 Übung
      Übung zu Cybersecurity and AI II (Gerhard Wunder)
      Zeit: Mo 14:00-16:00 (Erster Termin: 28.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 60102702 Übung
      Übung zu Complex Data Analysis in Physiology (Dorothee Günzel)
      Zeit: s. Vorlesung
      Ort: keine Angabe
  • Masterseminar Data Science in Life Sciences

    0590bB1.6
    • 19306711 Seminar
      Seminar über Algorithmen (László Kozma)
      Zeit: Do 14:00-16:00, zusätzliche Termine siehe LV-Details (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Fortgeschrittene Themen des Algorithmenentwurfs mit wechselnden Schwerpunkten.

      Im Sommersemester 2025: Neue Ergebnisse bei Algorithmen für kürzeste Wege.

      Zielgruppe

      Master-Studierende der Informatik oder Mathematik

      Empfohlene Vorkenntnisse

      Vorlesung "Höhere Algorithmik" oder vergleichbare Veranstaltung

       

      Literaturhinweise

      Spezialliteratur aus Zeitschriften

    • 19333611 Seminar
      Seminar: Deep Learning for biomedical applications (Vitaly Belik)
      Zeit: Mo 16:00-18:00 (Erster Termin: 14.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Kommentar

      Recent developments in the area of machine learning due to availability of data and computational power promise to revolutionize almost every area of science. The driving technology behind this advancement is deep learning – a machine learning technology based on artificial neural networks consisting of many layers. Deep learning is capable of processing huge amount of data of different nature and already outperforming humans in many decision-making tasks. Biomedical research became now a source of large heterogeneous data, i.e. images, video, activity sensors, omics and text data. Leveraging the opportunities of this deep learning technology in the biomedical field requires particular set of skills combining thorough knowledge of necessary algorithms, specifics of biomedical data and designated programming tools. In this course we aim to offer students with background in computer science an opportunity to acquire the above skills to be able to deploy deep learning technology with a focus on biomedical applications. The course is structured as a seminar, where students under extensive guidance of instructors read fundamental books and recent research articles on deep learning, learn necessary programming tools, and produce their own implementations of computational pipelines in case studies using already published or original data. Starting from fundamental aspects of deep learning we aim to cover its applications to e.g. image data, time series data, text data, complex networks.

      Literaturhinweise

      [1] Andresen N, Wöllhaf M, Hohlbaum K, Lewejohann L, Hellwich O, Thöne- Reineke C, Belik V, Towards a fully automated surveillance of well-being status in laboratory mice using deep learning: Starting with facial expres- sion analysis. Plos One, 15(4):e0228059, (2020) https://doi.org/10.1371/ journal.pone.0228059

      [2] Jarynowski A, Semenov A, Kamiński M, Belik V. Mild Adverse Events of Sputnik V Vaccine in Russia: Social Media Content Analysis of Telegram via Deep Learning. J Med Internet Res 2021;23(11):e30529 https://doi.org//10.2196/30529

    • 19334617 Seminar/Proseminar
      Seminar/Proseminar: How to Startup (Tim Landgraf)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Kommentar

      Dieses Seminar beleuchtet die facettenreiche Welt von Startups und vermittelt den Studierenden ein umfassendes Verständnis dafür, was es braucht, um in einer dynamischen und wettbewerbsorientierten Umgebung erfolgreich zu sein. Behandelt werden Themen wie Teamzusammensetzung, Marktanalyse, Investmentlogik, aktuelle Trends (wie KI) und typische Fehler, die Startups machen.

      Im Gegensatz zu traditionellen Seminaren liegt der Fokus dieses Kurses auf der praktischen Auseinandersetzung mit dem Thema. Die Studierenden bereiten prägnante "Impulsvorträge" (kurze, 15-minütige Präsentationen) zu spezifischen startup-relevanten Themen vor. Diese Präsentationen basieren auf einer Vielzahl von Quellen, darunter:

      * Webrecherche: Sammlung von Erkenntnissen aus Branchenberichten, Blogs und Artikeln.
      * Interviews: Gespräche mit echten Startups, um aus erster Hand Wissen und Perspektiven zu gewinnen.
      * Trendanalyse: Untersuchung aktueller Innovationen und Umbrüche im Startup-Ökosystem.


      Jeder Vortrag dient als Ausgangspunkt für eine interaktive Diskussion, die ein tieferes Verständnis und vielfältige Perspektiven unter den Teilnehmern fördert.

      Dieses Seminar richtet sich an Studierende, die neugierig auf Unternehmertum sind und erkunden möchten, wie Startups in der heutigen schnelllebigen Welt arbeiten, wachsen und Herausforderungen meistern.

       

    • 19335011 Seminar
      Seminar: Netzwerke, dynamische Modelle und ML für Datenintegration in den Lebenswissenschaften (Katharina Baum)
      Zeit: Di 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: T9/137 Konferenzraum (Takustr. 9)

      Kommentar

      Forschungsseminar der Arbeitsgruppe Data Integration in the Life Sciences (DILiS). Auch offen für Seminarteilnahmen im Masterstudium, Online-Teilnahme möglich. Bitte entnehmen Sie Termine dem aktuellen Plan im Whiteboard!

      Das Seminar bietet Raum für die Diskussion weiterführender und integrativer Datenanalysetechniken, insbesondere Vorträge und Diskussion von laufenden oder geplanten Forschungsprojekten, Neuigkeiten von Konferenzen, Besprechung aktueller Literatur und Diskussion möglicher zukünftiger Lehrformate und -inhalte, und Vorstellungen, sowie Abschlussvorträge zu Abschlussarbeiten oder Projektseminaren. Die Seminarsprache ist weitestgehend Englisch. Gern können interessierte Studierende teilnehmen und unverbindlich vorbeischauen oder ein selbst gewähltes Thema von Interesse für die Arbeitsgruppe vorstellen. Achtung: Einzelne Termine können ausfallen oder verschoben werden. Kontaktieren Sie mich gern für Fragen (katharina.baum@fu-berlin.de)!

    • 19336717 Seminar/Proseminar
      Aktives Lernen, Unsicherheit und Erklärbarkeit für biomedizinische Anwendungen (Katharina Baum)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.04.2025)
      Ort: T9/051 Seminarraum (Takustr. 9)

      Kommentar

      In diesem Hauptseminar besprechen wir verschiedenste Methoden für maschinelles Lernen. Im Fokus stehen dabei Ansätze des aktiven Lernens, Abschätzungen von Unsicherheit und ihre Nutzung, sowie Methoden für Erklärungen von Modellen. Die Anwendung und Entwicklung dieser Methoden für biomedizinische Fragestellungen wird anhand aktueller Forschungsarbeiten betrachtet.
      Beispiel für behandelte Ansätze sind
      - selective sampling
      - SHAP values
      - Gaussian ensemble models
      - Bayesian neural networks
      Wir werden das Seminar vornehmlich auf Englisch durchführen, natürlich können Sie Fragen auch auf Deutsch stellen.

    • 19337517 Seminar/Proseminar
      Seminar/Proseminar: Time Series Learning (Manuel Heurich)
      Zeit: Mo 10:00-12:00 (Erster Termin: 14.04.2025)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)

      Kommentar

      This seminar focuses on Machine Learning approaches that specialize in sequential data. Most real-world data is acquired over time. Moreover, most of the available data is not image data. We will discuss works before the Transformer era (e.g., RNNs, LSTMs) and highlight their strengths and weaknesses outside the Computer Vision domain. More recently, transformer-based approaches have outperformed earlier methods. We selectively pick works that highlight their strength in knowledge discovery on sequential data. With the strong trend towards powerful multi-modal models, the seminar aims to introduce state-of-the-art methods to produce robust embeddings based on Time Series data.

    • 19405211 Seminar
      Seminar zu Complex Systems in Bioinformatics (Martin Vingron, Max von Kleist, Jana Wolf)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A3/SR 119 (Arnimallee 3-5)
    • 19406411 Seminar
      Journal Club: Public Health Data Science (Max von Kleist)
      Zeit: Time: Wedneysday 10:00am First occasion: 23.April Last occasion: 23.July
      Ort: Meeting link: https://rki.webex.com/rki/j.php?MTID=mab87f7d0fb44ca448f53d4a69c179d77

      Kommentar

      In diesem Seminar werden aktuelle Forschungsarbeiten im Bereich der datengetriebenen public health Forschung, sowie die Fortschrittsberichte der PhD-Student*inn*en und Post-Docs vorgestellt. Master-Student*inn*en stellen entweder einen ihnen zugewiesenen Zeitschriftenartikel oder ihre Masterarbeit vor oder sie berichten über ihr Forschungspraktikum. Credits werden nur für die Präsentation von Artikeln vergeben.

      Online-Veranstaltung

      Meeting link: https://rki.webex.com/rki/j.php?MTID=mab87f7d0fb44ca448f53d4a69c179d77 Time: Wedneysday 10:00am   First occasion: 23.April Last occasion: 23.July

    • 60103311 Seminar
      Spatial Sequencing Analysis (Journal Club) (Christian Conrad)
      Zeit: Fr 10:00-12:00 (Erster Termin: 25.04.2025)
      Ort: A6/SR 009 Seminarraum (Arnimallee 6)

      Kommentar

      See English version

      For question or more information please contact: christian.conrad@bih-charite.de

  • Ausgewählte Themen der Data Science in Life Sciences

    0590bB1.7
    • 19405201 Vorlesung
      Complex Systems in Bioinformatics (Martin Vingron, Max von Kleist, Jana Wolf)
      Zeit: Di 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: A3/SR 120 (Arnimallee 3-5)

      Kommentar

      Die Studierenden haben ein vertieftes Verständnis grundlegender mathematischer und algorithmischer Konzepte im Bereich der Modellierung, Simulation und Analyse von komplexen biologischen Systeme vor dem Hintergrund aktueller Forschungsrichtungen der Systembiologie und Biotechnologie. Sie sind in der Lage, eine gegebene biologische oder medizinische Fragestellung zu analysieren, einen geeigneten Modellierungsansatz auszuwählen, eigenständig eine Problemlösung zu entwickeln sowie die Ergebnisse zu beurteilen und zu kommunizieren.

      Inhalte:

      Es werden vertieft Themen aus folgenden Gebieten behandelt:

      - Netzwerkstrukturanalyse

      - Graphische Modellierung

      - Modellierung biochemischer Netzwerke mit gewöhnlichen Differentialgleichungen

      - Diskrete Modellierung regulatorischer Netzwerke

      - Constraint-basierte Modellierung

      - Stochastische und hybride Modellierung

      Literaturhinweise

      wird in der Veranstaltung bekanntgegeben.

    • 19405202 Übung
      Übung zu Complex Systems in Bioinformatics (Martin Vingron, Max von Kleist, Jana Wolf)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.04.2025)
      Ort: A3/SR 120 (Arnimallee 3-5)
  • Spezielle Aspekte der Data Science Technologies

    0590bB2.3
    • 19304701 Vorlesung
      Robotik (Daniel Göhring)
      Zeit: Mi 12:00-14:00 (Erster Termin: 16.04.2025)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen:

      Interesse an Robotik mit Anwendungen an autonomen Fahrzeugen. Grundwissen in Mathematik, insbesondere Lineare Algebra und Optimisierung. Die Studierenden werden mit einem echten Modellauto im Robotiklabor arbeiten.

      Kommentar

      Inhalt:

      Die Vorlesung gibt eine Einführung in die Robotik. Sie ist in folgende Themenschwerpunkte untergliedert:

      • Bewegungserzeugung und dynamische Regelungsverfahren: Dieser Schwerpunkt beschäftigt sich mit Koordinatensystemen, nichtholonomen Bewegungsmodellen wie Ackermannmodellen (analog zu Automobilen) sowie PID-Reglern.
      • Planungsverfahren: Planung mit Hindernissen, Finden von Pfaden, Dijkstra, A*, Hindernisse im Konfigurationsraum, RRT, lattice planner, Gradientenabstieg, Potenzialfeldmethoden, Splines
      • Localisierung und Mapping: Zustandsabschätzung, Bayesfilter, Odometrie, Partikelfilter, Kalmanfilter, SLAM-Verfahren.
      • Vision und Umgebungswahrnehmung: SIFT, HOG-features, Deformable parts models, hough transform, Spurerkennung, 3d-Punktwolken, RANSAC .

      Nach dieser Vorlesung werden die Studenten in der Lage sein, einfache Algorithmen zur Bewegungserzeugung und Zustandsabschätzung für Roboter zu erzeugen.

      Die VL wird in deutscher Sprache gehalten, Folien und Begleitmaterial sind größtenteils auf Englisch.

       

      Literaturhinweise

      Literatur:


      John J Craig: Introduction to Robotics: Mechanics and Control; Steven LaValle: Planning Algorithms; Sebastian Thrun, Wolfram Burgard, Dieter Fox: Probabilistic Robotics

       

    • 19321101 Vorlesung
      Advanced Data Structures (László Kozma)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Die Schwerpunkte dieser Vorlesung sind Design, Analyse, und Anwendungen von Datenstrukturen.

      (Die Vorlesung wird in der englischen Sprache gehalten. Zusätzliche Details zu den Kursinhalten finden Sie in der englischen Beschreibung.)

       

      Literaturhinweise

      D. E. Knuth, The Art of Computer Programming, Volume 4A: Combinatorial Algorithms, Part 1. (Addison-Wesley, 2011), xv+883pp. ISBN 0-201-03804-8

    • 19327401 Vorlesung
      Bild- und Videocodierung (Heiko Schwarz)
      Zeit: Mo 14:00-16:00 (Erster Termin: 14.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Kommentar

      Die Vorlesung behandelt die wichtigsten Konzepte und Algorithmen, die in modernen Bild- und Videocodierverfahren verwendet werden. Wir werden uns insbesondere auf Techniken konzentrieren, die in aktuellen internationalen Videocodierstandards Anwendung finden.

      In einem kurzen ersten Teil werden zunächst die sogenannten Rohdatenformate eingeführt, welche als Eingangs- und Ausgangsformate von Bild- und Videocodecs verwendet werden. Dieser Teil beinhaltet folgenden Themen:

      • Farbräume und deren Beziehung zur menschlichen Farbwahrnehmung
      • Transfer-Funktionen (Gamma-Codierung)
      • Warum verwenden wir das YCbCr-Format?

      Der zweite Teil der Vorlesung behandelt zunächst die Bildcodierung und umfasst folgende Themen:

      • Der Anfang: Wie funktioniert JPEG?
      • Warum verwenden wir die Diskrete Cosinus-Transformation?
      • Effiziente Codierung von Transformationskoeffizienten
      • Prädiktion von Bildblöcken
      • Adaptive Blockpartitionierung
      • Wie treffen wir Entscheidungen im Encoder?
      • Optimierungen der Quantisierung

      Im dritten und letzten Teil der Vorlesungen behandeln wir Konzept die letztendlich die Videocodierung deutlich effizienter machen als eine separate Codierung der Einzelbilder. Dieser Teil umfasst folgende Themen:

      • Bewegungskompensierte Prädiktion
      • Codierung von Bewegungsvektoren
      • Algorithmen zur Bewegungssuche
      • Subpixel-genaue Bewegungsvektoren und Interpolationsfilter
      • Verwendung mehrere Referenzbilder
      • Was sind B-Bilder und warum verwenden wir diese?
      • Deblocking- und Deringing-Filter
      • Effiziente zeitliche Codierstrukturen

      In den Übungen werden wir schrittweise einen eigenen Codec für Bilder implementieren. Bei entsprechenden Interesse kann dieser zu einem einfachen Videocodec erweitert werden.

       

      Literaturhinweise

      • Bull, D. R., “Communicating Pictures: A Course in Image and Video Coding,” Elsevier, 2014.
      • Ohm, J.-R., “Multimedia Signal Coding and Transmission,” Springer, 2015.
      • Wien, M., “High Efficiency Video Coding — Coding Tools and Specifications,” Springer 2014.
      • Sze, V., Budagavi, M., and Sullivan, G. J. (eds.), “High Efficiency Video Coding (HEVC): Algorithm and Architectures,” Springer, 2014.
      • Wiegand, T. and Schwarz, H., "Source Coding: Part I of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, Now Publishers, vol. 4, no. 1–2, 2011.
      • Schwarz, H. and Wiegand, T., “Video Coding: Part II of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, Now Publishers, vol. 10, no. 1–3, 2016.

    • 19333101 Vorlesung
      Cybersecurity and AI II: Erklärbarkeit (Gerhard Wunder)
      Zeit: Mo 12:00-14:00, Di 10:00-12:00, Fr 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: 1.3.21 Seminarraum T1 (Arnimallee 14)
    • 19336901 Vorlesung
      Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)

      Kommentar

      Die Vorlesung über fortgeschrittene Datenvisualisierung für künstliche Intelligenz ist eine umfassende Erkundung der modernsten Techniken und Tools zur Erstellung und Validierung komplexer Visualisierungen für die Vermittlung von Dateneinblicken und Geschichten, mit einem besonderen Schwerpunkt auf Anwendungen in der Verarbeitung natürlicher Sprache (NLP) und erklärbarer KI. Der Vortrag führt die Teilnehmer in das verschachtelte Modell der Visualisierung ein, das vier Ebenen umfasst: Charakterisierung der Aufgabe und der Daten, Abstrahierung in Operationen und Datentypen, Entwurf visueller Kodierungs- und Interaktionstechniken und Erstellung von Algorithmen zur effizienten Ausführung von Techniken. Dieses Modell dient als Rahmen für den Entwurf und die Validierung von Datenvisualisierungen.

      Darüber hinaus wird in der Vorlesung die Anwendung der Datenvisualisierung im Bereich NLP behandelt, wobei der Schwerpunkt auf der Visualisierung von Worteinbettungen und Sprachmodellen liegt, um die Erforschung semantischer Beziehungen zwischen Wörtern und die Interpretation des Verhaltens von Sprachmodellen zu unterstützen. Im Kontext von Explainable AI liegt der Schwerpunkt auf der Verwendung von Visualisierungen zur Erklärung von Modellvorhersagen und der Bedeutung von Merkmalen, wodurch die Interpretierbarkeit von KI-Modellen verbessert wird. Durch die Nutzung des verschachtelten Modells der Visualisierung und die Fokussierung auf NLP und erklärbare KI zielt der Vortrag darauf ab, die Teilnehmer mit den wesentlichen Fähigkeiten auszustatten, um fortschrittliche Datenvisualisierungen zu entwerfen und zu validieren, die auf diese spezifischen Anwendungen zugeschnitten sind. So können sie letztendlich komplexe Datenmuster effektiv kommunizieren und tiefere Einsichten aus ihren Daten gewinnen.

    • 19337401 Vorlesung
      Elliptic Curve Cryptography (Marian Margraf)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)
    • 19304702 Übung
      Übung zu Robotik (Daniel Göhring)
      Zeit: Do 12:00-14:00 (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)
    • 19321102 Übung
      Übung zu Advanced Data Structures (N.N.)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      Übungen

    • 19327402 Übung
      Übung zu Bild- und Videocodierung (Heiko Schwarz)
      Zeit: Mo 12:00-14:00 (Erster Termin: 14.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)
    • 19333102 Übung
      Übung zu Cybersecurity and AI II (Gerhard Wunder)
      Zeit: Mo 14:00-16:00 (Erster Termin: 28.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 19336902 Übung
      Ü: Advanced Data Visualization for Artificial Intelligence (Georges Hattab)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)
    • 19337402 Übung
      Übung zu Elliptic Curve Cryptography (Marian Margraf)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.04.2025)
      Ort: T9/K40 Multimediaraum (Takustr. 9)
  • Aktuelle Forschungsthemen der Data Science Technologies

    0590bB2.4
    • 19321101 Vorlesung
      Advanced Data Structures (László Kozma)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A3/ 024 Seminarraum (Arnimallee 3-5)

      Kommentar

      Die Schwerpunkte dieser Vorlesung sind Design, Analyse, und Anwendungen von Datenstrukturen.

      (Die Vorlesung wird in der englischen Sprache gehalten. Zusätzliche Details zu den Kursinhalten finden Sie in der englischen Beschreibung.)

       

      Literaturhinweise

      D. E. Knuth, The Art of Computer Programming, Volume 4A: Combinatorial Algorithms, Part 1. (Addison-Wesley, 2011), xv+883pp. ISBN 0-201-03804-8

    • 19325301 Vorlesung
      Cluster Computing (Barry Linnert)
      Zeit: Di 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe

      • MSc

      Anforderungen

      • Erfahrung mit Computern und Software sowie Programierkenntnisse

      Sprache

      • Die Kurssprache ist Deutsch (oder Englisch wenn benötigt).
      • The exam will be formulated in German, but answers may be given in English, too.

      Credits & Klausur

      • aktive Teilnahme an den Übungen: regelmäßige Vorbereitung von Übungsaufgaben & Präsentation der Ergebnisse in den Übungen
      • Bestehen der Klausur

      Webseite

      https://www.mi.fu-berlin.de/w/SE/VorlesungClusterComputing

      Kommentar

      Cluster-Computer bilden die zur Zeit vorherrschende Klasse paralleler Hochleistungsrechner. Sie bestehen aus konventionellen Prozessorknoten, die über ein Hochgeschwindig­keitsnetzwerk miteinander verbunden sind. Obwohl meistens räumlich integriert, handelt es sich um verteilte Systeme mit jeweils lokalen Betriebssystemen. Das enorme Leistungspotential dieser Rechnerklasse kann nur ausgeschöpft werden, wenn Programmcode und Daten optimal über die Knoten verteilt werden. Die einge­setzten Verfahren müssen insbesondere skalierbar sein, also auch bei Tausenden von Rechnerknoten noch effizient arbeiten. Gleichzeitig soll aber die Programmiererin bzw. der Programmierer von diesen Aufgaben entlastet werden. Die Vorlesung gibt einen Überblick über die auftretenden Probleme und stellt Algorithmen zu ihrer Lösung vor.

      Literaturhinweise

      • Heiss, H.-U.: Prozessorzuteilung in Parallelrechnern, BI-Verlag, Mannheim, 1996
      • Andrews, G. A.: Foundations of Multithreaded, Parallel and Distributed Programming, Addison-Wesley, 2000
      • Pfister, G.: In Search of Clusters 2nd ed., Prentice Hall, 1998
      • Zomaya, A.: Parallel and distributed computing handbook, McGraw Gill, 1995
      • Buyya, R.: High Performance Cluster Computing, Vol. 1+2, Prentice Hall, 1999

    • 19327401 Vorlesung
      Bild- und Videocodierung (Heiko Schwarz)
      Zeit: Mo 14:00-16:00 (Erster Termin: 14.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Kommentar

      Die Vorlesung behandelt die wichtigsten Konzepte und Algorithmen, die in modernen Bild- und Videocodierverfahren verwendet werden. Wir werden uns insbesondere auf Techniken konzentrieren, die in aktuellen internationalen Videocodierstandards Anwendung finden.

      In einem kurzen ersten Teil werden zunächst die sogenannten Rohdatenformate eingeführt, welche als Eingangs- und Ausgangsformate von Bild- und Videocodecs verwendet werden. Dieser Teil beinhaltet folgenden Themen:

      • Farbräume und deren Beziehung zur menschlichen Farbwahrnehmung
      • Transfer-Funktionen (Gamma-Codierung)
      • Warum verwenden wir das YCbCr-Format?

      Der zweite Teil der Vorlesung behandelt zunächst die Bildcodierung und umfasst folgende Themen:

      • Der Anfang: Wie funktioniert JPEG?
      • Warum verwenden wir die Diskrete Cosinus-Transformation?
      • Effiziente Codierung von Transformationskoeffizienten
      • Prädiktion von Bildblöcken
      • Adaptive Blockpartitionierung
      • Wie treffen wir Entscheidungen im Encoder?
      • Optimierungen der Quantisierung

      Im dritten und letzten Teil der Vorlesungen behandeln wir Konzept die letztendlich die Videocodierung deutlich effizienter machen als eine separate Codierung der Einzelbilder. Dieser Teil umfasst folgende Themen:

      • Bewegungskompensierte Prädiktion
      • Codierung von Bewegungsvektoren
      • Algorithmen zur Bewegungssuche
      • Subpixel-genaue Bewegungsvektoren und Interpolationsfilter
      • Verwendung mehrere Referenzbilder
      • Was sind B-Bilder und warum verwenden wir diese?
      • Deblocking- und Deringing-Filter
      • Effiziente zeitliche Codierstrukturen

      In den Übungen werden wir schrittweise einen eigenen Codec für Bilder implementieren. Bei entsprechenden Interesse kann dieser zu einem einfachen Videocodec erweitert werden.

       

      Literaturhinweise

      • Bull, D. R., “Communicating Pictures: A Course in Image and Video Coding,” Elsevier, 2014.
      • Ohm, J.-R., “Multimedia Signal Coding and Transmission,” Springer, 2015.
      • Wien, M., “High Efficiency Video Coding — Coding Tools and Specifications,” Springer 2014.
      • Sze, V., Budagavi, M., and Sullivan, G. J. (eds.), “High Efficiency Video Coding (HEVC): Algorithm and Architectures,” Springer, 2014.
      • Wiegand, T. and Schwarz, H., "Source Coding: Part I of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, Now Publishers, vol. 4, no. 1–2, 2011.
      • Schwarz, H. and Wiegand, T., “Video Coding: Part II of Fundamentals of Source and Video Coding,” Foundations and Trends in Signal Processing, Now Publishers, vol. 10, no. 1–3, 2016.

    • 19333101 Vorlesung
      Cybersecurity and AI II: Erklärbarkeit (Gerhard Wunder)
      Zeit: Mo 12:00-14:00, Di 10:00-12:00, Fr 12:00-14:00 (Erster Termin: 15.04.2025)
      Ort: 1.3.21 Seminarraum T1 (Arnimallee 14)
    • 19337401 Vorlesung
      Elliptic Curve Cryptography (Marian Margraf)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: T9/SR 005 Übungsraum (Takustr. 9)
    • 19321102 Übung
      Übung zu Advanced Data Structures (N.N.)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A3/019 Seminarraum (Arnimallee 3-5)

      Kommentar

      Übungen

    • 19325302 Übung
      Übung zu Cluster Computing (Barry Linnert)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: T9/K44 Rechnerpoolraum (Takustr. 9)
    • 19327402 Übung
      Übung zu Bild- und Videocodierung (Heiko Schwarz)
      Zeit: Mo 12:00-14:00 (Erster Termin: 14.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)
    • 19333102 Übung
      Übung zu Cybersecurity and AI II (Gerhard Wunder)
      Zeit: Mo 14:00-16:00 (Erster Termin: 28.04.2025)
      Ort: A6/SR 032 Seminarraum (Arnimallee 6)
    • 19337402 Übung
      Übung zu Elliptic Curve Cryptography (Marian Margraf)
      Zeit: Do 14:00-16:00 (Erster Termin: 17.04.2025)
      Ort: T9/K40 Multimediaraum (Takustr. 9)
  • Ausgewählte Themen der Data Science Technologies A

    0590bB2.5
    • 19315401 Vorlesung
      Multiplicative Weights - A Popular Algorithmic Technique with Countless Applications (Wolfgang Mulzer)
      Zeit: Di 14:00-16:00, Fr 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Kommentar

      Just like greedy algorithms, dynamic programming, or divide-and-conquer, the multiplicative weights method is a fundamental algorithmic technique with countless applications across disciplines. However, it is taught only rarely in basic classes.



      In this class, we will study the multiplicative weights method in detail. We will learn about the basic technique and its variations, explore connections to other fields such as online convex optimization and machine learning, and see the beautiful mathematics that lies behind it.



      We will also see many applications of the technique, with examples from combinatorial optimization, machine learning, algorithmic game theory, computational geometry, information theory, online algorithms, and many more. For some of the applications, we will have invited speakers who have applied the technique in their respective fields.



      The class is jointly attended by students at Sorbonne Paris Nord in Paris and will be given in a hybrid format.



      The course website can be found here: https://www.inf.fu-berlin.de/lehre/SS25/mwu/


      Literaturhinweise

      Wird noch bekannt gegeben.

    • 19326601 Vorlesung
      Markovketten (Katinka Wolter)
      Zeit: Di 12:00-14:00, Do 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Kommentar

      Dieser Kurs wird auf englisch gehalten.

      Wir beschäftigen uns mit den grundlegenden stochastischen Modellen, die zur Untersuchung der Leistung von Computersystemen häufig benutzt werden. Markov modelle und Warteschlangen werden gerne für die Untersuchung dynamischer Systeme verwendet, z.B. Computer Hardware, Kommunicationsprotokolle, biologische Systeme, Epidemien, Verkehr und digitale Währungen.  Wir werden uns einen raschen Überblick verschaffen.  Betrachtete Themen sind der Geburts- und Todesprozess, der Poissonprozess, verallgemeinerte Markov und semi-Markov prozesse sowie deren Lösungsmethoden. Soweit die Zeit es erlaubt werden wir auch die Hintergründe der diskreten Ereignissimulation ansehen.

      Literaturhinweise

      William Stewart. Probability, Markov Chains, Queues and Simulation. Princeton University Press 2009.

    • 19315402 Übung
      Übung zu Multiplicative Weights (Michaela Krüger)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)
    • 19326602 Übung
      Übung zu Markovketten (Justus Purat)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)
  • Ausgewählte Themen der Data Science Technologies B

    0590bB2.6
    • 19315401 Vorlesung
      Multiplicative Weights - A Popular Algorithmic Technique with Countless Applications (Wolfgang Mulzer)
      Zeit: Di 14:00-16:00, Fr 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/055 Seminarraum (Takustr. 9)

      Kommentar

      Just like greedy algorithms, dynamic programming, or divide-and-conquer, the multiplicative weights method is a fundamental algorithmic technique with countless applications across disciplines. However, it is taught only rarely in basic classes.



      In this class, we will study the multiplicative weights method in detail. We will learn about the basic technique and its variations, explore connections to other fields such as online convex optimization and machine learning, and see the beautiful mathematics that lies behind it.



      We will also see many applications of the technique, with examples from combinatorial optimization, machine learning, algorithmic game theory, computational geometry, information theory, online algorithms, and many more. For some of the applications, we will have invited speakers who have applied the technique in their respective fields.



      The class is jointly attended by students at Sorbonne Paris Nord in Paris and will be given in a hybrid format.



      The course website can be found here: https://www.inf.fu-berlin.de/lehre/SS25/mwu/


      Literaturhinweise

      Wird noch bekannt gegeben.

    • 19326601 Vorlesung
      Markovketten (Katinka Wolter)
      Zeit: Di 12:00-14:00, Do 10:00-12:00 (Erster Termin: 15.04.2025)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Kommentar

      Dieser Kurs wird auf englisch gehalten.

      Wir beschäftigen uns mit den grundlegenden stochastischen Modellen, die zur Untersuchung der Leistung von Computersystemen häufig benutzt werden. Markov modelle und Warteschlangen werden gerne für die Untersuchung dynamischer Systeme verwendet, z.B. Computer Hardware, Kommunicationsprotokolle, biologische Systeme, Epidemien, Verkehr und digitale Währungen.  Wir werden uns einen raschen Überblick verschaffen.  Betrachtete Themen sind der Geburts- und Todesprozess, der Poissonprozess, verallgemeinerte Markov und semi-Markov prozesse sowie deren Lösungsmethoden. Soweit die Zeit es erlaubt werden wir auch die Hintergründe der diskreten Ereignissimulation ansehen.

      Literaturhinweise

      William Stewart. Probability, Markov Chains, Queues and Simulation. Princeton University Press 2009.

    • 19315402 Übung
      Übung zu Multiplicative Weights (Michaela Krüger)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)
    • 19326602 Übung
      Übung zu Markovketten (Justus Purat)
      Zeit: Di 14:00-16:00 (Erster Termin: 15.04.2025)
      Ort: A6/SR 007/008 Seminarraum (Arnimallee 6)
  • Masterseminar in Data Science Technologies

    0590bB2.7
    • 19303811 Seminar
      Projektseminar: Datenverwaltung (Muhammed-Ugur Karagülle)
      Zeit: Do 12:00-14:00 (Erster Termin: 17.04.2025)
      Ort: T9/137 Konferenzraum (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Voraussetzungen

      • ALP I
      • ALP II
      • Datenbanksysteme

      Kommentar

      Inhalt

      Ein Projektseminar dient als Vorbereitung für eine Bachelor- oder Masterarbeit in der AGDB. Im Rahmen des Projektseminars beschäftigen wir uns mit der Analyse und Visualisierung medizinischer Daten. Studierende lernen in einem iterativen Verfahren das Verfassen von wissenschaftlichen Dokumenten. Zusätzlich werden wir ein kleines praktisches Projekt realisieren.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19306711 Seminar
      Seminar über Algorithmen (László Kozma)
      Zeit: Do 14:00-16:00, zusätzliche Termine siehe LV-Details (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Fortgeschrittene Themen des Algorithmenentwurfs mit wechselnden Schwerpunkten.

      Im Sommersemester 2025: Neue Ergebnisse bei Algorithmen für kürzeste Wege.

      Zielgruppe

      Master-Studierende der Informatik oder Mathematik

      Empfohlene Vorkenntnisse

      Vorlesung "Höhere Algorithmik" oder vergleichbare Veranstaltung

       

      Literaturhinweise

      Spezialliteratur aus Zeitschriften

    • 19310817 Seminar/Proseminar
      Seminar/Proseminar: High Performance and Cloud Computing (Barry Linnert)
      Zeit: Di 12:00-14:00 (Erster Termin: 22.04.2025)
      Ort: T9/K40 Multimediaraum (Takustr. 9)

      Kommentar

      Wenn es darum geht, komplexe Anwendungen oder große Datenmengen in einem angemessenen Zeitrahmen zu verarbeiten, ist der Einsatz von parallelen Programmen unumgänglich. Diese können jedoch sowohl auf Grund des spezifischen Anwendungsrahmens oder der technischen Umgebungen sehr unterschiedlich ausfallen. So kommen im High Performance Computing (HPC) Supercomputer zum Einsatz, die Anwendungen mit einem hohen Maß an Interaktion unterstützen, während beim Cloud Computing ein Schwerpunkt auf die Bereitstellung von Daten und Rechenkapazität bei Bedarf (on demand) gelegt wird.

      Beide Anwendungsbereiche haben Herausforderungen sowohl auf Ebene der Programmierung als auch bei der Verwaltung der entsprechenden Systeme.

      Im Seminar wollen wir uns im Rahmen dieses Spektrums jeweils einem Aspekt widmen, und die aktuelle Forschung hierzu zusammenfassen und bewerten.

       

      Weitere Informationen zum Ablauf werden beim ersten Termin am 22.04.2025 bereitgestellt.

    • 19328217 Seminar/Proseminar
      Seminar/Proseminar: New Trends in Information Systems (Agnès Voisard)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: A3/SR 119 (Arnimallee 3-5)

      Kommentar

      Ziel dieses Seminars ist es, aktuelle Trends im Datenmanagement zu untersuchen. Wir werden uns unter anderem mit zwei aufstrebenden Themen beschäftigen: Location Based Services (LBS) und Event-Based Services (EBS).

      Event-Based Systems (EBS) sind Teil vieler aktueller Anwendungen wie Überwachung von Geschäftsaktivitäten, Börsenticker, Facility Management, Datenstreaming oder Sicherheit. In den vergangenen Jahren hat das Thema sowohl in der Industrie als auch in der Wissenschaft zunehmend an Bedeutung gewonnen. Aktuelle Forschungsschwerpunkte konzentrieren sich auf verschiedene Aspekte, die von Ereigniserfassung (eingehende Daten) bis zur Auslösung von Reaktionen reichen. Dieses Seminar zielt darauf ab, einige der aktuellen Trends in Event-basierten Systemen mit einem starken Fokus auf Modelle und Design zu studieren. Ortsbasierte Dienste sind heutzutage oft Teil des täglichen Lebens durch Anwendungen wie Navigationsassistenten im öffentlichen oder privaten Transportbereich. Die zugrundeliegende Technologie befasst sich mit vielen verschiedenen Aspekten, z. B. Standortbestimmung, Informationsabruf oder Datenschutz. In jüngerer Zeit wurden Aspekte wie der Benutzerkontext und Präferenzen berücksichtigt, um den Benutzern mehr personalisierte Informationen zu senden.

      Ein solider Hintergrund in Datenbanken ist erforderlich, typischerweise ein Datenbankkurs auf Bachelor-Niveau.

      Literaturhinweise

      Wird bekannt gegeben.

    • 19333311 Seminar
      Seminar: Continual Learning (Manuel Heurich)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)

      Kommentar

      This seminar focuses on recent advances in ‘Continual Learning’, an increasingly important field within machine learning. Continual Learning tackles the problem of drifting data in input space and changes between input and target distribution. Static models drop significantly in performance when data distributions are subject to change over time. We will cover recent approaches that tackle this problem from different angles.

    • 19334617 Seminar/Proseminar
      Seminar/Proseminar: How to Startup (Tim Landgraf)
      Zeit: Mi 10:00-12:00 (Erster Termin: 16.04.2025)
      Ort: T9/046 Seminarraum (Takustr. 9)

      Kommentar

      Dieses Seminar beleuchtet die facettenreiche Welt von Startups und vermittelt den Studierenden ein umfassendes Verständnis dafür, was es braucht, um in einer dynamischen und wettbewerbsorientierten Umgebung erfolgreich zu sein. Behandelt werden Themen wie Teamzusammensetzung, Marktanalyse, Investmentlogik, aktuelle Trends (wie KI) und typische Fehler, die Startups machen.

      Im Gegensatz zu traditionellen Seminaren liegt der Fokus dieses Kurses auf der praktischen Auseinandersetzung mit dem Thema. Die Studierenden bereiten prägnante "Impulsvorträge" (kurze, 15-minütige Präsentationen) zu spezifischen startup-relevanten Themen vor. Diese Präsentationen basieren auf einer Vielzahl von Quellen, darunter:

      * Webrecherche: Sammlung von Erkenntnissen aus Branchenberichten, Blogs und Artikeln.
      * Interviews: Gespräche mit echten Startups, um aus erster Hand Wissen und Perspektiven zu gewinnen.
      * Trendanalyse: Untersuchung aktueller Innovationen und Umbrüche im Startup-Ökosystem.


      Jeder Vortrag dient als Ausgangspunkt für eine interaktive Diskussion, die ein tieferes Verständnis und vielfältige Perspektiven unter den Teilnehmern fördert.

      Dieses Seminar richtet sich an Studierende, die neugierig auf Unternehmertum sind und erkunden möchten, wie Startups in der heutigen schnelllebigen Welt arbeiten, wachsen und Herausforderungen meistern.

       

    • 19337517 Seminar/Proseminar
      Seminar/Proseminar: Time Series Learning (Manuel Heurich)
      Zeit: Mo 10:00-12:00 (Erster Termin: 14.04.2025)
      Ort: A7/SR 140 Seminarraum (Hinterhaus) (Arnimallee 7)

      Kommentar

      This seminar focuses on Machine Learning approaches that specialize in sequential data. Most real-world data is acquired over time. Moreover, most of the available data is not image data. We will discuss works before the Transformer era (e.g., RNNs, LSTMs) and highlight their strengths and weaknesses outside the Computer Vision domain. More recently, transformer-based approaches have outperformed earlier methods. We selectively pick works that highlight their strength in knowledge discovery on sequential data. With the strong trend towards powerful multi-modal models, the seminar aims to introduce state-of-the-art methods to produce robust embeddings based on Time Series data.

  • Softwareprojekt Data Science B

    0590bB2.8
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (Mahmoud Elashmawi)
      Zeit: Do 08:30-10:00 (Erster Termin: 10.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Mi 12:00-14:00 (Erster Termin: 16.04.2025)
      Ort: T9/K63 Hardwarepraktikum (Takustr. 9)
    • 19334212 Projektseminar
      Softwareprojekt: Maschinelles Lernen und Erklärbarkeit für verbesserte (Krebs-)behandlung (Pauline Hiort)
      Zeit: Di 15:00-17:00, zusätzliche Termine siehe LV-Details (Erster Termin: 26.02.2025)
      Ort: T9/K40 Multimediaraum (Takustr. 9)

      Kommentar

      Im Softwareprojekt werden wir verschiedene Machine-Learning (ML)-Methoden implementieren, trainieren und evaluieren. Der Fokus im Projekt liegt auf neuronalen Netzen (NN) und ihrer Erklärbarkeit. Die Methoden werden wir mit verschiedenen Baseline-Modellen, zum Beispiel Regressionsmodellen, vergleichen. Verschiedene ML-Methoden werden auf einen spezifischen Datensatz, z.B. zur Vorhersage von Medikamentenkombinationen gegen Krebserkrankungen, angewendet und ausgewertet. Der Datensatz wird von uns vorbereitet und mit den implementierten Methoden analysiert. Zusätzlich legen wir einen Fokus auf Erklärbarkeit, um sicherzustellen, dass die Vorhersagen der ML-Modelle nachvollziehbar und interpretierbar sind. Dazu werden wir geeignete Techniken zur Erklärbarkeit von Modellen integrieren, um die Entscheidungsgrundlagen der Modelle besser zu verstehen und visualisieren zu können.

      Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, and PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt und kann auch auf Englisch durchgeführt werden.

    • 19337112 Projektseminar
      Softwareprojekt: Chat, Search and Summaries: Smarter Apps with LLMs (Tim Landgraf)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      In diesem praxisorientierten Projektkurs tauchen die Studierenden in die Welt der Large Language Models (LLMs) ein, um intelligente Anwendungen zu entwerfen und zu entwickeln. In Teams von 2-3 Personen nehmen die Teilnehmenden die Herausforderung an, Anwendungen zu erstellen, die LLMs für Aufgaben wie die intelligente Dokumentensuche, dynamische Nutzerinteraktionen und Inhaltszusammenfassungen nutzen.

      Der Kurs erstreckt sich über zwei Monate kontinuierlicher Entwicklungsarbeit und bietet eine umfassende Einführung in die Softwareentwicklung. Während LLMs den Kern jedes Projekts bilden, liegt der Schwerpunkt darauf, deren Funktionen durch folgende Aspekte zu integrieren und zu erweitern:

      * Front-End-Entwicklung: Gestaltung intuitiver Benutzeroberflächen zur Interaktion mit dem LLM-gestützten Backend.
      * Back-End-Entwicklung: Architektur robuster Systeme zur Verwaltung von APIs, Datenbanken und Anwendungslogik.
      * API-Design und Integration: Nahtlose Verbindung von LLMs mit externen Systemen, um einen effizienten Datenfluss und Echtzeitverarbeitung zu gewährleisten.
      * Skalierbarkeit und Deployment: Beachtung von Performance- und Hosting-Aspekten, um die Anwendungen für den Einsatz in der realen Welt vorzubereiten.

      Im Laufe des Kurses arbeiten die Studierenden in kollaborativen Design- und Entwicklungszyklen, erhalten regelmäßiges Feedback und optimieren ihre Projekte iterativ. Am Ende des Kurses präsentieren die Teams eine vollständig funktionale Anwendung und haben ein fundiertes Verständnis dafür, wie LLMs moderne Softwarelösungen revolutionieren können.

      Dieser Kurs richtet sich an Studierende, die ihre Fähigkeiten in der Entwicklung innovativer Software erweitern und gleichzeitig das Potenzial von LLMs erkunden möchten.

       

  • Datenbanksysteme Data Science

    0590bB2.9
    • 19301501 Vorlesung
      Datenbanksysteme (Agnès Voisard)
      Zeit: Di 14:00-16:00, Do 14:00-16:00, zusätzliche Termine siehe LV-Details (Erster Termin: 15.04.2025)
      Ort: T9/Gr. Hörsaal (Takustr. 9)

      Zusätzl. Angaben / Voraussetzungen

      Zielgruppe

      • Pflichtmodul im Bachelorstudiengang Informatik
      • Pflichtmodul im lehramtsbezogenen Bachelorstudiengang mit Kernfach Informatik und Ziel: Großer Master
      • Studierende im lehramtsbezogenen Masterstudiengang (Großer Master mit Zeitfach Informatik) können dieses Modul zusammen mit dem "Praktikum DBS" absolvieren
      • Wahlpflichtmodul im Nebenfach Informatik

      Voraussetzungen

      • ALP 1 - Funktionale Programmierung
      • ALP 2 - Objektorientierte Programmierung
      • ALP 3 - Datenstrukturen und Datenabstraktion
      • ODER Informatik B

      Kommentar

      Inhalt

      Datenbankentwurf mit ERM/ERDD. Theoretische Grundlagen relationaler Datenbanksysteme: Relationale Algebra, Funktionale Abhängigkeiten, Normalformen. Relationale Datenbankentwicklung: SQL Datendefinition, Fremdschlüssel und andere Integritätsbedingungen. SQL als applikative Sprache: wesentliche Sprachelemente, Einbettung in Programmiersprachen, Anwendungsprogrammierung; objekt-relationale Abbildung. Transaktionsbegriff, transaktionale Garantien, Synchronisation des Mehrbenutzerbetriebs, Fehlertoleranzeigenschaften. Anwendungen und neue Entwicklungen: Data Warehousing, Data Mining, OLAP.

      Projekt: im begleitenden Projekt werden die Themen praktisch vertieft.

      Literaturhinweise

      • Alfons Kemper, Andre Eickler: Datenbanksysteme - Eine Einführung, 5. Auflage, Oldenbourg 2004
      • R. Elmasri, S. Navathe: Grundlagen von Datenbanksystemen, Pearson Studium, 2005

    • 19301502 Übung
      Übung zu Datenbanksysteme (Muhammed-Ugur Karagülle)
      Zeit: Mo 12:00-14:00, Mo 14:00-16:00, Mo 16:00-18:00, Di 08:00-10:00, Di 10:00-12:00, Di 12:00-14:00, Mi 10:00-12:00, Mi 12:00-14:00, Mi 14:00-16:00, Do 08:00-10:00, Do 10:00-12:00, Do 12:00-14:00, Do 16:00-18:00, Fr 10:00-12:00, Fr 14:00-16:00, Fr 16:00-18:00 (Erster Termin: 14.04.2025)
      Ort: T9/SR 006 Seminarraum (Takustr. 9)
  • Softwareprojekt Data Science A

    0590bB2.1
    • 19308312 Projektseminar
      Softwareprojekt: Anwendungen von Algorithmen (Mahmoud Elashmawi)
      Zeit: Do 08:30-10:00 (Erster Termin: 10.04.2025)
      Ort: T9/053 Seminarraum (Takustr. 9)

      Kommentar

      Inhalt

      Ein typisches Anwendungsgebiet von Algorithmen wird ausgewählt und softwaretechnisch behandelt. In diesem Semester soll es um Algorithmen zum Graphenzeichnen gehen. Das Ziel ist es, Programme zur Herstellung guter Zeichnungen zu schreiben und damit an dem Zeichenwettbewerb teilzunehmen, der im September im Zusammenhang mit der internationalen Konferenz über Graph Drawing and Network Visualization stattfindet.

      Voraussetzungen

      Grundkenntnisse in Entwurf und Analyse von Algorithmen

      Literaturhinweise

      je nach Anwendungsgebiet

    • 19314012 Projektseminar
      Softwareprojekt: Semantische Technologien (Adrian Paschke)
      Zeit: Mi 14:00-16:00 (Erster Termin: 16.04.2025)
      Ort: A7/SR 031 (Arnimallee 7)

      Zusätzl. Angaben / Voraussetzungen

      Weitere Informationen finden sich auf der Veranstaltungsseite.

      Kommentar

      Im Rahmen des Softwareprojekts werden gemischte Gruppen von Bachelor- und Master-Studenten gebildet, die entweder ein eigenständiges Projekt erstellen oder aber ein Teil eines größeren Projektes im Bereich semantischer Technologien übernehmen. Bei der Umsetzung der Aufgaben werden vertiefte Programmierkenntnisse in der Anwendung semantischer Technologien und künstlicher Intelligenz im Corporate Semantic Web erworben, Projektmanagement und Teamfähigkeit gefördert, sowie Praktiken der guten Software-Entwicklung großer verteilter Systeme und Semantic Web Anwendungen geübt. Das Softwareprojekt kann in Zusammenarbeit mit einem externen Partner aus der Industrie oder Standardisierung durchgeführt werden. Die Fortführung des Projektes als Bachelor- oder Masterarbeit ist möglich und ausdrücklich erwünscht.

      Literaturhinweise

      Corporate Semantic Web

    • 19315312 Projektseminar
      Softwareprojekt: Verteilte Systeme (Justus Purat)
      Zeit: Mi 12:00-14:00 (Erster Termin: 16.04.2025)
      Ort: T9/K63 Hardwarepraktikum (Takustr. 9)
    • 19334212 Projektseminar
      Softwareprojekt: Maschinelles Lernen und Erklärbarkeit für verbesserte (Krebs-)behandlung (Pauline Hiort)
      Zeit: Di 15:00-17:00, zusätzliche Termine siehe LV-Details (Erster Termin: 26.02.2025)
      Ort: T9/K40 Multimediaraum (Takustr. 9)

      Kommentar

      Im Softwareprojekt werden wir verschiedene Machine-Learning (ML)-Methoden implementieren, trainieren und evaluieren. Der Fokus im Projekt liegt auf neuronalen Netzen (NN) und ihrer Erklärbarkeit. Die Methoden werden wir mit verschiedenen Baseline-Modellen, zum Beispiel Regressionsmodellen, vergleichen. Verschiedene ML-Methoden werden auf einen spezifischen Datensatz, z.B. zur Vorhersage von Medikamentenkombinationen gegen Krebserkrankungen, angewendet und ausgewertet. Der Datensatz wird von uns vorbereitet und mit den implementierten Methoden analysiert. Zusätzlich legen wir einen Fokus auf Erklärbarkeit, um sicherzustellen, dass die Vorhersagen der ML-Modelle nachvollziehbar und interpretierbar sind. Dazu werden wir geeignete Techniken zur Erklärbarkeit von Modellen integrieren, um die Entscheidungsgrundlagen der Modelle besser zu verstehen und visualisieren zu können.

      Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, and PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt und kann auch auf Englisch durchgeführt werden.

    • 19337112 Projektseminar
      Softwareprojekt: Chat, Search and Summaries: Smarter Apps with LLMs (Tim Landgraf)
      Zeit: Do 10:00-12:00 (Erster Termin: 17.04.2025)
      Ort: T9/049 Seminarraum (Takustr. 9)

      Kommentar

      In diesem praxisorientierten Projektkurs tauchen die Studierenden in die Welt der Large Language Models (LLMs) ein, um intelligente Anwendungen zu entwerfen und zu entwickeln. In Teams von 2-3 Personen nehmen die Teilnehmenden die Herausforderung an, Anwendungen zu erstellen, die LLMs für Aufgaben wie die intelligente Dokumentensuche, dynamische Nutzerinteraktionen und Inhaltszusammenfassungen nutzen.

      Der Kurs erstreckt sich über zwei Monate kontinuierlicher Entwicklungsarbeit und bietet eine umfassende Einführung in die Softwareentwicklung. Während LLMs den Kern jedes Projekts bilden, liegt der Schwerpunkt darauf, deren Funktionen durch folgende Aspekte zu integrieren und zu erweitern:

      * Front-End-Entwicklung: Gestaltung intuitiver Benutzeroberflächen zur Interaktion mit dem LLM-gestützten Backend.
      * Back-End-Entwicklung: Architektur robuster Systeme zur Verwaltung von APIs, Datenbanken und Anwendungslogik.
      * API-Design und Integration: Nahtlose Verbindung von LLMs mit externen Systemen, um einen effizienten Datenfluss und Echtzeitverarbeitung zu gewährleisten.
      * Skalierbarkeit und Deployment: Beachtung von Performance- und Hosting-Aspekten, um die Anwendungen für den Einsatz in der realen Welt vorzubereiten.

      Im Laufe des Kurses arbeiten die Studierenden in kollaborativen Design- und Entwicklungszyklen, erhalten regelmäßiges Feedback und optimieren ihre Projekte iterativ. Am Ende des Kurses präsentieren die Teams eine vollständig funktionale Anwendung und haben ein fundiertes Verständnis dafür, wie LLMs moderne Softwarelösungen revolutionieren können.

      Dieser Kurs richtet sich an Studierende, die ihre Fähigkeiten in der Entwicklung innovativer Software erweitern und gleichzeitig das Potenzial von LLMs erkunden möchten.

       

    • Introduction to Profile Areas 0590bA1.1
    • Statistics for Data Science 0590bA1.2
    • Machine Learning for Data Science 0590bA1.3
    • Programming for Data Science 0590bA1.4
    • Mustererkennung 0089cA1.12
    • Netzbasierte Informationssysteme 0089cA1.13
    • Rechnersicherheit 0089cA1.16
    • Verteilte Systeme 0089cA1.20
    • Spezielle Aspekte der Datenverwaltung 0089cA1.29
    • Künstliche Intelligenz 0089cA1.9
    • Höhere Algorithmik 0089cA2.1
    • Telematik 0089cA3.5
    • Big Data Analysis in Bioinformatics 0262cD1.8
    • Forschungspraxis 0590bB1.2
    • Interdisziplinäre Zugänge im Rahmen von Data Science B 0590bB1.28
    • Begleitendes Kolloquium 0590bE1.2