Moleküle im MP3-Format
Der Mathematiker Marco Sarich wurde mit dem Wissenschaftspreis des Vereins Berliner Kaufleute und Industrieller (VBKI) für seine Dissertation ausgezeichnet
02.11.2012
Wenn Marco Sarich Nicht-Mathematikern erklärt, worum es in seiner Dissertation geht, versucht er es mit Musik. Genauer gesagt mit MP3s. Doch dann ist er immer wieder schnell bei den Molekülen – und warum sie für Mathematiker besonders spannend sind. „Moleküle sind das, was man in der Mathematik ein hochdimensionales Problem nennt“, sagt Sarich, der am Institut für Mathematik der Freien Universität promoviert wurde. Diese Moleküle seien eine harte Nuss, die selbst mit Unterstützung von Hochleistungsrechnern schwer zu knacken sind.
Wie sich Biomoleküle genau verhalten, wann sie anfangen sich zu verändern – diese Fragen versuchen Biologen und Mediziner schon länger mithilfe von Mathematik zu klären. Zum Beispiel, wie es in Molekülen zu Fehlern bei der Faltung von Proteinen kommt. Solche fehlerhaften Faltungen führen unter anderem zu Krankheiten wie Alzheimer oder Parkinson.
An der Freien Universität entwickelt die Biocomputing Gruppe von Professor Christof Schütte mathematische Methoden zur Untersuchung komplexer Systeme. Als studentischer Mitarbeiter kam der heute 27-jährige Marco Sarich dort zu seinem Forschungsthema – der mathematischen Analyse von Molekulardynamik. Analysen zum Verhalten der Biomoleküle seien bisher noch oft Mammutprojekte. „Um das Verhalten eines einzigen Moleküls zu analysieren, muss man die Position jedes Moleküls im dreidimensionalen Raum festhalten. Man hat also Tausende x-,y- und z-Koordinaten, die man die ganze Zeit beobachten muss“, erklärt Sarich.
Kompliziert: das Erfassen der Bewegung von Molekülen
Eine Aufgabe, die viel Rechnerleistung verlangt. Denn Moleküle sind nicht nur hochdimensional, sondern auch noch ständig in Bewegung: In kurzer Zeit können sie ihre Struktur und ihre Position ändern. Beobachtung an echten Molekülen seien deshalb nur mit großen Einschränkungen möglich, erklärt Sarich: „Allein vom Speicherplatz ist so ein Verfahren unglaublich aufwendig. Schon für wenige Millisekunden sind schnell mehrere Terabyte Speicherplatz auf Festplatten vollgeschrieben.“ Bisher sind Wissenschaftler und Informatiker deshalb auf Hochleistungsrechner angewiesen, um die Bewegung der Moleküle zu erfassen.
Komprimierte Daten wie bei MP3
Eigentlich bräuchten Forscher viel mehr solcher Beobachtungen, um substantielle Entdeckungen zum biomolekularen Verhalten machen zu können. Doch genau das bereitete bisher große Probleme: „Diese Modelle sind unglaublich genau berechnet. Jetzt ging es darum, ein Modell zu entwickeln, das nicht ganz so genau aufgelöst ist – aber trotzdem noch richtige Rückschlüsse erlaubt“, erklärt Sarich. In der Musik gibt es ein ähnliches Verfahren schon – MP3. Mit der im Jahr 2000 am Fraunhofer-Institut entwickelten Methode wird ein Großteil des Audiosignals eines Musikstücks herausgerechnet. Damit kann die Datenmenge erheblich reduziert werden, ohne dass die Klangqualität wahrnehmbar darunter leidet.
Bereits seit 15 Jahren wird bei der Modellierung von Molekülen das sogenannte Markov State-Modell, kurz MSM genannt, eingesetzt. Dort knüpfte Marco Sarich mit seiner Dissertation an. „Bisher wurde dieser Algorithmus für die Modellreduktion schon häufig eingesetzt. Doch waren noch viele Fragen unbeantwortet, etwa wie gut die Kompression der Daten mit MSM tatsächlich ist.“
Entwicklung neuer Methode
Sarich untersuchte nicht nur das bestehende Modell, sondern konnte mit seiner Analyse auch eine neue Methode entwickeln. Mit diesem neuen Ansatz bleiben die molekularen Vorgänge genauer erhalten, trotz größerer Datenkompression. Bei einem einfachen Beispiel konnte der Mathematiker zeigen, dass mit seinem Ansatz eine 40-fach höhere Kompression erreicht werden kann, die trotzdem 100-mal genauer das wiedergibt, was Forscher über das Verhalten des Moleküls wissen müssen.
Bei einer Konferenzreise stellte Sarich kürzlich seine Methode in Stanford, Berkeley und Sydney vor – ein spannendes Erlebnis, sagt er. Schon jetzt wird sie im Bereich der Biomolekularen Forschung eingesetzt. „Für solche Probleme ist Mathematik eben sehr gut: Man kann Dinge beweisen“, sagt Sarich. Wenn sich die Lösung dann auch anwenden lässt – umso besser.