Mit dem Thüringer Forschungspreis ehrt der Freistaat seit 1995 wissenschaftliche Spitzenleistungen.

Künstliche Intelligenz identifiziert kleine Moleküle

Bioinformatik-Team wird mit dem Thüringer Forschungspreis 2022 in der Kategorie Angewandte Forschung ausgezeichnet
Mit dem Thüringer Forschungspreis ehrt der Freistaat seit 1995 wissenschaftliche Spitzenleistungen.
Foto: Jens Meyer (Universität Jena)
  • Informatik

Meldung vom: | Verfasser/in: Ute Schönfelder | Zur Original-Meldung

Zu den Preisträgern des Thüringer Forschungspreises 2022 gehört erneut ein Forschungsteam der Friedrich-Schiller-Universität Jena: Prof. Dr. Sebastian Böcker, Dr. Kai Dührkop, Dr. Markus Fleischauer, Dr. Marcus Ludwig und Martin Hoffmann werden in der Kategorie Angewandte Forschung ausgezeichnet, wie Thüringens Wissenschaftsminister Wolfgang Tiefensee heute (06. April) in einer Videoveranstaltung bekanntgegeben hat. Die Bioinformatiker werden für die Entwicklung informatischer Methoden zur Identifikation kleiner Moleküle geehrt und erhalten ein Preisgeld von 12.500 Euro.

Prof. Dr. Sebastian Böcker, Lehrstuhl für Bioinformatik, 3. v. li, hält den Thüringer Forschungspreis 2022 in seinen Händen. Ausgezeichnet wurden außerdem Dr. Markus Fleischauer, li, Dr. Kai Dührkop, 2. v. li., Dr. Marcus Ludwig, 4. v. li., und Doktorand Martin Hoffmann, re. Prof. Dr. Sebastian Böcker, Lehrstuhl für Bioinformatik, 3. v. li, hält den Thüringer Forschungspreis 2022 in seinen Händen. Ausgezeichnet wurden außerdem Dr. Markus Fleischauer, li, Dr. Kai Dührkop, 2. v. li., Dr. Marcus Ludwig, 4. v. li., und Doktorand Martin Hoffmann, re. Foto: Jens Meyer (Universität Jena)

Kleine Moleküle – sogenannte Metabolite – sind allgegenwärtig. Alles, was lebt, produziert Metabolite. Sie werden im Stoffwechsel jeder lebenden Zelle auf- und umgebaut. Sie dienen als Bausteine für Zellbestandteile, als Energiespeicher oder Signalstoffe. „Für den Menschen spielen sie als Wirkstoffe eine immense Rolle“, macht Prof. Böcker deutlich. „Neue Medikamente sind häufig Variationen von in der Natur vorkommenden Metaboliten: Wie beispielsweise Schimmelpilze, die uns gezeigt haben, wie man durch Penizillin Bakterien abtöten kann. Das hat vielen Millionen Menschen das Leben gerettet.

Neue Wirkstoffe aus der Natur zu identifizieren und nutzbar zu machen, ist jedoch zeit-, kosten- und arbeitsintensiv. „Hinzu kommt, dass wir oft gar nicht wissen, nach welchen unbekannten Molekülstrukturen wir eigentlich suchen“, so Böcker. Um kleine Moleküle in Zell- und Gewebeproben beispielsweise von Heilpflanzen nachzuweisen, wird ein Massenspektrum aufgenommen. Dabei werden die Moleküle in Fragmente zerlegt und deren Masse bestimmt. Diese Ergebnisse lassen sich dann mit Daten von Referenzmessungen abgleichen und so vorhandene Moleküle identifizieren. Klar ist aber auch: Auf diese Weise lassen sich aber immer nur Moleküle finden, deren Struktur bereits bekannt und in einer entsprechenden Datenbank erfasst ist.

Maschinelles Lernen hilft bei der Suche nach der passenden Struktur

Und genau hier setzt die Arbeit der Jenaer Bioinformatiker an, für die sie jetzt ausgezeichnet wurden. Sie entwickeln Methoden, die es erlauben, mit den Massenspektrometriedaten auch Molekülstrukturen zu identifizieren, für die bislang weder Reinsubstanzen vorliegen, noch dass sie bisher jemals in der Natur identifiziert wurden. Dafür nutzen sie Verfahren des maschinellen Lernens. So haben sie etwa mit ihrer Suchmaschine „CSI:FingerID“ ein Tool entwickelt, mit dem sich Massenspektrometriedaten in Information über die chemische Struktur „übersetzen“ und so diejenigen Strukturen ermitteln lassen, die am besten zu den Massenspektrometriedaten passen. Als Ergebnis erhält man – wie in einer Google-Suche – eine mehr oder weniger umfangreiche Liste möglicher Treffer. Das auf dieser Suchmaschine aufbauende COSMIC-Verfahren, das die Bioinformatiker ebenfalls entwickelt haben, ermittelt zusätzlich einen Score, der die Qualität der vorgeschlagenen Treffer bewertet und daraus ableitet, ob diese zutreffend oder falsch sind.

Doch was, wenn zwar der molekulare Fingerabdruck der unbekannten Substanz durch Massenspektrometrie ermittelt werden konnte, dieser aber keiner bisher bekannten molekularen Struktur zugeordnet werden kann? Auch das kommt recht häufig vor. „Chemisch möglich sind mehr Molekülstrukturen, als es Atome im Universum gibt“, so Böcker. Doch auch für die zahlreichen Moleküle, deren Struktur bisher in keiner Datenbank der Welt zu finden sind, haben die ausgezeichneten Bioinformatiker eine Lösung entwickelt, das CANOPUS-Verfahren. Dieses ebenfalls auf maschinellem Lernen beruhende Verfahren ordnet den Metaboliten eine bestimmte Stoffklasse zu, ohne diese dafür exakt identifizieren zu müssen. „Wir können also feststellen, ob es sich beispielsweise um ein Zuckermolekül, eine Aminosäure, ein Alkohol oder eine Gallensäure handelt“, sagt Böcker. CANOPUS beantwortet diese Frage für mehr als 2.500 Stoffklassen. Diese Information reicht in vielen Fällen bereits aus, um wichtige biologische oder medizinische Fragestellungen zu beantworten.

Prozess zur Identifizierung von Molekülen wird beschleunigt

Allen Methoden gemeinsam ist, dass sie die Auswertung von Messdaten, für die ein Mensch viele Wochen benötigen würde, in wenigen Stunden erledigen. Damit beschleunigen sie nicht nur den Prozess zur Identifizierung bislang unbekannter kleiner Moleküle. Es können auch wesentlich mehr Daten analysiert und so zum Beispiel Kandidaten für neue Arzneistoffe schneller und effizienter aufgespürt werden. Auch Forschende aus aller Welt nutzen die von den Jenaer Bioinformatikern entwickelten Methoden viele tausende Male täglich – insgesamt bereits mehr als 200 Millionen Mal. Zudem finden sie nicht nur in der akademischen Forschung Anwendung. Die ausgezeichneten fünf Wissenschaftler haben bereits vor einigen Jahren ein Unternehmen gegründet, das die Methoden auch in den Wirtschaftssektor transferiert und damit die Forschungs- und Entwicklungsleistung der Universität Jena auf nationaler und internationaler Ebene sichtbar macht.