Sprach-KI sprengt die Grenzen der Genomforschung, doch Experten warnen vor möglichen Konsequenzen
Die Sprach-KI Evo erzeugt präzise DNA-Sequenzen und beeindruckt Forscher, doch die neue Technologie wirft Fragen nach der Sicherheit auf.
Eine Sprach-KI kann DNA-Stränge entwerfen und so den Biotechnologie-Sektor revolutionieren. Das Modell Evo ist nicht nur in der Lage, bestehende Sequenzen zu analysieren, sondern auch neue DNA-Strukturen zu entwickeln, wie Der Standard berichtet.
Künstliche Intelligenz entwirft Genscheren-Moleküle
Im Gegensatz zu klassischen Large Language Models (LLM), die mit Worten arbeiten, kombiniert Evo molekulare Bausteine zu DNA-Sequenzen. Statt Buchstaben nutzt es Nukleotide, die Informationseinheiten der DNA. Für das Training griff das Team auf eine riesige Datenbasis zurück: 300 Milliarden Nukleotide aus den Genomen von Bakterien und Viren. Ziel war es zunächst, zu prognostizieren, wie genetische Veränderungen die Produktion von Proteinen beeinflussen. Laut dem Standard übertrafen die Ergebnisse bisherige Modelle in ihrer Präzision.
In einem weiteren Schritt ließ das Forschungsteam Evo DNA-Abschnitte für die Genschere Crispr/Cas entwerfen. Dabei entstand tatsächlich ein funktionierendes Molekül. Je länger die DNA-Sequenzen wurden, desto anfälliger war jedoch das Modell für Fehler.
Evo versteht komplexe Zusammenhänge
Die KI Evo lernt nicht nur Sequenzen auswendig, sondern begreift deren Umgebung. „Das Besondere daran ist, dass das Modell eine Sequenz nur richtig vorhersagen kann, wenn es die Sequenzen drumherum versteht – und so lernt das Modell dann die Zusammenhänge im Umfeld“, erklärte Anna Poetsch von der Technischen Universität Dresden gegenüber dem Science Media Center. Evo wurde mit 2,7 Millionen Genomen trainiert und lernte ihre biologische Informationsstruktur.
Laut Benedikt Bors vom Deutschen Krebsforschungszentrum in Heidelberg hat Evo im Vergleich zu anderen Tools einen großen Vorteil: „Es handelt sich nicht um das erste Tool, das es in dieser Art gibt, aber es ist das erste, das rein mit Genomsequenzen trainiert wurde und auch Aussagen zu Aminosäuren treffen kann“, sagte Bors. Während andere Modelle auf spezifische Fragestellungen beschränkt waren, öffnet Evo neue Wege in der Forschung.
Großer Fortschritt mit Sicherheitsbedenken
Die umfangreiche Datenbasis aus Viren-DNA sorgt jedoch für Diskussionen über potenziellen Missbrauch. Das Forschungsteam betonte, keine Sequenzen gefährlicher Viren genutzt zu haben, die Menschen, Tiere oder Pflanzen infizieren könnten. Trotzdem bleiben Fragen offen.
„Der Ausschluss gefährlicher Viren vom Training ist zwar ein wichtiger Schritt, aber womöglich nur ein Tropfen auf den heißen Stein“, warnte Susanne Gerber vom Institut für Humangenetik der Universitätsmedizin Mainz. Sie verwies darauf, dass viele Virengenome öffentlich zugänglich sind. Mit genügend Rechenleistung könnten entsprechende Programme dennoch für schädliche Zwecke eingesetzt werden. Hier sind laut Gerber internationale Regelungen für den Umgang von KI in der Biotechnologie notwendig, um deren Missbrauch zu verhindern.
KI könnte Genomforschung verändern
Sprachmodelle wie Evo könnten die Genomforschung laut Fachleuten grundlegend umgestalten. „Da diese Modelle sehr komplexe Zusammenhänge lernen können, ist in den nächsten Jahren mit sehr großen Sprüngen in vielen Forschungsbereichen zu rechnen“, so Poetsch. Sie betont jedoch, dass es essenziell sei, zu erkennen, welche Zusammenhänge das Modell erlernt hat.
Eine Herausforderung bleibt, dass KI-Modelle ihre „Entscheidungen“ nicht transparent machen. „Wenn es uns gelingt, diese Information zu extrahieren, werden wir viel darüber lernen, wie Viren und Bakterien funktionieren“, sagte Poetsch. Diese Technologie könnte dabei helfen, neuartige Behandlungsansätze gegen antibiotikaresistente Bakterien zu entwickeln oder Prozesse in der Biotechnologie effizienter zu gestalten.
Was du dir merken solltest:
- Die KI Evo kann DNA-Stränge entwerfen, Gensequenzen analysieren und mit genetischen Bausteinen arbeiten, was den Biotechnologie-Sektor verändern könnte.
- Das Modell wurde mit Millionen Genomen trainiert und übertrifft bestehende Tools durch die Fähigkeit, Aminosäuren vorherzusagen und komplexe Zusammenhänge zu verstehen.
- Trotz des beeindruckenden technischen Fortschritts bestehen Sicherheitsbedenken, da die Nutzung öffentlich zugänglicher Viren-Daten potenziell für Missbrauch anfällig sein könnte.
Übrigens: Der Mangel an hochwertigen Trainingsdaten bedroht die KI-Entwicklung – Experten warnen vor einem „digitalen Rinderwahnsinn“ und kritisieren zweifelhafte Lösungsansätze. Mehr dazu erfährst du in unserem Artikel.
Bild: © Vecteezy