Neue Algorithmen und Richtlinien könnten die Klassifizierung und Benennung von Mikroorganismen erheblich beschleunigen. Das geht aus zwei neuen Publikationen hervor, an denen Miguel Rodríguez-Rojas vom Institut für Mikrobiologie und dem Digital Science Center der Universität Innsbruck beteiligt war. Die Forscher*innen präsentierten unter anderem 65 000 neue Namen für bisher namenlose Mikroorganismen.
In der Mikrobiologie hat sich während der letzten Jahre ein Rückstau gebildet. Durch verbesserte Forschungsmethoden in der DNA-Sequenzierung werden neue Prokaryoten-Arten in so großen Mengen entdeckt, dass Forscher*innen mit dem Klassifizieren und Benennen schlicht nicht nachkommen. Anstatt eines Namens erhalten die Mikroorganismen vorübergehend einen alphanumerischen Code, eine Zahlen-Buchstabenfolge, die sich schlecht merken lässt. Mittlerweile liegt die Zahl der unbenannten Prokaryoten jedoch bei mehreren zehntausend und es werden jedes Jahr mehr. Dieses Problem wollen nun zwei Publikationen mit Big-Data-basierten Ansätzen angehen. An beiden Arbeiten war Miguel Rodríguez-Rojas vom Institut für Mikrobiologie und dem Digital Science Center (DiSC) der Universität Innsbruck beteiligt.
Lateinische Namen per Mausklick
Ein Paper im International Journal of Systematic and Evolutionary Microbiology präsentiert ein Computerprogramm, das lateinisch klingende Namen generiert, die einzigartig sind und keine eigene Bedeutung haben. „Unser Programm kann innerhalb von wenigen Minuten tausende neue Artennamen generiert. Diese setzen sich aus lateinischen Bausteinen zusammen und weisen die für wissenschaftliche Namen typische weibliche Nachsilbe auf“, erklärt Rodríguez-Rojas.
Die Studie in Zusammenarbeit mit dem Quadram Institute in Norwich konnte unter anderem einen skurrilen Rekord aufstellen, denn mit 65 000 generierten Namen führten sie die größte Artenbenennung innerhalb einer einzigen wissenschaftlichen Publikation durch. Da die Beschreibungen der neu benannten Arten 14 000 Seiten umfassten, konnten diese nicht in der Publikation selbst vorgestellt werden, sondern wurden als Datei angehängt.
Das die Namen keine Konkrete Bedeutung haben, schließt dabei an eine lange naturwissenschaftliche Tradition an. Bakterien wurden in der Vergangenheit unter anderem nach Personen (Tapinothrix clintonii, nach Bill Clinton) Organisationen (Basfia succiniciproducens, nach dem Chemiekonzern BASF) oder fiktiven Wesen (die Gattung Pokemonas) benannt.
SeqCode: unkompliziert zu neuen Arten
Ein weiteres Paper, erschienen in Nature Microbiology, befasst sich mit SeqCode, einer DNA-basierten Richtlinie. Es handelt sich um eine Sammlung aus Prinzipien, Regeln und Empfehlungen deren Ziel es ist, den Vorgang der Namensgebung von unkultivierten Prokaryoten zu vereinfachen und zu regulieren.
„Die herkömmliche Richtlinien des International Code of Nomenclature of Prokaryotes erfordern, dass neue Prokaryoten zunächst als Kultur herangezogen werden müssen“, erklärt Rodríguez-Rojas. „Diese wird dann eingefroren und dient als Referenz. Erst dann darf die neue Art einen Namen erhalten. Für die Anzahl der neu entdeckten Prokaryoten ist dieser Vorgang jedoch viel zu aufwändig, außerdem lassen sich längst nicht alle Arten als Kulturen heranzüchten.“ An dieser Stelle soll SeqCode ins Spiel kommen, entwickelt von einem Konsortium aus internationalen Forschungsteams, koordiniert durch die International Society for Microbial Ecology.
Ein wichtiger Bestandteil ist die SeqCode Registry, eine Web-basierte Anwendung, die auf Servern des Digital Science Centers an der Universität Innsbruck gehostet wird und deren leitender Entwickler Rodríguez-Rojas ist. Diese gleicht DNA-Sequenzen von neuen Prokaryoten mit bestehenden Datenbanken ab. So kann festgestellt werden, ob es sich tatsächlich um eine neue Art handelt. Anschließend kann die Art einen Namen erhalten.
Die Namen der neuen Arten, mitsamt ihrer DNA-Sequenz als Referenz, werden über die SeqCode Registry zentralisiert gespeichert. Dieses Portal erleichtert die Suche, Einordnung und Abgleich der verschiedenen Arten und verspricht so, den gesamten Prozess der Benennung neuer Prokaryoten wesentlich schneller und einfacher zu gestalten.
Neue Wege für die Mikrobiologie
Obwohl die Arbeiten unabhängig voneinander entstanden sind, könnten sich ihre Ergebnisse gut ergänzen, besonders in Fällen, in denen Forscher*innen ihre entdeckten Arten benennen, aber keine bestehende Namensbausteine benutzen wollen oder können. „Die Kombination beider Methoden könnte den Vorgang der korrekten Namensgebung von Organismen demokratisieren, indem Einstiegshürden wie umfassende Lateinkenntnisse abgebaut werden. Gleichzeitig wird die Kommunikation innerhalb der Wissenschaft verbessert, weil wir Namen anstatt alphanumerischer Codes verwenden können. Es ist eine win-win Situation!”, so Rodríguez-Rojas.
Entscheidend ist aber, dass die neuen Ansätze in der wissenschaftlichen Community auch Anklang finden und verwendet werden. Die Autor*innen der Studie haben festgestellt, dass SeqCode sehr positiv aufgenommen wurde, insbesondere in der mikrobiellen Ökologie, aber auch in anderen Bereichen, in denen nicht kultivierte Organismen weit verbreitet sind und die Nomenklatur weitgehend unreguliert ist, wie z.B. in der Veterinärmedizin.
„Der Vorschlag, willkürliche Namen zu vergeben, wurde hingegen eher gemischt aufgenommen“, sagt Rodríguez-Rojas. „Die Benennung hat für Forscher*innen auch einen emotionalen Wert, und manche hängen sehr an der sorgfältigen Erarbeitung gut durchdachter Namen. Mir geht es genauso, ich habe bereits Namen zu Ehren der bedeutenden Wissenschaftlerin Rosalind Franklin ("Aquidulcis franliniae") oder fiktiver Orte wie Macondo aus dem Roman "Hundert Jahre Einsamkeit" (Macondimonas diazotrophica) vorgeschlagen. Die sorgfältige Namensgebung ist wichtig und wird auch weiterhin bestehen, aber dieser Prozess ist einfach nicht skalierbar. Wir gehen davon aus, dass viele der von uns vorgeschlagenen Namen allgemeine Verwendung in der Literatur finden werden, ihre tatsächliche Nützlichkeit können wir erst auf lange Sicht beweisen.“
Veröffentlichungen:
Hedlund, B.P., Chuvochina, M., Hugenholtz, P. et al. SeqCode: a nomenclatural code for prokaryotes described from sequence data. Nat Microbiol 7, 1702–1708 (2022). https://doi.org/10.1038/s41564-022-01214-9
Pallen et al (2022) Naming the unnamed: over 65,000 Candidatus names for unnamed Archaea and Bacteria in the Genome Taxonomy Database has been published in the International Journal of Systematic and Evolutionary Microbiology.
https://doi.org/10.1099/ijsem.0.005482