Ultrahochgeschwindigkeits-Sequenzierung, Bioinformatik und maschinelles Lernen als Diagnosewerkzeug für die Bodengesundheit

Die Auswirkungen von landwirtschaftlichen Bewirtschaftungsmethoden und Pestiziden auf die Qualität und Gesundheit des Bodens sind ein wachsendes Anliegen von Verbrauchern, Landwirten und Bodenmanagern. Um diese Auswirkungen zu bewerten, haben Bioindikatoren wie Protisten ein großes Potenzial, werden aber nur begrenzt eingesetzt, da Bodenproben mit den derzeitigen Methoden nicht detailliert und schnell analysiert werden können. Um diese Nachteile zu überwinden, stellt die Identifizierung von Arten auf der Grundlage von DNA-Sequenzen (sog. "Barcoding" oder "Meta-Barcoding") in Verbindung mit neuen Ultrahochgeschwindigkeits-Sequenzierungstechniken einen vielversprechenden Ansatz dar. Die enorme Menge an Sequenzen und ihre hohe Komplexität machen es jedoch schwierig, sie mit herkömmlichen Mitteln zu verarbeiten. Daher ist es wichtig, Methoden zu entwickeln, die Bioinformatik und Machine Learning (ML) kombinieren, um (i) Protistensequenzen zu quantifizieren, zu analysieren und zu verarbeiten; (ii) Bioindikatoren (eine Untergruppe von Protisten) zu identifizieren und auszuwählen, die mit verschiedenen Stressfaktoren assoziiert sind; aber auch um (iii) ihre relative Häufigkeit unter verschiedenen Bedingungen zu modellieren, was zur Erstellung von prädiktiven Modellen für die Diagnose führt.

In einem ersten Schritt bestimmten wir die Zusammensetzung der Protistengemeinschaften von 28 Walliser Weinbergen mittels Meta-Barcoding. Anschließend verglichen wir die Vorhersageleistung verschiedener ML-Algorithmen, um ein Set von Variablen, die die Bodenqualität charakterisieren (z.B. pH-Wert, Kupfergehalt), vorherzusagen. Unsere bahnbrechenden Ergebnisse zeigten, dass das taxonomische Profil von Protistengemeinschaften zur Vorhersage eines breiten Spektrums von Variablen, einschließlich des Vorhandenseins von Pestiziden (Kupfer) im Boden, verwendet werden kann. Taxonomisch gesehen waren Ciliophora und Cercozoa die Protistengruppen mit der größten Anzahl an Bioindikatoren. Funktionell entsprach die Mehrheit der Bioindikatoren heterotrophen Taxa, aber einige Variablen (Pflanzenbiomasse und Boden-pH) wurden hauptsächlich von photosynthetischen Taxa vorhergesagt. Unsere Analysen ermöglichten uns die Entwicklung von Skripten zur Identifizierung von Biomarkern und zur Vorhersage verschiedener Bodenparameter.

Aufwertung

PEÑA C.-A., BROCHET X., FOURNIER B., HEGER T., Quantitative monitoring of agricultural soils using protist communities, SIB day 2020, 8 - 10 June 2020, Lausanne, Switzerland

HEGER T. J., JIBRIL M., STEINER M., XAVIER B., LAMY F., MOTA M., NOLL D., BACHER S., PENA C., Protist communities in vineyard soils: what do they tell us about soil quality and health? Joint meeting of the phycological society of America and the international society of protistologists, 29. Juli - 2. August 2018, Vancouver, Kanada.

MAMMERI J., BROCHET X., HEGER T., BACHER S., STEINER M., PENA C., MaLDIveS: Machine Learning Diagnostic Soil . SIB days 2018 (Swiss Institute of Bioinformatics), 26. bis 27. Juni 2018, Lausanne, Schweiz.

Verantwortlich für das Projekt Dr. Thierry Heger Professor für Bodenwissenschaften T +41 22 363 40 73

2017 - 2020

Partner: HEIG-VD

Finanzierung: HES-SO