Microbiologie in hapklare porties

Kunnen we computers trainen om bacteriële functies in planten te voorspellen?

Geschreven door:

Tess Deyett

Je weet misschien wel dat miljoenen microben in jouw lichaam wonen. Maar wist je ook dat miljoenen microben juist planten of zelfs je eten als thuis zien? Planten hebben een hele diverse en complexe verhouding met micro-organismen zoals bacteriën en virussen, maar ook met grotere organismen zoals protozoa (eencelligen) en nematoden (kleine wormpjes). Net zoals bij het menselijk microbioom zorgen veel factoren ervoor of een microob goed of slecht is voor planten. De omgeving, de gastheer en de microbiële buren hebben allemaal invloed op de gastheer-microob-microob interacties.

Laten we als voorbeeld Xylella fastidiosa nemen. Deze bacterie zorgt voor de Ziekte van Pierce in druivenplanten. Xylella is niet alleen een pathogeen voor de druivenplant, maar maakt het zich ook behaaglijk bij zo’n 350 andere plantensoorten. Veel van deze planten trekken zich echter niets aan van deze bacterie en lijden geen schade.

Onderzoekers kunnen kijken naar het genoom van Xylella om beter te begrijpen welke functies het heeft en welke genen nadelig zijn voor de plant. Deze genen noemen we virulentiefactoren, en ze kunnen bijdragen aan de progressie van de ziekte. De onderzoekers doen dit door de genen van de pathogeen te vergelijken met genen in een database waarvan bekend is dat ze schadelijke functies hebben. Dit zijn enzymen die bijvoorbeeld de celwand kapot maken, of de bacterie de mogelijkheid geven om een biofilm te maken.

Historisch gezien draaide de microbiologie om ziekteverwekkers en infectieziekten. Naarmate we beter worden in het ontcijferen van de microbiële wereld, verschuift deze focus. Gunstige microben kunnen de plantengroei verbeteren, planten beschermen tegen ziekten en helpen bij het creëren van meer veerkrachtige gewassen. Het vinden van ziekteverwekkers is eenvoudig: ze veroorzaken ziekten en ongewenste symptomen. Het vinden van nuttige microben kan een uitdaging zijn, omdat het moeilijk is om gezondheid en veerkracht aan één factor te koppelen.

Hoe scannen onderzoekers duizenden microben om potentiële goede eigenschappen te vinden? Een proces dat “machine learning” wordt genoemd kan daarbij helpen. In een recent artikel, Genomics and machine learning-accelerated discovery of biocontrol bacteria, gebruikten auteurs Matthew Biggs, Kelly Craig, Esther Gachango, Mathias Twizeyimana en David Ingham de kracht van computers om hen te helpen bacteriën te ontdekken die kunnen helpen bij het bestrijden van schimmelziekten. Ze zochten naar bacteriën met mogelijke schimmelwerende eigenschappen.

Dit is geen AI-overname, computers worden niet slimmer. Computers kunnen niet denken zoals jij en ik, maar ze zijn fenomenaal in patroonherkenning. Laten we een voorbeeld bekijken. Als ik je de reeks ATTGGCTA zou geven, zou je het kunnen onthouden. Je zou me er bepaalde eigenschappen over kunnen vertellen, zoals lengte en samenstelling. Een sequentie van acht nucleotiden is voor mensen leesbaar. Hoe zit het met een volledig genoom? Het gemiddelde bacteriële genoom is 5 miljoen baseparen lang, wat zich kan vertalen naar 5000 eiwitten! Als je hiernaar kijkt, wat denk je dan dat je eruit zou kunnen halen? Zelfs na maandenlang gespannen naar deze reeks te staren, zou je nog steeds nauwelijks begrijpen waar je naar kijkt. Dit is waar machine learning om de hoek komt kijken. Machine learning is als een trainingsprogramma voor computers.

Laten we zeggen dat je als kind naar balletlessen ging, maar nu swingdansen wil leren. Uit je eerdere ervaring met ballet weet je dat dans ritme, muziek, bepaalde bewegingen, posities en een specifieke outfit omvat, om er maar een paar te noemen. Je kunt ervan uitgaan dat swingdansen aan dezelfde criteria voldoet. De eerdere ervaring die je hebt met muziek, ritme, enz. zal je helpen om sneller te leren swingen dan iemand die nog nooit eerder in zijn leven heeft gedanst.

Dit is vergelijkbaar met machine learning voor computers. Onderzoekers kunnen voorbeeldgegevens (ervaringen uit het verleden) gebruiken om een computer te trainen om zijn prestaties te optimaliseren. De prestatie is hoe goed het de functie van bepaalde genen kan voorspellen. In het geval van Bigg waren ze geïnteresseerd in het vinden van antischimmel-genen. Het doel is om nieuwe microben te vinden die kunnen worden ontwikkeld tot microbiële producten welke een alternatief kunnen zijn voor biologische meststoffen en pesticiden.

In totaal keek het team naar 1.227 bacteriële genomen. Ze lieten de computer door de genomen kijken en zoeken naar patronen die lijken op bekende patronen van antischimmel-activiteit. Het leerproces markeerde 72 van deze genomen als potentieel werkend tegen schimmel. Er zijn al verschillende fungicide stofjes bekend: fengycine, pyrrolnitrine, zwittermicine, bacilysine en siderofoor pyoverdine zijn daar slechts een aantal van. Onderzoekers kunnen computers trainen om vergelijkbare patronen te zoeken en te voorspellen welke bacteriën antischimmel-genen hebben. Ze vragen de computer niet om het exacte gen te vinden maar om de voorkennis toe te passen op een nieuw scenario. Daarbij zullen onderzoekers de genen kunnen vinden die een bekende antischimmel functie hebben. Daarnaast vinden ze ook nieuwe antischimmel-verbindingen.

Machine learning is niet zo eenvoudig. Er zijn een aantal verschillende machine learning-algoritmes, en elk richt zich op verschillende criteria en zullen telkens andere resultaten geven. Het team vergeleek vier verschillende modellen, die steeds iets anders presteerden. Verschillende modellen kunnen beter presteren voor specifieke toepassingen en omstandigheden. Stel dat je als kind jazz of tapdance hebt geleerd, in plaats van ballet, dan zou je swingdansen sneller kunnen leren. Computers kunnen de functie van bacteriën niet bepalen: ze kunnen ons helpen de mogelijke functie van een gen in een bacterieel genoom te voorspellen. De computer kan eerdere kennis (1.227 complete genomen) gebruiken en een selectie van veelbelovende bacteriën maken (in dit geval 72) om verder te testen.

Antagonisme is een zeer complexe interactie. In de eenvoudigste vorm produceert een bacterie een antischimmelmiddel en doodt een gevoelige schimmel. Dit is wat de computer voorspelt. Maar antagonisme is dynamischer dan dit, het gen in het bacteriële genoom hebben betekent niet dat het gen functioneel is. Het kan niet voorspellen of er andere factoren nodig zijn voor het produceren van dit antischimmelmiddel. Moet de schimmel een bacterie aanraken zodat de bacteriën het antischimmelmiddel vrijgeven? Welke omstandigheden veroorzaken dit gedrag?

Antischimmel maken is ook niet de enige manier waarop een bacterie antagonistisch kan zijn tegen een schimmel. De bacteriën kunnen in een omgeving simpelweg te veel ruimte en/of voedingsstoffen in beslag nemen. Zonder ruimte en voedingsmiddelen zouden de andere microben verhongeren of een nieuw thuis moeten zoeken. Een andere manier waarop microben vijandig tegenover elkaar kunnen zijn, is via de gastheer. Microben kunnen de gastheer manipuleren. Ze kunnen de gastheer vertellen om zijn afweersysteem te versterken en zichzelf te wapenen voor een pathogene aanval, een proces dat bekend staat als priming.

Deze complexere interacties kunnen niet worden voorspeld door machine learning. Het is ook belangrijk om te zeggen dat computers niet onfeilbaar zijn want de voorspelling kan verkeerd zijn. Machine learning en andere bioinformatica-technieken helpen onderzoekers om de complexe en dynamische interacties tussen planten en microben te bestuderen met een snelheid die nog nooit eerder is gezien! Bioinformatica en machine learning vervangen echter niet de biologie, ze vullen elkaar aan.

Na elke bioinformatische analyse is het van vitaal belang om terug te keren naar de biologie. De voorspellingen die door de computer worden gedaan moeten in de praktijk worden getest. Wat zo opwindend is aan deze techniek, is dat het gemakkelijk op elke situatie kan worden toegepast! Hier keken ze specifiek naar bacteriën met het potentieel om een specifieke schimmel te vernietigen, maar deze machine learning-methode kan ook worden toegepast om microben te vinden die ziekten veroorzaken bij mensen, of microben die ons kunnen helpen de klimaatverandering te bestrijden. Het heeft het potentieel om de onderzoekstijd drastisch te verminderen en onderzoekers te helpen hun inspanningen te concentreren!

Kortom, onderzoekers kunnen computers gebruiken om de bacteriële functie te voorspellen, zowel van virulentiefactoren als gunstige eigenschappen in verschillende omgevingen. Computers kunnen helpen om een groep van duizenden microben te verkleinen tot minder dan honderd potentieel belangrijke microben. Dit kan onderzoekers helpen tijd te besparen en hun onderzoek te focussen wanneer ze deze microben in de planten testen.

Link naar het originele artikel: Matthew Biggs, Kelly Craig, Esther Gachango, Mathias Twizeyimana, and David Ingham. Genomics- and machine learning-accelerated discovery of biocontrol bacteria. Phytobiomes, May 2021

Vertaald door: Charlotte van de Velde