
De la microbiologie pour ceux qui ont les crocs
Des ordinateurs pour prédire les fonctions des bactéries.
Vous savez peut-être que des milliards de microbes habitent votre corps. Mais saviez-vous que des milliards de microbes colonisent les plantes et la nourriture que vous mangez à la maison également ? Les plantes ont des interactions diverses et complexes avec les micro-organismes allant des bactéries, des virus aux organismes plus gros comme les champignons, les protozoaires et les nématodes. Comme pour l’humain, de nombreux facteurs contribuent à ce qu’un microbe soit nocif ou bénéfique pour les plantes. L’environnement, l’hôte et les autres microbes ont un impact sur les interactions hôte-microbe-microbe.Prenons l’exemple de Xylella fastidiosa, la bactérie responsable de la maladie de Pierce de la vigne. Xylella est un phytopathogène du raisin, mais il colonise également 350 autres espèces végétales. Beaucoup de ces plantes ne sont pas affectées par la présence de Xylella.

Les chercheurs peuvent examiner le génome de Xylella pour mieux comprendre ses fonctions et extraire les gènes qui seraient néfastes à la plante. Nous appelons ces gènes des facteurs de virulence et ils peuvent contribuer à la progression de la maladie. Pour ce faire, ils comparent les gènes de l’agent pathogène à une base de données de gènes connus avec des fonctions pathogènes connues. Ces gènes peuvent être à l’origine d’enzymes qui décomposent les parois cellulaires ou responsable de la capacité à se protéger en formant un bouclier collant connu sous le nom de biofilm.
Historiquement, la microbiologie s’axait autour des agents pathogènes et des maladies infectieuses. Plus nous en apprenons sur le monde microbien, plus ces axes s’élargissent. Les microbes bénéfiques peuvent améliorer la croissance des plantes, les protéger contre les maladies et aider à la création de systèmes de culture plus résilients. Trouver des agents pathogènes est facile car ils provoquent des maladies, créent des symptômes indésirables. Trouver des microbes bénéfiques est plus difficile car il est compliqué de relier un état sain à un seul facteur.

Comment les chercheurs analysent-ils des milliers de microbes pour trouver des bienfaits potentiels ? Les méthodes de machine learning peuvent aider. Dans un article récent, les auteurs Matthew Biggs, Kelly Craig, Esther Gachango, Mathias Twizeyimana et David Ingham, ont utilisé la puissance des ordinateurs pour identifier des bactéries pouvant participer à lutte contre les maladies fongiques. Ils ont donc recherché des bactéries ayant des propriétés antifongiques potentielles.
Ce n’est pas une prise de contrôle de l’intelligence artificielle, les ordinateurs ne deviennent pas plus intelligents. Les ordinateurs ne peuvent pas penser comme vous et moi, mais ils sont excellents pour reconnaître des motifs. Regardons un exemple. Si je vous donnais la séquence ATTGGCTA, vous pourriez la mémoriser. Vous seriez en mesure de me dire certaines propriétés à son sujet telles que la longueur et la composition. Une séquence de huit nucléotides est lisible par l’homme. Qu’en est-il d’un génome complet ? Le génome bactérien moyen a une longueur de 5 millions de paires de base, ce qui peut se traduire par 5000 protéines ! Si vous regardiez cela, que pensez-vous pouvoir en retirer ? Même après des mois à forcer vos yeux à regarder cette séquence, vous comprendriez à peine ce que vous regardez. C’est là qu’intervient le machine learning. Le machine learning est comme un programme de formation pour les ordinateurs.
Disons que vous avez suivi des cours de ballet quand vous étiez enfant, mais que maintenant vous voulez apprendre la danse swing. Grâce à votre expérience passée à la pratique du ballet, vous savez que la danse comprend les notions de rythme, musique, mouvement, pas et une tenue spécifique pour n’en nommer que quelques-unes. Vous pouvez supposer que la danse swing inclut ces mêmes notions. Ces notions seraient spécifiques à la danse swing. L’expérience préalable que vous avez de la musique, du rythme, etc. vous aidera à apprendre le swing plus rapidement que quelqu’un qui n’a jamais dansé de sa vie.
Ceci est similaire au machine learning . Les chercheurs peuvent utiliser des exemples de données (expérience passée) pour entraîner un ordinateur à optimiser ses performances. La performance étant la justesse de prédiction de la fonction de certains gènes. Dans cette étude, la fonction des gènes étant des propriétés antifongiques, l’objectif étant de trouver de nouveaux microbes pouvant être utilisés en tant qu’alternatives aux biofertilisants et aux pesticides.

Au total, l’équipe a examiné 1 227 génomes bactériens. Ils ont dit à l’ordinateur de rechercher dans les génomes tous les motifs ressemblant aux motifs connus d’activité antifongique. La méthode de machine learning a repéré 72 isolats comme potentiellement antagonistes envers les champignons. Il existe plusieurs composés fongicides déjà connus , parmi lesquels : la fengycine, la pyrrolnitrine, la zwittermicine, la bacilysine et le sidérophore pyoverdine. Les chercheurs peuvent entraîner des ordinateurs à rechercher des motifs similaires et à prédire quelles bactéries peuvent avoir des gènes fongicides. Remarquez que les chercheurs ne demandent pas à l’ordinateur de trouver le gène en question. Les chercheurs demandent à l’ordinateur de prendre en compte des connaissances antérieures et de les appliquer à un nouveau scénario. En faisant ça, les chercheurs découvriront les gènes qui ont une fonction fongicide connue. En outre, ils trouvent également de nouveaux composés fongicides.
Le machine learning n’est pas si simple. Il existe de nombreux algorithmes de machine learning différents. Chacun se concentre sur des critères variables et produira des résultats légèrement différents. L’équipe a comparé quatre modèles, chacun ayant des performances légèrement différentes. La performance d’un modèle varie en fonction des applications et des conditions spécifiques. Tout comme si vous appreniez le jazz ou les claquettes quand vous étiez enfant, au lieu du ballet, vous pouvez apprendre le swing plus rapidement. Les ordinateurs ne peuvent pas déterminer la fonction des bactéries. Ils peuvent nous aider à prédire la fonction potentielle d’un gène dans un génome bactérien. L’ordinateur peut prendre des connaissances antérieures, 1227 génomes, et identifier un sous-ensemble d’isolats prometteurs, dans ce cas 72 isolats, pour tester davantage.
L’antagonisme est une interaction très complexe. Dans la forme la plus simple, une bactérie produit un antifongique, tuant un champignon sensible. C’est ce que l’ordinateur prédit. L’antagonisme est plus dynamique que cela. Le fait d’avoir le gène dans le génome bactérien ne signifie pas que le gène est fonctionnel. Il ne peut pas prédire s’il existe des dépendances spatiales pour produire cet antifongique. Ce champignon doit-il toucher cette bactérie pour que la bactérie libère l’antifongique ? Quelles conditions déclenchent ce comportement ?
Le comportement antifongique n’est pas non plus le seul moyen pour une bactérie d’être antagoniste envers un champignon. Les bactéries pourraient simplement prendre trop de place et/ou de ressources dans l’environnement. Sans espace et sans ressources, les autres microbes mourraient de faim ou devraient trouver un nouveau foyer. Une autre façon dont les microbes peuvent être antagonistes envers les autres est l’hôte. Les microbes peuvent manipuler l’hôte. Ils peuvent dire à l’hôte d’améliorer son système de défense, les armant pour une attaque pathogène. C’est un processus connu sous le nom d’amorçage.
Ces interactions plus complexes ne peuvent pas être repérées par le machine learning. Il est également important de dire que les ordinateurs ne sont pas infaillibles, la prédiction peut être fausse. Le machine learning et d’autres techniques bioinformatiques aident les chercheurs à étudier les interactions complexes et dynamiques entre les plantes et les microbes à un rythme jamais vu auparavant ! Cependant, la bioinformatique et le machine learning ne remplacent pas la biologie, ils se complètent.
Après toute analyse bioinformatique, il est vital de se rapporter à la biologie. Les prédictions faites par l’ordinateur doivent être testées dans des conditions réelles. Le plus intéressant avec cette méthode, c’est qu’elle peut facilement être appliquée à n’importe quelle situation ! Ici, ils ont examiné spécifiquement les bactéries ayant le potentiel de détruire un champignon particulier, mais le machine learning peut être utilisé pour trouver des microbes causant des maladies chez l’homme ou des microbes pouvant nous aider à lutter contre le changement climatique. Il a le potentiel de réduire considérablement le temps de recherche et d’aider les chercheurs à focaliser leurs efforts !

En conclusion, les chercheurs peuvent utiliser des ordinateurs pour aider à prédire la fonction bactérienne à la fois en tant que facteurs de virulence et caractéristiques bénéfiques dans divers environnements. Les ordinateurs peuvent aider à réduire un pool de milliers de microbes potentiellement importants à moins d’une centaine. Cela peut aider les chercheurs à gagner du temps en concentrant leurs recherches sur ces microbes de plantes.
Article original: Matthew Biggs, Kelly Craig, Esther Gachango, Mathias Twizeyimana, and David Ingham. Genomics- and machine learning-accelerated discovery of biocontrol bacteria. Phytobiomes, May 2021allol.png
Traduit par: Clémence Joseph