
Deconstruyendo la microbiología mordisco a mordisco
¿Podemos entrenar a las computadoras para predecir funciones bacterianas en plantas?
Es posible que sepas que millones de microbios llaman a tu cuerpo hogar. Pero, ¿sabías que millones de microbios llaman a las plantas y a la comida que comes también su hogar? Las plantas tienen interacciones diversas y complejas con microorganismos que van de bacterias y virus a organismos más grandes como hongos, protozoos, y nemátodos. Al igual que en el microbioma humano, muchos factores contribuyen a que un microbio sea beneficioso o dañino para las plantas. El ambiente, el hospedador, y los otros microbios impactan en las interacciones entre el hospedador y los microbios.
Toma a Xylella fastidiosa como ejemplo. Esta es el agente causal de la enfermedad de Pierce en la vid. Xylella es un patógeno de plantas de las uvas, pero a su vez llama a otras 350 especies de plantas su hogar. Muchas de estas plantas no son afectadas por la presencia de Xylella.
Los investigadores han estudiado el genoma de Xylella para entender mejor qué funciones tiene, y apartar los genes que serían perjudiciales para la planta. Llamamos a estos genes factores de virulencia, y pueden contribuir a la progresión de la enfermedad. Ellos hacen esto al comparar los genes del patógeno con una base de datos de genes que tienen funciones patogénicas conocidas. Estas podrían ser enzimas que rompen paredes celulares, o que tienen la habilidad de protegerse a sí misma al formar un escudo pegajoso llamado biofilm.

Históricamente, la microbiología ha girado en torno a los patógenos y las enfermedades infecciosas. A medida que nos volvemos mejores en descifrar el mundo microbiano, este foco está cambiando. Los microbios beneficiosos pueden aumentar el crecimiento de las plantas, proteger a las plantas de enfermedades, y asistir en la creación de sistemas de cultivos más resistentes. Encontrar patógenos es fácil, ellos causan enfermedades, causan síntomas no deseados. Encontrar microbios beneficiosos, bueno esto puede ser más desafiante, dado que es más difícil conectar buena salud y resiliencia con un único factor.
¿Cómo escanean los investigadores miles de microbios para encontrar cualidades potencialmente beneficiosas? Un proceso llamado machine learning puede ayudar. En un artículo reciente, “Genómica y descubrimiento acelerado por machine learning de bacterias de control biológico”, los autores Matthew Biggs, Kelly Craig, Esther Gachango, Mathias Tweiyimana, y David Ingham, usaron el poder de las computadoras para ayudarlos a descubrir bacterias que pueden ayudar a pelear en contra de enfermedades causadas por hongos. Buscaron bacterias que tenían propiedades antifúngicas potenciales.

Esto no es una toma del control de las inteligencias artificiales, las computadoras no se están volviendo más inteligentes. Las computadoras no pueden pensar como tu o como yo, pero son fenomenales para reconocer patrones. Miremos este ejemplo. Si te diera la secuencia ATTGGCTA, tu podrías memorizarla. Serías capaz de decirme ciertas propiedades acerca de ella tales como su longitud y composición. Una secuencia de 8 nucleótidos es legible para los humanos. ¿pero qué sucede con un genoma completo? El genoma bacteriano promedio es de 5 millones de pares de bases de longitud, ¡que se traduce a 5000 proteínas! Si miraras esto, ¿qué piensas que podrías obtener? Incluso luego de meses de forzar tus ojos mirando esta secuencia, aún apenas entenderías que es lo que estás mirando. Aquí es donde tiene lugar machine learning. Machine learning es como un programa de entrenamiento para computadoras.
Digamos que fuiste a clases de ballet cuando eras un niño/a pero ahora quieres aprender a bailar swing. De tu experiencia anterior en Ballet, sabes que el baile incluye ritmo, música, ciertos movimientos, posiciones, y un vestuario específico, solo por nombrar unos pocos. Puede asumir que bailar swing incluye los mismos criterios. Estos criterios serían específicos para el baile de swing. La experiencia anterior que tienes con la música, el ritmo, etc., va a ayudarte aprender a bailar swing más rápido que alguien que nunca ha bailado anteriormente en su vida.
Esto es similar al machine learning para las computadoras. Los investigadores pueden usar datos de ejemplo (experiencias anteriores) para entrenar a las computadoras para optimizar su desempeño. Este desempeño es qué tan bien las computadoras pueden predecir la función de ciertos genes. En el caso de Bigg, estaban interesados en encontrar genes antifúngicos. La meta es encontrar nuevos microbios que pueden ser desarrollados como productos microbianos. Los productos microbianos pueden ser alternativas a los biofertilizante y pesticidas.

Optimized results!: ¡Resultados optimizados!
En total, el equipo analizó 1227 genomas bacterianos. Le dijeron a la computadora que buscara a través de los genomas por cualquier patrón que fuese similar a patrones conocidos de actividad antifúngica. El proceso de machine learning mostró 72 aislamientos con la potencialidad de ser antagonistas de hongos. Hay distintos componentes fungicidas actualmente conocidos: fengicina, pirrolnitrina, zwittermicina, bacilisina, y siderófora pioverdina, son solo algunos. Los investigadores han entrenado a las computadoras para buscar por patrones similares y predecir qué bacterias podrían tener genes fungicidas. Observa, los investigadores no le están pidiendo a la computadora que encuentre exactamente el mismo gen. Los investigadores están pidiéndole a la computadora que tome conocimiento previo y lo aplique al nuevo escenario. Al hacer esto, los investigadores encontraran genes que tienen una función fungicida conocida. Además, también encontrarán nuevos compuestos fungicidas.
Machine learning no es tan simple. Hay un número de diferentes algoritmos de machine learning. Cada uno se enfoca en diferentes criterios y producirá resultados ligeramente diferentes. El equipo comparó cuatro diferentes modelos, cada uno trabajando de una forma levemente diferente. Diferentes modelos pueden funcionar mejor para aplicaciones y condiciones específicas. Tal como si tú aprendiste jazz o tap siendo niño/a en lugar de ballet, puedes aprender a bailar swing más rápidamente. Las computadoras no pueden determinar la función de las bacterias. Ellas pueden ayudarnos a predecir las funciones potenciales de un gen dentro del genoma bacteriano. La computadora puede tomar conocimiento anterior, 1227 genomas, y reportar un subconjunto de aislamientos prometedores, en este caso 72 aislamientos, para realizar más pruebas.
El antagonismo es una interacción muy compleja. En la forma más simple, una bacteria produce un antifúngico, matando a los hongos susceptibles. Esto es lo que la computadora está prediciendo. El antagonismo es más dinámico que esto. Tener un gen en el genoma bacteriano no significa que el gen sea funcional. No puede predecir si hay dependencias espaciales para la producción de este antifúngico. ¿Tiene el hongo que estar tocando la bacteria para que la bacteria libera en antifúngico? ¿Qué condiciones activan este comportamiento?
El comportamiento antifúngico no es la única manera en que una bacteria puede ser antagonista de un hongo. Las bacterias pueden simplemente tomar demasiado espacio y/o recursos en un ambiente. Sin espacio y recursos, el otro microbio moriría de hambre o tendría que encontrar un nuevo hogar. Otra manera en que los microbios pueden ser antagonistas entre ellos es a través del hospedador. Los microbios pueden manipular al hospedador. Ellos pueden decirle al hospedador que active su mecanismo de defensa, armándose para el ataque de patógenos. Este es un proceso conocido como cebado.
Luego de cualquier análisis bioinformático, es vital traer de vuelta la biología. Las predicciones hechas por las computadoras deben ser testeadas en condiciones del mundo real. Lo que es tan excitante acerca de esta técnica es que, ¡puede ser aplicada fácilmente a cualquier situación! Aquí ellos se fijaron específicamente en las bacterias con el potencial para destruir un hongo específico, pero este método de machine learning puede ser aplicado a encontrar microbios que causan enfermedades en humanos o que puede ayudarnos a luchar contra el cambio climático. Tiene el potencial de reducir drásticamente el tiempo de investigación y, ¡ayudar a los investigadores a enfocar sus esfuerzos!
En conclusión, los investigadores pueden usar computadoras para ayudar a predecir funciones bacterianas como factores de virulencia o características beneficiosas en varios entornos. Las computadoras pueden ayudar a reducir un grupo de miles de microbios a menos de cien microbios potenciales importantes. Esto puede ayudar a los investigadores a ahorrar tiempo y enfocar su investigación cuando prueben estos microbios en las plantas.

En conclusión, los investigadores pueden usar computadoras para ayudar a predecir funciones bacterianas como factores de virulencia o características beneficiosas en varios entornos. Las computadoras pueden ayudar a reducir un grupo de miles de microbios a menos de cien microbios potenciales importantes. Esto puede ayudar a los investigadores a ahorrar tiempo y enfocar su investigación cuando prueben estos microbios en las plantas.
Traducido por: Santiago Chaillou