
Разбираем мир микробиологии по кусочкам
Как научить компьютер анализировать функции бактерий в растениях?
Для триллионов микроорганизмов наше тело является домом и средой обитания. Но знаете ли вы, что триллионы этих же микроорганизмов также могут населять растения и еду, которую мы едим каждый день? Растения могут взаимодействовать с разными видами микроорганизмов, начиная от самых “маленьких” (бактерии и вирусы) и заканчивая самыми “большими” (грибки, простейшие и нематоды). Многие факторы определяют вид взаимодействия между микроорганизмом и растением. Окружающая среда, само растение, и микроорганизмы, обитающие на этом растении, тесно связаны между собой на многих уровнях жизни.
Например, бактерия Xylella fastidiosa, вызывающая болезнь Пирса, является бактериальным патогеном растений винограда, но при этом, эта же бактерия также может обитать на 350 видов других растений. Многие из этих растений не демонстрируют ни признаков болезни Пирса, ни признаков любого другого заболевания в присутствии этого микроорганизма.
Благодаря технологиям, существующим на сегодняшний день, ученые могут проанализировать геном этой бактерии, изучить его функции, а также исключить те гены, которые ответственны за проявление болезни в растениях винограда. Эти гены называются вирулентными, так как они способствуют прогрессии заболевания. Чтобы определить вирулентность, ученые сравнивают гены патогена с базой генов с известными патогенными свойствами. Факторы, обозначающие вирулентность, могут быть ферменты, которые производятся для разрушения клеточные стенки, или процесс формирования биопленки, служащей для защиты.

Полезные для растений микробы могут улучшить рост растений, защитить от болезней, и помочь в создании более устойчивых сельскохозяйственных культур. Благоприятные бактерии не легко распознать, но патогены, в свою очередь, видно сразу, так как они вызывают заболевания у растений, чьи симптомы и признаки видны невооруженным глазом.
Как же исследователи находят полезные микробы среди тысячи микроорганизмов? Процесс, известный как “машинное обучение”, является неотъемлемой частью этих поисков. В своей статье “Genomics and machine learning-accelerated discovery of biocontrol bacteria”, исследователи Мэтью Биггс, Келли Крейг, Эстер Гачанго, Матиас Твизёмана и Дэвид Ингхэм использовали компьютерные программы, чтобы распознать бактерии, которые могут помочь в борьбе с грибковыми заболеваниями. Они пытались найти именно те виды бактерий, которые имели бы противогрибковые свойства.

Прелесть таких компьютерных программ состоит в том, что они идеально подходят для распознавания повторяющихся нуклеотидных последовательностей. Например, вы с лёгкостью сможете запомнить данную последовательность: ATTGGCTA. Вы даже сможете описать ее, указав ее длину и компоненты. В целом, последовательность из 8 символов является достаточно легкой для анализа. А как насчет описания полного генома? Среднее количество символов в геноме бактерии составляет около 5 миллионов, что может кодировать около 5000 белков! Даже после нескольких месяцев напряженных поисков такой же последовательность, вы все равно будете иметь слабое представление того, на что именно вы смотрите. Как раз-таки в таких ситуациях компьютерные программы приходят на помощь!
Представьте, что в детстве вы ходили на балет, но теперь вы хотите изучать другой вид танца. Из вашего предыдущего опыта вы знаете, что танец состоит из ритма, музыки, определенных движений, позиций, и даже специального костюма. Вы с уверенностью можете предположить, что любой другой вид танца будет иметь эти же критерии. Ваш предыдущий опыт в балете поможет вам изучать новый танец быстрее и более успешно.
Пример с изучением танца похож на то, что является машинным обучением для компьютеров. Исследователи используют гены из уже существующих данных (прошлый опыт) для того, чтобы оптимизировать производительность компьютера и получить результаты, которые будут предсказывать функцию интересующих их генов. В случае исследования Мэтью Биггс и его коллег, они были заинтересованы в поисках противогрибковых генов у бактерий. Цель состояла в том, чтобы найти новые микроорганизмы, чьи противогрибковые вещества могли бы быть использованы в производстве противогрибковых продуктов. Такие продукты могут стать альтернативой биодобавкам и пестицидам.

В своем эксперименте, команда исследователей изучила 1227 бактериальных геномов. Созданная компьютерная программа получила команду поиска генома, который был бы аналогичен уже известным моделям с противогрибковой активностью. Процесс машинного обучения выделил 72 генома, которые бы потенциально имели противогрибковые свойства. Уже известные и используемые на рынке фунгицидные препараты (способные убивать грибковые инфекции) называются “Fengycin”, “Pyrrolnitrin”, “Zwittermicin”, “Bacilysin”, и “Siderophore pyoverdine” – и это всего лишь часть из них. Исследователи могут “обучить” компьютеры поиску противогрибковых нуклеотидных последовательностей у бактерий. Важно заметить, что исследователи не задают команду компьютеру поиска точного гена, имеющего антигрибковые свойства. Напротив, они просят компьютер использовать уже существующие знания и применить их к новому сценарию. Это позволяет найти новые гены, которые имеют уже известную функцию фунгицида. Более того, такой поиск также позволяет найти новые фунгицидные соединения.
Но, создать такую компьютерную программу и обучить машину определенным алгоритмам не простое дело. Существует несколько алгоритмов для обучения, и каждый из них фокусируется на разных деталях, что приводит к разным результатам. Использование разнообразных моделей позволяет получать более точные результаты. Компьютеры не могут определять роль бактерий в организме, но они могут помочь исследователям предсказать функцию гена в бактериальном геноме.
Антагонизм, как один из типов взаимоотношений живых организмов, является сложным для изучения. Если описывать это взаимоотношение простыми словами, то бактерия производит противогрибковое средство, убивая грибок. Это то, что предсказывает компьютер. В реальности, антагонизм намного более динамичен. Наличие гена в геноме не означает, что ген постоянно активен. Компьютер не может предсказать существование других факторов, влияющих на производство противогрибкового компонента. Должен ли присутствовать физический контакт между грибком и бактерией, чтобы бактерии начали производить противогрибковое средство? Какие условия вызывают такое поведение?
Выработка противогрибковых веществ – это не единственный пример антагонизма. Иногда, бактерии могут просто занимать слишком много места в окружающей среде и употреблять большое количество питательных веществ, что заставляет другие микроорганизмы искать новую среду обитания или же умереть от голода. Другой пример антагонизма среди микроорганизмов включает себя хозяина. Микробы могут манипулировать организмом-хозяином, заставляя его усиливать работу иммунной системы для противостояния атаки патогенов.
Такие сложные взаимодействия невозможно уловить с помощью компьютера. Также стоит отметить, что компьютеры не всегда выдают безошибочные результаты, и даже их прогнозы могут быть неверными. Несмотря на это, машинное обучение и другие методы биоинформатики помогают исследователям изучать сложные и динамичные взаимодействия между растениями и микробами с невиданной ранее скоростью! Но, биоинформатика и машинное обучение не заменяют биологию. Они работают в команде.
После завершения компьютерного анализа, результаты должны быть обязательно рассмотрены с точки зрения биологии. Прогнозы, сделанные компьютером, должны быть проверены в реальных условиях. Что является огромным плюсом в технике машинного обучения, это что ее можно применить в любой ситуации! В данном эксперименте, ученые изучали бактерии, способные уничтожить определенный грибок. Но, такой метод машинного обучения можно применить для поиска микробов, вызывающих болезни у людей, или микробов, которые могут помочь в борьбе с изменением климата. Это может значительно сократить время, затраченное на исследования, и помочь ученым сосредоточить свои силы на решении проблемы.

В заключении стоит отметить, что исследователи могут использовать компьютеры для прогнозирования полезных и вирулентных функции бактерий в различных средах обитания. Компьютеры могут помочь сократить группу из тысячи потенциально подходящих микробов до менее чем сотни. Благодаря этому, исследователи могут сэкономить время, и сосредоточиться на тестировании этих микробов в реальных экспериментах.
Перевод был сделан Марией Мартыновой