Ученые разработали нейросеть для «разметки» генов
Российский исследовательский институт AIRI представил инструмент GENATATOR на основе нейросети для картирования генов по последовательности ДНК. Об этом пишет N+1 со ссылкой на пресс-релиз.
Решение находит границы генов, определяет тип транскрипта и восстанавливает внутреннюю структуру.
ИИ-система состоит из нескольких моделей и работает поэтапно: сперва ищет вероятные начала и окончания транскриптов, затем проверяет участки между ними, уточняет структуру и отфильтровывает сомнительные предположения.
Инструмент рассчитан на идентификацию белок-кодирующих генов и генов длинных некодирующих РНК.
Модели обучили на генах человека и 38 других видов млекопитающих, включая моржей и слонов. Во время тестирования GENATATOR показал хорошие результаты и на других организмах — плодовой мушке, цветке Резуховидке Таля и пекарских дрожжах.
Решение значительно превзошло аналогичные модели по точности.
В AIRI подчеркнули, что в отличие от классических подходов GENATATOR не привязан к поиску отдельных маркеров кодирующих генов вроде старт- и стоп-кодонов и сигналов сплайсинга. Решение запоминает выучивает закономерности в последовательностях ДНК целиком.
Это позволяет применять инструмент к геномным сборкам немодельных организмов без подробных аннотаций.
Теоретически GENATATOR может использоваться для изучения процесса эволюции, поиска новых генов и изучения древних животных. В медицине он полезен в прогнозировании заболеваний, создании индивидуальных лекарств и биотехнологических разработках.
Модели выложили в открытый доступ на Hugging Face. Также доступны веб-сервис и открытый лидерборд для оценки качества.
Локальная версия поддерживает только выполнение на графическом процессоре CUDA с выводом данных в формате float32. Выполнение на центральном процессоре и режимы с более низкой точностью в текущей пока недоступны.
Напомним, в феврале главы OpenAI, Anthropic, Google DeepMind и Microsoft AI подписали открытое письмо с призывом закрепить на законодательном уровне обязательные проверки клиентов и заказов у поставщиков синтетических ДНК и РНК.
Источник: https://forklog.com/news/ai/uchenye-razrabotali-nejroset-dlya-razmetki-genov