Pavel Plyusnin

Data Scientist

Проекты студентов, выполненные под моим руководством

С 2019 года я провожу курс «Объектно-ориентированное программирование» для студентов 3 курса Факультета Биологической и Медицинской Физики МФТИ. За учебный год студенты осваивают Python, а также на его примере знакомятся с основными концепциями и культурой программирования. Во второй половине курса упор сделан на практике: работе с прикладными библиотеками, проектированию собственных приложений, а также проведению био-медицинских исследований при помощи машинного обучения

В конце курса студенты в командах выполняют финальные проекты по темам, которые они сами придумывают и выбирают. Кратко рассказать об этих проектах я сейчас и собираюсь. Год защиты проекта указан в названии в квадратных скобках


Анализ экспрессии генов и процесса метилирования у мышей [2020]

Ельцов Игорь, Подружко Екатерина, Полушкин Александр

В этой работе исследователи изучили связи экспрессии нескольких десятков белков с развитием мутации Ts65Dn у мышей и выделили наиболее важные факторы для ее проявления.

Мыши являются модельными организмами для исследования множества генетических заболеваний, в том числе – синдрома Дауна. Мыши с мутацией Ts65Dn – наиболее изученная модель синдрома Дауна. Будучи модельным организмом для изучения трисомии 21 хромосомы у человека, данные мыши обладают множеством интересных особенностей.

Получив датасет с информацией об экспрессии 60 белков у 1080 мышей, для определения самых значимых белков при отнесении мыши к конкретному генотипу авторы применили как статистические методы, так и методы машинного обучения, начиная с метода опорных векторов, заканчивая случайными лесами и нейронными сетями.

Кроме того, исследователи использовали данные BS- и MAB-секвенирования для нервных клеток. Используя эти два секвенирования, они нашли деметилированные участки и различия между активным и пассивным деметилированием. Построив квазибиномиальную модель, они выявили значимые области с наибольшей разницей в метилировании между различными типами клеток.

Подробно ознакомиться с проведенной работой вы можете здесь.

Использование глубоких нейронных сетей для для обнаружения одно-молекулярных событий по данным патч-клэмпа [2020]

Рыбашлыков Дмитрий, Калашников Павел, Бурцева Анна

Методы исследования одной молекулы фиксируют движение отдельных белков в режиме реального времени, незаметное при усреднении по ансамблю целых клеток. Критическим первым шагом в анализе является обнаружение событий, так называемая «идеализация», когда зашумленные необработанные данные превращаются в дискретные записи движения белка. На сегодняшний день существуют практические ограничения в идеализации данных патч-зажимов. Идеализация высокого качества трудоемка для сложных биологических данных. Целью авторов являлась идеализация сложной активности одной молекулы точнее и быстрее, чем в традиционных методах, используя модель глубокого обучения, основанную на сверточных нейронных сетях, и архитектуру долгосрочной краткосрочной памяти.

Для проведения экспериментов, исследователи написали генератор, моделирующий пэтч-кламп данные для различного числа каналов, и сделали нейронную сеть, распознающую число открытых каналов.

Известно, что ионные каналы контролируют широкий спектр процессов посредством контроля мембранного потенциала. Потеря или нарушение регуляции ионных каналов непосредственно лежит в основе многих заболеваний человека и животных, включая сердечно-сосудистые заболевания, поэтому данная работа очень важна.

Подробно ознакомиться с проведенной работой вы можете здесь.

Нейросетевое выделение клеток с лабораторных снимков [2020]

Белоусов Анатолий, Дашевский Дмитрий, Ильина Анастасия

В данном проекте исследователи создали нейронную сеть для распознавания клеток и их выделения на фоне остальной информации на изображении с микроскопа. Также авторы написали несколько сетей, для определения числа клеток на изображении. Авторы рассмотрели несколько архитектур для решения этих задач, а также много времени уделили поискам оптимальных параметров. Автоматизация определения количества клеток позволит быстро анализировать большой массив данных для внесение в базу или для дальнейших исследований.

Подробно ознакомиться с проведенной работой вы можете здесь.

Нейросетевое выделение клеток с лабораторных снимков [2021]

Волков Сергей, Казиахмедова Самира

Этот проект получил развитие в следующем году. Сергей и Самира переработали подход предыдущей команды и построили свою модель для решения этой задачи. Кроме того, исследователи сделали пользовательский интерфейс, позволяющий удобно загружать снимки, обрезать в них нужные области, получать графический результат поверх оригинального изображения: какие клетки были успешно распознаны. Такое улучшение позволяет пользователям этой программы убедиться, что все клетки были корректно посчитаны, а при необходимости подправить результат на глаз.

Подробно ознакомиться с проведенной работой вы можете здесь.

Обзор алгоритмов выравнивания последовательностей и построение филогенетического дерева [2020]

Шарафутдинов Эмиль, Блохина Яна

Целью проекта является определение степени родства различных видов вирусов. В данной работе авторы анализируют алгоритмы выравнивания при решении задачи поиска общих генов и сравнивают гены различных вирусов. Исследователи проводили выравнивание последовательностей с использованием трёх алгоритмов: алгоритма Нидлмана-Вунша, Fasta и BLAST.

В основе этой работы лежит интерес авторов к молекулярной филогенетике — науке устанавливающей и исследующей родственные связи между живыми организмами на основании изучения структуры полимерных макромолекул — ДНК, РНК и белков. Результатом молекулярно-филогенетического анализа является построение филогенетического дерева живых организмов, которое отражает их гипотетический ход эволюции. Близкое родство между живыми организмами обычно сопровождается большой степенью сходства в строении тех или иных макромолекул, а молекулы не родственных организмов сильно различаются между собой.

Подробно ознакомиться с проведенной работой вы можете здесь.

Сборщик генома, основанный на графе де Брёйна и выравниватель последовательностей, основанный на преобразовании Барроуза – Уиллера [2021]

Герасимова Алёна, Васильева Елена

Предыдущий проект тоже получил развитие в следующем году. На этот раз целью проекта стала реализация сборщика генома, основанного на графе де Брёйна, а также выравнивателя последовательностей, основанного на преобразовании Барроуза-Уиллера. Эти механизмы позволяют изучать строение биополимеров с помощью данных, полученных секвенированием.

Исследователи детально изучили алгоритмы и написали свою библиотеку в объектно-ориентированном подходе для внутреннего пользования.

Подробно ознакомиться с проведенной работой вы можете здесь.

Движок для Tower-Defense игры и обучение интеллектуального агента для игры в нее [2020]

Руппель Лео, Михаил Олиференко

В этом проекте авторы написали обучаемого интеллектуального агента для прохождения игры в жанре Tower-Defense. Исследователи написали собственный движок игры, поддерживающий 7 различных башен и 8 видов врагов. В игре выдержан хороший баланс: каждая башня хороша по своему и эффективна против определенных врагов.

Интеллектульаный агент обучается засчет Q-learning стратегии.

Подробно ознакомиться с проведенной работой можно, обратившись к авторам

Приключенческий 2D-платформер [2021]

Хрипливый Данила, Золкин Алексей

На следующий год у студентов снова возникло желание написать свою игру, на этот раз — платформер. Разработчики придумали свою концепцию, подобрали подходящие текстуры и написали код игры при помощи библиотеки Arcade на Python. Получился крепкий 2D-платформер с реализованными механиками передвижения, падений и прыжков, атаки, смерти и перехода на следующий уровень. В игре реализовано два уровня с различным набором уникальных врагов.

Также разработчики планировали написать своего интеллектуального агента для прохождения этой игры, но качественный результат не был получен из-за нехватки времени. Однако, этот факт не умаляет качество самой игры.

Подробно ознакомиться с проведенной работой вы можете здесь.

Нейросетевое раскрашивание черно-белых аниме-эскизов [2021]

Реганова Елизавета, Фомичёва Светлана, Сигова Елизавета

Задачей проекта было реализовать программу для раскрашивания черно-белых аниме-эскизов с возможностью управления цветовыми палитрами. Интерфейс программы был реализован с помощью PyQt6, а в качестве рабочего метода использовались генеративные состязательные сети (GAN). Идея проекта была подчерпнута из статьи.

Подробно ознакомиться с проведенной работой вы можете здесь.

Добавить комментарий

Your email address will not be published. Required fields are marked *.

*
*
You may use these <abbr title="HyperText Markup Language">HTML</abbr> tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>