Dmitrii R.

Математик, статистик, биолог, программист, биоинформатик

Работа на полный день, желательно удаленная, гибкий график.

Предпочтительна исследовательская работа, в которой требуется умение манипулировать информацией из разных областей знаний, будь то биология, математика, информатика, статистика.

Разработка ПО на Java, написание скриптов и реализация конвейеров на bash, статиcтический анализ в R.

Область интересов:

  • сравнительная геномика;
  • поиск мотивов;
  • биологические базы данных;
  • анализ регуляторных районов генов;
  • поиск соотношений генотип-фенотип;
  • редактирование генома,
  • анализ микробиома.

Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw

Последнее обновление резюме 03.10.2019
Адрес Ростов-на-Дону, Russian Federation
Электронная почта Заблокировано
Телефон Заблокировано
Соцсеть или сайт Заблокировано

Опыт

АТЛАС
Биоинформатик-аналитик
Апр 2019 - Июн 2019
Статистический анализ данных микробиоты:
1. поиск факторов, влияющих на состав микробиоты;
2. поиск корреляций между факторами;
3. построение регрессионных моделей.
Все делалось в R/Linux/bash.

Параллельно реализовывал учет популяционной структуры в GWAS с помощью линейных смешанных моделей (linear mixed models) с помощью GEMMA.
Genotek
Биоинформатик
Ноя 2018 - Апр 2019
1. Статистическая обработка данных;
2. Парсинг данных (R, bash, Java, Python);
3. Работа с vcf-файлами (bcftools/vcftools);
4. Реализация программных конвейеров (bash, parallel);
5. Аннотирование мутаций (snpEff);
6. Поиск полногеномных ассоциаций (plink, smartpca);
7. Генерация отчетов (R, markdown);
Южный федеральный университет
Аспирант биофака
Сен 2014 - Июл 2018
Кафедра генетики.

Диплом об окончании аспирантуры, диссертация подана в совет Институт проблем передачи информации им. А. А. Харкевича РАН.

Квалификация «Исследователь. Преподаватель-исследователь».

Занимался анализом геномных последовательностей и сравнительной геномикой:
• работал со множеством биологических баз данных (NCBI, EMBL, UCSC, EPD, JASPAR, ORegAnno, LNCipedia, miRBase, Pseudogene, dbSUPER, DENdb, VISTA, ENCODE и т.д.); для бд NCBI написал ряд bash-скриптов для автоматического извлечения информации на основе E-utilities;
• изучил алгоритмы и программы для аннотации в геномных последовательностях и поиска мотивов; реализовал программный конвейер для поиска регуляторных последовательностей (использовал Java и bash);
• сильно доработал метод попарного выравнивания последовательностей на основе построения и анализа точечной матрицы гомологий (также известный как дот-плот) и продемонстрировал, как с помощью дот-плота можно осуществить множественное выравнивание последовательностей; реализовал предложенный метод в виде программы на Java с графическим интерфейсом;
• укрепил знания в мат. статистике — важно было очень четко понимать где и какой критерий применим и при выполнении каких условий; как и когда учитывать эффект множественных сравнений.

Тема выпускной квалификационной работы/кандидатской диссертации:
«Анализ связи между структурно-функциональной организацией генома в окрестности регулирующих рост генов и морфо-физиологическими характеристиками млекопитающих».
Специальность: 03.01.09 «Математическая биология и биоинформатика».


В работе показано, где и как в последовательности ДНК различных видов млекопитающих могут быть «записаны» основные морфо-физиологические характеристики такие, как масса и размер тела взрослого животного, период полового созревания и продолжительность жизни. Предложены мишени для CRISPR/Cas9 редактирования некоторых участков ДНК в окрестности регулирующих рост генов с целью изменения фенотипа.
Южный федеральный университет
Младший научный сотрудник
Сен 2012 - Текущий
1. Поиск сайтов связывания микроРНК в некодирующией ДНК;
2. Поиск гомологий, выравнивание, построение филогенетических деревьев;
3. Определение взаимосвязи между количеством и расположением обнаруженных сайтов и фенотипическими характеристиками млекопитающих;
4. Работа с биологическими базами данных регуляторных последовательностей (ТФ, энхансеры, промоторы, DHS-регионы).
Южный федеральный университет
Биофак, магистр (2ое высшее)
Сен 2012 - Июл 2014
Кафедра генетики.

Диплом магистра с отличием.
Работал с генными сетями:
• Занимался биоинформатическим анализом генных регуляторных сетей.
• Изучал механизмы регуляции экспрессии и взаимодействия генов.
• Осуществлял биоинформатический анализ последовательностей регуляторных некодирующих районов генов, в частности, поиск сайтов микроРНК.

Тема магистерской диссертации (2ое образование): «Аннотация некодирующией белок ДНК вокруг генов соматотропной оси у различных видов животных».
Южный федеральный университет
Аспирант НИИ Нейрокибернетики им. А. Б. Когана
Сен 2010 - Июл 2011
Лаборатория нейросетей.

Разрабатывал на Java симуляционную графическую среду для моделирования роста нейронов.

Отчислился из аспирантуры по собственному желанию с целью получения второго образования. Сдал вступительные экзамены в магистратуру биофака ЮФУ.
Южный федеральный университет
Аспирант мехмата
Окт 2009 - Июл 2010
Кафедра прикладной математики и программирования.

Сдавал кандидатский минимумы, продолжал работу в теории игр. Заинтересовался нейронными сетями. После сдачи кандидатских минимумов перевелся в аспирантуру НИИ Нейрокибернетики им. А. Б. Когана (Ростов-на-Дону).
Южный федеральный университет
Мехмат, магистр
Июл 2007 - Июл 2009
Диплом магистра прикладной математики и информатики.

Факультет прикладной математики и информатики.
Кафедра прикладной математики и информатики,

Занимался теорией игр, в частности, теоретико-игровыми моделями в экономике. Вдохновился курсами «Java и многопоточное программирование» (с этого момента Java стал для меня основным языком) и «Искусственный интеллект и нейронные сети».

Тема магистерской диссертации: «Сравнительный анализ методов управления эколого-эко­но­мическими системами».
Южный федеральный университет
Мехмат, бакалавр
Сен 2003 - Июл 2007
Диплом бакалавра прикладной математики и информатики.

Факультет прикладной математики и информатики.
Кафедра прикладной математики и программирования.

Занимался компьютерной графикой, программировал на C/C++/Pascal/Asm, освоил DirectX.

Тема выпускной работы: «Создание библиотеки классов 3-х мерного объекта типа “Минерал”».

В чем вы сильны?

Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw

Компьютерные навыки:

  • Более 10 лет Linux в качестве настольной системы: начинал со Slackware, потом немного rolling-release ArchLinux, остановился на Debian — просто и стабильно.
  • Более 10 лет Java в качестве основного языка.

    Разрабатывал графические и многопоточные программы:
  • Понимаю отличие реализации Runnable от наследования Thread, блока sychronized от ReentrantLock.lock;
  • Знаю несколько приемов, чтобы избегать взаимных блокировок;
    Реализовывал интерфейсы Callable, Future, использовал FutureTask;
  • Использовал пул потоков (Executors);
  • Применял неблокирующую многопоточность (volatile-переменные, AtomicInteger);
  • Осознаю связь между многопоточностью и реализацией пользовательского интерфейса (главный поток/поток событий);
  • Писал обработчики событий пользовательского интерфейса (Listener’ы и Adapter’ы).

    В своих проектах использовал библиотеки:

  • BioJava (биоинформатика),
  • XPath, JSON-Java (парсинг данных),
  • JGraph/JGraphT (алгоритмы на графах),
  • Jaybird/Sqlite-jdbc (базы данных/SQL),
  • Neuroph, JavaML (машинное обучение, нейросети),
  • Библиотеки семейства Apache Commons (cli, io, lang),
  • Jama, JavaMI, Apache Common-Math (математика, статистика),
  • JFreeChart, Xerces (визуализация данных),
  • Системы сборки Maven и Ant.

    С помощью Neuroph реализовал систему поддержки принятия решений для медиков-акушеров; будучи обученной, система с точностью 85% предсказывала по профилю полиморфизмов матери наиболее вероятные осложнения при родах.

    Разработал графическую программу для построения и анализа точечных матриц гомологий, с помощью которой обрабатывал геномные данные.

  • Остальные ЯП:
  • bash + grep, sed, awk, parallel и другие инструменты — основные средства для автоматизации и написания конвейеров;
  • R, BioConductor — быстрое прототипирование статистических расчетов, парсинг и визуализация данных;
  • Python, BioPython — научные расчеты;
  • C/C++/Asm — системное низкоуровневое программирование, реализация критически важных по скорости и коротких подпрограмм;
  • SQL — СУБД Firebird, SQLite;
  • Мат. пакеты MATLAB, Maple, GNU/Octave, Mathematica (научные расчеты);
  • Pascal, Perl, PHP, JavaScript.
  • Сертификаты с отличием (решил 100/100) онлайн-курсов на Stepic:

  • «Введение в Linux» https://stepik.org/cert/4209
  • «Программирование на Python» https://stepik.org/cert/2485
  • «Основы программирования на R» https://stepik.org/cert/141638
  • «Анализ данных в R» https://stepik.org/cert/142547
  • «Молекулярная биология и генетика» https://stepik.org/cert/3286
  • «Математическая статистика» https://stepik.org/cert/150337
  • Статистические анализаторы кода (линтеры):
    Java (FindBugs);
    bash (shellcheck);
    C/C++ (cppcheck).
  • Комментирование кода, написание и генерация документации (javadoc).
  • Система контроля версий Git (использовал также при написании научных статей и текста диссера).
  • Сетевые технологии: модель OSI, протоколы, маршрутизация, межсетевой экран Linux, балансировка и приоритезация трафика, туннели и VPN.
  • Система компьютерной верстки LATEXв связке с bibTEX, PGF и TkiZ. Выпускную работу в магистратуре биофака и кандидатскую диссертацию верстал именно в LATEX, пакет disser, библиография в bibTEX, иллюстрации и графики делал с использованием TkiZ. Научные статьи тоже верстаю в LATEX.
  • Компьютерное железо: сборка, замена комплектующих, диагностика неисправностей, несложный ремонт (перепайка конденсаторов, замена BIOS).

Биоинформатика:

  • Базы данных NCBI/EMBL: поиск и чтение научных статей (PubMed), геномные данные (Gene, Genomes, dbSNP, dbVar и т.п.); EPD, JASPAR, ORegAnno, LNCipedia, miRBase, Pseudogene, dbSUPER, DENdb, VISTA, ENCODE, CONDOR. Реализовал ряд автоматизированных средств для извлечения информации из этих бд.
  • Геномные браузеры: UCSC, UGENE, Argo, JBrowse, BugView.
    Программы для выравнивания и поиска гомологий: семейство BLAST, пакет MEME Suite (glam2, glam2scan), Miranda (поиск микроРНК), RepeatMasker (повторы), snpEff (аннотация генома),
  • Точечные матрицы гомологий (дотплоты): dotolog (собственная разработка, возможность отображения/добавления аннотаций в интерактивном режиме), gepard (возможность строить полногеномные дотплоты),
  • Пакет BioJava: парсинг GenBank/FASTA файлов, работа с элементами последовательности (Features) и локациями (Location). Дополнил библиотеку своими классами.
  • Манипуляции с геномными данными: bedtools, bcf/vcftools.
  • Статистика/GWAS: plink, EIGENSOFT Smartpca.

Теория вероятностей и мат. статистика:

  • Умею поставить и формализовать задачу, интерпретировать результаты.
  • Знаю классические критерии, для чего нужны и условия их применения.
  • Ошибки 1-го и 2-го рода, что такое «значимо» и p-значение; умею рассчитывать чувствительность (когда значимого различия не обнаружено и требуется знать, с какой вероятностью действительные различия были бы обнаружены).
  • Отличаю коэфф. корреляции Пирсона от Спирмена (и вообще, параметрические критерии от непараметрических).
  • Умею обнаруживать и решать проблемы множественного сравнения: поправка Бонферрони, рассчет FDR.
  • Реализовывал классификацию последовательностей (промотор–не промотор; нужно было по диссеру) с помощью скрытых марковских моделей.
  • Связь между энтропией и информацией; применял метод направленной информации для построения генных регуляторных сетей на основе микрочиповых данных по изменению экспрессии.
  • Строил наивный байесовский классификатор и сравнивал его эффективность с классификатором на основе нейросетей.

Владение языками:
Английский, свободно пишу и разговариваю.
По работе постоянно занимаюсь чтением и переводом англоязычных научных статей по тематике исследований. Полностью написал и подал в рецензируемые журналы 2 научных статьи по теме диссертации; одну из них уже приняли к публикации.
Техническую литературу (мануалы, документацию) предпочитаю читать в оригинале; фильмы и сериалы смотрю исключительно в оригинале.

Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw

 

Расскажите о себе что-нибудь еще: публикации, конференции, хобби

Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw

Образовательная деятельность

  • Организую и провожу междисциплинарные семинары по биоинформатике для студентов мехмата и биофака ЮФУ. Выступал с докладами на следующие темы:
  1. Актуальные проблемы биоинформатики;
  2. Теломерный контроль генов регуляции роста у млекопитающих;
  3. Разбор задач Stepik Bioinformatics Contest 2017;
  4. Почему животные растут до определенного размера: где и как эта информация записана в геноме?
  5. Genome annotations: approaches to storage and processing;
  6. Alu-элементы как предполагаемый источник сайтов микро-РНК в геноме человека;
  7. Актуальные проблемы биоинформатики;
  8. Инновационная генетика;
  9. Аннотирование биопоследовательностей;
  10. Введение в агентное моделирование;
  11. Классификация биологических последовательностей с помощью скрытых марковских моделей;
  12. Реконструкция эволюции профиля экспрессии генов на примере E. coli;
  13. Построение и анализ точечной матрицы гомологии;
  14. Автоматизированный поиск мотивов и аннотация последовательностей;
  15. Язык R;
  16. Подходы к моделированию динамики сетей экспрессии генов;
  17. Применение метода направленной информации для построения генных регуляторных сетей;
  18. Подходы к построению модели клеточной дифференцировки;
  19. KEGG API;
  20. Булевы сети;
  21. Алгоритм Гиллеспи.
  • Обучаясь в аспирантуре биофака, самостоятельно составил программу и вел курс «Биологические базы данных» у магистров 1-го года биофака ЮФУ.
  • Готовил школьников по направлениям «Математика» и «Информатика» в государственном бюджетном учреждении дополнительного образования Ростовской области «Областной центр дополнительного образования детей» (https://ocdod.ru/).
  • Регулярно принимаю участие в качестве эксперта-биолога на научных мероприятиях, организуемых Информационным центром по атомной энергии Ростова-на-Дону (http://rostov.myatom.ru/), проводил публичные научно-популярные лекции и участвовал в обсуждении научных новостей.

 

Естественные науки

Предпочитаю сложные и нестандартные задачи из разных областей знаний:

  • Математика: фундаментальные дисциплины такие, как мат. анализ, дифф. ур-я и ур-я мат. физики, численный методы, линейная алгебра и геометрия, теория оптимизации, вариационное исчисление.
  • Биология: сравнительная геномика, анализ биологических последовательностей, структурно-функци­ональная организация генома млекопитающих, транскрипция, эпигенетика.
  • Со школы увлекаюсь решением олимпиадных задач по математике (вплоть до задач с международных олимпиад) — привлекают простые формулировки и красивые решения.
  • 6-ое место в международных соревнованиях по биоинформатике «Stepik Bioinformatics Contest 2017». В 2018 прошел квалификацию, занял в финале 128-ое место, а в 2019 — 132-ое среди более чем 3000 участников со всего мира.
    Победитель «Хаброквеста-2018» от MAIL.RU GROUP (https://puzzle.mail.ru/).
  • Представлял свой проект по обработке данных с экспрессионных микро-чипов на хакатоне по биоинформатике «GENEHACK-2015».

 

Избранные публикации

  1. Predictive diagnostics of newborn pathologies based on Neuroph software framework / D. E. Romanov, T. P. Shkurat, A. V. Antonenko et al. // Annals Academy of Medicine Singapore. — Vol. 45. — 2016. —9. — P. 166.
  2. Genome distance between growth-regulating genes and telomeres is correlated with morpho-physiological traits in mammals / D. E. Romanov, E. V. Butenko, G. B. Bakhtadze, T. P. Shkurat // Gene Reports. — 2019. — Vol. 14. — P. 124–128.
  3. Романов Д. Е. Масса и размер тела млекопитающих скоррелированы с расстоянием между некоторыми элементами генома в окрестности генов регуляции роста // XXV Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов 2018». — г. Москва, 2018. — 4.
  4. Романов Д. Е., Шкурат Т. П. Закономерности в расположении на хромосоме генов, регулирующих массу и размер тела млекопитающих // Материалы научно-практической конференции с международным участием «Генетика — фундаментальная основа инноваций в медицине и селекции». — г. Ростов-на-Дону : Издательство ЮФУ, 2017. — 11. — С. 104–105.
  5. Романов Д. Е., Шкурат Т. П. Закономерности в организации генома в окрестностях генов, регулирующих массу и размер тела млекопитающих // Материалы научно-практической конференции с международным участием «Генетика — фундаментальная основа инноваций в медицине и селекции». — г. Ростов-на-Дону : Издательство ЮФУ, 2017. — 11. — С. 102–103.
  6. Романов Д. Е. MSCANNER — a genome-wide motif finding tool // Материалы 7-й Международной Школы молодых ученых «Системная биология и биоинформатика» SBB-2015 / Под ред. А. В. Харкевич; Институт цитологии и генетики СО РАН. — г. Новосибирск : ФГУП «Издательство СО РАН», 2015. — С. 40.
  7. Анализ последовательностей геномов с помощью точечной матрицы гомологий / Н. С. Пономарева, Д. Е. Романов, А. И. Бутенко и др. // Материалы V Междунар. науч.-практ. конф. «Актуальные проблемы биологии, нанотехнологий и медицины» / Под ред. Ю. А. Пехтеревой ; НИИ биологии ЮФУ. — г. Ростов-на-Дону : Издательство ЮФУ, 2013. — 10. — С. 38–39.
  8. Свидетельство о государственной регистрации программы для ЭВМ No2016663454. Dotolog: Программа для автоматизации визуального анализа дотплот-изображений нуклеотидных последовательностей ДНК / Д. Е. Романов, Т. П. Шкурат – Заявка No2016661011. Дата поступления 18 октября 2016 г. Зарегистрировано в Реестре программ для ЭВМ 07 декабря 2016 г.
  9. Свидетельство о государственной регистрации программы для ЭВМ No2016663454. Mscanner: Программа для автоматического поиска мотивов в последовательности ДНК / Д. Е. Романов, Н. С. Ксёнз – Заявка No2016661028. Дата поступления 18 октября 2016 г. Зарегистрировано в Реестре программ для ЭВМ 25 ноября 2016 г.

Увлечения/спорт

  • Горные лыжи, Freeride. Учился сам, верхний любительский уровень. Предпочитаю технически сложные места с дропами и лесом (поэтому нелегко найти с кем катать).
  • Горный туризм в формате speedrun. Интересны пусть и короткие, но наиболее технически сложные участки. Максимум ходил 1B.
  • Горный велосипед, дисциплина кросскантри. Победитель областных соревнований. Пару раз ездил марафоны 200 км. Сейчас больше люблю катать на технику — это триал и стрит-триал.
  • Нападающий любительской хоккейной команды.
  • Контраварийное вождение автомобиля и мотоцикла. Самостоятельно регулярно отрабатываю элементы на полигоне.

 

Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw