Dmitrii R.
Математик, статистик, биолог, программист, биоинформатикРабота на полный день, желательно удаленная, гибкий график.
Предпочтительна исследовательская работа, в которой требуется умение манипулировать информацией из разных областей знаний, будь то биология, математика, информатика, статистика.
Разработка ПО на Java, написание скриптов и реализация конвейеров на bash, статиcтический анализ в R.
Область интересов:
- сравнительная геномика;
- поиск мотивов;
- биологические базы данных;
- анализ регуляторных районов генов;
- поиск соотношений генотип-фенотип;
- редактирование генома,
- анализ микробиома.
Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw
Последнее обновление резюме | 03.10.2019 |
Адрес | Ростов-на-Дону, Russian Federation |
Электронная почта | Заблокировано |
Телефон | Заблокировано |
Соцсеть или сайт | Заблокировано |
Опыт
Биоинформатик-аналитик
1. поиск факторов, влияющих на состав микробиоты;
2. поиск корреляций между факторами;
3. построение регрессионных моделей.
Все делалось в R/Linux/bash.
Параллельно реализовывал учет популяционной структуры в GWAS с помощью линейных смешанных моделей (linear mixed models) с помощью GEMMA.
Биоинформатик
2. Парсинг данных (R, bash, Java, Python);
3. Работа с vcf-файлами (bcftools/vcftools);
4. Реализация программных конвейеров (bash, parallel);
5. Аннотирование мутаций (snpEff);
6. Поиск полногеномных ассоциаций (plink, smartpca);
7. Генерация отчетов (R, markdown);
Аспирант биофака
Диплом об окончании аспирантуры, диссертация подана в совет Институт проблем передачи информации им. А. А. Харкевича РАН.
Квалификация «Исследователь. Преподаватель-исследователь».
Занимался анализом геномных последовательностей и сравнительной геномикой:
• работал со множеством биологических баз данных (NCBI, EMBL, UCSC, EPD, JASPAR, ORegAnno, LNCipedia, miRBase, Pseudogene, dbSUPER, DENdb, VISTA, ENCODE и т.д.); для бд NCBI написал ряд bash-скриптов для автоматического извлечения информации на основе E-utilities;
• изучил алгоритмы и программы для аннотации в геномных последовательностях и поиска мотивов; реализовал программный конвейер для поиска регуляторных последовательностей (использовал Java и bash);
• сильно доработал метод попарного выравнивания последовательностей на основе построения и анализа точечной матрицы гомологий (также известный как дот-плот) и продемонстрировал, как с помощью дот-плота можно осуществить множественное выравнивание последовательностей; реализовал предложенный метод в виде программы на Java с графическим интерфейсом;
• укрепил знания в мат. статистике — важно было очень четко понимать где и какой критерий применим и при выполнении каких условий; как и когда учитывать эффект множественных сравнений.
Тема выпускной квалификационной работы/кандидатской диссертации:
«Анализ связи между структурно-функциональной организацией генома в окрестности регулирующих рост генов и морфо-физиологическими характеристиками млекопитающих».
Специальность: 03.01.09 «Математическая биология и биоинформатика».
В работе показано, где и как в последовательности ДНК различных видов млекопитающих могут быть «записаны» основные морфо-физиологические характеристики такие, как масса и размер тела взрослого животного, период полового созревания и продолжительность жизни. Предложены мишени для CRISPR/Cas9 редактирования некоторых участков ДНК в окрестности регулирующих рост генов с целью изменения фенотипа.
Младший научный сотрудник
2. Поиск гомологий, выравнивание, построение филогенетических деревьев;
3. Определение взаимосвязи между количеством и расположением обнаруженных сайтов и фенотипическими характеристиками млекопитающих;
4. Работа с биологическими базами данных регуляторных последовательностей (ТФ, энхансеры, промоторы, DHS-регионы).
Биофак, магистр (2ое высшее)
Диплом магистра с отличием.
Работал с генными сетями:
• Занимался биоинформатическим анализом генных регуляторных сетей.
• Изучал механизмы регуляции экспрессии и взаимодействия генов.
• Осуществлял биоинформатический анализ последовательностей регуляторных некодирующих районов генов, в частности, поиск сайтов микроРНК.
Тема магистерской диссертации (2ое образование): «Аннотация некодирующией белок ДНК вокруг генов соматотропной оси у различных видов животных».
Аспирант НИИ Нейрокибернетики им. А. Б. Когана
Разрабатывал на Java симуляционную графическую среду для моделирования роста нейронов.
Отчислился из аспирантуры по собственному желанию с целью получения второго образования. Сдал вступительные экзамены в магистратуру биофака ЮФУ.
Аспирант мехмата
Сдавал кандидатский минимумы, продолжал работу в теории игр. Заинтересовался нейронными сетями. После сдачи кандидатских минимумов перевелся в аспирантуру НИИ Нейрокибернетики им. А. Б. Когана (Ростов-на-Дону).
Мехмат, магистр
Факультет прикладной математики и информатики.
Кафедра прикладной математики и информатики,
Занимался теорией игр, в частности, теоретико-игровыми моделями в экономике. Вдохновился курсами «Java и многопоточное программирование» (с этого момента Java стал для меня основным языком) и «Искусственный интеллект и нейронные сети».
Тема магистерской диссертации: «Сравнительный анализ методов управления эколого-экономическими системами».
Мехмат, бакалавр
Факультет прикладной математики и информатики.
Кафедра прикладной математики и программирования.
Занимался компьютерной графикой, программировал на C/C++/Pascal/Asm, освоил DirectX.
Тема выпускной работы: «Создание библиотеки классов 3-х мерного объекта типа “Минерал”».
В чем вы сильны?
Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw
Компьютерные навыки:
- Более 10 лет Linux в качестве настольной системы: начинал со Slackware, потом немного rolling-release ArchLinux, остановился на Debian — просто и стабильно.
- Более 10 лет Java в качестве основного языка.
Разрабатывал графические и многопоточные программы:
- Понимаю отличие реализации Runnable от наследования Thread, блока sychronized от ReentrantLock.lock;
- Знаю несколько приемов, чтобы избегать взаимных блокировок;
Реализовывал интерфейсы Callable, Future, использовал FutureTask; - Использовал пул потоков (Executors);
- Применял неблокирующую многопоточность (volatile-переменные, AtomicInteger);
- Осознаю связь между многопоточностью и реализацией пользовательского интерфейса (главный поток/поток событий);
- Писал обработчики событий пользовательского интерфейса (Listener’ы и Adapter’ы).
В своих проектах использовал библиотеки:
- BioJava (биоинформатика),
- XPath, JSON-Java (парсинг данных),
- JGraph/JGraphT (алгоритмы на графах),
- Jaybird/Sqlite-jdbc (базы данных/SQL),
- Neuroph, JavaML (машинное обучение, нейросети),
- Библиотеки семейства Apache Commons (cli, io, lang),
- Jama, JavaMI, Apache Common-Math (математика, статистика),
- JFreeChart, Xerces (визуализация данных),
- Системы сборки Maven и Ant.
С помощью Neuroph реализовал систему поддержки принятия решений для медиков-акушеров; будучи обученной, система с точностью 85% предсказывала по профилю полиморфизмов матери наиболее вероятные осложнения при родах.
Разработал графическую программу для построения и анализа точечных матриц гомологий, с помощью которой обрабатывал геномные данные.
- Остальные ЯП:
- bash + grep, sed, awk, parallel и другие инструменты — основные средства для автоматизации и написания конвейеров;
- R, BioConductor — быстрое прототипирование статистических расчетов, парсинг и визуализация данных;
- Python, BioPython — научные расчеты;
- C/C++/Asm — системное низкоуровневое программирование, реализация критически важных по скорости и коротких подпрограмм;
- SQL — СУБД Firebird, SQLite;
- Мат. пакеты MATLAB, Maple, GNU/Octave, Mathematica (научные расчеты);
- Pascal, Perl, PHP, JavaScript.
-
Сертификаты с отличием (решил 100/100) онлайн-курсов на Stepic:
- «Введение в Linux» https://stepik.org/cert/4209
- «Программирование на Python» https://stepik.org/cert/2485
- «Основы программирования на R» https://stepik.org/cert/141638
- «Анализ данных в R» https://stepik.org/cert/142547
- «Молекулярная биология и генетика» https://stepik.org/cert/3286
- «Математическая статистика» https://stepik.org/cert/150337
- Статистические анализаторы кода (линтеры):
Java (FindBugs);
bash (shellcheck);
C/C++ (cppcheck). - Комментирование кода, написание и генерация документации (javadoc).
- Система контроля версий Git (использовал также при написании научных статей и текста диссера).
- Сетевые технологии: модель OSI, протоколы, маршрутизация, межсетевой экран Linux, балансировка и приоритезация трафика, туннели и VPN.
- Система компьютерной верстки LATEXв связке с bibTEX, PGF и TkiZ. Выпускную работу в магистратуре биофака и кандидатскую диссертацию верстал именно в LATEX, пакет disser, библиография в bibTEX, иллюстрации и графики делал с использованием TkiZ. Научные статьи тоже верстаю в LATEX.
- Компьютерное железо: сборка, замена комплектующих, диагностика неисправностей, несложный ремонт (перепайка конденсаторов, замена BIOS).
Биоинформатика:
- Базы данных NCBI/EMBL: поиск и чтение научных статей (PubMed), геномные данные (Gene, Genomes, dbSNP, dbVar и т.п.); EPD, JASPAR, ORegAnno, LNCipedia, miRBase, Pseudogene, dbSUPER, DENdb, VISTA, ENCODE, CONDOR. Реализовал ряд автоматизированных средств для извлечения информации из этих бд.
- Геномные браузеры: UCSC, UGENE, Argo, JBrowse, BugView.
Программы для выравнивания и поиска гомологий: семейство BLAST, пакет MEME Suite (glam2, glam2scan), Miranda (поиск микроРНК), RepeatMasker (повторы), snpEff (аннотация генома), - Точечные матрицы гомологий (дотплоты): dotolog (собственная разработка, возможность отображения/добавления аннотаций в интерактивном режиме), gepard (возможность строить полногеномные дотплоты),
- Пакет BioJava: парсинг GenBank/FASTA файлов, работа с элементами последовательности (Features) и локациями (Location). Дополнил библиотеку своими классами.
- Манипуляции с геномными данными: bedtools, bcf/vcftools.
- Статистика/GWAS: plink, EIGENSOFT Smartpca.
Теория вероятностей и мат. статистика:
- Умею поставить и формализовать задачу, интерпретировать результаты.
- Знаю классические критерии, для чего нужны и условия их применения.
- Ошибки 1-го и 2-го рода, что такое «значимо» и p-значение; умею рассчитывать чувствительность (когда значимого различия не обнаружено и требуется знать, с какой вероятностью действительные различия были бы обнаружены).
- Отличаю коэфф. корреляции Пирсона от Спирмена (и вообще, параметрические критерии от непараметрических).
- Умею обнаруживать и решать проблемы множественного сравнения: поправка Бонферрони, рассчет FDR.
- Реализовывал классификацию последовательностей (промотор–не промотор; нужно было по диссеру) с помощью скрытых марковских моделей.
- Связь между энтропией и информацией; применял метод направленной информации для построения генных регуляторных сетей на основе микрочиповых данных по изменению экспрессии.
- Строил наивный байесовский классификатор и сравнивал его эффективность с классификатором на основе нейросетей.
Владение языками:
Английский, свободно пишу и разговариваю.
По работе постоянно занимаюсь чтением и переводом англоязычных научных статей по тематике исследований. Полностью написал и подал в рецензируемые журналы 2 научных статьи по теме диссертации; одну из них уже приняли к публикации.
Техническую литературу (мануалы, документацию) предпочитаю читать в оригинале; фильмы и сериалы смотрю исключительно в оригинале.
Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw
Расскажите о себе что-нибудь еще: публикации, конференции, хобби
Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw
Образовательная деятельность
- Организую и провожу междисциплинарные семинары по биоинформатике для студентов мехмата и биофака ЮФУ. Выступал с докладами на следующие темы:
- Актуальные проблемы биоинформатики;
- Теломерный контроль генов регуляции роста у млекопитающих;
- Разбор задач Stepik Bioinformatics Contest 2017;
- Почему животные растут до определенного размера: где и как эта информация записана в геноме?
- Genome annotations: approaches to storage and processing;
- Alu-элементы как предполагаемый источник сайтов микро-РНК в геноме человека;
- Актуальные проблемы биоинформатики;
- Инновационная генетика;
- Аннотирование биопоследовательностей;
- Введение в агентное моделирование;
- Классификация биологических последовательностей с помощью скрытых марковских моделей;
- Реконструкция эволюции профиля экспрессии генов на примере E. coli;
- Построение и анализ точечной матрицы гомологии;
- Автоматизированный поиск мотивов и аннотация последовательностей;
- Язык R;
- Подходы к моделированию динамики сетей экспрессии генов;
- Применение метода направленной информации для построения генных регуляторных сетей;
- Подходы к построению модели клеточной дифференцировки;
- KEGG API;
- Булевы сети;
- Алгоритм Гиллеспи.
- Обучаясь в аспирантуре биофака, самостоятельно составил программу и вел курс «Биологические базы данных» у магистров 1-го года биофака ЮФУ.
- Готовил школьников по направлениям «Математика» и «Информатика» в государственном бюджетном учреждении дополнительного образования Ростовской области «Областной центр дополнительного образования детей» (https://ocdod.ru/).
- Регулярно принимаю участие в качестве эксперта-биолога на научных мероприятиях, организуемых Информационным центром по атомной энергии Ростова-на-Дону (http://rostov.myatom.ru/), проводил публичные научно-популярные лекции и участвовал в обсуждении научных новостей.
Естественные науки
Предпочитаю сложные и нестандартные задачи из разных областей знаний:
- Математика: фундаментальные дисциплины такие, как мат. анализ, дифф. ур-я и ур-я мат. физики, численный методы, линейная алгебра и геометрия, теория оптимизации, вариационное исчисление.
- Биология: сравнительная геномика, анализ биологических последовательностей, структурно-функциональная организация генома млекопитающих, транскрипция, эпигенетика.
- Со школы увлекаюсь решением олимпиадных задач по математике (вплоть до задач с международных олимпиад) — привлекают простые формулировки и красивые решения.
- 6-ое место в международных соревнованиях по биоинформатике «Stepik Bioinformatics Contest 2017». В 2018 прошел квалификацию, занял в финале 128-ое место, а в 2019 — 132-ое среди более чем 3000 участников со всего мира.
Победитель «Хаброквеста-2018» от MAIL.RU GROUP (https://puzzle.mail.ru/). - Представлял свой проект по обработке данных с экспрессионных микро-чипов на хакатоне по биоинформатике «GENEHACK-2015».
Избранные публикации
- Predictive diagnostics of newborn pathologies based on Neuroph software framework / D. E. Romanov, T. P. Shkurat, A. V. Antonenko et al. // Annals Academy of Medicine Singapore. — Vol. 45. — 2016. —9. — P. 166.
- Genome distance between growth-regulating genes and telomeres is correlated with morpho-physiological traits in mammals / D. E. Romanov, E. V. Butenko, G. B. Bakhtadze, T. P. Shkurat // Gene Reports. — 2019. — Vol. 14. — P. 124–128.
- Романов Д. Е. Масса и размер тела млекопитающих скоррелированы с расстоянием между некоторыми элементами генома в окрестности генов регуляции роста // XXV Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов 2018». — г. Москва, 2018. — 4.
- Романов Д. Е., Шкурат Т. П. Закономерности в расположении на хромосоме генов, регулирующих массу и размер тела млекопитающих // Материалы научно-практической конференции с международным участием «Генетика — фундаментальная основа инноваций в медицине и селекции». — г. Ростов-на-Дону : Издательство ЮФУ, 2017. — 11. — С. 104–105.
- Романов Д. Е., Шкурат Т. П. Закономерности в организации генома в окрестностях генов, регулирующих массу и размер тела млекопитающих // Материалы научно-практической конференции с международным участием «Генетика — фундаментальная основа инноваций в медицине и селекции». — г. Ростов-на-Дону : Издательство ЮФУ, 2017. — 11. — С. 102–103.
- Романов Д. Е. MSCANNER — a genome-wide motif finding tool // Материалы 7-й Международной Школы молодых ученых «Системная биология и биоинформатика» SBB-2015 / Под ред. А. В. Харкевич; Институт цитологии и генетики СО РАН. — г. Новосибирск : ФГУП «Издательство СО РАН», 2015. — С. 40.
- Анализ последовательностей геномов с помощью точечной матрицы гомологий / Н. С. Пономарева, Д. Е. Романов, А. И. Бутенко и др. // Материалы V Междунар. науч.-практ. конф. «Актуальные проблемы биологии, нанотехнологий и медицины» / Под ред. Ю. А. Пехтеревой ; НИИ биологии ЮФУ. — г. Ростов-на-Дону : Издательство ЮФУ, 2013. — 10. — С. 38–39.
- Свидетельство о государственной регистрации программы для ЭВМ No2016663454. Dotolog: Программа для автоматизации визуального анализа дотплот-изображений нуклеотидных последовательностей ДНК / Д. Е. Романов, Т. П. Шкурат – Заявка No2016661011. Дата поступления 18 октября 2016 г. Зарегистрировано в Реестре программ для ЭВМ 07 декабря 2016 г.
- Свидетельство о государственной регистрации программы для ЭВМ No2016663454. Mscanner: Программа для автоматического поиска мотивов в последовательности ДНК / Д. Е. Романов, Н. С. Ксёнз – Заявка No2016661028. Дата поступления 18 октября 2016 г. Зарегистрировано в Реестре программ для ЭВМ 25 ноября 2016 г.
Увлечения/спорт
- Горные лыжи, Freeride. Учился сам, верхний любительский уровень. Предпочитаю технически сложные места с дропами и лесом (поэтому нелегко найти с кем катать).
- Горный туризм в формате speedrun. Интересны пусть и короткие, но наиболее технически сложные участки. Максимум ходил 1B.
- Горный велосипед, дисциплина кросскантри. Победитель областных соревнований. Пару раз ездил марафоны 200 км. Сейчас больше люблю катать на технику — это триал и стрит-триал.
- Нападающий любительской хоккейной команды.
- Контраварийное вождение автомобиля и мотоцикла. Самостоятельно регулярно отрабатываю элементы на полигоне.
Развернутое резюме https://yadi.sk/i/qeiRF3ZyrplFXw