Виктор С.

биоинформатик

Ищу работу на полный день, рассматриваю и удаленную.

Последнее обновление резюме 12.03.2018
Адрес Санкт-Петербург, Russian Federation
Электронная почта Заблокировано
Телефон Заблокировано

Опыт

Biocad
Научный сотрудник
Окт 2016 - Текущий
Занимаюсь организацией сбора, хранения, статистической обработки данных отдела.
Parseq Lab
биоинформатик-аналитик
Авг 2015 - Сен 2016
УлГУ
Ульяновский Государственный Университет
Окт 2010 - Июн 2015
Прошел обучение по специальности биолог в ульяновском государственном университете, на очном отделении. Мой поток являлся последним из обучающихся на специалитете.

В чем вы сильны?

Опыт биоинформатика:

  • Знание Python, R, JavaScript, SQL (работал с PostgreSQL, знание диалекта PL/pgSQL), CQL (для работы с графовой БД Neo4j), Stan;
  • Знание основных библиотек для обработки данных в Python: numpy, scipy, sklearn, pandas и др.;
  • Навыки проведения разведочного анализа данных и моделирования, machine learning (прим.: нейронные сети с помощью Keras, Pytorch, Thensorflow, градиентный бустинг с помощью XGBoost, байесовское моделирование, используя BRMS, Rstanarm, Rstan, опыт работы с другими алгоритмами), используя R и\или Python. В работе стараюсь придерживаться принципов reproducible research;
  • Визуализация данных и создание отчетов используя средства R (Rmarkdown, Shiny), Python (matplotlib, jupyter, docx-template), как в виде документов необходимого формата, так и в виде вэб-страниц, создание интерактивных dashboard используя d3.js;
  • Создание пользовательских интерфейсов в виде вэб-приложений используя Flask и JQuery;
  • Опыт работы с командной строкой в Linux, работал с Bash;
  • Умение разворачивать как сторонние приложения, так и собственные, в среде для автоматизации развёртывания и управления приложениями Docker. Развертывал и администрировал базы данных, собственный репозиторий Gitlab, контейнеризировал биоинформатические приложения;
  • Опыт работы с системой версионирования GIT;
  • Общая культура кода, пример моей работы (открытый код): https://github.com/projections-tech/projections-core
  • Работа с данными секвенирования на разных платформах;
  • Опыт работы и понимание основных форматов представления биологических данных: FASTA, FASTQ, SAM, BAM, BED, VCF (и др.). Знание основных программ для их обработки (samtools, bedtools, vcftools, bcftools, picard-tools, SnpEff, SnpSift, GATK, FastQC и др.), написание скриптов для их обработки и опыт работы с библиотеками для работы с ними;
  • Обработка данных транскриптомных исследований, расчет дифференциальной экспрессии генов как на чипах, так и данных RNA-Seq, анализ активности сигнальных путей (пакеты R: SPIA, TAPPA, ACST, GANPA и др.);
  • Опыт построения пайплайнов обработки и хранения биологических данных в крайне гетерогенных системах, создания как реляционных, так и графовых баз данных. Написание пайплайнов как на чистом Python, так и в системе организации обработки данных Snakemake (основной инструмент построения пайплайнов в моем случае), основанной на Python, с широким опытом его применения от построения конфигурируемого пайплайна de novo сборки геномов до написания пайплайнов variant-calling`а (начиная от сырых данных, кончая готовыми VCF-файлами). Так же имеется опыт написания пайплайнов в Bash и в системе Arvados;
  • Большой опыт работы с базами биологических данных. Опыт написания скриптов для доступа к NCBI, Ensembl, PDB, HGMD, KEGG, COSMIC, REACTOME, PANTHER и другие (пример драйверов для доступа имеется выше), понимание форматов их данных;
  • Опыт в обработке и анализе изображений микрофотографий (работа с библиотекой OpenCV). Работал над анализом изображений ДНК-комет;
  • И другие навыки, которые могут быть полезны для предметной области.

    Опыт биолога:

  • Работа с клеточными культурами линий HeLa, HCT-116, CHO, Jurkat; постановка экспериментов на определение выживаемости клеточной культуры, оксидативного стресса, митохондриального потенциала, соотношения апоптических и некротических клеток после воздействия лазерного излучения.
  • Проводил синтез и очистку праймеров для проведения полимеразной цепной реакции, осуществлял выделение ДНК и РНК, проведение ПЦР.

    Общие навыки:

  • Знаю английский на уровне быстрого прочтения и понимания технической документации;
  • Быстро обучаюсь работе с новыми технологиями, нет плохих инструментов, есть задачи которые необходимо решать.

Расскажите о себе что-нибудь еще: публикации, конференции, хобби

Биология являлась моим основным научным интересом с момента принятия решения получить высшее образование. Закончив первые два курса, я сосредоточил свое внимание на клеточной биологии.

После того, как я освоил навыки культивирования клеточных культур и получил свои первые опытные данные, фокус моего интереса сместился. В моей академической среде обработка данных была основана на монотонном полуавтоматическом труде. Я не видел в таком подходе смысла, поскольку сама работа с культурой (постановка опыта) была хоть и интересной, но занимала довольно большую часть моего времени. С того момента я решил избавить себя и моих коллег от примитивного подхода к обработке данных.

Первым и основным моим языком стал Python. Когда я решил проблему фильтрации лабораторных таблиц, сбора информации из баз данных по генам, вычисления статистики по совокупности имеющихся данным, построения графиков и прочих легко автоматизируемых задач, мне дали задание обучиться анализу экспресии генов. Так я изучил язык R, который обладает подавляющим превосходством в пакетах для обработки данных экспрессии. Впоследствии, я также обучился связывать эти два языка для удобства работы.

Окончив университет, я переехал в Санкт-Петербург, где получил связанную с моими навыками работу, изучил в глубине форматы представления биологических данных, обучился созданию пайплайнов, и получил еще больший опыт в биоинформатике, анализе данных и общем программировании.

На данный момент имею опыт полного сопровождения научных исследований, от этапа сбора необработанных данных с прибора, организации хранения данных, воспроизводимой статистической обработки полученной информации, взаимодействия с внешними ресурсами, и представления полученных результатов. Быстро ориентируюсь в новых методах, легко обучаюсь самостоятельно.

В данный момент мое хобби: экспериментирую с применением deep learning в работе с биологическими данными, вероятностным программированием и байесовской статистикой.