Виктор С.
биоинформатикИщу работу на полный день, рассматриваю и удаленную.
Последнее обновление резюме | 12.03.2018 |
Адрес | Санкт-Петербург, Russian Federation |
Электронная почта | Заблокировано |
Телефон | Заблокировано |
Опыт
Научный сотрудник
биоинформатик-аналитик
Ульяновский Государственный Университет
В чем вы сильны?
Опыт биоинформатика:
- Знание Python, R, JavaScript, SQL (работал с PostgreSQL, знание диалекта PL/pgSQL), CQL (для работы с графовой БД Neo4j), Stan;
- Знание основных библиотек для обработки данных в Python: numpy, scipy, sklearn, pandas и др.;
- Навыки проведения разведочного анализа данных и моделирования, machine learning (прим.: нейронные сети с помощью Keras, Pytorch, Thensorflow, градиентный бустинг с помощью XGBoost, байесовское моделирование, используя BRMS, Rstanarm, Rstan, опыт работы с другими алгоритмами), используя R и\или Python. В работе стараюсь придерживаться принципов reproducible research;
- Визуализация данных и создание отчетов используя средства R (Rmarkdown, Shiny), Python (matplotlib, jupyter, docx-template), как в виде документов необходимого формата, так и в виде вэб-страниц, создание интерактивных dashboard используя d3.js;
- Создание пользовательских интерфейсов в виде вэб-приложений используя Flask и JQuery;
- Опыт работы с командной строкой в Linux, работал с Bash;
- Умение разворачивать как сторонние приложения, так и собственные, в среде для автоматизации развёртывания и управления приложениями Docker. Развертывал и администрировал базы данных, собственный репозиторий Gitlab, контейнеризировал биоинформатические приложения;
- Опыт работы с системой версионирования GIT;
- Общая культура кода, пример моей работы (открытый код): https://github.com/projections-tech/projections-core
- Работа с данными секвенирования на разных платформах;
- Опыт работы и понимание основных форматов представления биологических данных: FASTA, FASTQ, SAM, BAM, BED, VCF (и др.). Знание основных программ для их обработки (samtools, bedtools, vcftools, bcftools, picard-tools, SnpEff, SnpSift, GATK, FastQC и др.), написание скриптов для их обработки и опыт работы с библиотеками для работы с ними;
- Обработка данных транскриптомных исследований, расчет дифференциальной экспрессии генов как на чипах, так и данных RNA-Seq, анализ активности сигнальных путей (пакеты R: SPIA, TAPPA, ACST, GANPA и др.);
- Опыт построения пайплайнов обработки и хранения биологических данных в крайне гетерогенных системах, создания как реляционных, так и графовых баз данных. Написание пайплайнов как на чистом Python, так и в системе организации обработки данных Snakemake (основной инструмент построения пайплайнов в моем случае), основанной на Python, с широким опытом его применения от построения конфигурируемого пайплайна de novo сборки геномов до написания пайплайнов variant-calling`а (начиная от сырых данных, кончая готовыми VCF-файлами). Так же имеется опыт написания пайплайнов в Bash и в системе Arvados;
- Большой опыт работы с базами биологических данных. Опыт написания скриптов для доступа к NCBI, Ensembl, PDB, HGMD, KEGG, COSMIC, REACTOME, PANTHER и другие (пример драйверов для доступа имеется выше), понимание форматов их данных;
- Опыт в обработке и анализе изображений микрофотографий (работа с библиотекой OpenCV). Работал над анализом изображений ДНК-комет;
- И другие навыки, которые могут быть полезны для предметной области.
Опыт биолога:
- Работа с клеточными культурами линий HeLa, HCT-116, CHO, Jurkat; постановка экспериментов на определение выживаемости клеточной культуры, оксидативного стресса, митохондриального потенциала, соотношения апоптических и некротических клеток после воздействия лазерного излучения.
- Проводил синтез и очистку праймеров для проведения полимеразной цепной реакции, осуществлял выделение ДНК и РНК, проведение ПЦР.
Общие навыки:
- Знаю английский на уровне быстрого прочтения и понимания технической документации;
- Быстро обучаюсь работе с новыми технологиями, нет плохих инструментов, есть задачи которые необходимо решать.
Расскажите о себе что-нибудь еще: публикации, конференции, хобби
Биология являлась моим основным научным интересом с момента принятия решения получить высшее образование. Закончив первые два курса, я сосредоточил свое внимание на клеточной биологии.
После того, как я освоил навыки культивирования клеточных культур и получил свои первые опытные данные, фокус моего интереса сместился. В моей академической среде обработка данных была основана на монотонном полуавтоматическом труде. Я не видел в таком подходе смысла, поскольку сама работа с культурой (постановка опыта) была хоть и интересной, но занимала довольно большую часть моего времени. С того момента я решил избавить себя и моих коллег от примитивного подхода к обработке данных.
Первым и основным моим языком стал Python. Когда я решил проблему фильтрации лабораторных таблиц, сбора информации из баз данных по генам, вычисления статистики по совокупности имеющихся данным, построения графиков и прочих легко автоматизируемых задач, мне дали задание обучиться анализу экспресии генов. Так я изучил язык R, который обладает подавляющим превосходством в пакетах для обработки данных экспрессии. Впоследствии, я также обучился связывать эти два языка для удобства работы.
Окончив университет, я переехал в Санкт-Петербург, где получил связанную с моими навыками работу, изучил в глубине форматы представления биологических данных, обучился созданию пайплайнов, и получил еще больший опыт в биоинформатике, анализе данных и общем программировании.
На данный момент имею опыт полного сопровождения научных исследований, от этапа сбора необработанных данных с прибора, организации хранения данных, воспроизводимой статистической обработки полученной информации, взаимодействия с внешними ресурсами, и представления полученных результатов. Быстро ориентируюсь в новых методах, легко обучаюсь самостоятельно.
В данный момент мое хобби: экспериментирую с применением deep learning в работе с биологическими данными, вероятностным программированием и байесовской статистикой.