Denis V.

опытный биоинформатик

Позицию в омиксной, алгоритмической, либо (предпочтительно) data science - ориентированной биоинформатике. Работа на полный день. В Новосибирске, либо удаленно.

Области: геномика, сборка геномов и транскриптомов,  анализ NGS, онкологическая биоинформатика, системная биология, некодирующие РНК, структурная биология РНК. Data science, Machine Learning, high throughput data analysis. Интересно было бы поработать в neuroscience.

 

Последнее обновление резюме 27.12.2023
Адрес Новосибирск, Russian Federation
Электронная почта Заблокировано
Телефон Заблокировано

Опыт

ОЦРВ
Data scientist, middle
Фев 2022 - Текущий
Исследования и разработка прототипов сервисов в области Natural Language Processing в интересах РЖД
Gustave Roussy Cancer Institute
bioinformatic engineer
Авг 2018 - Фев 2020
Геномика хронической миеломоноцитарной лейкемии.
Novell Software Systems
Биоинформатик, data scientist.
Янв 2017 - Янв 2018
Data science в области диагностики рака и других патологий, программирование на Python, машинное обучение с использованием библиотек: Pandas, Scikit-Learn; Jupyter Notebook. 
King Abdullah University of Science and Technology
visiting senior research scientist
Сен 2014 - Дек 2014
разработка статистических методов структурной геномики РНК
George Washington University, St. Laurent Institute
Software developer, bioinformatitian
Дек 2007 - Мар 2008
геномика некодирующих РНК
Novell Software Systems
разработчик, биоинформатик, консультант
Апр 2007 - Ноя 2008
Геномика некодирующих РНК, в том числе миРНК. Разработка софта (методов и пайплайнов).
Softberry Inc. - лидер сегмента отрасли
разработчик, алгоритмист
Май 2001 - Дек 2016
Разработка вычислительных алгоритмов в области геномики: некодирующих РНК, сборки геномов и транскриптомов из данных NGS и RNAseq, методов аннотации генов и псевдогенов и т.д. Очень много программирования

Образование

Институт Цитологии и Генетики
аспирант
Сен 1997 - Сен 2000
Специальность - генетика.
Новосибирский Государственный Университет
Молекулярный биолог
Сен 1991 - Июл 1996
специалист

В чем вы сильны?

По образованию - молекулярный биолог, НГУ, выпуск 1996 года. В 2000 окончил аспирантуру по генетике.

Навыки: программирования на C (20+ лет), затем немного на Perl, сейчас - Python, Data Science. Алгоритмист. С недавнего времени senior data scientist в несвязанной с биологией госкомпании - прокачиваю навыки специалиста по данным и машинному обучению. С удовольствием копаюсь в статьях по алгоритмике, машинному обучению, методам прикладной математики и физики. 

Первые 8 лет карьеры я проработал в академическом институте (Цитологии и Генетики в Новосибирске), где занимался in silico исследованием трансляционных свойств мРНК, сайтами связывания миРНК, предсказанием вторичной структуры РНК с помощью генетического алгоритма, статистикой вторичных структур РНК.

Затем, более 14-ти лет проработал в фирме, являющейся мировым лидером в области софта для аннотации геномов (Softberry Inc.) и компанией-пионером коммерческой биоинформатики. Продукты фирмы (при том, что в ней всего несколько сотрудников) упоминаются в более чем 9500 интернет-документах согласно Google Scholar, в том числе в сотнях статей в Nature и Science. 

Там я разрабатывал алгоритмы кластеризации EST, сборки геномов и транскриптомов из данных NGS и RNAseq, картирования повторов, аннотации псевдогенов в геноме, вычисления вторичной структуры РНК и ее картирования в геноме, поиска РНК-мотивов и т. д.

в 2007-2008 годах я сотрудничал с частным Институтом Сент-Лорена (SLI) и Университетом Джорджа Вашингтона (GWU) в проекте по геномике некодирующих РНК (в том числе, миРНК). Несколько месяцев работал в США.

В 2014 году я работал в Университете Науки и Технологии Короля Абдаллы (KAUST, Саудовская Аравия), где разработал метод вычисления значимости вторичной структуры РНК заданной формы.

Занимался data science в области протеомики рака, программирую на Python с использованием библиотек классического и глубокого машинного обучения. 

В 2018 - 2020 годах работал по контракту в крупнейшей в Европе онкологической клинике Gustave Roussy в Париже. Занимался геномикой лейкемии.

В настоящий момент (2022) работаю в компании ОЦРВ, где с помощью методов deep learning занимаюсь анализом аудио и текстов на естественном языке (NLP).

Расскажите о себе что-нибудь еще: публикации, конференции, хобби

Имею около 20-ти статей и более 70-ти тезисов конференций. Статей мало, т.к. во время работы в фирме они не являлись приоритетом, и их опубликовано всего 2 (но в топовых журналах). Статьи с моим участием:

Carr R, Vorobyev D, Lasho T, Marks D, Tolosa E, Vedder A, Almada L, ..., Nikolaev S, Patnaik M (2021) RAS mutations drive proliferative chronic myelomonocytic leukemia via a KMT2A-PLK1 axis. Nature Communications 12, 1-18

Titov I, Kobalo N, Vorobyev D, Kulikov A (2019) A Bioinformatic Method For Identifying Group II Introns In Organella Genomes. Frontiers in Genetics

Earl D., …, Vorobyev D., ... (2011) Assemblathon 1: A competitive assessment of de novo short read assembly methods. Genome Research, v.21, p.2224-2241

Solovyev V., Kosarev P., Seledsov I., Vorobyev D. (2006) Automatic annotation of eukaryotic genes, psuedogenes and promoters. Genome Biology, v.7 (Suppl. 1):S10

Titov I., Vorobiev D., Palyanov A. (2006) A toolbox for analysis of RNA secondary structure based on genetic algorithm. In: Bioinformatics of Genome Regulation and Structure II. Ed. by N.Kolchanov, R. Hofestaedt and L.Milanesi. Springer Science+Business Media, Inc., 2006, p.105-110.

Omelyanchuk N.A., Vorobiev D.G. (2004) Computer analysis of miRNA-mRNA duplexes and its application to predicting possible target mRNAs of Arabidopsis. In: Bioinformatics of Genome Regulation and Structure. Ed. by N.Kolchanov and R. Hofestaedt, Kluwer Academic Publishers, Boston/Dordrecht/London, p.115-124.

Kolchanov N.A., …, Vorob'ev D.G., …, Omel'ianchuk N.A. (2004) Integrated computer system for regulating eukaryotic gene expression. Molecular Biology (Moskow), v.38, p.69-81. (Russian)

Titov I.I., Vorobiev D.G., Ivanisenko V.A., Kolchanov N.A. (2002) A fast genetic algorithm for RNA secondary structure analysis. Russian Chemical Bulletin, v.51, p.1135-1144.

Kochetov A.V., Sarai A., Vorob'ev D.G., Kolchanov N.A. (2002) The context organization of functional regions in yeast genes with high-level expression. Molecular Biology (Moskow), v.36, p.1026-1034. (Russian)

Kochetov A.V., Vorob'ev D.G., …, Kolchanov N.A. (2001) mRNA-FAST (mRNA-Function, Activity, STructure) computer system. Molecular Biology (Moskow), v.35, p.1039-1047. (Russian)

Ponomarenko M.P., …, Vorobyev D.G., Kolchanov N.A., Overton G.C. (1999) Oligonucleotide frequency matrices addressed to recognizing functional DNA sites. Bioinformatics, v.15(7/8), p.631-643.

Ponomarenko J.V., … Vorobyev D.G., Overton G.C., Kolchanov N.A. (1999) Conformational and physicochemical DNA features specific for transcription factor binding sites. Bioinformatics, v.15(7/8), p.654-668.

Kolchanov N.A., …, Vorobyev D.G., …, Overton G.C. (1999) Integrated databases and computer systems for studying eukaryotic gene expression. Bioinformatics, v.15(7/8), p.669-686.

Kolchanov N.A., …, Vorobiev D.G., …, Overton G.C. (1999) GeneExpress: an integrator for databases and computer systems accessible by the Internet and intended for studying eukaryotic gene expression. Biofizika (Russian), v.44(5), p.837-841.

Ponomarenko M.P., Ponomarenko J.V., Podkolodnaya O.A., Frolov A.S., Vorobyev D.G., Kolchanov N.A., Overton G.C. (1999) Averaging results of site recognition can increase the accuracy of annotating the human genome. Biofizika (Russian), v.44(4), p.649-654.

Kochetov A.V., Ischenko I.V., Vorobiev D.G., Kel A.E., Babenko V.N., Kisselev L.L., Kolchanov N.A. (1998) Eukaryotic mRNAs encoding abundant and scarce proteins are statistically dissimilar in many structural features. FEBS Letters, v.440, p.351-355.

 

Хобби: горы, путешествия, спорт.