Образование биоинформатиков

Три года мы занимаемся образованием биоинформатиков и каждый курс стараемся сделать лучше и актуальнее. Чтобы учиться не только на своем опыте, мы попросили коллег-биоинформатиков рассказать о своем образовании. Всего в опросе участвовало 44 человека из России, Америки и Европы. Мы бы и сами хотели больше ответов, но биоинформатики — люди занятые.

Оказалось, биоинформатике в основном учатся после высшего образования: в аспирантуре и на работе:

Я учился биоинформатике

Самыми полезными навыками биоинформатики считают статистику и программирование. В числе редких ответов встречались также линейная алгебра, термодинамика, computer science, reproducible research, сравнительная геномика.

Самый полезный навык в моей работе:

Биоинформатики сильно нуждаются в повторении или освоении статистики с нуля. Несколько человек ответили, что хотели бы подтянуть математику: тервер, линейную алгебру, случайные процессы. Среди прочих предметов для желательного освоения называли иммунологию, молбиол, биохимию и эволюционную биологию. 

Если бы я мог, я бы повторил/изучил:

 

Мы не могли проигнорировать такой массовый запрос на хороший курс по статистике, поэтому ищем преподавателя для наших новых курсов.

В качестве дополнительного образования нам рекомендовали мероприятия Института Биоинформатики, Школы Биоинформатики, Бластима, Сколтех и сайт biostars. А также курсы и программы:

Образовательные программы:

Курсы и Школы:

Отдельно мы собрали список рекомендованных онлайн курсов (публикуем все, что посоветовали), который пополнит нашу постоянную страницу.

NGS:

Статистика:

Программирование:

Биология:

Машинное обучение:

Биоинформатика:

Другое:

Большое спасибо всем участникам опроса!

 

 

 

Стать рукопожатным биоинформатиком

Нас часто спрашивают, как стать биоинформатиком. Кроме списка «Где учиться», мы составили список слов, которые нужно знать (а лучше — понимать) начинающему биоинформатику, чтобы вести светские беседы:

  1. Статистика: случайные величины, математическое ожидание и дисперсия, распределения, виды распределений (равномерное, биномиальное, геометрическое, гипергеометрическое,  пуассоновское, нормальное,  хи-квадрат), pvalue, нулевая гипотеза, статистические критерии (Стьюдента, Фишера, Уилкоксона, Манна-Уитни, Колмогорова, гипергеометрический тест), дисперсионный анализ, ANOVA, корреляции (Пирсона, Спирмена).
  2. Машинное обучение: тестовая выборка, обучающая выборка, формула Байеса, (обобщенные) линейные модели, регрессия, классификация, кластеризация, k-means, метод опорных векторов (SVM), random forest, нейронные сети.
  3. Анализ данных: нормализация, методы нормализации, проверка на нормальность, PCA/MDS-анализ, аутлаеры, бутстреппинг, FDR, fold change, pvalue adjusted (B, BH, Holm), enrichment analysis.
  4. Графики: boxplot, barplot, scatter plot, PCA, MDS, heatmap, volcano plot
  5. Биология: SNP, аллель, гетерозигота, выравнивание, покрытие, филогенетические деревья, дифференциальная экспрессия/сплайсинг/whatever, tissue/organ/human/whatever-specific.

Что мы забыли? Пишите в комментариях!