Ищите самое важное в биотехе? Подписывайтесь на телеграм Бластим

Как клетки-гибриды помогают в разработке лекарств

Запощено 15.06.2023 от jobpost

Как клетки-гибриды помогают в разработке лекарств

Для лечения множества заболеваний используют моноклональные антитела. Это большие молекулы, очень специфично распознающие свою мишень в организме человека. Их нельзя получить путем химического синтеза — они слишком сложно устроены. Для производства моноклональных антител используют биологические системы: вирусы, дрожжи, клеточные культуры и даже целые организмы. Методы получения антител можно разделить на две большие группы — гибридомные и дисплейные.

Метод гибридóм основан на получении особых клеток-гибридов, сочетающих в себе особенности В-лимфоцитов и опухолевых клеток. Для их наработки проводят иммунизацию животного (обычно мыши) — то есть вводят в него антиген. В ответ на это мышь вырабатывает множество специфичных к этому антигену В-лимфоцитов. Затем В-клетки выделяют из организма и объединяют с опухолевыми клетками (обычно — с клетками миеломы) в специальных условиях. Получившаяся гибридома «наследует» от В-лимфоцита способность вырабатывать антитела, а от клетки миеломы — способность к неограниченному количеству делений. В результате нескольких этапов селекции и скрининга (отбора наиболее специфично связывающихся с нужной мишенью гибридóм) отбирают самую подходящую гибридóму. Ее размножают, чтобы получить множество копий одной и той же клетки, которые будут нарабатывать только нужные антитела.

Главное преимущество метода гибридом в том, что это естественная, приближенная к живому организму система. На выходе получают полноценные молекулы растворимых антител, которые хорошо нарабатываются в больших масштабах. Но у этого метода есть и ограничения, главное из которых — небольшое количество молекул-кандидатов, которые удается проверить в одном раунде. Еще одна сложность — при таком подходе получаются антитела иммунизированного животного — например, мыши. Такие антитела чужеродны для человека, поэтому их необходимо гуманизировать («очеловечивать») — этим занимаются биоинформатики.

Shortgun метагеномика

Запощено 13.06.2023 от jobpost

Технология секвенирования долго применялась для установления последовательности ДНК клеток одного вида (то есть «чистых культур»), а вот при попытке секвенировать материал из природных образцов возникало немало проблем. Пока не появилась метагеномика. Это направление занимается исследованием целых сообществ организмов, населяющих то или иное местообитание. Причем, оперируя метагеномными данными, ученые порой даже не имеют представления о внешнем виде и таксономической принадлежности изучаемых живых существ. Познакомимся с этой темой в деталях.

Последовательность шагов в метагеномном эксперименте

Начало

Собственно метагеномика стартовала с секвенирования отдельных ампликонов. И здесь, безусловно, самый известный маркер — ген 16s rRNA. По его последовательностям можно оценить разнообразие организмов сообщества. Так, благодаря этому методу в 1977 году ученые открыли новый домен жизни — Архей.

Но особенно преобразилась метагеномика с началом эры NGS. А именно стало распространяться полногеномное секвенирование и, соотвественно, Shotgun метагеномика. Она позволила определять таксономию и давать количественную оценку организмов вплоть до вида. Но главное ее отличие заключалось в том, что благодаря упорядочиванию множества различных частей генома каждого организма стало возможно выяснять еще и их функции в сообществе.

Шаг за шагом

Какова же последовательность современного метагеномномного анализа? Сначала ДНК образца нарезается случайным образом, после чего фрагменты секвенируются. Затем их необходимо упорядочить и реконструировать в согласованную последовательность, уже по которой можно будет сделать вывод о видовом составе микроорганизмов в сообществе и их роли в нем.

Поскольку данные состоят из коротких считываний (ридов), необходим этап сборки, который создает длинные последовательности из коротких. Далее требуется сортировка «каши» из последовательностей по принадлежности к таксономическим группам — биннинг. Есть несколько способов определить, какому микроорганизму принадлежит последовательность. Например, это может быть анализ частоты использования кодонов, поскольку известно, что данная характеристика зависит от набора транспортных РНК и представляет собой уникальный «почерк» микроорганизма.

Другой вариант — анализ степени покрытия: широко представленные в сообществе микроорганизмы обладают широким покрытием, слабо представленные — узким. Вместе собираются контиги с одинаковым покрытием.

Кроме того, контиги можно собирать по сигнатурным наборам генов — это гены, которые содержаться в одной копии в любом геноме прокариот. В сборке должен быть полный набор этих единичных генов. По итогу сборки получаются MAGи. MAG — это геном, собранный с помощью метагенома. Он представляет собой сборку одного таксона.

В дальнейшем полученные MAGи нужно аннотировать. Как правило этот процесс начинается с автоаннотации: программа разбивает MAGи на белок-кодирующие последовательности и определяет входящие в их состав гены. Однако автоматика часто оперирует не самыми последними данными и требует дальнейшей ручной обработки или комбинации различных программ.

Выводы

Таким образом, мы выяснили, что shotgun метагеномика — это работающий инструмент, чтобы узнать больше о микробном сообществе. Однако она не лишена недостатков. В сообществе могут встречаться гены, чья функция до сих пор не установлена, что оставляет в общей картине белые пятна. Кроме того, наличие определенных генов ничего не говорит об их экспрессии, и для получения этой информации нужна уже метатранскриптомика.

Подготовлено при участии Анны Кузнецовой

R — движок для биоинформатики и датасайнс

Запощено 13.06.2023 от jobpost

R был создан в 1992 году профессорами статистики Россом Ихака и Робертом Джентльменом, которые случайно встретились в Новой Зеландии и решили написать новый язык. Поскольку он наследовал языку S, то по первым буквам имен создателей новинку назвали R.

Из Новой Зеландии R разлетелся по всему миру на жесткие диски студентов и преподавателей, специалистов по данным, биологов и биоинформатиков.

Практичность R сделала его идеальным языком программирования для обучения: новички могут получить немедленную визуализацию своих данных, выполнив самые простые операции. О базовых, но и самых полезных вещах в R поговорим дальше.

«Грамматика графики» ggplot2

10 июня 2007 года Хэдли Уикхем выпустил ggplot2. Сегодня это один из самых популярных пакетов в R. Его можно считать сильнейшей альтернативой базовому R в сфере построения графиков и визуализации. ggplot2 настолько самостоятелен, что его можно даже назвать отдельным диалектом R.

gg в названии пакета означает «грамматику графики» — особый язык для описания графиков. Все графики состоят из трех компонентов: данных, сопоставления этих данных с визуальными элементами и геометрической формы, представляющей сопоставленные данные. Эти компоненты вместе с масштабом, статистическими преобразованиями и системой координат как раз составляют «грамматику графики», которая дает свободу в создании практически любой визуализации.

15 сентября 2016 года ggplot2 вместе с другими «вездесущими» пакетами, такими как dplyr для обработки данных и tibble для их хранения были объединены tidyverse. Этот набор пакетов переосмысливает операции с потоками данных в R и вводит оператор pipe « %>% », благодаря которому можно соединять программы и прогонять данные сквозь них. Да, большинство его возможностей доступны в базовом R, но tidyverse упрощает их использование и обеспечивает более интуитивно понятный и читаемый синтаксис.

Bioconductor — репозиторий для биоинформатиков

В начале 2000-х после широкого распространения микрочипов, а потом с началом эры NGS началось лавинообразное накопление биологических данных. Вскоре стало очевидно, что и в R необходим специализированный проект для биоинформатиков. В 2001 году под руководством Роберта Джентльмена был запущен Bioconductor с глобальной целью разработки инструментов R для биоинформатики, особенно для анализа омиксных данных.

Сегодня Bioconductor — второй по величине репозиторий пакетов R после CRAN. В Bioconductor размещены самые загружаемые инструменты вычислительных биологов: от изучения дифференциальной экспрессии (DESeq2 и limma) до анализа генома (GenomicRanges).

RMarkdown — красиво писать не запретишь

Но как же эстетично представить полученные с помощью R результаты? Такую возможность нам дает язык разметки RMarkdown. Он позволяет легко сформировать отчет о работе.

*Временная шкала возникновения культовых приложений в R*

Система Rmarkdown была впервые представлена пакетом Knitr в 2012 году, а теперь поддерживается специальным пакетом rmarkdown.

Сгенерированный документ Rmarkdown представляет собой текстовый файл с расширением Rmd. В документе можно совместить код, результаты его исполнения и написанный текст. При желании вставить картинки, ссылки, видео и многое другое.

Rmarkdown — это система, которая позволяет авторам обмениваться не только необработанными данными, но и полностью воспроизводимыми пайплайнами, что увеличивает прозрачность в научных исследованиях. В практичности Rmarkdown можно легко убедиться, используя RStudio — она полностью поддерживает язык разметки.

Где писать код на R: интегрированная среда Rstudio

Помимо просто встроенной консоли R на компьютере можно применять многое другое: текстовые редакторы, интегрированную среду разработки (IDE), графические пользовательские интерфейсы (GUI) для развертывания своей работы в одном месте без каких-либо дополнительных окошек.

Одна из самых популярных сред разработки R, особенно у молодых программистов — RStudio. RStudio была первой IDE для R: ее запустили 28 февраля 2011 года.

RStudio задумывалась не только как редактор для написания и выполнения кода R, но и как растущая вселенная для разработки R и для выхода языка программирования за пределы статанализа. Само приложение доступно как в десктопной версии, так и для браузеров, подключенных к серверу. RStudio объединяет консоль, редактор с подсветкой синтаксиса с функцией дополнения по табуляции, среду с переменными, вывод графического изображения, историю команд и справку в одном рабочем пространстве.

Благодаря тому, что RStudio изначально поддерживает интерфейс с RMarkdown, она способствует проведению воспроизводимых научных исследований и грамотному программированию, позволяя сохранять код и дополнять его текстовой информацией.

А вы используете R в своей работе? Следите за выходом новых пакетов?

Искусственный интеллект в биотехе

Запощено 19.05.2023 от jobpost

Сегодня искусственный интеллект (Artificial intelligence, AI) широко используется в науках о жизни: рациональный драг-дизайн, функциональная и структурная геномика и прочие омики, анализ медицинских изображений, предсказание третичной структуры белков и многое другое.

История ИИ

Принято считать, что сама область искусственного интеллекта зародилась в 1943 году, когда впервые была предложена математическая модель искусственного нейрона. А в 1956 году во время конференции в Дартмутском колледже Джон Маккарти предложил уже сам термин ИИ, введя его в академический оборот. В дальнейшем сфера претерпела несколько периодов бурного развития и полного застоя.

Американский информатик и автор термина «искусственный интеллект» Джон Маккарти. Источник

Окончательное возрождение искусственного интеллекта произошло в десятые годы XXI в., когда алгоритмы машинного обучения вошли без преувеличения в каждый дом: тут можно вспомнить системы распознавания лиц, обработки речи (Alexa, Siri), потребительских прогнозов (Netflix), машинного перевода (Google Переводчик). С тех пор сфера только развивается: лучшее подтверждение — нашумевший ChatGPT.

Искусственный интеллект, машинное и глубокое обучение

Обыватели часто смешивают понятия искусственный интеллект, машинное и глубокое обучение, оперируя ими как синонимами. Но на самом деле эти термины самостоятельны, хотя и вложены друг в друга по принципу матрешки.

Наиболее широко трактуется искусственный интеллект (ИИ, или AI). Под ним подразумеваются интеллектуальные системы, которые могут выполнять задачи, требующие творческого начала. Но пока машины не достигли уровня человеческого разума, и многие специалисты полушутя расшифровывают аббревиатуру ИИ как «имитация интеллекта».

Машинное обучение (Machine learning, ML) — одно из направлений ИИ, когда компьютеры могут сами распознавать шаблоны, находить закономерности в массивах данных и делать прогнозы. Яркий пример того, что ИИ не всегда тоже самое, что машинное обучение, — шахматы. В 1997 году действующий чемпион мира Гарри Каспаров потерпел поражение от IBM Deep Blue — ИИ, но без всякого машинного обучения.

Диаграмма Венна для области искусственного интеллекта (ИИ). Источник

Подобласть машинного обучения — глубокое обучение (Deep learning, DL). Это искусственные нейронные сети. Такие системы повторяют работу нейронов коры головного мозга, когда есть много слоев, и каждый слой получает переработанную информацию от предыдущего. Для глубокого обучения нужно гораздо больше данных, чем просто машинному обучению.

Далее поговорим о том, где ИИ нашел себя в биотехе. И начнем с растениеводства, где искусственный интеллект, по мнению специалистов, может решить проблему продовольственной безопасности. Потом рассмотрим лесное хозяйство и животноводство. А на закуску оставим, пожалуй, самое воодушевляющее направление — медицину.

Мониторинг состояния растений

В агротехе широко применимы алгоритмы компьютерного зрения (CV) на основе сверточных нейронных сетей (CNN). Компьютерное зрение может обнаруживать, автоматически идентифицировать и классифицировать объекты на изображениях, получаемых, например, с камер дронов. Как это работает?

Беспилотные летательные аппараты (БПЛА) облетают плантации по заданным маршрутам и осуществляют аэрофотосъемку, а ИИ анализирует и интерпретирует полученную информацию. Этот подход дает возможность удаленно мониторить состояние посевов, производить более точное прогнозирование урожайности, а также обнаруживать недостаток удобрений или наличие заболеваний и вредителей у сельскохозяйственных культур на огромных территориях.

А наземные роботы, «напичканные» датчиками, могут легко обнаружить сорняки и использовать ИИ для умного опрыскивания и прополки. Камера, установленная на машине-опрыскивателе, при детектировании сорного растения записывает его геолокацию, анализирует размеры и цвет, чтобы произвести расчет и внести точное количество гербицидов, необходимое для его уничтожения. Это позволяет сократить использование химикатов и сэкономить время.

Алгоритмы определяют степень зрелости томатов. Источник

Компьютерное зрение с высокой точностью определяет зрелость плодов и сроки их уборки. Уже созданы роботы c множеством датчиков и искусственным интеллектом, которые перемешаются по теплице. Проанализировав положение плодов в пространстве и степень их поспевания, машины осуществляют захват фруктов или овощей, а потом и сортировку. Роботизированные сборщики урожая смогут решить трудовую проблему, особенно ярко проявившуюся во время пандемии, когда фермеры столкнулись с острой нехваткой рабочей силы.

Высокопроизводительное фенотипирование в селекции

«Как соотносятся генотип и фенотип?» — одна из краеугольных проблем современной селекции растений. Традиционные инструменты фенотипирования основывались на ручном измерении отдельных фенотипических признаков небольшой выборки растений на определенных стадиях онтогенеза, что давало лишь ограниченную информацию и к тому же заставляло повреждать побеги.

Сегодня широкое распространение получило высокопроизводительное фенотипирование (High-throughput phenotyping, HTP), обеспечивающее цифровой автоматизированный анализ гигантских выборок растений для массовых селекционно-генетических экспериментов. HTP подразумевает оценку сразу множества признаков от клеточного уровня вплоть до целых растительных сообществ. Метод позволяет найти закономерности между морфологическими, химическими и физиологическими свойствами тысяч растений и условиями среды.

Как собирают большие данные для фенотипирования. Источник

Сбором данных при HTP занимаются беспилотные летательные аппаратами в сочетании с алгоритмами компьютерного зрения, а также наземные роботы, оснащенные несколькими датчиками и неинвазивными сенсорами, которые могут делать замеры на всем участке несколько раз в день или в течение всего сезона от всходов до созревания. Это приводит к огромному количеству пространственных и временных данных для анализа и хранения, эффективно разобраться с которыми помогает также машинное обучение.

Объединение результатов фенотипирования на основе изображений и информации с полевых датчиков с геномными и прочими омиксными данными о реакциях растений на условия среды (экспрессия генов, биосинтез метаболитов и т.д.) позволяет оптимизировать селекционный процесс и выявить новые фенотипы сельхозкультур, которые более эффективно используют ресурсы и устойчивы к меняющимся климатическим условиям.

Культура клеток растений in vitro

Чтобы быстро размножить растения в промышленных масштабах применяется биотехнологический метод — микроклональное размножение.

Диаграмма Исикавы, на которой перечислены основные факторы, влияющих на культуру тканей клеток растений и подлежащие моделированию с помощью ИИ. Источник

Здесь очень сложной задачей является подбор сред для культивирования тканей растений, поскольку нужно учесть множество факторов и их взаимодействие (фитогормоны, макро- и микроэлементы, витамины, аминокислоты). Модели ИИ могут имитировать и прогнозировать рост и развитие тканей растений in vitro в различных условиях для оптимизации питательных сред.

Животноводство

Животноводство — важный сектор сельского хозяйства и крупнейший в мире землепользователь. Чтобы поддерживать его рентабельность без вреда окружающей среде, отрасль должна производить больше с использованием меньшего количества ресурсов и вдобавок сокращать отходы.

Блок-схема процессов, которые подлежат оценке при LCA, на примере молочной фермы. Источник

Для интенсификации применяется LCA (Life-cycle assessment) — оценка жизненного цикла продукта. Это инструмент, позволяющий измерить экологический след на протяжении всех стадий от фермы до вилки: выращивание культур для производства кормов, здоровье животных, транспортировка, обработка и хранение пищевых продуктов.

Мониторинг создает большие данные, которые можно анализировать с помощью ИИ, чтобы переходить к более замкнутым циклам (за счет сокращения затрат и экономии ресурсов) и снижению выбросов парниковых газов.

Лесное хозяйство

Леса имеют планетарное экологическое значение, а древесина активно используется в хозяйстве. Однако возобновление не поспевает за обезлесением. Искусственный интеллект используется для анализа данных спутниковых снимков, фото с дронов и информации с наземных датчиков, чтобы прогнозировать рост и урожайность деревьев, а также места возгораний.

Схема работы системы мониторинга и предсказания лесных пожаров. Источник

В 2019-20 гг. Австралию охватила волна лесных пожаров, нанесших серьезный ущерб экосистемам: выгорело 190 тыс. кв. км леса на сумму более 20 млрд долларов. Оперативно была создана система Vesta Mark 2, которая объединяет исторические справки о пожарах за последние 40 лет, данные о состоянии лесного покрова и наиболее уязвимых местах возгораний с прогнозами погоды. На основе этой информации модель прогнозирует потенциальные очаги и скорость распространения пожара и шлет уведомления лесничим, чтобы они были готовы быстро выехать и потушить пламя.

Медтех

ИИ в медицине — популярное и динамично развивающееся направление, ведь оно напрямую касается здоровья человека. За годы работы медучреждений накапливается множество числовых и текстовых данных, например, результаты биохимических анализов, истории болезней или рентгеновские снимки пациентов. Алгоритмы могут анализировать эти массивы и находить скрытые закономерности, которые человек попросту не замечает.

Диагностика рака становится доступнее благодаря умному приложению на смартфоне. Источник

Особенно поражает воображение применение нейросетей для анализа медицинских изображений. Теперь, например, по обычной фотографии покровов тела, сделанной на смартфон, специальные мобильные приложения могут определять рак кожи без проведения биопсии и способствовать ранней диагностике заболевания. Недавно была создана модель ИИ, которая анализирует компьютерные томографии легких и может отличать раковые узлы от доброкачественных образований, что значительно упрощает работу врачам при постановке диагнозов.

Еще ИИ можно использовать для анализа данных из различных источников, таких как электронные медицинские карты и носимые устройства, для выявления закономерностей и корреляций, которые могут указывать на наличие определенной патологии или риск ее развития.

Машинное обучение и нейросети в RnD лекарств. Источник

Еще одна сфера: RnD лекарств. Разработка нового фармпрепарата — чрезвычайно длительный и дорогостоящий процесс, о чем мы недавно писали в статье. Однако отдельные его этапы можно ускорить с помощью ИИ, например, предсказание терапевтических мишеней. Использование нейросетей для интеграции разнообразных омиксных данных позволяет составить лучшее понимание механизмов болезней и определить потенциальные лекмишени.

ИИ пригоден и для рационального драг дизайна in silico. Химические библиотеки сегодня содержат миллиарды молекул, поэтому необходимы максимально эффективные подходы к виртуальному тестированию. Методы компьютерного обнаружения лекарств (CADD) способны значительно ускорить темпы скрининга новых препаратов. Например, платформа Deep Docking проводит экономичный молекулярный докинг и обеспечивает ускорение скрининга с помощью QSAR-модели в 50-100 раз. Это достигается за счет предварительного отбрасывания плохо «стыкуемых» молекул и окончательного докинга только ограниченного подмножества лигандов с наивысшими рангом. О современных подходах в медицинской химии можно послушать в лекции Яна Иваненкова.

Deep Docking ускоряет докинг во много раз. Источник

Еще больше о применении ИИ в медтехе, а также стартапах, которые активно развиваются в этой области, можно узнать из лекции Анны Костиковой, которую она прочитала в рамках курса «Биотех глазами инвесторов». Запись находится в открытом доступе на нашем ютуб канале.

Заключение

Таким образом, бум машинного обучения и нейросетей в нашем тысячелетии стал возможен благодаря доступности огромного количества данных, совершенствованию технологий их хранения, повсеместной цифровизации и все более высоким вычислительным мощностям. Сегодня буквально каждый день появляются новости об очередных достижениях в сфере искусственного интеллекта. Надеемся, что и в биотехе ИИ будет только процветать.

Бластим предлагает вместе знакомиться с ИИ. Начните в мае осваивать питон, а уже в конце лета приходите на продвинутый курс по ML. Так вы сможете быстрее выйти из зоны черного круга на диаграмме в начале нашей статьи в сторону тех, кто использует, исследует и разрабатывает ИИ! Успехов!

Пространственное секвенирование транскриптома

Запощено 15.05.2023 от jobpost

Описание метода впервые было опубликовано в 2016 году командой исследователей из Стокгольма. С его помощью ученые могут оценивать транскрипцию тысяч разных генов с разрешением 200 мкм и получать 2D-карты генной экспрессии.

Источник: Vivien Marx. Method of the Year: spatially resolved transcriptomics // Nature Methods. 2021. V.18. P. 9–14.

Кратко опишем суть метода. Готовят матрицу-подложку с прикрепленными олиго(дТ)-праймерами, разделенную на участки диаметром 100 мкм. Праймеры включают в себя уникальные для каждого участка баркоды. На этой матрице ткань фиксируют, окрашивают, далее разрушают клетки — транскрипты выходят из клеток и гибридизуются с праймерами подложки. В итоге молекулы мРНК располагаются на матрице так же, как и в ткани. После проводят обратную транскрипцию, ткань ферментативно удаляют. Из тех транскриптов, что прикрепились, готовят библиотеку, которая отправляется на секвенирование. При этом пространственная информация сохраняется благодаря баркодам.

Главный результат анализа данных пространственного секвенирования — данные об экспрессии мРНК для каждого 100-микрометрового участка матрицы. Почему же это важно?

Обычное (bulk) секвенирование РНК даёт информацию о среднем состоянии большого количества клеток в кусочке ткани. Данные секвенирования единичных клеток, наоборот, показывают состояние каждой клетки по-отдельности. В свою очередь пространственное секвенирование транскриптома претендует на объединение обеих функций: можно оценить состояние небольших групп клеток в разрезе ткани. С появлением пространственной транскриптомики стало гораздо легче изучать сети межклеточных взаимодействий и зависимость состояния одной клетки от микро- и макроокружения в гетерогенных тканях.

Источник: Patrik L. Ståhl et al. Visualization and analysis of gene expression in tissue sections by spatial transcriptomics // Science. 2016. V. 353. P. 78–82. — Источник: Patrik L. Ståhl et al. Visualization and analysis of gene expression in tissue sections by spatial transcriptomics // *Science*. 2016. V. 353. P. 78–82.

Совместив несколько 2D-карт можно получить 3D-представление ткани, что даёт возможность моделировать ткани и органы. Это расширяет возможности наблюдения за динамическими процессами, например, эмбриональным развитием или ростом злокачественных опухолей.

В России этот метод еще не распространился. Мы знаем только одну лабораторию в Томске, где есть необходимые приборы. Однако по статистике PubMed, количество статей с упоминанием «spatial transcriptomics» увеличивается в 1.5 — 2 раза ежегодно начиная с 2017 года, а общее количество таких статей приближается к 400.

Текст подготовила: Юлия Антоненкова

Какой бывает геномика?

Запощено 15.05.2023 от jobpost

Таймлайн расшифровки разных геномов. Источник: https://www.sciencedirect.com/science/article/pii/S2001037019303277#f0020

История геномики началась в 80х. Почти половину века ученые изучают структуру и функции генома, взаимодействия генов друг с другом и с окружающей средой. А возрастающая доступность технологий секвенирования с каждым годом расширяет возможности таких исследований. В зависимости от целей и методов выделяют несколько ключевых направлений геномики, о которых мы расскажем дальше.

Функциональная геномика

Функциональная геномика раскрывает весь путь реализации генома: от генов к определенным белкам и особенностям организма. Все осложняется тем, что один белок может влиять сразу на несколько признаков, на один признак может влиять несколько белков, а один ген (спасибо альтернативному сплайсингу) отвечать за несколько белков.

Структурная геномика

Как описать трехмерную структуру белка, зная последовательность оснований гена, который его кодирует? Здесь разберётся структурная геномика. Большую роль в исследованиях играет то, что ученые определяют структуры, кодируемые именно геномом, а не сосредотачивается на одном конкретном белке. В частности, в этом помогают уже изученные последовательности генов и относящиеся к ним структуры белков.

Эпигеномика

Если геном это сумма всех генов организма, то эпигеном представляет собой совокупность эпигенетических модификаций — факторов не меняющих последовательность оснований в ДНК, но от которых зависит работа генов. К ним относят, например, метилирование, гистоновые модификации, ацетилирование, фосфорилирование и т.д.

Эпигенетические модификации вовлечены в дифференцировку клеток и канцерогенез. Также эпигеномику используют в контексте биологии старения: у людей старшего возраста наблюдаются изменения профилей метилирования. Данные о модификациях получают различными способами: некоторые виды секвенирования (бисульфитное секвенирование, PacBio, ONT), иммунопреципитация хроматина (ChIP-on-chip, ChIP-Seq), гибридизация in situ, чувствительные к метилированию рестриктазы, идентификации ДНК-аденин-метилтрансферазы (DamID).

Сравнительная и эволюционная геномика

В этой области ученые работают с большими наборами геномов разных организмов, сравнивают их организацию и состав, выявляют геномные перестройки. Частый инструмент здесь пангеномы — объединением всех генов группы организмов. Моделирование эволюции, функциональная аннотация гена по последовательности, поиск гомологичных генов и блоков синтении, поиск молекулярных маркеров отбора — одни из примеров задач сравнительной геномики.

Популяционная геномика

Здесь изучают структуру генофонда популяции, его динамику во времени и причины изменчивости, ищут полиморфизмы, устанавливают связи между генетическими вариантом, фенотипом и средой обитания популяции. Уже описаны генофонды многих народов мира. Основные данные для анализа — генетические маркеры и их аналоги, в том числе последовательности митохондриальной ДНК и Y-хромосомы, полные последовательности генома, антропологические характеристики.

Метагеномика

Метагеномика использует генетические материалы организмов, полученные из образцов окружающей среды. Ученые анализируют видовой состав, филогению и разнообразие сообщества в образце по данным секвенирования. Чаще секвенируют не полный геном, а последовательность 16S рРНК у прокариот и 18S рРНК у эукариот.

Поиск ассоциаций

Метод полногеномного поиска ассоциаций (GWAS) подразумевает исследование генетических вариантов у разных людей с целью выяснить, связан ли какой-либо вариант с каким-либо признаком. В медицине это помогает находить генетические маркеры заболеваний. Ученые ищут однонуклеотидные полиморфизм (SNP), хромосомные перестройки (вставки, делеции, инверсии и т.д), а также вариаций числа копий генов (copy number variation, CNV) в геноме, возникающие из-за хромосомных перестроек.

Это далеко не все методы, которые применяют в современной геномике. Изначально геномные исследования были направлены на определение последовательностей ДНК, но за несколько десятилетий расширились до более функционального уровня — изучения генофондов целых популяций, профилей экспрессии и накопления огромного количества генетической информации. А умение обрабатывать данные стало ключевым навыком работы в этой области. Рассказываем основы на наших курсах «Анализ NGS-данных» в январе и «Анализ данных RNA-seq» к которому ещё можно присоединиться со скидкой.

Текст помогла подготовить Юлия Антоненкова.

Ссылки по теме:

Расширенная статья о геномике на хабре

Долгий путь к геномике: история и современные подходы к секвенированию и сборке генома

The Human Pangenome Project и новость о проекте в Биомолекуле

Правила размещения вакансии на blastim.ru

Запощено 03.05.2022 от jobpost

1. В вакансии нельзя указывать прямые контакты hr-менеджера или других представителей компании. Мы против размещения любых телефонов или адресов электронной почты в тексте вакансии. Вакансии с контактами будут модерироваться, если после нашего напоминания работодатель не отредактирует текст в соответствии с правилами.
2. Тематика вакансии должна соответствовать тематике сайта — биотехнологии, IT в биологии и т.п. Запрещено предлагать соискателям экскорт-услуги, объявления на сайтах знакомств, игорный бизнес и т.п. Запрещается размещать вакансии, нацеленныена поиск исполнителя/покупателя для дипломных/научных работ. Вакансии, которые нарушают правила сайта и противоречат ценностям компании, будут удалены без предупреждения.
3. Описание вакансии должно быть полным. Рекомендуем подробно заполнять разделы, чтобы соискателям было понятно ваше предложение.
4. Не стоит дублировать вакансии. Если старое объявление устарело, удалите его и создайте новую вакансию. Можно отредактировать старую вакансию.
5. Рекомендуем тщательно проверить орфографию и пунктуацию — по тексту вакансии у соискателей складывается первое впечатление о работодателе.
6. По умолчанию мы деактивируем вакансию, которая была опубликована более года назад. Рекомендуем вовремя скрывать неактуальные вакансии или удалять их.

Рекомендации основателей Бластима по оформлению вакансии.
Мы предлагаем услуги по продвижению вакансии. Узнать подробности и сделать заказ можно по ссылке.

PhD в Европе или Фонд, про который никто не знает.

Запощено 01.11.2018 от Администратор

Студент-биолог последнего курса. Мечтает заниматься наукой и хочет изменить мир.
Отлично учится и уже имеет опыт работы в лаборатории. Зарезервированное место в
аспирантуре и доклады на мелких конференциях, но амбиции требуют новый вызов и
тянут за границу.
Это я три года назад. Я твердо решил уехать в Европу на PhD, но не
знал, как это сделать. Наверняка, сейчас кто-то находится в таком же положении.

Куда и как уехать на PhD?
Простой поиск PhD позиций в гугле выдает огромное количество объявлений на
сайтах-агрегаторах, и на первый взгляд, найти что-то подходящее не составит
проблемы. Однако, сложности существуют, и главная из них – финансирование.
В Европе существует множество фондов, раздающих Studentship’ы и Fellowship’ы, но
большинство из них доступны только при наличии паспорта европейской страны. К
примеру, общее количество объявлений в Biological sciences на findaphd.com порядка
трех тысяч, из которых только 700 для Non-EU/International Students. Некоторые из
объявлений составлены с ошибкой, предлагают неполное финансирование или вообще
не про Европу. Таким образом, менее 20% всех PhD позиций доступны для нас. А так же
для студентов из Америки, Азии и Африки, что создаёт сумасшедшую конкуренцию.
Чтобы получить заветный грант нужно быть выдающимся кандидатом: иметь
идеальную успеваемость, опыт научной работы, какие-то публикации и еще проявить
себя с лучшей стороны на собеседовании. Пробиться напрямую не так уж и просто,
приходится искать лазейки.
Хорошая лазейка – иметь знакомства за рубежом, которые Вы успели выстроить в ходе
летних стажировок, конференций и школ. Хорошо себя зарекомендовав, можно
надеяться на поддержку и финансирование. Текущие коллабораторы тоже часто готовы
взять к себе. Такой подход эффективен, хоть и не системен. Но что делать, если Ваш
научный нетворкинг слабоват? Найти правильную стипендию.

Секретная стипендия в топовом университете Европе.
The Darwin Trust of Edinburgh независимый благотворительный фонд, финансирующий
студентов со всего мира для получения PhD в биологии в University of Edinburgh (Топ 29
в рейтинге Times Higher Education). Главными особенностями The Darwin Trust являются
щедрость и скромность. Ежегодно фонд выдает 15-20 стипендий при общем числе
заявок порядка 70. Данный конкурс в разы ниже, чем на стандартных университетских
(например, 3 места при 20 заявках в Университете Эдинбурга) и других крупных
стипендиях (15 мест на 100+ заявок в Leverhulme и Welcome Trust), что связано с
практически полным отсутствием информации о The Darwin Trust на просторах
интернета. Поэтому уехать на PhD в University of Edinburgh выходит гораздо проще, чем
в другие сопоставимые по рейтингу университеты Европы, хотя требования все еще
остаются очень высокими.

Процесс подачи заявки на стипендию The Darwin Trust.
Начать свой путь на PhD в Эдинбург (и не только) стоит с подготовки качественного CV.
К примеру, на blastim.ru есть несколько статей о том, как стоит подойти к написанию
этого документа. На данном этапе основными критериями будут высокая успеваемость
(>8.5/10) и опыт научной работы.
Следующий шаг – знакомство с потенциальным научным руководителем. Школа
биологии в Эдинбурге очень велика и насчитывает более 130 лабораторий. Каждый
заведующий может номинировать одного кандидата на получение стипендии The
Darwin Trust, но делают это далеко не все, еще меньше – активно рекламируют
позицию. Несмотря на это, большинство руководителей будут рады принять
мотивированного студента. Хорошо изучив сайт университета, можно найти научную
тематику на любой вкус. Напишите имэйл в понравившуюся лабораторию, расскажите
немного о себе, о желании подать заявку на стипендию The Darwin Trust и работать в
академии в очень солидном научном центре. Не забудьте прикрепить Ваше
качественное CV и укажите, что узнали о фонде от текущих русскоговорящих студентов.
Подходящий кандидат скорее всего получит ответ и предложение пообщаться в скайпе.
Здесь будет полезно подготовиться, чуть глубже изучить, чем занимается лаборатория,
и сформулировать логичные ответы для самого себя, почему это интересно. При
успешном онлайн знакомстве Вам вышлют документы для подачи заявки на получение
стипендии.
Заявка состоит из анкеты, мотивационного письма, описания личного научного опыта и
обоснования выбора лаборатории. Так же требуется два рекомендационных письма. На
данном этапе отсеивается около половины всех претендентов, поэтому к написанию
документов стоит подойти серьезно, а также убедиться в положительности
рекомендаций. Дедлайн на подачу обычно совпадает с Новым годом.
Отобранных аппликантов приглашают на скайп-интервью в феврале. В течение 30 минут
кандидаты рассказывают о мотивации заниматься наукой, презентуют свою работу и
обсуждают выбранную ими интересную статью.
При успешном прохождении онлайн этапов кандидатов приглашают на формальное
оффлайн собеседование в Эдинбург. Поездка оплачивается фондом. После чего The
Darwin Trust высылает заветный оффер.
Этот путь может показаться очень длительным и тернистым. Три года назад мне удалось
его пройти и даже оказаться в топе рейтинга, при этом мои шансы попасть в условный
Кембридж или Цюрих были значительно ниже. Пробуйте свои силы и не забывайте
проверять blastim, там обязательно появятся интересные позиции,в том числе и The
Darwin Trust.

Сайт университета.

Автор — Дима Дёгтев. PhD студент, university of Edinburgh.

Образование биоинформатиков

Запощено 25.07.2018 от Вита Степанова

Три года мы занимаемся образованием биоинформатиков и каждый курс стараемся сделать лучше и актуальнее. Чтобы учиться не только на своем опыте, мы попросили коллег-биоинформатиков рассказать о своем образовании. Всего в опросе участвовало 44 человека из России, Америки и Европы. Мы бы и сами хотели больше ответов, но биоинформатики — люди занятые.

Оказалось, биоинформатике в основном учатся после высшего образования: в аспирантуре и на работе:

Я учился биоинформатике

Самыми полезными навыками биоинформатики считают статистику и программирование. В числе редких ответов встречались также линейная алгебра, термодинамика, computer science, reproducible research, сравнительная геномика.

Самый полезный навык в моей работе:

Биоинформатики сильно нуждаются в повторении или освоении статистики с нуля. Несколько человек ответили, что хотели бы подтянуть математику: тервер, линейную алгебру, случайные процессы. Среди прочих предметов для желательного освоения называли иммунологию, молбиол, биохимию и эволюционную биологию.

Если бы я мог, я бы повторил/изучил:

Мы не могли проигнорировать такой массовый запрос на хороший курс по статистике, поэтому ищем преподавателя для наших новых курсов.

В качестве дополнительного образования нам рекомендовали мероприятия Института Биоинформатики, Школы Биоинформатики, Бластима, Сколтех и сайт biostars. А также курсы и программы:

Образовательные программы:

Курсы и Школы:

Отдельно мы собрали список рекомендованных онлайн курсов (публикуем все, что посоветовали), который пополнит нашу постоянную страницу.

NGS:

Статистика:

Программирование:

Биология:

Машинное обучение:

Machine learning

Биоинформатика:

Другое:

Большое спасибо всем участникам опроса!

Частые ошибки в резюме

Запощено 12.01.2017 от Юрий Пеков

Зачем вообще писать резюме?

Чтобы работодатель понял, подходите ли вы. Упростите ему задачу: изучите вакансию и компанию, а затем напишите под эту вакансию отдельное резюме.
Чтобы работодатель вспомнил именно вас, когда будет решать, кого позвать на собеседование. Это тонкий лед: вы должны выделиться, но не показаться фриком.

Эти общие соображения ведут к некоторым частным выводам. Пройдемся по разделам типичного резюме.

О себе

Зачем работодателю ваша дата рождения — чтобы достать калькулятор и посчитать, сколько вам лет? А точный адрес и желаемое время в пути — чтобы вбить в Яндекс и проверить, сколько вам ехать до офиса? Где вы родились, всем пофиг. Национальность видна по имени и фамилии, да и вообще в наше время писать ее неприлично. Зато для бухгалтерии важно, какой страны у вас паспорт.


Плохо	Хорошо
Русский, родился в г. Пермь	Гражданин РФ
02.02.1905	25 лет
Женат, трое детей
ул. Горького, 8/9, кв. 15	Живу в Казани

Опыт работы

В описании прошлых мест работы вы должны рассказать три вещи:

Что именно вы делали на работе день ото дня? Опишите это как процессы. Используйте глаголы в активном залоге.
Чего вы достигли на этой должности? Опишите это как результаты. Используйте цифры и факты.
Вспомните самые интересные примеры процессов или результатов. Коротко опишите какой-нибудь проект или кейс. Используйте имена, названия, термины.


Плохо	Хорошо
14.01.2013 — 24.12.2014	янв 2013…дек 2014
Инженер II кат. (так написано в моей трудовой)	Биоинформатик
Минимизация издержек производства	Выявлял требования и руководил командой Уменьшил расходы на 146% за 8 месяцев Сделал анализ рынка для Термофишера

Навыки и хобби

Сначала резюме прочитает рекрутер, который ничего не смыслит в вашей специальности. Поймет ли он, что вы подходите для вакансии? Используйте слова попроще, особенно если они использовались в вакансии.
Затем резюме прочитает профессионал — ваш будущий руководитель. Как он поймет, что вы шарите? Добавьте термины и названия. Придется подумать, как сочетать их с описанием для рекрутера.
Не хвалите себя, это неубедительно. Положительные качества надо не декларировать, а показывать и доказывать. Это сложно, но сразу выделяет кандидата. Вот отличный пример о лидерских качествах.
Хобби обычно вызывают лишние вопросы. Оставьте лишь те, которые показывают, что вы способны упорно работать и достигать результатов.


Плохо	Хорошо
PC, Microsoft Office	3 года на NGC Discover 10
Обучаемость и коммуникативность	За месяц научился ставить сиквенс на Иллюмине
Самообразование, здоровый образ жизни	Капитан дворовой команды по футболу

Какие ошибки нашли у себя? С чем не согласны? Что стоит добавить?