Твои Традиции

Геномные и эпигеномные механизмы адаптации лесных древесных видов

Геномные и эпигеномные механизмы адаптации лесных древесных видов

Основные задачи проекта:

Создание новой, конкурентоспособной, современной, динамичной и хорошо оснащённой лаборатории геномных исследовании. Получение эталонных, полностью просеквенированных и аннотированных геномов основных лесообразующих пород Российской Федерации. Разработка высокоинформативные молекулярно-генетические маркёры

Геномные и эпигеномные механизмы адаптации лесных древесных видов

Лаборатории популяционной генетики:

  • Института общей генетики им. Н. И. Вавилова РАН
  • Нayчный pyководитeль Научно-образовательного центра
  • геномных исследований и лаборатории лесной геномики
  • Сибирского федерального университета
  • Профессор генетики отделения лесной генетики и селекции
  • Гёттингенского университета, Германия
  • Адьюнкт профессор отделения по изучению и управлению экосистем Техасского агро-механический университета, США

Проект: «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации»
грант Правительства РФ №14.Y26.31.0004
Крутовский К.В., Орешкова Н.В., Путинцева Ю.В.Павлов И.Н.Кузьмин Д.А., Шилкина Е.А.Ибе А.А., Дейч К.О., Третьякова И.Н., Ваганов Е.А.

  1. Институт общей генетики им. Н.И. Вавилова РАН, Москва
  2. Сибирский Федеральный Университет, Красноярск
  3. Гёттингенский университет, Германия
  4. Институт леса им. В.Н. Сукачева СО РАН, Красноярск

Основные задачи проекта:

Создание новой, конкурентоспособной, современной, динамичной и хорошо оснащённой лаборатории геномных исследований, интегрированной как в научную, так и в образовательную инфраструктуру СФУ, способной проводить современные научные исследования и готовить специалистов в области геномики и биоинформатики.

Получение эталонных, полностью просеквенированных и аннотированных геномов основных лесообразующих пород Российской Федерации лиственницы сибирской (Larix sibirica Ledeb.), сосны обыкновенной (Pinus sylvestris L.) и сосны кедровой сибирской (Pinus sibirica Du Tour.) и их наиболее опасных патогенов, в первую очередь грибов, входящих в комплексы Armillaria mellea s. l. и Heterobasidion annosum s. l., которые вызывают катастрофическое усыхание российских бореальных лесов.

Разработка высокоинформативные молекулярно-генетические маркёры, которые могут быть эффективно использованы для определения происхождения древесины, изучения и мониторинга генетической изменчивости хвойных лесов, их адаптации к изменению климата и для создания селекционных и природоохранных программ.

Эти же задачи были заявлены как наиболее приоритетные для лесного хозяйства в Комплексной программе развития биотехнологий в Российской Федерации на период до 2020 года, утверждённой Правительством Российской Федерации 24 апреля 2012 г.

Создана новая лаборатория – единственная такого рода в стране!

Бореальные леса — самые большие биогеоценозы, которые требуют защиты и сохранения.
Хвойные:

  • самые долгоживущие, самые крупные, и т.д.
  • крайне разнообразные
  • самые эволюционно древние
  • самые экономически важные
  • эстетичные
  • самое доступное и реальное средство для борьбы с парниковым эффектом (через связывание углерода)
  • биогорючее (единственный реальный возобновляемые альтернативный источник энергии)

Космический масштаб задачГигантский размер геномов хвойных – в 4-9 раз больше генома человека!

Хвоя — это источник уникальных продуктов для:

  • строительной, бумажной и мебельной промышленности
  • получения альтернативной энергии и биотоплива (спирт на основе целлюлозы)
  • медицины (например, противоопухолевые препараты на основе таксола)
  • авиационной и ракетной техники (высококачественное реактивное топливо на основе альфа-пиренов)
  • борьбы с вредителями (экологически безопасные пестициды и репелленты на основе терпенов и др. вторичных метаболитов)

Самые генетически изменчивые — лесные деревья 20%

Самый большой размер генома

Сосна сахарная (Pinus lambertiana):  = 28,90 Gbp, Сосна обыкновенная (Pinus sylvestris): 1С = 22.47 Gbp, Сосна ладанная (Pinus taeda):  = 21,61 Gbp, Ель обыкновенная (Picea abies): 1C = 19,57 Gbp, Геном человека (Homo sapiens): 1С = 3,20 Gbp

Почему и зачем нужны геномные исследований в лесном хозяйстве?
Какая выгода лесной генетике и защите леса от расшифровки генома основных видов хвойных?

  • идентификация и аннотация всех функциональных генов и регуляторных элементов (включая короткие РНК, транскрипционные факторы и т.д.) и определение метаболических сетей генов, контролирующих адаптацию и устойчивость к болезням
  • разработка высоко информативные генетические маркеры (прежде всего микросателлитных локусов и однонуклеотидных полиморфизмов — SNP – т.н. «снипов»), которые могут быть использованы в генетических исследований популяций и для создания генетической базы данных (наподобие молекулярно-генетических штрих-кодов для отдельных популяций) для борьбы с нелегальной заготовкой и торговлей древесины
  • разработка полногеномных генетических маркеров для обнаружения связи между генетической изменчивостью (SNP, аллели , гаплотипы и генотипы ) с изменчивостью адаптивных и селекционно-ценных признаков и фенотипов, и с факторами окружающей среды для лучшего понимания генетического контроля адаптивных, селекционных и экономически важных признаков
  • разработка полногеномных генетических маркеров для геномной селекции быстрорастущих и более устойчивых пород с ценными признаками
  • системная биология: интеграция протеомики, транскриптомики и метаболомики
  • референсный геном для картирования при повторном секвенировании (ресеквенировании)

Проекты полного de novo секвенирования геномов хвойных

ВидВедущие учреждение (руководитель проекта, бюджет, годначала)
Ель обыкновеннаяNorway spruce (Picea abies)Umeå Plant Science Centre, Sweden(Dr. Pär Ingvarsson, $12M, 2010)
 
Ель белая, ситка и чёрнаяWhite, Sitka andBlack spruce (Picea glauca, P. mariana) sitchensis P.Université Laval, Canada(Dr. John MacKay, $10M, 2010)
 
Ладанная соснаLoblolly pine (Pinus taeda), Лжетсуга Douglas-fir (Pseudotsuga menziesii), Сахарная сосна Sugar pine (Pinus lambertiana)University of California, Davis, USA(Dr. David Neale, $15M, 2011)
  
 
 
Средиземноморская соснаMaritime pine (Pinus pinaster), сосна обыкновеннаяEuropean Union(Dr. María-Teresa Cervera, INIACIFOR, Spain, $10M, 2012)
Scots pine (Pinus sylvestris)
Сибирская лиственницаSiberian larch (Larix sibirica), сибирская кедровая сосна Siberian pine (Pinus sibirica), сосна обыкновеннаяSiberian Federal University, Russia(Dr. Konstantin Krutovsky, $2М,2012, $3M, 2014)
 
       

Колоссальная сложность задачи – гигантский размер геномов хвойных!
Сравнительный размер геномов хвойных в проектах полногеномного секвенирования

Вид1Колво ДНК,pg (1С)Размер ДНК,Gbp (1С)Соотношение кгеному человека
Геном человека, Homo sapiens23,473,201
Лиственница сибирская (Larix sibirica)312,3012,034
Лиственница Гмелина (Larix gmelinii)314,0013,694
Псевдотсуга (Pseudotsuga menziesii)419,0518,636
Ель обыкновенная (Picea abies) 520.0119.576
Ель белая (Picea glauca)320.2019,766
Сосна ладанная (Pinus taeda) 422.1021.617
Сосна обыкновенная (Pinus sylvestris)522,9822,477
Сосна приморская (Pinus pinaster) 324.3523.817
Сосна сибирская (Pinus sibirica)629,5528,909
Сосна сахарная (Pinus lambertiana)729,5528,909

Современные методы секвенирования ДНК

  • Выпуск с 2005 г. коммерческих высоко- производительных секвенаторов ДНК на основе новых технологий массивного параллельного секвенирования компаниями Roche и Illumina
  • Создание в 2012 г. Научно-образовательного центра геномных исследований и в 2014 г. Лаборатории лесной геномики Сибирского федерального университета при поддержке Отдела генетики и селекции Центра защиты леса Красноярского края и Лаборатории лесной генетики и селекции Института леса им. В. Н. Сукачева СОРАН, оборудованной самым производительным секвенатором Illumina HiSeq 2000 и суперкомпьютером (http://genome.sfu—kras.ru)

Основная задача геномики  полное секвенирование и расшифровка генома
Проблема полногеномного секвенирования с помощью новых секвенаторов: возможность секвенировать только короткими фрагментами 100-150
Полученные данные полногеномного секвенирования

  • Larix sibirica (12,03 Gbp): хвоя и гаплоидная клеточная линия парно-концевые (PE) библиотеки: 180, 250, 400 и 500 bp сцепленно-концевая (MPE) библиотека: 5 Kbp общая длина ридов хорошего качества ~891 Gbp (~74X)
  • Pinus sibirica (28,90 Gbp): отдельный эндосперм PE библиотеки: 250 и 500 bp MPE библиотеки: 3 и 5 Kbp общая длина ридов хорошего качества ~595 Gbp (~21X)
Motif, bpLoci selectedMean locus length, bpPer 1 Gbp
256320.628,570
314031.87,100
4753.9360
5360.0150
61059.9510

Микросателлитные локусы лиственницы сибирской (Larix sibirica)

Genome-wide Microsatellite Analyzing Tool (GMATo)

  • для лиственницы синтезированы и протестированы ПЦР праймеры для 87 локусов;
  • выявлено 2 полиморфных праймера информативных по гетерозиготности;
  • в дальнейшем планируется расширить число праймеров и использовать сиквенсы трёх деревьев для более информативного поиска
  • для сосны кедровой сибирской Pinus sibirica Du Tour протестированы ПЦР праймеры для 70 локусов и 20 оказались полиморфными

Анализ повторяющихся последовательностей в геноме сосны сибирской кедровой

Участки ДНК, включённые в геном, последовательность которых состоит из повторяющихся фрагментов.
~50% генома человека ~32% Arabidopsis thaliana ~70% кукурузы
~35% риса,
~42% Populus trichocarpa
~82% хвойных!

Повторяющиеся последовательности в геноме

Часто повторяющиеся последовательности

  • Сателлиты
  • Микросателлиты
  • Минисателлиты

Умеренно повторяющиеся последовательности

  • Ретроэлементы  — обратная транскрипция синтез ДНК на матрице РНК обратной транскриптазой
  • ДНК‐транспозоны (cut and paste) с участием транспозазы

Ретроэлементы:

  1.  LTR-содержащие ретроэлементы, включающие ретротранспозоны и эндогенные ретровирусы. Ty1/copia и Ty3/gypsy
  2. Ретроэлементы, не содержащие LTR, составленные из длинных (LINE) и коротких (SINE) диспергированных элементов.

Анализ повторяющихся последовательностей в геноме сосны сибирской кедровой

Данные полногеномного секвенирования сосны сибирской кедровой:

  • контиги длиной > 500 bp
  • общее число таких контигов = 2,389,750
  • суммарная длина = 2 149 954 272 bp
  • максимальная длина = 14,020 bp
  • N50 = 919 bp
  • N90 = 554 bp

Подходы к поиску повторяющихся последовательностей:

  • Поиск повторяющихся последовательностей с использованием библиотек повторов.
  • Сигнатурный подход (The signature-based approaches).
  • De Novo подходы:

– Self-comparison approaches
– K-mer and spaced seed approaches

RepeatModeler pipeline:

  • http://www.repeatmasker.org/RepeatModeler.html
  • Включает в себя программы:

– RECON
– RepeatScout (с использованием к-меров http://repeatscout.bioprojects.org)
– TRF
– RepeatMasker
–  Использует выходные данные программ RECON и RepeatScout для создания, уточнения и классификации консенсусных моделей предполагаемых повторов.

Сосна сибирская кедровая                                   Лиственница сибирская

Картирование коротких сиквенсов (ридов) сибирской лиственницы на хлоропластный геном европейской лиственницы из Genbank и сборка

L. decidua (NC_016058, 122,474 bp, complete)

  • картирование с помощью Bowtie2 и BWA программ
  • сборка ридов при помощи SPAdes;
  • сборка скаффолдов программой SSPACE

Аннотация хлоропластных геномов лиственницы

ВидДлина,bpСборкаОбщее число геновРНКгеныПротеиновыегеныGenbank
L. decidua122,474полная1103872NC_016058
L. occidentalis119,680неполная1053168FJ899578
L. sibirica122,561полная1213487 
  • SNPs искали при помощи программы UGENE (Call Variants with SAMtools).
  • Обнаружено13 SNPs, 2 из них – в кодирующих районах

Результаты картирования коротких сиквенсов (ридов) сибирской лиственницы и кедра на митохондриальные геномы ели обыкновенной и ладанной сосны из соотвествующих баз данных

P. taeda mitochondrial genome assembly (loblolly.ucdavis.edu/bipod/ftp/Genome_Data/genome/pinerefseq/Pita):

ScaffoldsContigsTotal length, bpMax length, bpMin length, bpN50, bpN90, bp
4311,263,957256,879124193,08758,893

Picea abies mitochondrial genome assembly (dl.dropboxusercontent.com/u/8576950/putative_mitochondrial_scaffold.fasta.zip):

ScaffoldsContigsTotal length, bpMax length, bpMin length, bpN50, bpN90, bp
?1052,400,82478,675?30,15712,361
SpeciesReads mapped to Pinus taedamitochondrial genome, %Reads mapped to Picea abiesmitochondrial genome, %
P. sibirica0.930.63
P. sylvestris3.570.84
L. sibirica 0.12
A. sibirica0.220.33

Mitochondrial genome assemblies for 4 conifer species in our study:

SpeciesContigsTotal length, bpMax length, bpN50, bpN90, bp
P. sibirica431482,0649,8822,274398
P. sylvestris2,5861,190,45019,7052,003177
A. sibirica248147,9653,4321,031240
L. sibirica20969,6151,039333227

De novo сборка транскриптома

Larix sibirica Ledeb.

  • мРНК почек лиственницы сибирской (Illumina MiSeq);
  • Предварительная обработка – Trimmomatic и

FastQC;

  • Сборка – Trinity;
  • Качество – PRINSEQ и QUAST;
  • Вспомогательные инструменты — Bowtie2 и

SAMtools.

De novo сборка транскриптома

Larix sibirica Ledeb.

  • Общая длина – 26,493,048 bp;
  • Картирование ридов на сборку:

общий % выравнивания — ~87%, покрытие – 23Х и 8014Х (среднее и максимальное)

  • Число контигов (юнигенов) – 43,686 (из них 6,919>1000 bp);
  • Длина максимального контига – 8512 bp;
  • N50 – 878 bp
  • GC,% – 43,57

Comparative whole genome sequencing of major phytopathogens of boreal forests  

Local die offs of pine-fir stand in Siberia and haploid culture of Armillaria mellea s.l., isolated from the roots of the affected trees (fresh dead wood and very weak trees)

The local spot of root fungus  in pine forests of natural origin in Siberia and haploid culture Heterobasidion 

annosum (Fr.) Bref. s.s., isolated from the roots of the affected wood trees

Кратко полученные научные результаты:

  • Все поставленные на 2014 г. задачи выполнены в полном объёме, а по некоторым показателям даже перевыполнены. Кроме того, дополнительно к запланированным задачам были получены чистые грибные культуры Armillaria mellea и Heterobasidion annosum с контрастной патогенностью, что изначально планировалось только в следующем 2015 г.
  • Впервые получены предварительные рабочие сборки ядерного генома лиственницы и кедра.
  • Заложены основы для полной сборки и аннотации геномов лиственницы и кедра.
  • Впервые полностью собраны и проаннотированы хлоропластные геномы лиственницы и сосны.
  • Впервые получены предварительные рабочие сборки митохондриального генома лиственницы и кедра.
  • Полученные геномные нуклеотидные сборки могут быть и были использованы для поиска высокополиморфных молекулярно-генетических маркёров, таких как микросателлитные локусы, которые могут быть эффективно использованы для решения практических и природоохранных задач 
  • лесного хозяйства.

6100 лет на двоих

Рецепт долголетия!

В гармонии с природой…………………….

Оставьте комментарий

WhatsApp chat
%d такие блоггеры, как: