Твои Традиции

Геномные и эпигеномные механизмы

Геномные и эпигеномные механизмы адаптации лесных древесных видов

Лаборатории популяционной генетики:

  • Института общей генетики им. Н. И. Вавилова РАН
  • Нayчный pyководитeль Научно-образовательного центра
  • геномных исследований и лаборатории лесной геномики
  • Сибирского федерального университета
  • Профессор генетики отделения лесной генетики и селекции
  • Гёттингенского университета, Германия
  • Адьюнкт профессор отделения по изучению и управлению экосистем Техасского агро-механический университета, США

Проект: «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации»
грант Правительства РФ №14.Y26.31.0004
Крутовский К.В., Орешкова Н.В., Путинцева Ю.В.Павлов И.Н.Кузьмин Д.А., Шилкина Е.А.Ибе А.А., Дейч К.О., Третьякова И.Н., Ваганов Е.А.

  1. Институт общей генетики им. Н.И. Вавилова РАН, Москва
  2. Сибирский Федеральный Университет, Красноярск
  3. Гёттингенский университет, Германия
  4. Институт леса им. В.Н. Сукачева СО РАН, Красноярск

Основные задачи проекта:

Создание новой, конкурентоспособной, современной, динамичной и хорошо оснащённой лаборатории геномных исследований, интегрированной как в научную, так и в образовательную инфраструктуру СФУ, способной проводить современные научные исследования и готовить специалистов в области геномики и биоинформатики.

Получение эталонных, полностью просеквенированных и аннотированных геномов основных лесообразующих пород Российской Федерации лиственницы сибирской (Larix sibirica Ledeb.), сосны обыкновенной (Pinus sylvestris L.) и сосны кедровой сибирской (Pinus sibirica Du Tour.) и их наиболее опасных патогенов, в первую очередь грибов, входящих в комплексы Armillaria mellea s. l. и Heterobasidion annosum s. l., которые вызывают катастрофическое усыхание российских бореальных лесов.

Разработка высокоинформативные молекулярно-генетические маркёры, которые могут быть эффективно использованы для определения происхождения древесины, изучения и мониторинга генетической изменчивости хвойных лесов, их адаптации к изменению климата и для создания селекционных и природоохранных программ.

Эти же задачи были заявлены как наиболее приоритетные для лесного хозяйства в Комплексной программе развития биотехнологий в Российской Федерации на период до 2020 года, утверждённой Правительством Российской Федерации 24 апреля 2012 г.

Создана новая лаборатория – единственная такого рода в стране!

Бореальные леса — самые большие биогеоценозы, которые требуют защиты и сохранения.
Хвойные:

  • самые долгоживущие, самые крупные, и т.д.
  • крайне разнообразные
  • самые эволюционно древние
  • самые экономически важные
  • эстетичные
  • самое доступное и реальное средство для борьбы с парниковым эффектом (через связывание углерода)
  • биогорючее (единственный реальный возобновляемые альтернативный источник энергии)

 

 

 

 

Космический масштаб задач: Гигантский размер геномов хвойных – в 4-9 раз больше генома человека!

Хвоя — это источник уникальных продуктов для:

  • строительной, бумажной и мебельной промышленности
  • получения альтернативной энергии и биотоплива (спирт на основе целлюлозы)
  • медицины (например, противоопухолевые препараты на основе таксола)
  • авиационной и ракетной техники (высококачественное реактивное топливо на основе альфа-пиренов)
  • борьбы с вредителями (экологически безопасные пестициды и репелленты на основе терпенов и др. вторичных метаболитов)

Самые генетически изменчивые — лесные деревья 20%

Самый большой размер генома

Сосна сахарная (Pinus lambertiana):  = 28,90 Gbp, Сосна обыкновенная (Pinus sylvestris): 1С = 22.47 Gbp, Сосна ладанная (Pinus taeda):  = 21,61 Gbp, Ель обыкновенная (Picea abies): 1C = 19,57 Gbp, Геном человека (Homo sapiens): 1С = 3,20 Gbp

Почему и зачем нужны геномные исследований в лесном хозяйстве?
Какая выгода лесной генетике и защите леса от расшифровки генома основных видов хвойных?

  • идентификация и аннотация всех функциональных генов и регуляторных элементов (включая короткие РНК, транскрипционные факторы и т.д.) и определение метаболических сетей генов, контролирующих адаптацию и устойчивость к болезням
  • разработка высоко информативные генетические маркеры (прежде всего микросателлитных локусов и однонуклеотидных полиморфизмов — SNP – т.н. «снипов»), которые могут быть использованы в генетических исследований популяций и для создания генетической базы данных (наподобие молекулярно-генетических штрих-кодов для отдельных популяций) для борьбы с нелегальной заготовкой и торговлей древесины
  • разработка полногеномных генетических маркеров для обнаружения связи между генетической изменчивостью (SNP, аллели , гаплотипы и генотипы ) с изменчивостью адаптивных и селекционно-ценных признаков и фенотипов, и с факторами окружающей среды для лучшего понимания генетического контроля адаптивных, селекционных и экономически важных признаков
  • разработка полногеномных генетических маркеров для геномной селекции быстрорастущих и более устойчивых пород с ценными признаками
  • системная биология: интеграция протеомики, транскриптомики и метаболомики
  • референсный геном для картирования при повторном секвенировании (ресеквенировании)

Проекты полного de novo секвенирования геномов хвойных

Вид

Ведущие учреждение (руководитель проекта, бюджет, год

начала)

Ель обыкновенная

Norway spruce (Picea abies)

Umeå Plant Science Centre, Sweden

(Dr. Pär Ingvarsson, $12M, 2010)

 

Ель белая, ситка и чёрная

White, Sitka and

Black spruce (Picea glauca, P. mariana) sitchensis & P.

Université Laval, Canada

(Dr. John MacKay, $10M, 2010)

 

Ладанная сосна

Loblolly pine (Pinus taeda), Лжетсуга Douglas-fir (Pseudotsuga menziesii), Сахарная сосна Sugar pine (Pinus lambertiana)

University of California, Davis, USA

(Dr. David Neale, $15M, 2011)

  
 
 

Средиземноморская сосна

Maritime pine (Pinus pinaster), сосна обыкновенная

European Union

(Dr. María-Teresa Cervera, INIA

CIFOR, Spain, $10M, 2012)

Scots pine (Pinus sylvestris)

Сибирская лиственница

Siberian larch (Larix sibirica), сибирская кедровая сосна Siberian pine (Pinus sibirica), сосна обыкновенная

Siberian Federal University, Russia

(Dr. Konstantin Krutovsky, $2М,

2012, $3M, 2014)

 
       

Колоссальная сложность задачи – гигантский размер геномов хвойных!
Сравнительный размер геномов хвойных в проектах полногеномного секвенирования

Вид1

Колво ДНК,

pg (1С)

Размер ДНК,

Gbp (1С)

Соотношение к

геному человека

Геном человека, Homo sapiens2

3,47

3,20

1

Лиственница сибирская (Larix sibirica)3

12,30

12,03

4

Лиственница Гмелина (Larix gmelinii)3

14,00

13,69

4

Псевдотсуга (Pseudotsuga menziesii)4

19,05

18,63

6

Ель обыкновенная (Picea abies) 5

20.01

19.57

6

Ель белая (Picea glauca)3

20.20

19,76

6

Сосна ладанная (Pinus taeda) 4

22.10

21.61

7

Сосна обыкновенная (Pinus sylvestris)5

22,98

22,47

7

Сосна приморская (Pinus pinaster) 3

24.35

23.81

7

Сосна сибирская (Pinus sibirica)6

29,55

28,90

9

Сосна сахарная (Pinus lambertiana)7

29,55

28,90

9

Современные методы секвенирования ДНК

  • Выпуск с 2005 г. коммерческих высоко- производительных секвенаторов ДНК на основе новых технологий массивного параллельного секвенирования компаниями Roche и Illumina
  • Создание в 2012 г. Научно-образовательного центра геномных исследований и в 2014 г. Лаборатории лесной геномики Сибирского федерального университета при поддержке Отдела генетики и селекции Центра защиты леса Красноярского края и Лаборатории лесной генетики и селекции Института леса им. В. Н. Сукачева СОРАН, оборудованной самым производительным секвенатором Illumina HiSeq 2000 и суперкомпьютером (http://genome.sfukras.ru)

Основная задача геномики полное секвенирование и расшифровка генома
Проблема полногеномного секвенирования с помощью новых секвенаторов: возможность секвенировать только короткими фрагментами 100-150
Полученные данные полногеномного секвенирования

  • Larix sibirica (12,03 Gbp): хвоя и гаплоидная клеточная линия парно-концевые (PE) библиотеки: 180, 250, 400 и 500 bp сцепленно-концевая (MPE) библиотека: 5 Kbp общая длина ридов хорошего качества ~891 Gbp (~74X)
  • Pinus sibirica (28,90 Gbp): отдельный эндосперм PE библиотеки: 250 и 500 bp MPE библиотеки: 3 и 5 Kbp общая длина ридов хорошего качества ~595 Gbp (~21X)

 

Motif, bp

Loci selected

Mean locus length, bp

Per 1 Gbp

2

563

20.6

28,570

3

140

31.8

7,100

4

7

53.9

360

5

3

60.0

150

6

10

59.9

510

Микросателлитные локусы лиственницы сибирской (Larix sibirica)

Genome-wide Microsatellite Analyzing Tool (GMATo)

  • для лиственницы синтезированы и протестированы ПЦР праймеры для 87 локусов;
  • выявлено 2 полиморфных праймера информативных по гетерозиготности;
  • в дальнейшем планируется расширить число праймеров и использовать сиквенсы трёх деревьев для более информативного поиска
  • для сосны кедровой сибирской Pinus sibirica Du Tour протестированы ПЦР праймеры для 70 локусов и 20 оказались полиморфными

Анализ повторяющихся последовательностей в геноме сосны сибирской кедровой

Участки ДНК, включённые в геном, последовательность которых состоит из повторяющихся фрагментов.
~50% генома человека ~32% Arabidopsis thaliana ~70% кукурузы
~35% риса,
~42% Populus trichocarpa
~82% хвойных!

Повторяющиеся последовательности в геноме

Часто повторяющиеся последовательности

  • Сателлиты
  • Микросателлиты
  • Минисателлиты

Умеренно повторяющиеся последовательности

  • Ретроэлементы  — обратная транскрипция синтез ДНК на матрице РНК обратной транскриптазой
  • ДНК‐транспозоны (cut and paste) с участием транспозазы

Ретроэлементы:

  1.  LTR-содержащие ретроэлементы, включающие ретротранспозоны и эндогенные ретровирусы. Ty1/copia и Ty3/gypsy
  2. Ретроэлементы, не содержащие LTR, составленные из длинных (LINE) и коротких (SINE) диспергированных элементов.

Анализ повторяющихся последовательностей в геноме сосны сибирской кедровой

Данные полногеномного секвенирования сосны сибирской кедровой:

  • контиги длиной > 500 bp
  • общее число таких контигов = 2,389,750
  • суммарная длина = 2 149 954 272 bp
  • максимальная длина = 14,020 bp
  • N50 = 919 bp
  • N90 = 554 bp

Подходы к поиску повторяющихся последовательностей:

  • Поиск повторяющихся последовательностей с использованием библиотек повторов.
  • Сигнатурный подход (The signature-based approaches).
  • De Novo подходы:

Self-comparison approaches
K-mer and spaced seed approaches

RepeatModeler pipeline:

  • http://www.repeatmasker.org/RepeatModeler.html
  • Включает в себя программы:

– RECON
– RepeatScout (с использованием к-меров http://repeatscout.bioprojects.org)
– TRF
– RepeatMasker
–  Использует выходные данные программ RECON и RepeatScout для создания, уточнения и классификации консенсусных моделей предполагаемых повторов.

Сосна сибирская кедровая                                   Лиственница сибирская

Картирование коротких сиквенсов (ридов) сибирской лиственницы на хлоропластный геном европейской лиственницы из Genbank и сборка

L. decidua (NC_016058, 122,474 bp, complete)

  • картирование с помощью Bowtie2 и BWA программ
  • сборка ридов при помощи SPAdes;
  • сборка скаффолдов программой SSPACE
 
 
 
 
Аннотация хлоропластных геномов лиственницы

Вид

Длина,

bp

Сборка

Общее число генов

РНК

гены

Протеи

новые

гены

Genbank

L. decidua

122,474

полная

110

38

72

NC_016058

L. occidentalis

119,680

неполная

105

31

68

FJ899578

L. sibirica

122,561

полная

121

34

87

 
  • SNPs искали при помощи программы UGENE (Call Variants with SAMtools).
  • Обнаружено13 SNPs, 2 из них – в кодирующих районах

Результаты картирования коротких сиквенсов (ридов) сибирской лиственницы и кедра на митохондриальные геномы ели обыкновенной и ладанной сосны из соотвествующих баз данных

P. taeda mitochondrial genome assembly (loblolly.ucdavis.edu/bipod/ftp/Genome_Data/genome/pinerefseq/Pita):

Scaffolds

Contigs

Total length, bp

Max length, bp

Min length, bp

N50, bp

N90, bp

4

31

1,263,957

256,879

124

193,087

58,893

Picea abies mitochondrial genome assembly (dl.dropboxusercontent.com/u/8576950/putative_mitochondrial_scaffold.fasta.zip):

Scaffolds

Contigs

Total length, bp

Max length, bp

Min length, bp

N50, bp

N90, bp

?

105

2,400,824

78,675

?

30,157

12,361

Species

Reads mapped to Pinus taeda

mitochondrial genome, %

Reads mapped to Picea abies

mitochondrial genome, %

P. sibirica

0.93

0.63

P. sylvestris

3.57

0.84

L. sibirica

 

0.12

A. sibirica

0.22

0.33

Mitochondrial genome assemblies for 4 conifer species in our study:

Species

Contigs

Total length, bp

Max length, bp

N50, bp

N90, bp

P. sibirica

431

482,064

9,882

2,274

398

P. sylvestris

2,586

1,190,450

19,705

2,003

177

A. sibirica

248

147,965

3,432

1,031

240

L. sibirica

209

69,615

1,039

333

227

De novo сборка транскриптома

Larix sibirica Ledeb.

  • мРНК почек лиственницы сибирской (Illumina MiSeq);
  • Предварительная обработка – Trimmomatic и

FastQC;

  • Сборка – Trinity;
  • Качество – PRINSEQ и QUAST;
  • Вспомогательные инструменты — Bowtie2 и

SAMtools.

De novo сборка транскриптома

Larix sibirica Ledeb.

  • Общая длина – 26,493,048 bp;
  • Картирование ридов на сборку:

общий % выравнивания — ~87%, покрытие – 23Х и 8014Х (среднее и максимальное)

  • Число контигов (юнигенов) – 43,686 (из них 6,919>1000 bp);
  • Длина максимального контига – 8512 bp;
  • N50 – 878 bp
  • GC,% – 43,57

Comparative whole genome sequencing of major phytopathogens of boreal forests  

Local die offs of pine-fir stand in Siberia and haploid culture of Armillaria mellea s.l., isolated from the roots of the affected trees (fresh dead wood and very weak trees)

The local spot of root fungus  in pine forests of natural origin in Siberia and haploid culture Heterobasidion 

annosum (Fr.) Bref. s.s., isolated from the roots of the affected wood trees

  

Кратко полученные научные результаты:

  • Все поставленные на 2014 г. задачи выполнены в полном объёме, а по некоторым показателям даже перевыполнены. Кроме того, дополнительно к запланированным задачам были получены чистые грибные культуры Armillaria mellea и Heterobasidion annosum с контрастной патогенностью, что изначально планировалось только в следующем 2015 г.
  • Впервые получены предварительные рабочие сборки ядерного генома лиственницы и кедра.
  • Заложены основы для полной сборки и аннотации геномов лиственницы и кедра.
  • Впервые полностью собраны и проаннотированы хлоропластные геномы лиственницы и сосны.
  • Впервые получены предварительные рабочие сборки митохондриального генома лиственницы и кедра.
  • Полученные геномные нуклеотидные сборки могут быть и были использованы для поиска высокополиморфных молекулярно-генетических маркёров, таких как микросателлитные локусы, которые могут быть эффективно использованы для решения практических и природоохранных задач 
  • лесного хозяйства.

                                                                                                              

6100 лет на двоих

Рецепт долголетия!

 

В гармонии с природой…………………….

WhatsApp chat