NEWS & RESOURCES

PUBLICATION

(주)엠디엑스케이는 고객의 연구 목적에 적합한 기술과 서비스를 제공합니다.

  • home
  • NEWS & RESOURCES
  • PUBLICATION

Capture full-length transcripts With PacBio Highly Accurate Long Read sequencing

2021-07-30 10:45:06

 

SEQUENCE PLANTS AND ANIMALS WITH CONFIDENCE

 

과학자들이 광범위한 식물 및 동물을 연구하는 것에 있어

생물학적 질문에 답하는 데 SMRT sequencing이

어떻게 도움이 되는지 알아보십시오.



 

 

크고 복잡한 genome은 polyploidy 및 높은 수준의 heterozygosity와 같은 독특한 문제를 제시합니다. PacBio는 이러한 문제를 극복하는 데 필요한 높은 정확도와 충분히 긴 길이의 read를 제공합니다.

 



  

Insect Biology

질병 예방 방법을 개발하고, 기본 생물학을 이해하고, 집단 또는 개체를 사용하여

해충 방제를 개선합니다.

 

Crop Improvements

작물의 건강을 개선하고, 형질 선택을 수행, 번식 효율성을 향상시키는 새로운

생물학을 발견하십시오.

 

Animal Health and Breeding

동물 유전학을 조사하여 유전, 면역학 및 가축화 패턴을 고해상도로 연구합니다.

 

Marine Biodiversity

해양 생태계의 깊숙한 곳으로 뛰어 들어 진화를 연구하고 개발에 대한 통찰력을 밝히고

기후 변화의 과제를 해결하십시오.

 

Conservation

지원 번식, 야생 동물 관리 및 지속 가능성을 지원하기 위해 위험에 처한 종의

유전적 다양성을 조사합니다.




OBTAIN A MORE COMPREHENSIVE SET OF TRANSCRIPT ISOFORMS

 

 

SMRT (Single Molecule, Real-Time) 시퀀싱에 의해 생성된 매우 정확하고 (>99%) 긴 read를 사용하는 Iso-Seq 방법은 transcript isoform의 전체 길이의 분석이 가능하며, computational reconstruction 없이  full-length transcript isoform의 기능적 특성을 분석할 수 있습니다.

 

 

 

Survey transcript diversity with easy-to-use Iso-Seq analysis


SMRT (Single Molecule, Real-Time) 시퀀싱 및 Iso-Seq 분석을 사용하면  assembly 과정 없이 전체 길이의 cDNA 서열을 생성하여 표적 유전자 내에서 또는 전체 전사체에 걸쳐 isoform의 특성을 분석할 수 있습니다.


 • Discover novel genes and isoforms, even in well-characterized samples

 • Detect alternative polyadenylation motifs

 • Identify promoters and splice sites in comprehensive gene models

 • Improve accuracy of RNA-seq quantification with isoform-level resolution

 


 


     

 

 

 

 

Alternative splicing profiling in diamondback moth

 

Qian Zhao et al. (2019) BMC Genomics

DOI: 10.1186/s12864-019-5838-3

 

연구 목적

- 비록 배추좀나방(DBM /Diamondback moth)이 유전체 모델이 되었다 하더라도, 발달과정과 성 결정(sex determination)에 관련한 post-transcriptional mechanism은 포괄적으로 연구되지 않았으며, mRNA transcript의 완전한 구조에 대한 이해가 부족하였습니다. 따라서 이 연구는 alternative splicing 의 whole-genome wide analysis를 수행하여 배추좀나방의 발달과정과 성 결정에 초점을 맞추었습니다. 

 

- PacBio(Pacific Bio Sciences) platform인 single-molecule sequencing 기술은 NGS와 다르게 longer reads를 생성할 수 있는 기술이며, gene isoforms 찾는 방법을 개선하였습니다. Single-molecule sequencing은 옥수수, 수수, 딸기, 대나무 등의 식물이 가지는 transcriptome의 complexity에 어떠한 특징이 있는지 알기 위해 사용되는 주된 방법입니다. 곤충의 경우, PacBio 플랫폼은 Erthesina fullo의 미토콘드리아 게놈의 transcriptome map을 구축하는 데 사용되었습니다.

 

- 본 연구에서는 PacBio platform을 사용하여 transcript isoforms를 찾을 수 있었기에 배추좀나방의 발달과정과 성 결정에 대해 더 잘 이해할 수 있었습니다. 이를 위해, 각각의 developmental stages (알, 4번째 영충 애벌레, 번데기, 성충)에서 얻은 암수 samples를 사용하였습니다. 이와 동일한 pooled samples는 gene/isoform expression을 정량화하기 위해 Illumina HiSeq 2000 platform에서도 시퀀싱되었습니다. 이 두 시퀀싱 플랫폼을 통해서 본 연구는 기존에 알던 수준보다 훨씬 디테일하고 보다 충분한 배추좀나방 전사체의 데이터를 얻을 수 있었습니다. 배추좀나방 genome에서 일어나는 여러 alternative splicing (AS)을 확인함으로써 post-transcriptional regulation mechanism이 어떤 것인지 알 수 있게 하였고, 이것은 배추좀나방의 발달과정과 성 결정의 기초가 되는 mechanism을 설명하기 위한 향후 연구에 중요한 단서입니다.

 

- 가능한 한 많은 transcript를 찾기 위해 Illumina RNA sequencing과 PacBio Iso sequencing (single-molecule long-read sequencing technology) 가 함께 사용되었습니다. 예상대로 RNAseq는 IsoSeq보다 높은 coverage를 생성했으며, 이 둘은 함께 gene coverage를 추가적으로 늘렸다. 이것은 두 method가 결합되면 오류율이 효과적으로 감소할 수 있음을 나타냅니다.

 

 

 

Ginkgo biloba transcript variants in flavonoid biosynthesis

 

Jiabao Ye et al. (2019) ScienceDirect
DOI: 10.1016/j.indcrop.2019.111547

연구의 목적
중국 전통 약용식물인 Ginkgo biloba 는 플라보노이드를 함유하고 있으며, 플라보노이드의 생성을 증가시키는 유전기술은 이것의 생합성(biosynthesis)에 관여하는 핵심 유전자에 초점을 맞추고 있습니다. 그러나 플라보노이드 생합성의 molecular mechanism은 아직 잘 알려져 있지 않습니다. 이 메커니즘을 이해하기 위해 G. biloba에 second-generation sequencing (SGS)와 single-molecule real-time (SMRT) sequencing이 함께 적용되었습니다.

연구에 사용된 technologies
PacBio SMRT sequencin을 이용하여  G. biloba의 8개 조직 샘플로부터 high-quality, full-length transcriptome databas를 구축하였습니다. RNA-seq  또한 이 조직 샘플들에 실행되었는데, gene/isoform expression을 정량화하기 위해 Illumina HiSeq platform을 사용하였습니다. Dataset에는 breadth (genes covered)와 depth (transcripts per gene)의 측면에서 G. biloba transcriptome에 대한 이해를 돕는 full-length cDNA 시퀀스 정보가 담겨있습니다. 또한, WGCNA analysis는 G. biloba의 flavonoid metabolism과 관련된 특정 유전자와 pathway를 확인하기 위해 수행되었습니다. 결론적으로, 이 연구는 개선된 genome annotation을 제공하였고 plant research를 위한 가치있는 자료가 되었습니다.

무엇을 발견하였는가?
FL isoforms, ORFs, SSRs, lncRNAs, AS, APA, fusion gene, novel gene, 유전자 구조 등을 예측할 수 있었습니다. G. biloba만이 가지고 있는 많은 long-read isoforms와 lncRNAs transcripts 및 플라보노이드 생합성과 관련있어 보이는 alternative splicing events 등을 발견할 수 있었습니다.
또한 단계별로 축적되는 TF와 structure genes를 찾아내어 플라보노이드 생합성 과정에서 기능하는 hub gene을 발견하였습니다.  이처럼 PacBio transcript sequencing을 통해 얻은 데이터는 G. biloba의 gene annotation이 가능하게 하였고 유전적 기능에 대한 연구들 또한 촉진할 수 있었습니다.
  
________________________________________

이 연구 결과는 G. biloba의 genome annotation을 개선하고 플라브노이드의 생합성과 관련한 gene regulation을 설명하는데 있어 full-length transcriptome의 SMRT sequencing의 중요성을 강조합니다.
SMRT 기술의 등장은 third-generation sequencing (TGS) 플랫폼을 제공합니다. 평균 read-length는 10Kb에서 15Kb이며 5’ end에서 3’-poly A tail까지의 전체 transcript까지 쉽게 확장할 수 있고 mRNA transcript 전체를 cover하기 위한 assembly가 필요하지 않습니다. SMRT sequencing platform은 mRNA 구조 최적화, mRNA homologs 분석, alternative splicing, 유전자 융합 등에 성공적으로 적용되고 있습니다.
 


  


이 웨비나에서는 Type II (THCA와 CBDA를 생성하는) 식물의 대마초 게놈 (cannabis genome)에 대해 설명합니다. PacBio의 long-read sequencing이 어떻게 high-quality plant genomics research를 가능하게 하는지와 full-length transcript sequencing이 대마초 reference genome을 annotation 하는 것, 그리고 다양한 종류의 대마초 식물에서 일어나는 cannabis synthesis(대마초 합성)에 대한 새로운 통찰력 등 대마초 게놈학의 최신 정보를 공유합니다.   





이 웨비나에서는 grizzly bears (회색곰)의 동면기와 활동 주기 동안에 gene expression이 다르다는 것에 초점을 두고, transcriptome 시퀀싱 및 분석에 대해 설명하고 있습니다. 이것은 근육 위축과 인슐린 저항성에 관련있는 정보로 이어질 수 있습니다. 이 연구팀은 이전 reference genome 전체에 특징지어졌던 것보다 더 많은 unique isoforms들을 간 조직에서 발견할 수 있었습니다 여기서 특별히 관심있게 여기는 것은, 동면기와 활동 주기 사이에 2,000개가 넘는 transcripts들이 다르게 발현된다는 것이고, 이 중 86개의 genes는 반대 방향으로 ?현되는 isoforms를 가집니다.





Xiujuan Zhang,  et.al. Fish & Shellfish immunology
DOI : 10.1016/j.fsi.2019.01.023
 

 

Pacific white shrimp (흰다리새우)는 전세계의 양식업에서 경제적으로 가장 중요한 새우 중 하나입니다. PacBio Iso-Seq 방법을 사용한 full-length transcriptome 분석은 Isoform-level reference transcriptome을 제공합니다. 병원균에 대항하는 데 필요한 새우의 innate immune system에 대한 정보를 제공하므로, 연관된 질병의 예방과 치료 발전에 기여합니다


중국연구팀은 취약종(vulnerable species)의 transcriptome에 대한 정보를 얻어, 그것의 innate immune system과 관련된 5,000개 이상의 full-length transcripts를 찾을 수 있었습니다. 또한, 그들은 면역 물질의 수와 기능을 증가시킨 interferon regulatory factors (IRFs)와 toll-like receptors (TLRs)와 같은 광범위한 transcript variants를 발견하였습니다.
 
연구팀은 PacBio isoform sequence analysis (Iso-Seq)와 Illumina paired-end short read 방법을 결합하여 다섯 개의 조직으로부터 평균 길이가 2,545 bp인 72,648개의 non-redundant full-length transcripts를 발견하였습니다.  아직은 reference genome이 없는 흰다리새우의 전체 genome을 sequencing할 때 어려움이 있어 targeted isoform sequencing을 사용하였습니다. Genome은 크고 highly-repetitive한 sequences를 가지고 있기에 short reads를 사용하는 것은 full-length cDNA molecules 생산에 제한이 있다고 말합니다.
  
  
________________________________________