Long read sequencing이 초기에는
genome contiguity의 향상에
주로 중점을 두었다면, 이제는 복잡하고
반복적인 영역이 haplotype phasing과 연관하여
어떻게 assemble 되는 지에
대해 관심이 증가하고 있습니다.
Utah State, BYU, the LOEWE Centre for Translational Biodiversity
Genomics(Germany), the University of Utah, the Smithsonian Institution 공동연구팀은
서로 다른 type의 sequence data가
genome assembly에 미치는 영향에 대해 살펴보았습니다.
본 논문에서는 caddisfly 종 (사막 메뚜기- 지금까지 완성된 가장 큰 곤충 genome 중 하나, human genome의 약 3배)을 사용하여 genome assembly 품질에 대해 다양한 시퀀스 리드 정확도의 영향을 평가하고 대규모 메타 분석을 수행하였습니다.
HiFi read는 식물과 동물 모두에 대해 다른 모든 data typea을 일관되게 능가하며 복잡한 식물 genome을 assembly하는 데 특히 유용한 도구가 될 수 있다고 설명하고 있습니다.
“To
realize the promise of biodiversity genomics, we call for greater uptake of
highly accurate long-reads in future studies.”
PacBio는 Earth BioGenome Project, Darwin
Tree of Life Project, Vertebrate Genome Project, African BioGenome Project,
European Reference Genome Atlas, Ag100Pest Initiative를 포함한 수많은 생물다양성 genomics initiative에 참여하고 있는 것을 자랑스럽게 생각합니다.
HiFi read기반의 정확하고 완전하며 연속적이고 haplotype 분석을 포함한 식물 및 동물 genome assembly로 생물다양성 연구의 초석으로 만드는 데 보탬이 되고자 합니다.
HiFi Reads Offer the Benefits of Short Reads and Long Reads in One Easy-to-Use Technology
HiFi read는 모든 변이 유형을 감지할 수 있는 높은 정확도 (> 99.9 %)와 가장 복잡한 유전체와 전체 전사체를 assemble하는데 필요한 충분히 긴 길이(최대 25kb)를 제공합니다.