Mitchell R Vollger, et. al. Annals of Human Genetics (2020)
DOI: 10.1111/ahg.12364
다양한 집단을 대표하는 64 개의 인간 genome에 대해 long read structural variation calling 을 적용하여 변이 발견을 위한 새로운 방법을 개발했습니다.
Many human genomes have been reported using short-read technology, but it is difficult to resolve structural variants (SVs) using these data. These genomes thus lack comprehensive comparisons among individuals and populations. Ebert et al. used long-read structural variation calling across 64 human genomes representing diverse populations and developed new methods for variant discovery. This approach allowed the authors to increase the number of confirmed SVs and to describe the patterns of variation across populations. From this dataset, they identified quantitative trait loci affected by these SVs and determined how they may affect gene expression and potentially explain genome-wide association study hits. This information provides insights into patterns of normal human genetic variation and generates reference genomes that better represent the diversity of our species.
Peter Ebert et. al Science(2021)
DOI: 10.1126/science.abf7117
PacBio long-read sequencing을 사용하여 Chinese genome (HX-1)의 de novo 어셈블리를 구성했습니다. 이 고품질 어셈블리는 GRCh38 참조 서열에서 247 N-gap을 채웠고 12.8Mb의 중국 인구집단의 특정 서열과 구조변이에 대해 명확한 분석 결과를 보여줍니다.
Shi, L. et al., 2016. Long-read sequencing and de novo assembly of a Chinese genome.
Nature Communications
Egyptian Genome Added to Growing List of Population-Specific Reference Genomes
Wohlers, I. et al. Nat Commun (2020).
DOI : 10.1038/s41467-020-17964-1
For Reference-Grade Human Genome Assemblies, SMRT Sequencing Yields Optimal Results
현재의 인간 참조 게놈 어셈블리 (GRCh38)는 50 명 이상의 인종적으로 다양한 개체의 DNA를 시퀀싱하여 생성되었습니다. PacBio의 SMRT (Single Molecule, Real-Time) 시퀀싱을 사용하여 개별 인간 genome을 sequencing 하고 de novo assembly하여 참조 품질의 human genome assembly를 구성 할 수 있습니다. 현재 이러한 새로운 조립 방법을 여러 민족의 인구집단을 대표하는 개인 genome에게 적용하여 사용 가능한 인간 참조 게놈의 다양성을 확장하고자 하는 글로벌 이니셔티브가 진행 중입니다.
Long read sequencing은 보다 큰 영역에서 DNA를 분석하여 short read 에서 발견하지 못한 유전 변이를 검출합니다.
백인이 아닌 인종 집단의 과학연구와 임상 실험에서 소수가 이 집단을 대표하는 것은 우려가 되는 사항입니다. 수년에 걸쳐 sequencing된 인간 게놈 데이터베이스 역시 유럽계 사람들에게 치우쳐 있습니다. 이 문제의 의미가 보고되고 있지만 불균형의 원인은 훨씬 더 깊어졌습니다. 해결되지 않은 채로두면 데 한쪽으로 치우친 데이터들로 인해 약물 실험에서 나타나는 다양성의 부족과 정밀 의학의 성공률의 불균형이 계속 커질 것입니다.
인간 genome 의 구조 변이의 포괄적인 목록을 작성하기 위해 워싱턴 대학 교 등의 연구팀들은 15 개의 인간 genome을 시퀀싱, 2019년 심층 분석 결과를 발표하였습니다.
Long read sequencing을 활용하면, 인간 구조 변이의 대규모 목록을 작성하여 인간 genome 에서 구조변이의 스펙트럼 및 중요성을 명확히 할 수 있습니다.
Highlights
• We sequence resolve and annotate 99,604 common human structural variants
• 55% of VNTRs map to the end of chromosomes and correlate with double-strand breaks
• Alternate alleles facilitate accurate genotyping with short reads and new associations
• We patch the reference and add diversity needed for developing a pan human genome
HiFi Reads Offer the Benefits of Short Reads and Long Reads in One Easy-to-Use Technology
HiFi read는 모든 변이 유형을 감지할 수 있는 높은 정확도 (> 99.9 %)와 가장 복잡한 유전체와 전체 전사체를 assemble하는데 필요한 충분히 긴 길이(최대 25kb)를 제공합니다.