KR20120096366A - 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법 - Google Patents

파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법 Download PDF

Info

Publication number
KR20120096366A
KR20120096366A KR1020110015756A KR20110015756A KR20120096366A KR 20120096366 A KR20120096366 A KR 20120096366A KR 1020110015756 A KR1020110015756 A KR 1020110015756A KR 20110015756 A KR20110015756 A KR 20110015756A KR 20120096366 A KR20120096366 A KR 20120096366A
Authority
KR
South Korea
Prior art keywords
atcc
pyrosequencing
accuracy
measuring
burkholderia
Prior art date
Application number
KR1020110015756A
Other languages
English (en)
Other versions
KR101259144B1 (ko
Inventor
박준홍
이태권
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020110015756A priority Critical patent/KR101259144B1/ko
Priority to US13/401,973 priority patent/US20120302447A1/en
Publication of KR20120096366A publication Critical patent/KR20120096366A/ko
Application granted granted Critical
Publication of KR101259144B1 publication Critical patent/KR101259144B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 메타게놈 앰플리콘을 이용하여 FLX 티타늄 파이로시퀀싱하는 경우에 발생하는 오차율을 직접 계산함으로써 파이로시퀀싱 정확도를 측정하는 방법에 관한 것으로, 본 발명에 따르면, 유전자 수 및 미생물 분류수에 대한 FLX 티타늄 파이로시퀀싱의 오차를 확인할 수 있고, 이에 대한 필터링이 가능한 효과가 있다.

Description

파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법{Mock community for measuring pyrosecuencing accuracy and a method of measuring pyrosequencing accuracy using the same}
본 발명은 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법에 관한 것으로, 보다 구체적으로는 인공유전체의 앰플리콘을 이용하여 FLX 티타늄 파이로시퀀싱을 하는 경우에 발생하는 오차율을 직접 계산하여서 파이로시퀀싱 정확도를 측정하도록 하는 것에 관한 발명이다.
대량 병렬 파이로시퀀싱(massively parallel pyrosequencing)은 미생물 개체군에서 보다 광범위한 시료 분자량 다양성에 대한 접근방법을 제공한다. 이로 인해, 통상적인 클로닝(cloning)에 의한 서열 플레이트 제조없이도 2~3시간 내에 수십만 개의 DNA 서열(100 내지 200개 뉴클레오타이드)을 생성시킬 수 있다.
파이로시퀀서는 454/로슈 게놈 시퀀서(Roche Genome Sequencers, 또는 ‘GS-FLX'라 함)를 지칭하는 것으로, DNA 합성 동안에 방출되는 파이로포스페이트가 검출되는 시퀀싱 방법에 근거하여 명명되었다. 다수 라이브러리의 분석을 위해 현재 이용가능한 454/로슈 파이로시퀀서는 일정 개수의 독립 시료만을 축적할 수 있으며, 시퀀싱 배지에서 매니폴드(manifold)를 이용한 물리적 분리를 필요로 한다. 이러한 분리 매니폴드는 시퀀싱 플레이트 상의 벽을 차단하여서 비드-결합된 DNA 템플레이트 분자가 축적되지 않도록 하는데, 그 결과 수득되는 서열의 개수가 한정되는 문제를 갖는다.
이러한 문제점을 해결하기 위하여, ‘바코드(Barcode, 이하, ’B‘로도 약칭됨)’ 또는 독특한 DNA 서열 식별자(identifier)가 고안되었다. 서열 바코드는 각각의 시료를 결합시켜서 시퀀싱할 개별 시료가 풀링(pooling)되어 있도록 하고, 이후에 파이로시퀀서 결과를 분리시키는 것으로, 이종(heterogeneous) 세포-풀(cell-pool) 또는 미생물-풀(organism-pool)에서 식별자 또는 유형 지정자(type specifier)로 작용한다.
또한, 454 앰플리콘(amplicon) 어댑터(Adapter, 이하, 'A‘로도 약칭됨)는 앰플리콘 시퀀싱 프라이머 어닐링 부위에 해당하며, 순방향 어댑터(F-어댑터)와 역방향 어댑터(R-어댑터)가 있다.
454를 이용한 파이로시퀀싱에 의해 생성된 메타게놈(metagenome)에는 시스템적 오차가 포함되는 것으로 밝혀졌으며, 이로 인해 유전자 및 미생물 분류군이 과다 측정된다. 즉, 파이로시퀀싱 방법에서 특징적으로 사용되는 인공산물(artifact)은 본래 DNA 시퀀싱 템플레이트보다 15% 이상 많이 증폭된다. 이는 증폭된 DNA가 이멀전(emulsion) PCR동안 공(empty) 비드에 부착될 때 또는 시퀀싱동안 광학 신호가 인접한 공 웰 공간에 흘러들어갈 때 단일 템플레이트를 반복 판독하여 일어나는 것으로 알려졌다.
16S rRNA 분석은 토양, 해수 및 인체와 같은 다양한 서식환경의 미생물 조성을 평가하기 위한 미생물 생태학자의 툴 키트(tool kit)의 필수 구성요소이다. 이는, 다양한 박테리아 중에서 16S 유전자 서열 보존이 높아서 미생물 다양성의 계통발생 분석 및 신규 분류군 동정이 가능하기 때문이다. 이러한 16S rRNA 유전자(16S) 서열은 환경 시료에서 박테리아 다양성(bacterial diversity)을 측정하기 위해 통상적으로 사용된다.
박테리아 다양성은 시료 제조, 프라이머 선택 및 키메라성 16S 증폭 생성물 형성에 의해 영향을 받을 수 있다.
키메라는 다수의 모 서열(parent sequence) 간의 혼성체(hybrid)로서, 신규 미생물로 잘못 해석되어 다양성을 외견상 증가시킬 수 있다. 키메라는 독립적인 증폭 중에서 반복재현가능하게 형성되는 것으로 밝혀졌으며, 시료 다양성을 잘못 인식하고 신규 분류군을 잘못 동정하도록 한다.
파이로시퀀싱과 관련한 선행문헌으로는 US 특허출원 제20100291578호 ‘적하 방법에 의한 파이로시퀀싱(Droplet-based pyrosequencing)’, US 특허출원 제20090325154호 ‘파이로시퀀싱 방법 및 관련 조성물(Pyrosequencing Methods and Related Compositions), WO 특허출원 제2008060090호 ’파이로시퀀싱을 이용하여 JAK2 V617F를 정량적 검출하기 위한 방법, 프라이머 및 키트(METHODS, PRIMERS AND KITS FOR QUANTITATIVE DETECTION OF JAK2 V617F MUTANTS USING PYROSEQUENCING)‘ 등이 알려져 있으나, 이들은 파이로시퀀싱 정확도를 측정하기 위한 인공유전체에 대하여 기재하고 있지 않으며, 선행문헌 [Accuracy and quality of massively parallel DNA pyrosequencing, 2007 Huse et al., licensee BioMed Central Ltd.]에는 파이로시퀀싱의 정확도 및 품질을 개선시키는 방법이 기재되어 있으나, 본 발명에 기재된 바와 같은 파이로시퀀싱 정확도 측저용 인공유전체에 대하여는 기재하고 있지 않다.
본 발명의 목적은 공지 서열의 인공유전체(mock community)를 파이로시퀀싱하여서 그 결과 수득된 서열을 공지 서열과 비교함으로써 파이로시퀀싱의 오차를 직접 계산함으로써 파이로시퀀싱 정확도를 측정하도록 한 인공유전체를 제공하고 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법을 제공하는데 있다.
본 발명에 따르면, 메타게놈 앰플리콘을 이용하여 FLX 티타늄 파이로시퀀싱에 대한 오차를 측정하기 위하여, 파이로시퀀싱 그 자체로부터의 오차율을 시험하는 과정, 오차에 영향을 주는 파라미터(프라이머, 바코드, 어댑터)를 밝히는 과정, 인공 서열을 반복하는 과정, 불일치(mismatch), 바코드 또는 어댑터와 관련하여 프라이머 편향오류(primer bias)를 밝히는 과정 및 인공유전체로부터 키메라의 정도 및 범위를 결정하는 과정을 제공한다.
본 발명에 따르면, 로도스피릴룸 루브룸(Rhodospillum rubrum) ATCC 11170, 부르크홀데리아 비에타멘시스(Burkholderia vietamensis) G4, 부르크홀데리아 제노보란스(Burkholderia xenovorans) LB400, 디설피토박테리움 하프니엔스(Desulfitobacteruim hafniense) DCB-2, 노스톡(Nostoc.) PCC 7120, 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans) CJ2, 로도코쿠스 속(Rhodococcus sp.) RHA 1, 수도모나스 푸티다(Pseudomonas putida) F1, 네이세리아 시카(Neisseria sicca) ATCC 29256, 오크로박트룸 안트로피(Ochrobactrum anthropi) ATCC 49188, 크로모박테리움 바이오라세움(Chromobacterium violaceum) ATCC 12472, 수도모나스 피케티(Pseudomonas pickettii) PKO1, 스핑고비움 야노이쿠야에(Sphingobium yanoikuyae) B1, 에스케리키아 콜라이(Escherichia Coli) K-12 서브 W3110, 바실러스 세루스(Bacillus cerus) ATCC 14579, 코리네박테리움 글루타민(Corynebacterium glutamin) ATCC 13032, 스타필로코쿠스 에피데미디스(Staphylococcus epidemidis) ATCC 12228, 잔토모나스 캄페스트리스(Xanthomonas campestries) py. ATCC 33913, 로스오박터 데니트리피칸(Roseobacter denitrifican) Och 114 및 로도박터 스파에로이데스(Rhodobacter sphaeroides) KD 131로 이루어진 것을 특징으로 하는 파이로시퀀싱 정확도 측정용 인공유전체(mock community)가 제공된다.
또한, 본 발명에 따르면 상기 인공유전체를 파이로시퀀싱한 결과와 상기 인공유전체 공지 서열을 비교하여서 파이로시퀀싱 정확도를 측정하는 방법이 제공된다.
본 발명은 유전자 수 및 미생물 분류수에 대한 FLX 티타늄 파이로시퀀싱의 오차를 직접 계산할 수 있어서 파이로시퀀싱 정확도를 측정할 수 있도록 하는 인공유전체를 제공하는 효과를 갖는다.
도 1은 1, 2, 6 내지 8 영역의 순수 시퀀스(raw sequence)를 나타낸 그래프이다.
도 2는 RDP (Ribosomal Database Project) 파이로시퀀싱 파이프라인의 초기 과정을 나타낸 그래프이다.
도 3은 동적 프로그래밍에 의해 오차 분석을 나타내는 과정을 모식적으로 나타낸 그래프이다.
도 4는 1회 read당 16S rRNA, bphA, nifH의 전체 오차율을 나타낸 그래프이다.
도 5는 16S rRNA, bphA, nifH의 치환 누적 곡선이다.
도 6은 16S rRNA의 오차 분포를 나타낸 그래프이다.
도 7는 16S bphA의 오차 분포를 나타낸 그래프이다.
도 8은 nifH의 오차 분포를 나타낸 그래프이다.
도 9는 본 발명에서 사용된 인공유전체의 균주, 그 게놈 크기 및 유전자를 나타낸 것이다.
도 10은 본 발명의 어댑터를 포함하지 않는 프라이머 서열을 나타낸 것이다.
도 11은 본 발명의 어댑터를 포함하는 프라이머 서열을 나타낸 것이다.
도 12a 내지 12d는 본 발명에 따른 PCR에서 각 DNA의 농도, 부피 등을 나타낸 것이다.
본 발명은 이하의 구체적인 실시예를 들어 보다 상세히 설명된다. 그러나, 하기 실시예는 단지 예시를 목적으로 한 것으로, 본 발명의 권리범위가 이에 한정되는 것이 아님이 당업자에게 명백히 이해될 것이다.
본 실험에 이용된 재료, 장비 및 문헌은 하기 표 1과 같다.
재료/장비/문헌 공급처 카탈로그 번호
AccuPrimeTM TaqDNA Plymerase High Fidelity Invitrogen 12346-086
AccuPrimeTM PfxDNA Plymerase Invitrogen 12344-024
Forward and Reverse Primers premixed Bioneer (대한민국) 주문 제작
DNAse/RNAse free water
Thermo cycler Biorad C-1000
Vortex
Pipettes Eppendorf 주문 제작
MinElute PCR Purification Kit Qiagen 28004
QIAquick PCR Purification Kit Qiagen 28106
Nanodrop Spectrophotometer Thermo Scientific ND-1000
PowerSoil DNA Isolation Kit MoBio 12888
MinElute PCR Purification Kit Manual
PCR은 AccuPrimeTM Taq DNA 폴리머라아제 하이 피델리티(Polymerase High Fidelity) 또는 AccuPrime TM Pfx DNA 폴리머라아제를 이용하여 실시하였다. 본 실험에 사용된 기능성 유전자(functional gene)는 nifH, bphA 및 16S rRNA 유전자(27F/518R)이었다.
(1) PCR 프라이머 준비
PCR 프라이머 세트는 하기와 같은 2개 종류로 제조한다.
5’-> 3’
어댑터-바코드-링커-특이프라이머
5’-> 3’
바코드-링커-특이프라이머
이를 위해, 하기 표 2의 프라이머를 준비하였다.
타겟 유전자 프라이머 명칭 Sequences (5' -> 3') 문헌 크기
nifH Poly Forward TGCGAYCCSAARGCBGACTC Poly et al. Res. Microbiol. 2001 360 bps
Poly Reverse ATSGCCATCATYTCRCCGGA
bphA BPHD-f3 AACTGGAARTTYGCIGCVGA Shoko et al. ISME J, 2009 542 bps
BPHD-r1 ACCCAGTTYTCICCRTCGTC
nirK F1aCu ATCATGGTSCTGCCGCG Michotey et al. Appl. Environ. Microbiol. 2000 472 bps
R3Cu-GC GCCTCGATCAGRTTGTGGTT
16S rRNA 27F GAGTTTGATCMTGGCTCAG
492 bps
518R WTTACCGCGGCTGCTGG
(2) DNA 템플레이트 제조
하기 표 3의 각 미생물의 Genomic DNA를 추출하여 Nanodrop을 이용하여 DNA 농도를 측정하였다. 그리고 동일한 DNA 농도를 섞어서 인공유전체를 제조하였다.
Figure pat00001
천연 유전체로는 하기 표 4와 같은 물질을 사용하였다.
시료명 제공자 비고
토양 1 MSU Performed Illumina V4 16S
강 침전물 연세대학교 강 침전물 (원주천)
조습지 연세대학교 조습지 (강화도)
생물양극 연세대학교 혐기 조건하에 1달 운영
(3) 파이로시퀀싱할 8개 부분의 제조
상기에서 수득한 인공유전체 및 천연 유전체, 어댑터, 바코드, 링커, 특이 프라이머 등을 이용하여 하기 표 3에 기재된 8개 플레이트를 제조하고, 이들을 region 1 내지 8이라 명명하였다. 이 때, 순방향(본원 명세서에서 'for'로 약칭되기도 함) 프라이머 어댑터로는 CGTATCGCCTCCCTCGCGCCATCAG 서열(Roche 사)이 사용되었고, 역방향(본원 명세서에서 'rev'로 약칭되기도 함) 프라이머 어댑터로는 CTATGCGCCTTGCCAGCCCGCTCAG 서열(Roche 사)이 사용되었다.
1 플레이트 (region 1)
DNA 템플레이트 각각의 인공유전체 및 4개 천연 유전체으로부터의 gDNA를 동일한 비로 혼합
프라이머 조성 어댑터 + 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA, nirK, 16S
2 플레이트 (region 2)
DNA 템플레이트 각각의 인공유전체 및 4개 천연 유전체 공급원으로부터의 gDNA를 동일한 비로 혼합
프라이머 조성 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA, nirK, 16S
3 플레이트 (region 3)
DNA 템플레이트 인공유전체로부터의 gDNA를 6개의 상이한 비로 혼합
프라이머 조성 어댑터 + 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA, nirK, 16S
4 플레이트 (region 4)
DNA 템플레이트 인공유전체로부터의 gDNA를 6개의 상이한 비로 혼합
프라이머 조성 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA, nirK, 16S
5 플레이트 (region 5)
DNA 템플레이트 특정 유전자를 갖는 균주로부터의 개별 gDNA
프라이머 조성 어댑터 + 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA, nirK, 16S
6 플레이트 (region 6)
DNA 템플레이트 인공유전체로부터의 gDNA를 6개의 상이한 비로 혼합
프라이머 조성 어댑터 + 교체된 바코드 + 링커 + 특이 프라이머
타겟 유전자 nifH, bphA
DNA 템플레이트 인공유전체 및 천연 유전체 공급원으로부터의 gDNA를 6개의 상이한 비로 혼합
프라이머 조성 어댑터 + 바코드 + 링커 + 특이 프라이머
타겟 유전자 16S rRNA
7 플레이트(region 7)
1 플레이트 반복
8 플레이트(region 8)
2 플레이트 반복
3, 4, 6 플레이트에서 인공유전체: 천연 유전체 공급원의 비는 하기 표 13과 같았다.
천연물 ratio 1 ratio 2 ratio 3
토양 1 0.3:9 1:9 3:9
ratio 4 ratio 5 ratio 6
생물양극 0.3:9 1:9 3:9
1, 2, 7, 8 플레이트의 프라이머 세트에 사용된 바코드는 하기 표 14과 같았다:
타겟 유전자 인공유전체 토양 1 토양 2 조습지 생물양극
nifH BC1 BC2 BC3 BC4 BC5
bphA BC6 BC7 BC8 BC9 BC10
nirK BC11 BC12 BC13 BC14 BC15
16S rRNA BC16 BC17 BC18 BC19 BC20
3, 4 플레이트의 프라이머 세트에 사용된 바코드는 하기 표 15과 같다:
타겟 유전자 Ratio 1 Ratio 2 Ratio 3 Ratio 4 Ratio 5
nifH BC1 BC2 BC3 BC4 BC5
bphA BC6 BC7 BC8 BC9 BC10
nirK BC11 BC12 BC13 BC14 BC15
16S rRNA BC16 BC17 BC18 BC19 BC20
5 플레이트의 프라이머 세트에 사용된 바코드는 하기 표 16와 같았다:
타겟 유전자 균주 1 균주 2 균주 3 균주 4 균주 5
nifH BC1 BC2 BC3 BC4 BC5
bphA BC6 BC7 BC8 BC9 BC10
nirK BC11 BC12 BC13 BC14 BC15
16S rRNA 5개의 대표 균주가 BC16 - BC20에 의해 증폭된다.
6 플레이트의 프라이머 세트에 사용된 바코드는 하기 표 17과 같았다:
타겟 유전자 Ratio 1 Ratio 2 Ratio 3 Ratio 4 Ratio 5
nifH BC6 BC7 BC8 BC9 BC10
bphA BC1 BC2 BC3 BC4 BC5
타겟유전자 Ratio 1 Ratio 2 Ratio 3 Ratio 4 Ratio 5
16S rRNA BC16 BC17 BC18 BC19 BC20
Ratio 6 More depth sequencing than others
BC21
상기에서, BC1는 ACACGTCA, BC2는 AGCTACGT, BC3은 AGCTGTAC, BC4는 ATATGCGC, BC5는 ACACACTG, BC6은 CACTACAG, BC7은 CATGACGT, BC8은 CTAGAGCT, BC9는 CTGTACGA, BC10은 CTGAGTCA, BC11은 TAGCTAGC, BC12는 TCAGACTG, BC13은 TCGACATG, BC14는 TGAGTCAC, BC15는 TGCAGATC, BC16은 ACACGACT, BC17은 ACAGTCAC, BC18은 AGACGTCT, BC19는 AGTCACTG, BC20은 ATCGTACG, BC21은 CACATGTG 서열을 가졌다.
(4) 마스터믹스(Master mix) 준비
2.5ul의 10X AccuPrime PCR 완충액 II, 0.2ul의 Accuprime Taq Hifi, 1.5ul/1.5ul(Forward/Reverse 프라이머 각각의 볼륨)의 혼합 프라이머 템플레이트 DNA(60ng), 및 총 부피가 25ul이 되도록 하는 잔량의 RNAse/DNAse를 함유하지 않은 물을 준비하였다.
(5) PCR 준비
상기에서 획득한 25uL의 PCR 튜브를 원심분리기에서 2000rpm으로 잠깐동안 교반하였다. 써모사이클러에 넣고, 하기 표 18과 같이 PCR을 실시하였다.
nifH
94℃ 1분 bphA 95℃ 3분
94℃ 1분 30사이클 95℃ 45초 30사이클
55℃ 1분 60℃ 45초
72℃ 2분 72℃ 40초
72℃ 5분 72℃ 4분
4℃ 계속(forever) 4℃ 계속
nirK 95℃ 1분 16S




94℃ 3분
94℃ 1분 30 사이클 94℃ 30초 30사이클
51℃ 1분 55℃ 30초
72℃ 1분 72℃ 1분
72℃ 10분 72℃ 5분
4℃ 계속 4℃ 계속
QIAquick PCR Purification Kit를 이용하여 PCR 생성물을 정제하였다.
(6) PCR 겔 분석
파라필름 상에서 8uL 탈염증류수 및 1uL 10X 로딩 염료에 1uL PCR 생성물을 첨가하였다. 피펫팅으로 혼합하였다. Safeview에 의해 1% 아가로즈 1X TAE 겔을 준비하였다. 시료를 로딩하고, 약 1시간동안 100V에서 실시하였다. gel-doc 상에서 겔 이미지를 포착하고, 분석을 위해 보관하였다.
(7) PCR 생성물 정량화
나노드롭 분광광도계를 제조업체 설명서에 따라 이용하여 PCR 생성물을 정량화하으며, 그 결과 하기 표 15의 농도(concentration) 항목에 기재된 값을 얻었다.
(8) PCR 풀링(pooling)
나노드롭 분광광도계로부터 수득한 값을 이용하여, poolingCalculator.xls를 이용하거나 하기 식을 이용하여 풀링 양을 계산하였으며, 그 결과 하기 표 15의 부피(volume) 항목에 기재된 값을 얻었다.
각 시료의 양(uL) = ((부피/2) X (min))/Sampleconc
상기에서, ‘부피’는 각 시료의 전체 부피를 의미하고, ‘min’은 가장 낮은 농도를 갖는 시료 농도(ng/ul 단위)를 의미하며, ‘Sampleconc'은 타겟 시료의 농도(ng/ul 단위)를 의미한다.
1uL의 최소 이동 부피를 이용하여 시료를 풀링하였다. 1uL 미만이 요청되는 경우에는 희석하여야 한다.
Qiagen minElute 컬럼을 이용하여 1x low TE, pH 8.0으로 용출하면서 제조업체 설명서에 따라 풀을 정제하였다. 정제율을 높이기 위해서 추가적인 정제를 진행하였으며 정제결과 흡광도 260/280이 모두 1.80 이상으로 나왔다.
(9) 파이로시퀀싱
마크로젠 (회사명)에서 Genome Sequencing FLX titanium pyrosequencing을 이용하여 Roche에서 제공하는 방법대로 시퀀싱을 진행하였다.
(10) 표준 시퀀스 선정(Standard sequencing collection)
인공유전체에서 최적의 염기서열을 선별하기 위해 본 발명자들은 2가지 방법으로 표준염기서열을 선정하였다. NCBI 게놈 데이터베이스에서 3개 유전자를 선별하여 특정 프라이머(nifH, bphA, 16S rRNA)를 이용하여 프라이모 유사성 비교(Probe match)를 진행하였다. 동일하지 않은 시퀀스들을 제거하기 위하여 각 유전자의 HMM(Hidden Markov Model) 모델을 사용하여 모든 시퀀스들을 각각의 유전자들과 유효성 평가하였다.
(11) 초기의 필터링 관리(Initial Processing)
품질좋은 시퀀스를 획득하기 위하여 RDP Pyro Initial Process tool [Cole 등 , 2009]을 이용하여 순방향 프라이머에 2개 이상의 mismatch 또는 average exponential quality 점수가 0 이상인 sequence들을 걸러냈다. 순방향 프라이머 이전의 염기들은 reads로부터 잘라냈다. Reads가 길기 때문에 역방향 프라이머는 16S와 bphA에 대한 검증을 하지 않았다. nifH reads의 경우 역방향 프라이머와 완별히 일치해야 하고, 역방향 프라이머는 잘라내었다. 또한, ambiguity 염기 또는 trimming 과정을 거친 후의 길이가 300bps 보다 짧은 read는 버려졌다 (도 2 참조).
(12) 오염된 시퀀스 검측(Contamination Detection)
초기 품질관리를 통과한 reads는 특별제작된 RDP tool인 ContaminateBot를 이용하여 분석했다. reads들은 RDP Seqmatch tool을 이용하여 높은 질의 RDP public dataset와 인공유전체 서열들과 비교하였다. S_ab 점수차가 0.2 이상이고 인공유전체 보다 RDP public dataset의 sequence 정보가 가까운 reads들은 오염된 sequence로 판단하여 제거하였다.
(13) 키메라 검측(Chimera Detection)
Potential Chimera를 분별하기 위하여 특별제작된 RDP tool인 ChimeraBot를 이용하여 3% 이상 오차를 갖는 reads를 분석하였다. ChimeraBot는 각각의 read별로 표준 인공유전체 서열 대비 5' 또는 3'에서 시작하는 partial alignments를 만든다. 순방향 및 역방향 alignment들로 가능한 모든 조합의 최대 점수, 해당 좌우 인공유전체 parents, alignment breakpoint 정보를 습득하였다. 종합점수가 최적의 single-parent alignment 점수보다 최소 10% 높고 각 partial alignment가 95% identity일 때 reads는 potential chimera로 가정하여 오차계산에서 제거하였다.
(14) 오차 분석(Error analysis)
초기 품질관리를 통과하고 contaminant가 아닌 reads는 RDP 인공유전체 Analysis tool (http://pyro.cme.msu.edu/)를 이용하여 표준 인공유전체 sequence와 비교하였다. 각각의 read는 표준 인공유전체 sequence 간의 alignment를 계산하였고, 최적의 alignment 대비 최고로 근접한 standard sequence를 획득하였다(도 3 참조). 이 최적의 alighment를 토대로 삽입, 결실(indel)와 mismatch error를 계산하였다.
각 유전자(바코드 + 어댑터/바코드/방향성) 별로 총 indel과 mismatch 결과를 파이로시퀀싱 시퀀스 결과로 나누어 전체 오차율을 계산하였고(도 4 참조), 시퀀싱 방향성 별로 차이를 확인하기 위하여 mismatch 누적 곡선을 그려 확인하였다(도 5 참조).
각 유전자별 오차 갯수에 따른 분포를 파악하기 위하여 누적 오차 분포 그래프를 작성하였다(도 6 내지 8).

Claims (2)

  1. 로도스피릴룸 루브룸(Rhodospillum rubrum) ATCC 11170, 부르크홀데리아 비에타멘시스(Burkholderia vietamensis) G4, 부르크홀데리아 제노보란스(Burkholderia xenovorans) LB400, 디설피토박테리움 하프니엔스(Desulfitobacteruim hafniense) DCB-2, 노스톡(Nostoc.) PCC 7120, 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans) CJ2, 로도코쿠스 속(Rhodococcus sp.) RHA 1, 수도모나스 푸티다(Pseudomonas putida) F1, 네이세리아 시카(Neisseria sicca) ATCC 29256, 오크로박트룸 안트로피(Ochrobactrum anthropi) ATCC 49188, 크로모박테리움 바이오라세움(Chromobacterium violaceum) ATCC 12472, 수도모나스 피케티(Pseudomonas pickettii) PKO1, 스핑고비움 야노이쿠야에(Sphingobium yanoikuyae) B1, 에스케리키아 콜라이(Escherichia Coli) K-12 서브 W3110, 바실러스 세루스(Bacillus cerus) ATCC 14579, 코리네박테리움 글루타민(Corynebacterium glutamin) ATCC 13032, 스타필로코쿠스 에피데미디스(Staphylococcus epidemidis) ATCC 12228, 잔토모나스 캄페스트리스(Xanthomonas campestries) py. ATCC 33913, 로스오박터 데니트리피칸(Roseobacter denitrifican) Och 114 및 로도박터 스파에로이데스(Rhodobacter sphaeroides) KD 131로 이루어진 것을 특징으로 하는 파이로시퀀싱 정확도 측정용 인공유전체(mock community).
  2. 청구항 1의 인공유전체를 파이로시퀀싱한 결과와 청구항 1의 인공유전체 공지 서열을 비교하여서 파이로시퀀싱 정확도를 측정하는 방법.
KR1020110015756A 2011-02-22 2011-02-22 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법 KR101259144B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110015756A KR101259144B1 (ko) 2011-02-22 2011-02-22 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법
US13/401,973 US20120302447A1 (en) 2011-02-22 2012-02-22 Mock community for measuring pyrosequencing accuracy and method of measuring pyrosequencing accuracy using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110015756A KR101259144B1 (ko) 2011-02-22 2011-02-22 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법

Publications (2)

Publication Number Publication Date
KR20120096366A true KR20120096366A (ko) 2012-08-30
KR101259144B1 KR101259144B1 (ko) 2013-04-30

Family

ID=46886394

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110015756A KR101259144B1 (ko) 2011-02-22 2011-02-22 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법

Country Status (2)

Country Link
US (1) US20120302447A1 (ko)
KR (1) KR101259144B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190138466A (ko) * 2018-06-05 2019-12-13 연세대학교 산학협력단 차세대 염기서열 분석법의 정확도를 분석하는 방법
KR20190138476A (ko) * 2018-06-05 2019-12-13 연세대학교 산학협력단 차세대 염기서열 분석법의 정확도 측정용 조성물

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220010351A1 (en) * 2018-11-29 2022-01-13 Helmholtz-Zentrum Für Umweltforschung Gmbh - Ufz Microbial cytometric mock communities and use thereof as standard in flow cytometry

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7727723B2 (en) * 2006-04-18 2010-06-01 Advanced Liquid Logic, Inc. Droplet-based pyrosequencing
KR100789731B1 (ko) * 2006-11-15 2008-01-03 전남대학교산학협력단 파이로시퀀싱을 이용한 jak2 v617f 돌연변이의 정량적검출방법, 시발체 및 키트

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190138466A (ko) * 2018-06-05 2019-12-13 연세대학교 산학협력단 차세대 염기서열 분석법의 정확도를 분석하는 방법
KR20190138476A (ko) * 2018-06-05 2019-12-13 연세대학교 산학협력단 차세대 염기서열 분석법의 정확도 측정용 조성물

Also Published As

Publication number Publication date
KR101259144B1 (ko) 2013-04-30
US20120302447A1 (en) 2012-11-29

Similar Documents

Publication Publication Date Title
Abellan-Schneyder et al. Primer, pipelines, parameters: issues in 16S rRNA gene sequencing
Kunin et al. Wrinkles in the rare biosphere: pyrosequencing errors can lead to artificial inflation of diversity estimates
Ong et al. Species identification and profiling of complex microbial communities using shotgun Illumina sequencing of 16S rRNA amplicon sequences
Degnan et al. Illumina-based analysis of microbial community diversity
Siqueira et al. Pyrosequencing as a tool for better understanding of human microbiomes
Maughan et al. Analysis of the cystic fibrosis lung microbiota via serial Illumina sequencing of bacterial 16S rRNA hypervariable regions
Sergeant et al. High-throughput sequencing of 16S rRNA gene amplicons: effects of extraction procedure, primer length and annealing temperature
Ibarbalz et al. The bias associated with amplicon sequencing does not affect the quantitative assessment of bacterial community dynamics
Pfeiffer et al. Improved group‐specific primers based on the full SILVA 16 S r RNA gene reference database
Svensson et al. A real-time PCR array for hierarchical identification of Francisella isolates
AU2015263055B2 (en) Sequencing process
US11993812B2 (en) Systems and methods of diagnosing and characterizing infections
CN109797438A (zh) 一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法
EP3430168A2 (en) Methods and kits to identify klebsiella strains
WO2011082325A2 (en) Sequences of e.coli 055:h7 genome
WO2017139715A1 (en) Systems and methods for the detection of infectious diseases
Nittami et al. Recent advances in understanding the ecology of the filamentous bacteria responsible for activated sludge bulking
KR20120096366A (ko) 파이로시퀀싱 정확도 측정용 인공유전체 및 이를 이용하여 파이로시퀀싱 정확도를 측정하는 방법
Shewmaker et al. Reevaluation of the taxonomic status of recently described species of Enterococcus: evidence that E. thailandicus is a senior subjective synonym of “E. sanguinicola” and confirmation of E. caccae as a species distinct from E. silesiacus
Rendboe et al. The Epidome-a species-specific approach to assess the population structure and heterogeneity of Staphylococcus epidermidis colonization and infection
Shin et al. Regional effects on chimera formation in 454 pyrosequenced amplicons from a mock community
CN110295231A (zh) 通过选择性等位基因富集或消耗用低深度测序检测和定量稀有变体
KR101765677B1 (ko) 결핵 및 비결핵 항산균 검출용 프라이머 세트 및 이를 이용한 검출 방법
JP6387500B2 (ja) 大腸菌の遺伝子型タイピング法及びこれに用いるプライマーセット
Prosdocimi et al. Errors in ribosomal sequence datasets generated using PCR-coupled ‘panbacterial’pyrosequencing, and the establishment of an improved approach

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160607

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170417

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180418

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190423

Year of fee payment: 7