KR102342490B1 - 분자 인덱스된 바이설파이트 시퀀싱 - Google Patents

분자 인덱스된 바이설파이트 시퀀싱 Download PDF

Info

Publication number
KR102342490B1
KR102342490B1 KR1020180039781A KR20180039781A KR102342490B1 KR 102342490 B1 KR102342490 B1 KR 102342490B1 KR 1020180039781 A KR1020180039781 A KR 1020180039781A KR 20180039781 A KR20180039781 A KR 20180039781A KR 102342490 B1 KR102342490 B1 KR 102342490B1
Authority
KR
South Korea
Prior art keywords
adapter
dna
sequence
long
oligonucleotide
Prior art date
Application number
KR1020180039781A
Other languages
English (en)
Other versions
KR20190116773A (ko
Inventor
정상균
오수아
Original Assignee
한국한의학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국한의학연구원 filed Critical 한국한의학연구원
Priority to KR1020180039781A priority Critical patent/KR102342490B1/ko
Priority to PCT/KR2019/004072 priority patent/WO2019194640A1/ko
Publication of KR20190116773A publication Critical patent/KR20190116773A/ko
Application granted granted Critical
Publication of KR102342490B1 publication Critical patent/KR102342490B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 통한 바이설파이트 시퀀싱 결과의 정확성을 크게 개선하기 위해 라이브러리 제조단계에서 이중가닥의 구별과 서로 다른 주형의 구별을 가능하게 하는 분자표지를 도입하는 방법에 관한 것이다.

Description

분자 인덱스된 바이설파이트 시퀀싱 {Molecularly Indexed Bisulfite Sequencing}
본 발명은 바이설파이트 시퀀싱 방법에 있어, 바이설파이트 처리 이전 단계에서 절단된 유전체 조각에 DNA 이중나선의 두 가닥을 다르게 표지하고, 또한 서로 다른 DNA 조각의 구별을 가능하게 하는 분자인덱스를 부착하는 단계를 도입함으로써 바이설파이트 시퀀싱 분석에 따른 오류가 크게 개선된 방법에 관한 것이다.
생물의 유전체는 DNA상의 염기서열 외에도 시토신이나 아데닌 염기의 메틸화를 통해 고차원의 정보를 담거나 유전자 정보의 흐름을 조절한다. 특히 포유동물의 경우 시토신 메틸화는 세포분열을 통해 그 패턴이 유전되며 대상이 되는 유전자의 발현을 원천적으로 차단하는 방법을 통해 세포의 발생학적 또는 조직학적 정체성을 결정하는 중요한 조절기전이다. 또한 레트로요소(retroelement)와 같은 위해 인자의 활성을 억제하는 유전체 방어 기전으로 사용되기도 한다. 이러한 조절기전이 훼손되어 특정 유전자나 조절 부위의 시토신이 불필요하게 메틸화 되거나 탈메틸화 함으로서 암과 같은 질병을 일으키는 요인으로 작용하기도 한다.
유전체에 가해진 시토신 메틸화의 양상을 정확하게 파악하는 것은 특정 유전자나 유전자 군 또는 특정 조절부위 염기서열의 발생학적, 분자유전학적 기능과 역할을 이해하는 데 중요한 정보를 제공할 뿐만 아니라 암과 같은 질병의 원인 규명, 진단, 예후 예측 등에 활용할 수 있다.
DNA 메틸화 분석은 메틸화된 염기에 민감한 (절단하지 못하는) 제한효소 등을 이용하여 절단 여부로 특정 제한효소 부위의 메틸화 정도를 판별하는 고전적 방법이 있다. 이 방법은 소수의 제한효소 부위만 적용할 수 있을 뿐만 아니라 절단 DNA와 비절단 DNA의 양적 관계를 구별할 수 있는 추가적인 방법들이 필요하며 그 결과도 제한적인 정보만 제공한다. 바이설파이트를 DNA에 처리하면 다른 염기는 반응하지 않지만 시토신은 탈아민 반응이 일어나 티민으로 구조가 변화된다. 따라서 바이설파이트가 처리된 DNA의 염기서열 결정을 통해 분석 대상이 되는 염기서열 내의 모든 시토신에 대한 메틸화 여부를 판별할 수 있다 (Frommer M et al, 1992 A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands, PNAS 89(5): 1827-1831).
NGS를 통한 대용량의 시퀀싱 기술의 개발은 바이설파이트 처리된 전장 유전체를 이용하여 유전체 내 대부분의 시토신에 대한 메틸화 수준을 분석할 수 있게 되었다. 그러나 일반 염기서열 결정과는 달리 시토신 메틸화 정도는 동일 염기서열 부위에 대해 매우 많은 수의 유전체 조각의 정보를 얻어야 하기 때문에 전장유전체 분석은 아직도 매우 많은 비용을 필요로 한다. 이러한 경제적 문제를 완화시키면서 전장유전체 분석 수준의 효과를 얻을 수 있는 축소 대표서열에 대한 바이설파이트 시퀀싱 기술이 (RRBS, reduced representative bisulfite sequencing) 개발되어 활용되고 있다 (Alexander M et al, 2005, Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis, Nucleic Acids Research, 33(18): 5868-77). 이 방법은 제한효소의 하나인 MspI으로 절단된 유전체 DNA중 길이가 짧은 절편만을 선택적으로 포획하여 바이설파이트 시퀀싱을 수행하는 것이며, 이들 포획체는 유전체내의 프로모터 등 조절부위에 특징적인 CpG 뉴클리오티드들이 밀집된 영역을 대표하기 때문에 전장유전체 분석의 효과를 나타낸다.
바이설파이이트 화합물은 시토신의 탈아민 반응외에도 무작위로 DNA를 파괴한다. 충분한 탈아민 반응을 유발하기 위한 반응 조건에서 90% 이상의 DNA가 파괴된다는 보고가 있다 (Grunau C et al, 2001, Bisulfite genomic sequencing: systematic investigation of critical experimental parameters, Nucleic Acid Research, 29(13): E65-5). 따라서 바이설파이트 처리후 시퀀싱된 템플레이트의 수가 매우 적은 수에서 유래한 것이라면 그 결과가 분석 대상의 정확한 메틸화 정도를 반영하지 않을 수 있다.
포유동물의 시토신 메틸화는 주로 CpG 이중 뉴클리오티드 배경에서 이루어 지며, DNA의 이중가닥에서 한 가닥의 시토신 메틸화는 이웃하는 구아닌 염기의 결합 염기인 반대 가닥 시토신의 메틸화와 동반되는 경우가 많으나 그렇지 않을 가능성도 상존하며 이러한 비대칭성은 중요한 조절 정보들 수반할 수 있다. 그러나 이러한 이중가닥에서의 비대칭 메틸화에 대한 정보를 얻는 것은 현존하는 바이설파이트 분석을 통해서는 거의 불가능하다.
이러한 배경하에서, 본 발명자들은 바이설파이트 시퀀싱의 장점을 그대로 유지하면서 이 방법이 가지는 두가지 단점, 즉 시퀀싱된 템플레이트의 정확한 수량과, DNA 이중가닥의 비대칭 메틸화 여부를 파악하지 못하는 점을 효과적으로 분석할 수 있는 분자적 장치를 개발하고자 예의 노력한 결과, 분자표지 등이 이루어진 어댑터를 활용한 바이설파이트 시퀀싱을 통해 상기한 바와 같이 시퀀싱 된 템플레이트의 수량과 메틸레이션의 대칭성을 파악할 수 있는 분자장치가 부착된 라이브러리를 제조할 수 있음을 확인함으로써 본 발명을 완성하였다.
한국등록특허공보 제10-1651817호 한국등록특허공보 제10-1254663호
본 발명의 하나의 목적은, 하기 제1단계 내지 제5단계를 포함하는, 바이설파이트 시퀀싱 방법을 제공하는 것이다.
(1) 개체로부터 추출된 게놈 DNA를 어댑터와 결합 가능한 절단면을 갖도록 절단하는 제1단계;
(2) 절단된 DNA의 절단면과 상보적인 말단을 갖는 2종의 어댑터인 부분 이중가닥 어댑터 A 및 B를 절단된 DNA에 결합시키는 제2단계;
(3) DNA 중합효소를 이용하여 어댑터 말단 단일 가닥의 fill-in을 수행하는 제3단계;
(4) 상기 제3단계에서 제조된 산물에 대해 바이설파이트(Bisulfite)를 처리하여, 메틸화되지 않은 시토신을 티민으로 전환시키는 제4단계;
(5) 상기 제4단계에서 제조된 산물을 주형으로 하여, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 제5단계.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.
상기 목적을 달성하기 위한 본 발명의 하나의 양태는
(1) 개체로부터 추출된 게놈 DNA를 어댑터와 결합 가능한 절단면을 갖도록 절단하는 제1단계;
(2) 절단된 DNA의 절단면과 상보적인 말단을 갖는 2종의 어댑터인 부분 이중가닥 어댑터 A 및 B를 절단된 DNA에 결합시키는 제2단계;
(3) DNA 중합효소를 이용하여 어댑터 말단 단일 가닥의 fill-in을 수행하는 제3단계;
(4) 상기 제3단계에서 제조된 산물에 대해 바이설파이트(Bisulfite)를 처리하여, 메틸화되지 않은 시토신을 티민으로 전환시키는 제4단계;
(5) 상기 제4단계에서 제조된 산물을 주형으로 하여, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 제5단계를 포함하는, 바이설파이트 시퀀싱 방법을 제공한다.
상기 제1단계 내지 제5단계는 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 단계로 제공될 수 있다.
본 발명에서 용어, "차세대 염기서열 분석(Next Generation Sequencing; NGS)"은 유전체의 염기서열에 대한 고속 분석 방법을 말하며, High-throughput sequencing, Massive parallel sequencing 또는 Second generation sequencing과 혼용되어 사용될 수 있다.
본 발명에서 용어, "라이브러리"는 제한효소 등으로 절단하여 얻은 유전자의 단편들의 집합을 말하며, 유전자의 단편을 벡터에 도입한 집합일 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 본 발명에서 상기 라이브러리는 상기 제1단계 내지 제5단계를 통해 제조할 수 있다.
상기 제1단계는 개체로부터 추출된 게놈 DNA를 어댑터와 결합 가능한 절단면을 갖도록 절단하는 단계를 제공한다.
본 발명에서 용어, "개체"는 차세대 염기서열 분석을 위한 라이브러리 제조가 필요한, 인간을 포함한 모든 생물 종을 의미할 수 있다. 본 발명의 일 실시예에서는, 게놈 DNA 수득을 위한 예시로서 마우스를 이용하였으나, 이에 제한되는 것은 아니다.
상기 DNA의 절단에는 제한효소가 이용될 수 있다. 본 발명에서 제한효소는 DNA의 특정한 염기배열을 식별하고 이중사슬을 절단하는 엔도뉴클레아제(핵산분해효소의 하나)로서 유전공학에서 재조합 DNA를 만들기 위해서 사용하는 특수한 효소를 의미하며, 본 발명의 구체적인 일 실시예에서는 MspI를 제한효소로 사용하였으나, 이는 제한효소의 대표적인 예시로서 사용한 것으로 본 발명의 범위가 이에 제한되는 것은 아니다. 또한, 제한효소뿐만 아니라 다양한 효소나 물리적 힘을 사용하여 DNA를 절단할 수 있으며, DNA polymerase등을 이용하여 절단면에 특정 오버행(over-hang)을 만드는 방법으로 제 1단계를 구성할 수 있다.
상기 '어댑터와 결합 가능한 절단면'이란, 게놈 DNA의 절단면 말단으로서 공유결합 및/또는 상보적 결합으로 어댑터와 연결될 수 있는 지역을 의미한다.
상기 제1단계의 과정에 따라 게놈 DNA의 절단면에 오버행이 생길 수 있다. 본 발명에서 '오버행(over-hang)'이란, DNA의 절단면에서 5'-말단이나 3'-말단에 일정 수의 뉴클레오티드(nucleotide)가 돌출된 구조를 말하며 오버행의 상보성이 클수록 DNA ligation의 효율이 크게 높아진다.
상기 게놈 DNA를 개체로부터 추출하는 방법은 당업계에서 사용되는 방법을 제한 없이 사용할 수 있다.
상기 제2단계는 절단된 DNA의 절단면과 상보적인 말단을 갖는 2종의 어댑터인 부분 이중가닥 어댑터 A 및 B를 절단된 DNA에 결합시키는 단계를 제공한다.
본 발명에서 용어, "어댑터"는 절단부위의 염기서열을 포함하는 증폭산물을 수득하기 위해 사용되는 부분 이중나선 구조의 염기서열을 말하며, 절단된 게놈 DNA의 양 말단에 결합할 수 있다.
제2단계의 어댑터는 서로 다른 어댑터인 어댑터 A 및 어댑터 B로 구성될 수 있다. 상기 어댑터의 일 말단은 절단되는 게놈 DNA 절단면과 상보적으로 결합하는 서열을 포함할 수 있으며, 구체적으로 어댑터 A는 5' 방향으로, 어댑터 B는 3' 방향으로 각각 결합할 수 있다. 본 발명의 일 실시예에서는, MspI 제한효소를 사용하여 마우스 DNA를 절단하였고, 상기 제한효소의 절단부위에 결합할 수 있는 어댑터를 절단된 게놈 DNA에 부착시켰다.
상기 어댑터 A는 두 개의 올리고뉴클레오티드인 Long-A와 Short-A의 상보적 결합으로 구성될 수 있다 (도 1).
구체적으로, 상기 어댑터 A는 이중가닥 부위; 일루미나 시퀀싱 플랫폼의 단일 말단 리딩(Single end reading)을 위한 프라이머 결합부위; 메틸 시토신(methyl cytosine), 아데닌, 구아닌 및 티민 4개의 염기가 또는 아데닌, 구아닌 및 티민 3개의 염기가 무작위로 구성된 4개 이상, 구체적으로 4개 내지 20개의 염기서열로 구성된 분자표지를 포함하는 Long-A 올리고뉴클레오티드와, Long-A와의 상보적 염기서열을 구성하는 Short-A 올리고뉴클레오티드의 상보적 결합으로 구성된 것일 수 있다. 이때 프라이머 결합부위는 시토신 대신 메틸화된 시토신을 사용하여 바이설파이트 처리에 의한 변형을 방지 한다.
상기 Long-A 올리고뉴클레오티드는 분자표지와 이중가닥 부위 사이 또는 분자표지의 앞에 위치하며, 서로 다른 길이의 염기서열로 구성되는 시프트를 추가로 포함할 수 있다. 구체적으로 상기 시프트는 G, GT, GTG, 또는 GTAG의 염기서열로 구성되는 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 이중가닥 부위는 top strand인 Long-A와 bottom strand인 Short-A가 상보적 결합을 이루고 있는 부위를 의미한다. 상기 분자표지는 시퀀싱 후 분자표지의 동일성을 바탕으로 각 염기서열이 유래한 주형(template)의 동일성을 구별할 수 있는 표지를 의미한다. 상기 시프트는 이중가닥 부위와 분자표지 사이에 위치한 1~4개의 서로 다른 길이로 구성된 뉴클레오티드로서, 서로 다른 시프트를 가진 어댑터는 이중가닥 부위의 시퀀싱 반응이 시프트 길이의 차이만큼 서로 다른 사이클(cycle)에서 이루어지게 한다. 이는 일루미나 시퀀싱 플랫폼(illumina sequencing platform)의 초기 시퀀싱 반응 사이클(sequencing reaction cycle)에서 클러스터 별로 동일한 뉴클레오티드가 읽혀지면 샘플에 오류가 있는 것으로 판단하여 반응이 중지되는 부작용을 방지하기 위한 장치이다.
상기 어댑터 B는 두 개의 올리고뉴클레오티드인 Long-B와 Short-B의 상보적 결합으로 구성될 수 있다 (도 1).
구체적으로, 상기 어댑터 B는 증폭용 프라이머 결합부위를 포함하며, 구성 염기 중 모든 시토신이 메틸화된 Long-B 올리고뉴클레오티드, 및 Short-B 올리고뉴클레오티드의 상보적 결합으로 구성된 것일 수 있다.
상기 어댑터는 증폭산물의 제조단계에서, PCR 수행시 프라이머의 부착이 가능한 염기서열을 포함할 수 있다.
상기 어댑터 A를 구성하는 Long-A 올리고뉴클레오티드는 예시적으로, 서열번호 1의 서열로 구성된 것이며, Short-A 올리고뉴클레오티드는 서열번호 2의 서열로 구성된 것일 수 있다. 상기 어댑터 A를 구성하는 Long-B 올리고뉴클레오티드는 예시적으로 서열번호 3의 서열로 구성된 것이며, Short-B 올리고뉴클레오티드는 서열번호 4의 서열로 구성된 것일 수 있다.
서열번호 1 - Long-A 올리고뉴클레오티드
AxAxGAxGxTxTTxxGATxTDDDDDDDDACACGAGCACACGTGACGT
서열번호 2 - Short-A 올리고뉴클레오티드
CGACGTCACGTGTGCTCGTGT
서열번호 3 - Long-B 올리고뉴클레오티드
GTGAxTGGAGTTxAGAxGTGTGxTxTTxxGATxTT
서열번호 4 - Short-B 올리고뉴클레오티드
CGAAGATCGGAAGAGCACACG
상기 서열번호 1 내지 4의 서열에 있어서, 'x'는 메틸화된 시토신을 의미하고, 'D'는 아데닌, 구아니, 티민 중에서 임의의 염기를 의미한다.
상기 제2단계에 따라 DNA-어댑터 연결체가 생산될 수 있다. 본 발명에서 용어, "DNA-어댑터 연결체"는 상기 절단된 게놈 DNA와 어댑터가 연결된 구조체를 말하며, 라이브러리 제조를 위한 증폭의 주형으로 사용된다. 이 때 각각의 절단된 DNA는 양 말단에 결합된 어댑터의 구성에 따라 어댑터 A만 결합한 형태, 어댑터 B만 결합한 형태, 서로 다른 어댑터가 결합한 형태 등 3가지 형태의 어댑터 결합 산물을 얻을 수 있으며, 이론상 양적으로 각 형태에 대해 1:1:2로 형성될 수 있다.
상기 제2단계에서 절단된 DNA 양 말단에 동종의 어댑터가 결합된 경우, PCR 반응 과정에서 어댑터 간 상보적 결합을 통해 팬-홀더(pan-holder) 구조가 형성될 수 있으며, 이로써 제5단계의 PCR 증폭이 억제될 수 있다. 반면, 절단된 DNA 양 말단에 이종의 어댑터가 결합된 경우, 제5단계의 PCR 증폭이 원활하게 이루어질 수 있다.
상기 2단계에서 생성된 어댑터-DNA결합체는 probe 등을 이용한 포획 등의 추가적인 과정을 통해 특정 염기서열들 일부만을 선별하여 분석대상으로 할 수 있다.
상기 제3단계는 DNA 중합효소를 이용하여 어댑터 말단 단일 가닥의 fill-in을 수행하는 단계를 제공한다. 상기 제3단계의 DNA 중합효소는 공지된 중합효소를 제한 없이 사용할 수 있다.
본 발명에서 용어 "fill-in"은 어댑터 말단에 위치한 단일 가닥 (single strand)에 대해 DNA 중합반응을 유도하여 이중가닥이 되도록 합성하는 과정을 의미한다.
상기 제3단계의 fill-in은 폴리머라제의 기질인 4종의 dNTP중 dCTP대신 methyl-dCTP를 사용하여 이루어지는 것일 수 있다. 이를 통해 fill-in 부위에서 바이설파이트 처리에 의한 염기변형이 일어나지 않도록 할 수 있다.
또한, 상기 두 어댑터의 Short 올리고뉴클레오티드는 5' 말단이 탈인산화(dephosphrylation) 되어 있으므로 절단 DNA에 결합하지 않고, fill-in 과정을 통해 Long 올리고뉴클레오티드에 대한 상보적인 염기서열이 만들어 지며, 이러한 서열은 바이설파이트 처리에 의한 염기변형이 일어나지 않게 된다. 나아가, 어댑터 A의 Long-A 올리고뉴클레오티드에 위치한 이중가닥 부위는 메틸화되지 않은 시토신(unmethylated cytosine)이 포함되어 있으므로 바이설파이트 처리에 의해 시토신 -> 티민 변형이 일어는 반면, 해당 부위의 상보적 서열은 시토신 -> 티민 변형이 일어나지 않으므로, 결과적으로 시퀀싱을 통해 절단된 DNA의 두 가닥을 구별할 수 있는 장치로 활용할 수 있다.
상기 제4단계는 상기 제3단계에서 제조된 산물에 대해 바이설파이트(Bisulfite)를 처리하여, 메틸화되지 않은 시토신을 티민으로 전환시키는 단계를 제공한다.
본 발명에서 용어 바이설파이트는 중아황산염, 또는 아황산수소염으로도 불리는 화합물로서, DNA 변형 유무에 대한 시료로 널리 사용되는 것으로 알려져 있다. 구체적으로, 바이설파이트를 DNA에 처리할 경우, DNA 상의 메틸화되지 않은 시토신(C)염기에 대한 탈아민화반응(deamination)이 진행되어 티민(T) 염기로 전환되는 한편, 메틸화된 시토신은 탈아민화반응이 진행되지 않아 티민으로 전환되지 않는다. 따라서, 바이설파이트를 이용하면 시토신의 메틸화 유무를 구별할 우 있다. 본 발명에서 용어 바이설파이트 시퀀싱은 이러한 바이설파이트를 이용해 DNA의 서열을 확인하고 메틸화된 염기의 패턴을 파악하는 등의 시퀀싱 방법을 의미한다. 이 경우 바이설파이트 시퀀싱에 관한 당업계 공지된 기술 또는 장치를 자유롭게 이용할 수 있다.
상기 제4단계는 제2단계보다 먼저 수행되는 것일 수 있으며, 제4단계를 제2단계보다 먼저 진행하더라도 본 발명의 방법과 동일한 결과가 나올 것임은 당업자에게 자명하다.
상기 제5단계는 상기 제4단계에서 제조된 산물을 주형으로 하여, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 단계를 제공한다.
본 발명에서 용어, "증폭산물"은 어댑터와 절단 DNA가 결합된 산물에 대해 프라이머를 이용하여 수행한 PCR의 결과물을 말하며, 절단되어 삽입된 DNA, 및 어댑터를 포함할 수 있다.
상기 제5단계의 프라이머 쌍은 상기 제4단계에서 제조된 증폭산물의 양 말단에 결합할 수 있다. 또한, 상기 프라이머들은 차세대 염기서열 분석에 적합한 염기서열이 추가된 형태의 프라이머들일 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서는, 차세대 염기서열 분석에 적합한 염기서열을 포함하는 프라이머 쌍을 사용하여 NGS용 라이브러리를 제조하였다(도 3).
상기 제5단계 이후 NGS 과정이 추가로 수행될 수 있다.
본 발명은 오류율이 높고 개별 주형에 대해 두 strand간 대칭적 메틸화의 구별이 불가능한 종래 바이설파이트 시퀀싱의 근본적 문제를 해결하기 위하여 분자표지가 장치된 어댑터를 바이설파이트 처리 전에 절단된 DNA에 미리 부착함으로써, 시퀀싱 결과물이 어떤 템플레이트에서 기원하였고 이중 나선의 어떤 가닥에 해당하는지를 분명하게 나타나게 하는 효과가 있다. 따라서 DNA 샘플링에 의한 오류 및 메틸화 대칭성의 여부 등을 파악할 수 있는 분명한 장치를 제공하므로 DNA 메틸화 정보를 보다 정확하게 분석할 수 있게 한다.
도 1은, 실시예에서 제조한 어댑터 A 및 B의 구조 및 이에 대한 설명을 나타낸 것이다.
도 2는, 바이설파이트 시퀀싱 라이브러리를 제작하는 과정을 나타낸 것이다.
도 3은, 바이설파이트 시퀀싱 라이브러리의 전기영동 결과를 나타낸 것이다. 좌측 컬럼은 사이즈 마커를 의미하며, 가운데 및 우측 컬럼은 서로 다른 게놈 DNA를 이용하여 제작한 바이설파이트 시퀀싱 라이브러리의 전기영동 결과를 의미한다.
도 4는, 레퍼런스 게놈에 대한 염기서열 및 methylation call의 mapping과 분자표지의 분포를 나타낸 것이다.
도 5는, 분자 표지를 반영한 methylation call을 분석한 것이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1: 어댑터(Adaptor) 제작
1-1. 어댑터 A 및 B의 제작
도 1에 도시된 구조와 같이 어댑터를 준비하였다. 구체적으로, 제한효소 절단면과 상보적 말단을 갖는 부분적 이중가닥 어댑터 2종을 준비하였으며 각각의 어댑터 A 및 B는 다음과 같은 특징을 가지도록 하였다.
먼저, 두 어댑터는 절단된 DNA의 양 말단에 상보적으로 결합하며, 어댑터 A는 5' 방향으로, 어댑터 B는 3' 방향으로 각각 결합한다. 이 때 DNA 결찰(ligation)을 통해 한쪽 가닥이 절단된 DNA의 말단과 공유결합을 형성하도록 하였다. 그에 따라, 각각의 어댑터 서열에 결합하는 primer를 통해 절단된 DNA (insert)의 증폭이 가능하도록 하였다.
어댑터 A는 두 개의 올리고뉴클레오티드 Long-A와 Short-A의 상보적 결합으로 구성되며, 이중가닥 부위 (DS-A), 시프트(Sft), 분자표지 (M-tag), 프라이머 결합부위 (PR-siteA)를 갖도록 구성되었다.
어댑터 A의 Long-A에서, PR-siteA에 포함된 시토신(cytosine) 염기는 모두 메틸화(methylation)된 시토신을 사용함으로서 이후 바이설파이트(bisulfite) 처리에 의해 C->T 변이가 일어나지 않도록 조절하였다.
어댑터 A의 M-tag 부위는 시토신을 제외한 3개의 염기가 무작위로 구성된 8개의 염기서열로 분자표지가 이루어진 부위로, 분자표지의 동일성을 바탕으로 주형(template)의 동일성이 구별하도록 장치하였다. 이 경우 분자표지는 메틸 시토신(methyl cytosine)을 포함한 4개의 염기를 모두 사용할 수도 있으며, 그 길이 또한 8 base에 제한되지 않는다.
어댑터 A의 Sft 즉 시프트는 M-tag과 DS-A 사이에 서로 다른 길이의 뉴클레오티드를 포함하도록 함으로서, 일루미나 시퀀싱 플랫폼(illumina sequencing platform)의 초기 시퀀싱 반응 사이클(sequencing reaction cycle)동안에 대부분의 클러스터에서 동일한 뉴클레오티드가 읽혀지면 샘플에 오류가 있는 것으로 판단하여 반응이 중지되는 부작용을 방지하기 위한 장치이다. 본 실시예에서는 시프트 위치에 서로 길이가 다른 G, GT, GTG, 또는 GTAG 서열이 각각 포함된 4종의 Long-A를 사용하였다.
Long-A의 PR-siteA는 일루미나 시퀀싱 플랫폼의 단일 말단 리딩(Single end reading)을 위한 primer 결합부위를 포함하므로, 모든 절단 DNA (insert)는 어댑터 A와 결합한 부위부터 염기서열이 결정된다.
어댑터 A의 DS-A 부위는 어떤 가닥(strand)이냐에 따라 바이설파이트 처리에 의해 시토신이 티민(thymine)으로 치환되거나 (top strand-Long A) 그대로 남게 되도록 (bottom strand-Short A) 구성되었다.
위와 같은 어댑터 A의 구조적 특징에 따라, Top strand의 염기서열은 바이설파이트 전환(bisulfite conversion)이 일어난 original top (OT) strand 염기서열이 읽히게 되고, bottom strand의 염기서열은 바이설파이트 전환이 일어난 가닥의 상보적 염기서열 (complementary to original bottom, CTOB)가 읽히게 된다.
어댑터 A의 Short-A는 DS-A만을 가지며 서로 다른 Sft를 가진 4종의 Long-A와 상보적으로 결합하여, 결과적으로 4종의 어댑터 A가 구성된다.
다음으로, 어댑터 B는 두 개의 올리고뉴클레오티드, 즉 Long-B, Short-B로 구성되며, 증폭용 프라이머 결합부위를 가지는데 이때 프라이머 결합부위에는 어댑터의 이중가닥 부위가 포함될 수 있다.
어댑터 B의 Long-B는 DNA ligation을 통해 절단 DNA(insert DNA)와 공유결합을 이루며, 구성 염기중 모든 시토신은 메틸화된 형태로, 바이설파이트 처리에 의한 염기변형 (C->T)이 일어나지 않도록 하였다.
1-2. 구체적인 어댑터 제조 과정
각 어댑터의 Long 및 Short 올리고뉴클레오티드는 (주)제노텍에 의뢰하여 제작하였다. 상기 Long 및 Short 올리고뉴클레오티드를 이용하여, 100 pmole/μl의 농도로 동량을 혼합하였다. 그 다음 이를 97℃?에서 2분간 방치한 후, 1℃?/cycle/분의 속도로 온도를 25℃?까지 내려 두 염기서열간의 상보적 결합을 유도함으로써 부분 이중가닥을 갖는 어댑터 A 및 B를 제작하였다.
실시예 2: 시퀀스용 RRBS 라이브러리 (Reduced representation bisulfite sequencing (RRBS) library) 제작
도 2에 도시된 바와 같이, 시퀀스를 위한 RRBS 라이브러리를 제작하였다.
2-1. DNA 절단 및 어댑터 결합
먼저, 마우스 게놈 DNA 4종을 각각 100ng씩 취하여, MspI 제한효소로 37℃? 에서 4시간 동안 절단하였다.
정제 키트(purification kit)(ExpinTM PCR SV, GeneAll)를 사용하여 절단된 DNA를 정제한 뒤 30μl의 물에 녹였고, 용해액 모두를 취하여 어댑터 결합(adaptor ligation)을 진행하였다. 구체적으로, 4종의 절단된 DNA에 대해 각각 서로 다른 시프트(Sft)를 가진 어댑터 A를 사용하여 결합을 수행하였다. 이때, 각각의 절단된 DNA는 양 말단에 결합된 어댑터의 구성에 따라 어댑터 A만 결합한 형태, 어댑터 B만 결합한 형태, 서로 다른 어댑터가 결합한 형태 등 3가지 형태의 어댑터 결합 산물을 얻을 수 있으며, 이론상 양적으로 각 형태에 대해 1:1:2로 형성된다.
2-2. 어댑터 말단의 Fill-in 수행
정제 키트(ExpinTM PCR SV, GeneAll)로 결합 산물을 정제한 후 30μl의 물에 녹이고 이를 15μl 취하여 말단 fill-in (end fill-in)을 수행하였다. 이때 폴리머라제의 기질인 4종의 dNTP중 dCTP는 메틸화된 met-dCTP를 사용하여, 이후 바이설파이트 처리에 의한 염기변형이 일어나지 않도록 하였다. 또한, 두 어댑터의 Short 올리고뉴클레오티드는 5' 말단에 인산기가 결여되어 있으므로 절단 DNA에 결합하지 않고, fill-in 과정을 통해 Long 올리고뉴클레오티드에 대한 상보적인 염기서열이 만들어 지며, 이러한 서열은 바이설파이트 처리에 의한 염기변형이 일어나지 않게 된다. 나아가, 어댑터 A의 Long-A 올리고뉴클레오티드에 위치한 DS-A부위는 메틸화되지 않은 시토신(unmethylated cytosine)이 포함되어 있으므로 바이설파이트 처리에 의해 C->T 변형이 일어는 반면, 해당 부위의 상보적 서열은 C->T 변형이 일어나지 않으므로, 결과적으로 시퀀싱을 통해 절단된 DNA의 두 가닥을 구별할 수 있는 장치로 활용할 수 있다.
2-3. 바이설파이트 전환 및 PCR 반응 수행
다음으로, 어댑터가 결합된 4종의 DNA를 모두 풀링(pooling)하여 정제 키트(ExpinTM PCR SV, GeneAll)로 정제한 다음, 바이설파이트 키트(EpiTectⓡ? Bisulfite Kit, Qiagen)를 이용하여 바이설파이트 전환 반응을 수행하였다. 그에 따라 메틸화되지 않은 시토신이 디아민화(deamination) 되어, 티민으로 전환되었다.
바이설파이트가 처리된 DNA를 정제한 다음 20μl의 물에 녹이고, 이중 7μl를 취해 PCR 증폭을 수행하여 NGS 라이브러리를 제작하였다. 상기 PCR 증폭용 프라이머에는 샘플을 구별할 수 있는 인덱스(index) 서열이 포함되어 있으며, 두 어댑터의 PR-site에 결합하여 증폭이 이루어진다. Mol-tag, Sft, DS-A 및 절단 DNA의 염기서열이 결정될 수 있도록 일루미나 시퀀싱 플랫폼을 통해 증폭산물을 설계하였다.
3가지 형태의 어댑터 부착 산물 중, 양 말단에 동일한 어댑터가 결합한 형태는 PCR 과정에서 양 말단에 서로 상보적이고 비교적 긴 염기서열이 생성되게 된다. 이러한 경우 PCR 과정에서 단일가닥으로 분리된 DNA에 양말단 간의 상보적 결합으로 인해 프라이머가 결합하지 못하는 팬-홀더(pan-holder)모양의 구조가 형성됨으로써 PCR 증폭이 크게 억제된다. 반면 양 말단에 서로 다른 어댑터가 부착된 경우는 정상적인 증폭이 일어남으로써, 결과적으로 증폭산물의 대부분을 이루게 된다.
상기 PCR 조건으로서, 95℃에서 20초, 58℃에서 40초, 68℃에서 60초를 1 cycle로 하여, 총 25 cycle을 수행하였다. 이렇게 수득된 PCR 증폭산물을 전기영동한 결과, 서로 다른 크기의 절단 DNA(도 3의 가운데 컬럼 및 우측 컬럼)가 고르게 증폭되었음을 확인하였다 (도 3). 상기 PCR을 통해 구성된 NGS 라이브러리 DNA를 정제한 뒤 illumina NextSeq 500 플랫폼을 사용하여 NGS를 수행하였다.
실시예 3: 시퀀싱 결과 분석
단일 말단(Single-end)의 150 염기 해독 (base reading)을 통해 약 20 Giga base, 131 Mega read를 생산하였다. 이중에서 77%인 101 Mega read가 정상적인 Mol-tag, Sft 및 DS-A 구조를 갖고 있었으며, Sft 서열의 구별을 통해 샘플별 염기서열들을 분류할 수 있었다.
각 샘플 별로 DS-A부위에 대한 서열을 결정한 결과, 모든 시토신이 티민으로 바이설파이트 처리에 의해 변형된 경우와 (OT), 그대로 남아있는 경우 (CTOB), 또는 일부가 변형된 경우가 각각 발견되었으며, 그 비율은 각각 44.4%, 42.2%, 13.4%로 확인되었다. OT의 경우 어댑터 A의 Long-A가 결합된 가닥의 서열을 표지하였으며, CTOB의 경우 bottom strand에 대한 상보적 서열을 표지하였다.
다음으로, Trim Galore tool을 사용하여 각 샘플의 read로부터 어댑터 B의 서열을 제거하였고, Bismark tool을 사용하여 레퍼런스 게놈(reference genome)에 각 read들을 맵핑(mapping)하여 그 결과를 SAM output으로 작성하였다.
Perl script를 사용하여 SAM file을 파싱(parsing) 하고, 각 맵핑 부위별로 sequence read들을 methylation call string과 함께 정렬하였으며, 도 4에 특정 유전체 부위의 결과를 나타내었다. 구체적으로, 첫 번째 줄에 mapping locus의 염색체와 (chr6) 서열의 시작부위를 (90276000) 표시하였다. 두 번째와 세 번째 줄에 레퍼런스 게놈(reference genome)의 top (T_Ref) 및 bottom (B_Ref) 가닥 서열을 각각 상보적으로 나타내었다. 그 다음 줄에는 해당 위치에 맵핑된 리드들의 중복을 생략한 염기서열과 (Seq) 이에 대한 cytosine methylation call을 (Met) 중복수가 가장 많은 순서대로 순차적으로 나타내었다. 시토신에 대한 메틸레이션 여부, 즉 methylation call은 CG, CHG, CHH 등 C가 위치한 염기서열 배경에 따라 각각 알파벳 Z, X, H로 표시하였고 메틸화 여부에 따라 대문자 (methylated) 및 소문자 (unmethylated)로 표시하였다. methylation call에 이어 같은 줄에 해당 서열의 template origin과 (OT 또는 CBOT), 서열의 중복 수, 그리고 해당 서열에 부착된 분자표지 및 해당 분자표지를 갖는 서열의 수를 차례로 나타내었다. 나열된 염기서열에서 중복수가 가장 많은 서열과 비교하여 변이가 있는 염기는 붉은 색으로 표시하였다.
정렬된 염기서열 중에서 동일한 분자표지를 갖는 서열은 하나의 주형(template)에서 기원된 중복 데이터이며, 서열 사이에 나타나는 소수의 염기변이는 PCR 또는 시퀀싱 등 각종 반응 과정에서 발생한 것이므로, 이를 통해 염기서열이나 포지션에 따른 염기의 중복수에 기반하여 해당 주형에 대한 대표 서열을 유추할 수 있다. 또한, methylation call 역시 대표서열을 대상으로 중복수 기반의 대표 값을 구할 수 있다.
OT와 CBOT에 대한 consensus 염기서열을 결정하고 해당 서열의 분자 표지에 대한 중복수를 나타내는 방식으로 도 4의 데이터를 재정리하여, 이를 도 5에 나타내었다.
해당 유전체 부위에서 총 3개의 주형에 대한 메틸화 정보가 염기서열에 따라 결정되었고, 이중 하나는 top 및 bottom strand에 대한 정보를 동시에 가지고 있으며 다른 2개는 bottom strand에 대한 정보만을 가지고 있다.
만약, 본 실시예의 어댑터와 달리, 어댑터에 분자표지가 없다면 유전자의 각 좌위(locus)별로 해당 서열이 유래한 주형의 수를 판단할 수 없어, 시퀀싱된 read들을 독립적으로 판단하여 분석할 수 밖에 없다. 이 경우, 해당 부위에서 총 86개의 template(도 4에서, 분자표시를 무시했을 때 해당 부위에 매핑되는 모든 read의 수를 합산한 것)에 대한 정보를 얻은 것으로 간주함에 따라, 데이터 해석이 과장되거나 왜곡될 가능성이 있다.
따라서 본 실시예의 결과를 통해, 동일 부위에 맵핑된 read중 OT와 CTOB 가닥에 대해 각각 동일한 분자표지를 갖고 있는 경우 (도 5의 AAGTATGG) 동일 주형의 top/bottom 이중가닥이 동시에 시퀀싱 된 것으로 볼 수 있으며, 해당 template에 대해 메틸화의 반접합성(hemizygosity)(한쪽 strand는 메틸화가 되어 있으나 다른 strand는 그렇지 않음) 등을 파악할 수 있다 (도 5의 붉은색 상자). 또한, 분자표지의 동일성을 바탕으로 하나의 template에서 유래한 것을 알 수 있으므로, 각종 반응 사이에 발생한 일부 염기변이에 대해 중복수를 바탕으로 보정의 기회를 가질 수 있다. 결과적으로, 상기 실시예의 방법을 이용하여 목적하는 개체의 DNA의 서열을 빠르게 판독하고, 돌연변이 발생 여부를 쉽고 정확하게 판단할 수 있다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Korea Institute of Oriental Medicine <120> Molecularly Indexed Bisulfite Sequencing <130> KPA171464-KR <160> 4 <170> KoPatentIn 3.0 <210> 1 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Long-A oligonuecleotide <220> <221> misc_feature <222> (2) <223> C is methylated C. <220> <221> misc_feature <222> (4) <223> C is methylated C. <220> <221> misc_feature <222> (7) <223> C is methylated C. <220> <221> misc_feature <222> (9) <223> C is methylated C. <220> <221> misc_feature <222> (11) <223> C is methylated C. <220> <221> misc_feature <222> (14) <223> C is methylated C. <220> <221> misc_feature <222> (15) <223> C is methylated C. <220> <221> misc_feature <222> (19) <223> C is methylated C. <220> <221> misc_feature <222> (21 to 28) <223> D is any base selected from the group consisting of A, G and T <400> 1 acacgacgct cttccgatct ddddddddac acgagcacac gtgacgt 47 <210> 2 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Short-A oligonuecleotide <400> 2 cgacgtcacg tgtgctcgtg t 21 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Long-B oligonuecleotide <220> <221> misc_feature <222> (5) <223> C is methylated C. <220> <221> misc_feature <222> (13) <223> C is methylated C. <220> <221> misc_feature <222> (17) <223> C is methylated C. <220> <221> misc_feature <222> (23) <223> C is methylated C. <220> <221> misc_feature <222> (25) <223> C is methylated C. <220> <221> misc_feature <222> (28) <223> C is methylated C. <220> <221> misc_feature <222> (29) <223> C is methylated C. <220> <221> misc_feature <222> (33) <223> C is methylated C. <400> 3 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 4 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Short-B oligonuecleotide <400> 4 cgaagatcgg aagagcacac g 21

Claims (14)

  1. 하기 제1단계 내지 제5단계를 포함하는, 바이설파이트 시퀀싱 방법으로서, 하기 제2단계의 어댑터 B는 증폭용 프라이머 결합부위를 포함하며, 구성 염기 중 모든 시토신이 메틸화된 Long-B 올리고뉴클레오티드, 및 Short-B 올리고뉴클레오티드의 상보적 결합으로 구성된 것이고,
    하기 제2단계의 어댑터 A는 이중가닥 부위; NGS 시퀀싱 플랫폼의 시퀀스 리딩(Sequence reading)을 위한 프라이머 결합부위; 및 메틸 시토신(methyl cytosine), 아데닌, 구아닌, 티민 염기가 또는 아데닌, 구아닌 및 티민 3개의 염기가 무작위로 구성된 4개 내지 20개의 염기서열로 구성된 분자표지를 포함하는 Long-A 올리고뉴클레오티드와, Long-A와의 상보적 염기서열을 구성하는 Short-A 올리고뉴클레오티드의 상보적 결합으로 구성되며 프라이머 결합부위는 시토신 대신 메틸화된 시토신을 사용하여 바이설파이트 처리에 의한 변형이 방지된 것인, 방법:
    (1) 개체로부터 추출된 게놈 DNA를 어댑터와 결합 가능한 절단면을 갖도록 절단하는 제1단계;
    (2) 절단된 DNA의 절단면과 상보적인 말단을 갖는 2종의 어댑터인 부분 이중가닥 어댑터 A 및 B를 절단된 DNA에 결합시키는 제2단계;
    (3) DNA 중합효소를 이용하여 어댑터 말단 단일 가닥의 fill-in을 수행하는 제3단계;
    (4) 상기 제3단계에서 제조된 산물에 대해 바이설파이트(Bisulfite)를 처리하여, 메틸화되지 않은 시토신을 티민으로 전환시키는 제4단계;
    (5) 상기 제4단계에서 제조된 산물을 주형으로 하여, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 제5단계.
  2. 삭제
  3. 제1항에 있어서, 상기 Long-A 올리고뉴클레오티드는 분자표지와 이중가닥 부위 사이 또는 분자표지의 앞에 위치하며, 서로 다른 길이의 염기서열로 구성되는 시프트를 추가로 포함하는 것인, 방법.
  4. 제3항에 있어서, 상기 시프트는 G, GT, GTG, 또는 GTAG의 염기서열로 구성되는 것인, 방법.
  5. 삭제
  6. 제1항에 있어서, 상기 Long-A 올리고뉴클레오티드는 서열번호 1의 서열로 구성된 것이며, 상기 Short-A 올리고뉴클레오티드는 서열번호 2의 서열로 구성된 것인, 방법.
  7. 제1항에 있어서, 상기 Long-B 올리고뉴클레오티드는 서열번호 3의 서열로 구성된 것이며, 상기 Short-B 올리고뉴클레오티드는 서열번호 4의 서열로 구성된 것인, 방법.
  8. 제1항에 있어서, 상기 제3단계의 fill-in은 dCTP대신 methyl-dCTP를 사용하여 이루어지는 것인, 방법.
  9. 제1항에 있어서, 상기 제4단계를 제2단계보다 먼저 수행되는 것인, 방법.
  10. 제1항에 있어서, 제2단계에서 절단된 DNA 양 말단에 동종의 어댑터가 결합된 경우, 어댑터 간 상보적 결합을 통해 팬-홀더(pan-holder) 구조가 형성되는 것인, 방법.
  11. 제1항에 있어서, 상기 제5단계는 절단된 DNA 양 말단에 이종의 어댑터가 결합된 가닥에 대해 이루어지는 것인, 방법.
  12. 제1항에 있어서, 상기 제5단계 이후 NGS (Next generation sequence)를 추가로 수행하는 것인, 방법.
  13. 하기 제1단계 내지 제4단계를 포함하는, 바이설파이트 시퀀싱 방법으로서, 하기 제2단계의 어댑터 B는 증폭용 프라이머 결합부위를 포함하며, 구성 염기 중 모든 시토신이 메틸화된 Long-B 올리고뉴클레오티드, 및 Short-B 올리고뉴클레오티드의 상보적 결합으로 구성된 것이고,
    하기 제2단계의 어댑터 A는 이중가닥 부위; NGS 시퀀싱 플랫폼의 시퀀스 리딩(Sequence reading)을 위한 프라이머 결합부위; 및 메틸 시토신(methyl cytosine), 아데닌, 구아닌, 티민 염기가 또는 아데닌, 구아닌 및 티민 3개의 염기가 무작위로 구성된 4개 내지 20개의 염기서열로 구성된 분자표지를 포함하는 Long-A 올리고뉴클레오티드와, Long-A와의 상보적 염기서열을 구성하는 Short-A 올리고뉴클레오티드의 상보적 결합으로 구성되며 프라이머 결합부위는 시토신 대신 메틸화된 시토신을 사용하여 바이설파이트 처리에 의한 변형이 방지된 것인, 방법:
    (1) 개체로부터 추출된 게놈 DNA를 어댑터와 결합 가능한 절단면을 갖도록 절단하는 제1단계;
    (2) 절단된 DNA의 절단면과 상보적인 말단을 갖는 2종의 어댑터인 부분 이중 가닥 어댑터 A 및 B를 절단된 DNA에 결합시키는 제2단계;
    (3) 상기 제2단계에서 제조된 산물에 대해 바이설파이트(Bisulfite)를 처리하여, 메틸화되지 않은 시토신을 티민으로 전환시키는 제3단계;
    (4) 상기 제3단계에서 제조된 산물을 주형으로 하여, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 제4단계.
  14. 제13항에 있어서, 상기 제2단계 후 DNA 중합효소를 이용하여 어댑터 말단 단일 가닥의 fill-in을 수행하는 단계를 추가로 포함하는 것인, 방법.
KR1020180039781A 2018-04-05 2018-04-05 분자 인덱스된 바이설파이트 시퀀싱 KR102342490B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180039781A KR102342490B1 (ko) 2018-04-05 2018-04-05 분자 인덱스된 바이설파이트 시퀀싱
PCT/KR2019/004072 WO2019194640A1 (ko) 2018-04-05 2019-04-05 분자 인덱스된 바이설파이트 시퀀싱

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180039781A KR102342490B1 (ko) 2018-04-05 2018-04-05 분자 인덱스된 바이설파이트 시퀀싱

Publications (2)

Publication Number Publication Date
KR20190116773A KR20190116773A (ko) 2019-10-15
KR102342490B1 true KR102342490B1 (ko) 2021-12-24

Family

ID=68100898

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180039781A KR102342490B1 (ko) 2018-04-05 2018-04-05 분자 인덱스된 바이설파이트 시퀀싱

Country Status (2)

Country Link
KR (1) KR102342490B1 (ko)
WO (1) WO2019194640A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240031934A (ko) * 2022-09-01 2024-03-08 주식회사 키오믹스 다중 표적 dna의 선택적 증폭용 조성물 및 이를 이용한 증폭 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090047680A1 (en) * 2007-08-15 2009-02-19 Si Lok Methods and compositions for high-throughput bisulphite dna-sequencing and utilities
KR101651817B1 (ko) 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008096146A1 (en) * 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
JP5843614B2 (ja) * 2009-01-30 2016-01-13 オックスフォード ナノポア テクノロジーズ リミテッド 膜貫通配列決定における核酸構築物のためのアダプター
KR101254663B1 (ko) 2010-04-14 2013-05-06 대한민국 파이로시퀀싱을 이용한 신종 인플루엔자 바이러스의 항바이러스제에 대한 유전자의 내성 돌연변이 검출방법
EP3092308A1 (en) * 2014-01-07 2016-11-16 Fundacio Privada Institut de Medicina Predictiva i Personalitzada del Cancer Method for generating double stranded dna libraries and sequencing methods for the identification of methylated cytosines
KR20170133270A (ko) * 2016-05-25 2017-12-05 주식회사 셀레믹스 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090047680A1 (en) * 2007-08-15 2009-02-19 Si Lok Methods and compositions for high-throughput bisulphite dna-sequencing and utilities
KR101651817B1 (ko) 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트

Also Published As

Publication number Publication date
WO2019194640A1 (ko) 2019-10-10
KR20190116773A (ko) 2019-10-15

Similar Documents

Publication Publication Date Title
US9732383B2 (en) Molecular redundant sequencing
DK2630263T3 (en) VARITAL COUNTING OF NUCLEIC ACIDS TO GET INFORMATION ON NUMBER OF GENOMIC COPIES
CN108431233B (zh) Dna文库的高效率构建
KR101858344B1 (ko) 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
US20140228223A1 (en) High throughput paired-end sequencing of large-insert clone libraries
CN110628880B (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
JP7033602B2 (ja) ロングレンジ配列決定のためのバーコードを付けられたdna
JP7332733B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
WO2018195217A1 (en) Compositions and methods for library construction and sequence analysis
CN110546272B (zh) 将衔接子附接至样品核酸的方法
JP5128941B2 (ja) 標的特異的コンポマー及び使用法
Cheng et al. Methods to improve the accuracy of next-generation sequencing
US11608518B2 (en) Methods for analyzing nucleic acids
US20200140933A1 (en) Polymorphism detection with increased accuracy
KR102342490B1 (ko) 분자 인덱스된 바이설파이트 시퀀싱
CN114746560A (zh) 改进甲基化多核苷酸结合的方法、组合物和系统
CN113227393A (zh) 用于校准表观遗传分区测定的方法、组合物和系统
KR101967879B1 (ko) 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
US20240093180A1 (en) Oligonucleotide adapters and method
KR20220122095A (ko) 분자 바코딩 효율을 향상시키기 위한 조성물 및 이의 용도
WO2023247658A1 (en) Methods and compositions for nucleic acid sequencing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant