KR102423682B1 - 이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법 - Google Patents

이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법 Download PDF

Info

Publication number
KR102423682B1
KR102423682B1 KR1020167021368A KR20167021368A KR102423682B1 KR 102423682 B1 KR102423682 B1 KR 102423682B1 KR 1020167021368 A KR1020167021368 A KR 1020167021368A KR 20167021368 A KR20167021368 A KR 20167021368A KR 102423682 B1 KR102423682 B1 KR 102423682B1
Authority
KR
South Korea
Prior art keywords
double
dna
adapter
strand
region
Prior art date
Application number
KR1020167021368A
Other languages
English (en)
Other versions
KR20160111403A (ko
Inventor
밀레 요렌스 콜
미구엘 에이. 페이나도 모랄레스
Original Assignee
푼다시오 프리바다 인스티튜트 데 메디시나 프레딕티바 이 페르소나리짜다 델 카세르
밀레 요렌스 콜
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 푼다시오 프리바다 인스티튜트 데 메디시나 프레딕티바 이 페르소나리짜다 델 카세르, 밀레 요렌스 콜 filed Critical 푼다시오 프리바다 인스티튜트 데 메디시나 프레딕티바 이 페르소나리짜다 델 카세르
Publication of KR20160111403A publication Critical patent/KR20160111403A/ko
Application granted granted Critical
Publication of KR102423682B1 publication Critical patent/KR102423682B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/30Characterised by physical treatment
    • C12Q2523/305Denaturation or renaturation by physical action
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

본 발명은 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법에 관한 것이다. 본 발명은 또한 본 발명의 방법에 의해 얻은 이중 가닥 DNA 라이브러리뿐 아니라 어댑터 및 상기 어댑터를 합성하는 키트에 관한 것이다.

Description

이중 가닥 DNA 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법{METHODS FOR GENERATING DOUBLE STRANDED DNA LIBRARIES AND SEQUENCING METHODS FOR THE IDENTIFICATION OF METHYLATED CYTOSINES}
본 발명은 이중 가닥 DNA의 시퀀싱 방법 및 이중 가닥 DNA 분자내에서 메틸화된 시토신을 확인하는 방법에 관한 것이다. 본 발명은 또한 어댑터 및 본 발명의 방법에 유용한 상기 어댑터뿐만 아니라 이중 가닥 DNA를 합성하기 위한 키트에 관한 것이다.
후생 유전학적 변형(예, DNA 메틸화)을 포함하는 핵산(DNA 및 RNA)의 1차 구조 분석은 일반적으로 "시퀀싱"이라고 칭하는 다른 기술을 사용하여 해결될 수 있다.
현재 이용가능한 모든 방법들은 원 물질을 직접 분석하지 않는다. 그것들은 본래 주형의 처리 또는 변환, 레플리카(replica)의 생성 및 레플리카의 증폭을 요구한다. 생성된 레플리카(게놈 라이브러리)는 현재 이용가능한 하나 이상의 시퀀싱 기술(예, Illumina, Roche 또는 IonTorrent 시퀀싱 플랫폼) 을 사용하여 시퀀싱하기에 적합하다.
시퀀싱은 선택된 가닥의 분석으로 이루어진 낮은 규모로 또는 전체 물질의 모든 부분의 대규모 분석으로 이루어진 높은 처리량(또는 게놈 규모)으로 수행될 수 있다. 분석대상인 상기 가닥의 길이는 사용되는 시퀀싱 방법에 의존한다. 게놈 규모 및 대부분 특정 좌위를 대상으로 한 기존 시퀀싱 기술은 DNA 가닥들을 따로따로 평가한다.
DNA 메틸화 평가용 현재 골드 스탠다드는 핵산을 바이설파이트(bisulfite)으로 화학적 변환한 것을 의미하고, 이것은 메틸화되지 않은 시토신이 우라실로 변환되어 티민처럼 보임으로써, 모든 시퀀싱 방법에서 실제 티민과 구분할 수 없게 하여 모호한 결과를 만들어 낸다. 이러한 정보의 감소는 여전히 미해결되고 그들의 응용을 제한하는 결점들이 있기 때문에 게놈 규모의 접근은 도전으로 보여진다. 예를 들면,
1) 기본 서열(즉, 돌연변이 또는 유전적 변형의 검출을 위한) 및 후생유전학적 변형(즉, 시토신의 메틸화)을 결정하는데 독립된 프로세스가 사용되어야 한다는 점;
2) 상기 생성된 모호함은 효율성(읽혀진 서열의 많은 부분이 모호함으로 버려짐) 및 적용범위(일부 영역은 분석될 수 없음)를 제한하고 까다로운 계산 처리과정을 포함한다는 점;
3) 많은 양의 시작물질이 많은 적용범위에 연구를 수행하기 위해 요구된다는 점;
4) 조절되지 않는 바이어스(bias)는 정량분석을 제한한다는 점; 및
5) 시퀀싱 오류가 시스템에 의해 거의 검출되지 않는다는 점
또 다른 방법은 헤어핀-바이설파이트 PCR(hairpin-bisulfite PCR)이다.(Laird et al., 2004, Proc. Natl. Acad. Sci. USA 101, 204-209; Riggs and Xiong, 2004, Proc. Natl. Acad. Sci. USA 101, 4-5). 이 방법에서, 바이설파이트으로 처리하기 전에, 두 상보적인 가닥은 헤어핀 고리 서열에 의해 공유 결합된다. 그러나, 이 방법은 단지 특정한 이중 가닥 분자에만 적합하고 이중 가닥 DNA 분자 집단의 서열을 결정하는데 적합하지 않고 특히 이중 가닥 DNA 분자 집단에서 메틸화된 시토신을 확인하는데 적합하지 않다.
그러므로 이중 가닥 DNA 분자 집단의 서열을 결정하고 특히 이중 가닥 DNA 분자 집단에서 메틸화된 시토신을 확인하는 추가적인 방법의 개발에 관심이 있어왔다.
WO2010/048337는 바이설파이트 저항성 유사 시토신을 사용하여 주형 핵산의 상보적인 가닥를 생성하는 단계, 주형 핵산과 상보적인 가닥을 선택적으로 짝짓기 단계, 주형 핵산 및 상기 상보적인 가닥 내의 메틸화되지 않은 시토신을 우라실로 전환하는 단계 및 바이설파이트으로 전환된 주형 핵산 및 전환되지 않은 상보적인 가닥의 핵산 서열을 결정하는 단계를 포함하는 메틸화된 시토신을 확인하는 방법을 개시한다. 황산염으로 전환된 주형 핵산 및 전환되지 않은 상보적인 가닥은 모두 메틸화된 시토신이 풍부하기 때문에, 이러한 가닥들은 처리하기 어렵다.
본 발명은 이러한 문제를 해결한다.
발명의 요약
본 발명은 다음의 단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법에 관한 것이다:
(i) 복수의 짝지어진 어댑터-변형 DNA 분자들를 제공하기 위해 복수의 이중 가닥 DNA 분자들 중 적어도 하나의 가닥 말단에 이중 가닥 DNA 어댑터를 접합시키고 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하고;
(ii) 상기 짝지어진 어댑터-변형 DNA 분자들 내의 (메틸화되지 않은) 시토신을 우라실로 변환시키고;
(iii) 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들를 제공하기 위해 뉴클레오타이드 A, G, C 및 T와 이중 가닥 DNA 어댑터의 적어도 일부분과 상보적인 서열을 가지는 프라이머를 사용하여 상기 변환된 짝지어진 어댑터-변형 DNA의 상보적인 가닥들을 제공하고;
(iv) 증폭된 짝지어진 이중 가닥 DNA 분자들을 제공하기 위해 상기 (iii) 단계에서 얻어진 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 선택적으로 증폭하고; 및
(v) 상기 (iii) 단계 또는 상기 (iv) 단계에서 얻어진 짝지어진 DNA 분자들를 시퀀싱하는 단계;
지정 위치에 상기 메틸화된 시토신의 존재는 만약 시토신이 (iii) 단계 또는 (iv) 단계에서 얻어진 짝지어진 이중 가닥 DNA 분자들 중 한 가닥에서 존재하고 구아닌이 짝지어진 이중 가닥 DNA 분자들 중 다른 가닥에서 대응하는 위치에 나타나면 결정되고, 그리고/또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 만약 우라실 또는 티민이 (iii) 단계 또는 (iv) 단계에서 얻어진 짝지어진 이중 가닥 DNA 분자들 중 한 가닥에서 존재하고 구아닌이 짝지어진 이중 가닥 DNA 분자들 중 다른 가닥에서 대응하는 위치에 나타나면 결정된다.
도 1은 본 발명의 일실시예를 나타내는 개략도이다. 접합단계[(i) 단계]. 오버행 말단(A 및 C)을 가지는 시료 준비 단계로부터 게놈 가닥(검은 선; B)은 이중 가닥 DNA (어댑터; D) 및 헤어핀(E)의 두 분자로 접합된다. 포집단계. 비오틴(biotine; G)으로 표지된 프로브(F)가 헤어핀과 혼성화하여 헤어핀을 포함하지 않는 접합 생성물을 제거한다. 바이설파이트 및 신장 단계[(iii) 단계]. 접합생성물은 바이설파이트으로 처리되어 상보성을 잃는다(glow). 이것은 이후 증폭 단계에서 중합효소 확장(점선; I)을 위해 프라이머(H)가 시작하도록 허용한다. 게놈 가닥B의 전형적인 시퀀스 가닥을 보여준다. 상기 핵산 서열 C*GTTGGAA 및 그것의 상보적 서열 TTCCAAC*G 은 바이설파이트으로 처리되고 TTCCAAC*G 는 TTUUAAC*G으로 전환된다. 증폭단계 후, 핵산 서열 CGTTAAAA 및 TTCCAACG 가 얻어진다. C*: 메틸화된 시토신
도 2는 본 발명의 일실시예의 신장 단계를 보여주는 계략도이다[(iii) 단계]. 하나의 첫 번째 어댑터와 접합된 생성물(DBE 및 EBD, 도 1에서 언급된 것과 같이)만이 프라이머(H)로 확장되어 합성된 가닥(I)을 얻을 수 있다.
도 3은 본 발명의 일시예를 보여주는 개략도로 상기 어댑터 분자는 지지체에 고정되어 제공된다. 1. 고체 표면에 고루 어댑터(A)의 분배. 2. 게놈 가닥(B)의 접합. 단 하나의 A 어댑터가 각 게놈 가닥에 접합될 수 있다. 3. 접합된 가닥들. 4. 헤어핀 어댑터(C)는 게놈 가닥의 자유 말단과 접합된다. 5. 바이설파이트 전환 및 상보성의 손실. 6. 신장 단계 [(iii) 단계]. 합성가닥(E)를 얻기 위해 프라이머(D)로 첫 중합효소 신장을 보여준다
도 4는 본 발명의 실시예를 보여주는 개략도로 상기 어댑터 분자는 지지체에 고정되어 제공된다. 1. 게놈 가닥(B)는 첫 번째 어댑터 분자(A)와 접합된다. 2. 헤어핀 어댑터(C)는 게놈 가닥의 자유 말단과 접합된다. 3. 바이설파이트 전환 및 상보성 손실. 4. 프라이머(D)는 어댑터 분자의 일부 서열과 혼성화한다. 5, 6, 7. 신장 단계[(iii) 단계]. 합성 가닥(E)를 얻기 위해 프라이머(D)로 첫 중합효소 확장을 보여준다. 8. 상기 주형은 고체 표면과 접합되어 확장 생성물은 상층액으로 방출된다. 방출된 분자는 프라이머(F)로 증폭될 수 있다[(iv) 단계]. 상기 문자 A, B 및 C는 도 3과 동일하다.
도 5는 본 발명의 일실시예를 보여주는 개략도이다. 접합단계[(i) 단계]. 시료 준비단계에서 얻은 게놈 가닥(검은선)은 첫 번째 DNA 가닥(A) 및 두 번째 DNA 가닥(B)로부터 각각 생성된 두개의 Y-어댑터와 접합되고, 상기 두 번째 DNA 은 헤어핀 고리(C)와 3' 영역(D) 3' 말단에 위치한 첫 번째 분절로부터 생성된다. 확장 단계. 합성 서열(점선, F)은 상기 중합효소를 위한 프라이머로 헤어핀을 사용하여 생성된다. 바이설파이트[(ii) 단계]. 신장단계 후 얻어진 분자에 바이설파이트을 처리하고 상기 가닥은 상보성을 상실한다. 상보적 가닥 생성 단계(신장 단계) [(iii) 단계]. 프라이머(G)가 증폭 첫 단계에 첨가된다(점선; H).
도 6은 본 발명의 일 실시예를 보여주는 개략도이다. 접합단계[(i) 단계] 및 신장단계[(iii) 단계]는 상기 설명한 것과 동일하다. 첫 번째 증폭단계[(iv) 단계]는 어댑터 분자의 첫 번째 DNA 가닥의 일부 상보적 서열에 상보적인 프라이머(G) 또는 본 발명의 라이브러리를 만들기 위해 사용된 게놈 가닥의 서열에 상보적인 특정 서열에 상보적인 프라이머(J)가 사용됨을 보여준다. 프라이머 쌍(G, I) 또는 (J, K)가 두 번째 및 그 다음 증폭에 사용될 수 있다.
도 7은 본 발명의 일실시예를 보여주는 개략도이다. 접합단계[(i) 단계]. 시료 준비단계에서 얻은 게놈 가닥(검은선)은 첫 번째 DNA 가닥(A) 및 두 번째 DNA 가닥(B)로부터 각각 생성된 두개의 Y-어댑터와 접합된다. 신장프라이머(D)는 헤어핀 어댑터(C)와 양립가능한 오버행 말단을 가진 Y-어댑터의 두 번째 가닥과 혼성화한다. 신장 프라이머(D)는 합성 가닥을 얻기 위한 중합효소 신장에 사용된다(점선).
도 8은 본 발명의 일 실시예를 보여주는 개략도로, 상기 헤어핀 어댑터(C) 및 신장 프라이머(D)는 복합체로 제공된다. 접합 단계[(i) 단계]. 시료 준비단계에서 얻은 게놈 가닥(검은선)은 첫 번째 DNA 가닥(A) 및 두 번째 DNA 가닥(B)로부터 각각 생성된 두개의 Y-어댑터와 접합된다. 헤어핀 어댑터(C) 및 신장 프라이머(D)로부터 생성된 복합체는 Y-어댑터 분자의 두 번째 가닥과 혼성화하고 합성 가닥을 얻기 위해 중합효소 신장에 사용된다(점선).
도 9는 본 발명의 두 개의 추가 일 실시예를 보여주는 개략도로, 헤어핀 어댑터 및 신장 프라이머(A 또는 B)는 복합체로 제공된다.
도 10는 본 발명의 일 실시예를 보여주는 개략도로, 상기 헤어핀 어댑터(헤어핀 서열 또는 헤어핀 분자)(F) 및 신장 프라이머(E)는 복합체로 제공된다. 가닥화 및 접합 단계. 게놈 가닥(검은선)은 첫 번째 DNA 가닥(A) 및 두 번째 DNA 가닥(C)를 포함하고 첫 번째 DNA 가닥에 조합 서열(B)를 가지는 헤미어댑터 분자에 결합된다. 치환 단계. 헤미어댑터의 두 번째 DNA 가닥은 대체 두 번째 가닥(D)로 치환된다. 갭을 채우는 단계. 대체 두 번째 가닥의 5' 말단과 상기 DNA 가닥의 3' 말단에 존재하는 갭을 메운다. 헤어핀 어댑터(F) 및 신장 프라이머(E)로부터 생성된 복합체는 Y-어댑터 분자의 대체 두 번째 가닥에 혼성화하고 합성 가닥을 얻기 위해 중합효소 신장에 사용된다(점선).
도 11은 본 발명의 추가 일 시시예를 보여주는 개략도로 상기 대체 두 번째 가닥(D), 헤어핀 어댑터(F) 및 신장 프라이머(E)는 복합체로 제공된다.
도 12는 본 발명의 몇 일 실시예의 생성물을 증폭하는 단계를 보여주는 개략도이다. 헤어핀 어댑터(C)에 의해 결정되는 각 증폭된 생성물의 본 서열(A) 및 합성 서열(B)의 분배를 보여준다.
도 13은 본 발명의 일 실시예를 보여주는 개략도로, 생기 어댑터(C 및 D)는 다른 조합 서열을 포함한다. 조합 바코드(YY, XX, 각각)는 분자에 독특한 표지를 할 수 있다. 전체 과정 후, 처음부터 같이 존재하던 상보적 가닥은 같은 두 개의 바코드를 공유할 것이다. 이것은 각각의 이중 가닥 DNA 단편의 양 가닥(A 및 B)을 추적할 수 있다.
도 14는 본 발명의 일 실시예를 보여주는 개략도로, 상기 어댑터는 Y-어댑터이다. 접합단계[(i) 단계]. 시료 준비 단계에서 얻은 게놈 단편(검은선; A, B)이 첫 번째 DNA 가닥(회색) 및 두 번째 DNA 가닥(흰색)으로부터 각각 생성된 두 개의 Y-어댑터(C, D)에 접합되고, 상기 어댑터는 다른 이중 가닥 DNA 조합 서열(XX 및 YY, 각각)을 포함한다. 바이설파이트 단계[(ii) 단계]. 접합 단계 후 얻은 분자를 바이설파이트으로 처리하여 각 가닥의 상보성을 상실시킨다(glow). 상보적 가닥 생성 단계(신장 단계)[(iii) 단계]. 프라이머(E)가 첫 증폭단계 동안 첨가된다. 조합 바코드(YY, XX, 각각)는 분자에 독특한 표지를 할 수 있다. 전체 과정 후, 처음부터 같이 존재하던 상보적 가닥은 같은 두 개의 바코드를 공유할 것이다. 이것은 각각의 이중 가닥 DNA 단편의 양 가닥(A 및 B)을 추적할 수 있다.
도 15는 조합 서열을 포함하는DNA Y-어댑터를 제공하는 방법을 보여주는 개략도이다. 혼성화 단계. 첫 번째 단일 가닥 폴리뉴클레오타이드(A)는 두 번째 단일 가닥 폴리뉴클레오타이드(B)와 접촉하고, 상기 두 번째 폴리뉴클레오타이트는 조합 서열(C)를 가지고 3' 말단에서 가역적으로 차단되어 있다(검은 세모; D) 신장 단계. 첫 번째 폴리뉴클레오타이드의 3'말단은 두 번째 폴리뉴클레오타이드의 5' 영역에 상보적인 서열(E)을 생성하기 위해 신장된다. 차단 해제 단계. 두 번째 폴리뉴클레오타이드의 3'말단은 차단이 해제된다(흰색 세모).
도 16은 본 발명의 방법에 사용하기 위한 조합 서열을 포함하는 예시적인 어댑터 및 이의 합성방법을 보여주는 개략도이다. 본 발명의 일 실시예에 따라 다른 Y-어댑터를 제공하기 위한 순서도.
본 발명은 이중 가닥 DNA 분자 집단에서 메틸화된 시토신을 확인하는 방법에 관한 것이다. 일실시예에서 설명된 이러한 방법은 같은 DNA 분자의 각 가닥은 동시에 읽히고 에러 및 바이어스 제어가 철저하기 때문에 서열 충실도 및 시퀀싱의 질 향상을 보장한다.
또한, 더 정밀한 시퀀싱 때문에, 신뢰성 있는 판독을 위한 더 적은 범위가 요구되고, 더 적은 시작 물질이 요구된다. 특히, 본 발명의 방법에 의해 생성된 이중 가닥 DNA 라이브러리는 DNA 단편을 포함하는 것이면 적은 양의 DNA 및 다양한 준비 시료로부터 생성될 수 있다.
일 실시예에 기술된 본 발명의 모든 방법은 추가 이점을 제공하는데, DNA 주형으로 사용된 재료는 실험과정 동안 보존될 수 있고, 그것은 다시 회수, 저장되어 재료의 소진 없이 다른 조건 및 복수의 시퀀싱을 하는 여러 증폭과정에 사용될 수 있다. 특히, 일 실시예에 기술된 어느 한 방법에 사용될 수 있는 상기 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열은 샘플 확인을 위한 특정 바코드(바코드 서열, 조합 서열 또는 조합 바코드) 및 신장 또는 증폭 단계 후 본 DNA 주형을 회수하기 위한 작용기를 가질 수 있다. 상기 바코드는 또한 이하 기술하는 것과 같이, 분리된 분자 형태로 존재할 수 있다
본 발명의 일 실시예에 있는 모든 방법은 특히 메틸화된 서열을 시퀀싱하는데 유용하다. 본 발명의 방법에 의해 제공된 상기 이중 가닥 DNA 라이브러리는 모호하지 않은 DNA 서열 및 DNA 메틸화 정보를 포함하고, 서열 변형(다형성 및 돌연변이) 및 DNA 메틸화 변형의 동시 검출이 가능하다. 특히, 양 가닥이 동시에 분석되기 때문에, 본 발명의 방법은 게놈 규모에서 DNA 메틸화 대칭 결정을 할 수 있다. 각 가닥을 판독함으로써, 시퀀싱 과정이 모니터링 될 수 있고 모든 개별적 서열에서 발생하는 에러가 수정될 수 있기 때문에 각 게놈 및 메틸화를 위한 더 많은 신뢰할 수 있는 정보를 얻을 수 있다.
추가로, 서열 변이(다형성 및 돌연변이 포함) 및 DNA 메틸화 변형에 대한 정량적인 결과가 DNA 주형 내에 조합 바코드를 도입하여 얻을 수 있다. 상기 바코드는 샘플의 처리과정(즉, DNA의 heterogeneous degradation) 및 증폭과정(즉, 서열 변이로 인한 증폭 효율 차이) 동안 도입된 바이어스들(biases) 때문에 모든 라이브러리를 모니터링할 수 있다. 이와 같은 목표를 달성하기 위해, 본 발명은 초고효율의 조합 바코드 DNA 어댑터를 합성하는 방법을 제공한다.
추가로, 본 발명은 또한 라이브러리를 제공 및 메틸화된 서열의 시퀀싱을 제공한다. 상기 사용된 어댑터는 본 DNA 분자의 센스 및 안티센스 가닥을 추적할 수 있는 독특한 조합 바코드를 포함한다. 요약하면, 본 발명의 방법을 통해 DNA 라이브러리 및 이의 시퀀싱을 얻는 전체 과정은 기존의 알려진 방법을 사용하는 것보다 수작업 및 계산 모두 덜 노동 집약적이고, 더 경제적이다. 본 발명의 방법은 원래 이중 가닥 DNA 분자, 바람직하게는 게놈 DNA의 각 가닥에서 메틸화된 시토신을 확인할 수 있다.
본 발명은 하기 단계를 포함하는 이중 가닥 DNA 분자 집단에서 메틸화된 시토신을 확인하기 위한 방법에 관한 것이다:
(i) 복수의 짝지어진 어댑터-변형 DNA 분자들을 제공하기 위해, 복수의 이중 가닥 DNA 분자들의 가닥들 중 적어도 하나의 말단에 이중 가닥 DNA 어댑터(adaptor)를 접합시키고 그리고 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하고(pairng);
(ii) 상기 짝지어진 어댑터-변형 DNA 분자들의 양 가닥들에서 (메틸화되지 않은) 시토신을 상기 짝지어진 어댑터-변형 DNA 분자에서 우라실로 변환시키고(transforming);
(iii) 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하기 위해 뉴클레오타이드 A, G, C 및 T와 이중 가닥 어댑터(상기 (ii) 단계 후에 얻어진)의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 사용하여, 짝지어지고 변환된 어댑터-변형 DNA 분자들의 상보적인 가닥들을 제공하고;
(iv) 짝지어진 이중 가닥 DNA 분자들을 증폭하기 위해, 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 선택적으로 증폭하고; 그리고
(v) 상기 (ii) 단계, (iii) 단계 또는 상기 (iv) 단계에서 얻은 상기 짝지어진 DNA 분자들을 시퀀싱하는(바람직하게는 (iii) 단계 및/또는 상기 (iv) 단계에서 얻어진); 단계
상기 지정 위치에 메틸화된 시토신의 존재는, 시토신이 상기 (iii) 단계 또는 (iv) 단계에서 얻은 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되고, 그리고/또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는, 우라실 또는 티민이 상기 (iii) 단계 또는 (iv) 단계에서 얻은 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정된다.
본 발명의 방법은 이중 가닥 DNA 라이브러리를 얻을 수 있고 상기 원래 DNA 분자의 센스 및 안티센스 가닥은 (i), (ii), (iii) 및 선택적으로 (iv) 단계 후에 물리적으로 결합되어 있을 수 있다(이하 기술된 것과 같이, 만약 결합이 헤어핀 분자에 의한 경우에). 본 발명의 방법의 개략도는 도 1에 나타내었다.
본 발명에서 사용된 용어 "DNA 라이브러리"는 관심있는 DNA 단편을 확인하고 분리하기 위해 어댑터 분자와 접합된 DNA 단편의 집합을 의미할 수 있다.
본 발명에서 사용된 표현 "이중 가닥 DNA 라이브러리"는 그들의 말단 중 하나에 의해 물리적으로 접합되고 같은 분자의 일부를 형성하는 DNA 분자의 각 가닥(즉, 센스 및 안티센스 가닥)을 모두 포함하는 라이브러리를 의미한다. DNA 라이브러리의 이중 가닥 DNA 분자의 가닥은 또한 그들의 말단 중 하나에 의해 물리적으로 접합되어 있지 않을 수 있다. 이하 기술된 것과 같이, 그들은 바코드 서열에 의해 짝지어질 수 있다. 본 발명의 이중 가닥 DNA 라이브러리는 원형 라이브러리가 아니다. DNA 분자의 본래 가닥은 고리에 의해 그들의 말단 중 하나와 물리적으로 접합될 수 있어 센스 및 안티센스 가닥간에 이중 가닥을 형성한다. 이중 가닥 DNA 라이브러리의 각 분자는 또한 DNA 분자의 센스 및 안티센스 가닥사이의 상보성이 부분적으로 또는 완전히 상실될 때 선형의 형태로 존재할 수 있다. 또한, DNA 분자의 본래 가닥은 그들의 말단 중 하나에 의해 물리적으로 접합되지 않을 수 있지만 적어도 하나의 바코드 서열에 의해 짝지어 질 수 있다.
본 발명의 방법은 집단 또는 복수의 이중 가닥 DNA 분자를 요구한다. 본 발명에서 사용된 "집단 또는 복수의 이중 가닥 DNA 분자"는 제한 없이, 게놈 DNA(핵 DNA, 미토콘드리아 DNA, 엽록체 DNA 등), 플라스미드 DNA 또는 단일 가닥 핵산 샘플(예, DNA, cDNA, mRNA)로부터 얻은 이중 가닥 DNA 분자일 수 있는 이중 가닥 DNA 분자들의 집합이다. 일 실시예에서 상기 집단은 DNA 단편에 의해 생성된다.
바람직하게는, 복수의 이중 가닥 DNA 분자는 게놈 DNA이다. 이것은 전체 게놈이거나 게놈의 감소된 일부분일 수 있다. 상기 DNA는 예를 들면, 농축 또는 크로마틴 면역 침강(chromatin immunoprecipitation, ChiP)에 의해서 얻을 수 있다
상기 용어 "게놈 DNA"는 생물체의 유전될 수 있는 유전적 정보를 의미한다. 상기 게놈 DNA는 핵의 DNA(또한 염색체 DNA로 언급되는) 뿐만 아니라 색소체(예, 엽록체) 및 다른 세포 내 기관(예, 미토콘드리아)의 DNA를 포함한다. 본 발명에서 사용된 상기 용어 "게놈 DNA"는 본 발명에서 기술된 게놈 DNA에 상보적인 서열을 포함하는 게놈 DNA를 포함한다.
바람직하게는, 복수의 이중 가닥 DNA 분자는 DNA 단편이다. 상기 DNA는 기계적 스트레스(초음파(sonication), 분무(nebulization), 공동현상(cavitation) 등), 효소적 단편화(제한 엔도뉴클레아제에 의한 효소적 소화, 엔도뉴클레아제 닉킹(nicking endonucleases), 엔도뉴클레아제 등.) 및 화학적 단편화(디메틸 황산(dimethyl sulfate), 하이드라진(hydrazine), NaCl, 피페리딘(piperidine), 산(acid) 등.)을 포함하는 적합한 방법을 통해 단편화 되고, 상기 방법에 제한되지 않는다. 원칙상, 단편화 후 DNA 단편의 길이에 대한 제한은 없지만 좁은 범위의 길이를 가지는 것이 바람직하다. 단편의 적절한 크기는 본 발명의 첫 번째 방법의 (i) 단계 전에 선택될 수 있다. 최적의 길이는 이용가능한 시퀀싱 방법에 전적으로 의존한다. 더 바람직한 일 실시예에서 상기 이중 가닥 DNA 분자들은 게놈 DNA 단편들이다.
상기 (i) 단계에서 사용된 복수의 이중 가닥 DNA 분자들은 하기 단계에 의해 얻을 수 있다:
a) 게놈 DNA로부터 유래한 이중 가닥 DNA 분자들 집단을 제공하는 단계;
b) 게놈 DNA로부터 유래한 상기 이중 가닥 분자들을 분리하여 게놈 DNA로부터 유래한 단일 가닥 DNA 분자들을 제공하는 단계; 및
c) 상기 (i) 단계에서 사용된 이중 가닥 DNA 분자들을 얻기 위해 뉴클레오타이드 A, G, C 및 T를 사용하여 게놈 DNA로부터 유래한 상기 단일 가닥 DNA 분자들의 상보적 가닥을 제공하는 단계.
바람직하게는, 상기 어댑터가 접합된 복수의 이중 가닥 DNA 분자들은 이중 가닥 모두에서 (메틸화되지 않은) 시토신 및/또는 이중 가닥 중 한 가닥에서 메틸화되지 않은 시토신을 포함하는 DNA 를 포함한다.
보통 이중 가닥 DNA 분자들 집단의 말단은 처리되어 상기 시료는 시퀀싱 플랫폼의 특정 프로토콜에 적용될 수 있다.
선택적으로, 상기 이중 가닥 DNA 어댑터는 "절단 부위"(예, 제한효소에 의해 인식되는 올리고뉴클레오타이드인 "제한 효소 인식 자리")를 포함할 수 있다. 상기 "절단 부위"는 필요한 다른 시퀀싱 플랫폼에 상기 라이브러리의 최종 요소를 적용하는 방법을 추가한다. 이러한 적용은 이중 가닥 특정 형태의DNA 어댑터에 의해 달성될 수 있지만(시퀀싱 프라이머와 같이, 플랫폼 시약과 양립될 수 있는 서열을 도입함으로써), 절단 부위는 다중화(다른 유래의 시료를 혼합하는) 또는 대규모 시퀀싱 플랫폼용으로 바코드 또는 어댑터를 추가하여 모듈화가 가능하다(또한 불필요한 뉴클레오타이드를 제거하기 위해서). "절단 부위"는 복수의 짝지어진 어댑터-변형 DNA 분자의 말단에 알려진 타겟의 존재를 알 수 있는 특정 서열이다(상기 (i) 단계에서 얻은 짝지어진 어댑터-변형 DNA 분자 라이브러리, 또는 (iii) 단계(및 (iv) 단계)에서 얻은 짝지어지고 변환된 어댑터-변형 DNA 분자 라이브러리). "절단 부위"는 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열을 접합시키는 단계 전 또는 후에 복수의 이중 가닥 DNA 분자들과 접합될 수 있다. 상기와 같이, "절단 부위"는 이미 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열 내에 포함될 수 있다. 이렇게, 모든 단편이 절단될 수 있고 어댑터는 적절히 접합될 수 있다(이렇게 더 이상 불필요한 어댑터 서열 및/또는 헤어핀 서열 및/또는 바코드 서열이 제거되어 시퀀싱 효율을 증가시킬 수 있다).
바람직하게는, (i) 단계에서 사용된 상기 이중 가닥 DNA 분자는 (i) 단계 전에 말단-수정된다.
상기 용어 "말단-수정(end-repaired)"은 손상되거나 호환되지 않는 5'- 및/또는 3'-돌출된 말단을 포함하는 DNA 단편을 5'-인산기 및 3'-수산기를 포함하는 평활 말단(blunt-end)으로 전환하는 것을 의미한다. 상기 DNA 말단을 평탄하게 하는 것은 T4 DNA 중합효소(5' 돌출된 DNA 말단을 채우는 5'3' 중합 활성을 가지는) 및 E.coli DNA 중합효소 I(3'-오버행을 제거하는 3'5' 엑소뉴클라아제 활성을 가지는)의 Klenow 단편을 포함하는 효소에 의해 제한없이 일어날 수 있다. DNA 말단의 효율적인 인산화를 위해 탈인산화된 DNA 단편의 말단에 5'-인산기를 추가할 수 있는 효소라면 제한없이 사용될 수 있다.
바람직하게는, 본 발명의 방법은 말단-수정 단계 후에 DNA 분자를 dA-tailing하는 단계를 더 포함한다.
상기 용어 "dA-tailing"은 인산화DNA 단편의 3'평활 말단에 A염기를 추가하는 것을 의미한다. 이러한 처리는 다음 접합단계를 위한 호환가능한 오버행(overhangs)을 만든다. 이 단계는 본 발명이 속하는 기술 분야의 통상의 기술자에게 널리 알려진 방법에 의해 수행된다, 예를 들면, DNA 중합효소 I의 클레노우(Klenow) 단편을 이용할 수 있다.
본 발명의 방법에서 시작 물질로 사용된 복수의 이중 가닥 DNA는 단일 가닥 DNA 또는 cDNA로부터 합성하여 얻을 수도 있다. 상기 이중 가닥 DNA 분자들 집단은 cDNA로부터 얻을 수 있다. 상기 이중 가닥 DNA는 mRNA 를 분리하는 단계, RNA를 역전사시켜 단일 가닥 cDNA 를 제공하는 단계 및 상기 단일 가닥 DNA를 처리하여 이중 가닥 DNA를 얻는 단계를 포함하는 본 발명의 기술분야에서 널리 알려진 방법에 의해 mRNA(예, 바이러스 RNA)로부터 얻을 수도 있다.
복수의 이중 가닥 DNA 분자들을 얻는데 사용된 시료는 생물 또는 환경을 출처로 할 수 있다. 생물학적 시료는 동물 또는 인간 시료, 액체 및 고체 음식 및 사료(유제품, 야채, 고리 등)를 제한 없이 포함한다. 바람직한 생물 시료는 DNA 또는 mRNA를 포함하는 생물학적 유체, 세포, 조직, 기관 또는 이들의 일 부분을 포함하고 이에 제한되는 것은 아니다. 생물학적 시료는 결장, 직장, 유방, 난소, 전립선, 신장, 폐, 혈액, 뇌 또는 다른 기관 또는 조직의 세포와 같은 종양 세포를 포함할 수 있다. 모든 생물체는 원료로 사용될 수 있고 세균, 곰팡이, 바이러스, 식물, 동물, 예를 들면, 인간, 비인간 영장류, 파충류, 곤충, 조류, 벌레, 물고기, 포유류, 가축(소, 말, 돼지, 양, 염소, 개, 고양이, 쥐 등)을 포함하고 이에 제한되는 것은 아니다. 환경적 시료는 표면물질, 흙, 물 및 식품 및 유제품 처리기기로부터 얻은 시료 뿐만 아니라 산업용 시료를 포함하고 이에 제한되는 것은 아니다. 상기 분석된 시료는 단일 소스(예, 단일 생물체, 조직 세포 등)로부터 유래되거나 복수의 생물체, 조직 또는 세포로부터 얻은 핵산 집단으로부터 유래될 수 있다.
(i) 단계
첫 번째 단계에서, 이중 가닥 DNA 분자들 집단 내에서 메틸화된 시토신을 확인하는 방법은 복수의 이중 가닥 DNA 분자의 적어도 한 가닥 말단에 이중 가닥 DNA 어댑터를 접합하는 단계를 포함한다. 바람직하게는, 상기 이중 가닥 DNA 어댑터는 복수의 이중 가닥 DNA 분자의 어느 한 가닥 말단에 접합될 수 있다. 또는, 상기 이중 가닥 DNA 어댑터는 복수의 이중 가닥 DNA분자의 각 가닥의 말단에 접합될 수 있다.
상기 용어 "어댑터(adapter)"는 관심있는 핵산 분자에 접합될 수 있는 올리고뉴클레오타이드 또는 핵산 단편 또는 분절을 의미한다.
상기 "어댑터 분자"는 상기 이중 가닥 DNA의 말단과 호환가능한 말단을 가지는 이중 가닥 DNA 분자이다. 상기 어댑터 분자는 상호 보완적인 첫 번째 DNA 가닥 및 두 번째 DNA 가닥에 의해 형성될 수 있다. 상기 어댑터 분자는 상기 첫 번째 DNA 가닥의 3' 영역과 상기 두 번째 DNA 가닥의 5'영역이 서열 상보성에 의해 이중 가닥을 형성하고 상기 첫 번째 DNA 가닥의 5'영역과 상기 두 번째 DNA 가닥의 3'영역은 상보적이지 않은 Y-어댑터일 수 있다.
일 실시예에서, 이중 가닥 어댑터의 적어도 한 부분은 (i) 단계에서 사용된 상기 이중 가닥 어댑터 전부와 공통된 서열을 가진다. 이 경우에, (iii) 단계, 및/또는 증폭 단계(iv)에서 짝지어진 변환된 어댑터-변형 DNA 분자의 상보적인 가닥을 생성하기 위한 동일한 프라이머가 사용될 수 있다.
선택적으로, 상기 어댑터는 정량분석뿐만 아니라 샘플 확인, 다중화, 짝짓기를 가능하도록 하는 독특한 조합 바코드("조합 서열" 또는 "바코드" 또는 "바코드 서열" 또는 "조합 표지"도 의미하는)를 포함한다. 본 발명의 방법에 의해 얻은 구조는 초기 구조와 관련된 고유 식별자를 생성하는 바코드를 가진다, 따라서 구조간 차이를 구별할 수 있는 능력을 제공한다. 각 고유 식별자는 시작 물질내에서 개별 분자와 관련이 있다. 그러므로, 고유 식별자를 담지한 상기 초기 개별 분자의 어떠한 증폭 산물도 동일한 것으로 가정된다. 상기 조합 서열은 또한 시료 내의 개별 서열의 함량을 정량할 수 있고 증폭단계 동안 바이어스(biases)를 모니터링하고 에러를 조절하는데 유용하다.
상기 바코드 서열은 "바이어스 제어(bias control)" 기능도 포함한다. 증폭이 일어날 때, 일부 단편은 여러가지 이유로 선택적으로 증폭될 수 있다. 이러한 바람직하지 않은 효과는 정량화를 위한 주요 문제인데, 이것은 시퀀싱, 특히 DNA 메틸화 상태 분석을 위한 많은 응용에 중요하다(각 세포 내의 각 대립유전자는 다른 메틸화 상태를 가질 수 있고 심지어 시료는 정량화 및 바이어스가 대부분의 응용을 위해 필수적인 것을 조절하도록 하는 이종 구성을 가질 수 있기 때문에). 따라서, 적어도 하나의 바코드 서열의 존재는 바이어스를 제어할 수 있는 가능성을 허용한다. 복수의 이중 가닥 DNA 분자들로부터 각 이중 가닥 DNA 분자는 하나 또는 이상의 다른 바코드 서열을 가질 수 있기 때문에, 바이어스 제어를 수행하고 주어진 이중 가닥 또는 단일 가닥 DNA 분자의 선택적인 증폭을 확인하는 것이 가능할 수 있다.
현재, 시퀀싱 기기는 오류율을 가진다. 이러한 대부분의 오류는 도시할 수 없고 최종 결과에 숨겨진 상태로 존재한다. 이것은 다음 과정 및 결과 분석에 부정적인 결과를 나타낸다. 본 발명의 방법은 모든 판독 값이 일치해야 하므로, 각 염기를 판독할 수 있는 각 염기에 대한 네 가지 정보소스(경우에 따라서, 주어진 이중 가닥DNA의 상 하부 가닥 및 각각의 합성 상보 가닥)를 제공한다. 따라서, 본 발명의 방법은 상기 서열 결정의 오류 검출 및 수정을 가능하게 한다.
바람직하게는, 어댑터 분자 및/또는 헤어핀 서열 및/도는 바코드 서열은 각각 분자 라이브러리로 제공된다. 상기 라이브러리 내에서 각 서열은 이하 설명된 바와 같이, 서열 내의 조합 서열에 의해 다른 것과 구별된다.
상기 용어 "어댑터 분자 및/또는 헤어핀 서열 및/또는 바코드 서열" 및/도는 "조합 표지"는 어댑터 분자 및/또는 헤어핀 분자 및/또는 바코드 서열의 집합을 의미한다. 상기 집합의 각 서열은 어댑터 및/도는 헤어핀 서열 및/도는 바코드 서열 내의 조합 서열에 의해 다른 것과 구별될 수 있다.
상기 용어 "조합 서열", "바코드 서열", "바코드" 및 "조합 바코드" 는 본 명세서에서 교환적으로 사용되고 개별적인 어댑터/헤어핀 서열 또는 분리된 DNA 분자(어댑터 및/또는 헤어핀 서열에 속하지 않는 그 자체의 바코드 서열)에 대한 고유 식별자를 의미한다. 바람직하게는, 상기 바코드 서열은 어댑터 및/또는 헤어핀 서열에 포함된다. 일 실시예에서, 상기 어댑터 서열/헤어핀 서열내의 조합 서열은 축퇴 핵산 서열(degenerate nucleic acid sequence)이다. 조합 서열은 아데닌, 구아닌, 시토신, 메틸화된 시토신 및 다른 변형된 염기를 포함하는 염기를 포함한다. 조합 서열내의 염기의 수는 바람직하게는 상기 조합 서열에 의해 표시되는 잠재 및 실제 서열의 수가 라이브러리 내에서 어댑터의 전체 수보다 더 많도록 설계 된다. 상기 조합 서열은 상기 어댑터/헤어핀 서열의 한 영역 내에 위치될 수 있다. 바람직하게는, 상기 어댑터/헤어핀 서열의 이중 가닥 영역 내에 위치된다.
선택적으로, 상기 어댑터/헤어핀 서열/바코드 서열은 신장 또는 증폭 단계 이후에 원래 DNA 주형의 복원을 가능하게 하는 후술하는 바와 같이 결합 쌍의 두 번째 구성으로 표시된 염기를 통합한다. DNA 주형으로 사용된 시료는 절차 동안 보전되고 센스 및 안티센스에 의해 형성된 상기 원래 DNA 주형은 회수, 저장될 수 있고 시료 소진 없이 다른 조건 및 시퀀싱으로 다중 증폭에 사용될 수 있다. 본 발명의 모식도는 도 1에 나타내었다.
첫 (i) 단계에서, 본 발명의 이중 가닥 DNA 분자의 집단에서 메틸화된 시토신을 확인하는 방법은 복수의 짝지어진 어댑터-변형 DNA 분자를 제공하기 위해 복수의 이중 가닥 DNA 분자들의 가닥들의 짝짓기 단계를 더 포함한다.
본 발명 첫 단계의 "짝짓기 단계(pairing step)"는 하나 또는 이상의 이중 가닥 DNA 분자의 가닥과 헤어핀 서열(또는 "헤어핀 분자" 또는 "헤어핀 어댑터"를 의미한다)을 공유결합으로 짝지음으로써 수행될 수 있다. 본 발명 첫 단계의 "짝짓기 단계"는 바코드 서열을 사용하여 수행될 수 있다. 본 발명 첫 단계의 "짝짓기 단계"는 헤어핀 서열 및 바코드 서열 모두를 사용하여 수행될 수 있다.
예를 들면, 본 발명 첫 단계의 "짝짓기 단계"는 헤어핀 서열을 통해서 수행될 수 있다. 헤어핀 서열은 헤어핀 고리 영역과 이중 가닥 영역을 포함할 수 있고, 상기 이중 가닥 영역은 이중 가닥 DNA 분자 말단과 호환 가능한 말단을 포함한다(및/또는 DNA 가닥에 이미 접합되었다면, 바코드 서열의 말단과). 따라서 상기 짝짓기 단계는 하나 또는 이상의 이중 가닥 DNA 분자의 가닥과 헤어핀 서열을 공유결합시킴으로써 수행될 수 있다. 상기 헤어핀 서열은 또한 하나 또는 이상의 바코드 서열을 포함할 수 있다.
이 경우에, 상기 원래 DNA 분자의 센스 및 안티센스 가닥이 물리적으로 결합된 이중 가닥 DNA 라이브러리가 얻어진다(예, 도 1).
본 발명에서 사용된 상기 용어 "짝짓기 서열" 또는 "짝짓기 분자"는 하나 또는 이상의 이중 가닥 DNA 분자의 가닥들을 짝짓기 하는데 적합한 서열을 의미한다. 예를 들면, "짝짓기 서열"은 헤어핀 서열 및/또는 하나 또는 이상의 바코드 서열을 의미할 수 있다. 본 발명에서 사용된 상기 용어 "헤어핀 서열"(또는 "헤어핀 분자" 또는 헤어핀 어댑터")은 같은 가닥 내에서 상보적인 염기 서열간 염기쌍에 의해 유지되는 이중 가닥 영역을 형성하기 위해 자체적으로 복제된 단일 가닥 핵산에 의해 형성된 이중 가닥을 의미한다. 상기 헤어핀 분자는 또한 짝지어지지 않은 염기에 의해 형성된 헤어핀 고리 영역을 포함한다. 상기 헤어핀 서열은 이중 가닥 DNA 분자 내에서 이중 가닥 DNA어댑터의 위치에 대하여 이중 가닥 DNA 분자의 반대편 말단에 위치한다.
선택적으로, 상기 본 발명의 첫 단계((i) 단계)의 "짝짓기 단계"는 바코드(또한 상술한 바와 같이, "바코드 서열", "조합 서열" 및/또는 "조합 바코드" 및/또는 바코드 및/또는 "조합 표지"로 지칭됨)의 사용을 통해서 수행될 수 있다. 따라서 상기 짝짓기 단계를 바코드 서열을 사용하여 수행될 수 있다.
상기 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하는데 사용되는 "조합 서열", "조합 바코드", "바코드 서열" 또는 "바코드"는 어댑터 및/또는 만약 존재한다면, 헤어핀 서열내에 위치할 수 있다. 상기 바코드는 이중 가닥 DNA 분자의 하나 또는 각 말단 모두에 접합될 수 있는 분리된 이중 가닥 DNA 분자 일 수 있다. 예를 들면, 상기 바코드는 상기 어댑터 및/또는 헤어핀 서열이 상기 이중 가닥 DNA 분자에 접합되기 전에 상기 이중 가닥 DNA 분자의 하나 또는 두 말단에 접합될 수 있다(그리고 이 경우에, 어댑터 및/또는 헤어핀 서열은 바코드에 접합될 수 있다). 상기 바코드는 상기 어댑터 및/또는 헤어핀 서열이 상기 이중 가닥 DNA 분자에 접합되기 후에 상기 이중 가닥 DNA 분자의 하나 또는 두 말단에 접합될 수 있고, 그리고 따라서 어댑터에 접합될 수 있다.
상기 짝짓기 단계는 또한 헤어핀 서열 및 바코드 모두를 사용하여 수행될 수 있다.
상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 메틸화되지 않은 시토신 및/또는 메틸화된 시토신을 포함할 수 있다. 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 메틸화되지 않은 시토신을 포함하지 않을 수 있다. 예를 들면, 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 시토신을 포함하지 않는다. 예를 들면, 상기 어댑터 헤어핀 서열 및/또는 바코드 서열은 메틸화된 시토신은 포함하지만 메틸화되지 않은 시토신은 포함하지 않는다. 예를 들면, 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 메틸화된 시토신을 포함한다. 예를 들면, 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 메틸화된 시토신 및 메틸화되지 않은 시토신을 포함한다.
상기 어댑터가 메틸화되지 않은 시토신을 포함하는 경우, 이러한 메틸화되지 않은 시토신은 혼성화 특성의 관점에서 메틸화되지 않은 시토신을 시토신과 유사하지 않은 염기로 변환시키는 시약으로 동일하게 처리되고(바람직하게는 우라실)(본 발명의 어느 일 실시예의 (ii) 단계에서). 그리고 따라서 혼성화 특성의 관점에서 시토신과 유사하지 않은 염기로 동일하게 변형된다(바람직하게는 우라실). 따라서, 상기 변형 후 (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 프라이머는 이중 가닥 어댑터의 적어도 일부분에 상보적인 서열을 포함한다.
상기 용어 "말단(ends)"은 핵산 서열의 각 끝(또는 근위)에 위치하는 서열 영역을 의미한다.
상기 용어 "호환가능한(compatible)"은 어댑터 분자 말단 중 하나의 모든 가닥들이 시작 물질로 사용된 이중 가닥 DNA 분자의 하나 또는 모든 말단과 접할 수 있는 것을 의미한다. 호환가능한 말단은 평활 DNA 말단(blunt DNA ends) 및 상보적인 오버행(overhangs) 을 가진 점착성 말단(sticky ends)을 포함한다. 두 호환가능한 말단은 바람직하게는 어떤 갭(gap) 또는 미스매치(mismatch) 없이 서로 결합될 수 있고 접합되어 제한 효소 절단 부위를 포함하는 DNA 서열을 생성할 수 있다.
상기 용어 "평활 말단(blunt ends)"은 염기쌍에서 이중 가닥 DNA의 모든 가닥의 길이 및 종료점이 동일한 것을 의미한다(즉, 짝지어지지 않은 염기가 없고 가닥은 서로 오버랩되거나 오버행되지 않는다).
상기 용어 "점착성 말단(sticky ends)"은 다양한 오버행에 의해 생성된 평활하지 않은 말단을 의미한다. 오버행은 DNA분자 말단에 뻗어있는 짝지어지지 않은 뉴클레오타이드이다. 이러한 짝지어지지 않은 뉴클레오타이드는 3' 또는 5' 오버행을 생성하여 각 가닥에 존재할 수 있다. 이러한 오버행은 대부분의 경우에 팔린드롬(palindromic)하다. 가장 단순한 오버행은 하나의 뉴클레오타이드이다. 이것은 대부분 아데노신이고 일부 DNA 중합효소에 의해 3' 오버행과 같이 생성된다. 상기 생성물은 3' 티민 오버행을 가진 선형 DNA 분자와 결합된다. 아데노신과 티민은 염기쌍을 형성하므로, 이것은 리가아제(ligase)에 의해 두 분자의 결합을 용이하게 한다. 본 발명의 첫 번째 방법에서, (i) 단계에서 사용된 이중 가닥 DNA 분자가 말단이 짝지어지고 (i) 단계 전에 d-A tailing되는 경우, 첫 번째 및 두 번째 어댑터 분자는 3'-티민 오버행을 가져야 한다. 더 긴 오버행은 제한효소에 의해 대부분 생성된다. 예를 들면, 제한효소는 서로 두 DNA 가닥 4개의 염기쌍을 절단할 수 있고 한 분자에는 4개의 염기로 이루어진 5' 오버행을 생성시키고 다른 한 분자에는 상보적인 5' 오버행을 생성시킨다. 이러한 말단은 리가아제에 의해 쉽게 서로 결합되므로 점착성 말단으로 불린다. 다른 제한효소들은 보통 다른 오버행을 생성하기 때문에, 두개의 다른 효소로 DNA 조각을 절단한 다음 같은 효소에 의해 생성된 말단을 가지는 다른 DNA 분자를 결합하는 것이 가능하다. 상기 오버행은 리가아제 활성을 위해 상보성을 가지기 때문에, 상기 두 분자는 단일한 방향으로만 접합할 수 있다.
상기 (i) 접합 단계는 복수의 어댑터-변형 DNA 분자를 얻기 위해 DNA 분자에 어댑터의 접합 및/도는 분자(헤어핀 및/도는 바코드 서열)의 짝짓기를 위한 적절한 조건아래에서 수행된다.
상기 용어 "접합(ligation)"은 두개 또는 이상의 핵산의 말단간에 공유 결합 또는 연결의 형성을 의미한다. 상기 결합 또는 연결의 본질은 매우 다양할 수 있고 상기 접합은 효소적으로 또는 화학적으로 수행될 수 있다. 상기 사용된 것과 같이, 상기 접합은 보통 효소적으로 수행되어 한 핵산의 5' 탄소 말단 뉴클레오타이드와 다른 핵산의 3' 탄소간에 인산이에스테르 결합(phosphodiester linkage)을 형성시킨다. 상기 접합을 위한 적절한 조건은 하나 또는 두개의 어댑터와 결합된 이중 가닥 DNA 분자를 얻을 수 있는 조건이다. 비록 DNA 리가아제 없이 접합하는 방법이 알려져 있지만 바람직한 조건은 DNA 리가아제를 사용하는 것이다.
짝짓기는 접합 전 또는 후 어느 때나 가능할 수 있고, 또는 어댑터 및/또는 헤어핀 서열의 접합과 동시에 가능할 수 있다. 바람직하게는, 상기 짝짓기는 어댑터 및/또는 헤어핀 서열의 접합과 동시에 수행된다.
본 발명의 첫 번째 단계((i) 단계)의 결과는 복수의 DNA 분자이다.
본 발명의 방법에서, 만약 본 발명의 방법의 (i) 단계인 짝짓기 단계가 헤어핀 서열 존재에 의해 수행된다면(예, 헤어핀 서열만의 존재에 의해 또는 헤어핀 서열 및 하나 또는 이상의 바코드 서열에 의해), (i) 단계에서 얻은 상기 DNA 분자는 이하와 같을 수 있다(도 1 참조):
A) 한 어댑터 분자(선택적으로 적어도 하나의 바코드 서열을 포함하는)의 한 말단과 두 번째 분자의 다른 말단이 접합된 이중 가닥 DNA 분자들로, 상기 두 번째 분자는 헤어핀 서열이다(및 선택적으로 하나 또는 이상의 바코드 서열을 포함하는)(이것은 짝지어진 어댑터-변형 DNA 분자로 불린다);
B) 헤어핀 분자(각 말단에 적어도 하나의)가 존재하지 않는 조건에서, 두 어댑터 분자가 접합된 이중 가닥 DNA 분자;
C) 두 분자(각 말단에 적어도 하나의)가 접합된 이중 가닥 DNA 분자로, 상기 두 분자는 헤어핀 서열 및/또는 바코드 서열일 수 있다; 및
D) 그것에(변형되지 않은 이중 가닥 DNA 분자들인 원래 이중 가닥 DNA 분자들) 접합된 분자가 없는 이중 가닥 DNA 분자들.
본 발명의 방법에서, 만약 본 발명의 방법의 (i) 단계인 짝짓기 단계가 (하나 또는 이상의) 바코드 서열의 존재 및 헤어핀 서열의 부 존재에 의해 수행된다면, (i) 단계에서 얻은 상기 DNA 분자는 이하와 같을 수 있다:
A) 이중 가닥 DNA 분자들 말단(적어도 하나의 바코드 서열을 포함하는)의 각각에 하나의 어댑터 분자가 접합된 이중 가닥 DNA 분자(이것은 짝지어진 어댑터-변형 DNA 분자로 불린다);
B) 이중 가닥 DNA 분자들 말단 중 하나에만 적어도 하나의 어댑터 분자가 접합된 이중 가닥 DNA 분자;
C) 이 경우라면, 이중 가닥 DNA 분자들 말단의 각각에 어댑터 분자가 부 존재한 상태에서 적어도 하나의 바코드 서열이 접합된 이중 가닥 DNA 분자; 및
D) 그것에(변형되지 않은 이중 가닥 DNA 분자인 원래 이중 가닥 DNA 분자) 접합된 분자가 없는 이중 가닥 DNA 분자.
본 발명의 (i) 단계인 짝짓기 단계가 (하나 또는 이상의)바코드 서열의 존재 및 헤어핀 서열의 부존재 하에서 수행된다면, (i) 단계 이후에 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 이중 가닥 DNA분자(가닥의 짝짓기를 위해 적어도 하나의 바코드 서열을 포함하는) 말단의 각각에 하나의 어댑터 분자가 접합된다.
(i) 단계 전에, 상기 이중 가닥 DNA 분자들 집단은 DNA 분자에 어댑터 분자를 접합시키기에 적절한 조건하에서 어댑터 분자로 처리될 수 있고 이의 따라 상기 DNA 분자에 점착성 말단이 도입된다. 점착성 말단을 가진 어댑터 분자는 적절한 제한효소를 이중 가닥 DNA에 처리하거나 단일 가닥 올리고뉴클레오타이드 어닐링과 같은 합성방법으로 제공될 수 있다.
(i) 단계에서 어댑터 접합 및/또는 분자(예, 헤어핀 서열 및/또는 바코드 서열) 짝짓기 후, 포집 단계(또는 "회수 단계", 또는 "정제 단계")가 선택적으로 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열을 포함하는 반응 혼합물을 상기 옵션 (A)에 따라(상술한 바와 같이, 짝지어지는 분자에 의존하는), 즉, 짝짓기가 적어도 하나의 헤어핀 분자 존재 하에서 수행되는 경우, 하나의 어댑터 분자(선택적으로 적어도 하나의 바코드 서열을 포함하는)의 한 말단과 두 번째 분자의 다른 말단이 접합된 이중 가닥 DNA 분자로, 상기 두 번째 분자는 헤어핀 서열인(및 선택적으로 하나 또는 이상의 바코드 서열을 포함하는) 이중 가닥 DNA 분자, 및 상기 짝짓기가 헤어핀 서열의 부 존재 하에서 수행되는 경우(적어도 하나의 바코드 서열에 의해서), 하나의 어댑터 분자와 이중 가닥 DNA 분자(적어도 하나의 바코드 서열을 포함하는) 말단의 각각이 접합된 이중 가닥 DNA 분자를 회수하기 위해 수행될 수 있다("회수단계"). 그러므로, 본 발명의 첫 번째 (i) 단계는 (i) 단계에서 얻은 DNA 분자 집단으로부터 짝지어진 어댑터-변형 DNA 분자의 하나 또는 두개의 말단에 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열을 포함하는 어댑터-변형 DNA분자(상기 (A)에 따른 분자들)를 회수하는 단계를 더 포함할 수 있다.
상기 단계는 생성된 DNA 분자 나머지로부터(예, 상기 B)-D)에 따라) 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열(예, 상기 (A)에 따라)을 포함하는 (i) 단계에서 얻은 짝지어진 어댑터-변형 DNA분자를 분리할 수 있다. 상기 포집 단계는 예를 들면 어댑터 분자뿐만 아니라 헤어핀 서열 및/또는 바코드 서열에 친화력을 가지는 프로브(probe) 또는 리간드(ligand)에 의해서 또는 어댑터 분자에만 친화력을 가지는 프로브 또는 리간드에 의해서 수행될 수 있다.
이 방법은 DNA 주형으로 사용된 샘플이 절차 동안 보전되고 센스 및 안티센스 가닥으로부터 생성된 원래 DNA 주형이 시료 손실 없이 회수, 저장될 수 있고 다른 조건으로 다중 증폭 및 시퀀싱에 사용될 수 있다는 장점이 있다(상기 (iii) 단계 및/또는 (iv) 단계). 이에 대한 개략도를 도 1에 도시하였다.
바람직하게는, 상기 회수 단계("포집 단계" 또는 "정제 단계" 또는 "분리 단계"로 지칭되는)는 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열의 적어도 일부 서열에 상보적인 서열을 포함하는 폴리뉴클레오타이드 및 정제 표지을 사용하여 수행된다.
상기 용어 "폴리뉴클레오타이드"는 많은 뉴클레오타이드 단량체가 공유 결합된 단일 가닥 DNA 또는 RNA 분자를 의미한다. 바람직하게는, 상기 폴리뉴클레오타이드는 8또는 이상의 뉴클레오타이드 단량체를 가진다. 바람직한 일 실시예에서, 상기 폴리뉴클레오타이드는 적어도 8, 적어도, 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 18, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100 또는 이상의 뉴클레오타이드를 가지는 단일 가닥 DNA 분자이다.
상기 용어 "정제 표지(purification tag)"는 폴리뉴클레이타이드 및 표적 서열의 분리가 가능한 잔기(moiety)를 의미한다. 바람직하게는, 상기 폴리뉴클레오타이드의 DNA 골격은 친화 정제 표지에 접합될 수 있는 하나 또는 이상의 뉴클레오타이드를 포함한다. 바람직하게는, 상기 친화 정제 표지는 결합쌍의 일부일 수 있다. 더 바람직하게는, 상기 친화 정제 표지는 비오틴(biotin) 및 아비딘(avidin) 또는 스트랩토아비딘(streptavidin)으로 친화성 정제로 분리된 이중 가닥 DNA 분자이다. 상기 단계는 마그네틱 비드에 의해 수행될 수 있으나, 이에 제한되는 것은 아니다.
(ii) 단계 전에, (i) 단계에서 생성된 복수의 짝지어진 어댑터-변형 DNA분자(상기 (A)에 정의된 바와 같이, 각 실시에서, 짝지어지는 분자에 의존하는)가 상기 정의된 B)-D)에 따라 (i) 단계에서 생성된 DNA 분자로부터 분리되어 상기 (A)에 따라 짝어지진 어댑터-변형 DNA 분자 라이브러리를 생성할 수 있다. 따라서, 본 발명의 방법은 이중 가닥 DNA 라이브러리를 얻을 수 있고 DNA 분자의 원래 센스 및 안티센스 가닥이 짝지어진다.
상기 용어 "DNA 라이브러리"는 관심있는 DNA 단편을 확인하고 분리하기 위해 어댑터 분자에 접합될 수 있는 DNA 단편의 집합을 의미한다.
본 발명에서 상기 표현 "이중 가닥 DNA 라이브러리"는 그것의 말단 중 하나(예, 헤어핀 서열)와 물리적으로 결합되고 같은 분자의 일부를 형성하는 DNA 분자 가닥 각각(예, 센스 및 안티센스 가닥)을 포함하는 라이브러리를 의미한다. 상기 이중 가닥 DNA 라이브러리는 원형 라이브러리가 아니다. 상기 DNA 분자의 원래 가닥들은 루프 형태로 그들의 말단 중 일부와 물리적으로 결합될 수 있고 이에 따라 센스 및 안티센스 가닥간에 이중 가닥을 형성한다(상기 A)에 따라). 이중 가닥 DNA 라이브러리의 각 분자는 DNA 분자의 센스 및 안티센스 가닥간의 상보성이 부분적으로 또는 완전히 상실한 경우에 선형으로 변형될 수 있다. 또한, 본 발명의 방법에서 상기 표현 "이중 가닥 DNA 라이브러리"는 DNA 분자의 모든 가닥들이 그들의 말단 중 하나에 물질적으로 결합된 것이 아니라 적어도 하나의 바코드 서열을 사용하여 짝지어진 경우(상기 A)에 따라)의 라이브러리를 의미한다.
본 발명의 방법의 (i) 단계의 상기 접합 단계는 "접촉 단계"로 지칭될 수 있다.
(ii) 단계
DNA 메틸화는 일반적으로 CpG 부위(DNA 서열 내에서 시토신이 구아닌 다음에 바로 있는 부위, cytosine-phosphate-guanine sites)에서 일어난다. 이 메틸화는 5-메틸시토신으로 시토신의 변환 결과이다. Me (methyl)-CpG 의 형성은 DNA 메틸화효소에 의해 촉매된다. 인간 DNA는 약 80-90%의 메틸화된 CpG 부위를 가지고 있지만, 메틸화 되지 않은 GC-리치(약 60% CG 레시듀를 가지는)인 CpG 섬으로 알려진 특정 영역이 있다. 이것은 보편적으로 발현되는 모든 유전자를 포함하는 56% 포유 동물 유전자의 프로모터와 관련이 있다. 인간 게놈의 1 내지 2%는 CpG 클러스터이고 CpG 메틸화와 전사 활성간에는 반비례 관계에 있다. 메틸화의 패턴은 일부 질병을 연구하는데 중요하다. 일반 조직에서, 유전자의 메틸화는 CpG 풀(poor)인 주로 코딩 영역에 나타난다: 반면에 유전자의 프로모터 영역은 상기 영역내에 높은 밀도의 CpG 섬을 가지고 있지만 메틸화되지 않는다. 그러나, 암에서는 국소적 과메틸화 및 DNA 메틸화효소의 발현 증가를 동반하는 게놈 전체 메틸화가 일어나 메틸화 불균형이 나타난다. 일부 유전자의 메틸화 상태는 종양에 대한 바이오마커로 사용될 수 있다.
두 번째 단계에서((ii) 단계), 시료의 메틸화 패턴을 분석하기 위해, (i) 단계 후 생성된 상기 짝지어진 어댑터-변형 DNA 분자 집단에 메틸화되지 않은 시토신을 혼성화 특성의 관점에서 시토신과 유사하지 않은 염기(바람직하게는 우라실)로 변환시킬 수 있는 시약을 처리하였다. 바람직하게는, (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 프라이머는 상기 시약 처리 후의 어댑터 분자에 특이적이다. 도 1은 본 발명의 방법의 이러한 실시예를 보여주는 개략도를 나타낸다.
상기 표현 "혼성화 특성의 관점에서 시토신과 유사하지 않은 염기"는 상보적인 가닥내에서 구아닌과 교배할 수 없는 염기를 의미한다. 바람직하게는, 시토신과 유사하지 않은 상기 염기는 티민 또는 우라실이고 더 바람직하게는 우라실이다.
이 단계에서 사용된 상기 시약은 메틸화되지 않은 시토신을 혼성화 특성의 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있지만 메틸화된 시토신의 활성에 영향이 없는 시약이어야 한다. 상기 시약의 예로, 바이설파이트(bisulfite), 메타바이설파이트(metabisulfite) 및 활성 유도된 시티딘-디아미나아제(activation-induced cytidine-deaminases, AID)와 같은 시티딘-디아미나아제이고 이에 제한되지 않는다. 바람직한 일실시예에서 상기 시약은 바이설파이트다. 바이설파이트 이온은 HSO3-의 의미를 가진다. 일반적으로, 바이설파이트는 바이설파이트 염, 예를 들면 소듐 바이설파이트(NaHSO3) 또는 마그네슘 바이설파이트(Mg(HSO3)2)의 수용성 용액으로 사용된다. 바이설파이트 화합물에 적합한 반대 이온은 1가 또는 2가일 수 있다. 1가 양이온의 예로는 나트륨, 리듐, 칼륨, 암모늄 및 테트라알킬암모늄을 포함하고 이에 제한되지 않는다. 적합한 2가 양이온은 마그네슘, 망간 및 칼슘을 포함하고 이에 제한되지 않는다. 바이설파이트로 DNA의 처리는 메틸화되지 않은 시토신 염기를 우라실로 전환하지만5-메틸시토신 염기는 이에 영향을 받지 않는다. 상기 전환은 표준절차에 의해 수행된다(Frommer et al. 1992, Proc Natl Acad Sci USA, 89:1827-31; Olek, 1996, Nucleic Acid Res. 24:5064-6; EP 1394172). 시료를 얻는 방법은 감소 표현 바이설파이트 시퀀싱(reduced representation bisulfite sequencing, RRBS)에 유용한 방법을 포함한다.
바람직하게는, 짝지어진 DNA 분자내에서 메틸화되지 않은 시토신의 우라실로의 전환은 바이설파이트로 수행된다.
(ii) 단계에서 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 메틸화되지 않은 시토신을 이중교배 특성 관점에서 시토신과 유사하지 않은 염기(상술한 바와 같이, 바람직하게는 우라실)로 전환시킬 수 있는 시약으로 처리되고. 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥간의 상보성은 부분적으로 또는 완전히 상실된다. 이것은 다음 단계에서 사용되는 프라이머의 어닐링(annealing)을 용이하게 한다. 특히 상기 가닥 중 하나가 비메틸화 시토신 및 메틸화되지 않은 시토신을 가진 경우, 이것은 또한 (iii) 단계에서 상보적 가닥의 생성을 용이하게한다.
상기 영역들 중 하나의 뉴클레오타이드 다른 영역의 100% 이하, 99% 이하, 95% 이하, 90% 이하, 80% 이하, 70% 이하, 60% 이하, 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하, 5% 이하, 3% 이하, 1% 이하, 0.5% 이하, 01% 이하로 센스 또는 안티센스 가닥 쌍을 포함하는 경우, 짝지어진 어댑터-변형 DNA 분자는 본래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥을 포함하는 영역간의 상보성을 부분적으로 잃는 것으로 간주된다. 상기 영역 중 하나의 뉴클레오타이드가 다른 영역의 0%로 센스 또는 안티센스 가닥 쌍을 포함하는 경우, 상보성을 완전히 상실하는 것으로 간주된다.
상기 원래 이중 가닥 DNA 분자가 완전히 메틸화되는 특별한 경우에, 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(예, 우라실)로 전환시킬 수 있는 시약을 처리한 후 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥간의 상보성은 상실되지 않는다. 가닥 중 하나가 (비메틸화) 시토신 및 메틸화되지 않은 시토신을 가지는 특별한 경우에, 상보성은 최적으로 상실된다.
(iii) 단계
세 번째 단계에서, DNA 가닥들은 상기 가닥의 합성이 일어나는 조건에서 주형으로 (ii) 단계에서 얻은 상기 짝지어지고 변환된 어댑터-변형 DNA 분자를 사용하고 프라이머로 적어도 첫 번째 어댑터 분자의 서열 일부와 상보적인 서열을 사용하여 합성된다. 따라서, 본 발명의 방법의 (iii) 단계는 뉴클레오타이드 A, G, C 및 T 및 부분적으로 변환된 짝지어진 이중 가닥 분자를 제공하기 위해 프라이머로 이중 가닥 어댑터의 적어도 일부분과 상보적인 서열을 사용하여 짝지어지고 변환된 어댑터-변형 DNA 분자의 상보적인 가닥을 제공한다.
예를 들어, 바이설파이트로 처리 후, DNA 가닥들은 (ii) 단계에서 얻은 변환되고 짝지어진 어댑터-변형 DNA 분자를 주형으로 사용하고 어댑터 분자의 적어도 일부 또는 어댑터 분자에 대한 상보적인 서열의 적어도 일부와 상보적인 서열을 프라이머로 사용하여 합성되고(이미 상술한 바와 같이, 바람직하게는, (ii) 단계에서 사용된 시약으로 처리한 후, (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 상기 프라이머는 어댑터 분자 또는 그의 상보적 서열에 특이적이다), 선택적으로, 얻어진 상기 생성물은 증폭된다. 우라실은 Taq 중합효소에 의해 티민으로 인식되고, 신장 단계 후에(및 선택적으로 증폭 단계), 얻어진 생성물은 DNA 주형이 비메틸화된 시토신을 가진 경우에 상기 위치에 티민을 포함하고 DNA 주형이 5-메틸시토신을 가진 경우에 상기 위치에 시토신을 포함한다.
상기 표현 "DNA 가닥을 합성하는 것"은 상기 가닥 합성이 일어나는 조건에서 주형으로 사용된 어댑터-변형 DNA 분자에 상보적인 DNA 분자의 합성을 의미한다.
상기 용어 "주형"은 새로운 가닥의 유전적 서열을 결정하는 DNA 가닥을 의미한다.
상기 표현 "가닥 합성이 일어나는 조건하에서"는 (i) 단계에서 사용된 이중 가닥 DNA 분자의 센스 및 안티센스 가닥을 포함하는 영역내에서 상보적인 염기간의 수소결합이 끊어질 수 있는 조건을 의미한다. 상기 조건은 만약 상기 가닥 쌍이 헤어핀 분자에 의해 얻어진 경우 (i) 단계 후 얻어진 어댑터-변형 DNA 분자의 선형화된 형태로 만드는 조건, 또는 가닥 변위 DNA 중합효소(strand displacement DNA polymerases) 같은 등온 기술을 사용하는 조건을 포함하는 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥을 포함하는 영역의 분리에 적합한 조건이고 이에 제한되는 것은 아니다.
상기 영역의 분리에 적합한 조건은 각 영역이 분리될 수 있는 조건으로, 예를 들면, 상기 분자를 상보적인 염기간의 수소 결합을 끊을 수 있는 20초 내지 2분간 94-98℃로 가열하는 것이다. 상기 영역의 분리는 또한 등온 기술을 사용함으로써 예를 들면, Phi29 DNA 중합효소 또는 Bacillus stearothermophilus DNA 중합효소의 큰 단편과 같은 가닥 변위 DNA 중합효소를 사용함으로써 분자의 가열없이 일어날 수 있고 이에 제한되는 것은 아니다.
또한, (i) 단계에서 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(바람직하게는 우라실)로 전환시킬 수 있는 시약으로 처리되고. 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥간의 상보성은 부분적으로 또는 완전히 상실된다. 특히 상기 가닥 중 하나가 비메틸화 시토신 및 메틸화되지 않은 시토신을 가진 경우, 이것은 또한 상보적 가닥의 합성을 용이하게 할 수 있다.
상기 용어 "프라이머"는 다른 핵산내의 서열과 상보적이고 DNA 합성 시작 지점의 역할을 하는 짧은 핵산 가닥을 의미한다. 바람직하게는 상기 프라이머는 적어도 2, 적어도, 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 18, 적어도 20, 적어도 25, 적어도 30 또는 이상의 염기를 가진다.
상기 용어 "상보적인"은 예를 들면, 이중 가닥 DNA 분자의 양 가닥간 또는 올리고뉴클레오타이드 프라이머와 단일 가닥 핵산의 프라이머 결합부위간 또는 올리고뉴클레오타이드 프로브와 DNA 분자내 그것의 상보적 서열간과 같은 뉴클레오타이드와 핵산간의 결합을 형성하도록 하는 염기 쌍을 의미한다. 일반적으로 상보적 뉴클레오타이드는 A 및 T(또는 A 및 U), 또는C 및 G이다. 최적으로 정렬되고 비교되고 적당한 뉴클레오타이드 삽입 또는 결실을 가진 한 가닥의 뉴클레오타이드가 다른 가닥의 약 60 %, 적어도 70 %, 적어도 80 % 적어도 85 %, 약 95 %의 통상 약 90 % 이상, 심지어는 약 98 % 내지 약 100 %와 쌍을 이룰 때, 두 개의 단일 가닥 DNA 분자는 실질적으로 상보적이라고 본다.
두 뉴클레오타이드 영역간의 상동성 정도는 컴퓨터에서 수행되는 알고리즘 및 기술 분야의 통상의 기술자에게 널리 알려진 방법을 통해 측정된다. 두 뉴클레오타이드 서열간의 상동성은 바람직하게는 BLASTN 알고리즘을 사용하여 측정된다(BLAST Manual, Altschul, S. et al., NCBI NLM NIH Bethesda, Md. 20894, Altschul, S., et al., J., 1990, Mol. Biol. 215:403-410).
상기 프라이머는 어댑터 분자의 서열(및 바람직하게는 (ii) 단계에서 시약, 바람직하게는 바이설파이트로 처리한 후, 그것으로부터 유래된 서열)과 낮은 엄격 조건(low stringency conditions), 바람직하게는 중간 엄격 조건(medium stringency conditions), 가장 바람직하게는 높은 엄격 조건(high stringency conditions)에서 혼성화할 수 있다. 이미 상술한 바와 같이, (iii) 단계 및 이 경우라면, (iv) 단계에서 사용된 상기 프라이머는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약(예, 바이설파이트)으로 처리한 후의 상기 어댑터 분자에 특이적이다.
"혼성화"는 두 개의 단일 가닥 폴리뉴클레오타이드가 비공유결합하여 안정적인 이중 가닥 폴리뉴클레오타이드를 형성하는 과정을 의미한다. "혼성화 조건"은 일반적으로 약 1 M 또는 이하, 더 일반적으로 약 500mM이하의 염 농도를 포함할 것이고 약 200mM이하일 수 있다. "혼성화 버퍼"는 5% SSPE, 또는 해당 분야에서 잘 알려진 다른 버퍼와 같은 완충 염 용액이다. 혼성화 온도는 5℃만큼 낮을 수 있지만, 일반적으로 22℃보다 높고, 그리고 더 일반적으로 30℃보다 높고, 그리고 일반적으로 37℃를 초과한다. 혼성화는 염격한 조건, 즉, 프라이머가 그것의 목적서열에만 혼성화되고 다른 것, 비상보적 서열에는 혼성화되지 않는 조건에서 수행된다. 엄격한 조건은 서열 의존적이고 다른 환경과 다르다. 예를 들면, 더 긴 단편은 짧은 단편보다 혼성화에 더 높은 온도를 요구할 수 있다. 염기 조성 및 상보적 가닥의 길이, 유기용매의 존재 및 염기 부정합의 정도를 포함하는 다른 요소가 혼성화의 엄격성에 영향을 줄 수 있기 때문에, 상기 파라미터들의 조합이 어떤 하나의 파라미터만의 절대적인 측정보다 더 중요하다. 일반적으로 엄격한 조건은 정해진 이온세기 및 pH에서 특정 서열에 대한 Tm보다 약 5℃ 낮은 범위에서 선택된다. 예시적인 엄격한 조건은 약 7.0 내지 약 8.3의 pH에서 1 M 이하의 나트륨 이온 농도(또는 다른 염)로 적어도 0.01 M 의 염 농도 및 적어도 25℃의 온도를 포함한다.
이에 따라, 상기 변환된 짝지어진 어댑터-변형 DNA 분자는 기술 분야에서 잘 알려진 방법(예, DNA 중합효소 및 dNTPs에 의한 신장/확장)에 의해 이중 가닥 DNA 분자(하나 또는 경우에 따라 짝짓기 형태(물리적 또는 바코드 서열에 의한)에 따라 두 개의 분리된 단일 가닥 분자일 수 있다)로 전환되어 부분적으로 변환된(상기 원래 가닥은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(바람직하게는 우라실)로 변환시킬 수 있는 시약으로 처리함으로써 영향을 받을 수 있지만, 새로운 것이 생성되는 것은 아니다)짝지어진 이중 가닥 DNA 분자를 제공한다.
(ii) 단계에서 회수된 상기 짝지어지고 변환된 어댑터-변형 DNA 분자는 두 개의 헤어핀 분자 및/또는 두 개의 바코드 서열에 접합된 이중 가닥 DNA 분자를 포함할 수 있다(예를 들면, 회수 또는 정제 단계가 일어나지 않았다면). 그러나, 상기 헤어핀 분자/바코드 서열 내에는 (iii) 단계에서 사용된 상기 프라이머의 목적 서열이 없기 때문에, 상기 분자들은 이중 가닥 DNA 분자로 전환될 수 없다. 도 2는 상기 이중 가닥 DNA 분자의 한 말단에 접합된 하나의 어댑터를 가지는 접합생성물만이 신장되고 증폭된다. 본 발명의 방법의 신장 단계를 나타낸다.
(ii) 단계 후, 또는 (iii) 단계 후 또는 (iv) 단계 후에 얻어진 상기 구조물은 본 발명의 이중 가닥 DNA 라이브러리를 형성하고 시퀀싱 또는 다른 일반적인 분자생물학 기술에 사용될 수 있다.
(iii) 단계는 또한 "신장 단계"로 지칭될 수 있다.
(iv) 단계 (또는 "증폭 단계"로 지칭됨)
선택적으로, 상기 구조물은 다음 단계를 위해 재료의 양을 증가시키기 위해 증폭될 수 있다. 바람직한 일 실시예에서, (iii) 단계에서 얻은 상기 이중 가닥 DNA 분자는 상기 어댑터 영역의 적어도 일 부분과 상보적인 서열을 가지는 프라이머를 이용하여 증폭된다((iv) 단계에서 사용된 상기 프라이머는 상술한 바와 같이, (ii) 단계의 시약으로 처리한 후에 어댑터 분자에 특이적이다).
따라서, 선택적인 네번째 단계에서, 본 발명의 방법은 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자를 증폭하는 단계를 포함하고 증폭된 짝지어진 이중 가닥 DNA 분자를 제공한다.
상기 DNA 증폭은 이중 가닥 DNA 분자의 시험관내 합성에 의해 상기 분자들의 많은 복제물의 생산을 가능하게 한다. DNA 증폭에는 어떠한 방법도 제한없이 사용될 수 있다. 또 다른 실시예에서, 다른 프로브(예, LightCycler, Taqman, Escorpio, Sunrise, Molecular Beacon 또는 Eclipse)를 사용하여 실시간-PCR(real time-PCR)에 의해 수행될 수 있다. 다른 증폭 조건은 발생할 수 있는 바이어스를 극복하기 위해 동일한 시료의 분취(aliquots)가 사용될 수 있다.
본 발명의 방법에 의해 얻어진 상기 이중 가닥 DNA 분자는 반응혼합물로부터 회수될 수 있다("회수 단계" 또는 "정제 단계"). 그러므로, 바람직하게는, (iii) 단계, 또는 경우에 따라 (iv) 단계에서 얻어진 상기 DNA 분자는 반응혼합물로부터 회수된다. 더 바람직하게는, 상기 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, (iii) 단계, 또는 경우에 따라 (iv) 단계에서 사용된 상기 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
선택적으로, 상기 원래 복수의 이중 가닥 DNA 분자들은 회수될 수 있다. (i) 단계에서 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 신장 및 증폭 단계에서 원래 주형의 역할을 한다. 상기 원래 주형은 과정중에 파괴되지 않고 보전되어 재사용될 수 있거나 다음 과정을 위해 저장될 수 있다. 이러한 목적을 달성하기 위해, 상기 원래 주형은 변환된 어댑터/헤어핀 서열/바코드 서열로 표지될 수 있다. 따라서, 바람직한 일 실시예에서, (i) 단계에서 얻은 상기 짝지어진 어댑터-변형DNA 분자는 (iii) 단계 또는, 경우에 따라 (iv) 단계 후에 얻은 반응 혼합물로부터 회수된다. 더 바람직한 일 실시예에서, 상기 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, 상기 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열은 상기 결합 쌍의 두 번째 구성으로 변형된다.
상기 용어 "반응 혼합물(reaction mixture)"은 (iii) 단계 및/또는 (iv) 단계가 일어난 후 얻어진 혼합물을 의미한다. 상기 반응 혼합물은 시약, 주형으로 사용된 짝지어진 어댑터-변형 DNA 분자, 미반응 짝지어진 어댑터-변형 DNA 분자 및 이중 가닥 DNA 라이브러리를 형성하는 상기 분자를 포함하는 반응 생성물의 조합에 의해 형성된다.
상기 용어 "결합 쌍(binding pair)"은 첫 번째 구성과 두 번째 구성에 의해 생성된 짝을 의미하고 예를 들면, 항원/항체(digoxigenin/anti-digoxigenin 항체) 또는 합텐/항-합텐 시스템(hapten/anti-hapten systems )과 같은 면역형 결합 쌍; 예를 들면, 비오틴/아비딘(biotin/avidin), 비오틴/스트렙타비딘(biotin/streptavidin), 폴산/폴산 결합 단백질(folic acid/folate binding protein), 상보적인 핵산 분절, 단백질 A 또는 G/면역글로불린(protein A or G/immunoglobulins)과 같은 상기 두 구성이 서로 자연 친화력을 공유하지만 항체는 아닌 비 면역형 결합 쌍; 및 예를 들면, 말레이미드(maleimides) 및 할로아세틸 유도체(haloacetyl derivatives)와 같은 설피드릴 반응기(sulfhydryl reactive groups)와 이소티오시아네이트(isothiocyanates), 숙시니미딜 에스테르(succinimidyl esters) 및 설포닐 할라이드(sulfonyl halides) 등과 같은 아민 반응기(amine reactive groups)와 같은 서로 공유 결합을 형성할 수 있는 공유 결합쌍을 포함한다.
(iii) 단계 또는 (iv) 단계에서 사용된 상기 프라이머의 서열 또는 어댑터의 서열 및/또는 헤어핀 서열 및/또는 바코드 서열은 결합 쌍의 두 번째 구성에 표지된 염기를 도입함으로써 설계될 수 있다(예, digoxigenin, biotin등). 상기 도입된 표지된 염기는 임의로 지지체에 결합된 상기 결합 쌍의 첫 번째 구성과 같이 그들의 복합체로 사용될 수 있다.
(iii) 단계 및 이 경우라면, (iv) 단계에서 사용된 상기 프라이머는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약(예, 바이설파이트)으로 처리한 후에 상기 어댑터 분자에 특이적이다. 상기 용어 "특이적인"은 상기 분자들이 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(예, 우라실)로 전환시킬 수 있는 시약으로 처리된 경우 상기 프라이머가 어댑터 분자에만 혼성화할 수 있는 것을 의미한다. 바람직하게는 상기 프라이머는 상기 전환을 거치기 전에는 어댑터 분자에 혼성화 할 수 없다. 상기 어댑터 분자가 메틸화되지 않은 시토신을 포함하고 있는 경우, (iii) 단계 및/또는 (iv) 단계에서 사용된 상기 프라이머는 원래 어댑터 분자의 메틸화되지 않은 시토신과 짝을 이루는 위치에 구아닌 염기 대신에 아데닌을 가진다. 상기 어댑터 분자는 메틸화되거나 메틸화되지 않은 시토신을 포함할 수 있다. 임의적으로, 상기 시약을 처리한 후 상기 어댑터 분자의 서열, 헤어핀 서열 및/또는 바코드 서열의 특정 부분이 변경되는 것을 피하기 위해 첫 번째 어댑터 분자의 서열, 바람직하게는 어댑터 내의 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성의 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약 처리에 내성이 있는 변형된 시토신을 포함할 수 있다.
상기 용어 "변형된 시토신"은 메틸화되지 않은 시토신을 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리하여 혼성화 특성의 관점에서 시토신과 유사하지 않은 염기로 변환될 수 없는 변형된 시토신을 얻기 위해 하나 또는 이상의 원자 및 잔기의 대체 또는 첨가에 의해 변형된 시토신 염기를 의미한다. 상기 어댑터 서열 및 바람직하게는 본 발명의 상기 어댑터의 조합 서열, 헤어핀 서열 및/또는 바코드 서열에 적합한 변형된 시토신의 예로는 메틸시토신(methylcytosine) 및 5-하이드록시메틸시토신(5-hydroxymethylcytosine)이 있고 이제 제한되는 것은 아니다. 상기 변형된 시토신은 시약 처리 후에 변하지 않고 그대로이거나 바이설파이트 처리하면 구아닌과 상보적인 염기로 전환되어 중합효소 증폭 및 시퀀싱시에 시토신으로 읽히기 때문에 시약 처리에 저항성이 있다(예, 5-하이드록시메틸시토신은 시토신-5-메틸설포네이트로 전환된다)
그 다음, (iii) 단계 및/또는 (iv) 단계에서 얻은 상기 짝지어진 DNA 분자(및/또는, 선택적으로 덜 바람직하게는, (ii) 단계에서 얻은 짝지어진 DNA 분자)는 서열이 결정된다(명세서 하단의 "서열 결정 단계" 참고).
상기 지정 위치에 메틸화된 시토신의 존재는, 시토신이 상기 (iii) 단계 또는 (iv) 단계에서 얻은 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되고, 그리고/또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는, 우라실 또는 티민이 상기 (iii) 단계 또는 (iv) 단계에서 얻은 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정된다.
이것은 이하 "메틸화된 시토신의 확인" 부분에서 더 자세히 설명한다.
본 발명에 따른 방법의 첫 번째 실시예
본 발명의 방법은 고체지지체 상에서 수행될 수 있다. 특히, 상기 이중 가닥 어댑터, 헤어핀 서열 및/또는 바코드 서열은 지지체에 고정되어 제공될 수 있다. 고체 지지체가 사용되는 경우, 시퀀싱 장비로 자동화 및 높은 수준의 시료 보존(시료 영속)이 기대된다.
상기 고정화는 바람직하게는 이중 가닥 어댑터, 헤어핀 서열 및/또는 바코드 서열 중 하나의 말단을 상기 지지체에 결합시켜 수행된다. 바람직하게는, 상기 이중 가닥 어댑터, 헤어핀 서열 및/또는 바코드 서열 중 하나의 말단은 상기 지지체에 결합된다. 따라서, 이중 가닥 어댑터, 헤어핀 서열 및/또는 바코드 서열이 지지체에 고정될 때, 접합의 정도가 결정되므로 특정 어댑터/헤어핀 서열 또는 바코드 서열은 DNA 분자의 특정 말단에 접합된다.
상기 이중 가닥 어댑터 분자, 헤어핀 서열 및/또는 바코드 서열이 지지체에 고정되면, (i) 단계에서 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 지지체에 부착된 채로 있기 때문에 상술한 바와 같은 원래 DNA 주형을 회수하는 단계가 필요 없다.
추가적으로, 상기 어댑터 분자가 지지체에 고정된다면, (i) 단계에서 얻은 모든 짝지어진 어댑터-변형 DNA 분자는 어댑터 분자의 한 말단에 접합된 이중 가닥 DNA 분자이고 상기 짝짓기가 헤어핀 분자의 존재 하에게 일어나는 경우에는 헤어핀 서열 및 선택적으로 바코드 서열의 다른 말단에 접합된 이중 가닥 DNA 분자이다. 상기 짝짓기가 헤어핀 서열의 부존재 하에서, 즉, 바코드 서열 존재하에서 일어나는 경우, (i) 단계에서 얻은 상기 짝지어진 어댑터-변형 DNA 분자는 추가적으로 적어도 하나의 바코드 서열의 포함하는 어댑터 분자의 모든 말단에 접합된 이중 가닥 DNA 분자이다. 그러므로, 상기 어댑터 서열의 한 말단과 헤어핀 서열 및/또는 바코드 서열 및/또는 어댑터 서열의 다른 말단을 포함하는 분자들(상술한 바와 같이, A)에 의한 분자들)을 (i) 단계에서 얻은 분자 집단으로부터 회수하는 것이 필요하지 않다.
또한, 본 발명의 이 실시예에서, 상기 이중 가닥 어댑터 헤어핀 서열 및/또는 바코드 서열은 지지체에 고정화되어 제공되고, (i) 단계의 짝짓기는 지지체의 이미 지정된 위치에 상기 이중 가닥 어댑터를 위치시킴으로써 수행될 수 있다.
상기 용어 "지지체(support)"는 핵산과 화학적으로 결합을 형성하는 물질을 의미하고 플라스틱, 라텍스, 유리, 금속(예, 전도성 금속), 나일론, 니트로셀룰로오스, 쿼츠, 실리콘 또는 세라믹을 포함하고 이에 제한되는 것은 아니다. 상기 지지체는 바람직하게는 고체이고 거의 구형(예, 비드(bead))이거나 마이크로웰 플레이트(microwell plate) 또는 표면과 같은 표준 실험실 용기(standard laboratory container)를 포함할 수 있다.
상기 용어 "고정화된(immobilized)"은 신장, 증폭, 절단 및 상술된 다른 공정의 조건 하에서 안정적인 연결을 제공하는 방식으로 상기 분자(예, 어댑터, 헤어핀 서열, 바코드 서열)와 상기 지지체간의 연결 또는 결합을 의미한다. 그러한 결합은 공유결합 또는 비공유결합이 될 수 있다. 비공유 결합은 전기적, 친수성 및 소수성 결합을 포함한다. 공유 결합은 원자간의 전자쌍을 공유하는 것을 특징으로 하는 공유결합의 형성이다. 상기 공유결합은 상기 어댑터 및 상기 지지체간에 직접 일어나거나 교차 결합에 의해 형성되거나 상기 지지체 또는 상기 어댑터 또는 두개 모두에 특이적 반응기를 포함시켜 형성될 수 있다. 어댑터의 공유결합은 아비딘 또는 스트랩타비딘과 같은 지지체에 고정된 결합 파트너 및 상기 아비딘 또는 상기 스트랩타비딘에 대한 비오틴 결합된 어댑터의 비공유 결합을 이용하여 달성될 수 있다. 고정화는 또한 공유 및 비공유 결합의 조합을 포함할 수 있다.
상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 먼저 합성된 다음 지지체에 부착될 수 있다. 또한, 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열은 지지체에서 직접 합성될 수 있다. 바람직하게는, 상기 고정화는 상기 어댑터, 헤어핀 서열 및/또는 바코드 서열 또는 상기 헤어핀 고리의 뉴클레오타이드 중 하나의 말단이 상기 지지체에 공유결합함으로써 수행될 수 있다.
바람직하게는, 상기 어댑터는 지지체에 부착되지만 상기 헤어핀 서열 및/또는 바코드 서열은 상기 지지체에 부착되지 않는다. 이 실시예에서, 상기 지지체에 부탁된 각 어댑터 분자는 이웃 어댑터 분자로부터 충분히 분리되어 하나의 이중 가닥 DNA 분자가 이러한 어댑터 두 개와 접합되는 것을 막을 수 있다. 본 발명의 방법 (i) 단계에 따라, 실시예에서 상기 복수의 이중 가닥 DNA 분자들은 지지체에 부착된 상기 어댑터 분자와 접촉하고 단 하나의 어댑터만이 각각의 이중 가닥 DNA 분자에 접합될 수 있다. 그 후, 상기 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열은 상기 이중 가닥 DNA 분자의 자유말단에 접합될 수 있다.
또한, 상기 헤어핀 서열 및/또는 바코드 서열은 지지체에 부착될 수 있지만 상기 어댑터 분자는 상기 지지체에 부착될 수 없다. 이 실시예에서, 상기 지지체에 부탁된 각 헤어핀 서열 및/또는 바코드 서열은 이웃 헤어핀 서열 및/또는 바코드 서열로부터 충분히 분리되어 하나의 이중 가닥 DNA 분자가 이러한 분자들 두 개와 접합되는 것을 막을 수 있다. 예를 들면, 상기 처음의 복수의 이중 가닥 DNA 분자들은 지지체에 부착된 헤어핀 서열 및/또는 바코드 서열과 접촉할 수 있고 단 하나의 헤어핀 서열 및/또는 바코드 서열만이 각 이중 가닥 DNA 분자에 접합될 수 있다. 그 후, 상기 어댑터 분자는 지지체에 부착된 상기 이중 가닥 DNA 분자의 자유말단에 접합된다(만약 상기 헤어핀이 지지체에 부착되고 상기 이중 가닥 DNA 분자의 다른 말단과 접합된다면). 이 경우 상기 짝짓기는 단지 바코드 서열(헤어핀 서열 부존재하에서)에 의해 일어나고 상기 바코드 서열은 지지체에 부착되고, 상기 부착된 바코드 서열에 어댑터가 접합되어야 한다. 그 다음, 상기 이중 가닥 DNA 서열은 상기 어댑터에 접합되어야 한다. 마지막으로, 다른 어댑터 분자는 상기 이중 가닥 DNA 분자의 자유 말단에 접합된다.
또한, 상기 어댑터 분자 및 상기 헤어핀 서열 및/또는 바코드 서열은 지지체에 부착될 수 있다. 따라서 상기 짝짓기는 단지 바코드 서열 존재하에서만 일어나는 경우(헤어핀 서열의 부존재하에서), 즉 상기 이중 가닥 DNA 분자가 두 개의 어댑터, 상기 이중 가닥DNA 분자의 각 말단 중 하나에 접합되는 경우에 두 개의 동일한 어댑터가 아닌 두 개의 동일한 분자에 이중 가닥 DNA 분자가 접합되는 것을 막기 위해 추가 조치가 요구된다.
고체 지지체에서 본 발명의 방법을 수행하는 경우에 장점은 다음과 같을 수 있다(예, 상술한 바와 같이, 고체 지지체에 상기 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열을 고정화시킴으로써):
- 접합 방향을 조절할 수 있어서 원하지 않는 접합이 발생하지 않는다(예, 두 개의 헤어핀 서열 등을 가지는 분자). 또한, 원래 복수의 이중 가닥 DNA 분자들이 고체 지지체에 고정되어서 시작 물질의 감소가 없다.
- 또한, 반응은 유세포(flow cell)에서 수행될 수 있다. 반응이 일어난 후(예, 접합, 변형, 상보적 가닥의 생성), 상기 원래 물질은 저장되어 재사용될 수 있다(지지체에 부탁되어 있기 때문에). 상기 유세포는 공정의 자동화 및 단순화를 가능하게 하는 NGS(next generation sequencing) 장치(및 브릿지 증폭(bridge amplification) 또는 시퀀싱 반응과 같은 특정 반응이 상기 유세포 자체에 대해 수행될 수 있다)와 접목할 수 있다.
상술한 바와 같이, 지지체에 고정되는 과정의 마지막에 상기 이중 가닥 DNA 어댑터의 접합 및 상기 복수의 이중 가닥 DNA 분자들의 가닥들을 짝지은 후, 상기 (ii) 단계에서 상술한 바와 같이, 상기 짝지어진 어댑터-변형 DNA 분자의 모든 가닥에 있는 메틸화되지 않은 시토신은 상기 짝지어진 어댑터-변형 DNA 분자내에서 시토신과 유사하지 않은 염기(바람직하게는 우라실)로 전환된다.
그 다음, 부분적으로 변환되고 짝지어진 이중 가닥 분자를 제공하기 위해 짝지어지고 변환된 어댑터-변형 DNA 분자의 상보적 가닥을 뉴클레오타이드 A, C, G 및 T와 상기 이중 가닥 DNA 어댑터의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 사용하여 얻을 수 있다(바람직하게는, 상술한 바와 같이, (ii) 단계의 시약으로 처리된 후 상기 프라이머는 어댑터 분자에 특이적이다).
본 발명의 이 실시예에서 상보적 가닥((iii) 단계)을 제공하는 이 단계는 지지체에 부착된 상기 짝지어지고 변환된 어댑터-변형 DNA 분자로 수행될 수 있고, 가닥 합성이 일어날 수 있는 조건하에서 수행된다.
바람직하게는, 현재 실시예에서((iii) 단계) 사용되는 상기 프라이머는 지지체에 부착되지 않는다. 이 실시예에서 지지체에 고정되어 제공되는 상기 어댑터 분자 집단을 나타내는 개략도를 도3 및 4에 도시하였다. 상기 주형 가닥은 지지체에 부착된 채로 남아있고 신장 생성물이 상층액으로 방출된다. 그러므로, 이 실시예에서, 이중 가닥 DNA 라이브러리는 상층액으로 방출된다. 선택적으로, (iv) 단계는(부분적으로 변환되고 짝지어진 이중 가닥 분자를 선택적으로 증폭하는 단계) 상기 반응 혼합물로부터 회수되기 전 또는 후에 상층액에 있는 상기 분자로 수행될 수 있다. 지지체에 부착된 그러한 어댑터 또는 상기 어댑터-변형 DNA 분자는 본 방법의 여러 단계에서 지지체로부터 방출될 수 있다.
(iii) 단계에서 사용된 상기 프라이머는 또한 지지체에 선택적으로 부착될 수 있다. 이 경우, 상기 주형 및 신장 생성물이 지지체에 부착된 채로 남아있다. 그러므로, 이 경우, 상기 이중 가닥 DNA 라이브러리는 지지체에 부착된다. 지지체에 부착된 상기 어댑터, 프라이머 및/또는 상기 어댑터-변형 DNA 분자는 본 발명의 현재 실시예의 여러 단계에서 상기 지지체로부터 방출될 수 있다.
(iv) 단계는 지지체에 부착되어 있는 분자들 또는 지지체로부터 방출된 후의 상층액에 있는 분자들로 선택적으로 수행될 수 있다.
선택적인 증폭 단계((iv) 단계)에서 사용된 프라이머는 바람직하게는 지지체에 부착되지 않는다. 그러나, (iv) 단계에서 사용된 하나 또는 각 프라이머 모두는 지지체에 부착될 수 있다. (iv) 단계에서 사용된 각 프라이머 모두가 지지체에 부착된 경우, 브릿지 증폭(bridge amplification)(등온일 수 있는)이 일어날 수 있다. 이 브릿지 증폭은 시퀀싱 프로토콜, 특히 NGS(next generation sequencing)를 의무화하는 폴로니(polonies), 즉, 복제 클러스트 증폭산물(clonally clustered amplicons)을 야기할 수 있다.
이 실시예는 지지체에 결합된 주형을 회수하는 것이 가능하므로 시료 영속을 증가시킨다. 주형에 부착된 상기 지지체는 시료의 저장에도 사용될 수 있다. 상기 주형은 발생할 수 있는 바이어스를 방지하기 위해 다른 조건으로 다른 증폭에 사용될 수 있다. 상기 원래 주형의 회수는 결합 쌍을 기반으로 하는 재포집 단계를 필요로 하지 않는다. 그러므로, 이 실시예는 특히 제한된 양의 시료에 적합하다. 재포집 단계가 필요하지 않지만, (i) 단계 또는 (ii) 단계에서 얻은 상기 DNA 분자는 지지체로부터 방출될 수 있고 (iii) 단계 또는, 경우에 따라, (iv) 단계 후에 얻어진 반응 혼합물로부터 회수될 수 있다. 바람직하게는, 반응 혼합물로부터 상기 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되는데, 상기 어댑터 및/또는 헤어핀 서열 및/또는 바코드 서열은 상기 결합 쌍의 두 번째 구성으로 변형된다.
(i) 단계에서 얻은 상기 DNA 분자는 또한 시퀀싱에 사용될 수 있다.
바람직하게는, (i) 단계에서 사용된 상기 이중 가닥 DNA 분자는 게놈 DNA(genomic DNA)의 단편이다. (i) 단계에서 사용된 상기 이중 가닥 DNA 분자는 상기 (i) 단계 전에 선택적으로 말단-수정되고, 바람직하게는 상기 말단-수정 단계 후에 상기 DNA 분자를 dA-tailing하는 단계를 더 포함한다. 상기 어댑터 분자 및/또는 헤어핀 분자 및/또는 바코드 분자는 분자 라이브러리로 제공될 수 있고, 상기 라이브러리의 각 구성은 상기 분자 서열 내의 조합 서열에 의해 다른 것과 구별된다. (i) 단계 후, 상기 어댑터-변형 DNA 분자 집단은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리되고 본 발명의 방법의 (iii) 단계 또는 선택적으로 (iv) 단계에서 사용된 프라이머는 상기 시약으로 처리된 후(본 발명의 방법의 (ii) 단계) 상기 어댑터 분자에 특이적이다. 상기 어댑터 서열 및/또는 헤어핀 서열 및/또는 바코드 서열내의 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리하는 것에 저항성을 가지는 변형된 시토신을 포함할 수 있다. 그들은 메틸화되지 않은 시토신을 포함하지 않을 수 있다. 선택적으로, (iii) 단계 또는, 경우에 따라, 본 발명의 두 번째 방법의 (iv) 단계에서 얻은 DNA 분자는 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 반응 혼합물로부터 회수되고, (iii) 단계 또는, 경우에 따라, 본 발명의 방법의 (iv) 단계에서 사용된 상기 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다. DNA 분자 내에 점착성 말단을 도입함으로써 상기 어댑터 분자와 상기 DNA 분자의 접합에 적합한 조건아래에서 이중 가닥 DNA 분자들 집단은 어댑터 분자로 (i) 단계 전에 처리될 수 있다.
본 발명에 따른 방법의 두 번째 실시예
본 발명의 방법의 두 번째 실시예에서, 복수의 이중 가닥 DNA 분자들의 가닥들의 적어도 하나의 말단과 접합된 이중 가닥 DNA 어댑터(본 발명의 방법의 (i) 단계)는 "Y"형태를 가지고 "Y 어댑터"로 지칭된다.
본 실시예에서 상기 용어 "Y-어댑터(Y-adapter 및 Y-adaptor)"는 두 개의 DNA 가닥에 의해 형성된 어댑터를 의미하는데, 상기 첫 번째 DNA 가닥의 3' 영역과 상기 두 번째 DNA 가닥의 5' 영역이 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단은 상기 이중 가닥 DNA 분자의 말단과 호환가능하다. 상기 표현 "3' 영역"은 상기 가닥의 3' 말단을 포함하는 뉴클레오타이드 가닥의 영역을 의미한다.
상기 용어 "3' 말단"은 그것의 마지막 데옥시리보오스 당고리내 세번째 탄소에 수산화기를 가지고 있는 뉴클레오타이드의 말단을 나타낸다.
상기 표현 "5' 영역"은 상기 가닥의 5' 말단을 포함하는 뉴클레오타이드 가닥의 한 영역을 의미한다.
상기 용어 "5' 말단"은 그것의 마지막 데옥시리보오스 당 고리내 5번 탄소를 가지는 뉴클레오타이드의 말단을 나타낸다.
상기 표현 "서열 상보성"은 두 핵산 서열이 서로 역평행하게 정렬되는 경우, 각 위치에 뉴클레오타이드 염기들이 상보적으로 되는 경우에 상기 두 핵산 서열간에 공유되는 특성을 의미한다
이 두 번째 실시예에 따라 본 발명의 방법의 (i) 단계에 따라 얻은 복수의 짝지어진 어댑터-변형 DNA 분자는 하기 단계에 의해 얻어진다:
(a) DNA Y-어댑터를 복수의 이중 가닥 DNA 분자들의 가닥의 각 말단에 접합시키는 단계로, 상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 상기 이중 가닥 DNA 분자들의 말단들과 호환가능하고; 그리고
(b) 주형으로 (a) 단계에서 얻은 DNA 분자들의 각 가닥들을 사용하여 Y-어댑터 분자내에서 상기 두 번째 DNA 가닥의 3' 말단으로부터 중합효소 신장에 의해 상기 (a) 단계에서 얻은 DNA 분자들의 각 가닥들에 대한 상보적인 가닥을 합성하는 단계로, 이에 의해 상기 (a) 단계에서 얻은 DNA 분자들의 각 가닥들과 그것의 합성 상보 가닥을 짝지어 복수의 짝지어진 어댑터-변형 DNA 분자를 제공하는 단계.
바람직하게는, 상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하고, 상기 첫 번째 분절은 3' 영역의 3' 말단에 위치하고 상기 두 번째 분절은 5' 영역 부근에 위치한다.
선택적으로, Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 3' 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하지 않는다.
본 실시예에 따라, 본 발명의 방법의 (i) 단계의 짝짓기 단계는 물리적(Y-어댑터 내에 헤어핀 서열이 존재하는 경우, 원래 DNA 가닥과 그것의 합성 상보적인 가닥이 물리적으로 결합될 수 있다)으로 일어나거나 또한, Y 어댑터 내(이중 가닥 영역 및/또는 각각의 단일 가닥 영역, 또는 세 영역 모두 중 어느 영역내) 바코드 서열이 존재하고 헤어핀 서열이 존재하지 않는 경우, 원래 DNA 가닥과 그것의 합성 상보적인 가닥은 물리적으로 결합되지 않지만 적어도 하나의 바코드 서열 존재하에서 일어날 수 있고, 또한, 모두(헤어핀 서열 및 하나 또는 이상의 바코드 서열) 존재하에서 일어날 수 있다.
따라서, 한 측면에서, 상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하고, 상기 첫 번째 분절은 3' 영역의 3' 말단에 위치하고 상기 두 번째 분절은 5' 영역부근에 위치한다.
이러한 측면에서, (a) 단계에서 얻은 상기DNA 분자의 각 가닥들은 물리적으로 그것의 합성 상보적인 가닥과 짝지어져(적어도 하나의 헤어핀 분자에 의해) 짝지어진 어댑터-변형 DNA 분자를 제공한다.
상기 용어 "헤어핀 고리(hairpin loop)"는 DNA 가닥이 접혀 다른 부분 또는 같은 가닥의 분절과 염기쌍을 이룰 때 형성되는 짝지어 지지 않은 염기들에 형성된 DNA 영역을 의미한다.
상기 용어 "혼성화"는 안정된 이중 가닥 폴리뉴클레오타이드를 형성하기 위해 두 단일 가닥 폴리뉴클레오타이드 또는 같은 가닥의 두 영역이 비공유적으로 결합되는 과정을 의미한다.
따라서, 본 측면은 이중 가닥 DNA 라이브러리를 얻을 수 있고 DNA 분자의 상기 원래 센스 및 안티센스 가닥은 서로 물리적으로 결합된다. DNA 분자의 각 원래 가닥은 합성 확장에 의해 얻은 상보적인 가닥과 물리적으로 결합된다. 이 실시예의 모식도는 도 5 및 6에 나타내었다.
상기 용어 “DNA 라이브러리”는 관심있는 DNA 단편을 확인하고 분리하기 위해 어댑터 분자에 접합되는 DNA 단편의 집합을 의미한다.
본 측면에서 상기 표현 “이중 가닥 DNA 라이브러리”는 합성 확장으로 얻은 상보적 가닥에 그들의 말단 중 하나에 의해 물리적으로 연결된 DNA 분자의 원래 가닥들 중 하나를 포함하는 라이브러리를 의미한다. 본 발명의 세번째 방법의 이중 가닥 DNA 라이브러리는 원형 라이브러리가 아니다. DNA 분자의 원래 DNA가닥과 그것의 합성 상보적인 가닥은 그들의 말단 중 하나 및 고리에 의해 물리적으로 결합되어 그들간의 이중 가닥을 형성한다(도 12 참고). 본 발명의 방법의 두 번째 실시예의 본 측면에서, DNA 분자의 각 원래 DNA 가닥과 그것의 합성 상보적인 가닥은 헤어핀 고리에 의해서 짝지어져 물리적으로 결합된다. 이중 가닥 DNA 라이브러리의 각 분자는 또한 각 가닥간의 상보성이 부분적이거나 완전히 상실된 경우에 선형의 형상을 가질 수 있다.
본 발명의 방법의 두 번째 실시예의 다른 측면에서, 상기 짝짓기는 Y 어댑터 내 적어도 하나의 바코드 서열의 존재하에서 수행된다(단일 가닥 영역 내 및/또는 이중 가닥 영역 내 또는 각 모든 영역 내 중 어느 영역 내). 이 측면에 따라, Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역 내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하지 않는다. 이 경우, DNA 분자의 각 원래 DNA 가닥과 그것의 합성 상보적인 가닥은 Y-어댑터의 이중 가닥 영역 내 또는 Y-어댑터의 단일 가닥 영역 내 또는 원래 DNA 가닥 어디에서나 바코드 서열의 존재하에서 짝지어진다.
물론, DNA 분자의 각 원래 DNA 가닥과 그것의 합성 상보적인 가닥의 짝짓기는 물리적으로(상술한 바와 같이, Y-어댑터 내 헤어핀 고리의 존재 하에서)그리고 하나 또는 이상의 바코드 서열 존재 하에서 모두 수행될 수 있다.
상기 Y-어댑터는 그것의 이중 가닥 DNA 영역내에 하나 또는 이상의 바코드 서열을 포함할 수 있다. 이것은 적어도 원래 이중 가닥 DNA 분자의 원래 DNA 각 가닥간의 짝짓기를 위해 필요하다.
이 경우, DNA 분자의 원래 센스 및 안티센스 가닥은 조합 표지(“바코드 서열” 또는 “조합 바코드”)에 의해 확인되고, 특히 각각의 센스 및 안티센스 가닥은 두 조합 서열과 연결될 것이다. 모든 조합 서열은 센스 및 안티센스 가닥에 대해 동일하기 때문에, 모든 가닥은 과정 동안 따라올 수 있다. 전체 과정 후, 처음부터 함께했던 그것의 상보적 가닥들은 동일한 두 조합 서열을 공유할 것이다. 이것은 본 발명의 방법의 (i) 단계에서 사용된 원래 각 이중 가닥 DNA 단편의 모든 가닥들의 추적을 가능하도록 한다. 도 13은 상기 조합 표지가 사용된 본 발명의 방법의 일실시예를 나타낸다.
또한, Y 어댑터는 두 DNA 가닥에 의해 형성된 Y 어댑터의 첫 번째 DNA 가닥의 5' 영역 내 및/또는 두 번째 DNA 가닥의 3' 영역 내(및/또는 이중 가닥 영역 내) 하나 또는 이상의 바코드 서열을 포함할 수 있다. 따라서 바코드 서열은 Y-어댑터 분자의 단일 가닥 영역 내 및/또는 Y-어댑터의 이중 가닥 영역 내에 위치할 수 있다. 이 경우, 각 원래 DNA 가닥 및 그것의 합성 상보적인 가닥은 이후 짝지어진다.
바람직하게는, DNA Y 어댑터는 이중 가닥 영역 내 첫 번째 바코드 서열 및/또는 Y-어댑터의 두 번째 가닥의 3' 영역 내 두 번째 바코드 서열을 가진다. 선택적으로, 상기 DNA Y 어댑터는 이중 가닥 영역 내 첫 번째 바코드 서열 및/또는 Y-어댑터의 첫 번째 가닥의 5' 영역 내 두 번째 바코드 서열을 가진다. 선택적으로, 상기 DNA Y 어댑터는 이중 가닥 영역 내 첫 번째 바코드 서열 및/또는 Y-어댑터의 두 번째 가닥의 3' 영역 내 두 번째 바코드 서열 및/또는 Y-어댑터의 첫 번째 가닥의 5' 영역 내 세 번째 바코드 서열을 가진다.
바람직하게는, 상기 DNA Y-어댑터는 Y 어댑터의 첫 번째 DNA 가닥의 5' 영역 내 제한효소 인식자리를 가진다.
이중 가닥 DNA 분자의 각 원래 DNA 가닥 및 각 원래 DNA 가닥 및 그것의 합성 상보적인 가닥은 짝지어지는데 이것을 “이중 짝짓기(double pairing)”라고 지칭한다(즉, 동시에 한 가닥이 그것의 원래 상보적 가닥 및 그것의 합성 상보적 가닥과 짝지어 지는 것이다). 상기 이중 짝짓기는 4개의 다른 분자 재료의 정보(주어진 이중 가닥 DNA 분자의 상하 가닥 및 그들 각각의 합성 상보적인 가닥들)를 비교 가능하도록 하여 각 뉴클레오타이드 판독의 고유 검증을 제공하여 결과의 신뢰성을 더욱 향상시킨다. 또한, 이것은 원래 이중 가닥 DNA 분자의 상하 가닥 모두를 평가가능하도록 하고, 그 다음, 게놈 규모에서 헤미메틸화(hemimethylation)를 분석 가능하도록 한다. 바람직하게는, 이 실시예에 따라 (i) 단계 후 얻은 복수의 짝지어진 어댑터-변형 DNA 분자는 상술한 바와 같이, 이중으로 짝지어 진다.
(a) 단계에서 사용된 이중 가닥 DNA 분자는 바람작히게는 게놈 DNA의 단편이다. 바람직하게는, (a) 단계에서 사용된 게놈 DNA의 단편은 짝지어져 복수의 짝지어진 게놈 DNA 단편을 제공한다. 상술한 바와 같이, 이러한 짝짓기는 바람직하게는 바코드 서열을 사용하여 수행된다.
바람직하게는, (a) 단계에서 사용된 이중 가닥 DNA 분자는 상기 (a) 단계 전에 말단-수정되고, 바람직하게는 상기 말단-수정 후 상기 DNA 분자를 dA-tailing 하는 단계를 더 포함한다.
(a) 접합 단계는 이중 가닥 DNA 분자의 모든 말단과 Y-어댑터의 접합에 적합한 조건하에서 수행된다.
상기 (a) 단계의 결과는 복수의 Y-어댑터-포함 DNA 분자이다. 상기 분자들은 각 말단에 접합된 하나의 Y-어댑터를 가지는 이중 가닥 DNA 분자로 짝지어 진다(헤어핀 서열 및/또는 바코드 서열에 의해).
바람직하게는, 본 실시예에서, (a) 단계에서 얻은 Y-어댑터-포함 DNA 분자는 Y-어댑터-포함 DNA 분자의 가닥들을 분리하는데 적합한 조건하에서 (b) 단계 전에 처리된다.
상기 Y-어댑터-포함 DNA 분자의 가닥들을 분리하는데 적합한 조건은 각 가닥들이 모두 분리될 수 있는 조건이고 이에 제한되지 않는다. 예를 들면, 상보적 염기간의 수소결합을 끊고 단일 가닥 DNA 분자들을 산출할 수 있는 20초-2분 동안 94-98℃ 로 분자를 가열하는 조건일 수 있고 이에 제한되는 것은 아니다. 상기 가닥들의 분리는 등온기술을 사용하여 분자를 가열하지 않고 달성될 수 있는데, 예를 들면, Phi29DNA 중합효소 또는 Bacillus stearothermophilus DNA 중합효소의 큰 단편과 같은 가닥 변위 DNA 중합효소를 사용함으로써 수행될 수 있고, 이에 제한되는 것은 아니다.
(a) 단계에서 어댑터의 접합 후, (a) 단계에서 얻은 DNA 분자의 각 가닥들은 주형으로 (a) 단계에서 얻은 상기 DNA 분자의 각 가닥을 사용하여 Y-어댑터 내 두 번째 DNA 가닥의 3' 말단으로부터 중합효소 신장에 의해 짝지어진 이중 가닥 DNA 분자로 전환된다(상기 (b) 단계).
본 실시예에서 상기 표현 “짝지어진 이중 가닥 DNA 분자로 각 가닥을 전환시키는 것”은 상기 가닥들 각각에 상보적인 DNA 가닥이 합성되어, 모든 가닥들이 짝지어지는 것을 의미한다. 상기 짝짓기는 물리적으로 수행되어(즉, 상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역이 상기 3' 영역 내에서 3' 영역의 3' 말단에 위치하는 첫 번째 분절과 두 번째 DNA 가닥의 5' 영역 부근에 위치하는 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하는 경우) 이중 가닥 DNA를 형성하고 상기 단일 DNA 가닥은 자체로 접힌다.
선택적으로, Y-어댑터의 두 번째 DNA 가닥의 3' 영역이 상기 3' 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하지 않는 경우, 상기 짝짓기는 Y-어댑터의 적어도 한 가닥 내, 이중 가닥 영역 내 또는 단일 가닥 영역 내 중 어느 영역 내, 바람직하게는 단일 가닥 영역내에서 바코드 서열을 도입함으로써 일어날 수 있다.
상술한 바와 같이, 짝짓기는 원래 DNA 가닥 및 그것의 합성 상보적인 가닥의 물리적 접합 및 하나 또는 이상의 바코드 서열 존재 하에서 모두 일어날 수 있다.
상기 표현 “중합효소 신장(polymerase elongation)”은 Y-어댑터 분자 내에서 두 번째 DNA 가닥의 3' 말단에 자유 뉴클레오타이드를 첨가하는 DNA 중합효소에 의해 상보적인 가닥이 합성되는 것을 의미한다. 상기 Y-어댑터 분자는 신장 단계에서 프라이머 역할을 할 수 있다. 이 단계 동안 온도는 사용되는 특정 DNA 중합효소에 적합한 온도에 따라 선택된다.
바람직하게는, (b) 단계는 뉴클레오타이드 A, G, C 및 T를 사용하여 수행된다. 선택적으로 메틸화된 시토신이 신장단계에서 사용될 수 있지만 대신에 메틸화되지 않은 시토신의 사용은 다음와 같은 중요한 문제를 해결할 수 있다:
1 - 바이설파이트 변환의 조절.
바이설파이트 변환 효율은 가변적인데, 이것은 모든 시토신이 성공적으로 변환되지 않음 의미한다(바람직하게는 우라실(U)로). 또한, 각 실험 및 심지어 주어진 실험 내 각 분자에서 이 효율을 평가하는 것은 중요하다.
새로운 가닥을 위해 메틸화된 시토신을 사용하는 것은 모든 C가 메틸화되어 C로 판독될 것이므로, C>U 변형의 정도를 평가(또는 조절)하는데 바람직하지 않다. 반대로, 메틸화되지 않은 C가 사용되면, 각 분자의 바이설파이트 변환 효율이 결정될 수 있다.
2 -헤어핀에 의해 짝지어진 양 가닥의 상보성을 감소시킴으로써 증폭의 촉진
본 실시예에 따른 (i) 단계 후, 두 이중 가닥 DNA 분자가 각 Y-어댑터-포함 DNA 분자로부터 얻어지고, 상기 각각의 이중 가닥 DNA 분자는 짝지어진 DNA 분자의 원래 DNA 가닥과 그것의 합성 상보적 가닥에 의해 형성된다(상술한 바와 같이, 그들이 포함하고 있는 헤어핀 분자 또는 바코드 서열 또는 모두에 의해 그들의 말단 중 하나에 의해 물리적으로 결합 될 수 있다).
원래 이중 가닥 DNA 분자의 각 가닥간의 짝짓기는 사용된 원래 각 이중 가닥 DNA 단편의 각 가닥들의 추적을 가능하게 한다.
그러므로, 각 Y-어댑터는 정량 분석뿐만 아니라 시료의 확인 및 다중화가 가능한 고유의 조합 바코드를 포함할 수 있다. 바람직한 일 실시예에서, Y-어댑터는 어댑터의 라이브러리로 제공되고, 상기 라이브러리의 각 구성은 어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역에 의해 형성된 이중 가닥 영역내에 위치한 조합 서열에 의해 다른 것과 구별 가능하다. 따라서 본 발명은 본 발명의 방법에 사용하기 위한 것들 중에서도 적어도 하나의 바코드 서열을 포함하는 Y 헤어핀 어댑터를 제공한다.
조합 서열을 가진 Y-어댑터 라이브러리가 본 발명의 방법의 (i) 단계에서 사용되는 경우, (i) 단계 후 얻어진 DNA 분자를 포함하는 각 Y-어댑터는 상기 DNA 분자의 각 말단에 접합된 Y-어댑터 중 하나에 위치한 그들 각각의 두 개의 다른 조합 서열을 가질 것이다. 상기 두 식별자는 각각의 분자와 연관되어 있고, 따라서 구조물을 구별할 수 있다. 본 실시예의 (b) 단계 후 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥은 다른 분자 내에 그대로 남아있게 되지만 이들 분자 각각은 모두 조합서열을 포함하기 때문에, 상기 식별자는 상기 식별자 및 그의 파생물을 포함하는 특정 구조물의 확인을 가능하게 한다. 상기 식별자를 포함하는 상기 초기 개별 분자의 증폭 산물들은 동일한 것으로 가정된다. 상기 조합 바코드는 시료내 각 서열의 백분율을 정량할 수 있게 하고 증폭 단계동안 바이어스를 모니터링하고 오류를 조절하는데 유용하다.
선택적으로, 상기 Y-어댑터는 결합 쌍의 두 번째 구성으로 표지된 염기들을 포함하여 신장 또는 증폭 단계 후 원래 DNA 주형의 회수가 가능하다. 이것은 DNA 주형으로 사용된 시료를 과정 동안 확인 및 보존가능하고 회수, 저장될 수 있고 시료 손실 없이 다른 조건의 다중 증폭 및 시퀀싱에 사용할 수 있다는 장점을 제공한다.
본 실시예에 따라 (i) 단계 후 얻은 구조물은 이중 가닥 DNA 라이브러리를 형성하고, 그것은 시퀀싱 또는 다른 일반적인 분자생물학 기술분야에 이용될 수 있다.
선택적으로, Y-어댑터는 상술한 바와 같이, "절단 부위"를 포함할 수 있다. "절단 부위"는 다른 시퀀싱 플랫폼의 필요에 상기 라이브러리의 최종요소를 적용하는 방법을 추가한다. 이러한 적용은 특정 형태의 Y-어댑터(시퀀싱 프라이머와 같은 플랫폼 시약과 호환될 수 있는 서열을 도입함으로써)를 통해 가능하지만, 상기 절단 부위는 다중화(다른 기원의 혼합 시료) 또는 대규모 시퀀싱 플랫폼의 필요에 따라 바코드 또는 어댑터를 추가하여 모듈화를 가능하게 한다(또는 가능한한 불필요한 뉴클레오타이드를 제거하기 위해). 상기 "절단 부위"는 복수의 짝지어진 어댑터-변형 DNA 분자((i) 단계에서 얻은 짝지어진 어댑터-변형DNA 분자 라이브러리 또는 (iii) 단계(및 선택적으로 (iv) 단계)에서 얻은 짝지어진 변환된 어댑터-변형 DNA 분자 라이브러리) 끝(edges)에 아는 대상의 존재를 확인할 수 있는 특정 서열이다. "절단 부위"는 Y-어댑터를 접합하는 단계 전 또는 후에 복수의 이중 가닥 DNA 분자들에 접합될 수 있다. 상술한 바와 같이, "절단 부위"는 Y-어댑터내에 이미 포함되어 있을 수 있다. 이 경우, 모든 단편은 절단될 수 있고 어댑터는 적절히 접합될 수 있다(이경우 더 이상 필요하지 않은 어댑터의 서열이 제거되어 시퀀싱 효율을 증가시킬 수 있다).
그 다음, 본 발명의 방법의 (ii) 단계가 수행되고, 즉, 본 발명의 방법의 본 실시예의 (i) 단계에서 얻은 복수의 짝지어진 어댑터-변형 DNA 분자 내에 존재하는 (메틸화되지 않은) 시토신은 이미 설명한 바와 같이, 복수의 짝지어진 어댑터-변형 DNA 분자내에서 변환된다(바람직하게는 우라실로).
따라서, 복수의 짝지어진 어댑터-변형 포함 DNA 분자는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(바람직하게는 우라실)로 전환시키는 시약으로 처리되고 상기 (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 프라이머는 (ii) 단계에서 얻은 이중 가닥 DNA 분자에 대한 상기 시약처리의 결과로 적어도 서열의 일부분에 상보적이다. 이러한 처리는 어댑터-포함 DNA 분자의 상기 원래 및 그 합성 가닥의 상보성을 부분적으로 또는 완전히 상실하게 하여 그 다음 단계에서 사용된 프라이머의 어닐링을 용이하게 만든다. 도 5 및 6은 이를 보여주는 개략도이다.
바람직한 실시예에서, 상기 시약은 모든 메틸화되지 않은 시토신을 우라실로 전환시키는 바이설파이트이고, 이것은 (iii) 단계에서 증폭된 분자에서 티민으로 판독될 것이다.
(i) 단계에서 얻은 짝지어진 어댑터-변형 DNA 분자가 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리될 때, 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥간의 상보성은 부분적으로 또는 완전히 상실된다. 이것은 상보적인 가닥의 합성을 용이하게 할 수 있다.
본 발명의 방법의 (ii) 단계에서 얻은 Y-어댑터-포함 DNA 분자는 Y-어댑터-포함 DNA 분자의 가닥을 분리하는데 적합한 조건하에서 (iii) 단계 전에 더 처리될 수 있다.
상기 Y-어댑터-포함 DNA 분자의 가닥들을 분리하는데 적합한 조건은 각 가닥들이 모두 분리될 수 있는 조건으로, 예를 들면, 상보적 염기간의 수소결합을 끊고 단일 가닥DNA 분자들을 얻을 수 있는 20초-2분 동안 94-98℃ 로 분자를 가열하는 조건일 수 있고 이에 제한되는 것은 아니다. 상기 가닥들의 분리는 등온기술을 사용하여 분자를 가열하지 않고 달성될 수 있는데, 예를 들면, Phi29DNA 중합효소 또는 Bacillus stearothermophilus DNA 중합효소의 큰 단편과 같은 가닥 변위 DNA 중합효소를 사용함으로써 수행될 수 있고, 이에 제한되는 것은 아니다. 그 다음, 본 발명의 방법의 (iii) 단계가 수행되고 즉, 짝지어지고 변환된 복수의 어댑터-변형 DNA 분자의 상보적인 가닥을 제공하는 단계가 수행된다.
선택적으로, 상기 구조물은 다음 단계를 위해 재료의 양을 증가시키기 위해 증폭될 수 있다((iv) 단계). 바람직하게는, (iii) 단계에서 얻은 이중 가닥 DNA 분자는 (iii) 단계에서 얻은 이중 가닥 DNA 분자의 적어도 일부분과 상보적인 서열을 포함하는 적어도 하나의 프라이머를 사용하여 증폭된다.
바람직하게는, (iii) 단계에서 얻은 이중 가닥 DNA 분자는 어댑터 분자의 첫 번째 가닥의 5' 영역의 상보적인 서열의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 첫 번째 증폭 단계에서 증폭될 수 있다. (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 상기 프라이머는 바람직하게는 (ii) 단계에서 얻은 이중 가닥 DNA 분자에 대한 시약 처리로 생성된 서열의 적어도 일부분에 상보적이다. 이 실시예는 도 5 및 6에 나타내었고 이중 가닥 DNA 라이브러리를 생성하는데 사용되는 이중 가닥 DNA 분자들 집단의 전체 서열에 대한 증폭산물을 얻는 것이 가능하다.
또한, (iii) 단계에서 얻은 이중 가닥 DNA 분자는 이중 가닥 DNA 라이브러리를 생성하는데 사용되는 이중 가닥 DNA 분자들 집단의 상보적인 서열의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 첫 번째 증폭 단계에서 증폭될 수 있다. (iii) 단계(및 선택적으로 (iv) 단계)에서 사용된 프라이머는 바람직하게는 (ii) 단계에서 얻은 이중 가닥 DNA 분자에 대한 시약 처리로 생성된 서열의 적어도 일부분에 상보적이다. 이 실시예는 도 6에 나타내었다.
프라이머 쌍을 가지고 다음 증폭 단계의 수행이 또한 가능할 수 있다. 어떠한 프라이머의 조합도 본 발명에 의해 포함된다. 예를 들면, 첫 번째 프라이머는 어댑터 분자의 첫 번째 DNA 가닥의 5' 영역에 상보적인 서열의 적어도 일부분에 상보적일 수 있고 두 번째 프라이머는 첫 번째 증폭 단계 후에 얻어진 분자의 3' 영역에 상보적일 수 있다(도 6).
도 12는 본 실시예에 의해 얻어진 이중 가닥 DNA 라이브러리에서 다른 요소의 배치를 나타낸다. 참고로, 다른 조건을 가진 다른 증폭단계가 동일한 시료의 분취로 수행될 수 있고, 이 경우에 바이어스(TA 또는 CG 바이어스)가 분석 단계에서 평가 및 고려될 수 있다.
선택적으로, 본 발명의 방법의 (iii) 단계 및/또는 (iv) 단계 후 얻은 분자들은 반응 혼합물로부터 회수될 수 있다. 그러므로, (iii) 단계 및/또는 (iv) 단계에서 얻은 분자들은 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 반응 혼합물로부터 회수될 수 있고, 상기 (iii) 단계 및/또는 (iv) 단계에서 사용된 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
선택적으로, 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약처리에 저항성을 가지는 변형된 시토신을 포함할 수 있다. 또한 조합서열은 메틸화되지 않은 시토신을 포함할 수 있다(메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약처리에 저항성을 가지지 않는).
상기 표현 “이중 가닥 DNA 분자들 집단”. “말단”. “호환가능한”, “접합”, “주형”, “프라이머”, “상보적인”, “어댑터 라이브러리”, “조합 서열” 또는 “조합 바코드”, “반응 혼합물”, “결합 쌍”, “결합 쌍의 첫 번째 구성”, “결합 쌍의 두 번째 구성” 및 “혼성화 특성 관점에서 시토신과 유사하지 않은 염기”는 본 발명의 방법의 설명에서 정의되었다.
Y-어댑터는 지지체에 고정되어 제공될 수 있다. 바람직하게는 상기 고정화는 Y-어댑터의 첫 번째 DNA 가닥의 5' 말단 또는 두 번째 DNA 가닥의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합시킴으로써 수행된다. (iii) 단계에서 사용된 프라이머는 지지체에 또한 부착될 수 있다. 상기 지지체에 어댑터 및/또는 프라이머의 결합은 바람직하게는 공유결합일 수 있다.
상기 용어 “고정화”, “지지체” 및 “공유 결합”은 상기 정의되었다.
예를 들면, 본 발명의 방법의(i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자는 다음 단계에 의해 얻어진다:
(a) 이중 가닥 DNA 분자들 집단을 DNA Y-어댑터와 접촉시키는 단계로, 상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 말단은 이중 가닥 DNA 분자의 말단과 호환가능하고, 상기 접촉은, 각 이중 가닥 DNA 분자들 말단에 Y-어댑터의 접합에 적합한 조건에서 수행되어 복수의 Y-어댑터-포함 DNA 분자들을 얻고;
(b) 상기 Y-어댑터-포함 DNA 분자들의 각 가닥을, Y-어댑터의 두 번째 가닥에 신장 프라이머가 혼성화하기에 적합한 조건하에서, Y-어댑터 분자의 두 번째 DNA 가닥에 상보적인 3’ 영역을 포함하는 신장 프라이머와 접촉시키는 단계로, Y-어댑터 분자의 두 번째 DNA 가닥과의 혼성화는 오버행 말단들을 생성하고;
(c) (b) 단계에서 생성된 분자들에 헤어핀 어댑터를 접합시키기에 적합한 조건하에서, (b) 단계에서 생성된 분자들과 헤어핀을 접촉시키는 단계로, 상기 헤어핀 어댑터는 헤어핀 고리 영역 및 (b) 단계에서 생성된 분자들 내 오버행 말단들에 호환가능한 오버행 말단들을 포함하고; 그리고
(d) (b) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (c) 단계에서 얻은 이중 가닥 DNA 분자들의 각 말단들을 이중 가닥 DNA 분자로 전환시키는 단계로,
상기 헤어핀 어댑터에 접합시키는 상기 (c) 단계와 신장단계인 상기 (d) 단계는 임의의 순서로 또는 동시에 수행될 수 있다.
상술한 것과 유사하게, 상기 용어 "Y-어댑터"는 두 개의 DNA 가닥에 의해 형성된 어댑터를 의미하고 상기 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역이 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 말단은 이중 가닥 DNA 분자의 말단에 호환가능하다. 이 경우, Y-어댑터는 헤어핀 고리를 포함하지 않는데, 즉 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 3' 영역 내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하지 않는다.
바람직하게는, (a) 단계에서 사용된 이중 가닥 DNA 분자는 게놈 DNA 의 단편이다. 바람직하게는, (a) 단계에서 사용된 이중 가닥 DNA 분자는 상기 (a) 단계 전에 말단-수정되고, 바람직하게는 상기 말단-수정 단계 후에 상기 DNA 분자를 dA-tailing 단계를 더 포함한다.
(a) 단계인 접촉시키는 단계는 Y-어댑터를 이중 가닥 DNA 분자의 모든 말단에 접합시키기 적합한 조건하에서 수행된다.
상기 단계의 결과는 분자의 각 말단에 하나의 Y-어댑터가 접합된 이중 가닥 DNA 말단인 복수의 Y-어댑터-포함 DNA 분자이다.
두 번째 (b) 단계는 신장 프라이머를 Y-어댑터-포함 DNA 분자의 각 가닥에 접촉시키는 것을 포함한다.
상기 용어 “신장 프라이머”는 오버행 말단을 생성하는 Y-어댑터의 두 번째 가닥에 상보적인 3'영역을 포함하는 본 방법의 다음 신장단계에 사용되는 프라이머를 의미한다. 상기 용어 “프라이머” 및 “오버행 말단”은 위에서 정의되었다.
세 번째 (c) 단계는 (b) 단계에서 생성된 분자에 헤어핀 어댑터가 접합하기에 적합한 조건하에서 (b) 단계에서 생성된 분자를 헤어핀 어댑터와 접촉시키는 것을 포함한다
상기 용어 “헤어핀 어댑터(hairpin adapter)”는 같은 가닥 내에서 상보적인 염기 서열간 염기쌍에 의해 유지되는 이중 가닥 영역을 형성하기 위해 자체적으로 복제된 단일 가닥 핵산에 의해 형성된 이중 가닥, 짝지어지지 않은 염기에 의해 형성된 헤어핀 고리 영역 및 (b) 단계에서 생성된 분자내의 오버행 말단과 호환가능한 오버행 말단을 포함하는 것을 의미한다.
도 7은 헤어핀 어댑터 및 신장 프라이머가 별도로 제공되는 본 발명의 방법의 일실시예를 나타낸다.
또한, 상기 Y-어댑터-포함 DNA 분자의 각 가닥에 신장 프라이머를 접촉시키는 (b) 단계 및 (b) 단계에서 생성된 상기 분자에 헤어핀 어댑터를 접촉시키는 (c) 단계는 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공함으로써 단일 단계로 수행된다.
상기 용어 “복합체(complex)”는 헤어핀 어댑터 및 신장 프라이머에 의해 형성된 특정 분자를 의미한다. 도 8 및 9는 신장 프라이머 및 헤어핀 어댑터가 다른 형태의 복합체로 제공된 본 발명의 방법에 따른 실시예를 나타낸다. 이 경우, Y-어댑터의 접합 후, 복합체에 포함된 신장 프라이머는 분리되고 Y-어댑터의 두 번째 가닥의 3' 말단 및 헤어핀 어댑터의 5' 말단 사이에서 접합이 일어난다.
상기 헤어핀 어댑터에 접합 단계(c) 및 신장 단계(d)는 임의적 순서로 또는 동시에 수행될 수 있다. 일 실시예에서, (c) 단계는 (d) 단계 전에 수행된다. 다른 실시에서, (d) 단계는 (c) 단계 전에 수행된다(즉, 신장이 헤어핀이 구조물에 접합되기 전에 수행된다). 다른 실시예에서, (c) 및 (d) 단계는 동시에 수행된다.
바람직하게는, (a) 단계 또는 (c) 단계에서 얻은 Y-어댑터-포함 DNA 분자는 상기 Y-어댑터-포함 DNA 분자의 가닥을 분리하는데 적합한 조건하에서 일어난다.
(d) 단계 후 얻은 구조물은 이중 가닥 DNA 라이브러리를 형성하고, 시퀀싱 또는 통상의 분자생물학 기술분야에 사용될 수 있다.
Y-어댑터는 라이브러리의 각 구성이 어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역에 의해 형성된 이중 가닥 영역 내 위치한 조합 서열(또는 바코드 서열)에 의해 다른 것과 구별되는 어댑터 라이브러리로 제공되고, 이것은 복수의 이중 가닥 DNA 분자들의 단편을 짝짓기 위함이다(원래 가닥 및 그것의 원래 상보적인 가닥).
선택적으로, Y-어댑터, 신장 프라이머 및/또는 헤어핀 어댑터는 신장 또는 증폭 단계 후 원래 DNA 주형의 회수를 위해 결합 쌍의 두 번째 구성을 가진 표지된 염기들을 통합한다..
선택적으로 (d) 단계 후 얻은 분자는 반응 혼합물로부터 회수될 수 있다. 그러므로, (d) 단계에서 얻은 분자는 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 반응 혼합물로부터 회수될 수 있고, 상기 (e) 단계에서 사용된 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
복수의 짝지어진 어댑터-변형 DNA 분자가 제공되면(본 발명의 방법의 (i) 단계), 짝지어진 어댑터-포함 DNA 분자는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기(바람직하게는 우리실)로 전환시킬 수 있는 시약으로 처리되고 상기 (i)(b) 단계에서 사용된 프라이머는 이중 가닥 DNA 분자에 상기 시약 처리 결과 생성된 서열의 적어도 일부분과 상보적이다(본 발명의 방법의 (ii) 단계).
바람직하게는, 상기 시약은 바이설파이트이다.
선택적으로 상기 시약 처리 후 조합 서열(바코드 서열)의 특정 부분 서열이 변경되는 것을 막기 위해 조합 서열의 상기 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약을 처리하는 것에 저항성을 가지는 변형된 시토신을 포함할 수 있다.
예를 들면, 헤어핀 어댑터 및/또는 Y-어댑터는 상술한 바와 같이, 지지체에 고정된 채로 제공될 수 있다. 바람직하게는, 상기 고정화는 헤어핀 어댑터의 헤어핀 고리의 뉴클레오타이드 및/또는 Y-어댑터의 첫 번째 DNA 가닥의 5' 말단을 상기 지지체에 결합시켜 수행된다.
다른 실시예에서, 본 실시예에서 상술한 바와 같이, (i)(d) 단계(및 선택적으로 본 발명의 방법의 (iii) 단계 및 선택적으로 (iv) 단계)에서 사용된 프라이머는 부분적으로 변환되고 짝지어진 이중 가닥 DNA 분자를 선택적으로 증폭하기 위해 상기 지지체에 또한 부착된다. 바람직하게는, 어댑터 및/또는 지지체에 부착된 프라이머간의 결합은 공유결합이다.
본 발명에 따른 방법의 세 번째 실시예
본 발명의 발명의 세 번째 실시예에서, 본 발명의 방법의 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자는 다음 단계에 의해 얻을 수 있다:
(a) 오버행 말단을 가지는 복수의 이중 가닥 DNA 분자들의 단편을 생성하기 위한 적합한 조건하에서 복수의 이중 가닥 DNA 분자들을 단편화하는 단계로, 상기 각 단편의 각 말단은 헤미어댑터 분자에 결합되고, 상기 헤미어댑터 분자는 첫 번째 DNA 가닥 또는, 선택적으로 두 번째 DNA 가닥을 포함하고, 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성을 통해 첫 번째 가닥과 이중 가닥 영역을 형성하고 상기 헤미어댑터 분자는 헤미어댑터의 첫 번째 가닥의 3' 말단 및 이중 가닥 DNA 분자들의 단편들의 오버행 말단들간의 이중 가닥 DNA 분자 단편에 결합되고;
(b) 대체 두 번째 가닥을 추가하거나 헤미어댑터의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 단계로, 상기 대체 두 번째 가닥의 5' 영역은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적이고, 상기 대체 두 번째 가닥은 헤미어댑터 분자의 첫 번째 가닥에 상보적이지 않은 영역을 포함하여, 복수의 Y-어댑터-변형 DNA 분자들을 생성하고;
(c) 상기 Y-어댑터의 대체 두 번째 가닥의 5' 말단과 각 DNA 단편의 3' 말단간에 존재하는 갭(gap)을 선택적으로 채우는 단계;
(d) 상기 Y-어댑터의 대체 두 번째 가닥에 신장 프라이머를 혼성화시키기에 적합한 조건하에서, Y-어댑터 분자의 대체 두 번째 DNA 가닥에 상보적인 3' 영역 및 Y-어댑터의 대체 두 번째 DNA 가닥에 혼성화되지 않는 5' 영역을 포함하는 신장 프라이머에 상기 Y-어댑터-포함 DNA 분자의 각 가닥의 접촉시키는 단계;
(e) (d) 단계에서 생성된 분자들의 짝짓기 단계로, 상기 짝짓기 단계는 바람직하게는 (d) 단계에서 생성된 분자에 헤어핀 어댑터를 접합시키기에 적합한 조건 하에서 (d) 단계에서 생성된 분자내의 말단과 호환가능한 말단 및 헤어핀 고리 영역을 포함하는 헤어핀 분자를 (d) 단계에서 생성된 분자와 접촉시킴으로써 이루어진다; 선택적으로, 상기 짝짓기 단계는 (d) 단계 후에 추가되거나, Y-어댑터 및/또는 신장 프라이머 내에 이미 존재하는 바코드 서열에 의해(헤어핀 분자의 부존재) 일어날 수 있고; 그리고
(f) 복수의 짝지어진 어댑터-변형 DNA 분자들을 얻는 (d) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (e) 단계에서 얻은 DNA 분자들의 각 가닥들을 이중 가닥 DNA 분자로 전환시키는 단계로,
상기 헤어핀 어댑터에 접합시키는 단계(e) 및 신장 단계(f)는 임의의 순서로 또는 동시에 일어날 수 있다.
본 발명의 세 번째 실시예는 다른 단편화 시스템에 적용된다.
첫 단계에서, 본 발명의 세 번째 실시예에 따라 이중 가닥 DNA 라이브러리를 생성하는 방법은 오버행 말단을 가지는 복수의 이중 가닥 DNA 분자들의 단편을 생성하기 위한 적합한 조건하에서 복수의 이중 가닥 DNA 분자들을 단편화 하는 단계를 포함하고, 상기 각 단편의 각 말단은 헤미어댑터의 첫 번째 가닥의 3' 말단과 이중 가닥 DNA 분자 단편의 오버행 말단간의 결합으로 생성된 헤미어댑터 분자에 결합된다,
상기 용어 "헤미어댑터(hemiadapter 및 hemiadaptor)"는 첫 번째 DNA 가닥 및, 선택적으로 두 번째 DNA 가닥에 의해 형성된 불완전한 어댑터를 의미하고, 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성을 통해 첫 번째 가닥과 이중 가닥 영역을 형성한다. 상기 본 실시예의 헤미어댑터는 헤어핀 고리를 포함하지 않는다. 예를 들면, 상기 헤미어댑터는 두 번째 DNA 가닥을 포함하지 않는다. 예를 들면, 상기 헤미어댑터는 첫 번째 및 두 번째 DNA 가닥을 포함하지 않는다.
바람직하게는, (a) 단계에서 사용된 이중 가닥 DNA 분자는 게놈 DNA의 단편이다.
헤미어댑터를 이중 가닥 DNA 분자에 단편화하여 접합시키는 단계를 포함하는 본 실시예의 첫 단계가 수행될 수 있는데, 예를 들면, 전이 인자(transposable element)가 도너 DNA(헤미어댑터 분자)로부터 도입되어 목적 DNA(이중 가닥 DNA 분자들 집단)로 시험관 내 전위됨으로써 수행된다.
바람직하게는, 단편화 단계(a)는 이중 가닥 어댑터 분자에 도입된 전이효소 이량체(transposase dimer)와 이중 가닥 DNA 분자들 집단을 접촉시키는 단계를 포함하는 방법에 의해 일어나는데, 상기 어댑터 분자는 Tn5 역방향 반복(Tn5 inverted repeat) 및 5' 오버행을 가지는 가닥들 중 하나를 포함하는 이중 가닥 영역을 포함하고, Tn5 역방향 반복의 일부를 형성하지 않는 이중 가닥 영역 및 단일 가닥 영역의 상기 시토신 뉴클레오타이드는 선택적으로 메틸화되고 상기 접촉시키는 단계는 DNA의 단편화와 각 DNA 단편의 모든 말단에 헤미어댑터 분자의 부착에 적합한 조건하에서 일어난다.
상기 용어 “전이효소(transposase)”는 특정 DNA 서열을 인식하고 4곳에서 두 개의 이중 DNA 분자를 절단하고 가닥들을 접합시킬 수 있는 효소(E.C number 3.1.-.-)를 의미한다. 상기 전이효소는 전위가능한 핵산과 복합체를 형성하는데, 즉, 목적 DNA 서열로의 핵산의 삽입을 용이하게 한다.
상기 표면 “전이효소 이량체(transposase dimer)”는 다수의 잔기를 가진 두 개의 화학적으로 동일한 단량체의 이량체를 의미한다. 특히 관심있는 것은 전이효소 Tn5, Tn3, Tn7 및 그것의 돌연변이와 레트로바이러스 인테그라아제(retroviral integrases)이며 이에 제한되는 것은 아니다. 바람직한 일 실시예에서 상기 전이효소 이량체는 Tn5 전이효소이다. 상기 용어 “Tn5 전이효소”는 레트로바이러스 인테그라아제를 포함하는 단백질의 RNAse 슈퍼패밀리의 한 구성을 의미한다. 본 발명의 Tn5 전이효소는 대장균에서 발견되어 서열 Q46731(UniProt database, version of April 3, 2013)로 정의된다. 본 발명의 다른 종에서 나타나는 자연적 변종 및 분자 생물학 기술에 의해 얻은 인공적 변종(예, US596544에 개시된 Tn5 전이효소 돌연변이)을 포함하는 기능적으로 동일한 상기 Tn5 전이효소 변종을 또한 포함한다.
상기 용어 “도입된(loaded)”은 전이효소 이량체가 이중 DNA 단편에 결합되는 것을 의미한다.
본 실시예에서 상기 표현 "이중 가닥 어댑터 분자"는 Tn5 역방향 반복 및 5' overhang을 가지는 가닥 중 하나를 포함하는 이중 가닥 영역을 포함하는 어댑터 분자를 의미한다.
상기 표현 “Tn5 역방향 반복(Tn5 inverted repeat)”은 전이 요소를 의미한다. 상기 Tn5 역방향 반복은 일반적으로 18 또는 19 염기를 가지며 또 다른 Tn5 역방향 반복에 대해 역방향 반복되어 있다(Johnson R.C. and Reznikoff W.S. 1983. Nature, 304:280). 상기 Tn5 역방향 반복서열은 잘 알려져 있다.
Tn5 역방향 반복의 부분을 형성하지 않는 이중 가닥 영역 및 단일 가닥 영역 내의 시토신 뉴클레오타이드는 메틸화될 수 있거나 그렇지 않을 수 있다. 특히 일 실시예에서, 상기 시토신 뉴클레오타이드는 메틸화된다.
본 실시예에서 상기 표현 “DNA의 단편화 및 각 DNA 단편의 모든 말단에 헤미어댑터 분자의 부착에 적합한 조건”은 도입된 전이효소 이량체 효소가 잘 작동하는데 적합한 시간, 온도 및 버퍼 조성과 같은 조건을 의미한다. 상기 조건은 기술분야의 통상의 기술자에게 널리 알려져 있다. 예시적인 조건은 Adey A. and Shendure J. 2012. Genome Research, 22:1139-1143 and in Adey A. et al. 2010. Genome Biology, 11: R119에 개시되어 있다.
본 실시예의 첫 단계 (a)에 적합한 키트는 예를 들면, Nextera™ DNA sample preparation kits (Illumina)이다.
시험관 내 전위는 태그멘테이션(tagmentation)(“Ultra-low-input, tagmentation-based-whole-genome bisulfite sequencing” Adey A. and Shendure J. 2012. Genome Research, 22:1139-1143; “Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition” Adey A. et al. 2010. Genome Biology, 11: R119)을 사용하여 수행될 수 있고 또한 변형된 태그멘테이션 방법은 US5965443에 개시되어 있다. 본 발명에서 사용될 수 있는 다른 방법은 EP2527438A1, US2003143740A, US7160682B 및 WO9925817A에 개시되어 있고, 이에 제한되는 것은 아니다.
상기 (a) 단계의 결과는 분자의 각 말단에 접합된 하나의 헤미어댑터를 가지는 이중 가닥 DNA 분자인 복수의 헤미어댑터-포함 DNA 분자이다.
본 실시예의 두 번째 (b) 단계는 대체 두 번째 가닥을 첨가하거나 헤미어댑터 분자의 두 번째 DNA 가닥을 복수의 Y-어댑터-포함 DNA 분자를 얻는 대체 두 번째 가닥으로 치환하는 단계를 포함한다.
상기 표현 “치환(replacing)”은 헤미어댑터의 두 번째 가닥이 대체 두 번째 가닥에 의해 치환되는 것을 의미한다. 상기 치환는 헤미어댑터의 시작 두 번째 DNA 가닥이 상기 반응에서 온도, 가닥 농도 및 가닥 멜팅 온도를 조절함으로써 대체 두 번째 가닥에 대한 친화력을 상실하는 경우의 조건하에서 일어난다. 요약하면, 시작 두 번째 DNA 가닥은 예를 들면 적합한 버퍼내에서 2분 동안 50 ℃로 온도를 상승시킴으로써 헤미어댑터의 첫 번째 가닥과의 혼성이 상실된다. 그 다음, 혼합물은 냉각되고 대체 두 번째 가닥은 시작 두 번째 DNA 가닥을 치환한다. 헤미어댑터의 두 번째 DNA 가닥을 치환하는 예시적인 조건은 Adey A. and Shendure J. 2012. Genome Research, 22:1139-1143에 개시되어 있다.
상기 표현 “대체 두 번째 가닥(alternative second strand)”은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적인 5' 영역을 가지고 헤미어댑터의 첫 번째 가닥에 상보적이지 않은 영역을 포함하는 가닥을 의미한다. 일 실시예에서 헤미어댑터 분자의 첫 번째의 3' 영역에 상보적인 대체 두 번째 가닥의 5' 영역은 대체 두 번째 가닥의 5' 말단 및 DNA 단편의 3' 말단 사이에 어떤 갭도 없다. 다른 실시예에서 갭은 대체 두 번째 가닥의 5' 말단 및 DNA 단편의 3' 말단 사이에 존재한다.
본 실시예에서 상기 표현 "Y-어댑터"는 상기 3' 영역 및/또는 첫 번째 가닥의 중심 영역 및 대체 두 번째 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 첫 번째 가닥의 5' 영역 및 대체 두 번째 가닥의 3' 영역은 상보적이지 않은 두 개의 DNA 가닥에 의해 형성된 어댑터를 의미한다.
일부 경우에, Y-어댑터의 대체 두 번째 가닥의 5' 말단 및 각 DNA 단편의 3' 말단은 갭이 상기 말단 사이에 존재하므로 접합되지 않는다.
본 실시예는 Y-어댑터의 대체 두 번째 가닥의 5' 말단 및 각 DNA 단편의 3' 말단 사이에 존재하는 갭을 선택적으로 채우는 (c) 단계를 포함한다.
상기 용어 “갭(gap)”은 하나 또는 이상의 뉴클레오타이드의 손실로 두 DNA 가닥 중 하나에서의 불연속성을 의미하다.
상기 표현 “갭을 채우는 것”은 가닥에서 빠진 뉴클레오타이드를 첨가하는 것을 의미한다. DNA 중합효소는 갭에 맞는 뉴클레오타이드를 삽입하고 상보적인 DNA 가닥에 있는 갭에 반대되는 염기를 인식함으로써 가닥의 3' 말단에 있는 뉴클레오타이드에 그것을 연결한다. 갭에 닉이 있기 때문에, 닉의 양쪽에 있는 DNA 가닥은 DNA 리가아제에 의해 접합된다.
헤미어댑터의 첫 번째 DNA 가닥이 조합서열을 포함하는 경우 본 실시예의 (c) 단계는 갭을 채움으로써 상기 조합 서열의 상보적인 복제물을 생성한다.
본 실시예의 (d) 단계는 Y-어댑터의 대체 두 번째 가닥에 신장 프라이머의 혼성에 적합한 조건하에서 신장 프라이머에 Y-어댑터-포함 DNA 분자의 각 가닥을 접촉시키는 단계를 포함한다.
본 실시예에서 사용된 상기 용어 “신장 프라이머”는 Y-어댑터의 대체 두 번째 가닥에 상보적인 3' 영역과 Y-어댑터의 대체 두 번째 가닥에 바람직하게는 혼성화되지 않는 5' 영역을 포함하고 상기 방법의 다음 단계에서 신장을 위해 사용되는 프라이머를 의미한다.
본 실시예의 (d) 단계는 평활 말단 또는 오버행 말단을 생성하고, 바람직하게는 오버행 말단을 생성한다.
본 실시예의 (e) 단계는 헤어핀 어댑터가 (d) 단계에서 생성된 분자들에 접합되기에 적합한 조건하에서 바람직하게는 (d) 단계에서 생성된 분자들을 접촉 시킴으로써 (d) 단계에서 생성된 분자들을 짝짓기 하는 것을 포함한다. 선택적으로, 짝짓기는 (d) 단계 후 첨가되거나 이미 Y-어댑터 및/또는 신장 프라이머에 존재하는 바코드 서열 존재하(헤어핀 분자의 부존재하에서)에서 일어날 수 있다
본 실시예에서 상기 용어 “헤어핀 어댑터”, “헤어핀 서열”은 동일한 가닥의 상보적인 염기서열간의 염기 쌍에 의해 유지되는 이중 가닥 영역을 형성하기 위해 자체로 이중화된 단일 가닥 핵산에 의해 형성된 이중체, (d) 단계에서 생성된 분자내에서 짝지어지지 않은 염기들과 상기 말단과 호환가능한 말단에 의해 형성된 헤어핀 고리 영역을 의미한다. 헤어핀 어댑터는 평활 말단 또는 오버행 말단을 포함할 수 있고, 바람직하게는 오버행 말단을 포함할 수 있다.
본 실시예의 다른 경우에서, 상기 Y-어댑터-포함 DNA 분자의 각 가닥에 신장 프라이머를 접촉시키는 (d) 단계 및 (d) 단계에서 생성된 분자를 헤어핀 분자에 접촉시키는 (e) 단계는 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공함으로써 단일 단계로 수행된다.
상기 용어 “복합체”는 상기 헤어핀 어댑터와 신장 프라이머에 의해 형성된 특정 분자를 의미한다. 도 10은 신장 프라이머 및 헤어핀 어댑터가 복합체로 제공되는 본 실시예에 따른 예시를 나타낸다. 이 경우, 상기 복합체에 포함된 신장 프라이머는 분리되고 Y-어댑터의 대체 두 번째 가닥의 3' 말단과 헤어핀 어댑터의 5' 말단 사이에서 접합이 일어난다.
본 실시예에서 다른 경우에서, 대체 두 번째 가닥을 첨가하거나 헤미어댑터 분자의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 (b) 단계, 상기 Y-어댑터-포함 DNA 분자의 각 가닥을 신장 프라이머에 접촉 시키는 (d) 단계 및 (d) 단계에서 생성된 분자들을 헤어핀 분자에 접촉시키는 (e) 단계는 대체 두 번째 가닥, 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공함으로써 단일 단계로 수행된다.
상기 용어 “복합체”는 대체 두 번째 가닥, 헤어핀 어댑터 및 신장 프라이머에 의해 형성된 특정 분자를 의미한다. 도 11은 상기 대체 두 번째 가닥, 신장 프라이머 및 헤어핀 분자가 복합체로 제공되는 본 실시예에 따른 예시를 나타낸다. 이 경우, 복합체내에 포함된 대체 두 번째 가닥은 헤미어댑터 분자의 첫 번째 DNA 가닥에 어닐링된다. 갭을 채우는 (c) 단계 및 신장시키는 (f) 단계는 DNA 중합효소 및 DNA 리가아제가 첨가되면 동시에 일어날 수 있다; 또는 신장 프라이머의 3' 말단이 가역적으로 차단된 경우, 독립적으로 수행될 수 있다. 바람직하게는 (b) 단계에서 (f) 단계는 동시에 수행된다.
본 실시예에서 헤어핀에 접합하는 (e) 단계 및 신장시키는 (f) 단계는 임의의 순서로 또는 동시에 수행될 수 있다.
바람직한 실시예에서, (b) 단계 또는, 경우에 따라 (c) 단계에서 얻은 Y-어댑터-포함 DNA 분자 또는 (e) 단계 또는 경우에 따라, (f) 단계에서 얻은 짝지어진 어댑터-포함 DNA 분자는 상기 분자들의 가닥을 분리하는데 적합한 조건하에 놓인다.
본 실시예의 (f) 단계 후 얻은 구조물은 이중 가닥 DNA 라이브러리를 형성하고 시퀀싱 또는 통상적인 분자 생물학 기술분야에 사용될 수 있다.
바람직하게는, (a) 단계에서 사용된 헤미어댑터는 헤미어댑터 라이브러리로 제공되고, 라이브러리의 각 구성은 헤미어댑터의 첫 번째 가닥의 3' 영역 내의 조합 서열에 의해 다른 것과 구별될 수 있다. 예를 들면, (b) 단계에서 사용된 헤미어댑터의 두 번째 가닥 또는 대체 두 번째 가닥은 상기 조합 영역과 상당한 부분이 겹쳐지는 것으로 나타나지 않는다. 다른 예에서 (b) 단계에서 사용된 헤미어댑터의 두 번째 가닥 또는 대체 두 번째 가닥은 상기 조합 영역과 상당한 부분이 겹치지는 것으로 나타난다.
상기 표현 “어떤 상당한 겸침을 나타내지 않는”은 (b) 단계에서 사용된 헤미어댑터의 두 번째 가닥 또는 대체 두 번째 가닥은 조합 영역을 넓히고 겹쳐지지 않는다. 상기 표현 "상당한 겹침을 나타내다"는 (b) 단계에서 사용된 헤미어댑터의 두 번째 가닥 또는 대체 두 번째 가닥이 조합 영역을 부분적으로 또는 완전히 덮는 것을 의미한다.
선택적으로, Y-어댑터, 신장 프라이머 및/또는 헤어핀 어댑터 및/또는 바코드 서열은 신장 또는 증폭 단계 후 원래 DNA 주형의 회복을 가능하게 하는 결합 쌍의 두 번째 구성으로 표지된 염기들을 포함한다.
선택적으로, 본 실시예의 (f) 단계 후 얻은 분자들은 반응 혼합물로부터 회수될 수 있다. 그러므로, 본 발명의 본 실시예에서 (f) 단계에서 얻은 분자들은 반응 혼합물로부터 회수되고, 바람직하게는 이 경우라면, Y-어댑터, 신장 프라이머 및/또는 헤어핀 분자 및/또는 바코드 서열은 신장 또는 증폭 단계 후 원래 DNA 주형의 회복을 가능하게 하는 결합 쌍의 두 번째 구성으로 표지된 염기들을 포함한다.
본 실시예에 따라 복수의 짝지어진 어댑터-변형 DNA 분자가 제공되면(본 발명의 방법의 (i) 단계), 짝지어진 어댑터-변형 DNA 분자의 모든 가닥에 존재하는 (메틸화되지 않은) 시토신이 짝지어진 어댑터-변형 DNA 분자 내에서 예, 우라실로 변환된다(본 발명의 방법의 (ii) 단계).
따라서, 복수의 짝지어진 어댑터-변형 DNA 분자는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리되고 상기 (g) 단계에서 사용된 프라이머는 (f) 단계에서 얻은 이중 가닥 DNA 분자에 상기 시약을 처리하여 생성된 서열의 적어도 일부분과 상보적이다.
바람직하게는 상기 시약은 바이설파이트이다.
선택적으로, 조합서열(바코드 서열)은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리하는 것에 저항성이 있는 하나 또는 이상의 변형된 시토신을 포함할 수 있다. 또한 조합 서열은 메틸화되지 않은 시토신을 포함할 수 있다(메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리하는 것에 저항성이 없는)
복수의 짝지어진 변환된 어댑터-변형 DNA 분자가 생성되면(본 발명의 방법의 (ii) 단계), 짝지어진 변환된 어댑터-변형 DNA 분자의 상보적인 가닥들이 제공된다(본 발명의 방법의 (iii) 단계).
바람직하게는, 본 발명의 방법의 (iii) 단계는 헤미어댑터 분자의 첫 번째 DNA 가닥의 5' 영역의 상보적인 서열의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 수행된다(바람직하게는 이중 가닥 DNA 분자에 시약을 처리한 결과(본 발명의 방법의 (ii) 단계)).
바람직하게는, 본 발명의 방법의 (iii) 단계는 짝지어진 변환된 어댑터-변형 DNA 분자들을 생성하는데 사용되는 이중 가닥 DNA 분자들 집단의 상보적인 서열의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 수행된다(바람직하게는 이중 가닥 DNA 분자들에 시약 처리 결과로 생성된 서열에 상보적인(상술한 바와 같이, 본 발명의 방법의 (ii) 단계)).
다음 증폭 단계는 프라이머쌍을 이용하여 가능할 수 있다(본 발명의 방법의 (iv) 단계). 프라이머 조합은 본 발명에 포함된다. 예를 들면, 특히 일실시예에서, (iii) 단계의 프라이머는 헤미어댑터 분자의 첫 번째 DNA 가닥의 5' 영역의 상보적인 서열의 일부분에 상보적이고 (iv) 단계의 프라이머는 첫 증폭 단계 후 얻은 분자의 3' 영역에 상보적이다.
선택적으로, (iii) 단계 및/또는 (iv) 단계 후 얻은 분자들은 반응 혼합물로부터 회수될 수 있다. 그러므로, (iii) 단계 및/또는 (iv) 단계에서 얻은 분자들은 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 반응 혼합물로부터 회수될 수 있고, 상기 (iii) 단계 및/또는 (iv) 단계에서 사용된 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
본 실시예에서, 헤어핀 어댑터 및/또는 헤미어댑터의 첫 번째 DNA 가닥은 지지체에 고정되어 제공될 수 있다. 바람직하게는, 상기 고정은 헤어핀 어댑터의 헤어핀 고리의 뉴클레오타이드 및/또는 헤미어댑터의 첫 번째 DNA 가닥의 5' 말단을 상기 지지체에 결합시킴으로써 수행된다. 본 실시예에서, (iii) 단계 및/또는 (iv) 단계에서 사용된 프라이머도 지지체에 부착될 수 있다. 바람직하게는, 어댑터 및/또는 지지체에 상기 프라이머간의 결합은 공유결합이다.
본 발명에 따른 방법의 추가 실시예
1. 복수의 이중 가닥 DNA 분자들의 가닥들의 짝짓기가 바코드 서열의 존재 하에서 일어나는 본 발명의 방법
예를 들면, 본 발명의 방법의 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자들은 이중 가닥 DNA 분자들 집단을 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하는 DNA 어댑터 집단에 접합시켜 얻을 수 있는데, 상기 첫 번째 DNA 가닥의 3' 영역 및 상기 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 각 말단들은 이중 가닥 DNA 가닥의 말단과 호환가능하고, 상기 집단의 각 어댑터는 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역내에 위치하는 조합 서열에 의해 다른것과 구별될 수 있고, 상기 접합은 이중 가닥 DNA 분자의 각 말단들에 어댑터가 접합될 수 있는 적합한 조건하에서 수행된다.
따라서, 특히 시료의 메틸화를 분석하는데 유용한 이중 가닥 DNA 라이브러리가 얻어지고, 상기 DNA 분자의 원래 센스 및 안티센스 가닥은 링커에 의해 서로 물리적으로 결합되지 않지만 그들은 조합 표지(조합 서열 또는 바코드 서열)에 의해 식별될 수 있다. 특히, 각 센스 및 안티센스 가닥은 두 조합서열에 연결된다.
상기 용어 "DNA 라이브러리"는 관심있는 DNA 단편을 확인하고 분리하기 위해 어댑터 분자에 접햅된 DNA 단편의 집합을 의미한다.
상기 표현 “이중 가닥 DNA 라이브러리”는 DNA 분자의 모든 가닥을 포함하지만(즉, 센스 및 안티센스 가닥), 상기 가닥들은 링커에 의해 물리적으로 결합되지 않는다. 센스 가닥은 안티센스 가닥도 존재하는 두 고유 조합 바코드를 포함하기 때문에 원래 분자의 센스 및 안티센스 가닥들은 조합 표지(조합 서열 또는 바코드 서열)에 의해 식별된다. DNA 분자의 각 원래 가닥은 고유 조합 서열을 가진 어댑터의 첫 번째 가닥의 한 말단 및 다른 고유 조합 서열을 가지는 다른 어댑터의 두 번째 가닥의 다른 말단에 결합된다.
상기 용어 "어댑터"는 관심 있는 핵산분자에 접합될 수 있는 올리고뉴클레오타이드 또는 핵산 단편 또는 분절을 의미한다.
본 발명에서 사용된 “DNA 어댑터”는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 말단은 복수의 이중 가닥 분자의 말단과 상보적이고, 상기 각 어댑터는 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역내에 위치하는 조합 서열에 의해 다른것과 구별될 수 있다. DNA 어댑터는 상당히 상보적인 첫 번째 DNA 가닥 및 두 번째 DNA 가닥에 의해 형성될 수 있다. 그러므로, 첫 번째 DNA 가닥의 5' 영역 및 두 번째 DNA 가닥의 3' 영역은 상보적일 수 있다. DNA 어댑터는 Y-어댑터일 수 있다. 그러므로, DNA 어댑터는 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역이 서열 상보성에 의해 이중 가닥 영역을 형성하고 첫 번째 DNA 가닥의 5' 영역 및 두 번째 DNA 가닥의 3' 영역은 상보적이지 않은 Y-어댑터일 수 있다. 도 14는 본 발명의 방법의 이 측면을 보여주는 모식도이다. 선택적으로, DNA 어댑터는 본 발명의 명세서의 “본 발명의 Y-어댑터 라이브러, 이를 합성하는 방법 및 키트” 섹션에 개시된 어댑터에 따른 어댑터일 수 있다. 상기 섹션에 개시된 실시예는 상기 사용된 어댑터에 적용될 수 있다. 바람직하게는, 각 어댑터 내의 두 번째 DNA 가닥의 3' 말단은 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 연결하는 링커에 의해 가역적으로 차단된다.
바람직하게는, (i) 단계에서 사용된 이중 가닥 DNA 분자는 게놈 DNA 단편이다. 선택적으로, (i) 단계에서 사용된 이중 가닥 DNA분자는 상기 (i) 단계 전에 말단-수정되고, 바람직하게는 상술한 바와 같이, 상기 말단-수정 단계 후에 DNA 분자를 dA-tailing 단계를 더 포함한다.
선택적으로, 복수의 이중 가닥 DNA 분자들은 상기 DNA 분자내 점착성 말단을 포함하는 DNA 분자에 어댑터 분자를 접합하기에 적합한 조건하에서 어댑터 분자로 (i) 단계 전에 처리된다.
(i) 단계 접합단계는 복수의 어댑터-포함 DNA 분자를 얻기 위해 이중 가닥 DNA 분자의 각 말단에 어댑터를 접합시키기에 적합한 조건하에서 수행된다.
상기 단계의 결과는 복수의 짝지어진 어댑터-포함 DNA 분자이다. 각 짝지어진 어댑터-변형 DNA 분자는 다른 두 조합 서열을 가질 것이고, 각 조합 서열은 DNA 분자의 각 말단에 접합된 어댑터 중 하나에 위치한다.
(i) 단계 후 얻은 구조물은 본 발명의 이중 가닥 라이브러리를 형성한다. 이 라이브러리의 장점은 조합 서열이 더 신뢰할만한 결과를 얻기 위해 원래 함께 있던 센스 및 안티센스 가닥으로부터 얻은 서열 정보를 혼성(crossing) 시키도록 한다는 점이다.
(i) 단계에서 얻은 어댑터-포함 DNA 분자는 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약으로 처리된다((ii) 단계).
바람직한 실시예에서, 상기 시약은 모든 메틸화되지 않은 시토신을 우라실로 전환시키는 바이설파이트이고, 우라실은 (iii) 단계에서 증폭된 분자내에서 티민으로 판독될 것이다.
(ii) 단계 처리 후, 원래 이중 가닥 DNA 분자의 센스 및 안티센스 가닥간의 상보성은 부분적으로 또는 완전히 상실된다. 이것은 다음 단계에서 사용되는 프라이머의 어닐링(annealing)을 용이하게 한다.
(ii) 단계 후 얻은 구조물은 또한 시퀀싱 또는 다른 통상적인 분자생물학 기술분야에 사용될 수 있고, 특히 시료의 메틸화를 분석하는데 사용될 수 있다.
본 발명의 방법의 세 번째 단계에서((iii) 단계), (ii) 단계에서 얻은 짝지어진 변환된 어댑터-변형 DNA 분자의 상보적인 가닥이 제공된다. 이 단계에서, 어댑터(이중 가닥 DNA 분자에 상기 시약을 처리한 결과 생성된(본 발명의 방법의 (ii) 단계))의 두 번째 DNA 가닥의 적어도 일부분에 상보적인 서열을 가진 프라이머가 사용된다. 이것은 도 14에 나타나고 이중 가닥 DNA 라이브러리를 생성하는데 사용되는 짝지어진 변환된 어댑터-변형 이중 가닥 DNA 분자들 집단의 전체 서열에 대한 상보적인 가닥을 얻을 수 있도록 한다.
(ii) 단계가 일어난 후, 상기 분자가 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리될 때 (iii) 단계에서 사용된 프라이머는 짝지어진 변환된 어댑터-변형 DNA 분자에 혼성화될 수 있다. 예를 들면, 상기 프라이머는 상기 전환이 일어나기 전에는 어댑터 분자에 혼성화될 수 없다. 어댑터 분자가 메틸화되지 않은 시토신을 포함하고 있는 경우, (iii) 단계에서 사용된 프라이머는 원래 어댑터 분자의 메틸화되지 않은 시토신과 짝을 이루는 위치에 구아닌 염기 대신 아데닌 염기를 가진다. 어댑터 분자는 메틸화된 또는 메틸화되지 않은 시토신을 포함할 수 있다. 선택적으로, 어댑터 분자의 서열, 헤어핀 서열 및/또는 바코드 서열의 특정 부분이 상기 시약으로 처리 후 변형되는 것을 막기 위해, 첫 번째 어댑터 분자의 서열 및 바람직하게는 어댑터 서열 내의 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 변환시키는 시약처리에 저항성을 가지는 변형된 시토신을 포함할 수 있다. 어댑터는 메틸화되지 않은(변형되지 않은) 시토신을 포함할 수 있다.
참고로, 다른 조건을 가진 다른 증폭은 동일한 시료의 분취로 수행될 수 있고, 이 경우 바이어스(TA 또는 CG 바이어스)가 분석 단계에서 평가되고 고려될 수 있다.
선택적으로 DNA 어댑터는 (i), (ii), (iii) 또는 (iv) 단계 후 원래 DNA 주형의 회수를 가능하게 하는 결합 쌍의 두 번째 구성으로 표지된 염기들을 포함한다.
본 발명의 방법의 (i) 단계 또는 (ii) 단계에서 얻은 DNA 분자는 (i) 단계, (ii) 단계 후 또는 경우에 따라 (iii) 단계 후 및/또는 (iv) 단계 후 얻은 반응 혼합물로부터 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 회수되고, 상기 어댑터는 상기 결합 쌍의 두 번째 구성으로 변형된다.
선택적으로, (iii) 단계에서 및/또는 (iv) 단계 후 얻은 DNA 분자는 반응 혼합물로부터 바람직하게는 결합 쌍의 첫 번째 구성을 사용하여 회수되고, 상기 (iii) 단계에서 및/또는 (iv) 단계 후 사용된 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
조합 바코드들은 정량분석뿐 아니라 시료 확인, 다중화, 짝짓기를 가능하게 하고 증폭 단계 동안 바이어스를 모니터링하고 오류를 제어하는데 유용하다. 이 경우에서 얻은 구조물은 안티센스 가닥과 관련된 동일한 두 식별자가 있는 센스 가닥에 관련된 다른 두 식별자를 가진다. 각 조합 서열들은 센스 및 안티센스 가닥에 대해 동일하므로 각 가닥들은 과정 동안 따라올 수 있다. 전 과정 후, 원래 함께 있었던 그들의 상보적인 가닥들은 동일한 두 조합 서열을 공유할 것이다. 두 고유 식별자들은 시작 시료 내에 각 개별 분자와 관련되므로 구조물을 구별시키는 능력을 제공한다. (ii) 단계 후 이중 가닥 DNA 분자의 원래 센스 및 안티센스 가닥은 분리될 수 있지만 이러한 가닥 각각은 모두 조합서열을 포함할 것이기 때문에 상기 고유 식별자는 상기 식별자 및 그것의 패생물을 포함하는 특정 구조물의 식별이 가능하다. 그러므로, 두 고유 식별자를 포함하는 시작 개별 분자의 증폭 산물은 하강에 의해 동일할 것으로 가정된다.
이것은 DNA 주형으로 사용된 시료를 확인하고, 과정 동안 보전하고 회수, 저장 및 시료 손실 없이 다른 조건의 다중 증폭 및 시퀀싱에 제공가능하다는 이점을 제공한다.
상기 표현 "이중 가닥 DNA 분자들 집단", "조합 서열", "말단", "호환가능", "접합", "주형", "프라이머", "상보적인", "증폭", "결합 쌍", "결합 쌍의 첫 번째 구성", "결합 쌍의 두 번째 구성". "혼성화 특성 관점에서 시토신과 유사하지 않은 염기" 및 "변형된 시토신"은 본 발명의 방법의 설명에서 정의되었다.
본 발명의 방법에 사용된 모든 실시예 및 정의는 본 예에 적용가능하다.
2. 복수의 이중 가닥 DNA 분자들의 가닥들의 짝짓기는 바코드 서열존재 하에서 수행되는 본 발명의 방법
예를 들면, 본 발명의 방법의 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA분자는 다음의 단계에 의해 얻어질 수 있다
(a) 오버행 말단을 가지는 복수의 이중 가닥 DNA 분자들의 단편을 생성하기 위한 적합한 조건하에서 복수의 이중 가닥 DNA 분자들을 단편화 하는 단계로, 상기 각 단편의 각 말단은 헤미어댑터 분자에 결합되고, 상기 헤미어댑터 분자는 첫 번째 DNA 가닥 또는, 선택적으로 두 번째 DNA 가닥을 포함하고, 상기 각 헤미어댑터는 첫 번째 DNA 가닥의 3' 영역 내 위치한 조합 서열에 의해 구별될 수 있고, 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성을 통해 첫 번째 가닥과 이중 가닥 영역을 형성하고 상기 헤미어댑터 분자는 헤미어댑터의 첫 번째 가닥의 3' 말단과 이중 가닥 DNA 분자 단편의 오버행 말단간의 결합으로 이중 가닥 DNA 분자 단편에 결합되고;
(b) 대체 두 번째 가닥을 추가하거나 헤미어댑터의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 단계로, 상기 대체 두 번째 가닥의 5' 영역은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적이고, 상기 대체 두 번째 가닥은 헤미어댑터 분자의 첫 번째 가닥에 상보적이지 않은 영역을 포함하여, 복수의 Y-어댑터-변형 DNA 분자를 생성하고; 및
(c) Y-어댑터의 대체 두 번째 가닥의 5' 말단과 각 DNA 단편의 3' 말단간에 존재하는 갭을 선택적으로 채우는 단계.
이 경우에, 본 발명의 방법의 (i) 단계 후 얻은 복수의 짝지어진 어댑터-변형 DNA 분자는 다른 단편화 시스템에 적용된다.
첫 단계에서, 복수의 이중 가닥 DNA 분자들은 오버행 말단을 가지는 이중 가닥 DNA 분자 단편의 집단을 생성하는데 적합한 조건하에서 단편화되고 상기 각 단편의 각 말단은 헤미어댑터의 첫 번째 가닥의 3' 말단과 이중 가닥 DNA 분자 단편의 오버행 말단 사이의 헤미어댑터 분자에 결합된다.
상기 용어 "헤미어댑터"는 첫 번째 DNA 가닥 및, 선택적으로, 두 번째 DNA 가닥으로 형성된 불완전한 어댑터를 의미하고, 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성을 통해 첫 번째 가닥과 이중 가닥 영역을 형성하고 상기 각 헤미어댑터는 첫 번째 DNA 가닥의 3' 영역 내 위치한 조합 서열에 의해 다른 것과 구별될 수 있다. 일 실시예에서 헤미어댑터는 두 번째 DNA 가닥을 포함하지 않는다. 헤미어댑터는 첫 번째 및 두 번째 DNA 가닥을 포함할 수 있다.
바람직하게는, 헤미어댑터의 두 번째 가닥은 상기 조합 서열과 상당한 겸침을 보이지 않는다.
바람직하게는 (i) 단계에서 사용된 이중 가닥 DNA 분자는 게놈 DNA 단편이다.
선택적으로, (i) 단계에서 사용된 이중 가닥 DNA 분자는 상기 (i) 단계 전에 말단-수정되고, 바람직하게는 상기 말단-수정 단계 후 DNA 분자를 dA-tailing 단계를 더 포함한다.
선택적으로, 이중 가닥 DNA 분자들 집단은 상기 DNA 분자 내에 점착성 말단을 도입한 DNA 분자에 어댑터 분자를 접합하기에 적합한 조건하에서 (i) 단계 전에 어댑터 분자로 처리된다.
단편화 및 헤미어댑터를 이중 가닥 DNA 분자에 접합시키는 것을 포함하는 첫 단계가 예를 들면, 시험관 내 전위에 의해 일어날 수 있는데, 상기 전이 요소는 도너 DNA(헤미어댑터 분자)로부터 목적 DNA(이중 가닥 DNA 분자들 집단)로 도입된다.
바람직하게는, 단편화 단계 (i) 단계는 이중 가닥 어댑터 분자에 로드된 전이효소 이량체에 이중 가닥 DNA 분자들 집단을 접촉시키는 단계를 포함하는 방법에 의해 수행되고, 상기 어댑터 분자는 Tn5 역방향 반복 및 가닥 중 하나의 5' 오버행을 포함하는 이중 가닥 영역을 포함하고, Tn5 역방향 반복의 부분을 형성하지 않는 상기 이중 가닥 영역 내 및 단일 가닥 영역내에서 시토신 뉴클레오타이드는 선택적으로 메틸화되고 상기 접촉시키는 것은 DNA의 단편화 및 각 DNA 단편의 각 말단들에 헤미어댑터 분자의 부착에 적합한 조건하에서 수행된다.
상기 표현 "이중 가닥 어댑터 분자"는 Tn5 역방향 반복 및 가닥 중 하나의 5' 오버행을 포함하는 이중 가닥 영역을 포함하는 어댑터 분자를 의미한다.
상기 단계의 결과는 분자의 각 말단에 접합된 하나의 헤미어댑터를 가진 이중 가닥 DNA 분자인 복수의 헤미어댑터-포함 DNA 분자이다. 각 헤미어댑터-포함 DNA 분자는 다른 두 조합 서열을 가지는데, 그것들 각각은 DNA 분자의 각 말단에 접햅된 헤미어댑터의 첫 번째 DNA 가닥의 3' 영역 내 위치한다
두 번째 (b) 단계는 대체 두 번째 가닥을 추가하거나 헤미어댑터 분자의 두 번째 DNA 가닥을 복수의 Y-어댑터-포함 DNA 분자를 얻는 대체 두 번째 가닥으로 치환하는 것을 포함한다.
상기 표현 "대체 두 번째 가닥"은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적인 5' 영역을 가지고 헤미어댑터의 첫 번째 가닥에 상보적이지 않은 영역을 포함하는 가닥을 의미한다. 선택적으로, 헤어미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적인 대체 두 번째 가닥의 5' 영역은 헤미어댑터의 대체 두 번째 가닥의 5' 말단과 DNA 단편의 3' 말단 사이에 갭을 가지지 않는다. 다른 실시예에서 갭은 헤미어댑터의 대체 두 번째 가닥의 5' 말단과 DNA 단편의 3' 말단 사이에 존재한다.
바람직하게는, 대체 두 번째 가닥은 헤미어댑터의 첫 번째 DNA 가닥의 조합 영역과 상당한 겸침을 나타내지 않는다.
상기 표현 "Y-어댑터"는 상기 3' 영역 및/또는 첫 번째 DNA 가닥의 중심 영역 및 대체 두 번째 가닥의 5' 영역이 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 첫 번째 가닥의 5' 영역 및 대체 두 번째 가닥의 3' 영역이 상보적이지 않은 두 DNA 가닥에 의해 형성되는 어댑터를 의미한다.
일부 실시예에서, Y-어댑터의 대체 두 번째 가닥의 5' 말단 및 각 DNA 단편의 3' 말단은 말간 사이에 존재하는 갭 때문에 접합되지 않는다.
(b) 단계 후 얻은 구조물은 본 발명의 이중 가닥 라이브러리를 형성하고 시퀀싱 또는 다른 통상적인 분자 생물학 기술분야에 사용될 수 있다. 이러한 라이브러리의 장점은 조합 서열들이 더 신뢰할만한 결과를 얻기 위해 원래 함께였던 센스 및 안티센스 가닥으로부터 얻은 서열 정보를 혼성화 가능하도록 하는 것이다.
선택적으로, (c) 단계는 Y-어댑터의 대체 두 번째 가닥의 5' 말단 및 각 DNA 단편의 3' 말단 사이에 존재하는 갭을 채우는 것을 포함한다.
이 단계는 갭을 채움으로써 헤미어댑터의 첫 번째 DNA 가닥의 조합 서열에 대한 상보적인 복제물을 생성한다.
이후에, 얻은 복수의 짝지어진 어댑터-변형 DNA 분자는 본 발명의 방법의 (ii) 단계 및 (iii) 단계(및, 선택적으로 (iv) 단계)로 진행된다.
선택적으로, Y-어댑터는 원래 DNA 주형의 회수를 가능하도록 하는 결합 쌍의 두 번째 구성으로 표지된 염기들을 포함한다. Y-어댑터는 메틸화된 시토신 및/또는 메틸화되지 않은 시토신을 포함할 수 있다. 상기 표현 "이중 가닥 DNA 분자들 집단". "조합 서열", "말단", "호환가능한", "접합", "주형", "프라이머", "상보적인", "증폭", "결합 쌍", "결합 쌍의 첫 번째 구성", "결합 쌍의 두 번째 구성", "혼성화 특성 관점에서 시토신과 유사하지 않은 염기" 및 "변형된 시토신"은 이미 정의되었다.
상기 표현 "전이효소", "진이효소 이량체", "로드된", "Tn5 역방향 반복", "DNA 단편화 및 각 DNA 단편의 각 말단들에 헤미어댑터 분자를 부착하기에 적합한 조건", "치환하는 것", "갭", "갭을 채우는 것" 및 "상당한 겹침을 보이지 않는다"는 이미 정의되었다.
상기 용어 “DNA 라이브러리” 및 “이중 가닥 DNA 라이브러리”는 이미 정의되었다.
시퀀싱 단계(본 발명의 방법의 (v) 단계)
본 발명의 방법의 (ii) 단계, (iii) 단계 및/또는 (iv) 단계에서 생성된 짝지어진 DNA 분자(이중 가닥 DNA 라이브러리 또는 DNA 라이브러리로도 지칭되는)는 시퀀싱 기술에 적합하다(바람직하게는 (iii) 단계 및/또는 (iv) 단계에서 생성된 짝지어진 DNA 분자는 시퀀싱된다).
본 발명의 방법에서 생성된 DNA 라이브러리의 디자인은 서열 및 전환 오류를 발견하고 이전 단계에서 발생한 바이어스를 모니터링하는 것이 현재 사용되는 방법보다 더 낫도록 한다.
증폭될 때, 일부 단편은 많은 원인에 의해 선택적으로 증폭될 수 있다. 이러한 바람직하지 않은 효과는 정량화를 위한 주요 문제인데, 이것은 시퀀싱, 특히 DNA 메틸화 상태 분석을 위한 많은 응용에 중요하다(각 세포내의 각 대립유전자는 다른 메틸화 상태를 가질 수 있고 심지어 시료는 정량화 및 바이어스가 대부분의 응용을 위해 필수적인 것을 조절하도록 하는 이종 구성을 가질 수 있기 때문에).
본 발명의 방법에서 생성된 이중 가닥 DNA 라이브러리는 모든 이중 가닥 DNA 분자의 각 가닥들이 시퀀싱 동안 동시에 판독되도록 하는 장점을 가진다. 모든 개별적인 서열 판독에서 생성된 상기 시스템적인 잠재 시퀀싱 오류를 검출 및 수정할 수 있기 때문에 이중 판독은 본 방법의 신뢰도를 증가시킨다.
현재, 시퀀싱 기기는 예상 가능한 오류율을 가진다. 이러한 대부분의 오류는 보이지 않아 최종 결과에 숨겨진 채로 존재한다. 이것은 다음 과정 및 결과분석에 부정적 결과를 낳는다. 본 발명의 방법은 모든 판독이 일관되어야 하므로, 각 염기를 판독할 수 있는 각 염기에 대한 네 가지 정보소스(경우에 따라서, 주어진 이중다가 DNA의 상하부 가닥 및 그것의 각각의 합성 상보 가닥들)를 제공한다. 따라서, 본 발명의 방법은 상기 서열 결정의 오류 검출 및 수정을 가능하게 한다(시작 서열 결정 및 시토신의 메틸화 분석에 대한).
시퀀싱 오류는 가닥 중 하나에서만 나타나더라도 검출된다. 만약 비대칭적 메틸화와 혼동될 수 없고 뉴클레오타이드 검출 신뢰도가 높고 참조 게놈 서열이 식별가능하다면 이러한 오류는 수정될 수 있다.
상기 변형은 실제 유전적 변형으로 간주되려면 모든 가닥들에서 나타나야 하므로, 유전적 변형(즉, 돌연변이 및 SNPs)은 서열 오류와 혼동될 수 없다. 본 발명의 방법의 이중 검출은, 즉, 변형 검출의 검증이다, 더욱이, 시작 서열 및 메틸화 정보는 동시에 평가되므로, 메틸화되지 않은 시토신으로부터 발생한 티민들은 돌연변이 또는 SNPs로부터 발생한 티민들과 구별될 수 있다.
또한, 조합 서열(바코드 서열)이 어댑터 내에 포함된 경우, 시료내에 초기에 존재하는 증폭 바이어스를 추적하고 고유 이증가닥 DNA 분자를 카운트하는 것이 가능하다. 정량분석은 또한 본 발명의 시퀀싱 방법 동안 가능하다.
이중 가닥 라이브러리는 차세대 시퀀싱 기술(NGS)를 포함하는 통상적인 시퀀싱 방법에서 사용될 수 있다. 본 발명에 따라 이중 가닥 DNA 라이브러리를 생성하는 방법은 DNA 시퀀싱, 즉 NGS 기술 등의 현재 및 향후의 파이프라인에 접목될 수 있다. 라이브러리의 NGS는 대부분의 이용가능한 플랫폼으로 수행될 수 있다. 필요하지 않아도 결합-말단 시퀀싱(Paired-end sequencing)을 사용할 수 있다. 심지어 시퀀싱이 전체 분자를 다루지 못할 때, 필요할 때, 제공된 서열화된 영역을 얻을 수 있는 두 가닥의 짝짓기에 기초한 정보는 상보적인 영역 및 바코드를 포함한다(예, 도 13 참고).
또한, 좌위 특정 시퀀싱(locus specific sequencing)도 수행될 수 있다.
본 발명의 방법에 따라 얻은 라이브러리는 이미 얻어지거나 시퀀싱 과정 전에 정제될 수 있는 반응 혼합물로부터 직접 시퀀싱에 사용될 수 있다.
일 측면에서, 본 발명은 실시예에서 본 발명의 방법을 사용하는 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 것을 포함하는 이중 가닥 DNA 분자들 집단의 서열을 결정하는 방법 및 본 발명의 방법의 (ii) 단계, (iii) 단계 또는, 경우에 따라 (iv) 단계에서 얻은 DNA 분자를 시퀀싱하는 방법에 관한 것이다(본 발명의 방법의 (v) 단계).
상기 용어 "시퀀싱" 또는 상기 표현 "서열을 결정하는 것" 또는 "서열 결정" 및 유사한 것은 핵산의 뉴클레오타이드 염기 서열과 관련된 정보의 결정, 특히 핵산 내 복수의 연속적인 뉴클레오타이드의 결정 및 정렬을 의미한다. 상기 정보는 이중 가닥 DNA 라이브러리의 시작 서열, 후성 유전학적 변형(예, 메틸화 또는 하이드록시메틸화) 또는 각각을 의미한다. 서열 정보는 다양한 범위의 통계적 신뢰성 또는 신뢰도에 의해 결정될 수 있다. 상기 예와 같이, 본 발명의 방법은 이중 가닥 DNA 분자가 시퀀싱 될 때, 높은 신뢰도를 얻을 수 있다.
본 발명의 방법은 이중 가닥 DNA 라이브러리의 시작 서열을 시퀀싱하는데 더 사용될 수 있다.
시작 서열의 결정은 돌연변이 또는 다형성(SNPs 등)과 같은 유전적 변형의 검출을 포함한다.
바람직하게는, 본 발명의 방법은 시작 서열 및 시토신 메틸화를 모두 동일한 판독에서 동시에 결정할 수 있다. 시퀀싱의 결과를 분석함으로써, 각 판독결과는 어댑터에 포함된 조합 서열 뿐 아니라 각 가닥들의 시작 서열(메틸화 및 SNPs 포함하는) 및 메틸화 서열의 정보를 가질 것이다.
메틸화된 시토신의 확인
본 발명의 방법은 이중 가닥 DNA 분자들 집단 내 메틸화된 시토신의 확인이 가능하다.
본 발명의 방법에 따라((iii) 단계 또는 (iv) 단계) 생성된 이중 가닥 DNA 분자(또한 이중 가닥 DNA 라이브러리로 지칭되는)는 상술한 바와 같이, 메틸화된 시토신의 확인에 적합하다.
만약 시토신이 가닥들 중 하나에 나타나고 다른 가닥 내 대응 위치에 구아닌이 나타나면 지정된 위치에 메틸화된 시토신의 존재가 결정되고 만약 우라실 또는 티민이 가닥 중 하나에 나타나고 다른 가닥 내 대응 위치에 구아닌이 나타나면 지정된 위치에 메틸화되지 않은 시토신의 존재가 결정된다.
상기 표현 "가닥"은 이중 가닥 DNA 분자의 각 사슬을 의미한다. 만약 두 가닥들의 짝짓기가 헤어핀 분자의 존재에 의해 일어나면, DNA 분자의 각 가닥들 모두는 함께 연결되어 고유 분자를 형성한다. 만약 상기 짝짓기가 헤어핀 분자 존재 없이 일어나면, DNA 분자의 각 가닥들은 다른 분자 내에 있고, 즉 그들은 서로 물리적으로 연결되지 않지만 조합 서열에 의해 확인될 것이다.
상기 표현 "다른 가닥"은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리하기 전에 첫 번째 가닥에 상보적인 가닥을 의미한다. 예를 들면, DNA 분자의 안티센스 가닥은 센스 가닥의 반대 가닥이다. 시약으로 처리 후 각 가닥들의 상보성이 부분적으로 또는 완전히 상실되기 때문에 상기 용어 "다른 가닥"은 상기 용어 "상보적인 가닥"보다 더 넓은 의미를 가질 것이다.
상기 표현 "대응 위치"는 대응 가닥(즉, 비록 상기 짝짓기가 상보적이지 않지만, 다른 가닥 내 지정된 뉴클레오타이드 위치와 짝지어진 뉴클레오타이드 위치)에 같은 위치를 의미한다
상기 표현 "이중 가닥 DNA 분자들 집단", "라이브러리". "어댑터-변형 DNA 분자", "시약". "혼성화 특성 관점에서 시토신과 유사하지 않은 염기", "프라이머". "특이적인"은 상기에서 정의되었다.
상기 용어 "시퀀싱"은 본 발명의 방법의 시퀀싱 부분에서 정의하였다. 그러므로, 본 발명의 방법의 (v) 단계 시퀀싱 단계는(메틸화된 시토신의 확인을 위한) 동시에 시작 정보 및 메틸화 정보를 얻을 수 있다.
바람직하게는, 시토신과 유사하지 않은 염기로 메틸화되지 않은 염기를 전환시키는 상기 시약은 바이설파이트이다. 바람직하게는, 상기 시토신과 유사하지 않은 염기는 티민 또는 우라실이고 더 바람직하게는 우라실이다.
메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리하는 것은 본 발명의 방법의 (i) 단계에서 얻은 분자들의 모든 메틸화되지 않은 시토신을 우라실로 전환시키는 것이다. 상기 처리된 분자들이 본 발명의 방법의 (iii) 단계에 제공되고 합성된 상보적인 DNA 분자는 주형 분자가 우라실을 가진 경우 상기 위치에 우라실을 가질 것이다. 첫 번째 분자에 우라실이 있는 경우에 상기 분자(본 방법의 (iv) 단계에서 선택적으로 증폭된)는 티민을 가질 것이다(우라실이 아닌 제공된 티민이 증폭에 사용된다). 그러므로, 메틸화되지 않은 시토신은 마지막 과정에 우라실 또는 티민으로 판독될 것이다.
신장 또는 PCR 증폭될 때, 우리실은 티민으로 증폭되고 반면에 5-메틸시토신 잔기는 메틸화된 시토신을 원래 이중 가닥 DNA에서 메틸화되지 않은 시토신과 구별되도록 하면서 시토신으로 남아있다. 이중 가닥 DNA 라이브러리의 분자가 시퀀싱될 때, 원래 이중 가닥 DNA 분자의 메틸화된 시토신은 다른 가닥의 대응 위치에 구아닌 대비 지정 위치에 시토신의 존재에 의해 유추 할 수있다.
이중 가닥 DNA 라이브러리의 분자가 시퀀싱될 때, 원래 이중 가닥 DNA 분자의 메틸화되지 않은 시토신은 다른 가닥의 대응 위치에 구아닌 대비 지정 위치에 우라실 또는 티민의 존재에 의해 유추 할 수있다.
본 발명의 방법의 (iii) 또는 (iv) 단계에서 얻은 짝지어진 이중 가닥 DNA 분자(또는 DNA 라이브러리로 지칭되는)를 사용할 때, 각 판독은 이중 가닥 DNA 의 각 가닥들의 서열을 변환시키는 시약을 가진다. 원래 상보적이었던 가닥들은 짝짓기가 바코드의 사용에 의해 일어난 경우, 각 가닥의 조합 서열(바코드 서열 또는 조합 바코드)로부터 제외될 수 있다.
이러한 정보를 가지고 모든 가닥들의 원래 서열을 유추할 수 있다(시약으로 변환되기 전에). 그러므로, 각 판독에 대해, 시작 서열(참조 게놈에 의한 맵핑 및 다형성 평가를 위한) 및 이중 가닥 DNA 분자의 각 가닥들의 메틸화 상태의 정보를 얻을 수 있다. 분자들의 조합 표지는 이중 가닥 DNA 분자의 원래 각 가닥들의 서열을 변환시키는 시약의 평가를 허용한다.
원래 이중 가닥 DNA 분자의 서열을 유추할 수 있는 상기 과정은 이중 가닥 DNA 라이브러리의 각 분자에 대해 시약으로 처리전 서열 및 상기 시약으로 처리 후 서열을 얻기 위해 상기 결과 서열을 처리하는 소프트웨어에 의해 수행된다. 그 후, 소프트웨어는 각 가닥 및 그것의 인증된 상보적인 가닥으로부터 얻은 정보 분석하고, 상기 인증된 상보적인 가닥은 첫 번째 가닥에 원래 결합되어 있던 가닥으로 간주된다. 각 가닥들이 물리적으로 결합한 경우 이러한 정보를 본 발명의 방법에 의해 얻은 라이브러리에 의해 직접 얻을 수 있다. 원래 가닥들이 조합 서열에 의해 짝지어진 경우, 이러한 정보를 직접 얻을 수 있다.
개발된 소프트웨어는 (i) 시작 서열 및 메틸화 정보의 통합, (ii) 돌연변이, SNPs 및 CNV(득실)의 검출 및 (iii) 서열 오류 및 바이러스 검출이 가능하다.
원래 이중 가닥 DNA 분자들의 각 가닥들의 메틸화 정보가 결정되기 때문에 이것은 각 가닥 내 헤미메틸화 또는 메틸화 대칭을 평가할 수 있다.
상기 용어 "헤미메틸화된" 및 "비대칭적으로 메틸화된"은 교환적으로 사용될 수 있고 두 가닥 중 하나만이 메틸화된 경우 복제된 DNA내의 서열(예, CpG )을 의미한다.
Y-어댑터 라이브러리, 이것의 합성 방법 및 키트
본 발명은 또한 본 발명의 방법에 사용되는 Y-어댑터를 합성하는 방법 및 키트를 제공한다. 본 발명은 또한 Y-어댑터 라이브러리를 포함하는 키트를 제공한다.
본 발명은 Y-어댑터 라이브러리에 관한 것이고, 상기 각 Y-어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥을 형성하고, 상기 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역 내에서 첫 번째 및 두 번째 분절 사이에 혼성화에 의해 헤어핀 고리를 형성할 수 있고, 3'영역의 3' 말단에 위치한 첫 번째 분절 및 두 번째 DNA 가닥의 영역 분근내에 위치한 두 번째 분절은 첫 번째 DNA 가닥의 3' 영역과 이중 가닥 영역을 형성하고 상기 라이브러리의 각 구성은 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역내에 위치한 하나 또는 이상(바람직하게는 하나)의 조합 서열에 의해, 및/또는 Y-어댑터의 단일 가닥 영역 내 위치한 하나 또는 이상의 조합 서열에 의해 다른 것들과 구별될 수 있다. 바람직하게는, Y-어댑터는 Y-어댑터의 이중 가닥 영역 내에 하나의 바코드 서열 및 Y-어댑터의 단일 가닥 영역내에 하나의 바코드 서열을 포함한다. 선택적으로, Y-어댑터는 또한 상술한 바와 같이 Y-어댑터 내에 “절단 부위”를 포함한다. 바람직하게는 "절단 부위"는 Y-어댑터의 단일 가닥 영역 내에 위치한다.
Y-어댑터 라이브러리의 바람직한 일 실시예에서 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로의 처리에 저항성을 가지는 하나 또는 이상의 변형된 시토신을 포함한다.
Y-어댑터 라이브러리의 다른 실시예에서, 각 어댑터 내에서 두 번째 폴리뉴클레오타이드의 3' 말단은 가역적으로 차단된다.
상기 표현 “가역적으로 차단된”은 합성 동안 프라이머 결합으로부터 폴리뉴클레오타이드를 차단하는 가역적인 블락킹 그룹(reversible blocking group)을 가지는 가역적 변형을 의미하고 이에 제한되지 않는다. 상기 변형은 가역적이고, 상기 블락킹 그룹은 다음 단계에서 제거될 수 있다.
상기 용어 “가역적 블락킹 그룹(reversible blocking group)”은 중합효소 확장을 차단하기 위해 폴리뉴클레오타이드 3' 말단의 3' OH기를 치환하는 그룹를 의미한다. 가역적 블락킹 그룹의 예로는 3'-p; 3'-amino; 3'-inverted 3-3' deoxynucleoside (idN), inosine, 3'-O-allyl (Intelligent Bio-Systems), 3'-O-methoxymethyl, 3'-O-nitrobenzyl and 3'-O-azidomethyl (Illumina/Solexa)와 같은 3'-O ethers; 3'-aminoalkoxyl 및 3'-O-amino 가 있고 이에 제한되는 것은 아니다. 가역적 블락킹 그룹의 예로는 또한 Gardner A.F. et al. 2012. Nucleic Acids Research, 40(15):7404-7415에 개시되어 있고 Lightning Terminators™ (Lasergen, Inc.)로 불린다. 본 발명에서, 전체 디데옥시뉴클레오타이드(ddCMP, ddAMP, ddTMP, ddGMP)는 또한 가역적 블락킹 그룹으로 간주될 수 있다.
상기 용어 “가역적 블락킹 그룹”은 또한 제거될 수 있는 첫 번째 DNA 가닥의 5' 말단 및 두 번째 DNA 가닥의 3' 말단을 연결하는 링커를 포함할 수 있다. 상기 링커는 일반적인 뉴클레오타이드, 변형된 뉴클레오타이드 또는 일반적이거나 변형된 뉴클레오타이드의 서열일 수 있고 이에 제한되는 것은 아니다. 링커가 제거되면, 어댑터의 첫 번째 및 두 번째 DNA 가닥은 분리된다. 상기 어댑터는 상기 링커가 제거되기 전 또는 후에 본 발명의 방법에서 이중 가닥 DNA 분자들 집단에 접합하는데 사용될 수 있다. 상기 링커는 지지체에 연결될 수 있다.
그러므로, Y-어댑터의 다른 실시예에서, 각 어댑터 내의 두 번째 폴리뉴클레오타이드의 3' 말단은 첫 번째 DNA 가닥의 5' 말단 및 두 번째 DNA 가닥의 3' 말단을 연결하는 링커에 의해 가역적으로 차단된다.
Y-어댑터 라이브러리의 다른 실시예에서, 각 어댑터에서 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역 사이에 형성된 이중 가닥 영역의 말단 분절은 제한 엔도뉴클레아제(restriction endonuclease)가 인식할 수 있는 목적 부위를 포함한다.
상기 용어 “제한 엔도뉴클레아제”는 제한 부위 또는 목적 부위(제한 효소에 의해 인식되는 올리고뉴클레오타이드의 서열)로 알려진 DNA 또는 특정 인식 뉴클레오타이드 서열 부위를 절단하는 효소를 의미한다. 제한 엔도뉴클레아제의 예는 본 발명의 기술분야에서 잘 알려져 있다. 제한 엔도뉴클레아제는 type I enzymes, type II enzymes, type IIS enzymes, type III enzymes 및 type IV enzyme를 포함하고 이에 제한되지 않는다. REBASE 데이터베이스는 제한 엔도뉴클레아제에 대한 종합적인 데이터베이스를 제공한다(Roberts R.J. et al. 2010. Nucleic Acids Research, 38: D234-D236).
상기 용어 “목적 부위” 는 제한 엔도뉴클레아제에 의해 특이적으로 인식되는 뉴클레오타이드 서열을 의미한다.
다른 측면에서, 본 발명은 하기의 단계를 포함하는 DNA Y-어댑터를 생산하는 방법에 관한 것이다:
(i) 첫 번째 단일 가닥 폴리뉴클레오타이드를 두 번째 단일 가닥 폴리뉴클레오타이드에 접촉시키는 단계로, 상기 첫 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역은 두 번째 폴리뉴클레오타이드의 5' 영역의 적어도 일 부분과 상보적이고,
상기 두 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역은 상기 3' 영역의 3' 말단에 위치한 첫 번째 분절 및 두 번째 폴리뉴클레오타이드의 5' 영역 부근에 위치한 두 번째 분절인, 상기 3' 영역 내 첫 번째 및 두 번째 분절의 혼성화에 의한 헤어핀 고리를 형성하고 상기 두 번째 폴리뉴클레오타이드의 3' 말단은 가역적으로 차단되고,
상기 접촉은 첫 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역 및 두 번째 단일 가닥 폴리뉴클레오타이드의 5' 영역 내 상보적인 영역의 혼성화에 적합한 조건하에서 수행되어 이중 DNA 분자를 생성하고;
(ii) 상기 첫 번째 단일 가닥 폴리뉴클레오타이드 내에 두 번째 폴리뉴클레오타이드의 5' 영역에 상보적인 서열을 생성할 수 있도록 첫 번째 폴리뉴클레오타이드의 3' 말단을 신장하는 단계; 및
(iii) 선택적으로, 두 번째 폴리뉴클레오타이드의 3' 말단의 차단을 푸는 단계.
(i) 단계는 첫 번째 폴리뉴클레오타이드의 3' 영역과 두 번째 단일 가닥 폴리뉴클레오타이드 집단의 5' 영역 수성 내 상보적인 영역의 혼성화에 적합한 조건하에서 수행된다. 혼성화에 적합한 조건은 본 발명의 첫 번째 방법에서 정의되었다.
(ii) 단계는 신장을 포함한다. 신장에 적합한 조건은 기술분야의 통상의 기술자에게 널리 알려져 있다.
(iii) 단계는 두 번째 폴리뉴클레오타이드의 3' 말단의 차단을 푸는 것을 포함한다. 상기 용어 “차단을 푸는 것”은 폴리뉴클레오타이드의 3' 말단의 블락킹 그룹을 제거하고 3'-OH 기를 회복시키는 것을 의미한다. 차단을 푸는 것에 적합한 조건은 이중을 파괴시키지도 DNA를 손상시키지 않으면서 특정 블락킹 그룹에 의존하는 조건이다. 예를 들면, 3'-O-allyl기는 전이금속 촉매에 의해 절단되고, 3'-O-methoxymethyl기는 산에 의해 절단되고, 3'-O-nitrobenzyl기는 빛에 의해 절단되고 3'-oazidomethylene기는 포스핀(phosphines)에 의해 절단된다. 가역적 블락킹 그룹이 디데옥시뉴클레오타이드인 경우, 전체 디데옥시뉴클레오타이드는 이중의 파괴없이 두 번째 폴리뉴크레오타이드의 3' 말단으로부터 제거된다(즉, 첫 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역과 두 번째 단일 가닥 폴리뉴클레오타이드의 5' 영역 내 상보적인 영역사이에 결합은 유지된다). 상기 용어 "차단을 푸는 것"은 또한 첫 번째 단일 가닥 폴리뉴클레오타이드 및 두 번째 단일 가닥 폴리뉴클레오타이드의 3' 말단을 연결하는 링커를 제거하는 것을 의미한다.
DNA Y-어댑터를 생산하는 방법에 대한 바람직한 일 실시예에서, (ii) 단계에서 수행되는 신장은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성이 있는 변형된 시토신의 존재하에서 수행된다.
다른 실시예에서, (i) 단계에서 사용된 첫 번째 단일 가닥 폴리뉴클레오타이드 및/또는 두 번째 단일 가닥 폴리뉴클레오타이드도 변형된 시토신을 포함한다.
본 발명의 세 번째 방법에 따라 DNA Y- 어댑터를 생산하는 방법에 대한 바람직한 또 다른 일 실시예에서, 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 Y-어댑터를 처리하는 것을 더 포함한다.
바람직한 또 다른 실시예에서, 첫 번째 폴리뉴클레오타이드의 3' 말단 내 적어도 한 부분은 구아닌이고 상기 첫 번째 뉴클레오타이드의 3' 말단 내 위치 또는 상기 위치와 혼성화하는 두 번째 폴리뉴클레오타이드의 5' 영역 내 위치는 시토신 또는 메틸-시토신이다.
바람직한 또 다른 실시예에서, 두 번째 단일 가닥 폴리뉴클레오타이드의 5' 말단은 상보적인 가닥이 (ii) 단계 신장 동안 형성될 때, 제한 엔도뉴클레아제의 목적 부위를 형성하는 상보적인 가닥으로 복제되는 서열을 포함한다.
두 번째 단일 가닥 폴리뉴클레오타이드는 팔린드롬 서열일 수도 아닐 수도 있는 서열을 포함한다. 팔린드롬 서열은 한 가닥에서 5' 에서 3'으로 읽히든 다른 상보적인 가닥에서 5'에서 3'으로 읽히든지 동일하게 읽히는 핵산 서열이다.
상기 표현 “상보적인 가닥으로 복제된”은 합성된 상보적인 가닥이 두 번째 단일 가닥 폴리뉴클레오타이드의 상보적이고 역 평행한 서열(antiparallel sequence)을 포함하는 것을 의미한다.
Y-어댑터는 본 발명의 방법의 생성물을 추적가능하도록 하는 조합 바코드를 포함할 수 있다.
두 번째 단일 가닥 폴리뉴클레오타이드는 폴리뉴클레오타이드 라이브러리로 제공되고, 상기 라이브러리의 각 구성은 상기 폴리뉴클레오타이드의 5' 영역 내 위치한 조합 서열(또는 바코드 서열 또는 조합 바코드로 지칭되는)에 의해 다른 것과 구별되고 상기 조합 서열은 첫 번째 단일 가닥 폴리뉴클레오타이드와 상보적인 서열을 나타내는 영역과 관련하여 업스트림에 위치하고, 이에 의해 DNA Y-어댑터 라이브러리를 생산한다. 더 많은 바람직한 실시예에서, 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약을 처리하는 것에 저항성이 있는 하나 또는 이상의 변형된 시토신을 포함한다. 도 15는 본 발명의 세 번째 방법에 따라 조합 서열을 포함하는 DNA Y-어댑터를 생성하는 방법의 일 실시예를 나타낸다.
조합 서열은 다수의 축퇴 뉴클레오타이드에 의해 형성된다(각 축퇴 뉴클레오타이드는 둘 또는 이상의 뉴클레오타이드 혼합인). 만약 X가 조합 서열내에서 다른 축퇴 뉴클레오타이드의 수이고 Y가 조합 서열내에서 뉴클레오타이드의 길이라면, 다른 어댑터의 수는 XY에 의해 얻을 수 있다. 예를 들면, 조합 서열이 A, T 또는 G인 4개의 뉴틀레오타이드의 길이를 가진다면, 다른 어댑터의 수는 34=81이고, Y-어댑터-포함 DNA 분자 내에서 두 어댑터의 조합의 수는 812=6561이다. 만약 조합 서열이 A, T 또는 G일 수 있는 5개의 뉴클레오타이드의 길이를 가진다면, 다른 어댑터의 수는 243이고 Y-어댑터-포함 DNA 분자 내에서 두 어댑터의 조합의 수는 59049이다.
상기 표현 “업스트림”은 가닥의 5' 말단쪽 영역을 의미한다.
또 다른 실시예에서, 첫 번째 단일 가닥 폴리뉴클레오타이드 및/또는 두 번째 단일 가닥 폴리뉴클레오타이드는 지지체에 고정되어 제공되고, 상기 고정은 첫 번째 단일 가닥 폴리뉴클레오타이드의 5' 말단 또는 두 번째 단일 가닥 폴리뉴클레오타이드의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합하여 수행된다. 바람직하게는, 상기 결합은 공유결합이다.
또 다른 실시예에서, 첫 번째 단일 가닥 폴리뉴클레오타이드 및 두 번째 단일 가닥 폴리뉴클레오타이드는 첫 번째 단일 가닥 폴리뉴클레오타이드의 5' 말단과 두 번째 단일 가닥 폴리뉴클레오타이드의 3' 말단 사이에 링커에 의해 결합되고 상기 링커는 지지체에 고정된다. 상기 링커의 지지체에 결합은 신장 단계를 용이하게 한다. 상기 링커와 지지체간의 결합은 Y-어댑터의 합선이 어댑터를 방출시키기 위해 종료된 후 끊어질 수 있다. 링커에 의해 지지체에 결합된 어댑터는 또한 분자들을 접합시키는데 사용될 수 있다.
본 발명은 본 발명의 방법의 Y-어댑터를 얻기 위한 폴리뉴클레오타이드를 포함하는 키트를 제공한다.
다른 측면에서, 본 발명은 다음 구성을 포함하는 키트에 관한 것이다.
(i) 5' 영역 및 3' 영역을 포함하는 첫 번째 단일 가닥 폴리뉴클레오타이드, 및
(ii) 5' 영역 및 3' 영역을 포함하는 두 번째 폴리뉴클레오타이드로, 상기 3' 영역은 상기 3' 영역 내에서 3' 영역의 3' 말단에 위치하는 첫 번째 분절과 5' 영역 부근에 위치하는 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하고 상기 두 번째 뉴클레오타이드의 3' 말단은 가역적으로 차단되어 있고,
상기 첫 번째 단일 가닥 폴리뉴클레오타이드의 3'영역은 두 번째 폴리뉴클레오타이드의 5' 영역의 적어도 한 부분에 상보적이다.
상기 표현 “키트”는 다른 형태의 생물학적 시약, 용기, 상업적 판매를 위한 패키징(packaging) 같은 패키지(packages), 전자 하드웨어 구성요소 등을 포함하는 둘 또는 이상의 요소 또는 구성요소의 조합을 의미한다.
적합한 키트는 적합한 용기내에 본 발명에 다른 사용을 위한 다양한 시약 및 튜브, 유리병 및 1수축 포장되고 취입 성형된 포장물을 포함하는 포장물질을 포함한다. 또한, 본 발명의 키트는 키트에 있는 다른 성분들의 동시, 순차 또는 별도의 사용 지침을 포함할 수 있다. 상기 지침은 인쇄물의 형태 또는 전자 저장매체(자기 디스크, 테이프 등), 광학 매체(CD-ROM, DVD) 등과 같이 피사체에 의해 판독될 수 있는 설명서를 저장할 수 있는 전자 보조기기 형태일 수 있다. 또한, 상기 매체는 상기 지침을 제공하는 인터넷 주소를 포함할 수 있다.
본 발명의 키트의 바람직한 실시예에서, 두 번째 폴리뉴클레오타이드는 폴리뉴클레오타이드 라이브러리로 제공되고, 상기 각 구성들은 두 번째 폴리뉴클레오타이드 5' 영역 내 위치한 조합 서열 및 첫 번째 단일 가닥 폴리뉴클레오타이드에 서열 상보성을 나타내는 영역과 관련된 업스트림에 의해 다른 것과 구별될 수 있다. 더 바람직한 일 실시예에서, 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약을 처리하는 것에 저항성을 가지는 하나 또는 이상의 변형된 시토신을 포함한다.
또 다른 실시예에서, 첫 번째 단일 가닥 폴리뉴클레오타이드 및/또는 두 번째 폴리뉴클레오타이드도 변형된 시토신을 포함한다.
또 다른 실시예에서, 두 번째 폴리뉴클레오타이드의 5' 영역은 이중 가닥 영역으로 전환될 때, 제한 엔도뉴클레아제를 위한 목적 부위를 생성하는 서열을 포함한다.
선택적으로, 키트는 하나 또는 이상의 추가 구성요소를 포함한다.
또 다른 실시예에서 키트는 다음으로 구성되는 그룹으로부터 선택되는 하나 또는 이상의 구성요소를 포함한다:
(i) DNA 중합효소;
(ii) A, G, C 및 T로부터 선택된 하나 또는 이상의 뉴클레오타이드;
(iii) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 이상의 변형된 시토신;
(iv) 두 번째 폴리뉴클레오타이드의 3' 말단으로부터 블락킹 그룹을 제거할 수 있는 시약;
(v) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약; 및
(vi) 두 번째 폴리뉴클레오타이드의 5' 말단 내 서열에 의해서 형성되는 목적 부위에 대해 특이적인 제한 엔도뉴클레아제.
상기 표현 “DNA 중합효소”는 주형으로 핵산을 사용하고 새롭게 형성될 가닥의 3'-OH 말단에 만 자유 핵산을 첨가하여 신규 DNA 가닥을 합성하는 효소를 의미한다. 이것은 5' 에서3' 방향으로 새 가닥을 신장시킨다. DNA 중합효소는 자연발생적인 DNA 중합효소 또는 상기 언급된 활성을 가지는 자연적 효소의 변형물일 수 있다.
본 키트에서 제공된 상기 뉴클레오타이드는 변형된 뉴클레오타이드일 수 있다. 변형된 뉴클레오타이드의 예로 메틸 시토신 및 하이드로메틸시토신과 같은 변형된 시토신이다.
상기 표현 “두 번째 폴리뉴클레오타이드의 3' 말단으로부터 블락킹 그룹을 제거할 수 있는 시약”은 두 번째 폴리뉴클레오타이드의 3' 말단의 차단을 푸는 시약을 의미한다. 상기 시약은 사용된 특정 블락킹 그룹에 의존한다. 적합한 시약은 상기 개시하였다(예를 들면, 산, 포스핀 등)
목적 부위에 특이적인 제한 엔도뉴클레아제는 목적 서열 및 근처를 특이적으로 인식하고 절단할 수 있는 제한 엔도뉴클레아제이다.
바람직한 일 실시예에서, 하나 또는 이상의 변형된 시토신이 메틸시토신, 하이드로메틸시토신 및 그들의 조합으로 구성된 그룹으로부터 선택된다.
본 발명은 또한 본 발명의 방법의 Y-어댑터 라이브러리 및 추가 구성요소를 포함하는 키트를 제공한다.
또 다른 측면에서, 본 발명은 다음을 포함하는 키트에 관한 것이다:
(i) Y-어댑터 라이브러리, 상기 각 Y-어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역 내에서 3' 영역의 3' 말단에 위치하는 첫 번째 분절과 첫 번째 DNA 가닥의 3' 영영과 이중 가닥 영영을 형성하는 두 번째 DNA 가닥 영역 근처에 위치하는 두 번째 분절 사이의 혼성화에 의한 헤어핀 고리를 형성하고 상기 라이브러리의 각 구성은 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역 사이에 형성된 이중 가닥 영역 내에 위치한 조합 서열에 의해 다른 것과 구별될 수 있다.
(ii) 다음의 구성요소로 이루어진 그룹으로부터 선택되는 하나 또는 이상의 구성요소:
a) DNA 중합효소;
b) A, G, C 및 T로부터 선택된 하나 또는 이상의 뉴클레오타이드;
c) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 이상의 변형된 시토신;
d) 두 번째 폴리뉴클레오타이드의 3' 말단으로부터 블락킹 그룹을 제거할 수 있는 시약;
e) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약; 및
f) 두 번째 뉴클레오타이드의 5' 에 서 되는 에 적인 뉴클레아제.
특히 이미 개시된 Y-어댑터 라이브러리 및 Y-어댑터를 얻기 위한 키트의 추가 구성요소를 개시하는 모든 실시예들을 본 발명의 방법의 Y-어댑터 라이브러리를 포함하는 키드에 적용할 수 있다.
다른 용어 및 표현은 이미 정의되었다.
조합 서열을 포함하는 이중 가닥 DNA 어댑터 라이브러리 및 그것을 얻는 방법
본 발명은 또한 본 발명의 방법 또는 조합 바코드를 필요로 하는 다른 방법에 사용될 수 있는 조합 서열("바코드 서열" 또는 "조합 바코드")을 가지는 이중 가닥 DNA 어댑터 라이브러리를 합성하는 방법을 제공한다.
어댑터를 합성하기 위해 전구체가 조합 영역을 포함하는 것 중 하나에 대하여 두 개의 부분적으로 상보적인 올리고뉴클레오타이드로 이루어져 사용될 수 있다. 이 조합 영역은 전구체 형태에서 단일 가닥 DNA 이다. 이 전구체 형태를 적합한 효소와 배양한 후, 불완전한 올리고뉴클레오타이드가 완전해지고 조합 영역은 이중 가닥 DNA가 된다.
한 측면에서, 본 발명은 이중 가닥 DNA 어댑터 라이브러리를 얻는 방법에 관한 것이고, 상기 각 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고 각 어댑터는 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치한 조합 서열에 의해 다른 것과 구별될 수 있고, 상기 방법은 다의 단계를 포함한다,
(i) 불변 영역 및 조합 영역을 포함하는 단일 가닥 DNA 분자 집단을 제공하는 단계로, 상기 단일 가닥 DNA 분자는 조합 영역 내 서열에 의해 다른 것과 구별될 수 있고, 상기 불변 영역은 조합 영역에 대하여 3' 에 위치하고 상기 3' 말단은 가역적으로 차단된다 및
(ii) 주형으로 (i) 단계의 단일 가닥 DNA 분자 및 단일 가닥 DNA 분자의 불변 영역에 완전히 또는 부분적으로 혼성화하는 신장 프라이머를 사용하여 이중 가닥 DNA를 생성하는 단계로, 이에 의해 이중 가닥 조합 서열이 생성된다.
상기 표현 “불변 영역”은 서열이 단일 가닥 DNA 분자 집단의 각 구성에 대해 동일한 경우에 단일 가닥 DNA 분자 내 영역을 의미한다.
상기 표현 본 발명의 이 측면에서 사용된 “가역적으로 차단된”은 합성 동안 프라이머가 결합하는 것으로부터 폴리뉴클레오타이드를 방해해 가역적인 블락킹 그룹으로 가역적으로 변형된 것을 의미한다. 상기 변형은 가역적이기 때문에, 상기 블락킹 그룹은 추가 단계로 제거될 수 있다. 가역적 블락킹 그룹의 예는 "본 발명의 Y-어댑터, 그들을 합성하는 방법 및 키트" 에 개시되었다.
상기 표현 "가역적으로 차단된"은 첫 번째 DNA 가닥의 5' 말단 및 두 번째 DNA 가닥의 3' 말단을 연결하는 링커를 포함할 수 있는 상기 링커는 제거될 수 있다.
상기 표현 “가역적으로 차단된”은 또한 단일 가닥 DNA 분자의 3' 말단이 지지체에 결합함으로써 단일 가닥 DNA 분자가 지지체에 고정화되는 것을 의미한다. 차단은 가역적이므로, 상기 단일 가닥 DNA 분자의 3' 말단 및 지지체간의 상기 연결은 추가 단계에서 끊어질 수 있다.
상기 표현 “단일 가닥 DNA 분자의 불변영역에 완전히 또는 부분적으로 혼성화하는”은 단일 가닥 DNA 분자의 불변 영역에 안정한 이중 가닥 폴리뉴클레오타이드를 형성하기 위해 비공유적으로 신장 프라이머가 완전히 또는 부분적으로 결합하는 것을 의미한다. 상기 표현 “혼성화” 및 “혼성화 조건”은 본 발명의 첫 번째 방법에서 정의되었다.
신장 프라이머는 100% 프라이머가 영역에 혼성화하는 경우 단일 가닥 DNA 분자의 불변영역에 완전히 혼성화한다. 신장 프라이머는 100% 이하의 프라이머가 상기 영역에 혼성화하는 경우, 단일 가닥 DNA 분자의 불변 영역에 부분적으로 혼성화한다. 바람직하게는, 적어도 0.1%, 적어도 1%, 적어도 2%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%의 신장 프라이머는 단일 가닥 DNA 분자의 불변 영역과 혼성화하지 않는다.
상기 표현 “조합 영역”은 서열이 단일 가닥 DNA 분자 집단의 각 구성에 대해 차이가 있는 경우에 단일 가닥 DNA 영역 내 가변 영역을 의미한다. 상기 용어 조합 서열은 이미 정의되었다.
상기 표현 "새롭게 생성된 가닥으로 조합 영역을 복제하는"은 새롭게 생성된 가닥이 단일 가닥 DNA 분자의 조합 영역에 대해 상보적이고 반평행 서열을 포함하는 것을 의미한다.
바람직한 실시예에서, 본 발명은 단일 가닥 DNA 분자의 3' 말단으로부터 블락킹 그룹을 제거하는 것을 더 포함한다.
또 다른 실시예에서, 신장 프라이머는 단일 가닥 DNA 분자의 불변 영역과 혼성화하지 않는 오버행 5' 영역을 포함한다.
또 다른 실시예에서 단일 가닥 DNA 분자의 상기 불변 영역은 신장 프라이머와 혼성화하지 않는 오버행 3' 영역을 포함한다.
또 다른 실시예에서 단일 가닥 DNA 분자의 불변 영역은 상기 불변 영역내 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성한다.
상기 조합 서열은 별도로 생성될 수 있고 그 후 조합 어댑터를 생성하기 위해 다른 어댑터에 첨가될 수 있다. 그러므로, 어댑터 라이브러리는 더 복잡한 어댑터를 얻기 위해 불완전한 다른 어댑터에 부착할 수 있는 모듈로써 사용될 수 있다. 예를 들면, 두 상보적인 가닥에 의해 형성된 조합 어댑터 라이브러리는 조합 영역을 가진 Y-어댑터 집합을 얻기 위해 비 조합 Y-어댑터에 접합될 수 있다.
또 다른 실시예에서 본 방법은 어댑터 라이브러리를 두 번째 DNA 분자에 접합하는 것을 더 포함할 수 있고, 상기 두 번째 DNA 분자는 이중 가닥 영역, 어댑터 분자의 말단들과 호환가능한 말단을 가진다. 바람직하게는, 상기 두 번째 DNA 분자는 서로 혼성화되지 않는 첫 번째 가닥의 5' 영역 및/또는 두 번째 가닥의 3' 영역에 오버행 영역을 포함한다. 더 바람직한 실시예에서, 두 번째 가닥에서 3' 오버행 영역은 상기 영역 내 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성한다.
또 다른 실시예에서 (i) 단계의 각 단일 가닥 DNA 분자는 지지체에 고정되어 제공된다. 더 바람직한 일 실시예에서 상기 고정은 단일 가닥 DNA 분자의 5' 말단을 상기 지지체에 결합시켜 수행되고, 바람직하게는 공유결합에 의해서 결합된다. 또 다른 실시예에서, 상기 고정은 상기 지지체에 단일 가닥 DNA 분자의 3' 말단을 결합시킴으로써 수행되고, 바람직하게는 공유결합에 의해서 결합된다. 또 다른 바람직한 실시예에서 단일 가닥 DNA 분자의 불변 영역이 상기 불변 영역 내 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하는 경우, 상기 고정은 단일 가닥 DNA 분자의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합시킴으로써, 바람직하게는 공유결합 시킴으로써 수행된다.
또 다른 실시예에서, 첫 번째 DNA가닥 및 두 번째 DNA 가닥은 첫 번째 DNA 가닥의 5' 말단 및 두 번째 DNA 가닥의 3' 말단 간에 링커에 의해 결합되고 상기 링커는 지지체에 결합된다. 상기 링커의 지지체에 결합은 신장단계를 용이하게 한다. 링커와 지지체 간의 결합은 어댑터의 합성이 어댑터 방출을 위해 끝난 후 끊어질 수 있다. 링커에 의해 지지체에 결합된 어댑터는 또한 분자들을 접합시키는데 사용될 수 있다.
본 발명은 상기 방법에 의해 얻은 이중 가닥 DNA 어댑터 분자 라이브러리에 관한 것이다.
또 다른 측면에서, 본 발명은 이중 가닥 DNA 어댑터 분자 라이브러리에 관한 것이고, 상기 DNA 어댑터 분자는 불변 영역 및 가변 영역을 포함하고, 상기 각 이중 가닥 DNA 어댑터 분자는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고 상기 각 어댑터는 첫 번째 DNA 가닥의 3' 영역과 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치한 가변 영역 내의 조합 서열에 의해서 다른 것과 구별될 수 있다.
바람직한 일 실시예에서, 가닥의 중 적어도 하나의 3' 말단은 가역적으로 차단된다.
또 다른 실시예에서 하나 또는 각 모든 가닥들은 다른 가닥과 혼성화되지 않는 오버행 영역을 포함한다. 바람직하게는 가닥 중 하나의 불변 영역은 상기 불변 영역 내의 첫 번째 및 두 번째 분절간 혼성화에 의해 헤어핀 고리를 형성한다.
도 16은 본 발명의 상기 측면의 다른 실시예를 나타내고 상기 Y-어댑터는 본 발명의 세 번째 방법에 따라 헤어핀을 포함하고, 본 발명의 네 번째, 여섯 번째 및 일곱 번째 방법에 따른 Y-어댑터, 헤미어댑터 및 플레인(plain) 어댑터가 얻어진다.
상기 발명은 명확성 및 이해를 목적으로 다소 상세하게 설명되었지만, 본 발명 및 청구항의 실제 범위로부터 벗어나지 않고 형태 및 세부사항에서 다양한 변화가 이루어질 수 있다는 것은 이 명세서를 읽음으로써 본 발명의 기술분야의 통상의 기술자에 의해 이해될 것이다.
본 발명은 단지 예시로써, 본 발명의 범위를 제한하는 어떠한 경우에 고려되어야하는 다음의 실시예를 이용하여 설명한다.
실시예
실시예 1: 두 개의 원래 가닥이 물리적으로 짝지어지고 단지 원하는 중간 생성물이 선택적으로 여과되고, 바이설파이트로 변환되고, 증폭되고 시퀀싱되는 방법에 대한 프로토콜
어댑터 제공. 헤어핀 어댑터들을 10 μM 올리코뉴클레오타이드 c15_Hairp01-5'P (SEQ ID NO: 1)로부터 제공하였다. 이중 가닥 어댑터를 20 μM oligonucleotide c14_Hang04 5'P (SEQ ID NO: 2) 및 20 μM oligonucleotide c14_BIO05noB (SEQ ID NO: 3)으로부터 제공하였다. 어댑터들를 열 순환기에서(95°2'; 80°2'; 65°10'; 37°10'; 25°5'; 4°-'), 냉각 후 초기 변성에 의해 혼성화시켰다.
접합 과정. 4 pmol의 이중 가닥 DNA 단편(30 mer)들을 3 μM 헤어핀 어댑터 및 3 μM 이중 가닥 어댑터와 함께 20 μL 최종 부피 내에서 23℃, 15분 동안 T4DNA 리가아제 및 T4 완충액의 존재하에서 최총 농도가 0.2 μM가 되도록 혼합하였다. 상기 반응 생성물을 G50컬럼으로 정제하였다.
접합 생성물 포집. 적절한 반응 생성물을 헤어핀 어댑터에 상보적인 비오틴화 올리고뉴클레오타이드를 사용하여 포집하였다: 3 μL의 20 μM c14_BIO04-5'B (SEQ ID NO: 4)를 SSC 존재하에서 10 μL 접합 반응물에 첨가하였다. 반응 튜브를 천천히 혼합하고 열 순환기에서 배양하였다(90°2'; 65°5'; 60°5'; 55°5'; 25°-'). 30 μL의 M-270 비드를 재현탁하였고 제공업체의 지침에 따라 최종볼륨 90 μL의 BW1x를 제공하였다. M-270 비드를 포집반응물에 첨가하였고 15 분 동안 기본 온도에서 배양하였다. 반응물을 세척하고 접합 생성물을 M-270 비드로부터 방출시켰다. 비드들을 SCC1x 로 재현탁하고 95℃에서 2분 동안 열 가열 블록(heating block) 내에서 배양하였다.
바이설파이트. 50 μL의 접합 생성 포집물에 표준 절차에 따라 또는 제공업체의 지침에 따라 소듐 바이설파이트를 처리하였다. 최종 생성물을 30 μL 용출 버퍼에서 용출하였다.
증폭. 1 μL 이전 단계 생성물을 프라이머 c14_amp02F (SEQ ID NO: 5) 및 c14_amp02R (SEQ ID NO: 6)으로 Zymotag 또는 TurboPfu와 같은 중합효소를 사용하여 증폭하였다. 20 μM의 1 μL 각 프라이머를 30 μL 최종 부피 반응물을 위해 사용하였다. PCR을 20싸이클 수행하였다(95°2'; 62°30''; 72°1'). 생성물을 G50 컬럼으로 정제하고 PAGE 전기영동으로 평가하였다.
시퀀싱. 이전 단계로부터의 최종 생성물을 Ion Torrent's protocol에 따라 처리하고 Integrative Genomics Viewer를 사용하여 도시하였다.
실시예 2: 상보적인 가닥을 생성하고 그들의 주형과 물리적으로 결합시키고, 그리고 전체 결과 중간 생성물은 바이설파이트로 전환되고, 증폭되고 시퀀싱되는 방법 프로토콜
어댑터 제공. Y-어댑터를 20 μM 올리코뉴클레오타이드 c15_YA4 (SEQ ID NO: 7) 및 20 μM 올리고뉴클레오타이드 c15_Hairp06 (SEQ ID NO: 8)로부터 제공하였다. 어댑터들를 열 순환기에서(95°2'; 80°2'; 65°10'; 37°10'; 25°5'; 4°-'), 냉각 후 초기 변성에 의해 혼성화시켰다.
접합 과정. 4 pmol의 이중 가닥 DNA 단편(30 mer)들을 2.5 μM Y-어댑터와 함께 20 μL 최종 부피 내에서 23℃에서 15분 동안 T4DNA 리가아제 및 T4 완충액의 존재하에서 최총 농도가 0.2 μM가 되도록 혼합하였다. 상기 반응 생성물을 G50컬럼으로 정제하였다.
접합 생성물 확장. 접합 생성물을 30 μL 부피의 반응에서 dNTPs로 최적 완충액 내에서 반응물에 중합효소를 추가함으로써 신장하였다. 상기 반응 튜브를 천천히 혼합하고 열 순환기에서 배양하였다(25°2'; 72°10'; 4°-').
바이설파이트. 20 μL의 접합 생성 포집물에 표준 절차에 따라 또는 제공업체의 지침에 따라 소듐 바이설파이트를 처리하였다. 최종 생성물을 20 μL 용출 버퍼에서 용출하였다.
증폭. 1 μL의 이전 단계 생성물을 프라이머 c14_amp02F (SEQ ID NO: 5) 및 c14_amp02R (SEQ ID NO: 6)으로 Zymotag 또는 TurboPfu와 같은 중합효소를 사용하여 증폭하였다. 20 μM의 1 μL 각 프라이머를 30 μL 최종 부피 반응물을 위해 사용하였다. PCR을 20싸이클 수행하였다(95°2'; 62°30''; 72°1'). 생성물을 G50 컬럼으로 정제하고 PAGE 전기영동으로 평가하였다.
시퀀싱. 이전 단계로부터의 최종 생성물을 Ion Torrent's protocol에 따라 처리하고 Integrative Genomics Viewer를 사용하여 도시하였다.
올리고뉴클레오타이드 서열
c15_Hairp01-5'P 5'-pho-GCTCCGATCGAGGGAGGTAGGATGGAGGAATGGCTCGATCGGA
GCT-3' (서열번호 1)
c14_Hang04 5'P 5'-pho-GCAAGCAACGACGGTAACGGGCGGCTC-3' (서열번호 2)
c14_BIO05noB 5'-CCGAGCCGCCCGTTACCGTCGTTGCTTGCT-3' (서열번호 3)
c14_BIO04-5'B 5'-bio-AAAAAAAAACATTCCTCCATCCTACCTC-3' (서열번호 4)
c14_amp02F 5'-ACCCATTACCATCATTACTTAC-3' (서열번호 5)
c14_amp02R 5'-GAGTTGTTTGTTATTGTTGTTGTTTGT-3' (서열번호 6)
c15_YA4 5'- GAGCCGCCCGTTACCGTCGTTGCTTGCTTCGGCTTCCTGAGTGT-3'
(서열번호 7)
c15_Hairp06 5'-pho-CACTCAGGAAGCCGAAGCGCTCCGATCGAGTGTTGTCTCGATC
GGAGC-3' (서열번호 8)
pho: phosphate; bio: biotin
본 발명의 항목
본 발명은 다음 항목을 제공한다.
[1]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 이중 가닥 DNA 분자들 집단을 첫 번째 어댑터 분자 및 두 번째 어댑터 분자에 접촉시키는 단계로,
상기 첫 번째 어댑터 분자는 이중 가닥 DNA의 말단과 호환가능한 하나의 말단에 말단을 가진 이중 가닥 DNA 분자이고,
상기 두 번째 어댑터 분자는 헤어핀 고리 영역 및 이중 가닥 영역을 포함하는 헤어핀 어댑터 이고, 상기 이중 가닥 영역은 이중 가닥 DNA 분자의 말단과 호환가능한 말단을 포함하고, 및
상기 접촉시키는 단계는 복수의 어댑터-변형 DNA 분자를 생성하기 위해 첫 번째 및/또는 두 번째 어댑터 분자를 DNA 분자에 접합하기에 적합한 조건아래에서 수행되고,
(ii) (i) 단계에서 얻은 어댑터-변형 DNA 분자 집단으로부터 어댑터-변형 DNA 분자의 한 말단 또는 양 말단에 두 번째 어댑터 분자를 포함하는 분자들을 회수하는 단계,
(iii) 첫 번째 어댑터 분자 서열의 적어도 일부분과 상보적인 서열을 가진 프라이머를 사용하여 가닥 합성이 일어날 수 있는 조건 아래에서 주형으로 (ii) 단계에서 얻은 어댑터-변형 DNA 분자를 사용하여 DNA 가닥을 합성하는 단계, 및
(iv) 첫 번째 어댑터 영역의 적어도 일부분과 상보적인 서열을 가진 프라이머를 사용하여 (iii) 단계에서 얻은 이중 가닥 DNA 분자를 선택적으로 증폭하는 단계.
[2]. [1]에 있어서, 상기 (ii) 회수 단계는 두 번째 어댑터 서열의 적어도 일부분에 상보적인 서열을 포함하는 폴리뉴클레오타이드 및 정제 태그를 사용하여 수행된다.
[3]. [1] 또는 [2]에 있어서, 상기 (ii) 단계에서 얻은 DNA 분자는 (iii) 단계 또는, 경우에 따라 (iv) 단계 후 얻은 반응 혼합물로부터 회수된다.
[4]. [3]에 있어서, 상기 반응 혼합물로부터의 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, 상기 첫 번째 및/또는 두 번째 어댑터는 상기 결합 쌍의 두 번째 구성으로 변형된다.
[5]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 이중 가닥 DNA 분자들 집단을 첫 번째 어댑터 분자 및 두 번째 어댑터 분자에 접촉시키는 단계,
상기 첫 번째 어댑터 분자는 이중 가닥 DNA 의 말단에 호환가능한 한 말단을 가지는 이중 가닥 DNA 분자이고,
상기 두 번째 어댑터 분자는 헤어핀 고리 영역 및 이중 가닥 영역을 포함하는 헤어핀 어댑터이고, 상기 이중 가닥 영역은 이중 가닥 DNA 분자의 말단들에 호환가능한 말단들을 포함하고,
상기 첫 번째 어댑터 분자 또는 두 번째 어댑터 분자 또는 둘 다 지지체에 고정되어 제공되고, 상기 고정은 첫 번째 어댑터 분자의 가닥 중 한 말단 또는 두 번째 어댑터 분자의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합시킴으로써 수행되고 및
상기 접촉시키는 것은 복수의 어댑터-변형 DNA 분자를 얻기 위해 DNA 분자들에 첫 번째 및/또는 두 번째 어댑터 분자를 접합시키기에 적합한 조건아래에서 수행되는 것인 단계,
(ii) 주형으로 (i) 단계에서 얻은 어댑터-변형 DNA 분자 및 첫 번째 어댑터 분자의 서열의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 이용하여 DNA 가닥을 합성하는 단계 및
(iii) 첫 번째 어댑터 영역의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 (ii) 단계에서 얻은 이중 가닥 DNA 분자들을 선택적으로 증폭하는 단계.
[6]. [1] 내지 [5]에 있어서, (i) 단계에서 사용된 이중 가닥 DNA 분자들은 게놈 DNA 단편들이다.
[7]. [1] 내지 [6]에 있어서, (i) 단계에서 사용된 상기 이중 가닥 DNA 분자들은 상기 (i) 단계 전에 말단-수정된다.
[8]. [7]에 있어서 말단-수정 단계 후 DNA 분자들을 dA-tailing 단계를 더 포함하는 방법.
[9]. [1] 내지 [8]에 있어서 상기 첫 번째 및/또는 두 번째 어댑터 분자들은 어댑터 분자들의 첫 번째 및 두 번째 라이브러리로 각각 별개로 제공되고, 상기 각 라이브러리의 구성은 어댑터 서열 내 조합 서열에 의해 다른 것들과 구별될 수 있다.
[10]. [1] 내지 [9]에 있어서 상기 어댑터-변형 DNA 분자들은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 상기 라이브러리가 [1]에 따른 방법에 의해 얻어지면 (iii) 단계 전에 처리되고 [5]에 따른 방법에 의해 얻어지면 (ii) 단계 전에 처리되고 상기 [1]의 (iii) 단계 및 (iv) 단계 또는, 경우에 따라, [5]의 (ii) 단계 및 (iii) 단계에서 사용된 프라이머는 상기 시약으로 처리된 후 첫 번째 어댑터 분자에 특이적이다.
[11]. [10]에 있어서 어댑터 서열 내 상기 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가진 변형된 시토신을 포함한다.
[12]. [1] 내지 [11]에 있어서 라이브러리가 [1]의 방법에 따라 얻어진 경우에 상기 (iii) 단계 또는, 경우에 따라, (iv) 단계에서 또는 [5]의 방법에 따라 얻어진 경우에 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 얻은 상기 DNA 분자들은 반응 혼합물로부터 회수된다.
[13]. [12]에 있어서 상기 반응 혼합물로부터 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, [1]의 상기 (iii) 단계 또는, 경우에 따라, (iv) 단계에서 또는 [5]의 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 사용된 상기 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
[14]. [1] 내지 [13]에 있어서 상기 이중 가닥 DNA 분자들의 집단은 어댑터 분자들로 DNA 분자들에 어댑터 분자들의 접합에 적합한 조건아래에서 (i) 단계 전에 처리되고 이에 의해 상기 DNA 분자내에 점착성 말단이 도입된다.
[15]. [1] 내지 [14]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계 및 상기 라이브러리가 [1]의 방법에 의해 얻어지면 (iii) 단계 또는, 경우에 따라, (iv) 단계에서 또는 상기 라이브러리가 [5]의 방법에 의해 얻어지면 (i) 단계 또는 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계를 포함하는 이중 가닥 DNA 분자들 집단의 서열을 결정하는 방법.
[16]. 다음의 단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법
(i) [1] 내지 [14]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계로, 상기 복수의 어댑터-변형 DNA 분자들은 라이브러리가 [1]의 방법에 의해 얻어지면 (iii) 단계 전에 또는 [5]의 방법에 의해 얻어지면 (ii) 단계 전에 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리되고 상기 라이브러리가 [1]의 방법에 의해 얻어지면 (iii) 단계 및 (iv) 단계에서 또는 [5]의 방법에 의해 얻어지면 (ii) 단계 및 (iii) 단계에서 사용된 프라이머는 상기 시약으로 처리된 후 첫 번째 어댑터 분자에 특이적이다 및
(ii) 라이브러리가 [1]의 방법에 의해 얻어진 경우 (iii) 단계 또는 [5]의 방법에 의해 얻어진 경우 (ii) 단계 전에 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리된 라이브러리가 [1]의 방법에 의해 얻어진 경우 (ii) 단계 또는 (iii) 단계 또는, 경우에 따라, (iv) 단계에서 또는 [5]의 방법에 의해 얻어진 경우 (i) 단계 또는 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계,
지정 위치에 메틸화된 시토신의 존재는 시토신이 가닥 중 하나에 나타나고 구아닌이 다른 가닥에 대응 위치에 나타나는 경우 결정되고 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 가닥 중 하나에 나타나고 구아닌이 다른 가닥내 대응 위치에 나타나는 경우 결정된다.
[17]. 다음 단계들을 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 이중 가닥 DNA 분자들 집단을 DNA Y-어댑터와 접촉시키는 단계로, 상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 Y-어댑터의 두 번째 DNA 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 이중 가닥 DNA 분자들의 말단들에 호환가능하고, 상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3' 영역의 3' 말단에 위치하는 첫 번째 분절 및 두 번째 DNA 가닥의 5' 영역 근처에 위치하는 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 상기 3' 영역 내에 형성한다.
상기 접촉시키는 것은 이중 가닥 DNA 분자들의 각 말단들에 Y-어댑터의 접합에 적합한 조건아래에서 수행되어 복수의 Y-어댑터-포함 DNA 분자들을 얻을 수 있다.
(ii) (i) 단계에서 얻은 각 DNA 분자들의 각 가닥들을 주형으로 사용하여 Y-어댑터 분자내 두 번째 DNA 가닥의 3' 말단으로부터 중합효소 신장에 의해 (i) 단계에서 얻은 DNA 분자들의 각 가닥들을 이중 가닥 DNA 분자로 전환시키는 단계 및
(iii) (ii) 단계에서 얻은 이중 가닥 DNA 분자의 적어도 일부분에 상보적인 서열을 가진 프라이머를 사용하여 (ii) 단계에서 얻은 이중 가닥 DNA 분자들을 선택적으로 증폭하는 단계.
[18]. [17]에 있어서 (i) 단계에서 얻은 상기 Y-어댑터-포함 DNA 분자는 Y-어댑터-포함 DNA 분자들 가닥의 분리에 적합한 조건아래에서 (ii) 단예 전에 처리된다.
[19]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 이중 가닥 DNA 분자들을 Y-어댑터와 접촉시키는 단계로, 상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고,
상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 말단들은 이중 가닥 DNA 분자들의 각 말단들과 호환가능하고,
상기 접촉시키는 것은 이중 가닥 DNA 분자들의 각 말단들에 Y-어댑터의 접합에 적합한 조건아래에서 수행되어 복수의 Y-어댑터-포함 DNA 분자를 얻는다,
(ii) Y-어댑터의 두 번째 가닥과 신장 프라이머의 혼성화에 적합한 조건 아래에서 상기 Y-어댑터-포함 DNA 분자들의 각 가닥을 Y-어댑터의 두 번째 가닥에 상보적인 3' 영역을 포함하는 신장 프라이머와 접촉시키는 단계로, Y-어댑터 분자의 두 번째 DNA 가닥과 혼성화 후 오버행 말단들을 생성한다,
(iii) (ii) 단계에서 생성된 분자들에 헤어핀 어댑터를 접합시키기에 적합한 조건하에서 헤어핀 고리 영역 및 (ii) 단계에서 생성된 분자들 내 오버행 말단들과 호환가능한 오버행 말단을 포함하는 헤어핀 어댑터에 (ii) 단계에서 생성된 분자들을 접촉시키는 단계,
(iv) (ii) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (ii) 단계에서 얻은 DNA 분자들의 각 가닥들을 이중 가닥 DNA 분자로 전환시키는 단계 및
(v) (iv) 단계에서 얻은 이중 가닥 DNA 분자의 적어도 일부분에 상보적인 서열을 가진 적어도 하나의 프라이머를 사용하여 (iv) 단계에서 얻은 이중 가닥 DNA 분자들을 선택적으로 증폭하는 단계.
상기 헤어핀 어댑터에 접합하는 단계(iii) 및 신장 단계(iv) 는 임의의 순서로 또는 동시에 수행될 수 있다.
[20]. [19]에 있어서 (i) 단계 또는 (iii) 단계에서 얻은 상기 Y-어댑터-포함 DNA 분자들은 상기 Y-어댑터-포함 DNA 분자들의 가닥들을 분리하는데 적합한 조건하에서 수행된다.
[21]. [19] 또는 [20]에 있어서 상기 Y-어댑터-포함 DNA 분자들의 각 가닥을 신장 프라이머에 접촉시키는 (ii) 단계 및 (ii) 단계에서 생성된 분자들을 헤어핀 어댑터에 접촉시키는 (iii) 단계는 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공하여 단일단계에서 수행된다.
[22]. [17] 내지 [21]에 있어서 (i) 단계에서 사용된 상기 이중 가닥 DNA 분자들은 게놈 DNA 단편들이다.
[23]. [17] 내지 [22]에 있어서 (i) 단계에서 사용된 상기 이중 가닥 DNA 분자들은 상기 (i) 단계 전에 말단-수정된다.
[24]. [23]에 있어서 말단-수정 후에 DNA 분자들을 dA-tailing 단계를 더 포함한다.
[25]. [17] 내지 [24]에 있어서 상기 Y-어댑터는 어댑터 라이브러리로 제공되고 상기 라이브러리의 각 구성은 첫 번째 DNA 가닥의 3' 영역 및 어댑터의 두 번째 가닥의 5' 영역에 의해 형성된 이중 가닥 영역 내 위치한 조합 서열에 의해 다른 것들과 구별될 수 있다.
[26]. [25]에 있어서 상기 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시킬 수 있는 시약의 처리에 저항성을 가진 변형된 시토신을 포함한다.
[27]. [17] 내지 [26]에 있어서 라이브러리가 [17]의 방법에 의해 얻어지면 (iii) 단계 전에 또는 [19]의 방법에 의해 얻어지면 (v) 단계 전에 상기 어댑터-포함 DNA 분자들은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리되고 상기 [17]의 (iii) 단계 또는, 경우에 따라, [19]의 (v) 단계에서 사용된 프라이머는 [17]의 (ii) 단계 또는, 경우에 따라, [19]의 (iv) 단계에서 얻은 이중 가닥 DNA 분자에 상기 시약을 처리한 결과로 생성된 서열의 적어도 일부분에 상보적이다.
[28]. [17] 내지 [27]에 있어서 상기 헤어핀 어댑터 및/또는 Y-어댑터는 지지체에 고정되어 제공되고, 상기 고정은 헤어핀 어댑터의 헤어핀 고리의 뉴클레오타이드 및/또는 Y-어댑터의 두 번째 DNA 가닥의 헤어핀 고리의 뉴클레오타이드 및/또는 Y-어댑터의 첫 번째 DNA 가닥의 5' 말단을 상기 지지체에 결합시켜 수행된다.
[29]. [17] 내지 [28]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계 및 라이브러리가 [17]의 방법에 의해 얻어지면 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 또는 [19]의 방법에 따라 얻어지면 (iv) 단계 또는, 경우에 따라, (v) 단계에서 얻은 DNA 분자를 시퀀싱하는 단계를 포함하는 이중 가닥 DNA 분자들 집단의 서열을 결정하는 방법.
[30]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단내 메틸화된 시토신을 확인하는 방법
(i) [17] 내지 [28]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계로, 상기 어댑터-변형 DNA 분자들은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 만약 라이브러리가 [17]의 방법에 의해 얻어지면 (iii) 단계 전에 또는 [19]의 방법에 의해 얻어지면 (v) 단계 전에 처리되고 [17]의 방법에 의해 라이브러리가 얻어지면 (iii) 단계에서 또는 [19]의 방법에 의해 라이브러리가 얻어지면 (v) 단계에서 사용된 프라이머는 상기 시약으로 처리된 후 [17]의 (ii) 단계 또는 [19]의 (iv) 단계에서 얻은 이중 가닥 DNA 분자들의 서열에 특이적이다, 및
(ii) 라이브러리가 [17]의 방법에 의해 얻어진 경우 (iii) 단계 또는 [19]의 방법에 의해 얻어진 경우 (v) 단계 전에 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 처리된 라이브러리가 [17]의 방법에 의해 얻어진 경우 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 또는 [19]의 방법에 의해 얻어진 경우 (iv) 단계, 경우에 따라, (v) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계,
지정 위치에 상기 메틸화된 시토신의 존재는 시토신이 가닥 중 하나에 나타나고 구아닌이 다른 가닥에 대응 위치에 나타나는 경우 결정되고 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 가닥 중 하나에 나타나고 구아닌이 다른 가닥 내 대응 위치에 나타나는 경우 결정된다.
[31]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 오버행 말단을 가진 이중 가닥 DNA 분자들 단편의 집단을 생성하기 위한 적합한 조건하에서 이중 가닥 DNA 분자들 집단을 단편화하는 단계로, 상기 각 단편의 각 말단은 헤미어댑터 분자에 결합되고, 상기 헤미어댑터 분자는 첫 번째 DNA 가닥 및, 선택적으로, 두 번째 DNA 가닥을 포함하고 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성에 의해 첫 번째 가닥과 이중 가닥 영역을 형성하고 상기 헤미어댑터 분자는 헤미어댑터의 첫 번째 가닥의 3' 말단 및 이중 가닥 DNA 분자들의 단편의 오버행 말단간의 이중 가닥 DNA 분자들의 단편에 결합된다.
(ii) 대체 두 번째 가닥을 첨가하거나 헤미어댑터의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 단계로, 상기 대체 두 번째 가닥의 5' 영역은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적이고, 상기 대체 두 번째 가닥은 헤미어댑터 분자의 첫 번째 가닥에 상보적인 영역을 포함하여 복수의 Y-어댑터-포함 DNA 분자를 생성한다,
(iii) 대체 Y-어댑터의 대체 두 번째 가닥의 5' 말단과 각 DNA 단편의 3' 말단간에 존재하는 갭을 선택적으로 채우는 단계,
(iv) Y-어댑터의 대체 두 번째 가닥에 신장 프라이머를 혼성화하기에 적합한 조건 아래에서, Y-어댑터의 대체 두 번째 DNA 가닥에 상보적인 3' 영역 및 Y-어댑터의 두 번째 DNA 가닥에 혼성화되지 않는 5' 영역을 포함하는 신장 프라이머와 Y-어댑터-포함 DNA 분자의 각 가닥을 접촉시키는 단계,
(v) (iv) 단계에서 생성된 분자들에 헤어핀 어댑터의 접합에 적합한 조건 아래에서 헤어핀 고리 및 (iv) 단계에서 생성된 분자 내 말단에 호환가능한 말단들을 포함하는 헤어핀 어댑터에 (iv) 단계에서 생성된 분자들을 접촉시키는 단계,
(vi) (iv) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (v) 단계에서 얻은 DNA 분자들의 각 가닥들을 이중 가닥 DNA 분자로 전환시키는 단계 및
(vii) (vi) 단계에서 얻은 이중 가닥 DNA 분자의 적어도 일 부분에 상보적인 서열을 가진 적어도 하나의 프라이머를 사용하여 (vi) 단계에서 얻은 이중 가닥 DNA 분자들을 선택적으로 증폭시키는 단계,
상기 헤어핀 어댑터에 접합시키는 단계(v) 및 신장 단계 (vi) 는 임의의 순서로 또는 동시에 수행될 수 있다.
[32]. [31]에 있어서 상기 단편화하는 (i) 단계는 이중 가닥 DNA 분자들을 이중 가닥 어댑터 분자들에 로드된 전이효소 이량체와 접촉시키는 단계를 포함하는 방법에 의해 수행되고, 상기 어댑터 분자들은 Tn5 역방향 반복 및 가닥들 중 하나의 5' 오배행을 포함하고, Tn5 역방향 반복의 부분을 형성하지 않는 이중 가닥 영역 내 및 단일 가닥 영역 내 상기 시토신이 선택적으로 메틸화되고 상기 접촉시키는 것은 DNA의 단편화 및 각 DNA 단편의 각 말단들에 헤미어댑터 분자들의 부착에 적합한 조건하에서 수행된다.
[33]. [31] 또는 [32]에 있어서 (ii) 단계 또는 경우에 따라, (iii) 단계에서 얻은 상기 Y-어댑터-포함 DNA 분자들 또는 (v) 단계에서 또는, 경우에 따라, (vi) 단계에서 얻은 헤어핀 어댑터-포함 DNA 분자들은 상기 Y-어댑터-포함DNA 분자들의 가닥들을 분리하는데 적합한 조건하에서 수행된다.
[34]. [31] 내지 [33]에 있어서 상기 Y-어댑터-포함 DNA 분자들을 신장프라이머와 접촉시키는 (iv) 단계 및 (iv) 단계에서 생성된 분자들을 헤어핀 어댑터와 접촉시키는 (v) 단계는 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공하여 단일단계로 수행된다.
[35]. [31] 내지 [33]에 있어서 대체 두 번째 가닥을 첨가하거나 헤미어댑터 분자의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 (ii) 단계, 상기 Y-어댑터-포함 DNA 분자의 각 가닥을 신장 프라이머와 접촉시키는 (iv) 단계 및 (iv) 단계에서 생성된 분자들을 헤어핀 어댑터와 접촉시키는 (v) 단계는 대체 두 번째 가닥, 헤어핀 어댑터 및 신장 프라이머를 복합체로 제공하여 단일단계로 수행된다.
[36]. [35]에 있어서 상기 (ii) 내지 (vi) 단계는 동시에 수행된다.
[37]. [31] 내지 [36]에 있어서 (i) 단계에서 사용된 헤미어댑터는 헤미어댑터 라이브러리로 제공되고, 라이브러리의 각 구성은 헤미어댑터의 첫 번째 가닥의 3' 영역 내 조합 서열에 의해 다른 것들과 구별된다.
[38]. [37]에 있어서 (ii) 단계에서 사용된 상기 헤미어댑터의 두 번째 가닥 또는 대체 두 번째 가닥은 상기 조합 서열과 상당한 겹침을 나타내지 않는다.
[39]. [37] 또는 [38]에 있어서 상기 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전화시키는 시약의 처리에 저항성을 가진 하나 또는 이상의 변형된 시토신을 포함한다.
[40]. [31] 내지 [39]에 있어서 상기 어댑터-포함 DNA 분자들은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 (vii) 단계 전에 처리되고 상기 (vii) 단계에서 사용된 프라이머는 (vi) 단계에서 얻은 이중 가닥 DNA 분자들에 상기 시약의 처리로 생성된 서열의 적어도 일부분에 상보적이다.
[41]. [31] 내지 [40]에 있어서 상기 (vi) 단계 또는, 경우에 따라, (vii) 단계에서 얻은 분자들은 반응 혼합물로부터 회수된다.
[42]. [31] 내지 [41]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계 및 (vi) 단계 또는, 경우에 따라, (vii) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계를 포함하는 이중 가닥 DNA 분자들 집단의 서열을 결정하는 방법.
[43]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법
(i) [31] 내지 [41]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계로, 상기 어댑터-변형 DNA 분자들 집단은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 (vii) 단계 전에 처리되고 (vii) 단계에서 사용된 프라이머는 상기 시약으로 처리 된 후 (vi) 단계에서 얻은 이중 가닥 DNA 분자들의 서열에 특이적이다, 및
(ii) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 (vii) 단계 전에 처리 된 (vi) 단계 또는, 경우에 따라, (vii) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계,
지정 위치에 상기 메틸화된 시토신의 존재는 시토신이 가닥 중 하나에 나타나고 구아닌이 다른 가닥에 대응 위치에 나타나는 경우 결정되고 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 가닥 중 하나에 나타나고 구아닌이 다른 가닥내 대응 위치에 나타나는 경우 결정된다.
[44]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법:
(i) 각 어댑터가 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하는 DNA 어댑터 집단에 이중 가닥 DNA 분자들 집단을 접촉시키는 단계로,
상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고 상기 이중 가닥 영역의 말단들은 이중 가닥 DNA 분자들의 말단들과 호환가능하고,
상기 집단의 각 어댑터는 첫 번째 DNA 가닥의 3' 영역 및 두 번재 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치하는 조합 서열에 의해 다른 것들과 구별될 수 있고,
상기 접촉시키는 것은 이중 가닥 DNA 분자들의 각 말단에 어댑터를 접합시키는데 적합한 조건하에서 수행되고,
(ii) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 (i) 단계에서 얻은 어댑터-포함 DNA 분자들을 선택적으로 처리하는 단계 및
(iii) (i) 단계 또는 (ii) 단계에서 얻은 어댑터-포함 DNA 분자의 적어도 일부분에 상보적인 서열을 가진 적어도 하나의 프라이머를 사용하여 (i) 단계 또는, 경우에 따라, (ii) 단계에서 얻은 어댑터-포함 DNA 분자들을 선택적으로 증폭하는 단계.
[45]. [44]에 있어서 상기 첫 번째 DNA 가닥의 5' 영역 및 두 번째 DNA 가닥의 3' 영역은 상보적이다.
[46]. [44]에 있어서 상기 어댑터는 Y-어댑터이고 상기 첫 번째 DNA 가닥의 4' 영역 및 두 번째 DNA 가닥의 3' 영역은 상보적이지 않다.
[47]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단으로부터 이중 가닥 DNA 라이브러리를 생성하는 방법
(i) 오버행 말단을 가진 이중 가닥 DNA 분자들 단편의 집단을 생성하기 위한 적합한 조건하에서 이중 가닥 DNA 분자들 집단을 단편화하는 단계로, 상기 각 단편의 각 말단은 헤미어댑터 분자에 결합되고, 상기 헤미어댑터 분자는 첫 번째 DNA 가닥 및, 선택적으로, 두 번째 DNA 가닥을 포함하고 상기 각 헤미어댑터는 첫 번째 DNA 가닥의 3' 영역 내 위치한 조합서열에 의해 다른 것들과 구별될 수 있고 상기 두 번째 가닥은 첫 번째 가닥의 중심 영역과의 상보성에 의해 첫 번째 가닥과 이중 가닥 영역을 형성하고 상기 헤미어댑터 분자는 헤미어댑터의 첫 번째 가닥의 3' 말단 및 이중 가닥 DNA 분자들의 단편의 오버행 말단간의 이중 가닥 DNA 분자들의 단편에 결합되는 단계,
(ii) 대체 두 번째 가닥을 첨가하거나 헤미어댑터의 두 번째 DNA 가닥을 대체 두 번째 가닥으로 치환하는 단계로, 상기 대체 두 번째 가닥의 5' 영역은 헤미어댑터 분자의 첫 번째 가닥의 3' 영역에 상보적이고, 상기 대체 두 번째 가닥은 헤미어댑터 분자의 첫 번째 가닥에 상보적인 영역을 포함하여 복수의 Y-어댑터-포함 DNA 분자를 생성하는 단계,
(iii) Y-어댑터의 대체 두 번째 가닥의 5' 말단과 각 DNA 단편의 3' 말단 사이에 존재하는 갭을 선택적으로 채우는 단계.
(iv) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 (iii) 단계에서 얻은 Y-어댑터-포함 DNA 분자들을 선택적으로 처리하는 단계 및
(v) (ii) 단계 또는 (iii) 단계 또는, 경우에 다라, (iv) 단계에서 얻은 Y-어댑터-포함 DNA 분자들의 적어도 일부분에 상보적인 서열을 가지는 적어도 하나의 프라이머를 사용하여 (ii) 단계 또는 (iii) 단계 또는, 경우에 따라, (iv) 단계에서 얻은 Y-어댑터-포함 DNA 분자들을 선택적으로 증폭하는 단계.
[48]. [47]에 있어서 상기 (i)은 이중 가닥 어댑터 분자들에 로드된 전이효소 이량체에 이중 가닥 DNA 분자들 집단을 접촉시키는 단계를 포함하는 방법에 의해 수행되고, 상기 어댑터 분자들은 Tn5 역방향 반복 및 가닥들 중 하나의 5' 오버행을 포함하는 이중 가닥 영역을 포함하고, 상기 Tn5 역방향 반복의 일부를 형성하지 않는 이중 가닥 영역 내 및 단일 가닥 영역 내 시토신 뉴클레오타이드는 선택적으로 메틸화되고 상기 접촉시키는 것은 DNA의 단편화 및 각 DNA 단편의 각 말단들에 헤미어댑터 분자들을 부착시키는데 적합한 조건하에서 수행된다.
[49]. [47] 또는 [48]에 있어서 (ii) 단계에서 사용된 상기 헤미어댑터의 두 번째 가닥 및 대체 두 번째 가닥은 상기 조합 영역과 상당한 겹침을 보이지 않는다.
[50]. [44] 내지 [49]에 있어서 (i) 단계에서 사용된 상기 이중 가닥 DNA 분자들은 게놈 DNA 단편들이다.
[51]. [44] 내지 [50]에 있어서 (i) 단계에서 사용된 상기 이중 가닥 DNA 분자들은 상기 (i) 단계 전에 말단-수정된다.
[52]. [51]에 있어서 상기 말단-수정 단계 후 DNA 분자들을 dA-tailing 단계를 더 포함한다.
[53]. [44] 내지 [52]에 있어서 상기 이중 가닥 DNA 분자들 집단은 DNA 분자들에 어댑터 분자들을 접합시키기에 적합한 조건하에서 어댑터 분자들로 (i) 단계 전에 처리되어 상기 DNA 분자들에 점착성 말단을 도입한다.
[54]. [44] 내지 [53]에 있어서 어댑터 서열내 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가진 하나 또는 이상의 변형된 시토신을 포함한다.
[55]. [44] 내지 [54]에 있어서 [44]의 방법에 의해 라이브러리가 얻어지는 경우 상기 (i) 단계 또는 (ii) 단계에서 얻은 DNA 분자들 또는 [47]의 방법에 의해 라이브러리가 얻어지는 경우 상기 (iii) 단계 또는 (iv) 단계에서 얻은 DNA 분자들은 [44]의 (i) 단계, (ii) 단계 또는, 경우에 따라, (iii) 단계 후 또는 [47]의 (iii) 단계, (iv) 단계 또는, 경우에 따라, (v) 단계 후 얻은 반응 혼합물로부터 회수된다.
[56]. [55]에 있어서 상기 반응 혼합물로부터 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, 상기 어댑터는 상기 결합 쌍의 두 번재 구성으로 변형된다.
[57]. [44] 내지 [56]에 있어서 라이브러리가 [44]의 방법에 의해 얻어진 경우 (iii) 단계에서 얻은 DNA 분자들 또는 라이브러리가 [47]의 방법에 의해 얻어진 경우 (v) 단계에서 얻은 DNA 분자들은 반응 혼합물로부터 회수된다.
[58]. [57]에 있어서 상기 반응 혼합물로부터 회수는 결합 쌍의 첫 번째 구성을 사용하여 수행되고, [44]의 (iii) 단계 또는 [47]의 (v) 단계에서 사용된 프라이머는 상기 결합 쌍의 두 번째 구성으로 변형된다.
[59]. [44] 내지 [58]의 방법을 사용하여 상기 이중 가닥 DNA 분자들 집단으로부터 라이브러리를 생성하는 단계 및 라이브러리가 [44]의 방법에 의해 얻어지는 경우 (i) 단계 또는 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 얻은 DNA 분자들 또는 라이브러리가 [47]의 방법에 의해 얻어지는 경우 (ii) 단계 또는 (iii) 단계 또는 (iv) 단계 또는, 경우에 따라, (v) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계를 포함하는 이중 가닥 DNA 분자들 집단의 서열을 결정하는 방법.
[60]. 다음 단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법
(i) [44] 내지 [58]의 방법을 사용하여 상기 이중 가닥 DNA 분자들로부터 라이브러리를 생성하는 단계로, 상기 어댑터-변형 DNA 분자들 집단은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약으로 상기 라이브러리가 [44]의 방법에 의해 얻어진 경우 (iii) 단계 전에 또는 [47]의 방법에 의해 라이브러리가 얻어진 경우 (v) 단계 전에 처리되고 상기 라이브러리가 [44]의 방법에 의해 얻어진 경우 (iii) 단계에서 또는 상기 라이브러리가 [47]의 방법에 의해 얻어진 경우 (v) 단계에서 사용된 라이브러리는 [44]의 (ii) 단계 또는 [47]의 (iv) 단계에서 얻은 DNA 분자들의 서열에 특이적이다 및
(ii) 상기 라이브러리가 [44]의 방법에 의해 얻어진 경우 (ii) 단계 또는, 경우에 따라, (iii) 단계에서 또는 [47]의 방법에 의해 상기 라이브러리가 얻어진 경우 (iv) 단계 또는, 경우에 따라, (v) 단계에서 얻은 DNA 분자들을 시퀀싱하는 단계,
상기 메틸화된 시토신의 존재는 시토신이 가닥 중 하나에 나타나고 구아닌이 다른 가닥에 대응 위치에 나타나는 경우 결정되고 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 가닥 중 하나에 나타나고 구아닌이 다른 가닥내 대응 위치에 나타나는 경우 결정된다.
[61]. [1] 내지 [14], [17] 내지 [28], [31] 내지 [41] 또는 [44] 내지 [58]의 방법에 의해 얻을 수 있는 DNA 라이브러리.
[62]. Y-어댑터 라이브러리로
상기 각 Y-어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고,
상기 두 번째 DNA 가닥의 3' 영역은 3' 영역의 3' 말단에 위치한 첫 번째 분절 및 첫 번째 DNA 가닥의 3' 영역과 이중 가닥 영역을 형성하는 두 번째 DNA 가닥의 영역 부근에 위치한 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성하고 및
상기 라이브러리의 각 구성은 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치한 조합 서열에 의해 다른 것들과 구별될 수 있다.
[63]. [62]에 있어서 상기 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약을 처리하는 것에 저항성이 있는 하나 또는 이상의 변형된 시토신을 포함한다.
[64]. [62] 또는 [63]에 있어서 상기 각 어댑터의 두 번째 폴리뉴클레오타이드의 3' 말단은 가역적으로 차단되어 있다.
[65]. [62] 내지 [64]에 있어서 각 어댑터 내 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역의 상기 말단 분절은 제한 엔도뉴클레아제에 대한 목적 부위를 포함한다.
[66]. 하기 단계를 포함하는 DNA Y-어댑터를 제공하는 방법:
(i) 첫 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역이 두 번째 폴리뉴클레오타이드의 5' 영역의 적어도 일부분에 상보적인 첫 번째 단일 가닥 폴리뉴클레오타이드를 두 번째 단일 가닥 폴리뉴클레오타이드와 접촉시키는 단계로,
상기 두 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역은 3' 영역내에서 3' 영역의 3' 말단에 위치한 첫 번째 분절 및 두 번째 폴리뉴클레오타이드의 5' 영역 부근에 위치한 두 번째 분절 간의 혼성화에 의해 헤어핀 고리를 형성하고 상기 두 번째 폴리뉴클레오타이드의 3' 말단은 가역적으로 차단되고,
첫 번째 가닥 폴리뉴클레오타이드의 3' 영역 및 두 번째 단일 가닥 폴리뉴클레오타이드의 5' 영역 내 상보적인 영역의 혼성화에 적합한 조건하에서 수행되는 상기 접촉시키는 단계에 의해 이중 DNA 분자를 제공한다.
(ii) 상기 첫 번째 단일 가닥 폴리뉴클레오타이드 내에서 두 번째 폴리뉴클레오타이드의 5' 영역에 상보적인 서열을 생성할 수 있도록 첫 번째 폴리뉴클레오타이드의 3' 말단을 신장하는 단계, 및
(iii) 선택적으로, 두 번째 폴리뉴클레오타이드의 3' 말단의 차단을 푸는 단계.
[67]. [66]에 있어서 상기 (ii) 단계에서 수행되는 신장은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약을 처리하는 것에 저항성을 가지는 변형된 시토신의 존재하에서 수행된다.
[68]. [66] 또는 [67]에 있어서 상기 첫 번째 폴리뉴클레오타이드의 3' 말단 내 적어도 하나의 위치에 구아닌이 있고 상기 위치와 혼성화하는 두 번째 폴리뉴클레오타이드의 5' 영역 내 위치 또는 첫 번째 폴리뉴클레오타이드의 3' 말단 내 위치에는 시토신 또는 메틸시토신이 있다.
[69]. [66] 내지 [68]에 있어서 두 번째 단일 가닥 폴리뉴클레오타이드의 5' 말단은 상기 상보적인 가닥이 신장 단계 (ii) 동안 형성될 때, 제한 엔도뉴클레아제에 대한 목적 부위를 형성하는 상보적인 가닥으로 복제되는 서열을 포함한다.
[70]. [66] 내지 [69]에 있어서 상기 두 번째 단일 가닥 폴리뉴클레오타이드는 폴리뉴클레오타이드 라이브러로 제공되고, 상기 라이브러리의 각 구성은 상기 폴리뉴클레오타이드의 5' 영역 내 위치한 조합 서열에 의해 다른 것들과 구별될 수 있고 상기 조합 서열은 첫 번째 단일 가닥 폴리뉴클레오타이드에 상보적인 서열을 나타내는 영역에 관련된 업스트림에 위치하고, 이에 의해 DNA Y-어댑터 분자들을 생성한다.
[71]. [70]에 있어서 상기 조합 서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 이상의 시토신을 포함한다.
[72]. [66] 내지 [71]에 있어서 첫 번째 단일 가닥 폴리뉴클레오타이드 및/또는 두 번째 단일 가닥 폴리뉴클레오타이드는 지지체에 고정되어 제공되고, 상기 고정은 첫 번째 단일 가닥 폴리뉴클레오타이드의 5' 말단 또는 두 번째 단일 가닥 폴리뉴클레오타이드의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합시켜 수행된다.
[73]. 하기 구성을 포함하는 키트
(i) 5' 영역 및 3' 영역을 포함하는 첫 번째 단일 가닥 폴리뉴클레오타이드,
(ii) 5' 영역 및 3' 영역을 포함하는 두 번째 폴리뉴클레오타이드로, 상기 3' 영역은 상기 3' 영역 내에서 3' 영역의 3' 말단에 위치하는 첫 번째 분절과 5' 영역 부근에 위치하는 두 번째 분절과의 혼성화에 의해 헤어핀 고리를 형성하고 상기 두 번째 폴리뉴클레오타이드의 3' 말단은 가역적으로 차단되고,
상기 첫 번째 단일 가닥 폴리뉴클레오타이드의 3' 영역은 두 번째 폴리뉴클레오타이드의 5' 영역의 적어도 일부분과 상보적이다.
[74]. [73]에 있어서 상기 두 번째 폴리뉴클레오타이드는 폴리뉴클레오타이드 라이브러리로 제공되고, 상기 각 구성은 두 번째 폴리뉴클레오타이드의 5' 영역 내 위치한 조합 서열 및 상기 첫 번째 단일 가닥 폴리뉴클레오타이드와 서열 상보성을 나타내는 영역과 관련된 업스트림에 의해 다른 것들과 구별될 수 있다.
[75]. [74]에 있어서 상기 조합서열은 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 이상의 변형된 시토신을 포함한다.
[76]. [73] 내지 [75]에 있어서 상기 두 번째 폴리뉴클레오타이드의 5' 영역은 이중 가닥 영역으로 전환될 때, 제한 엔도뉴클레아제에 대한 목적 부위를 생성하는 서열을 포함한다.
[77]. [73] 내지 [76]에 있어서 다음으로 이루어진 그룹으로부터 선택되는 하나 또는 이상의 구성요소를 더 포함하는 키트.
(i) DNA 중합효소,
(ii) A, G, C 및 T로부터 선택되는 하나 또는 이상의 뉴클레오타이드,
(iii) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 그 이상의 변형된 시토신,
(iv) 두 번째 폴리뉴클레오타이드의 3' 말단으로부터 블락킹 그룹을 제거할 수 있는 시약,
(v) 메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약 및
(vi) 두 번째 폴리뉴클레오타이드의 5' 말단 내 서열에 의해 형성되는 목적 부위에 특이적인 제한 엔도뉴틀레아제.
[78]. 다음의 구성을 포함하는 키트:
(i) [63] 내지 [65]에 의한 Y-어댑터 라이브러리; 및
(ii) 하기의 구성으로 이루어진 그룹으로부터 선택된 하나 또는 이상의 구성요소:
i.DNA 중합효소,
ii.A, G, C 및 T로부터 선택되는 하나 또는 이상의 뉴클레오타이드,
iii.메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약의 처리에 저항성을 가지는 하나 또는 그 이상의 변형된 시토신,
iv.두 번째 폴리뉴클레오타이드의 3' 말단으로부터 블락킹 그룹을 제거할 수 있는 시약,
v.메틸화되지 않은 시토신을 혼성화 특성 관점에서 시토신과 유사하지 않은 염기로 전환시키는 시약 및
vi. 두 번째 폴리뉴클레오타이드의 5' 말단 내 서열에 의해 형성된 목적 부위에 특이적인 제한 엔도뉴클레아제.
[79]. [77] 또는 [78]에 있어서 상기 하나 또는 이상의 변형된 시토신은 메틸시토신, 하이드로메틸시토신 및 그들의 조합으로 이루어진 그룹으로부터 선택된다.
[80]. 이중 가닥 DNA 어댑터 라이브러리를 얻는 방법으로, 상기 각 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고 상기 각 어댑터는 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치한 조합 서열에 의해 다른 것들과 구별될 수 있고, 상기 방법은 하기의 단계를 포함한다
(i) 불변영역 및 조합 영역을 포함하는 단일 가닥 DNA 분자들 집단을 제공하는 단계로, 상기 단일 가닥 DNA 분자들은 조합 영역 내 서열에 의해 다른 것들과 구별되고, 상기 불변 영역은 조합 영역과 관련된 3' 에 위치하고 상기 3' 말단은 가역적으로 차단되고 및
(ii) 주형으로 (i) 단계의 단일 가닥 DNA 분자 및 단일 가닥 DNA 분자의 불변 영역에 완전히 또는 부분적으로 혼성화하는 신장 프라이머를 사용하여 이중 가닥 조합 서열을 생성하는 이중 가닥 DNA 를 생성하는 단계.
[81]. [80]에 있어서 단일 가닥 DNA 분자들의 3' 말단으로부터 블락킹 그룹을 제거하는 단계를 더 포함하는 방법.
[82]. [80] 또는 [81]에 있어서 상기 신장 프라이머는 단일 가닥 DNA 분자들의 불변 영역에 혼성화되지 않는 오버행 5' 영역을 포함한다.
[83]. [80] 내지 [82]에 있어서 단일 가닥 DNA 분자들의 상기 불변 영역은 상기 불변 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성한다.
[84]. [80] 또는 [81]에 있어서 두 번째 DNA 분자에 어댑터 라이브러리를 접합시키는 단계를 더 포함하는 방법으로, 상기 두 번째 DNA 분자는 이중 가닥 영역, 어댑터 분자들의 말단들에 호환가능한 말단들을 가진다.
[85]. [84]에 있어서 두 번째 DNA 분자는 서로 혼성화 되지 않는 첫 번째 가닥의 5' 영역 내 및/또는 두 번째 가닥의 3' 영역 내 오버행 여역을 포함한다.
[86]. [85]에 있어서 두 번째 가닥에서 3' 오버행 영역은 상기 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성한다.
[87]. [80] 내지 [82] 또는 [84] 내지 [86]에 있어서 (i) 단계의 상기 각 단일 가닥 DNA 분자는 지지체에 고정되어 제공되고, 상기 고정은 단일 가닥 DNA 분자의 5' 말단을 상기 지지체에 결합시켜 수행된다.
[88]. [83]에 있어서 (i) 단계의 상기 각 단일 가닥 DNA 분자는 지지체에 고정되어 제공되고, 상기 고정은 단일 가닥 DNA 분자의 헤어핀 고리의 뉴클레오타이드를 상기 지지체에 결합시켜 수행된다.
[89]. 이중 가닥 DNA 어댑터 분자 라이브러리, 상기 각 DNA 어댑터 분자는 불변 영역 및 가변 영역을 포함하고, 상기 각 이중 가닥 DNA 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고 상기 각 어댑터는 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역간에 형성된 이중 가닥 영역 내 위치한 가변 영역 내의 조합 서열에 의해 다른 것들과 구별된다.
[90]. [89]에 있어서 상기 가닥들 중 적어도 하나의 3' 말단은 가역적으로 차단된다.
[91]. [89] 또는 [90]에 있어서 상기 하나 또는 각 말단들은 다른 가닥과 혼성화되지 않는 오버행 영역을 포함한다.
[92]. [91]에 있어서 상기 가닥들 중 하나의 불변 영역은 상기 불변 영역내에서 첫 번째 및 두 번째 분절간의 혼성화에 의해 헤어핀 고리를 형성한다.
<110> FUNDACIO PRIVADA INSTITUT DE MEDICINA PREDICTIVA I PERSONALITZADA DEL CANCER COLL MULET, Llorene <120> METHODS FOR GENERATING DOUBLE STRANDED DNA LIBRARIES AND SEQUENCING METHODS FOR THE IDENTIFICATION OF METHYLATED CYTOSINES <130> I16O10D0043P/DE <150> 14382002.5 <151> 2014-01-07 <160> 8 <170> KopatentIn 2.0 <210> 1 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> c15_Hairp01-5'P oligonucleotide <400> 1 gctccgatcg agggaggtag gatggaggaa tggctcgatc ggagct 46 <210> 2 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> c14_Hang04 5'P oligonucleotide <400> 2 gcaagcaacg acggtaacgg gcggctc 27 <210> 3 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> c14_BIO05noB oligonucleotide <400> 3 ccgagccgcc cgttaccgtc gttgcttgct 30 <210> 4 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> c14_BIO04-5'B biotinylated oligonucleotide <400> 4 aaaaaaaaac attcctccat cctacctc 28 <210> 5 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> c14_amp02F oligonucleotide <400> 5 acccattacc atcattactt ac 22 <210> 6 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> c14_amp02R oligonucleotide <400> 6 gagttgtttg ttattgttgt tgtttgt 27 <210> 7 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> c15_YA4 oligonucleotide <400> 7 gagccgcccg ttaccgtcgt tgcttgcttc ggcttcctga gtgt 44 <210> 8 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> c15_Hairp06 oligonucleotide <400> 8 cactcaggaa gccgaagcgc tccgatcgag tgttgtctcg atcggagc 48

Claims (22)

  1. (i) 복수의 이중 가닥 DNA 분자들의 가닥들 중 적어도 하나의 말단에 이중 가닥 DNA 어댑터(adaptor)를 접합시키고(ligating) 그리고 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하여(pairing) 복수의 짝지어진 어댑터-변형 DNA 분자들을 제공하는 단계;
    (ii) 상기 짝지어진 어댑터-변형 DNA 분자에서 메틸화되지 않은 시토신을 상기 짝지어진 어댑터-변형 DNA 분자에서 우라실로 변환시키는 단계(transforming);
    (iii) 뉴클레오타이드 A, G, C 및 T와 이중 가닥 어댑터의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 사용하여, 짝지어지고 변환된 어댑터-변형 DNA 분자들의 상보적인 가닥을 제공하여 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계;
    (iv) 상기 (iii) 단계에서 얻은 상기 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는;
    단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법으로,
    지정 위치에 메틸화된 시토신의 존재는, 시토신이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되고,
    또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되며, 그리고
    상기 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자들은 하기 단계에 의해 얻어지고:
    (a) DNA Y-어댑터를 복수의 이중 가닥 DNA 분자들의 가닥의 각 말단에 접합시키는 단계로, 상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 상기 이중 가닥 DNA 분자들의 말단들과 호환가능하고;
    (b) 주형으로 상기 (a) 단계에서 얻은 DNA 분자들의 각 가닥들을 사용하여, Y-어댑터 분자에서 두 번째 DNA 가닥의 3' 말단으로부터 중합효소 신장에 의해 상기 (a) 단계에서 얻은 DNA 분자들의 각 가닥들에 대한 상보적인 가닥을 합성하여 상기 (a) 단계에서 얻은 DNA 분자들의 각 가닥들을 그것의 합성 상보 가닥을 짝지어 복수의 짝지어진 어댑터-변형 DNA 분자를 제공하는 단계로, 상기 (a) 단계에서 복수의 이중 가닥 DNA 분자들은 게놈 DNA 단편들이고, 상기 게놈 DNA 단편들의 가닥들은 짝지어져 복수의 짝지어진 게놈 DNA 단편들을 제공하며, 상기 게놈 DNA 단편들의 가닥들의 짝지음은 바코드 서열을 사용하여 수행되고, 그리고 상기 (b) 단계는 뉴클레오타이드 A, G, C 및 T를 사용하여 수행되는 것을 특징으로 하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  2. 제 1항에 있어서, 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 증폭하여 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계를 추가로 포함하고, 그리고 상기 (iv) 단계는 상기 추가 단계에서 얻어진 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는 것을 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  3. 제 1항에 있어서, 상기 (i) 단계에서, 상기 짝짓기는 접합 전 또는 후, 또는 접합과 동시에 수행될 수 있는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  4. 제 1항에 있어서, 상기 이중 가닥 DNA 어댑터의 적어도 일부분은 상기 (i) 단계에서 사용된 모든 이중 가닥 어댑터에 공통된 서열을 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  5. 제 1항에 있어서, 상기 (ii) 단계 전에, 복수의 짝지어진 어댑터-변형 DNA 분자들은 분리되어 짝지어진 어댑터-변형 DNA 분자 라이브러리를 생성하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  6. 제 1항에 있어서, 상기 짝지어진 어댑터-변형 DNA 분자들 내에서 메틸화되지 않은 시토신의 우라실로의 변환은, 바이설파이트(bisulfite)에 의해 수행되는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  7. 제 1항에 있어서, 상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3’ 영역 내의 첫 번째 분절과 두 번째 분절 사이의 혼성화를 통해 헤어핀 고리를 형성하고, 상기 첫번째 분절은 두 번째 DNA 가닥의 3’ 영역의 3’ 말단에 위치하고 상기 두 번째 분절은 두 번째 DNA 가닥의 5’ 영역 부근에 위치하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  8. 제 1항에 있어서, 상기 DNA Y 어댑터는 상기 이중 가닥 영역 내에 첫 번째 바코드 서열, Y-어댑터의 두 번째 DNA 가닥의 3' 영역 내에 두 번째 바코드 서열, 또는 상기 이중 가닥 영역 내에 첫 번째 바코드 서열 및 Y-어댑터의 두 번째 DNA 가닥의 3' 영역 내에 두 번째 바코드 서열을 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  9. 제 1항에 있어서, 상기 DNA Y 어댑터는 Y-어댑터의 첫 번째 DNA 가닥의 5' 영역 내에 제한효소 인식자리를 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  10. (i) 복수의 이중 가닥 DNA 분자들의 가닥들 중 적어도 하나의 말단에 이중 가닥 DNA 어댑터(adaptor)를 접합시키고(ligating) 그리고 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하여(pairing) 복수의 짝지어진 어댑터-변형 DNA 분자들을 제공하는 단계;
    (ii) 상기 짝지어진 어댑터-변형 DNA 분자에서 메틸화되지 않은 시토신을 상기 짝지어진 어댑터-변형 DNA 분자에서 우라실로 변환시키는 단계(transforming);
    (iii) 뉴클레오타이드 A, G, C 및 T와 이중 가닥 어댑터의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 사용하여 짝지어지고 변환된 어댑터-변형 DNA 분자들의 상보적인 가닥을 제공하여 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계;
    (iv) 상기 (iii) 단계에서 얻은 상기 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는;
    단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법으로,
    지정 위치에 메틸화된 시토신의 존재는, 시토신이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되고, 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되며, 그리고
    상기 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자들은 하기 단계에 의해 얻어지고:
    (a) 복수의 이중 가닥 DNA 분자들의 집단을 DNA Y-어댑터와 접촉시키는 단계로,
    상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 상기 이중 가닥 DNA 분자들의 말단들과 호환가능하고, 상기 접촉시키는 단계는 상기 이중 가닥 DNA 분자들의 양 말단에 Y-어댑터가 접합하기 적절한 조건하에서 수행되어 복수의 Y-어댑터 포함 DNA 분자들을 얻으며;
    (b) 상기 Y-어댑터-포함 DNA 분자들의 각 가닥을, Y-어댑터의 두 번째 가닥에 신장 프라이머가 혼성화하기에 적합한 조건하에서, Y-어댑터 분자의 두 번째 DNA 가닥에 상보적인 3' 영역을 포함하는 신장 프라이머와 접촉시키는 단계로, Y-어댑터 분자의 두 번째 DNA 가닥과의 혼성화는 오버행 말단들을 생성하고;
    (c) (b) 단계에서 생성된 분자들에 헤어핀 어댑터를 접합시키기에 적합한 조건하에서, (b) 단계에서 생성된 분자들과 헤어핀을 접촉시키는 단계로, 상기 헤어핀 어댑터는 헤어핀 고리 영역 및 (b) 단계에서 생성된 분자들 내 오버행 말단들에 호환가능한 오버행 말단들을 포함하고;
    (d) (b) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (c) 단계에서 얻은 이중 가닥 DNA 분자들의 각 가닥을 이중 가닥 DNA 분자로 전환시키는 단계로,
    상기 (c) 및 (d) 단계는 순차적으로 또는 동시에 수행될 수 있고,
    상기 (i) 단계에서, 상기 복수의 이중 가닥 DNA 분자들은, 복수의 짝지어진 어댑터-변형 게놈 DNA 단편들을 제공하기 위한 게놈 DNA 단편들이고, 그리고
    상기 (i) 단계는 바코드 서열을 사용하여 수행되는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  11. 제 10항에 있어서, 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 증폭하여 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계를 추가로 포함하고, 그리고 상기 (iv) 단계는 상기 추가 단계에서 얻어진 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는 것을 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  12. (i) 복수의 이중 가닥 DNA 분자들의 가닥들 중 적어도 하나의 말단에 이중 가닥 DNA 어댑터(adaptor)를 접합시키고(ligating) 그리고 복수의 이중 가닥 DNA 분자들의 가닥들을 짝짓기 하여(pairing) 복수의 짝지어진 어댑터-변형 DNA 분자들을 제공하는 단계;
    (ii) 상기 짝지어진 어댑터-변형 DNA 분자에서 메틸화되지 않은 시토신을 상기 짝지어진 어댑터-변형 DNA 분자에서 우라실로 변환시키는 단계(transforming);
    (iii) 뉴클레오타이드 A, G, C 및 T와 이중 가닥 어댑터의 적어도 일부분에 상보적인 서열을 가지는 프라이머를 사용하여 짝지어지고 변환된 어댑터-변형 DNA 분자들의 상보적인 가닥을 제공하여 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계;
    (iv) 상기 (iii) 단계에서 얻은 상기 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는;
    단계를 포함하는 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법으로,
    지정 위치에 메틸화된 시토신의 존재는, 시토신이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되고, 또는 지정 위치에 상기 메틸화되지 않은 시토신의 존재는 우라실 또는 티민이 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 가닥들 중 하나에 나타나고, 구아닌이 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들의 다른 가닥의 대응 위치에 나타나는 경우 결정되며, 그리고
    상기 (i) 단계의 복수의 짝지어진 어댑터-변형 DNA 분자들은 하기 단계에 의해 얻어지고:
    (a) 복수의 이중 가닥 DNA 분자들의 집단을 DNA Y-어댑터와 접촉시키는 단계로,
    상기 어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고, 상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하고, 상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 상기 이중 가닥 DNA 분자들의 말단들과 호환가능하고, 상기 접촉시키는 단계는 상기 이중 가닥 DNA 분자들의 양 말단에 Y-어댑터가 접합하기 적절한 조건하에서 수행되어 복수의 Y-어댑터 포함 DNA 분자들을 얻으며;
    (b) Y-어댑터의 두 번째 가닥에 신장 프라이머가 혼성화하기에 적합한 조건하에서, 상기 Y-어댑터-포함 DNA 분자들의 각 가닥을 헤어핀 어댑터와 신장 프라이머의 복합체와 접촉시키는 단계로, 상기 신장 프라이머는, Y-어댑터 분자의 두 번째 DNA 가닥에 상보적이고, Y-어댑터 분자의 두 번째 DNA 가닥과 혼성화 후에 오버행 말단들을 생성하는, 3' 영역을 포함하고, 그리고 상기 헤어핀 어댑터는 헤어핀 고리 영역 및 Y-어댑터 분자의 두 번째 DNA 가닥에 신장 프라이머의 혼성화 후 형성된 오버행 말단과 호환가능한 오버행 말단을 포함하며,
    (c) (b) 단계에서 사용된 신장 프라이머로부터 중합효소 신장에 의해 (b) 단계에서 얻은 이중 가닥 DNA 분자들의 각 가닥을 이중 가닥 DNA 분자로 전환시키는 단계로,
    상기 (b) 및 (c) 단계는 순차적으로 또는 동시에 수행될 수 있고,
    상기 (i) 단계에서, 상기 복수의 이중 가닥 DNA 분자들은, 복수의 짝지어진 어댑터-변형 게놈 DNA 단편들을 제공하기 위한 게놈 DNA 단편들이고, 그리고
    상기 (i) 단계는 바코드 서열을 사용하여 수행되는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  13. 제 12항에 있어서, 상기 (iii) 단계에서 얻은 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 증폭하여 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 제공하는 단계를 추가로 포함하고, 그리고 상기 (iv) 단계는 상기 추가 단계에서 얻어진 증폭되고 부분적으로 변환된 짝지어진 이중 가닥 DNA 분자들을 시퀀싱하는 것을 포함하는 것인, 이중 가닥 DNA 분자들 집단에서 메틸화된 시토신을 확인하는 방법.
  14. 제1항 내지 제13항 중 어느 한 항의 방법에 사용하기 위한 DNA Y-어댑터로,
    상기 Y-어댑터는 첫 번째 DNA 가닥 및 두 번째 DNA 가닥을 포함하고,
    상기 첫 번째 DNA 가닥의 3' 영역 및 두 번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하며,
    상기 Y-어댑터의 첫 번째 DNA 가닥의 3' 영역 및 두 번째 가닥의 5' 영역에 의해 형성된 상기 이중 가닥 영역의 말단들은 상기 이중 가닥 DNA 분자들의 말단들과 호환가능하고,
    상기 DNA Y-어댑터의 이중 가닥 영역은 하나 이상의 바코드 서열을 포함하며,
    상기 Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3’ 영역 내의 첫 번째 분절과 두 번째 분절 사이의 혼성화를 통해 헤어핀 고리를 형성하고, 상기 첫번째 분절은 두 번째 DNA 가닥의 3’ 영역의 3’ 말단에 위치하며 상기 두 번째 분절은 두 번째 DNA 가닥의 5’ 영역 부근에 위치하고, 또는
    상기 DNA Y-어댑터는 Y-어댑터의 단일 가닥 영역 내 적어도 하나 이상의 바코드 서열을 포함하는 것인, DNA Y-어댑터.
  15. 제 14항에 있어서, 상기 DNA Y 어댑터는 Y-어댑터의 첫 번째 DNA 가닥의 5' 영역 내에 제한효소 인식자리를 포함하는 것인, DNA Y-어댑터.
  16. 제 14항에 있어서, 상기 DNA Y 어댑터는 Y-어댑터의 단일 가닥 영역 내에 적어도 하나 이상의 바코드 서열을 포함하고, 상기 DNA Y-어댑터의 두 번째 DNA 가닥의 3' 영역은 상기 3’ 영역 내의 첫 번째 분절과 두 번째 분절 사이의 혼성화를 통해 헤어핀 고리를 형성하며, 그리고 상기 첫번째 분절은 두 번째 DNA 가닥의 3’ 영역의 3’ 말단에 위치하고 상기 두 번째 분절은 두 번째 DNA 가닥의 5’ 영역 부근에 위치하는 것인, DNA Y-어댑터.
  17. 제 14항에서 정의된 DNA Y-어댑터를 포함하는 어댑터 라이브러리로, 상기 라이브러리의 각 멤버는 첫번째 DNA 가닥의 3' 영역 및 두번째 DNA 가닥의 5' 영역에 의해 형성된 이중 가닥 영역 내 위치한 조합 서열에 의해 다른 것과 구별되는 것인, 어댑터 라이브러리.
  18. 제14항에서 정의된 DNA Y-어댑터를 포함하는 키트.
  19. 하기 구성을 포함하는 키트로,
    (i) DNA Y-어댑터 라이브러리, 상기 어댑터는 첫번째 DNA 가닥 및 두번째 DNA 가닥을 포함하고, 상기 첫번째 DNA 가닥의 3' 영역 및 두번째 DNA 가닥의 5' 영역은 서열 상보성에 의해 이중 가닥 영역을 형성하며, 그리고 상기 이중 가닥 영역의 말단들은 이중 가닥 DNA 분자의 말단들과 호환가능하고;
    (ii) 복수의 신장 프라이머, 상기 각 신장 프라이머는 (i)에서 정의한 Y-어댑터 분자의 두번째 DNA 가닥에 상보적인 3' 영역을 포함하고, 이것은 Y-어댑터 분자의 두번째 DNA 가닥에 혼성화한 후 오버행 말단을 형성하며; 그리고
    (iii) 복수의 헤어핀 어댑터, 상기 각 헤어핀 어댑터는 헤어핀 고리 영역 및 (i)에서 정의한 Y-어댑터의 두번째 가닥에 (ii)에서 정의한 신장 프라이머의 혼성화 후 형성된 오버행 말단들과 호환 가능한 오버행 말단들을 포함하고, 상기 (ii)의 신장 프라이머 및 (iii)의 헤어핀 어댑터는 복합체로 제공될 수 있고;
    상기 (i)의 DNA Y-어댑터, (ii)의 신장 프라이머 및 (iii)의 헤어핀 어댑터는 제 1항 내지 제 13항 중 어느 한 항의 방법에 사용하기 위한 DNA-Y 어댑터 라이브러리를 얻는데 적합한 것인, 키트.
  20. 제17항에서 정의된 어댑터 라이브러리를 포함하는 키트.
  21. 삭제
  22. 삭제
KR1020167021368A 2014-01-07 2015-01-07 이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법 KR102423682B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14382002 2014-01-07
EP14382002.5 2014-01-07
PCT/EP2015/050182 WO2015104302A1 (en) 2014-01-07 2015-01-07 Method for generating double stranded dna libraries and sequencing methods for the identification of methylated cytosines

Publications (2)

Publication Number Publication Date
KR20160111403A KR20160111403A (ko) 2016-09-26
KR102423682B1 true KR102423682B1 (ko) 2022-07-20

Family

ID=49999856

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167021368A KR102423682B1 (ko) 2014-01-07 2015-01-07 이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법

Country Status (10)

Country Link
US (3) US10260087B2 (ko)
EP (1) EP3092308A1 (ko)
JP (1) JP6895753B2 (ko)
KR (1) KR102423682B1 (ko)
CN (1) CN106103743A (ko)
AU (1) AU2015205612B2 (ko)
CA (1) CA2936564C (ko)
IL (1) IL246615B (ko)
RU (1) RU2688485C2 (ko)
WO (1) WO2015104302A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US9822408B2 (en) 2013-03-15 2017-11-21 Nugen Technologies, Inc. Sequential sequencing
RU2688485C2 (ru) 2014-01-07 2019-05-21 Фундасио Привада Институт Де Медисина Предиктива И Персоналицада Дель Кансер Способы получения библиотек двухцепочечных днк и способы секвенирования для идентификации метилированных цитозинов
JP6334063B2 (ja) * 2014-11-07 2018-05-30 エルジー エレクトロニクス インコーポレイティド メタルタッチ感知装置とメタルタッチ感知装置が備えられた家電機器及びその制御方法
WO2016195382A1 (ko) 2015-06-01 2016-12-08 연세대학교 산학협력단 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
US10689690B2 (en) * 2015-08-13 2020-06-23 Centrillion Technology Holdings Corporation Library construction using Y-adapters and vanishing restriction sites
CN106811460B (zh) 2015-11-30 2020-11-27 浙江安诺优达生物科技有限公司 用于低频突变检测的二代测序文库的构建方法及试剂盒
JP6714709B2 (ja) * 2016-01-29 2020-06-24 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 核酸配列決定のための新規アダプターおよび使用法
KR101714300B1 (ko) * 2016-01-29 2017-03-08 현대자동차주식회사 터치입력장치
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
PT3440205T (pt) * 2016-04-07 2021-08-06 Univ Leland Stanford Junior Diagnóstico não invasivo através da sequenciação de dna 5- hidroximetilado sem células
US10370701B2 (en) 2016-06-17 2019-08-06 Pacific Biosciences Of California, Inc. Methods and compositions for generating asymmetrically-tagged nucleic acid fragments
JP7048609B2 (ja) 2016-12-09 2022-04-05 ボリアル ジェノミクス, インコーポレイテッド 連結型ライゲーション
CN108203847B (zh) * 2016-12-16 2022-01-04 深圳华大智造科技股份有限公司 用于二代测序质量评估的文库、试剂及应用
CN111373042A (zh) * 2017-10-20 2020-07-03 纽亘技术公司 用于选择性扩增核酸的寡核苷酸
CN107760773A (zh) * 2017-10-26 2018-03-06 北京中仪康卫医疗器械有限公司 一种对胚胎培养液进行scRRBS分析的方法
EP3768853A4 (en) * 2018-03-23 2021-04-28 Board Of Regents The University Of Texas System EFFICIENT SEQUENCING OF DSDNA WITH EXTREMELY LOW ERROR RATE
KR102342490B1 (ko) * 2018-04-05 2021-12-24 한국한의학연구원 분자 인덱스된 바이설파이트 시퀀싱
CA3067435C (en) 2018-05-17 2023-09-12 Illumina, Inc. High-throughput single-cell sequencing with reduced amplification bias
CN108949945B (zh) * 2018-08-10 2021-02-26 中国科学院动物研究所 一种具有单碱基分辨率的检测dna甲基化和单核苷酸变异的测序文库及应用
US12098419B2 (en) 2018-08-23 2024-09-24 Ncan Genomics, Inc. Linked target capture and ligation
EP3884071A4 (en) * 2019-01-03 2022-04-06 Boreal Genomics, Inc. LINKED TARGET CAPTURE
KR20220015367A (ko) * 2019-05-31 2022-02-08 프리놈 홀딩스, 인크. 메틸화된 핵산의 고심도 시퀀싱 방법 및 시스템
RU2746126C9 (ru) * 2019-07-22 2021-07-28 Общество С Ограниченной Ответственностью "Тестген" Способ приготовления библиотеки днк
US11066661B2 (en) * 2019-08-20 2021-07-20 Seagate Technology Llc Methods of gene assembly and their use in DNA data storage
WO2021050393A2 (en) * 2019-09-09 2021-03-18 University Of Utah Research Foundation Targeted sequencing to detect and quantify low levels of methylated dna
US20220259587A1 (en) * 2019-10-25 2022-08-18 Illumina Cambridge Limited Methods for generating, and sequencing from, asymmetric adaptors on the ends of polynucleotide templates comprising hairpin loops
WO2021097252A1 (en) * 2019-11-13 2021-05-20 Bradley Bernstein Methylation assays and uses thereof
JP7104770B2 (ja) 2019-12-30 2022-07-21 財團法人工業技術研究院 標的ヌクレオチド配列を増幅及び確定する方法
US12059674B2 (en) 2020-02-03 2024-08-13 Tecan Genomics, Inc. Reagent storage system
WO2021178893A2 (en) 2020-03-06 2021-09-10 Singular Genomics Systems, Inc. Linked paired strand sequencing
EP4083231A1 (en) 2020-07-30 2022-11-02 Cambridge Epigenetix Limited Compositions and methods for nucleic acid analysis
US20220033810A1 (en) * 2020-07-31 2022-02-03 Becton, Dickinson And Company Single cell assay for transposase-accessible chromatin
CN111755072B (zh) * 2020-08-04 2021-02-02 深圳吉因加医学检验实验室 一种同时检测甲基化水平、基因组变异和插入片段的方法及装置
WO2022174898A1 (en) * 2021-02-18 2022-08-25 F. Hoffmann-La Roche Ag Structure to prevent threading of nucleic acid templates through a nanopore during sequencing
AU2022333075A1 (en) * 2021-08-26 2024-01-04 Illumina, Inc. Methods and compositions for detecting genomic methylation
EP4396372A2 (en) 2021-09-03 2024-07-10 Singular Genomics Systems, Inc. Amplification oligonucleotides
EP4426858A2 (en) * 2021-11-02 2024-09-11 Guardant Health, Inc. Quality control method
CN113969307A (zh) * 2021-11-24 2022-01-25 竹石生物科技(苏州)有限公司 Dna甲基化测序文库及制备方法和dna甲基化检测方法
AU2023234670A1 (en) * 2022-03-15 2024-01-18 Illumina, Inc. Concurrent sequencing of forward and reverse complement strands on separate polynucleotides for methylation detection
WO2024213788A1 (en) 2023-04-13 2024-10-17 Aniling Sl. Method of dna sequencing

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
WO1999025817A2 (en) 1997-11-13 1999-05-27 Regents Of The University Of Minnesota Tc1-based transposon vectors
US6287825B1 (en) * 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
US7160682B2 (en) 1998-11-13 2007-01-09 Regents Of The University Of Minnesota Nucleic acid transfer vector for the introduction of nucleic acid into the DNA of a cell
DE10112515B4 (de) * 2001-03-09 2004-02-12 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern mit hoher Sensitivität
US20040197791A1 (en) * 2001-06-29 2004-10-07 Makarov Vladimir L. Methods of using nick translate libraries for snp analysis
US20030143740A1 (en) 2001-10-15 2003-07-31 Christine Wooddell Processes for transposase mediated integration into mammalian cells
EP1394172A1 (en) 2002-08-29 2004-03-03 Boehringer Mannheim Gmbh Improved method for bisulfite treatment
WO2008096146A1 (en) * 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
US20110003701A1 (en) * 2008-02-27 2011-01-06 454 Life Sciences Corporation System and method for improved processing of nucleic acids for production of sequencable libraries
US20090269771A1 (en) * 2008-04-24 2009-10-29 Life Technologies Corporation Method of sequencing and mapping target nucleic acids
WO2009133466A2 (en) * 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
EP2340314B8 (en) 2008-10-22 2015-02-18 Illumina, Inc. Preservation of information related to genomic dna methylation
CN103119439A (zh) * 2010-06-08 2013-05-22 纽亘技术公司 用于多重测序的方法和组合物
DK2633071T3 (en) * 2010-10-27 2017-01-30 Harvard College COMPOSITIONS OF "MAINTENANCE" PRIMER DUPLEXES AND METHODS OF USE
AU2012249759A1 (en) * 2011-04-25 2013-11-07 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
US9005935B2 (en) 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
US9249460B2 (en) * 2011-09-09 2016-02-02 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
EP4372084A3 (en) * 2012-01-26 2024-08-14 Tecan Genomics, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
RU2688485C2 (ru) 2014-01-07 2019-05-21 Фундасио Привада Институт Де Медисина Предиктива И Персоналицада Дель Кансер Способы получения библиотек двухцепочечных днк и способы секвенирования для идентификации метилированных цитозинов

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hodges 등, Genome Res., Vol. 19, No. 9, 페이지 1593-1605 (2009.07.06.)*
Riggs 등, PNAS., Vol. 101, No. 1, 페이지 4-5 (2004.01.06.)*

Also Published As

Publication number Publication date
US20170002404A1 (en) 2017-01-05
US10260087B2 (en) 2019-04-16
IL246615B (en) 2021-07-29
RU2688485C2 (ru) 2019-05-21
RU2016132476A3 (ko) 2018-06-14
JP6895753B2 (ja) 2021-06-30
JP2017501739A (ja) 2017-01-19
EP3092308A1 (en) 2016-11-16
RU2016132476A (ru) 2018-02-13
CA2936564C (en) 2022-10-18
WO2015104302A1 (en) 2015-07-16
AU2015205612B2 (en) 2020-12-03
IL246615A0 (en) 2016-08-31
AU2015205612A1 (en) 2016-07-21
AU2015205612A8 (en) 2016-08-04
US20190177776A1 (en) 2019-06-13
CA2936564A1 (en) 2015-07-16
US20220213533A1 (en) 2022-07-07
KR20160111403A (ko) 2016-09-26
US11459602B2 (en) 2022-10-04
CN106103743A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
KR102423682B1 (ko) 이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법
JP7127104B2 (ja) 連続性を維持した転位
CN110036117B (zh) 通过多联短dna片段增加单分子测序的处理量的方法
JP7008407B2 (ja) ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法
CN107969137B (zh) 接近性保留性转座
EP2585593B1 (en) Methods for polynucleotide library production, immortalization and region of interest extraction
CN112601823A (zh) 用于形成连接产物的方法和组合物
US20150315639A1 (en) Method of Making a Paired Tag Library for Nucleic Acid Sequencing
US20160348152A1 (en) Compositions and Methods for Preparing Sequencing Libraries
US20120122161A1 (en) Sorting Asymmetrically Tagged Nucleic Acids by Selective Primer Extension
JP2023513606A (ja) 核酸を評価するための方法および材料

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right