KR102313470B1 - Dna의 에러-프리 염기서열 분석 - Google Patents

Dna의 에러-프리 염기서열 분석 Download PDF

Info

Publication number
KR102313470B1
KR102313470B1 KR1020167017436A KR20167017436A KR102313470B1 KR 102313470 B1 KR102313470 B1 KR 102313470B1 KR 1020167017436 A KR1020167017436 A KR 1020167017436A KR 20167017436 A KR20167017436 A KR 20167017436A KR 102313470 B1 KR102313470 B1 KR 102313470B1
Authority
KR
South Korea
Prior art keywords
dna
oligonucleotide
sequence
artificial sequence
sequencing
Prior art date
Application number
KR1020167017436A
Other languages
English (en)
Other versions
KR20160117419A (ko
Inventor
크리스토프 크레인
스테판 키르쉬
즈비그니에 타데우스 치즈
즈비그니에 타데우스 치즈
우르스 라만
Original Assignee
프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 filed Critical 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우
Publication of KR20160117419A publication Critical patent/KR20160117419A/ko
Application granted granted Critical
Publication of KR102313470B1 publication Critical patent/KR102313470B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 DNA의 에러-프리 염기서열 분석(error-free sequencing)의 새로운 방법에 관한 것이다. 또한, 본 발명은 고정 서열, 무작위 서열, 제한 뉴클레아제 인식 부위 및/또는 제한 부위, 및 프라이머 결합 부위를 포함하는 4개-파트 올리고뉴클레오티드를 제공한다. 본 발명은 또한 DNA 서열 분석, 세포 계통수의 생성 또는 복제수의 측정을 위한 방법에서 본 발명의 방법에 의해 얻은 염기서열 분석된 DNA 단편의 용도에 관한 것이다.

Description

DNA의 에러-프리 염기서열 분석 {Error-free sequencing of DNA}
본 발명은 DNA의 에러-프리 염기서열 분석(error-free sequencing)의 새로운 방법에 관한 것이다. 또한, 본 발명은 고정 서열, 무작위 서열, 제한 뉴클레아제 인식 부위 및/또는 제한 부위, 및 프라이머 결합 부위를 포함하는 4개-파트 올리고뉴클레오티드를 제공한다. 본 발명은 또한 DNA 서열 분석, 세포 계통수의 생성 또는 복제수의 측정을 위한 방법에서 본 발명의 방법에 의해 얻은 염기서열 분석된 DNA 단편의 용도에 관한 것이다.
특허 출원, 제조업자의 매뉴얼 및 과학 출판물을 포함하는 다수의 문헌이 본 명세서에서 인용된다. 이러한 문헌의 개시는, 이 발명의 특허가능성에 관련이 있는 것으로 고려되지 않는 반면, 그 전체가 참조로서 여기에 통합된다. 더욱 구체적으로, 모든 참조 문헌들은 각각의 개별 문헌이 참조에 의해 통합될 것을 구체적이고 개인적으로 지시하는 경우와 같이 동일한 정도로 참조에 의해 통합된다.
시행전 분자 진단학, 암의 조기 진단 및 치료 반응성의 핵산 바이오마커-기반 경도 모니터링과 같은 임상 적용은 분자 분석을 위한 충분한 고-품질 DNA 양을 제공하기 위하여 정확한 샘플 준비 및 전체 게놈 증폭 방법을 요구한다. DNA 또는 단일 세포의 전체 게놈의 증폭을 위해 특히 유용한 DNA의 증폭을 위한 방법은 WO 00/17390에 설명되어 있다. 그러나, 전체 게놈 증폭뿐만 아니라 샘플 준비는 DNA 서열에서 에러의 도입을 하기 쉽다. 그러므로, 단일 세포로부터 정확한 서열의 측정은 염기서열 분석 에러의 높은 백그라운드 수준에 의해 방해된다. 그러므로, 도입된 서열 에러를 적절히 모니터하고 방법론적으로 측정하기 위한 과정이 수립되어야 한다. 이러한 목표를 달성하기 위한 가장 중요한 요구는 그들이 실험적 조작 전에 있을 때와 같이 단일 세포 유래 DNA 서열을 정확하게 검색하는 것이다. 현재의 접근법은 원래의 이중 가닥 DNA 분자의 두 가닥에 존재하지 않는 모든 변화에 대해 정정하기 위하여 각각의 DNA 서열의 상보적 DNA 가닥의 정보를 사용한다.
상당히 다른 민감도를 갖는 접근법의 다양한 근본적으로 구별되는 카테고리는 차세대 염기서열 분석 접근법에서 실제 유전적 변이로부터 염기서열 분석-에러 유래 노이즈를 분리하는 것으로 사용되었다. 접근법의 제1 카테고리는 바이오인포매틱스 분석으로 독점적으로 구성되어 있고, 표준 차세대 염기서열 분석 데이터 세트에 대해 키 다운스트림 분석(key downstream analysis)을 나타낸다; 예를 들어 DePristo et al., (2011) Nature Genetics 43(5):491-8 및 여기에서 인용된 참조문헌을 참조하라. 대부분의 변이체 서열 콜러(callers)는 Bayesian 알고리즘 하에 형성되고, 알려진 다형성율 및 염기서열 분석 에러가 주어진 특정 위치에서 특이적 변이체에 대한 측정 확률을 통합한다. 전체 게놈 및 엑솜 염기서열 분석을 위하여, 더욱 정교한 정렬후(post-alignment) 절차는 변이체 콜링(calling)의 정확도를 더욱 증가시키기 위하여 개발되었다. 변이체 콜링 이전의 삽입결실(indels) 주위에 국부 재정렬, 염기 품질 스코어의 재보정 및 조정 에러 모델링을 위한 새로운 방법은 허위양성 변이체를 확인하는 것을 가능하게 한다. 이 서열 분석 파이프라인(pipeline)을 조정하는 것 및 단일 세포 게놈으로부터 유래된 염기서열 분석 데이터에 대한 그의 수행을 평가하는 것은 단일 세포 유전체학에서 주요 도전을 현재 제기한다. 제2 카테고리는 염기서열 분석될 게놈 단편과 직접적으로 커플링하는 무작위 태그 서열의 사용에 기초한 비-컴퓨터 접근법을 포함한다. 이러한 기술적 발전은, 예를 들어, 딥 염기서열 분석(deep sequencing)에 의한 종양 조직에서 빈번히 발견되는 것과 같은 불균일 세포 군집에서 드문 변이체의 검출에 주로 초점이 맞춰져 있다. 차세대 염기서열 분석에 의한 드문 돌연변이의 검출은 Schmitt et al. (2012) PNAS 109(36):14508-13 및 WO2013/142389에 설명되어 있다. 염기서열 분석 정확도는 증폭 전에 이중-가닥 게놈 분자의 두 가닥에 무작위 상보적 이중-가닥 DNA 어댑터의 첨가에 의해 달성된다. 동일한 염기서열 분석 태그를 공유하는 모든 염기서열 분석 판독은 단일-가닥 공통 서열에 합쳐질 수 있다. 게다가, 상보적 가닥으로부터 유래된 모든 염기서열 분석 판독은 상보적 태그 서열에 의해 확인되고, 이것은 듀플렉스(Duplex) 서열로 불리는 이중-가닥 공통 서열의 생성을 가능하게 한다. 실제 유전적 변이는 반대 단일-가닥 공통에서 같은 뉴클레오티드에서의 완벽한 매치에 의해 특징지어진다.
Safe-SeqS로 불리는 다른 접근법은 Kinde et al. (2011) PNAS 108(23):9530-5에 설명되었다. 이 접근법은 두 기본 단계로 구성된다. 첫째, 각각의 DNA 주형에 독한 식별자의 배치 및, 둘째, 각각의 독특하게 태그된 주형의 증폭. Schmitt et al.과 달리, Safe-SeqS는 상보적 가닥 유래 정보를 사용하지 않는다.
추가적인 접근법은 샘플 기원(origin)을 확인하기 위하여 바-코드된 어댑터 (T/A-클로닝을 통해 라이게이션되거나 블런트 엔드(blunt end) 라이게이션)를 사용하는 것이 공개되어 있다. 그러나, 어느 접근법도 에러-정정 접근법을 포함하지 않는다. 제1 접근법은 WO 2012/042374에서 설명된 바와 같이 이중-가닥 DNA 단편의 블런트 엔드(blunt ends)에 라이게이션되는 이중-가닥 DNA 어댑터를 사용한다. 하기에서 더욱 설명된 바와 같이, 이중-가닥 어댑터 분자를 사용하는 이러한 기술은 적은 양의 핵산 분지, 특히 DNA, 특히 단일 세포의 DNA 또는 단일 DNA 분자를 증폭하고 염기서열 분석할 수 없다.
유사하게, 알려진 다른 접근법은 부분적으로 이중-가닥 DNA 어댑터, 이른바 Y-어댑터의 사용을 포함한다. 그러한 기술은 어댑터 이합체화를 최소화하기 위하여 어댑터 라이게이션 이전에 dA-테일링(tailing)을 요구한다. 또한, 제한 효소 생성된 이중-가닥 DNA는 Y-어댑터 라이게이션에 사용될 수 있고, 예를 들어 Monson-Miller et al. (2012) BMC Genomics 13:72에서와 같다. 이 방법은 샘플 식별을 위하여 짧은 바코드 서열 (4 염기)의 사용을 수반한다. 그러나, 이러한 기술은 염기서열 분석 에러 확인 및/또는 돌연변이 분석을 위한 상보적 DNA 가닥에 함유된 불필요한 서열 정보에 의존할 수 없다.
DNA 염기서열 분석을 위한 반복적 및 재생식 방법 Jones (1997) BioTechniques 22:938-946에 의해 그리고 US 08/742,755에서 제공된다. 이 방법은 타입 II s 제한 효소, 특히 Fok I 또는 Bse RI를 사용한 제한 효소 절단을 수반한다. 그 인식 부위는 어댑터 서열에 포함된다. 각각의 PCR 사이클 후에, 어댑터는 표적 DNA로부터 갈라지고, PCR을 위한 프라이머 결합 부위의 손실을 초래한다. PCR의 한 사이클은 하나의 염기를 염기서열 분석하기 위해 수행되고, 즉 적은 양의 DNA로부터 상당한 샘플 증폭이 오직 반복적인 라이게이션-증폭 사이클과 함께 가능하다. 결과적으로, 이 방법은 적은 양의 DNA에 적합하지 않다.
종래 기술의 접근법 중 어느 것도 적은 양의 DNA를 포함하는 샘플 또는 적은 양의 핵산 분자, 특히 단일 세포의 핵산 분자(들)/DNA를 포함하는 샘플에서 핵산 서열의 확인이 가능하지 않다. 사실은, 상기 본 명세서에서 언급된 모든 알려진 접근법은 많은 양의 DNA에 제한된다. 이것은 그 중에서도(inter alia), 예를 들어, WO2013/142389에서 설명된 듀플렉스 염기서열 분석이 라이게이션을 위해 어댑터를 사용하고, 그것은 세포 DNA에 많은 양으로 첨가된다는 사실 때문이다. 이중 가닥 어댑터 분자의 초과량은 PCR 억제제를 생성한다. 그러므로, 적은 양의 DNA는 설명된 접근법을 사용함에 의하여 성공적으로 증폭될 수 없다. 다른 기술들은 다수의 샘플로부터 정보 및/또는 돌연변이 및/또는 염기서열 분석 에러의 확인을 위한 확률-기반 바이오인포매틱스 접근법을 요구한다. 그러므로, 적은 양의 인풋 핵산 분자/DNA, 특히 단일세포의 DNA로부터 또한 에러-프리 서열 정보를 제공하는 염기서열 분석 방법에 대한 필요가 있다.
그러므로, 본 발명의 기저가 되는 기술적 문제는 핵산 분자의 개선된 에러-프리(error-free) 염기서열 분석 방법을 제공하기 위한 것이다.
이 기술적 문제의 해결책이 하기 본 명세서에서 정의되고 청구항에서 특징된 구체예에 의해 제공된다.
본 발명은, 따라서, 하기에 관한 것이다:
하기의 단계를 포함하는, 핵산 분자(들)의 에러-프리 염기서열 분석(error-free sequencing) 방법:
(a) 핵산 분자(들)를 포함하는 샘플을 제공하는 단계;
(b) 유사한 길이의 핵산 분자 단편을 얻기 위해 적합한 조건에서 핵산 분자(들)를 제한 엔도뉴클레아제(restriction endonuclease)로 절단하는(digesting) 단계로서,
상기 제한 엔도뉴클레아제는 5' 오버행(overhangs)을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화(phosphorylated)되는 것이거나, 또는
상기 제한 엔도뉴클레아제는 3' 오버행(overhangs)을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 핵산 분자 단편에 수산화(hydroxylated)되는 것인 단계;
(c) 제1 올리고뉴클레오티드를 상기 핵산 분자 단편에 어닐링(annealing)하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 핵산 분자 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열(randomized sequence)을 포함하는 것인 단계;
(d) 상기 제2 올리고뉴클레오티드를 상기 핵산 분자 단편에 라이게이션(ligation)하는 단계;
(e) 생성된 오버행을 채우는(filling in) 단계;
(f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열과 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 핵산 분자 단편을 증폭하는 단계; 및
(g) 상기 증폭된 핵산 분자 단편을 염기서열 분석하는 단계.
구체적으로, 본 발명은 하기에 관한 것이다:
1. 하기의 단계를 포함하는, DNA의 에러-프리 염기서열 분석(error-free sequencing) 방법:
(a) DNA를 포함하는 샘플을 제공하는 단계;
(b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서,
상기 제한 엔도뉴클레아제는 5' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화되는 것이거나, 또는
상기 제한 엔도뉴클레아제는 3' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 DNA 단편에 수산화되는 것인 단계;
(c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열과 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하는 것인 단계;
(d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션(ligation)하는 단계;
(e) 생성된 오버행을 채우는(filling in) 단계;
(f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열과 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; 및
(g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계.
2. 항목 1의 방법에 있어서, 상기 제3 올리고뉴클레오티드는 프라이머인 것인 방법.
3. 항목 1의 방법에 있어서, 상기 제2 올리고뉴클레오티드는 부위-특이적(site-specific) 엔도뉴클레아제의 제한 부위(restriction site)를 포함하는 제4 서열을 더 포함하는 것인 방법.
4. 항목 1 내지 3 중 어느 하나의 방법에 있어서, 상기 제2 올리고뉴클레오티드는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드 또는 DNA/RNA 올리고뉴클레오티드인 것인 방법.
5. 항목 3의 방법에 있어서, 상기 엔도뉴클레아제는 호밍 엔도뉴클레아제(homing endonuclease), 징크 핑거 뉴클레아제(zinc finger nuclease), TALEN, TFO 뉴클레아제 또는 타게트론(targetron)인 것인 방법.
6. 항목 3 또는 5의 방법에 있어서, 상기 엔도뉴클레아제는 I-SceI 또는 I-CeuI인 것인 방법.
7. 항목 1 내지 6 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (e')를 더 포함하고, 상기 단계 (e')에서 엑소뉴클레아제(exonuclease)를 첨가하는 것인 방법.
8. 항목 7의 방법에 있어서, 상기 엑소뉴클레아제는 단일 가닥 DNA, RNA 및/또는 DNA/RNA 분자를 분해하는 효소인 것인 방법.
9. 항목 7 또는 8의 방법에 있어서, 상기 엑소뉴클레아제는 엑소뉴클레아제 I, 녹두 뉴클레아제(mung bean nuclease), 엑소뉴클레아제 T, 또는 RecJf인 것인 방법.
10. 항목 1 내지 9 중 어느 하나의 방법에 있어서, 상기 DNA는 (i) 단일 세포의 게놈(genome) 또는 전사체(transcriptome), (ii) 단일 세포의 염색체(들), (iii) 단일 세포의 엑소좀(exosomes) 또는 다른 마이크로베지클(microvesicles) 유래 핵산, 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함하는 것인 방법.
11. 항목 10의 방법에 있어서, 상기 단일 세포는 법의학(forensics), 생식 의학(reproductive medicine) 또는 재생 의학(regenerative medicine)에 사용되는 생물학적 물질로부터 얻은 것인 방법.
12. 항목 10 또는 11의 방법에 있어서, 상기 단일 세포는 종양 세포, 혈액 세포, 골수 흡인물(bone marrow aspirates)로부터의 세포, 림프절로부터 얻은 세포 및/또는 현미해부된 조직(microdissected tissue)로부터 얻은 세포, 배아(embryo)의 난할구(blastomere) 또는 배반포(blastocyst), 정세포(sperm cell), 양수로부터 얻은 세포, 혈액으로부터 얻은 세포, 또는 점막세포채집(buccal swabs)으로부터 얻은 세포인 것인 방법.
13. 항목 12의 방법에 있어서, 상기 종양 세포는 파종성 종양 세포(disseminated tumor cell), 순환 종양 세포(circulating tumor cell) 또는 종양 생검으로부터의 세포인 것인 방법.
14. 항목 12의 방법에 있어서, 상기 혈액 세포는 말초 혈액 세포 또는 제대혈로부터 얻은 세포인 것인 방법.
15. 항목 1 내지 9 중 어느 하나의 방법에 있어서, 상기 DNA는 (i) 하나 이상의 단일 세포의 DNA, (ii) 하나 이상의 단일 세포의 세포 유리 태아 DNA (cell-free fetal DNA), (iii) 암 환자들의 혈청 및/또는 혈장에서 하나 이상의 단일 세포의 세포 유리 DNA (cell-free DNA) 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함하는 것인 방법.
16. 항목 15의 방법에 있어서, 상기 세포 유리 DNA는 체액 유래 DNA 물질을 포함하는 것인 방법.
17. 항목 1 내지 16 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (a')를 더 포함하고, 상기 단계 (a')에서 상기 DNA는 인공 제한 부위(artificial restriction sites) 또는 태그(tags)의 도입에 의해 변형된 것인 방법.
18. 항목 1 내지 17 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (a'')를 더 포함하고, 상기 단계 (a'')에서 DNA는 프로테이나제(proteinase)로 절단된 것인 방법.
19. 항목 18의 방법에 있어서, 상기 프로테이나제는 열불안정성인 것인 방법.
20. 항목 18 또는 19의 방법에 있어서, 상기 프로테이나제는 프로테이나제 K인 것인 방법.
21. 항목 18 내지 20 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (a''')를 더 포함하고, 상기 단계 (a''')에서 프로테이나제가 열 불활성화되는 것인 방법.
22. 항목 1 내지 21 중 어느 하나의 방법에 있어서, 단계 (b)에서 사용된 상기 제한 엔도뉴클레아제는 4 내지 6개의 정의된 염기(defined bases)를 갖는 모티프(motif)를 인식하는 것인 방법.
23. 항목 1 내지 22 중 어느 하나의 방법에 있어서, 단계 (b)에서 사용된 상기 제한 엔도뉴클레아제는 공통 서열(consensus sequence) TTAA를 인식하는 것인 방법.
24. 항목 1 내지 23 중 어느 하나의 방법에 있어서, 단계 (b)에서 사용된 상기 제한 엔도뉴클레아제는 Msel 또는 이의 동일전달제한효소(isochizomer)인 것인 방법.
25. 항목 1 내지 24 중 어느 하나의 방법에 있어서, 상기 제2 올리고뉴클레오티드는 상기 제1 올리고뉴클레오티드 보다 더 긴 것인 방법.
26. 항목 1 내지 25 중 어느 하나의 방법에 있어서, 상기 제1 올리고뉴클레오티드는 4 내지 15개의 뉴클레오티드를 포함하고, 상기 제2 올리고뉴클레오티드는 30 내지 60개의 뉴클레오티드를 포함하는 것인 방법.
27. 항목 1 내지 26 중 어느 하나의 방법에 있어서, 상기 무작위 서열은 3 내지 24개의 뉴클레오티드를 포함하는 것인 방법.
28. 항목 1 내지 27 중 어느 하나의 방법에 있어서, 상기 제1 올리고뉴클레오티드는 서열 5'-TAACTGACdd-3'를 포함하고 및/또는 상기 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 서열을 포함하고 및/또는 상기 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열을 포함하는 것인 방법.
29. 항목 1 내지 28 중 어느 하나의 방법에 있어서, 상기 제1 올리고뉴클레오티드는 서열 5'-TAACTGACdd-3'을 가지고 및/또는 상기 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 서열을 가지고 및/또는 상기 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열을 포함하는 것인 방법.
30. 항목 1 내지 29 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (c')를 더 포함하고, 상기 단계 (c')에서 상기 제1 올리고뉴클레오티드 및 상기 제2 올리고뉴클레오티드를 상기 DNA 단편으로부터 분리하여 서로 혼성화하고, 그리고 상기 DNA 단편에 첨가하는 것인 방법.
31. 항목 1 내지 30 중 어느 하나의 방법에 있어서, 제1 올리고뉴클레오티드의 마지막 3' 뉴클레오티드는 dd-뉴클레오티드인 것인 방법.
32. 항목 10 내지 31 중 어느 하나의 방법에 있어서, 상기 단일 세포의 본질적으로 전체 핵 게놈으로부터의 DNA 단편이 증폭되는 것인 방법.
33. 항목 10 내지 32 중 어느 하나의 방법에 있어서, 상기 단일 세포는 화학적 고정이 적용되어 있는 것인 방법.
34. 항목 3 내지 33 중 어느 하나의 방법에 있어서, 상기 방법은 단계 (f')를 더 포함하고, 상기 단계 (f')에서 호밍 엔도뉴클레아제를 첨가하는 것인 방법.
35. 항목 34의 방법에 있어서, 상기 호밍 엔도뉴클레아제에 의한 제한(restriction) 후에 단편을 라이게이션하는 단계를 더 포함하는 것인 방법.
36. 항목 35의 방법에 있어서, 라이게이션된 단편은 전체 게놈 염기서열 분석에 적용되는 것인 방법.
37. 항목 1 내지 33 중 어느 하나의 방법에 있어서, 단계 (a) 내지 (f)는 하나의 반응 용기(vessel)에서 수행하는 것인 방법.
38. DNA 서열 분석, 세포 계통수(cell lineage trees)의 생성 또는 복제수(copy numbers)의 측정을 위한 방법에서 항목 1 내지 37 중 어느 하나의 방법에 의해 얻은 염기서열 분석된 DNA 단편의 용도.
39. 항목 38의 용도에 있어서, DNA 서열 분석을 위한 방법은 전체 게놈(genome) 염기서열 분석, 전체 엑솜(exome) 염기서열 분석, 전체 레귤롬(regulome) 염기서열 분석, 염기서열 분석-기반 메틸화 분석, 염기서열 분석-기반 브레이크포인트(breakpoint) 측정, ChIP 염기서열 분석, 또는 표적 염기서열 분석 및 이들의 변형인 것인 용도.
40. 고정 서열(fixed sequence), 무작위 서열, 제한 뉴클레아제 인식 부위 및/또는 제한 부위, 및 프라이머 결합 부위를 포함하는 4개-파트(four-part) 올리고뉴클레오티드로서, 상기 고정 서열은 4 내지 15개의 뉴클레오티드를 포함하고, 상기 무작위 서열 3 내지 24개의 뉴클레오티드, 그리고 상기 제한 뉴클레아제 인식 부위는 호밍 엔도뉴클레아제의 인식 부위인 것인, 4개-파트 올리고뉴클레오티드.
41. 항목 40의 4개-파트 올리고뉴클레오티드에 있어서, 상기 4개-파트 올리고뉴클레오티드는 프라이머인 것인 4개-파트 올리고뉴클레오티드.
42. 항목 40 또는 41의 4개-파트 올리고뉴클레오티드에 있어서, 상기 제한 뉴클레아제 인식 부위 및/또는 제한 부위 및 상기 프라이머 결합 부위는 하나의 서열에 포함된 것인 4개-파트 올리고뉴클레오티드.
43. 청구항 40 내지 42 중 어느 하나의 4개-파트 올리고뉴클레오티드에 있어서, 상기 고정 서열은 GTCAGT를 포함하고 및/또는 상기 제한 뉴클레아제 인식 부위 및/또는 제한 부위는 서열번호 3을 포함하고 및/또는 상기 프라이머 결합 부위는 서열번호 4를 포함하는 것인 4개-파트 올리고뉴클레오티드.
44. 청구항 40 내지 42 중 어느 하나의 4개-파트 올리고뉴클레오티드에 있어서, 상기 고정 서열은 GTCAGT를 포함하고, 또는 상기 제한 뉴클레아제 인식 부위 또는 제한 부위는 서열번호 3을 포함하고, 또는 상기 프라이머 결합 부위는 서열번호 4를 포함하는 것인 4개-파트 올리고뉴클레오티드.
45. 청구항 40 내지 42 중 어느 하나의 4개-파트 올리고뉴클레오티드에 있어서, 상기 고정 서열은 GTCAGT를 포함하고, 그리고 상기 제한 뉴클레아제 인식 부위 또는 제한 부위는 서열번호 3을 포함하고, 그리고 상기 프라이머 결합 부위는 서열번호 4를 포함하는 것인 방법.
46. 항목 39 내지 42 중 어느 하나의 4개-파트 올리고뉴클레오티드에 있어서, 서열번호 14, 5 또는 12를 포함하는 것인 4개-파트 올리고뉴클레오티드.
따라서, 본 발명은 DNA의 에러-프리 염기서열 분석의 신규하고 진보된 방법을 제공한다. 첨부된 실시예로부터 알 수 있듯이, 본 명세서에서 제공된 에러-프리 염기서열 분석 방법은 특히 에러-프리 DNA 분석에 앞서 DNA 염기서열 분석 단계를 포함하는 에러-프리 DNA 분석을 포함한다. 적은 양의 DNA가 본 발명의 방법에서 이용될 출발 물질로서 바람직하다. 특히, 본 발명은 단일 세포의 DNA 또는 단일 DNA 분자의 에러-프리 염기서열 분석의 신규하고 진보된 방법을 제공한다. 본 명세서에서 제공된 DNA, 특히 적은 양의 DNA의 에러-프리 염기서열 분석의 방법은 (a) DNA를 포함하는 샘플을 제공하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 5' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화되는 것이거나, 또는, 상기 제한 엔도뉴클레아제는 3' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 DNA 단편에 수산화되는 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션하는 단계; (e) 생성된 오버행을 채우는 단계; (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계를 포함한다.
본 발명에 따르면, 제2 올리고뉴클레오티드는 제4 서열을 더 포함할 수 있고, 상기 제4 서열은 엔도뉴클레아제, 바람직하게는 호밍 엔도뉴클레아제(homing endonuclease)의 제한 부위를 포함한다.
이중 가닥 어댑터 대신 단일 가닥 올리고뉴클레오티드의 사용은 PCR 억제제(inhibitors) 및/또는 셀프-라이게이팅 어댑터(self-ligating adaptors), 즉 다른 어댑터 분자에 결합하고 라이게이션에 적용되는 어댑터 분자의 창출(creation)을 피한다는 것이 본 발명자에 의해 놀랍게 발견되었다. 어댑터의 적은 양의 표적 DNA에 대한 높은 라이게이션 효율을 달성하기 위하여 표적 DNA의 양의 초과량으로 어댑터 분자의 첨가가 요구된다. 이중 가닥 어댑터는 그후 PCR 프라이머의 표적 DNA에 대한 결합을 방해할 것인데, 왜냐하면 상보적 서열의 농도가 지나치게 높기 때문이다. 어댑터 분자의 이 초과량은 적은 양의 표적 DNA를 사용하는 것을 불가능하게 하는데, 그것은 표적 DNA의 상당한 손실 없이는 어댑터-표적 DNA 혼합으로부터 정제될 수 없다. 그에 반해서, 본 발명은 출발 물질로서 사용된 DNA의 양에서 독립된 방법을 제공한다. 특히, 본 발명의 방법은 특별히 적은 양의 표적 DNA의 에러-프리 염기서열 분석을 가능하게 하는데, 이것은 단일 세포의 DNA 및/또는 단일 DNA 분자만큼 낮을 수 있다.
게다가, 세 개의 올리고뉴클레오티드의 사용은 출발 물질로서 사용되는 DNA의 양에 독립적인 에러-프리 염기서열 분석을 가능하게 한다는 것이 본 발명자에 의해 놀랍게 발견되었다. 더욱 구체적으로, 선행 기술의 방법은, 예를 들어, 적은 양의 DNA의 에러-프리 염기서열 분석을 제공할 수 없다. 그에 반해서, 본 명세서에서 제공된 방법은 어떤 양의 DNA, 특히 단일 세포의 DNA 및/또는 단일 DNA 분자의 DNA의 서열을 증폭하고 얻기위하여 디자인되었다. 본 명세서에서 제공된 방법은 또한 실제 돌연변이 및 정확한 서열을 확인하기 위하여 증폭되고 염기서열 분석된 DNA에서 염기서열 분석 에러를 제거하기 위해 사용될 수 있다. 이것은 세 개의 올리고뉴클레오티드의 사용에 의해 성취된다. 특히, 제1 올리고뉴클레오티드는 제한 엔도뉴클레아제에 의해 절단된 DNA 샘플의 생성된 3' 및/또는 5' 오버행에 부분적으로 상보적이다. DNA 단편의 오버행(들)과 결합하였을 때, 제1 올리고뉴클레오티드는 또한 오버행을 생성한다, 즉, 제1 올리고뉴클레오티드는 DNA 단편의 3' 및/또는 5' 오버행 보다 길다. 세 개 내지 네 개의 기능 파트/서열을 포함하는 제2 올리고뉴클레오티드는 본 명세서에서 또한 고정 서열(fixed sequence)로 명명된 제1 서열을 포함하는데, 이는 제1 올리고뉴클레오티드와 부분적으로 상보적이고, 그것은 제2 올리고뉴클레오티드가 제1 올리고뉴클레오티드에 의해 생성된 오버행과 결합하는 것을 가능하게 하고, 그것에 의하여 DNA-올리고뉴클레오티드-올리고뉴클레오티드 복합체를 형성한다. 따라서, 제1 올리고뉴클레오티드는 제2 올리고뉴클레오티드가 표적 DNA를 향하도록한다. 제1 올리고뉴클레오티드의 사용은 제2 올리고뉴클레오티드의 각각의 표적 DNA 단편과의 라이게이션 효율을 놀랍게 증가시킨다. 고정 서열은 다양할 수 있으나, 제1 올리고뉴클레오티드와 상보적인 서열을 필수적으로 포함한다. 제2 올리고뉴클레오티드와 결합한 후에, 단일 가닥 라이게이션이 수행되어 제2 올리고뉴클레오티드가 DNA 단편에 공유 결합한다. 제1 올리고뉴클레오티드는 바람직하게는 DNA에 라이게이션되지 않는다. 이것은 5'-인산염 말단(phosphat terminus) 없이 올리고뉴클레오티드를 합성하는 것에 의해 성취될 수 있다.
게다가, 제2 올리고뉴클레오티드의 제2 서열은 각각의 올리고뉴클레오티드-DNA 복합체를 독특하게 표시하기 위하여 바코드(barcode)/식별자(identifier)로서 사용되는 무작위 서열(randomized sequence)를 포함한다. 바코드의 길이는 다양할 수 있다. 특히, 바코드의 길이는 생성된 DNA 단편의 수에 따라 다양할 수 있다. 다음 단계에서, 라이게이션된 제2 올리고뉴클레오티드에 의해 생성된 오버행(들)이 폴리머라제(polymerase) 반응에 의해 채워진다. 제2 올리고뉴클레오티드는 뿐만 아니라 제3 올리고뉴클레오티드가 결합되는 것을 가능하게 하기 위해 디자인된 제3 서열을 포함한다. 그러므로, 제3 올리고뉴클레오티드는 제2 올리고뉴클레오티드의 제3 서열에 상보적이다. 제3 올리고뉴클레오티드는 전체 샘플 대표(representation)의 효율적인 PCR-기반 증폭을 가능하게 하기 위해 디자인되었고, 그 서열이 그후 얻어진다. 따라서, 제3 올리고뉴클레오티드는 PCR 증폭을 위한 프라이머의 역할을 한다.
용어 "서열(sequence)"은 두 개 이상의 단위 (뉴클레오티드) 길이(long)인 핵산 분자 또는 핵산 분자의 임의의 부분에 대한 서열 정보를 의미한다. 이 용어는 또한 핵산 분자 자체 또는 이의 관련 부분에 대한 참조로서 사용될 수 있다.
핵산 분자 서열 정보는 핵산 분자에서 뉴클레오티드 염기의 연속에 관한 것이다. 예를 들어, 핵산 분자가 염기 아데닌(Adenine), 구아닌(Guanine), 시토신(Cytosine), 티민(Thymine) 또는 우라실(Uricil), 또는 이의 화학적 유사체(analogs)를 함유한다면, 핵산 분자 서열은 문자 A, G, C, T 또는 U의 상응하는 연속, 예를 들어, DNA 또는 RNA 분자에 의해 표시될 수 있다.
핵산 분자의 서열을 결정하기 위하여 사용될 예시적인, 비제한적인 방법은 예를 들어 핵산의 염기서열 분석 방법 (예를 들어 생어(Sanger) 디-데옥시 염기서열 분석), 파이로시퀀싱(pyrosequencing), 역방향 염색 터미네이터(reverse dye terminator), 양성자 검출(proton detection), 인연결된 형광 뉴클레오티드(phospholinked fluorescent nucleotides)와 같은 대규모 병렬형 염기서열 분석 방법(massive parallel sequencing methods)이다.
특히, 결과적인 PCR 산물은 종래 생어(Sanger)-기반 디데옥시 뉴클레오티드 염기서열 분석 방법이나 새로운 대규모 병렬형 염기서열 분석 방법 ("차세대 염기서열 분석")을 이용하는 것, 예를 들어 Roche (454 technology), Illumina (Solexa technology), ABI (Solid technology) 또는 Pacific Biosciences (SMRT technology)에 의해 제공된 것에 적용될 수 있다. 돌연변이는 공개되어 이용가능한 서열 데이터 베이스와 비교하는 것에 의해 또는 SIFT 및 PolyPhen과 같은 인실리코(in silico) 바이오인포매틱 도구에서 수행되는 기능 상실(loss-of-function) 및/또는 기능 회득(gain-of-function) 예측 알고리즘에 의해 서열 판독으로부터 확인될 수 있다. 특히, 돌연변이는 의료 지침(medical indications)에 관련된/결정적인 이 기술분야에 알려진 돌연변이일 수 있다. 대안적으로, 돌연변이는 효소 검출 반응, 형광, 질량 분석 등을 사용하여 검출될 수 있는 분자 태그(tags)의 대립유전자-특이적 혼입(incorporation)에 의해 확인될 수 있다; Vogeser (2007) Dtsch Arztebl 104 (31-32), A2194-200을 참조하라.
용어 "에러-프리(error-free)" 염기서열 분석은 샘플 가공, 예를 들어 DNA 분리, 증폭 및/또는 염기서열 분석 동안 도입된 기술적 에러가 많이 확장되는 것을 제거하는 것을 가능하게 하기 위한 접근을 의미한다. 무작위 바코드/식별자의 사용을 통해 각각의 개별 대립유전자는 두 말단에 독특한 서열 태그로 표지된다. 두 라이게이션된 바코드가 옆에 배치된 서열은 쉽게 추적될 수 있는데, 두 상보적인 DNA 가닥의 공통 서열이 결정될 수 있기 때문이다. 동일한 이중-가닥 DNA 단편의 단일 가닥 공통 서열 사이의 임의의 뉴클레오티드에서 상보성의 부족은 기술적 에러로서 인식될 것이다. 그러나, 당업자는 용어 "에러-프리"가 기술적 제거의 완전한 제거를 의미하지 않으며, 대신에 무시할 수 있는 수준으로 그 빈도의 감소를 의미한다는 것을 쉽게 이해할 것이다. 특히, 당업자는 본 발명의 방법에서 이용될 출발 물질로서 단일 세포의 DNA 또는 단일 DNA 분자를 사용하였을 때, DNA의 증폭이 나중에 본 발명의 방법을 사용하여 에러 정정에 의해 제거될 수 있는 에러를 도입할 것이라는 점을 인정할 것이다. 본 명세서에서 또한 제공된 더 많은 양의 출발 물질, 예를 들어 조직으로부터 추출된 DNA는 DNA 염기서열 분석 이전에 DNA 증폭을 요구하지 않을 수도 있고, 가능하게는 DNA 염기서열 분석에서 감소된 에러율을 초래하고, 그것은 또한 본 발명의 방법을 사용하여 정정될 수 있다.
본 발명에 따른 용어 "무작위 서열(randomized sequence)"은 뉴클레오티드의 서열로 이해될 것이고, 여기에서 각각의 위치는 임의의 뉴클레오티드가 될 독립적이고 동등 확률을 가진다. 무작위 뉴클레오티드는 임의의 순서의 임의의 뉴클레오티드, 예를 들어 G, A, C, T, U, 또는 이의 화학적 유사체(analogs)가 될 수 있고, 여기에서: G는 구아닐릭 뉴클레오티드, A 아데닐릭 뉴클레오티드, T 티미딜릭 뉴클레오티드, C 시토딜릭 뉴클레오티드 및 U 우라실릭 뉴클레오티드를 나타내는 것으로 이해된다. 당업자는 알려진 올리고뉴클레오티드 합성 방법이 뉴클레오티드 G, A, C, T 또는 U의 불평등을 본질적으로 이끌 수 있다는 것을 인정할 것이다. 예를 들어, 합성은 뉴클레오티드, 예를 들어 무작위 DNA 서열에서 G의 과표현(overrepresentation)를 이끌 수 있다. 이것은 뉴클레오티드의 동등 표현에 기초하여 예측된 독특한 무작위 서열의 감소된 수를 이끌 수 있다. 그러나, 당업자는 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드에 포함된 독특한 무작위 서열의 전체 수는 각각의 표적 DNA 단편을 분명히 확인하기 위해 일반적으로 충분할 것이라는 점을 잘 알고 있다. 이것은 당업자가 또한 무작위 서열의 길이가 DNA 단편화로부터 초래된 단편의 수에 의존하여 다양할 수 있다는 사실을 알 것이기 때문이다. DNA 단편의 예상된 수는 제한 엔도뉴클레아제의 절단 부위의 수 및 표적 DNA의 길이로부터 얻어질 수 있다. 따라서, 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드의 무작위 서열에서 뉴클레오티드의 잠재적인 불공평한 표현은, 알려진 표준 올리고뉴클레오티드 합성 방법에서 뉴클레오티드의 불공평한 커플링 효율 때문인데, 이 기술분야의 일반적인 지식에 기초하여 당업자에 의해 쉽게 고려될 수 있다. 특히, 당업자는 무작위 서열의 길이는 독특한 무작위 서열의 증가된 수를 얻기 위하여 증가될 수 있다는 점을 잘 알고 있다.
용어 "상보적(complementary)" 또는 "상보성(complementarity)"은 염기-짝지음에 의한 허용된 염 및 온도 조건 하에 폴리뉴클레오티드의 자연적 결합을 의미한다. 예를 들어, 서열 "A-G-T"는 상보적 서열 "T-C-A"와 결합한다. 두 단일-가닥 분자 사이의 상보성은 "부분적"일 수 있고, 여기에서 핵산의 오직 몇 개의 뉴클레오티드가 서로 결합할 수 있고, 또는 단일-가닥 분자 사이에 전체 상보성이 존재할 때 그것은 완전할 수 있다. 핵산 가닥 사이의 상보성의 정도는 핵산 가닥 사이의 혼성화(hybridization)의 효율 및 강도에 상당한 효과를 가진다. 이것은 증폭 반응에서 특히 중요하고, 그것은 핵산 가닥 사이의 결합에 의존한다. 본 발명에서 사용된 바와 같이, 용어 "유사한 길이의 DNA 단편"은, 통계적 수준에서, 비슷한 길이의 크기를 가지는 단편을 나타낸다. 비슷한 길이의 DNA 단편은, 예를 들어, 약 50 +/- 5bp 부터 약 4kbp +/- 0.4 kbp까지의 단편이다. 바람직하게 생성된 DNA 단편의 길이 범위는 유리하게는 약 50 bp와 약 4 kbp 사이이다. 더 길거나 더 짧은 길이의 DNA 단편도 역시 사용될 수 있는데, 그들은 상기 정의된 크기 범위의 단편 보다 더 작은 면적으로 증폭되거나 나타날 수 있긴 하다. DNA 단편은 바람직하게는 직선 및/또는 지수 증폭에 적합하다. 바람직하게는, DNA 단편은 < 3 kbp의 크기를 가지고, 더욱 바람직하게는 상기 DNA 단편은 약 1000 bp의 평균 길이를 가지고, 특히 바람직하게는 약 100-400 bp의 단편이다.
본 명세서에서 사용된 용어 "5' 오버행(overhangs)" 및 "3' 오버행(overhangs)"은, 예를 들어 제한 엔도뉴클레아제에 의한 DNA의 엇갈린 절단에 의해 제공된 5' 인산기 또는 3' 수산기를 의미하고, 그리고 각각 DNA에서 단일 가닥 오버행 5' 말단 또는 DNA에서 단일 가닥 오버행 3' 엔드를 나타낸다.
용어 "증폭하는(amplifying)"은 뉴클레오티드의 구체적 서열의 양에서 증가를 초래하는 뉴클레오티드의 특정 서열의 반복된 카피를 의미하고, 동등한 또는 본질적으로 동등한 (즉, 적어도 95%, 더욱 바람직하게는 적어도 98%, 더욱 더 바람직하게는 적어도 99% 및 가장 바람직하게는 적어도 99.5%, 예를 들어 99.9% 동등한) 핵산 분자 또는 이의 부분의 다수의 생성을 가능하게 한다. 이러한 방법은 이 기술분야에 잘 설립되었다: Sambrook et al. "Molecular Cloning, A Laboratory Manual", 2nd edition 1989, CSH Press, Cold Spring Harbor를 참조하라. 다양한 증폭 방법이 적용될 수 있고, 이것은 예를 들어, 롤링 서클 증폭(rolling circle amplification) (예를 들어 Liu, et al., "Rolling circle DNA synthesis: Small circular oligonucleotides as efficient templates for DNA polymerases," J. Am. Chem. Soc. 118:1587-1594 (1996).), 등온 증폭(isothermal amplification) (예를 들어 Walker, et al., "Strand displacement amplification--an isothermal, in vitro DNA amplification technique", Nucleic Acids Res. 20(7):1691-6 (1992)), 리가아제 연쇄반응(ligase chain reaction) (예를 들어 Landegren, et al., "A Ligase-Mediated Gene Detection Technique," Science 241:1077-1080, 1988, or, in Wiedmann, et al., "Ligase Chain Reaction (LCR)--Overview and Applications", PCR Methods and Applications (Cold Spring Harbor Laboratory Press, Cold Spring Harbor Laboratory, NY, 1994) pp. S51-S64.)이다. 중합효소 연쇄 반응 증폭(polymerase chain reaction amplification)이, 그러나, 바람직하다. 그들은 몇몇의 바람직한 증폭 방법으로 지정된 중합효소 연쇄 반응 (PCR) 및 이의 변형, 리가아제 연쇄 반응 (LCR)을 포함한다.
용어 "어닐링하다(anneal)" 또는 "혼성화하다(hybridize)" 및 "어닐링(annealing)" 또는 "혼성화(hybridization)"는 Watson-Crick 염기 짝지음을 통해 복합체를 형성하기 위해 충분히 상보적인 뉴클레오티드 서열 사이의 복합체의 형성을 의미한다. 본 발명에 관하여, "~에 상보적인" 또는 "~와 상보적인" 핵산 서열, 또는 서로에 또는 서로와 "혼성화하는" 또는 "어닐링하는" 핵산 서열은 의도된 목적을 제공하기 위해 충분히 안정한 "혼성체(hybrids)" 또는 "복합체(complexes)"를 형성할 수 있거나 형성할 것이다. 혼성화 또는 어닐링 및 혼성화의 강도 (즉, 핵산 가닥 사이의 연계의 강도)는 이 기술분야에 잘 알려진 많은 요소에 의해 영향을 받는데, 예를 들어 핵산 사이의 상보성의 정도, 염의 농도와 같은 조건에 의해 영향을 받는 수반된 조건의 가혹함, 형성된 혼성체의 Tm (녹는 온도), 다른 성분의 존재 (예를 들어, 폴리에틸렌 글리콜 또는 베타인(betaine)의 존재 또는 부재), 혼성화 가닥의 몰 농도 및 핵산 가닥의 G:C 함량(content)을 포함한다.
본 발명의 방법은 DNA의 에러-프리 염기서열 분석을 가능하게 한다. 증폭 및/또는 염기서열 분석이 최종 염기서열 분석 결과에 에러를 도입한다는 점은 이 기술분야에 잘 알려져 있다. 이것은, 그 중에서도(inter alia), 염기서열 분석 동안 사용된 폴리머라제의 자연적 에러율 및/또는 염기의 아이덴티티(identity)의 모호성 때문이다. 에러를 확인하는 가장 좋은 방법은 이중 가닥 DNA 분자의 불필요한 서열 정보를 사용하는 것이다. 이것은 DNA 샘플의 같은 위치에서 증폭 및/또는 염기서열 분석 동안 에러의 도입의 개연성이 최소이기 때문이다. 본 명세서에서 제공된 방법은 각각의 단일 가닥 DNA 분자/단편에 독특한 식별자/바코드를 첨가하는 것에 의해 이중 가닥 DNA 분자의 불필요한 서열 정보의 사용을 만드는 것에 의해 그러한 에러의 확인을 가능하게 한다. 따라서, 각각의 이중 가닥 DNA 분자/단편은 두 5' 말단 또는 두 3' 말단 각각에 독특한 식별자/바코드가 태그된다. 그 다음의 채우는(fill-in) 반응은 표적 DNA의 각각의 부위에 두 구별되는 바코드가 태그된 단일 가닥 DNA 분자의 생성을 이끈다. 더욱 구체적으로, 각각의 단일 가닥 표적 DNA 분자는 표적 DNA 단편의 상보적 서열에 라이게이션된 제2 올리고뉴클레오티드의 바코드의 표적 DNA 단편 및 상보적 서열과 라이게이션된 제2 올리고뉴클레오티드의 바코드로 태그된다. 따라서, 이중 가닥 DNA 단편의 두 단일 가닥 DNA 분자는 각가의 단일 가닥 DNA의 5' 및 3' 말단에 각각 부착된 두 바코드 서열에 기초하여 분명하게 확인될 수 있다. 첫 번째 단계에서, 서열은 3' 및 5' 말단에 바코드에 따라 분류된다. 두 번째 단계에서 원래의 이중-가닥 DNA 분자의 상보적 가닥이 상보적 바코드를 통해 확인된다. 그것에 의하여 그 중에서도(inter alia) 샘플 제조, 예를 들어 증폭 및/또는 염기서열 분석 동안 도입된 에러를 확인하는 것이 가능하고, 그러므로, 예를 들어, 종양 세포의 대립유전자에서 실제 돌연변이를 확인하는 것이 가능하다. 각각의 환자의 종양 세포에서 실제 돌연변이의 신뢰할 수 있는 확인은 효율적인 개인맞춤형 표적 암 치료를 개발하고 및/또는 향상시키는 것을 가능하게 할 수 있다. DNA 분자에서 돌연변이의 확인에 더하여, 본 발명의 방법은 표적 DNA 분자의 변형, 예를 들어 메틸화(methylation), 특히 시토신의 메틸화의 에러-프리 확인을 위해 사용될 수 있다 (Laird 2010 Nature Reviews Genetics 11, 191-203).
본 발명의 올리고뉴클레오티드는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드 또는 DNA/RNA 올리고뉴클레오티드일 수 있다. 특히, 올리고뉴클레오티드는 리보핵산 뉴클레오티드 및/또는 데옥시리보핵산 뉴클레오티드 각각을 부분적으로 또는 완전히 포함할 수 있다. 본 발명의 일 구체예에서, 제2 올리고뉴클레오티드의 제2 서열은 리보핵산 뉴클레오티드로 구성된다. 따라서, DNA-RNA-DNA 조성의 제2 올리고뉴클레오티드의 이중-가닥 DNA-단편의 단일 가닥 분자와의 라이게이션 후에, RNA-의존적 및/또는 DNA-의존적 DNA 합성 특성을 갖는 효소(들)의 첨가는 라이게이션된 제2 올리고뉴클레오티드의 부위에서 조성 DNA:DNA-RNA:DNA-DNA:DNA의 이중-가닥 DNA 단편을 생성할 것이다. RNA-DNA 혼성체에서 인산디에스테르 결합을 특이적으로 가수분해하고 프리(free) 제2 올리고뉴클레오티드의 단일-가닥 RNA 파트를 절단하는 리보뉴클레아제(들)의 첨가는 반응에서 모든 RNA 서열을 제거할 것이고, 그것에 의하여 제2 올리고뉴클레오티드 및 제3 올리고뉴클레오티드의 부위에 내부 갭(gap)을 갖는 이중-가닥 단편을 생성할 것이다. 이중-가닥 DNA-단편에서 결과적인 갭은 반응에서 이미 존재하는 DNA 폴리머라제에 의해 채워질 것이다. 리가아제(ligase)의 첨가는 제2 올리고뉴클레오티드의 확장된 부분을 제2 올리고뉴클레오티드의 고정 서열과 공유결합으로 연결할 것이다.
본 발명의 제2 올리고뉴클레오티드는 게다가 제한 효소, 예를 들어 호밍 엔도뉴클레아제에 대한 부위-특이적 모티브를 함유할 수 있는 제4 서열을 포함할 수 있다. 그것에 의하여 제4 서열은 제2 및 제3 서열 사이 또는 제3 서열 내에 위치되는 것이 바람직하다. 따라서, 제2 올리고뉴클레오티드의 제4 서열의 존재는 올리고뉴클레오티드 결합 부위, 즉 제3 서열의 제거에 의하여 증폭 산물의 길이를 감소시키는 것을 가능하게 하고, 그것은 DNA 염기서열 분석에 필요하지 않다. 이것은 증폭 산물의 단축(shortening) 때문에 긴 세포 또는 샘플-유래 DNA 단편의 염기서열 분석을 가능하게 한다. 제한 효소 부위는 높은 효율로 염기서열 분석 어댑터를 라이게이션 하기 위해 또는 전체 게놈 염기서열 분석 접근법과 같은 차세대 염기서열 분석 기술 후 DNA 단편을 농축하기 위해 사용될 수 있다.
본 명세서에서 사용된, 용어 "제한 엔도뉴클레아제(restriction endonuclease)"는 특정 뉴클레오티드 서열에서 또는 그 근처에서 이중 가닥 DNA를 자를 수 있는 효소를 의미한다. 제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하고, DNA에 서열-특이적 결합할 수 있고 (제한 부위에서), 그리고 결합 부위에서 또는 그 근처에서 DNA를 자를 수 있다. 어떤 제한 효소 (예를 들어, 타입 IIS)는 제한 부위로부터 먼 부위에서 DNA를 자르고, 구별되는 결합 및 절단 단위를 가진다. 예를 들어, 타입 IIS 효소 Fok I는 한 가닥에서 그 제한 부위로부터 9개 뉴클레오티드에서 그리고 다른 하나에서 그 제한 부위로부터 13개 뉴클레오티드에서 DNA의 이중-가닥 절단에 촉매 작용을 한다. 예를 들어, U.S. Pat. Nos. 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 Li et al., Proc . Natl . Acad . Sci . USA, 89:4275-4279, 1992; Li et al., Proc . Natl . Acad . Sci . USA, 90:2764-2768, 1993; Kim et al., J. Biol . Chem., 269:31,978-31,982, 1994b; Kim et al., Proc . Natl. Acad . Sci . USA, 91:883-887, 1994a를 참조하라.
예시적인 타입 IIS 제한 효소는 국제공개공보 WO 07/014,275에 설명되었으며, 그 전체가 본 명세서에 통합된다. 다른 제한 효소는 또한 분리할 수 있는 결합 및 절단 도메인을 함유하고, 이것은 본 개시에 의해 고려된다. 예를 들어, Roberts et al., Nucleic Acids Res., 31:418-420, 2003를 참조하라.
표적 DNA에서 표적 부위를 가지는 임의의 뉴클레아제가 본 명세서에서 개시된 방법에서 사용될 수 있다. 예를 들어, 호밍 엔도뉴클레아제 및 메가뉴클레아제(meganucleases)는 매우 긴 제한 서열을 가지고, 그것중 일부는 인간-크기의 게놈에서일 때 통계적 근거에 존재할지도 모른다.
본 발명의 방법의 단계 (f')에서 사용되기에 적합한 예시적인 호밍 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII를 포함한다. 그들의 제한 서열은 알려져 있다. 또한 U.S. Pat. No. 5,420,032; U.S. Pat. No. 6,833,252; Belfort et al., Nucleic Acids Res., 25:3379-3388, 1997; Dijon et al., Gene, 82:115-118, 1989; Perler et al., Nucleic Acids Res., 22:1125-1127, 1994; Jasin, Trends Genet., 12:224-228, 1996; Gimble et al., J. Mol . Biol., 263:163-180, 1996; Argast et al., J. Mol . Biol., 280:345-353, 1998 및 New England Biolabs catalogue를 참조하라.
대부분의 호밍 엔도뉴클레아제의 절단 특이성이 그의 제한 부위와 관련하여 완벽하지 않을지라도, 그 부위는 그의 제한 부위의 단일 카피를 함유하는 세포에서 호밍 엔도뉴클레아제를 발현하는 것에 의해 포유동물-크기의 게놈 당 단일 절단 이벤트가 얻어질 수 있는 충분한 길이이다. 호밍 엔도뉴클레아제 및 메가뉴클레아제의 특이성은 비-자연 표적 부위에 결합하기 위해 조작될 수 있다는 점이 또한 보고되었다. 예를 들어, Chevalier et al., Molec . Cell, 10:895-905, 2002; Epinat et al., Nucleic Acids Res., 31:2952-2962, 2003; Ashworth et al., Nature, 441:656-659, 2006; Paques et al., Current Gene Therapy, 7:49-66, 2007를 참조하라.
게다가, 본 발명은 제1, 제2, 제3 및 제4 서열을 포함하는 4개-파트(four-part) 올리고뉴클레오티드를 제공하고, 여기에서 제1 서열은 고정 서열을 포함하고, 제2 서열은 무작위 서열을 포함하고, 제3 서열은 프라이머 결합 부위를 포함하고 그리고 제4 서열은 제한 뉴클레아제 인식 부위 및/또는 제한 부위를 포함한다. 본 발명에 따르면, 고정 서열은 바람직하게는 약 4 내지 15개의 뉴클레오티드를 포함하고, 무작위 서열은 바람직하게는 약 3 내지 24개의 뉴클레오티드를 포함하고, 그리고 제한 뉴클레아제 인식 부위는 바람직하게는 호밍 엔도뉴클레아제의 인식 부위를 포함한다. 4개-파트 올리고뉴클레오티드는 4개 서열/파트의 하기 바람직한 5' 내지 3' 순서를 가진다: 5' 엔드(end) 다음에 프라이머 결합 부위 (제3 서열) 또는 제한 부위 (제4 서열) 다음에 프라이머 결합 부위 또는 제한 부위 (대부분의 5' 서열의 선택에 의존함) 다음에 무작위 서열 (제2 서열) 다음에 고정 서열 (제1 서열) 다음에 3' 엔드(end).
본 발명에 따르면, 용어 "올리고뉴클레오티드(oligonucleotide)"는 임의의 핵산 분자, 예를 들어 DNA, 예를 들어 cDNA 또는 게놈(genomic) DNA, 및 RNA를 포함한다. 또한 이 기술분야에 알려진 핵산 모방 분자, 예를 들어 DNA 또는 RNA의 합성 또는 세미-합성 유도체 및 혼합된 폴리머를 포함한다. 본 발명에 따른 그러한 핵산 모방 분자 또는 핵산 유도체는 포스포로티오에이트 핵산(phosphorothioate nucleic acid), 포스포라미데이트 핵산(phosphoramidate nucleic acid), 2'-O-메톡시데틸 리보핵산, 몰포리노 핵산(morpholino nucleic acid), 헥시톨 핵산 (HNA) 및 LNA (locked nucleic acid) (Braasch and Corey, Chem Biol 2001, 8: 1를 참조하라) 등을 포함한다. LNA는 리보오스 고리가 2'-산소 및 4'-탄소 사이의 메틸렌 결합에 의해 속박된 RNA 유도체이다. 그들은 당업자에 의해 쉽게 인정되는 바에 따라 추가적인 비-자연의 또는 유도체 뉴클레오티드 염기를 함유할 수 있다.
게다가, 본 발명은 본 발명의 핵산 분자를 특이적으로 증폭할 수 있는 올리고뉴클레오티드에 관한 것이다. 따라서, 본 발명의 목적 내에서 올리고뉴클레오티드는 증폭을 위한 출발 포인트의 역할을 할 수 있고, 즉, 프라이머의 역할을 할 수 있다. 특히, 본 발명의 제3 올리고뉴클레오티드는 바람직하게는 PCR 증폭을 위한 프라이머의 역할을 한다. 상기 올리고뉴클레오티드는 또한 핵산 분자의 가닥 중 하나의 영역에 상보적인 올리고리보- 또는 데옥시리보뉴클레오티드를 포함할 수 있다. 본 발명에 따르면, 당업자는 용어 "프라이머(primer)"가 또한, 예를 들어, 중합효소 연쇄 반응 (PCR)에 의한 증폭을 가능하게 하기 위하여 서로를 향해 반대 방향으로 향하는 핵산 분자의 상보적 영역에 관련된 프라이머의 쌍을 의미한다는 것을 쉽게 이해할 것이다. 본 발명의 방법에서 그의 사용 이전에, 프라이머(들)의 정제가 일반적으로 예상된다. 그러한 정제 단계는 HPLC (high performance liquid chromatography) 또는 PAGE (polyacrylamide gel-electrophoresis)를 포함할 수 있고, 당업자에게 잘 알려져 있다. 프라이머, 특히 본 발명의 제3 올리고뉴클레오티드의 맥락에서 사용될 때, 용어 "특이적으로(specifically)"는 본 명세서에서 설명된 오직 원하는 핵산 분자가 증폭된다는 것을 의미한다. 그러므로, 본 발명에 따르면 프라이머는 바람직하게는 이 분자에 독특한 핵산 분자의 영역에 결합하는 프라이머이다. 프라이머의 쌍과 관련되어, 본 발명에 따르면, 쌍의 프라이머 중 하나가 상기 설명된 의미에서 특이적이거나 또는 쌍의 프라이머의 둘 모두가 특이적인 것이 가능하다.
프라이머의 3'-OH 엔드는 뉴클레오티드의 연속적인 결합에 의해 확장되기 위해 폴리머라제에 의해 사용된다. 본 발명의 프라이머 또는 프라이머의 쌍이, 예를 들어, 당업자에 의해 알려진 방법에 따른 주형 DNA에서 프라이머 연장 실험에서 사용될 수 있다. 바람직하게는, 본 발명의 프라이머 또는 프라이머의 쌍은 주형 DNA, 바람직하게는 게놈(genomic) DNA에 대한 증폭 반응을 위해 사용된다. 용어 "주형 DNA"는 상기 정의된 표적 뉴클레오티드 서열을 포함하는 임의의 소스(source) 또는 뉴클레오티드 조성물의 DNA 분자 또는 이의 단편을 의미한다. 프라이머 또는 프라이머의 쌍은 또한 이 기술분야에서 알려진 혼성화 실험을 위해 사용될 수 있다. 바람직하게는, 프라이머 또는 프라이머의 쌍은 중합효소 연쇄 반응에서 사용되어 본 발명의 핵산 분자의 서열에 상응하는 서열을 증폭한다. 프라이머의 길이는 다른 파라미터로부터 얻어진다는 점이 알려져 있다 (Gillam, Gene 8 (1979), 81-97; Innis, PCR Protocols: A guide to methods and applications, Academic Press, San Diego, USA (1990)). 바람직하게는, 프라이머는 표적 뉴클레오티드 서열의 특정 영역에 오직 혼성화하거나 결합할 것이다. 통계학적으로 표적 뉴클레오티드 서열의 하나의 영역과 오직 혼성화하는 프라이머의 길이는 하기 식에 의해 계산될 수 있다: (1/4) x (여기에서 x는 프라이머의 길이). 그러나, 상보적인 주형 가닥에 정확하게 매칭하는 프라이머는 적어도 9개 염기쌍 길이여야 한다는 것이 알려져 있고, 그렇지 않으면 안정한 이중 가닥이 생성될 수 없다 (Goulian, Biochemistry 12 (1973), 2893-2901). 또한 컴퓨터-기반 알고리즘이 DNA를 증폭할 수 있는 프라이머를 디자인하기 위해 사용될 수 있다는 것이 예상된다. 또한 프라이머 또는 프라이머의 쌍은 표지가 되어있다는 것이 예상된다. 표지는, 예를 들어, 방사성 표지, 예를 들어 32P, 33P 또는 35S일 수 있다. 본 발명의 바람직한 구체예에서, 표지는 비-방사성 표지, 예를 들어 디고시게닌(digoxigenin), 비오틴(biotin) 및 형광 염료 또는 염료이다.
본 명세서에서 사용된 용어 "채우는(filling in)" 또는 "채운다(fill-in)"는 3' 수산기 엔드에서 개시되어 상보적 가닥을 채우는 것을 초래하는 DNA 합성 반응을 의미한다. 이 DNA 합성 반응은 바람직하게는 dNTPs (dATP, dGTP, dCTP 및 dTTP, dUTP, 및/또는 이의 화학적 유사체)의 존재하에 수행된다. Taq 폴리머라제와 같은 열안정성 DNA 폴리머라제가 자주 사용되고, 당업자에게 잘 알려져 있다.
본 발명의 바람직한 구체예에서, 본 발명의 제2 올리고뉴클레오티드의 제4 서열은 부위-특이적 엔도뉴클레아제의 제한 부위를 포함한다. 이 점에서, 드물게 절단하는 엔도뉴클레아제의 제한 부위가 바람직하다. 더욱 구체적으로, 인간 게놈 DNA를 전형적으로 절단하거나 또는 인간 게놈에서 드물게 존재하는 핵산 서열의 부위-직접적 절단을 가능하게 하는 자연의 또는 조작된 합성 엔도뉴클레아제 또는 자연의 또는 조작된 효소의 제한 부위가 바람직하다. 조작된 제한 효소는 서열을 부위-특이적으로 인식하는 것이 가능할 수 있고, 그것은 인간 게놈에 존재하지 않으나, 인공적으로 도입된다. 엔도뉴클레아제는 호밍 엔도뉴클레아제, 징크 핑거(zinc finger) 엔도뉴클레아제, TALEN, TFO 뉴클레아제 또는 타게트론(targetron)일 수 있다. 엔도뉴클레아제는 I-SceI 또는 I-CeuI인 것이 바람직하다. 그러므로 엔도뉴클레아제에 의해 인식되는 제한 부위는 I-SceI 또는 I-CeuI를 사용할 때 각각 5'-TAGGGATAACAGGGTAAT-3' 또는 5'-TAACTATAACGGTCCTAAGGTAGCGAA-3' 인 것이 바람직하다.
부위-특이적 엔도뉴클레아제는 본 발명의 방법의 단계 (g) 이전에, 즉 증폭된 핵산 분자, 바람직하게는 DNA의 염기서열 분석 이전에 첨가될 수 있다. 부위-특이적 엔도뉴클레아제는 단계(f) 후에 단계 (f')에서 첨가되는 것이 바람직하다. 따라서, 본 발명의 방법은 단계 (f')를 더 포함하고, 단계 (f')에서 부위-특이적 엔도뉴클레아제, 특히 호밍 엔도뉴클레아제가 첨가되는 것이 바람직하다. 부위-특이적 엔도뉴클레아제는 호밍 엔도뉴클레아제, 더욱 바람직하게는 I-SceI 또는 I-CeuI인 것이 바람직하다.
본 발명의 방법은 엑소뉴클레아제(exonuclease)의 첨가를 더 포함할 수 있다. 엑소뉴클레아제는 특이적 인식 부위를 가지지 않기 때문에, 채우는(fill-in) 반응 후에, 첨가된 인공 서열을 갖는 표적 DNA는 단일-가닥 특이적 엑소뉴클레아제에 의해 절단될 수 없는 이중 가닥 DNA로 구성될 것이다. 그러므로, 단일-가닥 특이적 엑소뉴클레아제는 오직 비라이게이션된 올리고뉴클레오티드 서열에 영향을 미칠 것이다. 특히, 엑소뉴클레아제는 초과 단일 가닥 핵산 분자, 예를 들어 DNA 및/또는 RNA, 바람직하게는 DNA를 분해하기 위하여 첨가될 것이다. 구체적으로, 엑소뉴클레아제는 증폭 이전에 본 발명의 방법에서 사용된 제1 및 초과적인 제2 올리고뉴클레오티드를 분해하기 위하여 첨가될 수 있다. 그러므로, 엑소뉴클레아제는 본 발명의 방법의 단계 (f) 이전에 첨가되는 것이 바람직하다. 더욱 구체적으로, 본 발명의 방법은 단계 (e')를 더 포함하고, 단계 (e')에서 엑소뉴클레아제가 첨가되는 것이 바람직하다. 엑소뉴클레아제의 첨가는 증폭 동안에 원하지 않는 부산물을 피한다. 바람직하게는, 엑소뉴클레아제는 5'에서 3' 방향으로 단일-가닥 핵산 분자를 분해하는 반면, 임의의 다른 핵산 분자에 작용하지 않거나, 또는 3'에서 5' 방향으로 단일-가닥 핵산 분자를 분해하는 반면, 임의의 다른 핵산 분자에 작용하지 않는다. 엑소뉴클레아제에 의해 인식되는 제한 부위는 엑소뉴클레아제 I, 녹두 뉴클레아제(mung bean nuclease), 엑소뉴클레아제 T 또는 RecJf의 제한 부위인 것이 바람직하다. 단일-가닥 DNA 분자로부터 뉴클레오티드의 제거가 엑소뉴클레아제 I 또는 RecJf로 촉매 작용되는 것이 가장 바람직하다.
임의의 DNA 샘플이 본 발명의 방법을 위해 사용될 수 있는 반면, 사용된 DNA 샘플은 (i) 단일 세포의 게놈(genome) 또는 전사체(transcriptome), (ii) 단일 세포의 염색체(들), (iii) 단일 세포의 엑소좀(exosomes) 또는 다른 마이크로베지클(microvesicles) 유래 핵산 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함하는 것이 바람직하다.
본 발명의 방법에서 사용된 단일 세포는 법의학, 생식 의학 또는 재생 의학에서 사용된 생물학적 물질로부터 얻을 수 있다. 따라서, 단일 세포는 종양 세포, 혈액 세포, 골수 흡인물로부터의 세포, 림프절로부터의 세포 및/또는 현미해부된 조직으로부터 얻은 세포, 배아의 난할구 또는 배반포, 정세포, 양수로부터 얻은 세포, 또는 점막세포채집으로부터 얻은 세포일 수 있다. 종양 세포는 파종성 종양 세포, 순환 종양 세포 또는 종양 생검으로부터의 세포인 것이 바람직하다. 혈액 세포는 말초 혈액 세포 또는 제대혈로부터 얻은 세포인 것이 더욱 바람직하다. DNA 샘플은 (i) 단일 세포의 게놈 또는 전사체, (ii) 단일 세포의 염색체(들), (iii) 단일 세포의 엑소좀 또는 다른 마이크로베지클 유래 핵산 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)로 구성된 것이 특히 바람직하다.
본 발명의 또다른 측면에서, DNA 샘플은 또한 (i) 하나 이상의 단일 세포의 DNA, (ii) 하나 이상의 단일 세포의 세포 유리 태아 DNA, (iii) 혈청 및/또는 혈장에서 하나 이상의 단일 세포의 세포 유리 DNA (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함할 수 있다. DNA 샘플은 또한 하나 이상의 단일 세포 DNA, 하나 이상의 단일 세포의 세포 유리 태아 DNA 또는 암 환자들의 혈청 및/또는 혈장에서 하나 이상의 단일 세포의 세포 유리 DNA로 구성될 수 있다. DNA 샘플은 하나 이상의, 특히 둘 이상의 단일 세포로부터 얻을 수 있다. DNA 샘플은 2 내지 5000개 단일 세포로부터 얻어지는 것이 바람직하다.
게다가, 본 발명의 방법에서 사용된 DNA는 변형될 수 있다. 특히, 본 발명의 방법에서 사용된 DNA는 인공 제한 부위 또는 태그의 도입에 의해 변형될 수 있다. 본 발명의 방법에서 사용된 DNA에 변형은 DNA를 증폭하기 전에 수행하는 것이 바람직하다. 특히, 본 발명의 방법은 단계 (a')를 더 포함하고, 단계 (a')에서 인공 제한 부위 및/또는 태그의 도입에 의해 DNA가 변형되는 것이 바람직하다.
본 발명의 방법에서 사용된 단일 세포 및/또는 하나 이상의 단일 세포는 임의의 기원의 것일 수 있다. 그것은 생물학적 물질의 다양한 소스로부터 얻을 수 있다. 단일 세포(들)의 기원으로서 사용된 생물학적 물질은, 예를 들어, 법의학, 생식 의학 또는 재생 의학에서 사용될 수 있다. 본 발명의 방법에서 사용된 단일 세포 또는 단일 세포들은 파종성 종양 세포(들), 순환 종양 세포(들), 말초 혈액 세포(들), 골수 흡인물로부터의 세포(들), 종양 생검으로부터의 세포(들), 제대혈로부터 얻은 세포(들), 림프절로부터 얻은 세포(들) 및/또는 현미해부된 조직으로부터 얻은 세포(들), 배아의 난할구(들) 또는 배반포(들), 정세포(들), 양수로부터 얻은 세포(들) 또는 점막세포채집 또는 극체(polar bodies)로부터 얻은 세포(들)인 것이 바람직하다.
본 발명의 방법은 단계 (b) 이전에, 특히 단계 (a) 후에, 단계 (a'')를 더 포함할 수 있고, 여기에서 DNA를 포함하는 상기 샘플이 프로테이나제(proteinase)로 절단될 수 있다. 프로테이나제는 열불안정성(thermo-labil)이거나 화학적 불활성화와 같은 다른 수단에 의해 불활성화된 것일 수 있다. 바람직하게는, 상기 프로테이나제는 열불안정성이다. 따라서, 상기 프로테이나제는 단계 (a''')에서 열 불활성화될 수 있다. 상기 프로테이나제는 프로테이나제(Proteinase) K인 것이 특히 바람직하다.
본 발명의 방법은 또한 DNA 메틸화 분석의 단계를 포함할 수 있다. 후성적 메커니즘이 보통의 발달, 노화 및 다양한 질병 조건 동안 중요한 역할을 하는 것이 알려져 있다. 그러한 질병은 암, 다발성 경화증, 당뇨병 및/또는 정신분열병을 포함하는 인간 질병일 수 있다. 종양 억제자 유전자의 프로모터 영역에 위치한 CpG 섬의 과메틸화는 암에서 유전자 불활성화를 위한 빈번한 메커니즘으로서 견고하게 수립되어 있다 (Hansen et al. 2011. Nat. Genet. 43, 768-775). 시토신의 5' 탄소의 메틸화는 주요 DNA 서열에 영향을 미치지 않으나, 유전자 발현의 조절에 중요한 역할을 하는 2차 상호작용에 영향을 미치는 후성적 변형의 형태이다. 이상 DNA 메틸화는 전사 및 그후 유전자 발현을 억제할 수 있다. 본 발명의 방법에서와 같은 메틸화 분석은 표적 DNA의 선택적 변형을 포함할 수 있다. 그러한 변형은 메틸화-의존적 제한 효소 (MDREs) 또는 메틸화-민감성 제한 효소 (MSREs), 바람직하게는 MDREs의 첨가를 포함할 수 있다. 표적 DNA의 선택적 변형은 또한 메틸화된 또는 비메틸화된 뉴클레오티드를 선택적으로 구별할 수 있는 화학적 제제의 첨가를 포함할 수 있다. 특히, 본 발명에서와 같은 메틸화 분석은 나중에 본 발명의 에러-프리 염기서열 분석 방법을 사용하여 읽어낼 수 있는 메틸화된 시토신을 선택적으로 확인할 수 있다. 예를 들어, 중아황산염(bisulfite)의 처리는 비메틸화 시토신 (C)을 우라실 (U)로 바꾸는 반면 메틸화된 시토신은 바꾸지 않는 것으로 알려져 있다 (Frommer et al. 1992. Proc. Natl. Acad.Sci. USA 89, 1827-1831). 중아황산염 처리 이후 DNA의 염기서열 분석은 메틸화된 뉴클레오티드, 특히 시토신을 확인하기 위해 사용될 수 있다. MDREs 처리는 DNA 단편의 메틸화-의존성 제한을 초래하고, 반면 MSREs 처리는 제한의 메틸화-의존성 억제를 초래한다. MseI 제한에 더하여 MDRE/MSRE 제한 이후 DNA의 염기서열 분석은 메틸화된 뉴클레오티드, 특히 시토신을 확인하기 위해 사용될 수 있다. 따라서, 본 발명은 본 발명의 방법에 추가적 단계로서 표적 DNA를 선택적으로 변형하는 단계, 특히 표적 DNA에 포함된 메틸화된 및 비메틸화된 뉴클레오티드 사이를 구별하는 단계를 포함하는 에러-프리 DNA 메틸화 분석의 방법을 제공한다. 일 구체예에서, 본 발명은 본 발명의 방법의 단계 (g) 이전에 DNA를 중아황산염으로 처리하는 단계를 포함하는 DNA 메틸화 분석의 에러-프리 방법을 제공한다. 따라서, 본 발명은 하기의 단계를 포함하는 방법을 제공한다:
(a) DNA를 포함하는 샘플을 제공하는 단계;
(b) 메틸화 핵산 잔기를 선택적으로 변형시키는 제제, 특히 중아황산염을 상기DNA에 첨가하는 단계;
(c) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 제한 엔도뉴클레아제로 DNA를 절단하는 단계로서,
상기 제한 엔도뉴클레아제는 5' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화되거나, 또는
상기 제한 엔도뉴클레아제는 3' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 DNA 단편에 수산화되는 것인 단계;
(d) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 제2 서열은 무작위 서열을 포함하는 것인 단계;
(e) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션하는 단계;
(f) 상기 생성된 오버행을 채우는 단계;
(g) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계;
(h) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계; 및
(i) 메틸화된 핵산 잔기를 확인하는 단계로서, 중아황산염이 단계 (b)에서 제제로서 사용되었을 때, 시토신 (C)은 상기 DNA 샘플에서 메틸화된 잔기에 대응하고, 우라실 (U)은 상기 DNA 샘플에서 비메틸화된 잔기에 대응하는 것인 단계.
차후 DNA 서열 분석을 갖는 DNA 준비의 에러-프리 방법은 또한 메틸화 분석을 포함하는 것이 바람직하고, 메틸화 분석은 메틸화-의존성 제한 효소 (MDRE) 또는 메틸화-민감성 제한 효소 (MSRE), 바람직하게는 MDRE를 첨가하여 표적 DNA에 포함된 메틸화된 및 비메틸화된 뉴클레오티드 사이를 선택적으로 구별하는 것을 포함한다. MDRE 또는 MSRE, 바람직하게는 MDRE는 표적 DNA 단편을 증폭하기 이전, 즉 본 발명의 방법의 단계 (f) 이전에 첨가되는 것이 더욱 바람직하다. 바람직하게는, MDRE 또는 MSRE는 본 발명의 제2 올리고뉴클레오티드를 DNA 단편에 라이게이션 이후, 즉 본 발명의 방법의 단계 (d) 이후에 첨가된다. 그러나, MDRE 또는 MSRE는 DNA를 제한 엔도뉴클레아제로 절단하는 것, 즉 본 발명의 방법의 단계 (b)와 함께 또는 그 이전에 첨가되는 것이 또한 고려된다.
MDRE 또는 MSRE, 바람직하게는 MDRE의 첨가 이후에, 생성된 DNA 단편은 각각의 DNA 단편을 독특하게 확인하기 위하여 본 발명의 제2 올리고뉴클레오티드와 라이게이션되고, 본 명세서에서 제공된 에러-프리 DNA 분석을 가능하게 한다. 본 발명의 방법에서 사용하기 위해 바람직한 MDRE(들) 및 MSRE(들)의 예는, 그 중에서도(inter alia), FspEI, MspJI, LpnPI and AccII, HpaII, DpnI, 각각이다.
따라서, 본 발명은 하기 단계를 포함하는 방법을 제공한다:
(a) DNA를 포함하는 샘플을 제공하는 단계;
(b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서,
상기 제한 엔도뉴클레아제는 5' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화되거나, 또는
상기 제한 엔도뉴클레아제는 3' 오버행을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 DNA 단편에 수산화되는 것인 단계;
(c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열과 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하는 것인 단계;
(d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편과 라이게이션하는 단계;
(e) 상기 라이게이션된 DNA 단편을 MDRE 또는 MSRE, 바람직하게는 MDRE로 절단하는 단계;
(f) 제1 올리고뉴클레오티드를 상기 DNA 단편과 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열과 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열인 것인 단계;
(g) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편과 라이게이션하는 단계;
(g) 상기 생성된 오버행을 채우는 단계;
(i) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; 및
(j) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계.
본 발명에 따라 사용된, 특히 단계 (b)에서 본 발명의 방법에서 사용된, 제한 엔도뉴클레아제는 4개 내지 6개의 정의된 염기를 갖는 모티프(motif)를 인식하는 것이 특히 바람직하다. 그러한 엔도뉴클레아제는 그의 인식 부위에 4개의 구별되는 뉴클레오티드를 가지는 효소, 예를 들어 Msel, 뿐만 아니라 추가적인 워블(wobble) 염기/들이 제한 부위 내에 놓여 있는 효소, 예를 들어 Apol를 포함한다. 바람직하게는, 본 발명에 따라 사용된, 특히 단계 (b)에서 본 발명의 방법에서 사용된, 제한 엔도뉴클레아제는, 공통 서열 TTAA를 인식한다.
제한 엔도뉴클레아제는 Msel 또는 이의 동일전달제한효소(isoschizomer)인 것이 본 발명의 방법, 특히 본 발명의 방법의 단계 (b)을 위해 가장 바람직하다.
본 발명의 방법의 단계 (b)에서 사용된 제한 엔도뉴클레아제는 인식 부위로부터 먼 부위에서 DNA를 절단할 수 있는 제한 엔도뉴클레아제가 아닌 것이 더욱 바람직하다. 예를 들어, 타입 IIS 효소 Fok I는 하나의 가닥에서 그 인식 부위로부터 9개 뉴클레오티드에서, 그리고 다른 하나에서 그 인식 부위로부터 13개 뉴클레오티드에서 DNA의 이중-가닥 절단을 촉매 작용한다. 따라서, 본 발명의 방법의 단계 (b)에서 사용된 제한 엔도뉴클레아제는 타입 IIS 제한 엔도뉴클레아제가 아닌 것이 바람직하다.
본 발명의 다른 측면에서, 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드는 제1 올리고뉴클레오티드보다 더 길다. 제1 올리고뉴클레오티드에 대하여 제2 올리고뉴클레오티드의 초과적 길이는 제2 올리고뉴클레오티드의 제1 올리고뉴클레오티드에 대한, 특히 제2 올리고뉴클레오티드의 제1 서열, 즉 고정 서열을 제1 올리고뉴클레오티드의 제2 서열에 대한, 결합/혼성화를 조절한다. 또한, 제1 올리고뉴클레오티드는 제2 올리고뉴클레오티드가 DNA 단편에 라이게이션된 후에 올리고뉴클레오티드-DNA 복합체로부터 분리하는 것이 바람직하다. 따라서, 결합/혼성화는 제1 올리고뉴클레오티드의 제2 서열의 제2 올리고뉴클레오티드의 제1 서열, 즉 고정 서열에 대한 특이적 결합을 가능하게 하기 위해 최적화되고, 그리고 결합/혼성화는 올리고뉴클레오티드-DNA 복합체로부터 제1 올리고뉴클레오티드의 분리를 가능하게 하기 위해 최적화된 것이 바람직하다. 바람직하게는, 제1 올리고뉴클레오티드는 약 4 내지 15개의 뉴클레오티드를 포함하고, 제2 올리고뉴클레오티드는 약 30 내지 60개의 뉴클레오티드를 포함한다.
무작위 서열, 즉 제2 올리고뉴클레오티드의 제2 서열의 길이는 독특한 바코드/식별자의 요구된 수에 의존하고, 따라서 다양할 수 있다. 게다가, 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드의 제2 서열, 즉 제2 올리고뉴클레오티드의 무작위 서열은, 약 3 내지 24개의 뉴클레오티드를 포함하는 것이 바람직하다. 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드의 제2 서열, 즉 제2 올리고뉴클레오티드의 무작위 서열은 적어도 3개, 더욱 바람직하게는 적어도 4개 그리고 가장 바람직하게는 적어도 5개의 뉴클레오티드를 포함하는 것이 더욱 바람직하다.
본 발명에 따르면, 제1 올리고뉴클레오티드는 DNA 단편(들)의 생성된 오버행에 상보적인 제1 서열, 이는 바람직하게는 뉴클레오티드 T 및 A를 포함하고 있고, 제2 올리고뉴클레오티드의 고정 서열에 상보적인 제2 서열, 그것은 분석될 각각의 샘플로부터 다양하고 그리고 그것은 바람직하게는 4 내지 15개의 뉴클레오티드를 포함하고, 그리고 5'-인산염(phosphat) 말단이 없는 뉴클레오티드, 바람직하게는 뉴클레오티드 C를 포함한다.
제2 올리고뉴클레오티드의 고정 서열의 변화 그리고 따라서 제1 올리고뉴클레오티드의 제2 서열의 변화는, 샘플 식별자 (SID)로서 각각의 샘플과 결합될 수 있는 고정 서열에 기초하여 샘플의 구별된 확인을 가능하게 한다. 이것은 다른 견본으로부터 비롯된 다수의 판독에서 특정 샘플의 서열 판독의 명백한 확인을 가능하게 하고, 이는 하나의 염기서열 분석 런(run) 내에서 다수 샘플의 병렬적 분석을 가능하게 한다. 따라서, 이것은 더 독립적으로 증폭된 샘플로서 더 높은 샘플 처리량이 염기서열 분석을 위해 동시에 처리될 수 있는 것을 가능하게 한다. 또한, SID는 염기서열 분석 파일을 분석하기 위하여 사용될 수 있고 그것에 의하여 서열을 하나의 샘플에 분명하게 할당한다. 미리-분류된 서열은 환자 샘플의 더욱 빠른 측정을 가능하게 할 것이다.
본 발명의 일 특정 구체예에서, 본 발명의 방법에서 사용된 제1 올리고뉴클레오티드는 서열 5'-TAACTGACdd-3'에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하고 및/또는 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하고 및/또는 본 발명의 방법에서 사용된 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 것이 바람직하다.
본 발명의 다른 구체예에서, 본 발명의 방법에서 사용된 제1 올리고뉴클레오티드는 서열 5'-TAACGACdd-3'에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하고 및/또는 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드는 서열번호 6으로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하고 및/또는 본 발명의 방법에서 사용된 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 것이 바람직하다.
본 발명의 방법에서 사용된 제1 올리고뉴클레오티드는 서열 5'-TAACTGACdd-3'를 가지고 및/또는 본 발명의 방법에서 사용된 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 서열을 가지고 및/또는 본 발명의 방법에서 사용된 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열을 가지는 것이 가장 바람직하다.
본 발명의 다른 측면에서, 본 발명의 방법에서 사용된 제1 및 제2 올리고뉴클레오티드는 DNA로부터 분리되어 서로 혼성화될 수 있다. 특히, 혼성화된 올리고뉴클레오티드는 본 발명의 방법의 단계(d) 이전에, 즉 라이게이션 이전에, 특히 본 발명의 방법의 단계 (c) 후에, DNA 또는 DNA 단편에 첨가될 수 있다. 따라서, 본 발명의 방법은 단계 (c')를 더 포함하고, 단계 (c')에서 제1 올리고뉴클레오티드 및 제2 올리고뉴클레오티드가 DNA 단편으로부터 분리되어 서로 혼성화되고 DNA 단편에 첨가되는 것이 바람직하다.
본 발명의 방법에서 사용된 제1 올리고뉴클레오티드는 상기 올리고뉴클레오티드의 마지막 3' 뉴클레오티드가 디데옥시 (dd)-뉴클레오티드라는 점에서 추가적으로 변형될 수 있다.
본 발명의 방법은 세포의 본질적으로 전체 핵 게놈의 증폭 및/또는 에러-프리 DNA 분석, 바람직하게는 단일 세포의 본질적으로 전체 게놈의 증폭을 가능하게 한다. 당업자에게 인정되는 바와 같이, 전체 게놈 증폭은 본질적으로 전체 게놈이 증폭되는 방법을 의미하나, 게놈에 존재하는 각각의 뉴클레오티드가 증폭되는 증폭 방법을 필수적으로 의미하는 것은 아니다. 그러나, 본 발명의 방법은 세포의 전체 게놈, 바람직하게는 단일 세포의 전체 게놈을 증폭하는 것이 바람직하다.
본 발명의 방법에서 사용된 단일 세포는 화학적 고정(chemical fixation)이 적용되어 있을 수 있다. 화학적 고정은 포르말린(formalin) 및/또는 아세톤(aceton)을 사용한 고정을 포함할 수 있다.
본 발명에 따르면, 호밍 엔도뉴클레아제는 본 발명의 방법의 단계 (g) 이전에, 특히 본 발명의 방법의 단계 (f) 이후에 첨가될 수 있다. 따라서, 본 발명의 방법은 단계 (f')를 더 포함하고, 단계 (f')에서 호밍 엔도뉴클레아제를 첨가하는 것이 바람직하다. 이와 관련하여, 상기 호밍 엔도뉴클레아제는 I-SceI 또는 I-CeuI인 것이 바람직하다.
본 발명의 방법은 하나의 반응 용기(vessel)에서 수행할 수 있다. 특히, 본 발명의 방법의 단계 (a) 내지 (f)는 하나의 반응 용기에서 수행할 수 있다. 그러나, 부위-특이적 엔도뉴클레아제 반응 (단계 f'), 바람직하게는 호밍 엔도뉴클레아제 반응은 분리된 반응 용기에서 수행하는 것이 바람직하다.
본 발명의 바람직한 구체예에서, DNA의 에러-프리 염기서열 분석 방법은 (a) 단일 세포의 DNA를 포함하는 샘플을 제공하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 오버행의 말단 뉴클레오티드가 인산화된 5' 오버행 또는 오버행의 말단 뉴클레오티드가 상기 DNA 단편에 수산화된 3' 오버행을 제공할 수 있고, 상기 제한 엔도뉴클레아제는 공통 서열 TTAA를 인식하는 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각가에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션하는 단계; (e) 생성된 오버행을 채우는 단계; (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 제1 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계를 포함한다.
본 발명의 일 구체예에서, DNA의 에러-프리 염기서열 분석 방법은 (a) DNA를 포함하는 샘플을 제공하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 오버행의 말단 뉴클레오티드가 인산화된 5' 오버행 또는 오버행의 말단 뉴클레오티드가 상기 DNA 단편에 수산화된 3' 오버행을 제공할 수 있고, 그리고 상기 제한 엔도뉴클레아제는 공통 서열 TTAA를 인식하는 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하고, 상기 제1 올리고뉴클레오티드는 핵산 서열 5'-TAACTGACdd-3'를 포함하고, 상기 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 핵산 서열을 포함하는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션 하는 단계; (e) 생성된 오버행을 채우는 단계; (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 제1 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계로서, 상기 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 핵산 서열을 포함하는 것인 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계를 포함한다.
본 발명의 또 다른 구체예에서 DNA의 에러-프리 염기서열 분석 방법은 (a) DNA를 포함하는 샘플을 제공하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 오버행의 말단 뉴클레오티드가 인산화된 5' 오버행 또는 오버행의 말단 뉴클레오티드가 상기 DNA 단편에 수산화된 3' 오버행을 제공할 수 있고, 그리고 상기 제한 엔도뉴클레아제는 MseI 또는 이의 동일전달제한효소(isoschizomer)인 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하고, 상기 제1 올리고뉴클레오티드는 핵산 서열 5'-TAACTGACdd-3'를 가지고 그리고 상기 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 핵산 서열을 가지는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션 하는 단계; (e) 생성된 오버행을 채우는 단계; (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열에 결합하는 제1 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계로서, 상기 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 핵산 서열을 가지는 것인 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계를 포함한다.
본 발명의 다른 구체예에서 DNA의 에러-프리 염기서열 분석 방법은 (a) DNA를 포함하는 샘플을 제공하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 오버행의 말단 뉴클레오티드가 인산화된 5' 오버행 또는 오버행의 말단 뉴클레오티드가 상기 DNA 단편에 수산화된 3' 오버행을 제공할 수 있고, 그리고 상기 제한 엔도뉴클레아제는 MseI 또는 이의 동일전달제한효소(isoschizomer)인 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2, 제3 및 제4 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제4 서열은 부위-특이적 엔도뉴클레아제의 제한 부위를 포함하는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션하는 단계; (e) 생성된 오버행을 채우는 단계; (e') 엑소뉴클레아제를 첨가하는 단계; (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열과 결합하는 제1 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; (f') 부위-특이적 엔도뉴클레아제를 첨가하는 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계를 포함한다.
본 발명은 DNA의 에러-프리 염기서열 분석 방법에 관한 것으로 다음의 단계를 포함한다: (a) DNA를 포함하는 샘플을 제공하는 단계; (a'') DNA를 프로테이나제, 예를 들어 프로테이나제 K로 절단하는 단계; (a''') 프로테이나제를 열 불활성화하는 단계; (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서, 상기 제한 엔도뉴클레아제는 오버행의 말단 뉴클레오티드가 인산화된 5' 오버행 또는 오버행의 말단 뉴클레오티드가 상기 DNA 단편에 수산화된 3' 오버행을 제공할 수 있고 그리고 상기 제한 엔도뉴클레아제는 MseI 또는 이의 동일전달제한효소일 수 있는 것인 단계; (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링하는 단계로서, 상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열에 상보적이고, 상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고, 상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 RNA 서열을 포함하는 것인 단계; (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션 하는 단계; (e) 역전사 효소 및 열 안정성 DNA 폴리머라제의 첨가에 의해 생성된 오버행을 채우는 단계; (e') RNA 절단 효소, 예를 들어 RNAse H 및 RNAse If를 첨가하는 단계; (e'') 리가아제를 첨가하는 단계; (f) 상기 DNA 단편을 증폭하는 단계; 및 (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계.
본 발명은 또한 본 발명의 방법에 의해 얻은 염기서열 분석된 DNA 단편의 용도에 관한 것이다. 특히, 본 발명은 본 발명의 방법에 의해 얻은 서열 정보의 용도에 관한 것이다. 서열 정보는, 예를 들어, DNA 서열 분석, 세포 계통수(cell lineage trees)의 생성 또는 카피수(copy numbers)의 측정을 위한 방법에서 사용될 수 있다. 특히, 본 발명의 방법에 의해 얻은 서열 정보는 전체 게놈(genome) 염기서열 분석, 전체 엑솜(exome) 염기서열 분석, 전체 레귤롬(regulome) 염기서열 분석, 염기서열 분석-기반 메틸화 분석, 염기서열 분석-기반 브레이크포인트(breakpoint) 측정, ChIP 염기서열 분석 또는 표적 염기서열 분석과 같은 DNA 서열 분석을 위한 방법에서 사용될 수 있다. 본 발명의 방법은 상기 언급된 모든 접근법을 위해 특히 유용하며, 여기에서 인풋(input) 핵산, 바람직하게는 DNA의 양이 강하게 제한된다, 즉 단일 세포 DNA 또는 이의 분획물. 게다가, 본 발명의 방법은 딥 염기서열 분석(deep sequencing)을 포함하는 고 처리량 염기서열 분석 접근법을 위해 특히 유용할 수 있고, 이것은 와일드 타입 (변하지 않은) 발현 프로파일/후성적 프로파일/유전자형을 나타내는 서열의 백그라운드에 숨어 있는 드문 서열 변이체 (즉, 전사물(transcripts), 전사 변이체/아이소폼(isoforms), 스플라이싱 중간체(splicing intermediates), 후성적 변화의 이상 부위, 포인트 돌연변이, 삽입-결실(indels) 및 다른 서열 변이 및/또는 돌연변이)를 찾는다. 게다가, 본 발명의 방법에 의해 생성된 서열 정보는 표적 DNA 내에 메틸화 부위를 확인하기 위해 사용될 수 있다.
본 발명은 또한 제1, 제2, 제3 및 제4 서열을 포함하는 4개-파트(four-part) 올리고뉴클레오티드를 제공하고, 여기에서 제1 서열은 고정 서열을 포함하고, 제2 서열은 무작위 서열을 포함하고, 제3 서열은 프라이머 결합 부위를 포함하고 그리고 제4 서열은 제한 뉴클레아제 인식 부위 및/또는 제한 부위를 포함한다. 본 발명에 따르면, 고정 서열은 바람직하게는 약 4 내지 15개 뉴클레오티드, 무작위 서열은 바람직하게는 약 3 내지 24개 뉴클레오티드를 포함하고, 그리고 제한 뉴클레아제 인식 부위 및/또는 제한 부위는 바람직하게는 호밍 엔도뉴클레아제의 인식 부위 및/또는 제한 부위이다.
본 발명의 올리고뉴클레오티드의 제한 뉴클레아제 인식 부위 및/또는 제한 부위는, 바람직하게는 무작위 서열의 5' 측에 위치한다. 제한 뉴클레아제 인식 부위 및/또는 제한 부위 및 프라이머 결합 부위, 즉 본 발명의 올리고뉴클레오티드의 제3 및 제4 서열은, 동일하거나 및/또는 겹치는 것(overlapping)이 더욱 바람직하다. 제한 뉴클레아제 인식 부위 및/또는 제한 부위 및 프라이머 결합 부위, 즉 본 발명의 올리고뉴클레오티드의 제3 및 제4 서열은, 100 퍼센트 동일하고 겹치는 것이 가장 바람직하다.
본 발명의 4개-파트 올리고뉴클레오티드는 서열 GTCAGT에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 고정 서열 및/또는 무작위 서열 및/또는 서열번호 3으로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 제한 뉴클레아제 인식 부위 및/또는 서열번호 4로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 프라이머 결합 부위를 포함하는 것이 바람직하다. 따라서, 본 발명의 4개-파트 올리고뉴클레오티드는, 서열번호 5로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 것이 바람직하다. 본 발명의 4개-파트 올리고뉴클레오티드는 서열번호 12로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 것이 또한 바람직하다.
본 발명의 4개-파트 올리고뉴클레오티드는 서열 GTCAGT를 가지는 고정 서열 및/또는 무작위 서열 및/또는 서열번호 3으로 표시되는 서열을 가지는 제한 뉴클레아제 인식 부위 및/또는 제한 부위 및/또는 서열번호 4로 표시되는 서열을 가지는 프라이머 결합 부위를 포함하는 것이 가장 바람직하다. 따라서, 본 발명의 4개-파트 올리고뉴클레오티드는, 서열번호 5로 표시되는 서열을 가지는 것이 바람직하다. 4개-파트 올리고뉴클레오티드는 서열번호 12로 표시되는 서열을 가지는 것이 또한 바람직하다.
본 발명의 4개-파트 올리고뉴클레오티드는 고정 서열 및/또는 무작위 서열 및/또는 제한 엔도뉴클레아제 인식 부위 및/또는 프라이머 결합 부위를 포함하고, 상기 프라이머 결합 부위는 서열번호 13으로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 가지는 것이 가장 바람직하다. 따라서, 본 발명의 4개-파트 올리고뉴클레오티드는 서열번호 14로 표시되는 서열과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 바람직하게는 90%, 95% 또는, 가장 바람직하게는, 100% 상동성을 가지는 서열을 포함하는 것이 가장 바람직하다.
다른 식으로 정의되지 않는다면, 본 명세서에서 사용된 모든 기술적 및 과학적 용어는 이 발명이 존재하는 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 같은 의미를 가진다. 본 명세서에서 설명된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실행 또는 테스팅에 사용될 수 있을지라도, 적절한 방법 및 물질을 하기에 설명하였다. 충돌하는 경우에, 정의를 포함한 본 명세서가 제어할 것이다. 또한, 물질, 방법 및 예시는 단지 설명을 위한 것이고 제한하기 위해 의도된 것은 아니다.
본 발명의 방법 및 기술은 다른 식으로 정의되지 않는다면 이 기술분야에 잘 알려진 종래 방법에 따라 그리고 본 명세서를 통해 인용되고 논의된 다양한 일반적이고 더욱 구체적인 참조에서 설명된 바와 같이 일반적으로 수행될 수 있다. 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989) 및 Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992), 및 Harlow and Lane Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990)를 참조하라.
본 발명이 도면 및 전술한 설명에서 구체적으로 묘사되고 설명된 반면, 그러한 묘사 및 설명은 설명 또는 예시적인 것으로 고려될 것이고 제한하는 것이 아니다. 하기 청구항의 범위 및 의미 내에서 통상의 기술자에 의해 변화 및 변형이 만들어질 수 있다는 것이 이해될 것이다. 특히, 본 발명은 상기 및 하기에서 설명된 서로 다른 구체예로부터의 특징의 임의의 조합을 갖는 추가적인 구체예를 포함한다.
본 발명은 또한 각각의 도면에 나타난 모든 추가적인 특징을 포함하는데, 비록 이들이 이전 또는 하기 설명에서 설명되지 않았을지라도 그렇다. 또한, 도면 및 설명에서 설명된 구체예들의 단일 택일 및 이의 특징들의 단일 택일은 본 발명의 다른 측면의 주제로부터 디스클레임(disclaim)될 수 있다.
또한, 청구항에서 단어 "포함하는(comprising)"은 다른 요소 또는 단계를 배제하지 않으며, 부정관사 "a" 또는 "an"은 복수를 배제하지 않는다. 단일 단위는 청구항에서 나열된 몇몇의 특징들의 기능을 성취할 것이다. 속성 또는 값과 관련하여 용어 "필수적으로(essentially)", "약(about)" "거의(approximately)" 등은 특히 또한 정확하게 속성 또는 정확하게 값을 각각 정의한다. 청구항에서 임의의 참조 사인(reference signs)은 범위를 제한하는 것으로 해석되지 않을 것이다.
본 발명을 또한 하기 도에 의해 설명한다.
도 1. 올리고뉴클레오티드 서열.
이 도는 본 발명의 방법에서 사용될 수 있는 제1, 제2 및 제3 올리고뉴클레오티드의 올리고뉴클레오티드 서열을 나타낸다. 또한, 4개-파트 올리고뉴클레오티드의 서열을 나타내었다.
도 2. 성공적인 중기(metaphase) CGH 실험을 예측하기 위하여 선택된 세 PCR 마커의 분석 정확도
도 3. WGA 후에 특정 서열의 검출
도 4. 품질 관리 분석 및 임상 샘플에서 WGA 품질의 예측
도 5. 효율적인 샘플 준비를 위한 최적의 올리고뉴클레오티드 디자인의 선택
(A,B) DSL12-DSS6 (A) 또는 DSL9-DSS5 (B) 올리고뉴클레오티드 듀플렉스로 처리된 샘플에서 수행된 3-플렉스 PCR의 결과. 샘플 1-10은 건강한 기증자의 단일-세포로부터 기원한 DNA 샘플을 가리킨다. 샘플 P1 및 P2는 세포의 풀(pools)을 사용하여 생성되었다. + 및 - 는 양성 및 음성 대조군 각각 가리켰다. (C-D) 건강한 기증자의 단일-세포 (C) 및 OE-19 세포주의 단일-세포 (D)의 aCGH 프로파일. 모든 상염색체(autosomes)을 나타냈다. 두 샘플은 DSL12-DSS6로 생성했다.
도 6. 대립유전자의 탈락(allelic drop-out, ADO)율의 분석. 4개의 SNP 마커 (SNP1-SNP4)에 특이적인 RFLP - PCR의 결과. 단일-세포로부터 각각 유래된 세 무작위 선택 샘플이 분석에 포함되었다. 각각의 샘플은 어닐링 단계의 온도가 다른 일차(primary) PCR의 다른 변형체에 적용되었다. L은 DNA 크기의 위치를 가리키고, - 는 음성 PCR 대조군을 가리키고 그리고 + 는 제한 절단의 양성 대조군이다.
도 7. 일차(primary) PCR 동안 DSL12 올리고뉴클레오티드의 어닐링에 대한 올리고뉴클레오티드 어닐링 온도의 영향.
A,B,C) 일차 PCR의 세 변형으로 처리된 샘플의 4-플렉스 품질 관리 PCR의 결과로서, 올리고뉴클레오티드 어닐링의 온도에서 다르다: 57℃ (A), 60℃ (B), 63℃ (C). 샘플 NZ1-NZ10의 각각은 건강한 남성 기증자의 각각 처리된 단일-세포로부터 기원되고, 반면 샘플 Pool1 및 Pool2는 세포의 풀(pool)로 생성되었다.
도 8. 일차(primary) PCR에 사용된 PCR 반응 버퍼에서 엑소뉴클레아제의 수행.
이중 가닥 PCR 산물 (dsDNA)을, PCR 어댑터의 첨가와 함께 또는 첨가 없이, 엑소뉴클레아제 I로 처리하였다. dsDNA의 수율 및 반응에서 PCR-어댑터 함량의 감소에 엑소뉴클레아제 I 처리의 효과는 없었음에 주목하라.
도 9. 단일 세포 앰플리콘(amplicons)의 증폭 후에 DSL 올리고뉴클레오티드 서열의 검출
(A,B,C) DSL12 서열이 측면에 위치한 세 개의 특이적 MseI 제한 단편을 나타내는 무작위로 선택된 서열의 서열. 칼라 코드(color code)는 올리고뉴클레오티드 서열의 위치를 가리킨다: 노랑 - I-SceI 부위를 포함하는 DSPCR 프라이머의 결합 서열; 연두 - 무작위 바코드 서열, 보라 - 고정된 3'-엔드(end). 무작위 바코드의 서열은 각각의 시간에서 달랐는데, 이는 독특한 바코드가 정말로 도입되었다는 것을 증명한다는 점을 주의하라.
도 10. 프로테이나제( Proteinase ) K 절단(digestion)을 위한 조건.
도 11. MseI 절단을 위한 조건
도 12. PCR 어댑터의 어닐링을 위한 조건
도 13. 라이게이션을 위한 조건
도 14. 일차(primary) PCR을 위한 조건 ( 엑소뉴클레아제 처리 없는 변형)
도 15. 일차(primary) PCR을 위한 조건 ( 엑소뉴클레아제 I 처리를 포함하는 변형)
도 16. 본 발명의 올리고뉴클레오티드의 표적 DNA에 대한 결합 및 라이게이 션의 도시
PCR-어댑터의 라이게이션 및 그 후 채우는(fill-in) 반응의 기초가 되는 메커니즘의 개요. 제1 올리고뉴클레오티드 - DSS - 의 5'-엔드에서 인산염(phosphate)의 부족 때문에 그것은 표적 DNA 서열의 3'-엔드와 공유적으로 라이게이션될 수 없다. 라이게이션 이벤트는 제2 올리고뉴클레오티드 (DSL)의 3'-엔드 및 표적 DNA 서열의 5'-엔드 사이에서 우선적으로 일어난다. 게다가, 제1 올리고뉴클레오티드의 3'-엔드의 변형 (2',3' 디데옥시뉴클레오티드의 도입)은, 이 올리고뉴클레오티드에 의해 개시되는 어떤 프라이밍 이벤트도 예방한다. 채우는(fill-in) 단계 (68℃) 동안에, DSS 올리고뉴클레오티드는 그 결합 파트너로부터 분리되고, 이것은 DNA 폴리머라제가 DSL 올리고뉴클레오티드에 상보적인 서열을 합성하는 것을 가능하게 한다. 그 다음의 PCR-기반 증폭은 제3 올리고뉴클레오티드 (DSPCR)의 사용으로 수행되고, 그것은 DSL 올리고뉴클레오티드의 제3 서열에 상보적이다.
도 17. 제2 올리고뉴클레오티드를 분해하기 위한 엑소뉴클레아제의 사용의 도시
PCR-어댑터 서열의 채우는(fill-in) 반응 후에 단일 가닥 엑소뉴클레아제의 이용은 (표적 서열에 결합되지 않은 남아 있는 제2 올리고뉴클레오티드의 제거를 용이하게 한다. 라이게이션되지 않은 제2 올리고뉴클레오티드의 제거는 프라이머로서 비-분해된 제3 올리고뉴클레오티드에 의한 그 다음 증폭을 방해하는 것을 막는다.
도 18. 방법의 전체 게놈 증폭 (whole genome amplification, WGA )에 대한 응용 및 최신 기술의 방법과의 비교
사진은 Jones (1997) BioTechniques 22:938-946 및 US 08/742,755에서 설명된 방법 (A) 또는 본 발명의 방법 (B)으로 생성된 WGA 산물에 대해 수행한 컨트롤(control) PCR의 결과를 나타낸다. 두 경우에서 WGA 산물은 다양한 양의 주형 DNA로 생성되었다 (즉 단일 세포, 10개 세포의 풀(pool) 및 ~100개 세포의 풀(pool)). 레인 M: 분자량 마커 (2-log DNA 래더; New England Biolabs); 레인 1-2: WGA의 음성 (주형 없음) 대조군; 레인 3-7: WGA 산물 - 각각은 서로 다른 단일 세포의 DNA로 생성되었다; 레인 8-10: 10개 단일 세포의 풀(pools)로 생성된 WGA 산물; 레인 11-13 - ~100개 세포의 풀(pools)로 생성된 WGA 산물); 레인 (-) - PCR 음성 대조군; 레인 (+) - PCR 양성 대조군. 실험은 실시예 10에서 설명된 바와 같이 수행하였다.
도 19a-d. 같은 무작위 서열을 공유하는 염기서열 분석 판독(reads)의 그룹 핑을 통한 에러 정정의 도시
염기서열 분석 판독(reads)은 인간 게놈 어셈블리 19에 대해 배열되고, 그의 각각의 어댑터 서열 내에 확인된 무작위 서열에 기초하여 그룹화되었다. (a) 위치 124,934,321 부터 124,934,396 까지의 염색체 6, (b) 위치 39,277,551 부터 37,277,608 까지의 염색체 22, (c) 위치 18,455,108 부터 18,455,137 까지 및 위치 18,455,218 부터 18,455,247 까지의 염색체 22 및 (d) 위치 42,820,701 부터 42,820,754 까지의 염색체 22로 맵핑한 판독(reads)의 작은 섹션을 나타내었다. 각각의 예에서, 각각의 위치에서 각각의 참조 서열은 판독(reads)의 상단에 나타내었다. 판독 그룹의 서열 아래의 별표 "*"는 100%의 염기가 참조에 일치하는 무작위 서열의 그룹 내의 위치를 가리키고, 반면 갭 " "는 참조와 소수 다른 무작위 서열의 그룹 내의 위치를 가리킨다. 이러한 에러는 염기서열 분석- 또는 증폭-에러로 고려되고, 그러므로 에러-정정이 필요할 것이다. 판독 그룹의 서열 아래의 "X"는 또한 무작위 서열의 적어도 하나의 그룹에서 대부분의 판독(reads)이 참조와는 다른 배열에서 모든 판독 내의 위치를 가리킨다. 이것은 SNPs (만약 차이가 무작위 서열의 오직 하나의 그룹에서 일어났다면) 또는 돌연변이 (만약 차이가 무작위 서열의 모든 그룹에서 일관하여 나타났다면)로 고려된다.
본 발명은 하기 설명된 비-제한적인 예의 방법으로 추가적으로 설명되며, 이는 본 발명의 그리고 이의 많은 이점의 더 나은 이해를 제공한다. 하기 예들은 본 발명의 바람직한 구체예들을 증명하기 위하여 포함된다. 하기의 실시예에서 개시된 기술은 본 발명의 실현에서 잘 기능하기 위하여 본 발명에서 사용된 기술을 대표하고, 그러므로 그 실현을 위해 바람직한 모드를 구성하는 것으로 고려될 수 있다는 점이 당업자에게 이해되어야 한다. 그러나, 본 개시를 고려하여, 많은 변화가 개시된 구체적인 구체예에서 만들어질 수 있고, 본 발명의 의미 및 범위에서 벗어남 없이 여전히 같거나 유사한 결과를 얻을 수 있다는 것을 당업자는 인정하여야 한다.
도 20. 염기서열 분석 에러율
에러-프리 염기서열 분석 런(run)으로부터의 판독 서열을 인간 게놈 어셈블리 19로 맵핑하였다. 이 위치에 맵핑된 판독 염기의 프레드(phred) 스코어와 관련하여 맵핑 위치의 결실 (Del), 삽입 (Ins), 미스매치/치환 (Sub) 및 매치 (Match)의 상대적 양을 나타내었다. 이것은 참조 (Del/Ins/Sub)부터 염기서열 분석 품질까지의 변화의 증가하는 수 사이의 정정을 가리키고, 에러 정정의 필요성을 더욱 지지한다.
다른 식으로 지시되지 않는다면, 재조합 유전자 기술의 수립된 방법, 예를 들어, Sambrook, Russell "Molecular Cloning, A Laboratory Manual", Cold Spring Harbor Laboratory, N.Y. (2001)에 설명된 바와 같은 방법을 사용할 수 있고, 이것은 그 전부가 참조에 의해 본 명세서에 통합된다.
실시예 1 - DNA의 에러- 프리 염기서열 분석(error-free sequencing) 방법의 디자인
이 방법의 중요한 구성요소는 올리고뉴클레오티드의 디자인인데, 이는 단일 DNA 분자의 증폭 및 인위적(artifactual) 돌연변이의 확인과 제거를 가능하게 한다. 이 올리고뉴클레오티드들은 라이게이션(ligation)을 통해 단일 DNA 분자에 결합된다. 인위적 돌연변이의 제거는 샘플의 조작 전에 이중 가닥 DNA 분자를 형성하는 상보적 DNA 가닥의 확인에 기초한다 (예를 들어 단일 세포에서). 그러므로, 관심있는 DNA 분자에 첨가된 올리고뉴클레오티드는 라이게이션 부위에서 이중 가닥 분자를 형성한다. 단순하게, 에러-프리 염기서열 분석을 위한 이 어댑터(adaptors)를 형성하는 올리고뉴클레오티드는 각각 DSL (duplex sequencing oligonucleotide long) 또는 DSS (duplex sequencing oligonucleotide short)라고 불린다. 두 올리고뉴클레오티드의 서열은 도 1에 나타내었다. 두 올리고뉴클레오티드는 서로 부분적으로 상보적이어서 올리고뉴클레오티드-올리고뉴클레오티드 듀플렉스(duplexes)의 형성을 가능하게 하고, 이것은 라이게이션-매개 PCR 접근법에서 어댑터(adaptor)로서 사용된다 (도 1). 듀플렉스 구조에서, DSS 올리고뉴클레오티드는 5'-오버행(overhang)을 형성하고, 이것은 제한 엔도뉴클레아제(restriction endonuclease)에 의해 유전자 표현(genomic representation)으로 도입된 제한 부위와 호환되어서 (제한 효소 Mse I를 위하여, 이 염기는 TA이다), PCR-어댑터의 더욱 효율적인 라이게이션을 가능하게 한다. 남아있는 염기는 DSL 올리고뉴클레오티드와 상보적이다. 우리는 서브스크립트(subscript) m (DSSm)을 사용하여 상보적 서열의 길이를 나타내었다. DSS 올리고뉴클레오티드는 중합 단계 동안 이의 신장(elongation)을 예방하기 위해 디데옥시뉴클레오티드(dideoxynucleotide)를 함유할 수 있다 (도 1). DSL 올리고뉴클레오티드는 3개 내지 4개 파트로 구성되어 있다. 3'-엔드(end)에 서열은 DSS 올리고뉴클레오티드와 올리고뉴클레오티드-올리고뉴클레오티드 듀플렉스의 형성에 책임이 있는 고정 서열(fixed sequence)이다. 이것은 변화될 수 있고, 또한 예를 들어 특정 개체의 세포를 태그(tag)하는 다양한 아이덴티티(identity)의 올리고뉴클레오티드를 생성하기 위해 사용될 수 있다 (이 경우에 DSS 올리고뉴클레오티드가 상보적 서열을 가질 필요가 있다는 점에 유의하라). DSL 올리고의 중간 섹션(section)은 무작위 서열(randomized sequence)를 함유하고, 이것은 표적 DNA에 라이게이션되는 반응에서 각각의 올리고뉴클레오티드를 고유하게 표시하기 위한 바코드(barcode)로서 사용된다. 이 바코드의 길이는 다양할 수 있다. 예를 들어 여기에서 우리는 서브스크립트(subscript) n (DSLn)을 첨가하여 무작위 염기의 수를 나타냈다. 세 번째로, 올리고뉴클레오티드의 대부분의 5'-위치된 서열은 호밍 엔도뉴클레아제(homing endonuclease)의 예로 I-SceI와 같은 제한 효소에 대한 부위-특이적 모티브(motive)를 함유할 수 있다. 이 DSLn 올리고뉴클레오티드의 5'-엔드(end)는 전체 샘플 대표(representation)의 효율적인 PCR-기반 증폭을 가능하게 하기 위해 디자인되었다.
증폭을 가능하게 하기 위하여, 하기 단계가 사용되었다:
1) DSL 및 DSS의 어댑터의 형성
2) 어댑터의 라이게이션; 여기 예에서 DSL이 공유결합으로 라이게이션되는 반면 DSS는 그렇지 않다. 그후에, 짧은 DSS 올리고뉴클레오티드는 중합 동안 온화한 변성(denaturing) 단계에서 염기쌍형성(base-pairing)으로부터 방출될 것이다 (단계 3).
3) DSL 올리고뉴클레오티드의 상보적 서열의 중합 (fill-in 반응). 이 단계 동안 바코드는 이중 가닥 바코드로서 생성된다.
4) 제3 올리고뉴클레오티드는 DSL 올리고뉴클레오티드의 5'-영역에서 PCR-프라이머 결합 영역과 결합하는 증폭을 위해 사용된다.
실시예 2 DNA의 에러- 프리 염기서열 분석 방법의 일반적인 개요
그 다음의 에러-프리 염기서열 분석을 가능하게 하는 유전적 대표(들)의 준비를 위해 사용된 절차는 하기 단계로 구성된다:
(a) DNA 물질을 둘러싸고 있는 세포 구성물 및 단백질의 제거에 의한 DNA로의 접근 (전형적으로 단백질 분해효소, 즉 프로테이나제 K 및/또는 세제(detergents)를 사용하여 수행됨)
(b) (그 다음의 절단 제한 효소; 여기에서 MseI)를 사용하여 DNA 물질의 절단
(c) DSLn 및 DSLm 올리고뉴클레오티드의 어닐링
(d) 검사 (inspection) 하에 DSLn-DSLm 올리고뉴클레오티드 듀플렉스를 DNA 물질에 라이게이션(ligation)
(e) 선택적: 엑소뉴클레아제 또는 다른 단일 가닥 DNA (ssDNA) 특이적 효소 또는 DNA/RNA 올리고의 경우에 RNAse H를 사용하여 결합되지 않은 (DSL/DSS) 올리고뉴클레오티드의 분해.
(f) 유니버셜(universal) 프라이머를 사용하여 표적 게놈 대표(들)의 증폭 (여기에서 DSPCR로 명명됨), 그의 서열은 DSLn 올리고뉴클레오티드의 5'-프라이머 결합 영역과 동일하다.
완전한 프로토콜 또는 그것의 선택된 파트는 다양한 타입의 샘플, 예를 들어 단일-세포, 다수의 단일 세포, 세포 유리 DNA, 엑소좀(exosomal) DNA, 화학적으로 고정된 조직 견본 (즉 포르말린 고정된 파라핀에 내장된 조직 샘플) 등을 위해 사용될 수 있다.
실시예 3 - 엑소뉴클레아제의 첨가 없이 처리된 샘플.
단일 세포는 건강한 개체의 말초 혈액으로부터 분리되거나 또는 OE-19 식도 암 세포의 부착 세포 배양으로부터 수확되었다. 단일 세포는 1.0 μL의 PBS로 수집하였고, 2.0 μL의 프로테이나제 K 분해 버퍼 (10 mM Tris acetate, pH 7.5, 10 mM Mg acetate, 50 mM K actate (0.2 μL의 10 x One-Phor-All-Buffer-Plus 버퍼); 0.67% 트윈(Tween) 20; 0.67% Igepal; 0,67 mg/ml 프로테이나제 K)를 함유하는 반응 튜브로 이동하였다. 프로토콜의 모든 다음 단계들은 가열된 빛(heated lit)과 함께 PCR 기계에서 수행하였다. 프로테이나제 K 절단은 10 h 동안 42℃에서 수행하였고, 80℃에서 10분 동안 불활성화 단계를 수행하였다. 그 다음, 단일 세포 DNA는 0.2 μL의 10 x One-Phor-All-Buffer-Plus 버퍼, 10 U의 MseI (New England Biolabs) 및 H2O를 전체 부피 5.0 μL에 첨가하는 것에 의하여 MseI (Fermentas) 제한 엔도뉴클레아제로 절단에 적용하였다. 제한 절단은 3시간 동안 37℃에서 수행하였고 65℃에서 5분 동안 열-불활성화하였다. 라이게이션 매개 PCR을 위한 어댑터의 준비는 DSLn 및 DSSm 올리고뉴클레오티드의 어닐링에 의해 달성하였다. 이 목적을 위해 올리고뉴클레오티드의 각각의 100 μM 저장액(stock solution)의 0.5 μL를 1.0 μL의 H2O와 혼합하였다. 어닐링은 65℃에서 개시하였고, 1℃/min의 램프로 지속적으로 감소하는 온도에서 15℃에 이르기까지 계속하였다. 어닐링된 올리고뉴클레오티드는 0.5 μL의 DSPCR 올리고뉴클레오티드 [100 μM 저장액], 1 μL의 ATP (10 mM) 및 1 μL의 T4-DNA 리가아제 (5U; Roche)로 보충하였다. 다음으로 프리믹스된 올리고뉴클레오티드/ATP/리가아제 혼합물을 단편화된 DNA 대표(representation)에 첨가하고 15℃에서 밤새 라이게이션하였다. 그후 PCR 반응은 3 μL의 PCR 버퍼 (Expand Long Range Buffer 1, Roche), 2 μL의 dNTPs (10 mM), 5U의 Pwo/Taq DNA 폴리머라제 믹스 (PolMix, Expand Long Range Buffer 1, Roche) 및 H2O를 전체 부피 50 μL로 첨가한 후에 시작하였고, PCR 기계에서 47 사이클 동안 런(run)하였다. 일차(primary) PCR에서 사용된 사이클링 절차의 디테일은 도 14에 개요를 서술하였다.
실시예 4 - 엑소뉴클레아제 처리를 포함하는 샘플 준비.
3 내지 18개의 무작위 베이스를 갖는 바코드의 포함은 각각의 결과 서열이 독특하다는 점에서 단일 또는 적은 세포의 매 라이게이션된 DNA 분자를 기본적으로 표시한다. 그러므로, DSL 올리고뉴클레오티드는 PCR 올리고뉴클레오티드로서 사용될 수 없는데, 독특한 바코드가 상실되거나 증폭 효율이 나쁘기 때문이다. 게다가, 온전한 바코드를 갖는 DSL 올리고뉴클레오티드는 원하지 않는 무작위 프라이밍 이벤트에 의해 PCR 반응에 부정적으로 영향을 미칠 수 있다.
DSL 올리고뉴클레오티드의 원하지 않는 결합을 예방하기 위하여 채우는(fill-in) 반응 후에 및 샘플의 지수 증폭 전에 엑소뉴클레아제 단계를 첨가할 수 있다. 이 절차의 이 구체예에서 프로테이나제 K 절단 및 MseI 절단의 단계는 변하지 않은 채로 남아있다. 올리고뉴클레오티드 서열의 어닐링은 0.5 μL의 10 x One-Phor-All-Buffer-Plus 버퍼, 0.5 μL의 DSLn 및 DSSm 올리고뉴클레오티드 (100 μM 각각), 및 1.5 μL H20로 구성되었다. 동등하게, 이 절차의 이전의 변화에 대해, 어닐링은 65℃에서 개시하였고, 1℃/min의 램프로 지속적으로 감소하는 온도에서 15℃까지 계속하였다. 그후, 어닐링된 올리고뉴클레오티드는 MseI 절단의 산물과 혼합하였고, 밤새 15℃에서 라이게이션하였다. 그후 일차(primary) PCR 반응은 3.0 μL의 PCR 버퍼 (Expand Long Range Buffer 1, Roche), 2 μL의 dNTPs (10 mM), 5U의 Pwo/Taq DNA 폴리머라제 블렌드 (PolMix, Expand Long Range Buffer 1, Roche) 및 34.0 μL의 H2O를 첨가하는 것에 의해 조립하였다. 채우는(fill-in) 단계 (68℃에서 3분) 이후에, 0.5 μL 엑소뉴클레아제 I (20 U/μL)를 첨가하여 결합하지 않은 올리고뉴클레오티드를 제거하였다. 엑소뉴클레아제 절단은 37℃에서 30분 동안 수행하였고, 85℃에서 15분 동안 열-불활성화하였다. 다음으로, 0.5 μL의 DSPCR 올리고뉴클레오티드 (100 μM)을 처가하였고, PCR을 개시하였다. 사용된 사이클링 절차를 위한 설명은 도 15에 개요를 서술하였다.
실시예 5 - 에러- 프리 염기서열 분석을 위한 샘플의 품질 관리
전체 게놈 증폭 (WGA)의 품질을 예측하는 서로게이트 분석(surrogate assay)이 이전에 개발되었다. 각각의 개개의 세포를 위한 측정을 하기 위해 이 분석, 중기(metaphase) CGH, 어레이 CGH 및 대립유전자의 탈락율을 수행하기 위해 WGA의 품질을 사용하였다. 요약하면, Ampli1TM로 단일 세포 DNA의 신뢰할 수 있고 균일한 전체 게놈 증폭을 측정하기 위한 적절한 테스트를 고안하기 위하여 하기 실험을 수행하였다: 존재하는 단일 세포 WGA 바이오뱅크로부터, 유방암 및 전립선 암 환자의 골수로부터, 뿐만 아니라 흑생종 환자의 림프절로부터 분리된 단일 파종성 암 세포 (DCC)의 72 WGA 산물을 선택하였다. 각각의 세 종양 타입으로부터, 이전의 CGH 실험에서 인간 염색체에 성공적으로 혼성화된 12 DCC (n=36), 및 CGH 실험에서 실패한 3 x 12 DCC를 선택하였다. 서로 다른 염색체 영역에 위치한 MseI 제한 단편을 위하여 서로 다른 단편 길이로 8개의 서로 다른 올리고뉴클레오티드 쌍을 디자인하였고, 239 bp부터 1936 bps까지의 범위였다. 모든 선택된 DCC에 대한 8개의 올리고뉴클레오티드 쌍으로 특이적 PCR을 수행하였고, 결과를 알려진 CGH 결과와 관련시켰다. 만약 단일 세포 WGA 산물이 적어도 2/3 마커에 대해 양성이라면, 세 개의 올리고뉴클레오티드 쌍은 94%의 특이성 및 97%의 민감성을 갖는 성공적인 중기(metaphase) CGH 실험을 예측할 수 있는 것으로 발견되었다 (도 2).
이 분석은 분리된 100개의 2배체 비-암 세포에서 유효하였고, 그의 DNA는 1999 및 2008 사이에 증폭되었다. CGH 분석을 가능하게 하기 위한 선택된 세 개의 올리고뉴클레오티드 쌍에 의해 예측된 단일 세포의 22 WGA 산물 및 실패할 것으로 예상된 단일 세포의 10 WGA 산물을 선택하였다. CGH의 수행은 모든 32 경우에서 정확하게 예측되었다. 후에, PCR 올리고뉴클레오티드의 제4 쌍은 KRAS 유전자의 빈번히 돌연변이된 코돈12/13을 포함하는 192 bp 긴 MseI 제한 단편 위에 위치하였고, 분리된 세포의 게놈 온전성을 예측하기 위한 디자인된 4 마커 멀티플렉스 PCR 어세이 (Ampli1 TM QC kit)가 포함되었다.
그리고나서, 남성 기증자의 말초 혈액으로부터 88개 단일 단핵세포를 수동으로 조절된 현미 조작 장치(micromanipulator)를 사용하여 분리하였고, 게놈 DNA를 증폭하였고, 그리고 증폭의 품질은 새롭게 분리되고 고정되지 않은 세포에서 Ampli1 TM QC 키트로 측정하였다. 결과는 83/88 (94.3%)의 세포가 둘 또는 셋의 QC 밴드를 나타냄을 보여주었다 (도 3).
최종 QC 어세이는 게놈 온전성 지수 (genomic integrity index, GII)를 할당하였는데, 0, 밴드가 증폭되지 않은 경우; 1, 하나의 밴드가 증폭된 경우; 2 두 개의 밴드가 증폭된 경우; 3, 세 개의 밴드가 증폭된 경우; 4, 네 개의 밴드가 증폭된 경우이다. (도 3). GII는 CellSearch 시스템에 의해 분리된 환자로부터 순환 종양 세포에서 테스트되었다. 모든 세포들은 몇몇의 다운스트림 분석, 즉 qPCR, 표적 생어(Sanger) 염기서열 분석 및 aCGH로 조사하였다. 다시, 어세이는 샘플의 품질을 측정하기 위해 완벽히 적합하였다.
멀티플렉스 PCR-기반 QC-어세이를 사용하여 에러-프리 염기서열 분석을 위한 샘플의 품질을 결정하였다. 이 반응은 인간 게놈에서 세 개의 다른 loci의 존재를 측정하였다. 멀티플렉스 반응의 양성율(positive rate)을 다수 다운스트림 적용의 성공율과 관련시키고, 그것에 의하여 이것은 성공적인 전체 게놈 증폭을 위한 서로게이트 마커(surrogate marker)로서 사용될 수 있다.
샘플 준비의 품질 및 수행을 더욱 측정하기 위하여, 샘플 준비 동안 도입된 바이어스(bias)로부터 초래된 대립유전자 탈락 (allelic dropout, ADO)률을 분석하였다. 이 목적을 위해, 4개의 서로 다른 SNP 마커가 선택되었고, 테스트 시리즈에 포함된 모든 견본에서 이형접합으로 테스트되었고, 그리고 RFLP-PCR 어세이에서 샘플에 그들의 존재에 대해 테스트되었다.
실시예 6 - 에러- 프리 염기서열 분석을 위한 샘플 준비 절차의 최적화
최적의 올리고뉴클레오티드 디자인의 결정.
DSL 올리고뉴클레오티드의 원하지 않는 프라이밍은 DSL 올리고뉴클레오티드의 3'-고정 서열의 길이 및 바코드의 길이의 비율에 달려있다. 3'-고정 서열이 더 짧을수록 Taq-폴리머라제 연장에 결정적인 염기의 3'-결합이 더 약해진다. 바코드가 더 길수록 완전히 상보적인 DSL 올리고뉴클레오티드가 PCR 동안 DNA-어댑터 산물에 결합할 가능성이 낮아진다. 그러므로, 짧은 바코드는 짧은 고정 서열을 가지고 더 잘 작용할 것고, 더 긴 고정 서열은 더 긴 바코드를 요구할 것이다.
DSSm 올리고뉴클레오티드의 길이가 일차(primary) PCR의 수행에 어떻게 영향을 미치는지 테스트하기 위하여, 각각에 TTAA 모티프를 재구성하는 두 개의 염기의 첨가에 더하여 5 또는 6개 염기의 길이를 갖는 올리고뉴클레오티드, DSS5 및 DSS6의 두 변형체를 테스트하였다.
두 올리고뉴클레오티드 조합 DSL12-DSS6 및 DSL9-DSS5 를 건강한 남성 기증자의 10개의 단일-세포 및 두 개의 세포 풀(pools)에 대하여 테스트하였다. 두 올리고뉴클레오티드 듀플렉스의 수행은 멀티플렉스 PCR을 사용하여 측정하였다 (도 5).
QC 어세이의 결과는 DSL12 및 DSS6 로 구성된 어댑터가 재현가능하게 고-품질 PCR 산물을 제공하였음을 가리키고, 반면 DSL9-DSS5 이용은 덜 적합한 것으로 보였다 (도 5A-B). DSL12/DSS6 를 사용한 단일 세포 게놈의 종합적인 증폭은 aCGH 실험에서 확인하였다 (도 5C-D). 이 이유에 대해 추가적인 실험을 DSL12-DSS6 올리고뉴클레오티드 조합만으로 수행하였다.
일차(primary) PCR 동안 올리고뉴클레오티드 어닐링을 위한 최적의 온도의 결정.
어댑터-매개 PCR의 수행의 추가적 최적화를 하기 위하여, 일차(primary) PCR을 위한 사이클링 조건을 테스트하였다. DSLn 올리고뉴클레오티드의 무작위 태그의 통합은 서로 다른 올리고뉴클레오티드 변형체의 다양한 어닐링 동역학(kinetics)를 초래하였다. 그러므로, 어닐링 조건의 적절한 선택은 PCR의 성공을 위해 중대할 수 있다. 가장 최적의 세팅을 찾기 위하여, 세 개의 서로 다른 어닐링 온도를 테스트하였다: 57℃, 60℃ 및 63℃. 단일 세포 샘플은 변형된 일차 PCR로 처리하였다. 그 다음의 SNP 분석은 사용된 어닐링 온도와 독립적인 비슷한 대립유전자 탈락율을 보여주었다 (도 6). 이것은 프로토콜이 드문 대립유전자 손실로 단일 세포 게놈을 완전히 증폭하는 것을 가능하게 한다는 것을 암시한다. 그러므로, 게놈의 범위(coverage)는 우수한 것으로 보인다.
그러나, 멀티플렉스 PCR을 사용한 PCR 산물의 품질 측정은 증가된 어닐링 온도가 일차 PCR에 다소 부정적인 영향을 가질 수 있다는 것을 밝혔다 (도 7). 일차 PCR 동안 57℃의 어닐링 온도를 사용하였을 때, 샘플은 가장 좋은 품질을 보여주었다 (도 7). 결론적으로, 이 세팅이 추가적인 실험을 위해 사용되었다.
실시예 7 - 추가적인 엑소뉴클레아제 처리
이미 언급된 바와 같이, 일차 PCR에서 결합하지 않은 DSLn 올리고뉴클레오티드의 존재는 일부 다운스트림 적용 또는 가끔 증폭 반응의 효율을 방해할 수 있다. 이것을 예방하기 위하여, 채우는(fill-in) 반응 및 일차 PCR에서 제한 단편의 지수 증폭의 개시 사이에 도입된 엑소뉴클레아제 I 절단 단계의 효과를 테스트하였다. 이 접근을 사용하는 것에 의해 샘플의 게놈 대표(representation)의 PCR-기반 증폭을 계속하기 이전에 결합되지 않은 올리고뉴클레오티드를 제거하는 것이 시도되었다. 엑소뉴클레아제 I로 초기 테스트는 효소가 PCR 반응에서 이중-가닥 DNA 분획물에 영향을 미치지 않고, 결합되지 않은 PCR 어댑터의 제거를 가능하게 한다는 것을 가리켰다 (도 8).
실시예 8 - 바코드의 앰플리콘 유래 단일 세포로의 도입에 대한 직접적 증명
Mse I 제한 단편이 정말 바코드로 표시되었는지 증명하기 위하여, DSL12 올리고뉴클레오티드를 사용하여 생성된 단일 세포 샘플 유래 세 개의 무작위로 선택된 제한 단편을 염기서열 분석하였다. 개개의 단편을 분리하기 위하여, 단일-세포 게놈의 크기 선택된 (300 bp 보다 큰 단편만) 대표(representation)를 pGEM T-Easy 벡터로 클로닝하였다. 이 구조물로 E.coli 박테리아를 형질전환하고, 형질전환된 콜로니를 비색분석 X-Gal 기반 선별 후에, 세 개의 콜로니를 다음 테스팅을 위해 무작위로 선택하였다. 플리스미드 DNA의 분리 하에, 그 다음의 염기서열 분석은 인간 게놈 서열을 품고 있는 서열은 DSL12 올리고뉴클레오티드 및 이의 상보적 서열이 측면에 놓여있다는 것을 밝혔다 (도 8). 예상했던 바와 같이, 무작위 바코드 서열은 모든 세 단편에 대해 달랐고, 이는 우리의 새로운 접근법이 단일-세포 DNA로부터 기원된 게놈 대표(representation)에서 개개의 제한 단편의 독특한 태깅(tagging)을 가능하게 한다는 것을 증명한다 (도 9). 이와 같이 고정된 환자-태그 서열 및 I-SceI 부위가 검색되었다.
실시예 9 - DNA/RNA 올리고뉴클레오티드의 사용
DNA/RNA 올리고뉴클레오티드의 사용을 또한 예상하였다. 그러한 방법은 하기 단계를 포함한다:
1) 세포 유리 DNA의 프로테아제 절단;
2) 예를 들어 MseI를 사용하여 제한;
3) 어댑터 라이게이션, 여기에서 제2 올리고뉴클레오티드는 DNA로 이루어진 제1 서열, RNA로 이루어진 제2 서열 및 DNA로 이루어진 제3 서열을 포함하는 DNA/RNA 올리고뉴클레오티드이다. 따라서, 제2 올리고뉴클레오티드의 무작위 서열은 RNA로 이루어진다;
4) 역전사 효소 + (열 안정성) DNA 폴리머라제 및 데옥시뉴클레오티드의 첨가하여 이중 가닥을 형성, 그것에 의하여 라이게이션된 제2 올리고뉴클레오티드에서 DNA:DNA-RNA:DNA-DNA:DNA 분자가 생성된다. 따라서 무작위 서열 RNA 가닥에 대한 상보적인 DNA 가닥이 생성된다;
5) RNAse H를 첨가하여 DNA/RNA 이중 가닥 혼성체를 절단;
6) RNAse If를 첨가하여 제1 및 제2 올리고뉴클레오티드로 제조된 프리(free) 어댑터의 단일 가닥 RNA의 절단;
7) 라이게이션된 제2 올리고뉴클레오티드의 RNA 서열의 제거 후에, 제2 올리고뉴클레오티드의 남아있는 DNA 파트가 다시 DNA 폴리머라제로 연결된다;
8) 리가아제를 첨가하여 제2 올리고뉴클레오티드의 고정 영역을 갖는 제2 올리고뉴클레오티드의 연장된 파트를 연결;
8) 남아있는 PCR 시약의 첨가;
9) 제3 올리고뉴클레오티드의 첨가. RNAse 단계가 효율적이었다면, PCR 프라이머는 반응 동안 생성된다. 따라서, RNAse 단계가 효율적이라면, 제3 올리고뉴클레오티드를 첨가할 필요가 없다.
실시예 10 - 전체 게놈 증폭 ( WGA ) 의 적용
본 발명의 방법에 의해 생성된 WGA의 수행은 단일-세포 WGA 산물의 품질을 테스트하기 위하여 특별히 디자인된 멀티플렉스 PCR 어세이를 사용하여 측정하였다; Polzer et al. (2014) EMBO Mol Med. Oct 30;6(11):1371-86를 참조하라. 이 테스트는 WGA 산물에서 4개의 유전적 loci (KRAS, D5S 2117, KRT19 및 TP53)의 존재를 측정하였다. 모든 4개의 서열의 존재 (4 양성 밴드)는 고-품질 산물을 나타낸다. 반대로, 컨트롤(control) PCR에서 어떤 산물의 부족은 WGA 산물의 좋지 못한 품질을 가리킨다. 비교로, 프로토콜은 Jones (1997) BioTechniques 22:938-946에 의해 그리고 US 08/742,755에서 설명된 바에 따라 수행하였다. 하기에서, 종래 기술, 즉 Jones (1997) BioTechniques 22:938-946 및 US 08/742,755 에서 설명된 프로토콜은 (A)로 나타내었고 반면 본 발명의 방법을 사용하여 수행된 실험은 (B)로 언급되었다.
DNA 샘플의 제공
Jones (1997) BioTechniques 22:938-946 및 US 08/742,755에서 설명된 방법은 본 발명의 방법과 비교하였다. 두 방법을 사용하여 다양한 양의 출발 물질로 13 샘플을 증폭하였다: 보통의 기증자 유래 단일 말초 혈액 림프구 (PBLs)로 5개 반응, 10 PBLs의 세 개의 풀(pools) 및 100 PBLs의 세 개의 풀(pools)이 각가의 용기에서 두 번(duplicates) 동시에 용해되어 이중-가닥 게놈 데옥시리보핵산 (DNA)를 방출하였다.
DNA 제한
(A) Jones (1997) BioTechniques 22:938-946 및 US 08/742,755에서 설명된 방법에 따라, 분리된 DNA는 절단 부위가 그 인식 부위로부터 분리된 제한 효소 (여기에서 Bse RI)로 절단하였고, 그것에 의하여 사용된 효소의 제한 부위에 상응하는 단일 가닥 오버행 서열을 가지는 이중 가닥 분자를 형성하였다. 제한 이후에, 효소는 제조업자에 의해 제공된 정보에 따라 불활성화하였다. 실험 셋팅에서, Bse RI 농도는 단일 세포 DNA, 10 PBLs 및 100 PBLs의 세포 풀(pool)로부터 기원된 DNA에 대해 각각 ~0.151U/pg, ~0,015U/pg 및 ~0,001U/pg의 DNA이었다 (1 단위(unit)는 전체 반응 부피 50 μL에서 37℃에서 1시간에 1 μg의 λDNA를 절단하기 위해 필요한 효소의 양으로 정의된다). 제한 절단은 반응 부피 5 μL에서 37℃에서 3시간 동안 수행하였다.
(B) 동시에, 분리된 DNA는 여기에서 설명된 바와 같이, 단일 세포 DNA, 10 PBLs 및 100 PBLs의 세포 풀(pool)로부터 기원된 DNA 각각에 대해 ~1.5U/pg, ~0.15U/pg 및 ~0.015U/pg의 DNA의 농도로 MseI 제한 효소를 사용하여 처리되었다 (1 단위(unit)는 전체 반응 부피 50 μL에서 37℃에서 1시간에 1 μg의 λDNA를 절단하기 위해 필요한 효소의 양으로 정의된다). 제한 절단은 반응 부피 5 μL에서 37℃에서 3시간 동안 수행하였다.
PCR 어댑터
(A) 어댑터 세트 1 (Jones (1997) BioTechniques 22 (5), 938-946의 표 2에 나타나고 그리고 US 08/742,755의 실시예 2에서 나열된 바와 같음)에 상응하는 어댑터는, 4개의 다른 어댑터를 사용하는 대신에 상부 가닥의 3'-말단 위치에 고정 뉴클레오티드를 각각 보유하고, 3'-말단 위치에 두 개의 가상 염기 (N)를 나타내는 상부 가닥을 갖는 오직 하나의 어댑터를 사용하는 것을 제외하고는 Jones et al. 공개의 Materials and Methods 섹션에서 설명된 바와 같이 생성하였다.
어댑터의 어닐링
(A) 이중 가닥 어댑터는 Jones DH et al., BioTechniques 22 (5), 938-946에서 설명된 절차에 따라 상부 및 하부 가닥 올리고뉴클레오티드의 어닐링에 의해 생성하였다.
(B) 동시에, 본 발명의 제1 및 제2 올리고뉴클레오티드를 하기 프로토콜을 사용하여 어닐링하였다: 단계 1 - 80℃에서 30초, 다음에 단계 2 - 1분 동안 65℃에서 인큐베이션 단계 및 단계 3: 1℃/min의 변함없는 램프 온도 램프로 15℃로 쿨링(cooling).
어댑터의 라이게이션
두 실험을 위해, 어댑터는 1 μL의 ATP (10 mM) 및 5U의 T4 DNA 리가아제의 존재에서 제한 효소 절단의 산물과 라이게이션하였다.
PCR 증폭
(A) 라이게이션된 이중-가닥 분자는 어댑터 세트 1에 특이적인 프라이머에 의해 증폭하였고, 그것에 의하여 서열을 식별 태그의 역할을 하는 어댑터의 상부 가닥의 서열과 상응하였다.
(B) 라이게이션된 이중-가닥 분자는 올리고뉴클레오티드 2에 특이적인 프라이머에 의해 증폭하였고, 그것에 의하여 올리고뉴클레오티드 2의 말단 파트는 프라이머 결합 태그의 역할을 하였다. 즉, 라이게이션된 이중-가닥 분자는 본 발명의 방법에서 사용된 제3 올리고뉴클레오티드를 사용하여 증폭하였다.
평가
WGA의 두 방법의 적합성은 QC2 멀티플렉스 PCR 어세이에 의해 측정하였다 (Polzer et al 2014; EMBO Molecular Medicine (2014) 6,1371-1386).
결과
Jones DH, BioTechniques 22:938-946 및 US 08/742,755 에서 설명된 방법에 의해 증폭된 모든 샘플에서 멀티플렉스 PCR 어세이의 부정적인 결과는 이 접근법이 전체 게놈 증폭에 적합하지 않고, 결과적으로 전체 게놈의 에러-프리 염기서열 분석을 초래할 수 없다는 것을 가리킨다. 그러므로, 여기에서 설명된 방법의 적용은 선택되고 미리-증폭된 (예를 들어 PCR에 의해) 게놈 loci의 염기서열 분석에 오직 제한되고, 전체 게놈의 분석을 위한 것은 아니다.
대조적으로, 본 발명의 방법을 사용하여 생성된 WGA 산물에 적용되었을 때 얻은 멀티플렉스 어세이의 긍정적인 결과는 이 기술이 전체 게놈 서열 대표(representation)의 전체 게놈 증폭을 위해 적합하다는 것을 보여준다. 게다가, 본 발명의 방법은 그후 전체 게놈의 에러-프리 염기서열 분석을 위해 사용될 수 있다. 도 18에 나타난 바와 같이, 본 발명의 방법은 통상의 기술자가 DNA를 증폭하고 그후 오직 적은 양의 출발 물질이 존재하는 샘플로부터 서열 정보를 검색하는 것을 가능하게 한다. 특히, 본 발명의 방법은 단일 세포의 DNA를 증폭할 수 있고, 이의 서열 정보는 그후 본 명세서에서 제공된 방법을 사용하여 검색될 수 있다.
실시예 11 - 단일세포의 DNA의 에러- 프리 염기서열 분석
본 발명의 방법에서 사용된 제2 올리고뉴클레오티드의 파트로서 바코드/식별자로서 무작위 서열을 사용하여 에러 정정의 실행가능성을 증명하기 위하여, 두 개의 실험을 수행하였다. 이를 위하여, 어댑터를 함유하는 무작위 서열은 단일 세포 유래 또는 FACS 분류된 인간 염색체 22 유래 ~6 pg MseI 절단된 DNA와 라이게이션하였다. MseI 단편은 그후 Ampli1 TM를 사용하여 증폭하였고, 그후 Roche GS 454 FLX+ 플랫폼에서 염기서열 분석하였다.
실험 셋업 (setup)
(a) 단일 세포 유래 DNA를 추출하였다;
(b) DNA 샘플을 제한 효소로서 MseI를 사용하여 절단하였다;
(d) 제1 올리고뉴클레오티드를 생성된 오버행에 어닐링하였다. 그후, 무작위 서열을 포함하는 제2 올리고뉴클레오티드를 제1 올리고뉴클레오티드에 어닐링하였다;
(d) 제2 올리고뉴클레오티드를 MseI 단편의 엔드(ends)에 라이게이션하였다;
(e) 라이게이션된 제2 올리고뉴클레오티드에 의해 생성된 오버행을 채웠다(fill-in);
(f) 단편은 제2 올리고뉴클레오티드의 제3 서열에 상보적인 PCR 프라이머를 사용하여 증폭하였다;
(f') 제2 올리고뉴클레오티드는 호밍 엔도뉴클레아제, 즉 SceI의 절단 부위를 포함하기 때문에, 증폭된 단편은 증폭 후에 절단하였다;
(g) 절단된 단편은 엔드-복원하였고, Roche Diagnostics의 Rapid Library Prep Kit에서 제공된 Y-어댑터와 T/A-라이게이션하였다. GS 454 FLX+ 플랫폼에서 염기서열 분석을 454 Sequencing System Methods Manuals XLR70Series에 설명된 바와 같이 수행하였다.
염기서열 분석
방법이 454FLX 플랫폼을 사용하여 수행되었을지라도, 통상의 기술자는 대안적인 염기서열 분석 방법을 사용할 수도 있다는 것을 인정할 것이다.
분석
염기서열 분석된 DNA 단편의 분석은 무작위 서열의 확인 및 그후 어댑터 트리밍(trimming)을 요구한다. 둘은 in-house JAVA 프로그램을 사용하여 수행하였다.
요약하면, 제2 올리고뉴클레오티드의 서열은 스미스-워터맨(smith-waterman) 알고리즘의 변형된 바이오자바(biojava) 구현에 기초하여 판독(reads) 내에서 확인하였다; 무작위 서열은 판독 헤더(read header) 및 딱 떨어지는(clipped) 어댑터 서열로 읽히는 반면 MseI 제한 부위 ("TTAA")는 보유된다. 어댑터 및 그러므로 도한 무작위 서열이 확인될 수 없는 판독 (1 - 3.5%의 모든 판독)은 버려진다. 더 나아가, 어댑터 트리밍 후에 20bp 보다 적은 길이로 버려진 판독 (어댑터가 확인된 0.7 - 4.3%의 모든 판독). 비-인간 종으로부터 판독 서열을 오염시키기 위한 스크리닝은 오염이 없는 것으로 드러났고, 트림-판독(trimmed-reads)은 그러므로 표준 셋팅으로 BWA mem 알고리즘을 사용하여 인간 게놈 어셈블리 19에 대해 직접적으로 맵핑된다 (Li and Durbin, Bioinformatics 2009 Jul 15;25(14):1754-60). 본 발명의 방법으르 사용하여 염기서열 분석 및 실제 돌연변이/SNPs 사이를 구별하기 위한 능력을 설명하기 위하여, 적어도 12의 판독 범위(coverage)로 그 게놈 영역을 확인하였다. 이것은 그후 동등한 무작위 서열을 갖는 적어도 8개의 판독(reads)이 일어난 영역을 위해 더 필터된다. 결과적인 데이터세트로부터, 추정되는 SNPs/돌연변이/염기서열 분석 에러를 함유하는 4개 영역이 무작위로 선별되었다. 나타난 정렬(alignments)을 위하여, 같은 무작위 서열을 함유하는 모든 판독을 사용하였다.
결과
참조 게놈의 같은 위치에 정렬된 판독의 무작위 서열을 사용하는 것은 염기서열 분석-/증폭 에러, 단일 뉴클레오티드 다형성 및 실제 돌연변이 사이를 신뢰할 수 있게 구별하는 것을 가능하게 하였다. 같은 무작위 서열을 공유하는 판독의 모든 그룹에서, 참조로부터 단일 뉴클레오티드 변화는 무작위 서열의 하나의 그룹에 특이적일 것으로 밝혀졌다 (도 19a-d).
<110> Fraunhofer-Gesellschaft zur Forderung der angewandten Forschung e.V. <120> Error-free sequencing of DNA <130> I16O10D0032PDE <150> EP14 15 4044.3 <151> 2014-02-05 <160> 139 <170> BiSSAP 1.2 <210> 1 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(40) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <220> <221> variation <222> (23)..(34) <223> /note="n = a, t, g, c or u" <400> 1 gctagggata acagggtaat gcnnnnnnnn nnnngtcagt 40 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(22) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <400> 2 gctagggata acagggtaat gc 22 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(18) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <400> 3 tagggataac agggtaat 18 <210> 4 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(22) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <400> 4 gctagggata acagggtaat gc 22 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(40) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <220> <221> variation <222> (23)..(34) <223> /note="n = a, t, g, c or u" <400> 5 gctagggata acagggtaat gcnnnnnnnn nnnngtcagt 40 <210> 6 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(36) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <220> <221> variation <222> (23)..(31) <223> /note="n =a, t, g, c or u" <400> 6 gctagggata acagggtaat gcnnnnnnnn ngtcgt 36 <210> 7 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(435) <223> /mol_type="unassigned DNA" /note="Annotation of the fragment: chr10, 1811253 to 1811607" /organism="Artificial Sequence" <400> 7 gctagggata acagggtaat gcgtggtcag gggggtcagt taaagtagtt ttggcaaatt 60 ggataaagag tcaagaccca tcagtgtgct gtattcagga aacccatctc atgtgcagag 120 acacacatag gctcaaaata aaaggatgga ggaagatcta ccaagcaaat ggaaaacaaa 180 aaaaggcagg ggttgcaatc ctagtctctg ataaaacaga ctttatacca acaaagatca 240 aaagagacaa agaaggccat tacataatgg taaagagatc aattcaacaa gaagagctaa 300 ctatcctaaa tatatatgca cccaatacag gagcacccag attcataaag caagtcctga 360 gtgacctaca aagagactta gactcccaga cattaactga cactctcgtc cttgcattac 420 cctgttatcc ctagc 435 <210> 8 <211> 543 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(543) <223> /mol_type="unassigned DNA" /note="fragment: chr5,96535437 to 96525889" /organism="Artificial Sequence" <400> 8 gctagggata acagggtaat gcgcgaaggt aggcgtcagt taaccaagaa aagaggagag 60 aaaatacaaa taagctcaat aaggaacaaa acaggagaca ttacaactga cactatataa 120 atacaaaaga tcattcaagg ctactgtgaa cacctttaca tgcataaact agaaaaccta 180 aaagacatgg ataaattcct ggaaagtaga gaggcatcac attacccaac ttcaaactat 240 actataaggc tatagtcacc aactcagcat ggcactggta taaaaatagg catgtagacc 300 aatgaaacag aaaagagaac ccagacataa agccaaatac agccaaccaa tctttgacaa 360 agcaaacaaa aacataaagt ggggaaagga cgctctattc aacaaatggt gctgggataa 420 ttggcaagcc acatgtagaa gaatgaaact ggatcctcat ctccccttta tacaaaatca 480 acacaaaata gataaaagac ttaactgacc cacaaggata ggcattaccc tgttatccct 540 agc 543 <210> 9 <211> 440 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(440) <223> /mol_type="unassigned DNA" /note="restriction fragment: chrX, 94553619 to 94553978" /organism="Artificial Sequence" <400> 9 gctagggata acagggtaat gcgtaggaga aaatgtcagt taaatctata aattgtgtgc 60 cacgtgcggt ggctcatgac tgtaatccca gcactttggg agtccgaggt gggcagatca 120 cgaggtcagg agattgagac catcttggct aacacggtga aaccctgtct ctactaaaaa 180 tacaaaaaca aaattagccg ggtgaggtgg caggcacctg tagtcccagc tactccagag 240 gctgaggtga gagaatggcg tgaacctggg aggcagagct tgcagtgagc tgagattgtg 300 ccactgcact ccagtctggg tgacagagca agactctgtc tcaaaaaaaa aaaaaaaaaa 360 aaaaattcta taaattgtgt tgggcagtat ggccttttta actgacacta aagtcacagc 420 attaccctgt tatccctagc 440 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(18) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <400> 10 tagggataac agggtaat 18 <210> 11 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(27) <223> /mol_type="unassigned DNA" /note="Primer" /organism="Artificial Sequence" <400> 11 taactataac ggtcctaagg tagcgaa 27 <210> 12 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(46) <223> /mol_type="unassigned DNA" /note="primer" /organism="Artificial Sequence" <220> <221> variation <222> (28)..(40) <223> /note="n = a, c, g, t or u" <400> 12 agttacgcta gggataacag ggtaatgcnn nnnnnnnnnn gtcagt 46 <210> 13 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(23) <223> /mol_type="unassigned DNA" /note="primer" /organism="Artificial Sequence" <400> 13 cgcagttacg ctagggataa cag 23 <210> 14 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(50) <223> /mol_type="unassigned DNA" /note="primer" /organism="Artificial Sequence" <220> <221> variation <222> (32)..(43) <223> /note="n = c, t, g, a or u" <400> 14 cgcagttacg ctagggataa cagggtaatg cnnnnnnnnn nnngatcagt 50 <210> 15 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(91) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01EV3C9" /organism="Artificial Sequence" <400> 15 gaagagggga gtgggaagta gaggctgagt gatttaggta tttccaataa tcaatagcaa 60 gaccactgtg agctgaatac atcgggttat c 91 <210> 16 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(90) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01D9VJ6" /organism="Artificial Sequence" <400> 16 gaagagggga gtgggaagtg aggctgagtg atttaggtat ttccaataat caatagcaag 60 accactgtga gctgaataca tcgggttatc 90 <210> 17 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(91) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01BDRUD" /organism="Artificial Sequence" <400> 17 gaagaggggg agtgggaagt gaggctgagt gatttaggta tttccaataa tcaatagcaa 60 gaccactgtg agctgaatac atcgggttat c 91 <210> 18 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01DC2CL" /organism="Artificial Sequence" <400> 18 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 19 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01AV5Z7" /organism="Artificial Sequence" <400> 19 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 20 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01BN7XB" /organism="Artificial Sequence" <400> 20 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 21 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01AH386" /organism="Artificial Sequence" <400> 21 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 22 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01D63DR" /organism="Artificial Sequence" <400> 22 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 23 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01BVTHT" /organism="Artificial Sequence" <400> 23 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 24 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01BI7HX" /organism="Artificial Sequence" <400> 24 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 25 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H02IESZE" /organism="Artificial Sequence" <400> 25 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 26 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H02G69J5" /organism="Artificial Sequence" <400> 26 atgagtggga tatgggaagt gaggctgagt gatttaggta tttccatatc aatagcaaga 60 ccactgtgag ctgaatacat caggttatc 89 <210> 27 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(67) <223> /mol_type="unassigned DNA" /note="I935FME02I8EWU" /organism="Artificial Sequence" <400> 27 gataaatatg aacactgcac cgtgaaattc tgtgcctcga agacaggctc gctattttag 60 aagaggg 67 <210> 28 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02HST0F" /organism="Artificial Sequence" <400> 28 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 29 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02IS3DB" /organism="Artificial Sequence" <400> 29 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 30 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02GVA1A" /organism="Artificial Sequence" <400> 30 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 31 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02GV56X" /organism="Artificial Sequence" <400> 31 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 32 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02HT9UP" /organism="Artificial Sequence" <400> 32 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02IPW2U" /organism="Artificial Sequence" <400> 33 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 34 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02HNKYA" /organism="Artificial Sequence" <400> 34 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 35 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02I0S0E" /organism="Artificial Sequence" <400> 35 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 36 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02HXEG8" /organism="Artificial Sequence" <400> 36 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 37 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02JFTGT" /organism="Artificial Sequence" <400> 37 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 38 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02GBSUA" /organism="Artificial Sequence" <400> 38 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 39 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02GR861" /organism="Artificial Sequence" <400> 39 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 40 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME02IPFUP" /organism="Artificial Sequence" <400> 40 gataaatatg aacactgcac cgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 41 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME01C1GTK" /organism="Artificial Sequence" <400> 41 agacgtttta agcactgcac tgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 42 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(69) <223> /mol_type="unassigned DNA" /note="I935FME01CN901" /organism="Artificial Sequence" <400> 42 agacgtttaa gcactgcact gtgaaattct gtgcctccga agacaggctc gctattttta 60 gaaagaggg 69 <210> 43 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME01EAK2C" /organism="Artificial Sequence" <400> 43 agacgtttta agcactgcac tgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 44 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(70) <223> /mol_type="unassigned DNA" /note="I935FME01AXYNN" /organism="Artificial Sequence" <400> 44 taaatagggt ttcactgcac tgtgaaattc tgtgcctccg aagacaggct cgctattttt 60 agaaagaggg 70 <210> 45 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(43) <223> /mol_type="unassigned DNA" /note="I935FME02G3JAX" /organism="Artificial Sequence" <400> 45 agcgggggtt ggaggtaagg tggtgaataa cgggtttccc aaa 43 <210> 46 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02HPZCG" /organism="Artificial Sequence" <400> 46 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 47 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(45) <223> /mol_type="unassigned DNA" /note="I935FME02HEGFO" /organism="Artificial Sequence" <400> 47 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaaca 45 <210> 48 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME02FY2OL" /organism="Artificial Sequence" <400> 48 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 ggga 64 <210> 49 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME02FUAIM" /organism="Artificial Sequence" <400> 49 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 ggga 64 <210> 50 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02HNVDR" /organism="Artificial Sequence" <400> 50 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 51 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02GP6YE" /organism="Artificial Sequence" <400> 51 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 52 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02IAAW2" /organism="Artificial Sequence" <400> 52 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 53 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02I4UCC" /organism="Artificial Sequence" <400> 53 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 54 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME02FVCO0" /organism="Artificial Sequence" <400> 54 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 ggga 64 <210> 55 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(45) <223> /mol_type="unassigned DNA" /note="I935FME02JTEOX" /organism="Artificial Sequence" <400> 55 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaaca 45 <210> 56 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(42) <223> /mol_type="unassigned DNA" /note="I935FME02GYCTS" /organism="Artificial Sequence" <400> 56 agcgggggtt ggaggtaagg tggtgataac gggtttccca aa 42 <210> 57 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(67) <223> /mol_type="unassigned DNA" /note="I935FME02HYT0N" /organism="Artificial Sequence" <400> 57 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagta 67 <210> 58 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(42) <223> /mol_type="unassigned DNA" /note="I935FME02JBAVG" /organism="Artificial Sequence" <400> 58 agcgggggtt ggaggtaagg tggtgataac gggtttccca aa 42 <210> 59 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02FX9GA" /organism="Artificial Sequence" <400> 59 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 60 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(42) <223> /mol_type="unassigned DNA" /note="I935FME02GYYLN" /organism="Artificial Sequence" <400> 60 agcgggggtt ggaggtaagg tggtgataac gggtttccca aa 42 <210> 61 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02ID4XH" /organism="Artificial Sequence" <400> 61 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 62 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(71) <223> /mol_type="unassigned DNA" /note="I935FME02HVJJE" /organism="Artificial Sequence" <400> 62 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg a 71 <210> 63 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME02H32G2" /organism="Artificial Sequence" <400> 63 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 ggga 64 <210> 64 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02F6Q0H" /organism="Artificial Sequence" <400> 64 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 65 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(67) <223> /mol_type="unassigned DNA" /note="I935FME02HNHHY" /organism="Artificial Sequence" <400> 65 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagta 67 <210> 66 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02FOIUY" /organism="Artificial Sequence" <400> 66 agcgggggtt ggaggtaagg tggtgataac gggtttccca aaacaggtga acggacgtac 60 gggagtaggg ac 72 <210> 67 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(42) <223> /mol_type="unassigned DNA" /note="I935FME02GSN7O" /organism="Artificial Sequence" <400> 67 agcgggggtt ggaggtaagg tggtgataac gggtttccca aa 42 <210> 68 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(39) <223> /mol_type="unassigned DNA" /note="I935FME02FR6XR" /organism="Artificial Sequence" <400> 68 agcgggggtt ggaggtaagg tggtgataac gggtttccc 39 <210> 69 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(71) <223> /mol_type="unassigned DNA" /note="I935FME02IP2KO" /organism="Artificial Sequence" <400> 69 agcggggttg gaggtaaggt ggtgataacg ggtttcccaa aacaggtgaa cggacgtacg 60 ggagtaggga c 71 <210> 70 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(71) <223> /mol_type="unassigned DNA" /note="I935FME02JKE75" /organism="Artificial Sequence" <400> 70 agcggggttg gaggtaaggt ggtgataacg ggtttcccaa aacaggtgaa cggacgtacg 60 ggagtaggga c 71 <210> 71 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01AGM6X" /organism="Artificial Sequence" <400> 71 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 72 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(60) <223> /mol_type="unassigned DNA" /note="I935FME01AMWUD" /organism="Artificial Sequence" <400> 72 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 60 <210> 73 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01EEHFG" /organism="Artificial Sequence" <400> 73 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 74 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(71) <223> /mol_type="unassigned DNA" /note="I935FME01CP0EN" /organism="Artificial Sequence" <400> 74 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggataggga c 71 <210> 75 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01CAYQ8" /organism="Artificial Sequence" <400> 75 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 76 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01CT2IH" /organism="Artificial Sequence" <400> 76 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 77 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01BLNIO" /organism="Artificial Sequence" <400> 77 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 78 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01EW5VF" /organism="Artificial Sequence" <400> 78 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 79 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01BR9EW" /organism="Artificial Sequence" <400> 79 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 80 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(71) <223> /mol_type="unassigned DNA" /note="I935FME01D9HRR" /organism="Artificial Sequence" <400> 80 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggataggga c 71 <210> 81 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01DYFB5" /organism="Artificial Sequence" <400> 81 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 82 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01D6FUV" /organism="Artificial Sequence" <400> 82 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 83 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01BB15Y" /organism="Artificial Sequence" <400> 83 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 84 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02IGF97" /organism="Artificial Sequence" <400> 84 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 85 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02FLWO3" /organism="Artificial Sequence" <400> 85 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 86 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02FOXSW" /organism="Artificial Sequence" <400> 86 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 87 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02GUX6V" /organism="Artificial Sequence" <400> 87 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatgc 60 gggagtaggg ac 72 <210> 88 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02GI4Z4" /organism="Artificial Sequence" <400> 88 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 89 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02H2M7T" /organism="Artificial Sequence" <400> 89 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 90 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02JHRO7" /organism="Artificial Sequence" <400> 90 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 91 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01DYW8K" /organism="Artificial Sequence" <400> 91 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 92 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME01BFXU5" /organism="Artificial Sequence" <400> 92 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 93 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02IQWMO" /organism="Artificial Sequence" <400> 93 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 94 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02HQ894" /organism="Artificial Sequence" <400> 94 atagactagg cgaggtaagg tggtgacaac gggtttccca aaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 95 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(72) <223> /mol_type="unassigned DNA" /note="I935FME02JROVV" /organism="Artificial Sequence" <400> 95 atagactagg cgaggtaagg tggtgacaac gggtttccca gaacaggtga acggacatac 60 gggagtaggg ac 72 <210> 96 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(66) <223> /mol_type="unassigned DNA" /note="I935FME01DKBPG" /organism="Artificial Sequence" <400> 96 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 gagggg 66 <210> 97 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(66) <223> /mol_type="unassigned DNA" /note="I935FME01C29WR" /organism="Artificial Sequence" <400> 97 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 gagggg 66 <210> 98 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(48) <223> /mol_type="unassigned DNA" /note="I935FME01BLAFB" /organism="Artificial Sequence" <400> 98 atatttaaag ctggtggagt tggaaggaat gatttgtgtc tggagggg 48 <210> 99 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(62) <223> /mol_type="unassigned DNA" /note="I935FME01AN93Y" /organism="Artificial Sequence" <400> 99 atatttaaag ctcccctgtg tgccttggtg gagttggagg aatgatttgt gtctgggagg 60 gg 62 <210> 100 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME01B80B0" /organism="Artificial Sequence" <400> 100 atatttaaag cttatcccct gtgtgccttg gtggagttgg aggaatgatt tgtgtctgga 60 gggg 64 <210> 101 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME01DFR9W" /organism="Artificial Sequence" <400> 101 atatttaaag cttatcccct gtgtgccttg gtggagttgg aggaatgatt tgtgtctgga 60 gggg 64 <210> 102 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME01BNPCR" /organism="Artificial Sequence" <400> 102 atatttaaag cttatcccct gtgtgccttg gtggagttgg aggaatgatt tgtgtctgga 60 gggg 64 <210> 103 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01EO6UA" /organism="Artificial Sequence" <400> 103 atatttaaag cttatccccc tgtgtgcctt ggtggagttg gaggaatgat ttgtgtctgg 60 agggg 65 <210> 104 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01D7FI6" /organism="Artificial Sequence" <400> 104 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 105 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01B4QJQ" /organism="Artificial Sequence" <400> 105 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 106 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01AP8OU" /organism="Artificial Sequence" <400> 106 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 107 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01EGAYX" /organism="Artificial Sequence" <400> 107 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 108 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01C0Z0O" /organism="Artificial Sequence" <400> 108 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 109 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01A84M0" /organism="Artificial Sequence" <400> 109 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 110 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01CNOA1" /organism="Artificial Sequence" <400> 110 atatttaaag cttatcccct gtgtgccttg gtggagttgg aaggaatgat ttgtgtctgg 60 agggg 65 <210> 111 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(64) <223> /mol_type="unassigned DNA" /note="I935FME01A1CI5" /organism="Artificial Sequence" <400> 111 atatttaaag cttatcccct gtgtgccttg gtggagttga ggaatgattt gtgtctggga 60 gggg 64 <210> 112 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(60) <223> /mol_type="unassigned DNA" /note="I935FME01AS8D7" /organism="Artificial Sequence" <400> 112 atatttaaag ctcccctgtg tgccttggtg gagttgagga atgatttgtg tctggagggg 60 60 <210> 113 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(63) <223> /mol_type="unassigned DNA" /note="I935FME01BJ137" /organism="Artificial Sequence" <400> 113 atatttaaag cttatcccct gtgtgccttg gtggagttga ggaatgattt gtgtctggag 60 ggg 63 <210> 114 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(63) <223> /mol_type="unassigned DNA" /note="I935FME01A46D0" /organism="Artificial Sequence" <400> 114 atatttaaag cttatcccct gtgtgccttg gtggagttga ggaatgattt gtgtctggag 60 ggg 63 <210> 115 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(59) <223> /mol_type="unassigned DNA" /note="I935FME01ENGKQ" /organism="Artificial Sequence" <400> 115 atgaatgcag tttgtgtgcc ttggtggagt tggaaggagt gatttgcgtc tgggagggg 59 <210> 116 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(58) <223> /mol_type="unassigned DNA" /note="I935FME01A5DNG" /organism="Artificial Sequence" <400> 116 atgaatgcag tttgtgtgcc ttggtggagt tggaaggagt gatttgcgtc tgggaggg 58 <210> 117 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01C7OXZ" /organism="Artificial Sequence" <400> 117 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 118 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01DB053" /organism="Artificial Sequence" <400> 118 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 119 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01CU25R" /organism="Artificial Sequence" <400> 119 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 120 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01AJLKP" /organism="Artificial Sequence" <400> 120 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 121 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01B8P5R" /organism="Artificial Sequence" <400> 121 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 122 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01BSJKW" /organism="Artificial Sequence" <400> 122 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 123 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01DZ64B" /organism="Artificial Sequence" <400> 123 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 gaggg 65 <210> 124 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(49) <223> /mol_type="unassigned DNA" /note="I935FME01EPZFR" /organism="Artificial Sequence" <400> 124 atgaatgcag ttttggtgga gttggaagga gtgatttgcg tctggaggg 49 <210> 125 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(49) <223> /mol_type="unassigned DNA" /note="I935FME01ASAI7" /organism="Artificial Sequence" <400> 125 atgaatgcag ttttggtgga gttggaagga gtgatttgcg tctggaggg 49 <210> 126 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(50) <223> /mol_type="unassigned DNA" /note="I935FME01C80EK" /organism="Artificial Sequence" <400> 126 atgaatgcag ttttggtgga gttggaagga gtgatttgcg tctggagggg 50 <210> 127 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01CN455" /organism="Artificial Sequence" <400> 127 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 128 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01C304D" /organism="Artificial Sequence" <400> 128 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 129 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01CGQON" /organism="Artificial Sequence" <400> 129 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 130 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01EJQ9M" /organism="Artificial Sequence" <400> 130 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 131 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01D218C" /organism="Artificial Sequence" <400> 131 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 132 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01DCUU6" /organism="Artificial Sequence" <400> 132 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 133 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01AI0RD" /organism="Artificial Sequence" <400> 133 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 134 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01B6QGC" /organism="Artificial Sequence" <400> 134 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 135 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(66) <223> /mol_type="unassigned DNA" /note="I935FME01B6P77" /organism="Artificial Sequence" <400> 135 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat tttgcgtctg 60 gagggg 66 <210> 136 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01BRGZH" /organism="Artificial Sequence" <400> 136 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 137 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(65) <223> /mol_type="unassigned DNA" /note="I935FME01A2VKU" /organism="Artificial Sequence" <400> 137 atgaatgcag tttatcccct gtgtgccttg gtggagttgg aaggagtgat ttgcgtctgg 60 agggg 65 <210> 138 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(92) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01EBTDI" /organism="Artificial Sequence" <400> 138 gaagagggga gtgggaaggt agaggctgag tgatttaggt atttccaata atcaatagca 60 agaccactgt gagctgaata catcgggtta tc 92 <210> 139 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <220> <221> source <222> (1)..(89) <223> /mol_type="unassigned DNA" /note="IQ4WJ2H01DJ2RX" /organism="Artificial Sequence" <400> 139 gaagagggga gtgggaagtg aggctgagtg atttaggtat ttccataatc aatagcaaga 60 ccactgtgag ctgaatacat cgggttatc 89

Claims (18)

  1. 하기의 단계를 포함하는 DNA의 에러-프리 염기서열 분석(error-free sequencing) 방법:
    (a) DNA를 포함하는 분리된 샘플을 제공하는 단계;
    (b) 유사한 길이의 DNA 단편을 얻기 위해 적합한 조건에서 DNA를 제한 엔도뉴클레아제로 절단하는 단계로서,
    상기 제한 엔도뉴클레아제는 5' 오버행(overhangs)을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 인산화되는 것이거나, 또는
    상기 제한 엔도뉴클레아제는 3' 오버행(overhangs)을 제공할 수 있고, 상기 오버행의 말단 뉴클레오티드는 상기 DNA 단편에 수산화되는 것인 단계;
    (c) 제1 올리고뉴클레오티드를 상기 DNA 단편에 어닐링(annealing)하는 단계로서,
    상기 제1 올리고뉴클레오티드의 제1 서열은 상기 DNA 단편의 5' 또는 3' 오버행 각각에 상보적이고, 그리고 상기 제1 올리고뉴클레오티드의 제2 서열은 제2 올리고뉴클레오티드의 제1 서열과 상보적이고,
    상기 제2 올리고뉴클레오티드는 제2 및 제3 서열을 포함하고,
    상기 제2 올리고뉴클레오티드의 상기 제2 서열은 무작위 서열을 포함하는 것인 단계;
    (d) 상기 제2 올리고뉴클레오티드를 상기 DNA 단편에 라이게이션(ligation)하는 단계;
    (e) 생성된 오버행을 채우는(filling in) 단계;
    (f) 상기 제2 올리고뉴클레오티드의 상기 제3 서열과 결합하는 서열을 포함하는 제3 올리고뉴클레오티드를 사용하여 상기 DNA 단편을 증폭하는 단계; 및
    (g) 상기 증폭된 DNA 단편을 염기서열 분석하는 단계.
  2. 제1항에 있어서, 상기 제2 올리고뉴클레오티드는 부위-특이적 엔도뉴클레아제의 제한 부위를 포함하는 제4 서열을 더 포함하는 것인 방법.
  3. 제1항에 있어서, 상기 제2 올리고뉴클레오티드는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 또는 DNA 및 RNA를 부분적으로 포함하는 올리고뉴클레오티드인 것인 방법.
  4. 제1항에 있어서, 상기 방법은 단계 (e')를 더 포함하고, 상기 단계 (e')에서 엑소뉴클레아제를 첨가하는 것인 방법.
  5. 제4항에 있어서, 상기 엑소뉴클레아제는 단일 가닥 DNA, 단일 가닥 RNA, 또는 단일가닥 DNA 및 단일 가닥 RNA를 부분적으로 포함하는 분자를 분해하는 효소인 것인 방법.
  6. 제1항에 있어서, 상기 DNA는 (i) 단일 세포의 게놈(genome) 또는 전사체(transcriptome), (ii) 단일 세포의 염색체(들), (iii) 단일 세포의 엑소좀 또는 다른 마이크로베지클 유래 핵산, 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함하는 것인 방법.
  7. 제1항에 있어서, 상기 DNA는 (i) 하나 이상의 단일 세포의 DNA, (ii) 하나 이상의 단일 세포의 세포 유리 태아 DNA (cell-free fetal DNA), (iii) 암 환자들의 혈청 또는 혈장에서 하나 이상의 단일 세포의 세포 유리 DNA (cell-free DNA), 또는 (iv) 항목 (i) 내지 (iii) 중 어느 하나의 물질의 단편(들) 또는 소분획물(들)을 포함하는 것인 방법.
  8. 제1항에 있어서, 상기 제한 엔도뉴클레아제는 MseI 또는 이의 동일전달제한효소(isoschizomer)인 것인 방법.
  9. 제1항에 있어서, 상기 무작위 서열은 3 내지 24개의 뉴클레오티드를 포함하는 것인 방법.
  10. 제1항에 있어서, 상기 제1 올리고뉴클레오티드는 서열 5'-TAACTGACdd-3'를 가지고 및 상기 제2 올리고뉴클레오티드는 서열번호 1로 표시되는 서열을 가지고 및 상기 제3 올리고뉴클레오티드는 서열번호 2로 표시되는 서열을 가지는 것인 방법.
  11. 제1항에 있어서, 제1 올리고뉴클레오티드의 마지막 3' 뉴클레오티드는 dd-뉴클레오티드인 것인 방법.
  12. 제2항에 있어서, 상기 방법은 단계 (f')를 더 포함하고, 상기 단계 (f')에서 호밍 엔도뉴클레아제(homing endonuclease)를 첨가하는 것인 방법.
  13. 제1항 내지 제12항 중 어느 한 항의 방법에 따라 염기서열 분석된 DNA 단편(들)을 얻는 단계, 및
    상기 염기서열 분석된 DNA 단편(들)을 DNA 서열 분석, 세포 계통수(cell lineage trees)의 생성 또는 복제 수(copy numbers)의 측정에 사용하는 단계를 포함하는 염기서열 분석된 DNA 단편(들)을 사용하는 방법.
  14. 제13항에 있어서, 상기 DNA 서열 분석은 전체 게놈(genome) 염기서열 분석, 전체 엑솜(exome) 염기서열 분석, 전체 레귤롬(regulome) 염기서열 분석, 염기서열 분석-기반 메틸화 분석, 염기서열 분석-기반 브레이크포인트(breakpoint) 측정, ChIP 염기서열 분석, 또는 표적 염기서열 분석, 또는 이들의 변형인 것인 방법.
  15. 고정 서열(fixed sequence), 무작위 서열, 제한 뉴클레아제 인식 부위 및 제한 부위, 및 프라이머 결합 부위를 포함하는 올리고뉴클레오티드로서,
    상기 고정 서열은 6 내지 15개의 뉴클레오티드를 포함하고, 상기 무작위 서열은 3 내지 24개의 뉴클레오티드를 포함하며, 상기 제한 뉴클레아제 인식 부위는 호밍 엔도뉴클레아제(homing endonuclease)의 인식 부위이고, 상기 고정 서열은 GTCAGT를 포함하고, 상기 제한 뉴클레아제 인식 부위는 서열번호 3을 포함하고, 및 상기 프라이머 결합 부위는 서열번호 4를 포함하는 것인, 올리고뉴클레오티드.
  16. 삭제
  17. 제15항에 있어서, 상기 올리고뉴클레오티드는 서열번호 5 또는 12를 포함하는 것인 올리고뉴클레오티드.
  18. 제15항에 있어서, 상기 올리고뉴클레오티드는 서열번호 14를 포함하는 것인 올리고뉴클레오티드.
KR1020167017436A 2014-02-05 2015-02-05 Dna의 에러-프리 염기서열 분석 KR102313470B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14154044 2014-02-05
EP14154044.3 2014-02-05
PCT/EP2015/052436 WO2015118077A1 (en) 2014-02-05 2015-02-05 Error-free sequencing of dna

Publications (2)

Publication Number Publication Date
KR20160117419A KR20160117419A (ko) 2016-10-10
KR102313470B1 true KR102313470B1 (ko) 2021-10-18

Family

ID=50031274

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167017436A KR102313470B1 (ko) 2014-02-05 2015-02-05 Dna의 에러-프리 염기서열 분석

Country Status (9)

Country Link
US (1) US10273538B2 (ko)
EP (1) EP3102702B1 (ko)
JP (1) JP6767870B2 (ko)
KR (1) KR102313470B1 (ko)
CA (1) CA2931140C (ko)
DK (1) DK3102702T3 (ko)
ES (1) ES2730962T3 (ko)
MX (1) MX2016010100A (ko)
WO (1) WO2015118077A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017044609A1 (en) 2015-09-08 2017-03-16 Cold Spring Harbor Laboratory Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
EP3199641B1 (en) 2016-01-27 2021-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Means and methods for staging, typing and treating a cancerous disease
CA3030430A1 (en) 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
EP3431611A1 (en) 2017-07-21 2019-01-23 Menarini Silicon Biosystems S.p.A. Improved method and kit for the generation of dna libraries for massively parallel sequencing
US11584929B2 (en) 2018-01-12 2023-02-21 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
CN112243462A (zh) 2018-06-06 2021-01-19 加利福尼亚大学董事会 产生核酸文库的方法以及用于实践所述方法的组合物和试剂盒
EP4083278A4 (en) * 2019-11-15 2024-02-28 Kao Corporation METHOD FOR CREATING A SEQUENCING LIBRARY
JP7146839B2 (ja) * 2019-11-15 2022-10-04 花王株式会社 シーケンシング用ライブラリの調製方法
WO2022131150A1 (ja) * 2020-12-16 2022-06-23 国立研究開発法人物質・材料研究機構 ゲノム解析方法
CN115273978B (zh) * 2022-08-29 2023-04-07 西安交通大学 适用于多层谱系树的剪接表观遗传密码的获得方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007073171A2 (en) 2005-12-22 2007-06-28 Keygene N.V. Improved strategies for transcript profiling using high throughput sequencing technologies
WO2009126395A1 (en) 2008-04-11 2009-10-15 Transgenomic, Inc. Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
US5858671A (en) * 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
ES2172353T3 (es) 1998-09-18 2002-09-16 Micromet Ag Amplificacion del adn de una unica celula.
TWI316964B (ko) * 2000-10-30 2009-11-11 Takara Bio Inc
CN101273141B (zh) 2005-07-26 2013-03-27 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
WO2008001414A1 (fr) 2006-06-23 2008-01-03 Japan Tobacco Inc. Vecteur cosmide destiné à transformer une plante et son procédé d'utilisation
BRPI1007214A8 (pt) * 2009-01-30 2022-12-20 Oxford Nanopore Tech Ltd Adaptador para sequenciar ácidos nucleicos, par de adaptadores, kit, construto de ácido nucleico, e, métodos para preparar um adaptador, um construto de ácido nucleico, e um construto de dequência, e para sequenciar ácido nucleico de fita dupla.
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
EP2828218B9 (en) 2012-03-20 2021-04-07 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US9797004B2 (en) * 2012-06-12 2017-10-24 Syngenta Participations Ag Methods and compositions for determination of vector backbone in a nucleic acid sample
EP2877580B1 (en) * 2012-07-27 2019-01-30 City of Hope An mva vaccine for delivery of a ul128 complex and preventing cmv infection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007073171A2 (en) 2005-12-22 2007-06-28 Keygene N.V. Improved strategies for transcript profiling using high throughput sequencing technologies
WO2009126395A1 (en) 2008-04-11 2009-10-15 Transgenomic, Inc. Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Illumina, Inc. Pub. No. 770-2011-030 (2011.10.31.)*

Also Published As

Publication number Publication date
CA2931140C (en) 2022-08-30
WO2015118077A1 (en) 2015-08-13
DK3102702T3 (da) 2019-06-17
US20160348164A1 (en) 2016-12-01
KR20160117419A (ko) 2016-10-10
JP6767870B2 (ja) 2020-10-14
MX2016010100A (es) 2016-10-07
CA2931140A1 (en) 2015-08-13
EP3102702A1 (en) 2016-12-14
EP3102702B1 (en) 2019-04-03
JP2017509324A (ja) 2017-04-06
US10273538B2 (en) 2019-04-30
ES2730962T3 (es) 2019-11-13

Similar Documents

Publication Publication Date Title
KR102313470B1 (ko) Dna의 에러-프리 염기서열 분석
US10704091B2 (en) Genotyping by next-generation sequencing
JP6744917B2 (ja) バリアント検出のための方法
US20230392191A1 (en) Selective degradation of wild-type dna and enrichment of mutant alleles using nuclease
CN107109401B (zh) 使用crispr-cas系统的多核苷酸富集
US20230295701A1 (en) Polynucleotide enrichment and amplification using crispr-cas or argonaute systems
JP2024060054A (ja) ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法
US20210246498A9 (en) Human identification using a panel of snps
CN105189746A (zh) 用于使用耐热的错配内切核酸酶的方法
WO2016160823A1 (en) Methods of amplifying nucleic acids and compositions and kits for practicing the same
WO2023107453A1 (en) Method for combined genome methylation and variation analyses
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
CA3107052A1 (en) Methods and composition for targeted genomic analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right