KR20190140961A - 라이브러리 제작 및 서열 분석을 위한 조성물 및 방법 - Google Patents

라이브러리 제작 및 서열 분석을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20190140961A
KR20190140961A KR1020197033449A KR20197033449A KR20190140961A KR 20190140961 A KR20190140961 A KR 20190140961A KR 1020197033449 A KR1020197033449 A KR 1020197033449A KR 20197033449 A KR20197033449 A KR 20197033449A KR 20190140961 A KR20190140961 A KR 20190140961A
Authority
KR
South Korea
Prior art keywords
sequence
stranded
adapter
library
dna
Prior art date
Application number
KR1020197033449A
Other languages
English (en)
Other versions
KR102601593B1 (ko
Inventor
제프리 에이. 골
아타르바 고어
루이 리우
Original Assignee
싱글레라 제노믹스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 싱글레라 제노믹스, 인코포레이티드 filed Critical 싱글레라 제노믹스, 인코포레이티드
Publication of KR20190140961A publication Critical patent/KR20190140961A/ko
Application granted granted Critical
Publication of KR102601593B1 publication Critical patent/KR102601593B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Structural Engineering (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Sampling And Sample Adjustment (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Polyurethanes Or Polyureas (AREA)

Abstract

본 발명은 폴리뉴클레오티드 라이브러리의 제작 방법 및/또는 폴리뉴클레오티드 시퀀싱 방법에 관한 것이다. 관련 키트 및 장치들이 또한 개시되어 있다. 본 발명은 또한, 예를 들어, 폴리뉴클레오티드 시퀀싱에 의해 유전자 및 게놈 분석을 수행하기 위한 조성물, 키트, 장치, 및 방법에 관한 것이다. 특정 양상들에서, 본 발명은 시퀀싱 동안 개선된 연결 효율성 및 전환율을 가지는 라이브러리들을 제작하기 위한 조성물, 키트, 및 방법들을 제공한다. 특정 구체예들에서, 본 발명의 조성물, 키트, 및 방법들은 뉴클레오티드 단편들, 가령, 순환 종양 DNA를 비롯하여 대상체의 신체에서 순환하는 폴리뉴클레오티드 단편들을 분석함에 유용하다.

Description

라이브러리 제작 및 서열 분석을 위한 조성물 및 방법
관련 출원들에 대한 상호 참조
본 출원은 2017년 4월 19일 출원된 미국 가 특허출원 제 62/487,423호, 및 2018년 4월 13일 출원된 미국 가 특허출원 제 62/657,544호에 대한 우선권의 이익을 주장하며, 상기 두 출원의 내용은 본 명세서에 그 전문이 참고로 포함된다. 일부 양상에서 본 발명은 2017년 4월 19일 출원된 미국 가 특허출원 제 62/487,422호와 관련되며, 이 출원의 내용은 그 전문이 본 명세서에 참고로 포함된다.
기술 분야
본 발명은 예를 들어, 폴리뉴클레오티드 시퀀싱에 의해 유전자 및 게놈 분석을 수행하기 위한 조성물, 키트, 장치 및 방법들에 관한 것이다. 특정 양상들에서, 본 발명은 시퀀싱 동안 개선된 연결 효율성 및 전환율로 라이브러리를 제작하기 위한 조성물, 키트 및 방법들을 제공한다. 특정 구체예들에서, 본 발명의 조성물, 키트, 및 방법들은 폴리뉴클레오티드 단편, 가령, 순환하는 종양 DNA를 비롯한, 대상체의 신체 내에서 순환하는 폴리뉴클레오티드 단편을 분석함에 유용하다.
배경
하기에서, 배경 및 도입을 위해 특정 제품 및 방법들을 설명한다. 본 명세서에 포함된 어떤 것도 선행 기술임을 "인정"하는 것으로 해석되어서는 안된다. 출원인은, 적절한 경우, 본 명세서에서 언급된 제품 및 방법이 적용 가능한 법령에 따라 선행 기술을 구성하지 않는다는 것을 입증할 권리가 있다.
지난 몇 년에 걸쳐 라이브러리 제작이 몇 차례 개선되었지만 차세대 시퀀싱을 위한 라이브러리 제작 과정은 여전히 비효율적이며 다양한 단계에서 많은 원래의 분자가 소실된다. 이중 가닥 연결 효율성은 여전히 낮으며, -20-30%의 분자들이 적절하게 연결된다. 추가적으로, 많은 분자들은 정제 및 혼성화 포획 단계 중에 소실되므로, 최종 전환율은 대략 10-20%가 된다. 낮은 대립유전자 분율의 변이체, 예를 들어, 순환 종양 DNA (ctDNA)에서 발견되는 변이체를 조사할 때 민감도는 여전히 낮다. 이는 낮은 대립유전자 분율의 돌연변이체를 정의할 때 정확도를 제한하는데, 낮은 대립유전자 분율을 가진 라이브러리를 보았을 때 낮은 효율성은 민감도를 손실시키게 될 것이기 때문이다.
해당 분야의 상기 문제점을 해결하기 위한 개선된 분석 기술의 필요성이 존재한다. 본 발명은 이러한 그리고 그 외 관련 필요성을 해결한다.
간단한 요약
본 요약은 청구범위에 기재된 발명의 범위를 제한하기 위해 사용되도록 하고자 하는 것이 아니다. 청구범위에 기재된 발명의 다른 특징, 세부사항, 유틸리티 및 이점들은 첨부 도면 및 첨부된 청구범위에 개시된 양상들을 포함하여 상세한 설명으로부터 명백해질 것이다.
한 구체예에서, 본 발명은 단일-가닥 폴리뉴클레오티드들의 라이브러리에 한 세트의 어댑터를 연결시키는 것을 포함하는 방법을 제공한다. 한 양상에서, 상기 연결은 단일-가닥 DNA (ssDNA) 연결효소에 의하여 촉매된다. 또 다른 양상에서 각 단일-가닥 폴리뉴클레오티드는 5' 단부에서의 연결을 방지하기 위해 5' 단부에서 차단된다. 또 다른 양상에서, 각 어댑터는 어댑터가 연결되는 단일- 가닥 폴리뉴클레오티드를 결정하는 고유한 분자 식별자 (UMI) 서열을 포함한다. 한 다른 양상에서, 각 어댑터는 3' 단부에서의 연결을 방지하기 위해 3' 단부에서 차단된다. 한 양상에서, 어댑터의 5' 단부는 ssDNA 연결효소에 의해 단일-가닥 폴리뉴클레오티드의 3' 단부에 연결되어 선형 연결 생성물을 형성한다. 임의의 전술한 구체예들에서, 선형의, 단일-가닥 연결 생성물들의 라이브러리가 수득될 수 있다.
또 다른 구체예에서, 한 세트의 어댑터를 단일-가닥 폴리뉴클레오티드들의 라이브러리에 연결시키는 단계를 포함하는 방법이 제공되며, 이 방법에서, 연결은 단일-가닥 DNA (ssDNA) 연결효소에 의해 촉매되고, 각 단일-가닥 폴리뉴클레오티드는 5' 단부에서의 연결을 방지하기 위해 5' 단부에서 차단되고, 각 어댑터는 어댑터가 연결되는 단일-가닥 폴리뉴클레오티드를 결정하는 고유 분자 식별자 (UMI) 서열을 포함하고, 각 어댑터는 3' 단부에서의 연결을 방지하기 위하여 3' 단부에서 차단되고, 어댑터의 5' 단부는 ssDNA 연결효소에 의해 단일-가닥 폴리뉴클레오티드의 3' 단부에 연결되어 선형 연결 생성물을 형성함으로써, 선형의 단일-가닥 연결 생성물들의 라이브러리를 수득한다.
임의의 전술한 구체예들에서, 상기 방법은 연결 단계 이전에, 샘플로부터 단일-가닥 폴리뉴클레오티드들의 라이브러리를 수득하는 단계를 추가로 포함할 수 있다. 한 양상에서, 상기 수득 단계는 샘플로부터 이중-가닥 폴리뉴클레오티드를 변성시키는 단계를 포함한다.
임의의 전술한 구체예들에서, 샘플은 생물학적 샘플일 수 있다. 일부 구체예들에서, 생물학적 샘플은 어떠한 처리도 없이 대상체로부터 곧바로 수득된다. 일부 구체예들에서, 생물학적 샘플 내 폴리뉴클레오티드들은 바이설파이트 전환되지 않았다. 다른 구체예들에서, 생물학적 샘플 내 폴리뉴클레오티드들은 부분적으로 또는 완전히 바이설파이트 전환되었다. 특정 양상들에서, 생물학적 샘플은 질환 또는 병태, 가령, 암 또는 신생물을 보유하는 또는 보유할 것으로 의심되는 대상체로부터 얻는다.
임의의 전술한 구체예들에서, 단일-가닥 폴리뉴클레오티드는 순환 종양 DNA (ctDNA)를 포함하는 샘플, 가령, 혈액, 혈청, 혈장, 또는 체액 샘플, 또는 이의 임의의 조합으로부터 얻을 수 있다.
임의의 전술한 구체예들에서, 단일-가닥 폴리뉴클레오티드는 약 20 내지 약 400개 핵산 잔기 길이, 예를 들면, 약 80, 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 또는 약 240개 핵산 잔기 길이일 수 있다.
임의의 전술한 구체예들에서, ssDNA 연결효소는 테르무스 (thermus) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigaseTM 및 CircLigase IITM), 또는 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methanohacterium thermociutoirophicim) RNA 연결효소 1일 수 있다. 다른 양상들에서, ssDNA 연결효소는 RNA 연결효소, 가령, T4 RNA 연결효소, 예컨대, T4 RNA 연결효소 I, 예컨대, Mew England Biosciences, M0204S, T4 RNA 연결효소 2, 예컨대, New England Biosciences, M0239S, T4 RNA 연결효소 2 절두형, 예컨대, New England Biosciences, M0242S, T4 RNA 연결효소 2 절두형 KQ, 예컨대, M0373S, 또는 T4 RNA 연결효소 2 절두형 K227Q, 예컨대, New England Biosciences, M0351S이다. 임의의 전술한 구체예들에서, 키트는 또한 열안정성 5' App DNA/RNA 연결효소, 예컨대, New England Biosciences, M03I9S, 또는 T4 DNA 연결효소, 예컨대, New England Biosciences, M0202S를 포함할 수도 있다.
임의의 전술한 구체예들에서, 각 단일-가닥 폴리뉴클레오티드의 차단은 그 5' 단부에서 연결을 방지하기 위하여 탈인산화를 포함할 수 있다.
임의의 전술한 구체예들에서, 각 어댑터의 차단은 그 3' 단부에서의 연결을 방지하기 위하여 탄소 스페이서, ddCTF, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜, 및/또는 헥사에틸렌 글리콜을 포함할 수 있다.
임의의 전술한 구체예들에서, 각 어댑터는 5' 단부에 다이뉴클레오티드 서열, 가령, GA (5'→3'), GG (5'→3'), AA (5'→3'), 또는 AG (5'→3')를 포함할 수 있으며, 이는 UMI 서열에 대해 5' 이다.
임의의 전술한 구체예들에서, 각 어댑터에서 UMI 서열은 약 6 내지 약 15개 핵산 잔기 길이일 수 있는데, 예를 들면 UMI 서열은 12-량체이다.
임의의 전술한 구체예들에서, 연결 반응은 크라우딩제 존재하에 수행될 수 있다. 한 양상에서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000 또는 PEG 6000, 덱스트란, 및/또는 Ficoll을 포함한다.
임의의 전술한 구체예들에서, 상기 방법은 선형, 단일-가닥 연결 생성물들의 라이브러리를 선형, 이중-가닥 연결 생성물의 라이브러리로 전환시키는 단계를 추가로 포함할 수 있다. 한 양상에서, 이러한 전환은 프라이머 또는 한 세트의 프라이머들을 사용하며, 각각은 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 포함한다.
임의의 전술한 구체예들에서, 상기 방법은 선형, 이중-가닥 연결 생성물의 라이브러리를 증폭 및/또는 정제하는 단계를 추가로 포함할 수 있다. 한 양상에서, 상기 정제는 비드-기반이다. 또 다른 양상에서, 상기 정제는 크기 선택에 기반하며, 예를 들어, 상기 정제 단계는 약 50개 뉴클레오티드 내지 약 1000개 뉴클레오티드 길이의 폴리뉴클레오티드들을 선택적으로 정제하는데, 예를 들어, 약 40개 뉴클레오티드 길이의 어댑터들 (그리고 약 40bp의 프라이머-어댑터 이중나선들 및/또는 프라이머 이량체)이 또 다른 양상에서 제거되며, 정제는, 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는다. 한 양상에서, 정제는, 예를 들어, 가령, Zymo 또는 Qiagen사의 dsDNA 또는 ssDNA 정제 컬럼을 사용함에 의한 컬럼-기반이다.
임의의 전술한 구체예들에서, 본 발명의 방법은 선형, 이중-가닥 연결 생성물의 라이브러리를, 예컨대, 중합효소 연쇄 반응 (PCR)으로 증폭시켜, 표적 서열의 서열 정보를 포함하는 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리를 수득하는 단계를 추가로 포함할 수 있다. 한 양상에서 상기 방법은 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 프라이머 또는 한 세트의 프라이머를 사용하는 것을 포함한다. 또 다른 양상에서, 상기 방법은 표적 서열 (예컨대, EGFR 유전자 서열)에 결합가능한 프라이머를 사용하는 것을 추가로 포함한다.
임의의 전술한 구체예들에서, 상기 본 발명의 방법은 선형, 이중-가닥 연결 생성물들의 라이브러리를, 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 프라이머 또는 한 세트의 프라이머들, 표적 서열 (예컨대, EGFR 유전자 서열)에 혼성화가능한 프라이머를 사용하여, 예컨대, 중합효소 연쇄 반응 (PCR)에 의해 증폭시킴으로써, 표적 서열에 관한 서열 정보를 포함하는 선형, 이중-가닥 연결 생성물의 증폭된 라이브러리를 수득하는 단계를 포함할 수 있다.
임의의 전술한 구체예들에서, 표적-특이적 프라이머는 서열 번호: 4-1529로 구성된 그룹에서 선택된 하나 이상의 임의의 서열, 또는 이의 상보적 또는 실질적으로 상보적인 서열을 포함할 수 있다.
임의의 전술한 구체예들에서, 복수의 프라이머들이 사용될 수 있으며, 이들 각각은 표적 서열에 특이적인 서열을 포함하며 프라이머는 동일 또는 상이한 표적 서열들을 가진다. 한 양상에서, 복수의 프라이머는 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두, 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위 범위의 서열을 포함한다.
임의의 전술한 구체예들에서, 표적 서열의 서열 정보는 돌연변이, 단일 뉴클레오티드 다형태 (SNP), 복제수 변이 (CNY), 또는 후성 변화를 포함할 수 있다. 한 양상에서, 돌연변이는 점 돌연변이, 삽입, 결실, 역전, 절두, 융합, 증폭, 또는 이의 임의의 조합을 포함한다.
임의의 전술한 구체예들에서, 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리는 전체 게놈 라이브러리 이외의 라이브러리, 예를 들어, 간접 (semi- targeted) 게놈 라이브러리일 수 있다.
임의의 전술한 구체예들에서, 상기 방법은 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리를 정제하는 단계를 추가로 포함할 수 있다. 한 양상에서, 상기 정제는 비드-기반이다. 또 다른 양상에서, 정제는 크기 선택에 기반하는데, 예를 들어, 정제 단계는 약 150개 이상의 뉴클레오티드 길이의 폴리뉴클레오티드들을 선택적으로 정제한다.또 다른 양상에서, 정제는, 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는다. 한 양상에서, 한 양상에서, 정제는, 예를 들어, 가령, Zymo 또는 Qiagen사의 dsDNA 또는 ssDNA 정제 컬럼을 사용함에 의한 컬럼-기반이다.
임의의 전술한 구체예들에서, 상기 방법은 선형의, 이중-가닥 연결 생성물의 정제된 증폭 라이브러리를 시퀀싱하는 단계를 추가로 포함할 수 있다. 한 양상에서, 시퀀싱 단계는 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 각각의 선형, 이중-가닥 연결 생성물에 부착하는 단계를 포함한다. 한 특정 양상에서, 상기 부착 단계는 중합효소 연쇄 반응 (PCR)을 사용하여 실시된다.
임의의 전술한 구체예들에서, 시퀀싱의 전환율 (시퀀싱 리드를 유발하는 라이브러리 내 단일-가닥 폴리뉴클레오티드들의 백분율)은 최소한 약 40%, 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 또는 최소한 약 90%일 수 있다.
임의의 전술한 구체예들에서, 상기 방법은 대상체의 질환 또는 병태 진단 및/또는 예측, 치료에 대한 대상체의 반응성을 예측, 질환/병태 또는 치료에 대한 약리유전체학 마커를 식별, 및/또는 모집단을 유전 정보에 대해 스크리닝하기 위해 사용될 수 있으며, 한 양상에서 상기 질환 또는 병태는 암 또는 신생물이고, 치료는 암 또는 신생물 치료이다.
또 다른 양상에서, 본 발명은 임의의 전술한 구체예들의 방법에 의해 생성된 선형, 단일-가닥 연결 생성물의 라이브러리를 개시한다.
또 다른 양상에서, 본 발명은 임의의 전술한 구체예들의 방법에 의해 생성된 선형, 이중-가닥 연결 생성물의 라이브러리를 개시한다.
또 다른 양상에서, 본 발명은 임의의 전술한 구체예들의 방법에 의해 생성된 선형, 이중-가닥 연결 생성물의 증폭된 라이브러리를 개시한다.
한 다른 양상에서, 본 발명은 임의의 전술한 구체예들의 방법에 의해 생성된 시퀀싱 라이브러리를 개시한다.
또 다른 양상에서 본 발명은 연결 생성물의 라이브러리를 제작하기 위한 키트를 개시한다. 한 구체예에서, 상기 키트는 단일-가닥 DNA (ssDNA) 연결효소를 포함한다. 또 다른 양상에서, 상기 키트는 복수의 어댑터를 포함한다. 특정 양상들에서, 각 어댑터는 3' 단부에서 연결을 방지하기 위하여 차단되는 반면 어댑터의 5' 단부는 단일-가닥 폴리뉴클레오티드에 연결 가능하여 선형, 단일-가닥 연결 생성물을 형성한다. 또 다른 특정 양상들에서, 각 어댑터는 단일-가닥 폴리뉴클레오티드를 결정하는 고유 분자 식별자 (UMI) 서열을 포함한다.
임의의 전술한 구체예들에서, 연결 생성물의 라이브러리 제작용 키트는 ssDNA 연결효소 및 복수의 어댑터를 포함할 수 있으며, 각 어댑터는 3' 단부에서 연결을 방지하기 위해 차단되는 반면 어댑터의 5' 단부는 단일-가닥 폴리뉴클레오티드에 연결 가능하여 선형, 단일-가닥 연결 생성물을 형성하고, 그리고 각 어댑터는 단일-가닥 폴리뉴클레오티드를 결정하는 UMI 서열을 포함한다.
임의의 전술한 구체예들에서, 상기 키트는 단일-가닥 폴리뉴클레오티드를 얻기 위해 샘플로부터의 이중-가닥 폴리뉴클레오티드를 변성시키는 변성화 시약을 추가로 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 테르무스 (thermus) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigase™및 CircLigase II™) 또는 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methcmobacterium thermoauiotrophicum) RNA 연결효소 1을 포함할 수 있다. 임의의 전술한 구체예들에서, 상기 키트는 RNA 연결효소, 가령, T4 RNA 연결효소, 예컨대, T4 RNA 연결효소 I, 예컨대, New England Biosciences, M0204S, T4 RNA 연결효소 2, 예컨대, New England Biosciences, M0239S, T4 RNA 연결효소 2 절두형, 예컨대, New England Biosciences, M0242S, T4 RNA 연결효소 2 절두형 KQ, 예컨대, M0373S, 또는 T4 RNA 연결효소 2 절두형 K227Q, 예컨대, New England Biosciences, M0351S를 포함할 수 있다. 임의의 전술한 구체예들에서, 키트는 또한 열안정성 5' App DNA/RNA 연결효소, 예컨대, New England Biosciences, M03I9S, 또는 T4 DNA 연결효소, 예컨대, New England Biosciences, M0202S를 포함할 수도 있다.
임의의 전술한 구체예들에서, 상기 키트는 단일-가닥 폴리뉴클레오티드의 4' 포스페이트기를 제거하기 위한 탈인산화 시약을 추가로 포함할 수 있다. 임의의 전술한 구체예들에서, 각 어댑터의 차단은 그 3' 단부에서 연결을 방지하기 위하여 탄소 스페이서, ddCTP, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜, 및/또는 헥사에틸렌 글리콜을 포함할 수 있다. 상기 키트에 관한 임의의 전술한 구체예들에서, 각 어댑터는 5' 단부에 다이뉴클레오티드 서열, 가령, GA (5'→3'), GG (5'→3'), AA (5'→3'), 또는 AG (5'→3')를 포함할 수 있다. 임의의 전술한 구체예들에서, 각 어댑터에서 UMI 서열은 약 6 내지 약 15개 핵산 잔기 길이일 수 있는데, 예를 들면 UMI 서열은 12-량체이다.
임의의 전술한 구체예들에서, 상기 키트는 연결 반응을 위한 크라우딩제를 추가로 포함할 수 있다. 한 양상에서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000 또는 PEG 6000, 덱스트란, 및/또는 Ficoll을 포함한다.
임의의 전술한 구체예들에서, 상기 키트는 단일-가닥 폴리뉴클레오티드를 이중-가닥 폴리뉴클레오티드로 전환시키기 위해 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 프라이머 또는 한 세트의 프라이머들을 추가로 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 프라이머 이량체 및/또는 프라이머-어댑터 이중나선을 제거하기 위한 시약을 추가로 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 표적 서열의 서열 정보를 포함하는 증폭된 선형, 이중-가닥 연결 생성물을 수득하기 위하여 표적 서열 (예컨대, EGFR 유전자 서열)에 특이적인 서열을 포함하는 프라이머를 추가로 포함할 수 있다. 임의의 전술한 구체예들에서, 표적-특이적 프라이머는 서열 번호: 4-1529로 구성된 그룹에서 선택된 하나 이상의 임의의 서열, 또는 이의 상보적인 또는 실질적으로 상보적인 서열을 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 표적 서열에 특이적인 서열을 각각 포함하는 복수의 프라이머들을 포함할 수 있으며, 이 때 프라이머들은 동일 또는 상이한 표적 서열들을 가진다. 한 양상에서, 복수의 프라이머는 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두, 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위 범위의 서열을 포함한다.
임의의 전술한 구체예들에서, 상기 키트는 증폭된 선형, 이중-가닥 연결 생성물을 시퀀싱하기 위한, 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 추가로 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 각 구성성분을 위한 개별 바이얼들 및/또는 이러한 구성성분들의 사용에 관한 설명서들을 추가로 포함할 수 있다. 한 양상에서, 상기 설명서들은 순환 종양 DNA (etDNA)를 포함하는 샘플, 가령, 혈액, 혈청, 혈장, 또는 체액 샘플 또는 이의 임의의 조합으로부터 단일-가닥 폴리뉴클레오티드를 수득하는 것을 포함한다.
또한 본 발명은 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 1)를 포함하는 폴리뉴클레오티드 또는 이의 일부, 예컨대, 약 18 내지 22개 뉴클레오티드 잔기를 포함하는 일부를 개시한다.
한 양상에서, 본 발명은 N1 . . . N i KAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG를 포함하는 폴리뉴클레오티드 또는 이의 일부를 개시하며, 이 때 N 1 내지 N i 는 임의의 핵산 잔기, 예를 들어, A, T, C, 또는 G이고, i는 약 4 내지 약 25의 정수이다.
또 다른 양상에서, 본 발명은 GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 2)를 포함하는 폴리뉴클레오티드 또는 이의 일부, 예컨대, 약 32 내지 36개 뉴클레오티드 잔기를 포함하는 일부를 개시하며, 이 때 N은 임의의 핵산 잔기, 예를 들어, A, T, C, 또는 G이다.
한 양상에서, 본 발명은 CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 폴리뉴클레오티드 또는 이의 일부; 예컨대, 약 12 내지 20개 뉴클레오티드 잔기를 포함하는 일부를 개시한다.
한 다른 양상에서, 본 발명은 서열 번호: 4-1529로 구성된 그룹에서 선택된 임의의 하나 이상의 서열들을 포함하는 프라이머이다. 한 양상에서, 본 발명은 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두, 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위범위의 서열을 포함하는 프라이머 세트를 개시한다. 한 양상에서, 본 발명은 서열 번호: 4-1529, 또는 이의 상보적인 또는 실질적으로 상보적인 서열을 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두; 또는 이의 수치 범위 또는 하위범위의 서열, 그리고 CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 프라이머 또는 이의 일부를 포함하는 프라이머 세트를 개시한다. 한 다른 양상에서, 본 발명은 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두; 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위범위의 서열, CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 프라이머 또는 이의 일부 및/또는 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 1)를 포함하는 폴리뉴클레오티드 또는 이의 일부를 포함하는 키트를 개시한다.
도면의 간단한 설명
도 1은 본 발명의 한 양상에 따라 단일-가닥 폴리뉴클레오티드 라이브러리를 제작하고 이러한 라이브러리를 사용하여 시퀀싱을 수행하는 단계들을 보여준다.
도 2는 본 발명의 한 양상에 따른, 표적 분자를 포함하는, 시퀀싱하기 위한 구조체를 보여준다.
도 3은 본 발명에 개시된 방법을 사용하여 예상된 대립유전자 분율과 관찰된 대립유전자 분율 사이의 선형 상관을 보여주며, 이는 상기 방법이 큰 재현성을 가짐을 나타낸다.
도 4는 본 발명에 개시된 방법을 사용하여 오류-보정 전과 후 대립유전자 분율들을 다수의 변수들에 대하여 비교한다.
도 5는 라이브러리 제작 및 시퀀싱을 위한 종래의 혼성화 포획법과 본 발명에 개시된 방법의 수행 파라미터들을 비교한다.
도 6은 종래의 혼성화 포획법과 본 발명에 개시된 방법 (Titan Seq)의 전환율을 비교한다.
도 7은 추가적인 예시 프라이머(들) 또는 프라이머 풀(들)을 보여준다.
상세한 설명
본 발명의 완전한 이해를 제공하기 위하여 많은 구체적인 상세한 내용들을 하기 설명에 제시한다. 이러한 상세한 내용은 예시를 위해 제공되며 청구범위의 발명은 이러한 구체적인 상세한 내용의 일부 또는 전부 없이 청구범위에 따라 실시될 수 있다. 청구범위에 기재된 주제의 범위를 벗어나지 않고 다른 구체예들이 사용될수 있으며 구조적 변화들이 이루어질 수 있음을 이해하여야 한다. 하나 이상의 개개 구체예들에 기재된 다양한 특징 및 기능은 이들이 기재된 특정 구체예에 대한 적용가능성에 제한되지 않는다는 것을 이해하여야 한다. 대신 이들은, 이러한 구체예들이 기재되어 있는지 여부에 관계없이, 그리고 이러한 특징들이 기재된 구체예의 일부인 것으로 제시되었는지 여부에 관계없이 단독으로 또는 일부 조합으로, 본 발명의 다른 구체예들 중 하나 이상에 적용될 수 있다. 명확히 하기 위하여, 청구범위의 주제와 관련된 해당 기술 분야에 공지된 기술 재료는 청구범위의 주제가 불필요하게 모호해지지 않도록 상세히 기재하지 않았다.
본 명세서에서 언급된 특허 문헌, 과학 논문 및 데이터베이스를 포함한 모든 간행물은 각각의 개개 간행물이 개별적으로 참고로 포함된 것과 동일한 정도로 모든 목적을 위해 그 전문이 참고로 포함된다. 간행물 또는 문서의 인용은 그 중 어느 것도 해당 분야의 선행 기술임을 인정하는 것이 아니며 상기 인용이 이러한 간행물 또는 문서의 내용이나 날짜에 관한 어떠한 인정도 구성하는 것이 아니다.
모든 표제는 독자의 편의를 위한 것이며, 구체적으로 명시되지 않는 한 표제에 수반되는 내용의 의미를 제한하기 위해 사용되지 않아야 한다.
제공된 구체예들의 실시는, 달리 나타나있지 않은 한, 유기 화학, 중합체 기술, 분자 생물학 (재조합 기술 포함), 세포 생물학, 생화학, 및 시퀀싱 기술에 관한 종래 기술 및 설명을 이용할 것이며, 이는 해당 기술을 실시하는 숙련된 기술자의 능력 범위에 속한다. 이러한 종래의 기술은 폴리펩티드 및 단백질 합성 및 변형, 폴리뉴클레오티드 합성 및 변형, 중합체 어레이 합성, 폴리뉴클레오티드의 혼성화 및 연결, 혼성화의 탐지 및 뉴클레오티드 시퀀싱을 포함한다. 적합한 기술들은 본 발명의 실시예를 참고하여 구체적으로 설명될 수 있다. 그런, 다른 균등한 종래의 절차들, 또한 사용될 수 있다. 이러한 종래의 기술 및 설명은 표준 실험 매뉴얼, 가령, Green, 외, Eds., Genome Analysis: A Laboratory Manual Series (Vols. I-IV) (1999); Werner, Gabriel, Stephens, Eds., Genetic Variation: A Laboratory Manual (2007); Dieffenbach, Dveksler, Eds.. PCR Primer: J Laboratory Manual (2003), Bowtell and Sambrook, DNA Microarrays: A Molecular Cloning Manual (2003); Mount, Bioinformatics: Sequence and Genome Analysis (2004); Sambrook and Russell, Condensed Protocols from Molecular Cloning: J Laboratory Manual (2006), and Sambrook and Russell, Molecular Cloning: A Laboratory Manual (2002) (모두 Cold Spring Harbor Laboratory Press 사), Austibel eds., Current Protocols in Molecular Biology (1987); T. Brown ed.. Essential Molecular Biology (1991), IRL Press; Goeddel ed., Gene Expression Technology (1991), Academic Press; A. Bothweil eds.. Methods for Cloning and Analysis o/ Eukaryonc Genes (1990), Harriett Publ.; M. Kiiegler, Gene Transfer and Expression (1990), Stockton Press, R. Wu eds., Recombinant UNA Methodology (1989), Academic Press, M. MePherson 외 y PCR A Practical Approach (1991), IRE Press at Oxford University Press: Stryer, Biochemistry (4th Ed.) (1995), W. H Freeman, New York N.Y.; Gait, Oligonucleotide Synthesis: A Practical Approach (2002), IRi, Press, London; Nelson and Cox, Lehninger, Principles of Biochemistry (2000) 3rd Ed, W. H. Freeman Pub., New York, N.Y.: Berg, 외, Biochemistry (2002) 5th Ed., W. H. Freeman Pub., New York, N.Y.에서 찾을 수 있으며, 이들 모두는 본 명세서에 그 전문이 참고로 포함된다.
A. 정의
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 해당 분야의 기술자에 의해 일반적으로 이해되는 바와 같은 동일한 의미를 가진다. 본 섹션에서 설명되는 정의가 본 명세서에 참고로 포함되는 특허, 출원, 공개된 출원 및 다른 간행물들에서 설명된 정의와 모순되거나 다른 방식으로 불일치 하는 경우, 본 섹션에서 설명된 정의가 본 명세서에 참고로 포함되는 정의에 우선한다.
본 명세서에서 사용되는 "하나 (a 또는 an)"는 "최소한 하나" 또는 "하나 이상"을 의미한다. 본 명세서에서 사용되는 단수형 "하나 (a, an)" 및 "그것"은 해당 내용에서 명확하게 달리 기재되어 있지 않은 한 복수 지칭을 포함한다.
본 명세서 전반에 걸쳐, 청구범위에 기재된 주제의 다양한 양상들이 범위 형식으로 제시된다. 범위 형식의 기재는 단지 편의 및 간결성을 위한 것으로 이해되어야 하며 청구범위에 기재된 주제의 범위에 대한 변경할 수 없는 제한으로 해석되어서는 안된다. 따라서 범위의 기재는 그 범위에 속하는 개개 수치값들 뿐만 아니라 모든 가능한 하위범위들이 명시적으로 개시된 것으로 고려되어야 한다. 예를 들면, 일정 수치 범위가 제공되는 경우, 상기 범위의 상한과 하한 사이의 각 중간 수치 그리고 상기 언급된 범위 내의 그 외 다른 임의의 언급된 또는 중간 수치가 청구범위의 주제에 포함됨을 이해하여야 한다. 이러한 보다 작은 범위들의 상한과 하한은 독립적으로 보다 작은 범위들에 포함될 수 있으며, 또한 언급된 범위에서 명시적으로 제외되는 한도를 조건으로 청구범위에 기재된 주제에 포함된다. 언급된 범위가 한도값 중 하나 또는 둘 모두를 포함하는 경우, 포함되는 이들 한도값들 중 하나 또는 둘 모두를 제외한 범위 또한 청구범위에 기재된 주제에 포함된다. 이는 범위의 폭에 관계없이 적용된다.
본 명세서의 값 또는 파라미터에 대한 "약(about)"의 지칭은 그 값 또는 파라미터 그 자체(per se)를 나타내는 변화를 포함 (및 설명)한다. 예를 들면, "약 X"를 지칭하는 기재는 "X"의 기재를 포함한다. 또한, 일련의 숫자들 앞에 "약"을 사용하는 것은 언급된 일련의 숫자들 각각 "약"을 포함한다. 예를 들면, "약 X, Y, 또는 Z"를 지칭하는 기재는 "약 X, 약 Y, 또는 약 Z"를 기재하고자 하는 것이다.
본 명세서에서 사용되는 용어 "평균"은, 내용에서 달리 명확히 나타나지 않는 한, 평균 또는 중앙값 중 하나, 또는 평균 또는 중앙값을 어림하기 위하여 사용되는 임의의 값을 지칭한다.
본 명세서에서 사용되는 "대상체"는 제공된 조성물, 방법, 키트, 장치 및 시스템이 투여되거나 적용될 수 있는 유기체 또는 유기체의 일부 또는 성분을 지칭한다. 예를 들면, 대상체는 포유동물 또는 세포, 조직, 장기 또는 포유동물의 일부 일 수 있다. 본 명세서에서 사용되는 "포유동물"은 임의의 포유동물 종 분류, 바람직하게는 인간 (인간, 인간 대상체 또는 인간 환자 포함)을 지칭한다. 포유동물들에는, 농장 동물, 경기 동물, 애완동물, 영장류, 말, 개, 고양이, 및 설치류, 가령, 생쥐 및 쥐가 포함되나 이에 제한되는 것은 아니다.
본 명세서에서 사용되는 용어 "샘플"은 생물학적 샘플을 포함하여, 분석을 원하는 표적 분자를 내포할 수 있는 어떤 것을 지칭한다. 본 명세서에서 사용되는 "생물학적 샘플"은 살아있는 또는 바이러스 (또는 프리온) 출처 또는 거대분자 및 생물분자의 다른 출처로부터 수득된 임의의 샘플을 지칭 할 수 있고, 이로부터 핵산, 단백질 및/또는 다른 거대분자를 수득할 수 있는 대상체의 임의의 세포 유형 또는 조직을 포함한다. 상기 생물학적 샘플은 생물학적 출처로부터 직접 수득한 샘플 또는 가공된 샘플일 수 있다. 예를 들면, 중폭된 단리된 핵산은 생물학적 샘플을 구성한다. 생물학적 샘플은 체액, 가령, 혈액, 혈장, 혈청, 뇌척수액, 활액, 소변, 땀, 정액, 대변, 가래, 눈물, 점액, 양수 등, 삼출액, 골수 샘플, 복수, 골반 세척액, 흉막액, 척수액, 림프, 안구액, 비강 추출물, 목구멍 또는 생식기 면봉표본, 소화된 조직의 세포 현탁액 또는 분변 물질 추출물, 그리고 동물 및 식물의 조직 및 장기 샘플 그리고 이로부터 유래한 가공된 샘플을 포함하지만, 이에 제한되는 것은 아니다.
용어 '폴리뉴클레오티드", "올리고뉴클레오티드", "핵산" 및 "핵산 분자"는 본 명세서에서 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭하기 위해 호환적으로 사용되며, 리보뉴클레오티드, 데옥시리보뉴클레오티드, 및 이의 유사체 또는 혼합물을 포함한다. 이 용어는 삼중-, 이중- 및 단일-가닥 데옥시리보핵산 ("DNA"), 뿐만 아니라, 삼중-, 이중- 및 단일-가닥 리보핵산 ("RNA")을 포함한다. 이는 또한, 예를 들어, 알킬화에 의해, 및/또는 캡핑에 의해 변형된, 그리고 비변형된 형태의 폴리뉴클레오티드를 포함한다. 더욱 특히, 용어 "폴리뉴클레오티드", "올리고뉴클레오티드", "핵산", 및 "핵산 분자"는 폴리데옥시리보뉴클레오티드 (2-데옥시-D-리보오스를 내포), 스플라이싱 여부에 관계없이 tRNA, rRNA, hRNA, 및 mRNA를 비롯한 폴리리보뉴클레오티드 (D-리보오스를 내포), 퓨린 또는 피리미딘 염기의 N- 또는 C-글리코시드인 임의의 다른 유형의 폴리뉴클레오티드, 그리고 비뉴클레오티드 골격를 내포하는 다른 중합체, 예를 들어, 폴리아마이드 (예컨대, 펩티드 핵산 ("FNAs")) 및 폴리모르폴리노 (OR주 Corvallis의 Anti-Virals, Inc.사로부터 Neugene으로 상업적으로 구입가능) 중합체, 및 다른 합성 서열-특이적 핵산 중합체를 포함하며, 이 때 중합체들은, 해당 구조에 핵염기들을 내포하며, 이러한 구조는 가령, DNA 및 RNA에서 나타나는 염기 페어링 및 염기 적층 (base stacking)을 가능하게 한다. 그러므로 이들 용어들은, 예를 들어, 3'-데옥시-2',5'-DNA, 올리고데옥시리보뉴클레오티드 N3' → P5' 포스포라미데이트, 2'-O-알킬-치환된 RNA, DNA와 RNA 간 또는 PNA와 DNA 또는 RNA 간의 하이브리드를 포함하고, 또한 공지된 유형의 변형들, 예를 들어, 표지, 알킬화, "캡", 하나 이상의 뉴클레오티드의 유사체로의 치환, 뉴클레오티드 간 변형, 가령, 예를 들어, 하전되지 않은 링키지 (예컨대, 메틸 포스포네이트, 포스포트라이에스터, 포스포라미데이트, 카바메이트, 등), 음으로 하전된 링키지 (예컨대, 포스포로싸이오에이트, 포스포로다이싸이오에이트, 등), 및 양으로 하전된 링키지 (예컨대, 아미노알킬포스포라미데이트, 아미노알킬포스포트라이에스터)를 보유한 변형, 부속 모이어티들, 가령, 예를 들어, 단백질 (효소 (예컨대 핵산분해효소), 독소, 항체, 신호 펩티드, 폴리-L-리신, 등을 포함)을 내포하는 변형, 인터칼레이터 (예컨대, 아크리딘, 솔라렌, 등)을 보유한 변형, 킬레이트 ( 예컨대 금속, 방사성 금속, 붕소, 산화성 금속, 등)를 내포하는 변형, 알킬화제를 내포하는 변형, 변형된 링키지를 보유한 변형 (예컨대, 알파 아노머 핵산, 등), 뿐만 아니라 폴리뉴클레오티드 또는 올리고뉴클레오티드의 비변형된 형태들을 포함한다. 핵산은 일반적으로 포스포다이에스터 결합을 내포할 것이나, 일부 경우에서 다른 골격, 가령, 포스포라미다이트, 포스포로다이싸이오에이트, 또는 메틸포스포로아미다이트 링키지; 또는 펩티드 핵산 골격 및 링키지를 가지는 핵산 유사체들이 포함될 수 있다. 다른 유사체 핵산들은 잠금 핵산, 양성 골격, 비-이온성 골격 및 비-리보오스 골격을 포함한 바이사이클릭 구조를 가진 핵산들을 포함한다. 분자들의 안정성을 증가시키기 위해 리보오스-포스페이트 골격의 변형이 이루어질 수 있으며: 예를 들어, PNA:DNA 하이브리드는 일부 환경에서 보다 높은 안정성을 나타낼 수 있다. 용어 "폴리뉴클레오티드", "올리고뉴클레오티드", "핵산" 및 "핵산 분자"는 임의의 적합한 길이, 가령, 최소한 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 1,000개 또는 그 이상의 뉴클레오티드를 포함할 수 있다.
본 명세서에서 사용되는 용어 "뉴클레오시드" 및 "뉴클레오티드"는 공지된 퓨린 및 피리미딘 염기 뿐만 아니라, 변형되어 있는 다른 헤테로사이클릭 염기를 내포하는 모이어티들을 포함함이 이해될 것이다. 이러한 변형들은 메틸화 퓨린 또는 피리미딘, 아실화 퓨린 또는 피리미딘, 또는 그 외 헤테로사이클을 포함한다. 변형된 뉴클레오시드 또는 뉴클레오티드는 또한 당 모이어티 상에 변형들을 포함하며, 예컨대, 하나 이상의 하이드록실기들은 할로겐, 지방족 그룹으로 대체되거나, 또는 에터, 아민 등으로 작용기화된다. 용어 "뉴클레오티드 단위"는 뉴클레오시드 및 뉴클레오티드를 포함하는 것으로 한다.
용어 "상보적인" 및 "실질적으로 상보적인"은 뉴클레오티드들 또는 핵산들 사이, 예를 들어, 이중-가닥 DMA 분자의 2개 가닥들 사이 또는 단일-가닥 핵산 상의 올리고뉴클레오티드 프라이머와 프라이머 결합 부위 사이의 혼성화 또는 염기 페어링 또는 이중나선의 형성을 포함한다. 상보적인 뉴클레오티드들은, 일반적으로, A와 T (또는 A와 U), 또는 C와 G이다. 2개 단일-가닥 RNA 또는 DNA 분자들은, 한 가닥의 뉴클레오티드가, 최적으로 정렬되고 비교되며 적절한 뉴클레오티드 삽입 또는 결실을 가지며, 다른 가닥의 최소한 약 80%, 통상적으로 최소한 약 90% 내지 약 95% 그리고 심지어 약 98% 내지 약 100%와 페어링 하는 경우, 실질적으로 상보적이라고 일컬어진다. 한 양상에서, 2개의 상보적인 뉴클레오티드 서열들은 25% 미만으로, 더욱 바람직하게는 15% 미만으로, 더더욱 바람직하게는 5% 미만으로, 가장 바람직하게는 대면하는 뉴클레오티드들 간에 미스매치가 없이 혼성화할 수 있다. 바람직하게는 상기 2개 분자들은 높은 엄격성 조건하에서 혼성화할 것이다.
기준 서열에 있어서, 본 명세서에서 사용되는 역 상보적 서열은 기준 서열에 대해 역 순서로 상보적인 서열이다. 예를 들면, 5'-ATCG-3'에 있어서, 상보적 서열은 3'-TAGC-5'이고, 역방향-상보적 서열은 5'-CGAT-3'이다.
본 명세서에서 사용되는 "혼성화"는 2개 단일-가닥 폴리뉴클레오티드들이 비-공유적으로 결합하여 안정한 이중-가닥 폴리뉴클레오티드를 형성하는 과정을 지칭할 수 있다. 한 양상에서, 생성되는 이중-가닥 폴리뉴클레오티드는 "하이브리드" 또는 "이중나선"일 수 있다. "혼성화 조건"은 전형적으로 대략 1 M 미만, 종종 약 500 mM 미만의 염 농도를 포함하며 약 200 mM 미만일 수 있다. "혼성화 완충액"은 완충된 염 용액, 가령, 5% SSPE, 또는 해당 분야에 공지된 이러한 다른 완충액을 포함한다.혼성화 온도는 5℃ 만큼 낮을 수 있으나, 전형적으로 22℃ 보다 높으며, 더욱 전형적으로 약 30℃ 보다 높고, 그리고 전형적으로 37℃ 이상이다. 혼성화는 종종 엄격한 조건, 즉, 서열이 그 표적 서열에는 혼성화하지만 그 외 다른 비-상보적 서열에는 혼성화하지 않는 조건하에서 실시된다. 엄격한 조건은 서열-의존성이며 상이한 환경에서 상이하다. 예를 들면, 보다 긴 단편은 특이적 혼성화에 있어서 짧은 단편 보다 더 높은 혼성화 온도를 필요로 할 수 있다. 상보적 가닥들의 염기 조성 및 길이, 유기 용매의 존재, 및 염기 미스매칭의 정도를 비롯한 다른 요인들이 혼성화의 엄격성에 영향을 줄 있기 때문에, 파라미터들의 조합은 어느 하나의 파라미터만의 절대 측정보다 더욱 중요하다. 일반적으로 엄격한 조건은 특정 서열에 있어서 정의된 이온 강도 및 pH에서 T m 보다 약 5℃ 더 낮도록 선택된다. 용융 온도 T m 은 이중-가닥 핵산 분자들의 모집단이 단일 가닥들로 절반정도 분해되는 온도일 수 있다. 핵산의 T m 을 계산하는 몇 가지 방정식들이 해당 분야에 공지되어 있다. 표준 참고문헌들에 나타나 있는 바와 같이, T m 값의 간단한 추정값은 방정식, T m =81.5 + 0.41 (%G+C)로 계산될 수 있으며, 이 때 핵산은 1 M NaCl의 수용액 중에 존재한다 (예컨대, Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985) 참고). 다른 참고문헌들 (예컨대, Allawi and SantaLucia, Jr., Biochemistry, 36:10581-94 (1997))은 대안적인 컴퓨터처리 방법들을 포함하며, 이러한 방법들은 T m 의 계산에 구조 및 환경, 뿐만 아니라 서열 특성들을 고려한다.
일반적으로, 하이브리드의 안정성은 이온 농도 및 온도의 함수이다. 전형적으로, 혼성화 반응은 보다 낮은 엄격성 조건하에서 실시되고, 이후 보다 높은 다양한 엄격성의 세척이 이어진다. 예시적인 엄격한 조건들에는, 약 7.0 내지 약 8.3의 pH 및 최소한 25℃의 온도에서 최소한 0.01 M 내지 1 M 이하의 나트륨 이온 농도 (또는 다른 염)의 염 농도를 포함한다. 예를 들면, 5 X SSPE (pH 7.4에서 750 mM NaCl, 50 mM 소듐 포스페이트, 5 mM EDTA) 및 대략 30℃의 온도 조건이 대립유전자-특이적 혼성화에 적합하지만, 적합한 온도는 혼성화되는 부위의 길이 및/또는 GC 함량에 따라 달라진다. 한 양상에서, 미스매치 백분율을 결정함에 있어서 "혼성화의 엄격성"은 다음과 같을 수 있다: 1) 높은 엄격성: 0 1 X SSPE, 0 1% SDS, 65℃; 2) 중간 엄격성: 0.2 x SSPE, 0.1% SDS, 50℃ (보통 엄격성으로도 지칭됨); 및 3) 낮은 엄격성: 1.0 X SSPE, 0.1% SDS, 50℃. 다른 완충액, 염 및 온도를 사용하여 균등한 엄격성이 구현될 수 있음이 이해된다. 예를 들면, 중간 엄격성 혼성화는 핵산 분자, 가령, 프로브가 상보적 핵산 분자에 결합할 수 있게 하는 조건들을 지칭할 수 있다. 혼성화된 핵산 분자들은 일반적으로 예를 들어 최소한 70%, 75%, 80%, 85%, 90%, 또는 95%의 동일성을 비롯하여 최소한 60% 동일성을 가진다. 중간 엄격성 조건들은 42℃에서 50% 포름아마이드, 5 / Denhardt 용액, 5 X SSPE, 0.2% SDS, 이어서 42℃에서 0 2 x SSPE, 0.2% SDS에서 세척이 수반되는 혼성화와 균등한 조건일 수 있다. 높은 엄격성 조건은, 예를 들어, 42℃에서 50% 포름아마이드, 5 X Denhardt 용액, 5 x SSPE, 0,2% SDS, 이어서 65℃에서 0.1 X SSPE, 및 0.1 % SDS에서의 세척이 수반되는 혼성화에 의해 제공될 수 있다. 낮은 엄격성 혼성화는 22℃에서 10% 포름아마이드, 5 X Denhardt 용액, 6 x SSPE, 0.2% SDS, 이어서 37℃에서 1 x SSPE, 0.2% SDS에서의 세척이 수반되는 혼성화와 균등한 조건들을 지칭할 수 있다. Denhardt 용액은 1 % Ficoll, 1 % 폴리비닐피롤리돈, 및 1 % 소 혈청 알부민 (BSA)을 내포한다. 20/SSPE (소듐 클로라이드, 소듐 포스페이트, EDTA)는 3 M 소듐 클로라이드, 0.2 M 소듐 포스페이트, 및 0.025 M EDTA를 내포한다. 다른 적합한 중간 엄격성 및 높은 엄격성 혼성화 완충액 및 조건은 해당 분야의 숙련된 기술자들에게 공지되어 있으며, 예를 들어, Sambrook 외. Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Press, Plainview, N.Y. (1989); 및 Ausubei 외. Short Protocols in Molecular Biology, 4th ed., John Wiley & Sons (1999)에 기재되어 있다.
대안적으로, 실질적인 상보성은 RNA 또는 DNA 가닥이 선택적 혼성화 조건하에서 그 보체에 혼성화될 때 존재한다. 전형적으로, 선택적 혼성화는 최소한 14 내지 25개 뉴클레오티드의 스트레치에 걸쳐 최소한 약 65% 상보성, 바람직하게는 최소한 약 75%, 더욱 바람직하게는 최소한 약 90% 상보성이 존재하는 경우 발생할 것이다. M. Kanehisa, Nucleic Acids Res. 12:203 (1984)을 참고하라.
본 명세서에서 사용되는 "프라이머"는 폴리뉴클레오티드 주형과 이중나선을 형성할 때, 핵산 합성 개시점으로 작용하여 주형을 따라 그 3' 단부로부터 연장되어 연장된 이중나선을 형성할 수 있는, 자연 또는 합성의 올리고뉴클레오티드 일 수 있다. 연장 과정 동안 추가되는 뉴클레오티드의 서열은 주형 폴리뉴클레오티드의 서열에 의해 결정된다. 프라이머들은 통상적으로 중합효소, 예를 들어, DNA 중합효소에 의해 연장된다.
"연결"은 주형-주도 반응에서 둘 이상의 핵산들, 예컨대, 올리고뉴클레오티드 및/또는 폴리뉴클레오티드의 말단 사이의 공유 결합 또는 링키지 형성을 지칭할 수 있다. 결합 또는 링키지의 성질은 매우 광범위하게 달라질 수 있으며 연결은 효소적으로 수행될 수 있다. 본 명세서에서 사용되는 연결은 통상적으로 효소적으로 수행되어 하나의 올리고뉴클레오티드의 5' 탄소 말단 뉴클레오티드와 또 다른 뉴클레오티드의 3' 탄소 사이에 포스포다이에스터 링키지를 형성한다.
본 명세서에서 사용되는 "증폭"은 일반적으로 원하는 서열의 복수의 복제본을 생성하는 과정을 지칭한다. "복수의 복제본"은 최소한 2개의 복제본을 의미한다. "복제본"은 반드시 주형 서열에 대한 완전한 서열 상보성 또는 동일성을 의미하는 것은 아니다. 예를 들면, 복제본은 뉴클레오티드 유사체, 가령, 데옥시이노신, 의도적 서열 변형 (가령, 주형에 혼성화가능하지만, 상보적이지는 않은 서열을 포함하는 프라이머를 통해 도입되는 서열 변형), 및/또는 증폭 중에 발생하는 서열 오류를 포함할 수 있다.
"서열 결정" 등은 핵산의 뉴클레오티드 염기 서열과 관련된 정보의 결정을 포함한다. 이러한 정보는 핵산의 부분적, 뿐만 아니라 완전한, 서열 정보의 식별 또는 결정을 포함할 수 있다. 서열 정보는 통계적 신뢰성 또는 신뢰도의 정도를 달리하여 결정될 수 있다. 한 양상에서, 상기 용어는 핵산 내 복수의 인접 뉴클레오티드의 동일성 및 순서의 결정을 포함한다.
용어 "시퀀싱," "고속 처리 시퀀싱" 또는 "차세대 시퀀싱"은 많은 (전형적으로 수천 내지 수십억) 핵산 서열을 고유하게 병렬 방식으로 결정하는 방법들, 즉, DNA 주형들이 한번에 하나가 아니라 벌크 공정으로 시퀀싱을 위해 제조되는 경우, 그리고 많은 서열들이 바람직하게는 병렬로 판독되는 방법들을 사용하는, 또는 대안적으로 그 자체로 병렬화될 수 있는 일련의 초고속 처리 공정을 사용하는 서열 결정을 포함한다.이러한 방법들은 파이로시퀀싱 (예를 들어, 코네티컷 주, 브랜포드, 454 Life Sciences, Inc.사가 판매); 연결에 의한 시퀀싱 (예를 들어, 캘리포니아주, 칼스바드에 위치한 Life Technologies, Inc.사가 SOLiD™ technology로 판매): 변형된 뉴클레오티드 (가령, 캘리포니아주, 샌디에고에 위치한, Illumiua, Inc.사 TruSeq™ 및 HiSeq™ technology; 메사추세츠주, 캠브리지에 위치한, Helicos Biosciences Corporation사의 HeliScope™ 및 캘리포니아주, 멘로 파크에 위치한, Pacific Biosciences of California, Inc.사의 PacBio RS로 판매됨)를 사용한 합성에 의한 시퀀싱, 이온 탐지 기술들 (가령, 캘리포니아주, 칼스바드에 위치한 Life Technologies사의 Ion Torrent™ 기술)에 의한 시퀀싱, DNA 나노볼 (캘리포니아주, 마운틴뷰에 위치한 Complete Genomics, Inc.사)의 시퀀싱; 나노포어-기반 시퀀싱 기술 (예를 들어, 영국, 옥스포드, LTD에 위치한 Oxford Nanopore Technologies사에 의해 개발됨), 및 이와 유사한 고도로 병렬화된 시퀀싱 방법들을 포함하나, 이에 제한되는 것은 아니다.
"SNP" 또는 "단일 뉴클레오티드 다형태"는 개체들 간의 유전자 변이; 예컨대, 가변적인 유기체들의 DNA에서 하나의 질소함유 염기 위치를 포함할 수 있다. SNP는 게놈 전체에서 발견되며, 개체들 간 많은 유전자 변이는 SNP 유전자 좌위의 변이로 인한 것이며, 이러한 유전자 변이는 종종 개체들 간의 표현형 변이를 초래한다. 본 발명에서 사용하기 위한 SNP 및 이들 각각의 대립유전자는 수많은 출처들, 가령, 공개 데이터베이스 (U.C. Santa Cruz Human Genome Browser Gateway) (genome.ucsc.edu/cgi-bin/hgGateway) 또는 NCBI dbSNP 웹 사이트 (ncbi.nlm.nih gov/SNP/)로부터 유래할 수 있거나, 미국 특허 제 6,969,589호 및 발명의 명칭 "Human Genomic Polymorphisms"의 미국 공개 특허 출원 제 2006/0188875호에 기재된 바와 같이 실험적으로 결정될 수 있다. SNP의 사용이 본 발명에 제시된 일부 구체예들에 기재되어 있지만, 다른 이중대립유전자성 또는 다중대립유전자성 유전자 마커가 또한 사용될 수 있음이 이해될 것이다. 이중대립유전자성 유전자 마커는 두 가지 다형태 또는 대립유전자들을 가지는 것이다. 상기 언급한 바와 같이, 형질과 관련된 이중대립유전자성 유전자 마커의 경우, 대조 그룹과 비교하여 사례 그룹의 유전자 조성에 더 풍부한 대립유전자를 "연관 대립유전자"라하고, 다른 하나의 대립유전자는 "비연관 대립유전자"로 지칭할 수 있다. 따라서, 주어진 형질 (예를 들어, 질병 또는 약물 반응)과 연관된 각각의 이중대립유전자성 다형태에 있어서, 상응하는 연관 대립유전자가 존재한다. 본 명세서에 제시된 방법들과 함께 사용될 수 있는 다른 이중대립유전자성 다형태는 다수뉴클레오티드 변화, 삽입, 결실 및 전위를 포함하지만, 이에 제한되는 것은 아니다.
본 명세서에서 DNA에 대한 지칭은 게놈 DNA, 미토콘드리아 DNA, 에피솜 DNA, 및/또는 DNA의 유도체, 가령, 앰플리콘, RNA 전사체, cDNA, DNA 유사체,을 포함할 수 있음이 또한 이해될 것이다. 연관 연구에서 스크리닝되는 다형체 유전자 좌위는 이배수체 또는 반수체 상태 일 수 있으며, 이상적으로는 게놈 전체에 걸친 부위들로부터 유래될 수 있다. SNP 시퀀싱을 위해 시퀀싱 기술을 사용가능한데, 가령, BeadArray 플랫폼 (GOLDENGATE™분석) (캘리포니아주, 샌디에고에 위치한 Illumiua, Inc.사) (Fan, 외, Cold Spring Symp. Quant. Biol, 68:69-78 (2003) 참고)이 사용될 수 있다.
일부 구체예들에서, 용어 "메틸화 상태" 또는 "메틸화 상태들"은 DNA 서열 내 하나 또는 복수의 CpG 다이뉴클레오티드들에서의 5-메틸시토신 ("5-mC" 또는 "5-mCyt")의 존재 또는 부재를 지칭한다. DNA 서열 내 하나 이상의 특정 CpG 메틸화 부위들 (각각 2개의 CpG 다이뉴클레오티드 서열들을 가짐)에서 메틸화 상태는 "비메틸화", "완전-메틸화" 및 "반-메틸화"를 포함한다. 용어 "반- 메틸화" 또는 "반메틸화"는 한 가닥만 메틸화되어 있는, 이중 가닥 DNA의 메틸화 상태를 지칭한다. 용어 "고메틸화"는, 정상 대조 DNA 샘플 내 상응하는 CpG 다이뉴클레오티드에서 발견되는 5-mCyt의 양과 비교하여, 테스트 DNA 샘플의 DNA 서열 내 하나 또는 복수의 CpG 다이뉴클레오티드에서 5-mCyt의 존재 증가에 상응하는 평균 메틸화 상태를 지칭한다. 용어 "저메틸화"는, 정상 대조 DNA 샘플 내 상응하는 CpG 다이뉴클레오티드에서 발견되는 5-mCyt의 양과 비교하여, 테스트 DNA 샘플의 DNA 서열 내 하나 또는 복수의 CpG 다이뉴클레오티드에서 5-mCyt의 존재 감소에 상응하는 평균 메틸화 상태를 지칭한다.
본 명세서에서 "복합분석" 또는 "다중 분석"은 각각 하나 이상의 마커를 사용하여 다수의 표적, 예컨대, 다수의 핵산 서열의 존재 및/또는 양을 동시에 분석할 수 있는 분석 또는 다른 분석 방법을 지칭 할 수 있으며, 상기 마커 각각은 최소한 하나의 상이한 탐지 특성, 예컨대, 형광 특성 (예를 들어, 여기 파장, 방출 파장, 방출 강도, FWHM (반치 최대 피크 높이에서 전체 폭) 또는 형광 수명) 또는 고유한 핵산 또는 단백질 서열 특성을 가진다.
본 명세서에서 사용되는 "질환 또는 장애"는 예컨대, 감염 또는 유전적 결함으로 인한, 그리고 식별가능한 증상들로 특징되는 유기체의 병리학적 상태를 지칭한다.
B. 라이브러리 제작 및 폴리뉴클레오티드 시퀀싱에 의한 폴리뉴클레오티드 단편 분석의 개요.
한 양상에서, 본 발명의 방법의 표적 (또는 주형) 폴리뉴클레오티드는, 예를 들어, 약 100개 잔기 내지 약 1000개 잔기 범위, 그리고 일부 구체예들에서, 약 150개 잔기 내지 약 400개 잔기 범위의 단편화된 폴리뉴클레오티드이다.
표적 또는 주형 DNA는 규칙적인 게놈 DNA, 염색체 DNA, 염색체외 DNA (가령, 미토콘드리아 DNA), 또는 이의 단편을 포함할 수 있다. 다른 구체예들에서, 표적 또는 주형 DNA는 가공된 DNA로서, 예를 들어, 효소 소화, 교차-결합, 화학적 또는 물리적 전단, 바이설파이트 전환, 및/또는 분해를 거친 DNA이다.
바이설파이트 전환은 바이설파이트를 사용하여 DNA의 메틸화 패턴을 결정하는 방법이며, DNA 메틸화는 시토신 또는 아데닌 DNA 뉴클레오티드에 대한 메틸기 추가와 관련된 생화학적 과정이다. DNA 메틸화는 세포가 배아 줄기 세포로부터 특정 조직으로 분열 및 분화함에 따라 세포에서의 유전자 발현을 안정하게 변화시킨다. 바이설파이트 전환에서, 표적 핵산은 메틸화 시토신의 영향을 전혀 받지 않으면서 비메틸화 시토신을 우라실로 특이적으로 전환시키는 바이설파이트 시약으로 먼저 처리된다. 바이설파이트 전환의 한 가지 결과는 서열 상보성의 손실로 인해 원래 표적의 이중-가닥 구조가 파괴된다는 것이다. 표적 서열은 샘플 준비 및 분석 또는 진단 테스트 동안 2개의 개별적인 단일-가닥 DNA로 존재한다. 표적 핵산 서열은 또한 빈번히 매우 낮은 농도로 존재한다. 이점은 순환 종양 DNA ("무세포 종양 DNA" 또는 "ctDNA"로도 지칭됨)에 있어서, 순환계에서 이의 종종 낮은 농도 및 매우 낮은 변이체 대립유전자 분율로 인해 특히 중요한 고려 사항이다.
일부 구체예들에서, 본 명세서에 개시된 관심 핵산 분자는 무세포 DNA, 가령, 무세포 태아 DNA ("cfDNA"로도 지칭 됨) 또는 ctDNA인데, cfDNA는 임산부의 체내에서, 가령, 혈액내에서 순환하며 태아 게놈을 나타내지만, ctDNA는 암 환자 체내에서, 가령, 혈액에서 순환하며 일반적으로 사전-단편화된다. 다른 구체예들에서, 본 발명에 개시된 관심 핵산 분자는, 예를 들어, 손상 조건하에서, 가령, 포르말린 고정된 샘플 또는 부분 소화된 샘플에서의 보관으로 인한, 오래된 (ancient) 및 / 또는 손상된 DNA이다.
암 세포가 사멸할 때, 이들은 혈류로 DNA를 방출한다. 순환 종양 DNA (ctDNA)로 공지된 이러한 DNA는 대략 150개 염기쌍의 평균 길이로 고도로 단편화된다. 일단 백혈구가 제거되면, ctDNA는 일반적으로 매우 적은 분율의 남아있는 혈장 DNA를 포함하고, 예를 들어, ctDNA는 혈장 DNA의 약 10% 미만을 구성 할 수 있다. 일반적으로, 이러한 백분율은 약 1% 미만, 예를 들어, 약 0.5% 미만 또는 약 0.01% 미만이다. 추가적으로, 혈장 DNA의 총 양은 일반적으로 매우 낮은데, 예를 들어, 혈장의 약 10 ng/mL이다. ctDNA 내 변이체들에 대해 차세대 시퀀싱을 비롯한 다양한 방법들을 사용하여 정보를 얻을 수 있다. ctDNA 대 혈장 DNA 비율이 낮기 때문에, PCR 및 시퀀싱 오류로 인해 높은 신뢰도로 변이체를 정의(call)하는 것이 어렵다. 고유 분자 식별자 (UMI)는 나타나는 임의의 변이체가 공통 서열과 비교될 수 있도록 원래의 분자를 태그하기 위해 일반적으로 사용된다. 이는 거짓 양성과 참을 구별하는 효과적인 방식이다. 변이체가 공통서열과 매치되는 경우, 이는 참 양성이다. 그렇지 않으면, 이는 분석에서 제거된다. 더욱이, 높은 백분율의 원래 분자들이 시퀀싱 라이브러리로 전환되어 선택성이 높게 유지되도록 하는 것, 즉, 변이체들이 드랍아웃으로 인해 소실되지 않는 것이 필수적이다. 그러므로, 연결 효율성은 라이브러리 제작 동안 매우 중요하다.
한 양상에서, 본 발명은 연결 효율성을 매우 개선시키면서도 선택된 게놈 영역들을 표적화하는 기술을 제공한다. 한 구체예에서, 시퀀싱에 의해 탐지되는 폴리뉴클레오티드들, 가령, ctDNA는, ctDNA의 그 자신에 대한 연결을 방지하기 위해 먼저 탈인산화되어 5' 포스페이트가 제거된다. 이어서 ctDNA는 모든 DNA가 단일 가닥이 되도록 변성된다. 단일 가닥 DNA 연결효소인 CirchgaseTM는 어댑터를 ctDNA의 3' 단부에 연결시키기 위해 사용된다. 한 양상에서, 어댑터는 연결 효율성을 최적화하기 위해 5' 단부 상에 2개 특정 염기들, 이어서 UMI를 내포한다. 한 양상에서 어댑?의 3' 단부는 어댑터들의 자가연결을 방지하기 위하여 탄소 스페이서를 내포한다. 또 다른 양상에서, 연결 반응은 크라우딩제, 가령, PEG 4000을 사용하여 추가로 최적화된다. 한 양상에서, 연결 후, 분자들은 어댑터에 역 상보적인 프라이머를 사용하여 이중-가닥화된다. 이는 이용가능한 DNA를 표준 정제법으로 제거하지 않으면서 연결되지 않은 과량의 어댑터를 효율적으로 제거할 수 있게 한다.
한 양상에서, 그 후 DNA는 간접 (semi-targeted) PCR을 사용하여 증폭된다. 하나의 프라이머는 어댑터에 역 상보적인 반면, 다른 하나 (예컨대, 프라이머 풀에서 하나의 프라이머)는 해당 게놈의 특정 표적 부위들에 어닐링된다. 특정 프라이머들은 프라이머-이량체 상호작용 및 오프타겟 어닐링을 최소화하기 위해 설계되었다. 한 양상에서, 표적-특이적 프라이머들은 작은 DNA 크기로 인해 특정 변이체에 대해 근접하게 도달하도록 추가로 최적화된다. 추가 세정 후, PCR은 전장 시퀀싱 어댑터 및 바코드를 추가한다. 이어서 최종 라이브러리가, 예를 들어, Illumina 기기에서 시퀀싱된다.
한 양상에서, 간접 PCR은 ~30,000 bp의 비교적 작은 표적 부위를 가짐에도 불구하고 원래 분자 세트가 > 약 40,000배 풍부해지는 결과를 가져온다. 한 양상에서, 본 방법의 전체 전환율은 최소한 60%이며, 이는 표준 라이브러리 제작 및 혼성화 포획과 비교할 때 원래 분자의 최소한 ~3배 이상이 서열화가능한 물질로 전환됨을 의미한다. 다른 구체예들에서, 전체 전환율은 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 또는 90% 이상이다. 한 양상에서, 본 발명의 방법은 그러므로 극히 낮은, 예를 들어, 0.01% 만큼 낮은 돌연변이체 대립유전자 분율에서, 유전자 또는 게놈 변이체들, 가령, SNV, 삽입-결실 (indel), CNV, 및 융합을 정확하게 정의(call) 할 수 있다. 다른 양상들에서, 유전자 또는 게놈 변이체의 대립유전자 분율은 약 0.05%, 약 0.1%, 약 0.5%, 약 1 %, 또는 약 2%이다.
다음 섹션에서는 본 발명의 방법의 특정 단계들을 보다 상세히 설명한다.
C. 단일-가닥 폴리뉴클레오티드 라이브러리 및 이의 제작 방법 .
예를 들어, ctDNA에 대한 차세대 시퀀싱을 위한 라이브러리 제작은 일반적으로, 단부 복구, A-테일링, 및 어댑터 분자의 이중 가닥 연결을 비롯한 몇 가지 단계들로 구성된다. 이들 연결된 분자들은 이어서 혼성화 포획을 사용하여 특정 게놈 부위들에서 1000-2000배 농축될 수 있다. 지난 수년에 걸쳐 라이브러리 제작이 몇 차례 개선되었으나, 이러한 과정은 여전히 비효율적이어서, 다양한 단계들 중에 많은 원래의 분자들이 소실되는 결과를 가져온다. 이중 가닥 연결 효율성은 여전이 낮은데, 해당 분자들의 ~20-30%가 적절히 연결된다. 추가적으로, 많은 분자들은 정제 및 혼성화 포획 단계 중에 소실되므로, 최종 전환율은 대략 10-20%가 된다. ctDNA에서 발견되는 낮은 대립유전자 분율의 변이체를 조사할 때 민감도는 여전히 낮다. 이는 낮은 대립유전자 분율의 돌연변이체를 정의 (calling) 할 때 정확도를 제한한다. 이는 낮은 대립유전자 분율을 가진 라이브러리를 보았을 때 낮은 효율성이 민감도 손실을 가져오게 될 것이기 때문이다.
또한, 특정 폴리뉴클레오티드, 가령, ctDNA의 작은 크기로 인해 태그 기반 라이브러리 제작법을 사용할 수 없다. 예를 들면, 폴리뉴클레오티드는 먼저 (예를 들어, 비오틴으로) 태그되어, 표적 라이브러리를 생성한 다음, 태그를 (예를 들어, 스트렙타비딘에 의해) 포획함으로써 농축된다. 이러한 방식에서, 관심 부위들에 대한 라이브러리는 약 1000-2000 배 만큼 농축될 수 있다. 마지막으로, 시퀀싱을 위해 PCR을 실시하여 분자들을 증폭하고 색인화한다. 그러나, PCR 기반 방법들은 원래 분자들에 UMI를 부가하기 어렵고 오류율이 높은 것으로 밝혀졌다.
한 양상에서, 본 발명에 기재된 조성물, 키트, 및 방법들은 상기 문제점들을 해결한다. 일부 구체예들에서, 상기 조성물, 키트, 및 방법들은 다양한 라이브러리의 제작, 다양한 증폭 반응 (가령, PCR 및/또는 프라이머 연장에 의한), 제작된 라이브러리의 정제, 및 시퀀싱 리드들의 분석을 비롯한 (그러나 이에 제한되는 것은 아님) 핵산 분자 시퀀싱에 유용하다.
특정 양상들에서, 시퀀싱 라이브러리는, 예를 들어, 단편화된 폴리뉴클레오티드, 가령, 단편 DNA를 내포하는 샘플로부터 제조될 수 있다. 한 양상에서, 샘플은, 예를 들어, 대상체로부터 직접 얻은 자연 발생 샘플, 가령, 혈액, 혈장, 혈청, 뇌척수액, 활액, 소변, 땀, 정액, 가래, 눈물, 점액 또는 양수를 비롯한 (그러나 이에 제한되는 것은 아님) 조직액 또는 체액이 수득된다. 다른 양상들에서, 시퀀싱 라이브러리는 (예를 들어, DNA를 전단함으로써) DNA 단편을 형성하고, 이러한 DNA 단편에 본 발명의 어댑터를 부착함으로써 제조될 수 있다. 특정 구체예들에서, 단편화된 폴리뉴클레오티드 및 어댑터는 단일-가닥이다.
상기 단편 (예를 들어, ctDNA 또는 보다 긴 DNA 가닥들을 단편화하여 형성된 단편)들은 때때로 "인서트"로 지칭되는데, 왜냐하면 이들이 어댑터 가령, 본 발명에 개시된 단일-가닥 어댑터에 인접하여 "삽입" 또는 연결될 수 있기 때문이다. RNA 분자들 또한 시퀀싱 될 수 있는데, 예를 들어, RNA 분자들을 역 전사하여 DNA 분자들을 형성하며, 이들은 어댑터에 부착된다.
한 양상에서, 한 세트의 어댑터들을 단일-가닥 폴리뉴클레오티드들의 라이브러리에 연결시키는 단계를 포함하는 방법이 제공되며, 이 방법에서, 연결은 단일-가닥 DNA (ssDNA) 연결효소에 의해 촉매된다. 본 명세서에서 사용되는, ssDNA 연결효소는 상보적 서열의 부재시 ssDNA의 단부들을 연결시킬 수 있다. 예를 들면, CircLigase™ ssDNA 연결효소 및 CircLigase™ II ssDNA 연결효소는 모두 5'-포스페이트 및 3'-하이드록실기를 가지는 ssDNA 주형들의 분자내 연결 (즉, 원형화)을 촉매하기 위해 통상적으로 사용되는 열안정성 연결효소들이다. T4 DNA 연결효소 및 Ampligase® DNA 연결효소와 대조적으로, 이들은 상보적 DNA 서열상에서 서로에 대해 인접하게 어닐링되는 DNA 단부들을 연결시키며 ssDNA 연결효소는 상보적 서열의 부재시 ssDNA의 단부들을 연결시킨다. 그러므로 효소는 선형 ssDNA로부터 원형 ssDNA 분자들을 제조함에 유용하다. 원형 ssDNA 분자들은 회전환 복제 또는 회전환 전사를 위한 기질로서 사용될 수 있다. ssDNA에 대한 이의 활성 이외에, CircLigase 효소는 또한 3'- 하이드록실 리보 뉴클레오티드 및 5'-인산화 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 가지는 단일-가닥 핵산을 연결시키는 활성을 가진다.
CircLigase™ ssDNA 연결효소 또는 CircLigase™ II ssDNA 연결효소가 본 발명에서 사용될 수 있다. 상기 두 가지 효소들은 CircLigase I은 CircLigase II에 비해 훨씬 적게 아데닐화되며 최고 활성을 위해 ATP를 필요로 한다는 점에서 상이하다. CircLigase I은 ATP의 존재시 ssDNA를 재원형화시킨다. CircLigase II는 거의 100% 아데닐화되므로 반응 완충액에 ATP를 추가할 필요가 없다. CircLigase II는 화학양론적 반응에 따라 기능하는데, 이 효소는 효소 활성 부위에서 아데닐화되는 올리고의 5'-단부에 결합한 다음, 올리고를 연결시키고 멈춘다. 상기 반응은 ATP를 포함하지 않으므로, CircLigase II는 1:1 효소:올리고 구성으로 작용한다. 원형화가 완료되면, 원형 ssDNA가 활성 부위로부터 방출되고 반응은 중단된다. 다른 적합한 ssDNA 연결효소 또한 사용될 수 있다. 예를 들면, 열안정성 5' App DNA/RNA 연결효소, 예컨대, New England Biosciences, M0319S, 또는 T4 DNA 연결효소, 예컨대, New England Biosciences, M0202S, 또는 T4 RNA 연결효소, 예컨대, T4 RNA 연결효소 I, 예컨대, New England Biosciences, M0204S, T4 RNA 연결효소 2, 예컨대, New England Biosciences, M0239S, T4 RNA 연결효소 2 절두형, 예컨대, New England Biosciences, M0242S, T4 RNA 연결효소 2 절두형 KQ, 예컨대, M0373S, 또는 T4 RNA 연결효소 2 절두형 K227Q, 예컨대, New England Biosciences, M0351S가 사용될 수 있다.
한 양상에서, 각 단일-가닥 폴리뉴클레오티드는 5' 단부에서 연결을 방지하기 위해 5' 단부에서 차단되고, 각 어댑터는 어댑터가 연결되는 단일-가닥 폴리뉴클레오티드를 결정하는 고유 분자 식별자 (UMI) 서열을 포함하고, 각 어댑터는 3' 단부에서 연결을 방지하기 위해 3' 단부에서 차단되고, 어댑터의 5' 단부는 ssDNA 연결효소에 의해 단일-가닥 폴리뉴클레오티드의 3' 단부에 연결되어 선형 연결 생성물을 형성함으로써, 선형, 단일-가닥 연결 생성물들의 라이브러리를 수득한다. 단일-가닥 DNA의 주형-독립적 원형화는 WO2010/094040 A1 (이의 내용은 본 명세서에 그 전문이 참고로 포함됨)에 기재되어 있지만, WO2010/094040 A1은 단일-가닥 폴리뉴클레오티드들의 분자내 연결 (예컨대, 원형화)만을 개시한다.
그러므로, 본 발명의 방법은 ssDNA 연결효소, 가령, CircLigase 또는 CircLigase II를 기존의 방식과 다른 방식으로 사용한다. 원형화 대신, 본 발명의 연결 방법은 단일-가닥 표적 폴리뉴클레오티드와 어댑터 분자 간의 선형 연결 생성물을 생성하는 것을 목적으로 한다. 한 양상에서, 본 발명은 분자내 연결을 수행하기 위하여, 예컨대, 단일-가닥 폴리뉴클레오티드에 어댑터를 연결시키기 위하여 ssDNA 연결효소를 사용한다. 이렇게 하기 위하여, 한 양상에서, 단일-가닥 폴리뉴클레오티드는 원형화를 방지하기 위해 5' 단부에서 차단된다. 이러한 방식으로, ssDNA의 3' 단부의 그 자신의 5' 단부에 대한 분자내 연결,
뿐만 아니라 동일한 라이브러리 내 또 다른 ssDNA의 5' 단부에 대한 하나의 ssDNA의 3' 단부의 분자간 연결이 방지된다. 그러므로 한 양상에서, 단일-가닥 폴리뉴클레오티드의 원형화 및 선형 연쇄동일서열(concatemers) (단일-가닥 폴리뉴클레오티드 및/또는 어댑터들을 내포)의 형성 모두는 연결 반응 동안 방지된다. 도 1에서 보는 바와 같이, 각 단일-가닥 폴리뉴클레오티드의 차단은 그 단부에서의 연결을 방지하기 위해 5' 단부에서의 탈인산화를 포함할 수 있다.
또 다른 양상에서 각 어댑터는 3' 단부에서 연결을 방지하기 위해 3' 단부에서 차단된다. 이러한 방식으로, 어댑터의 3' 단부의 그 자신의 5' 단부에 대한 분자내 연결, 뿐만 아니라 한 어댑터 분자의 3' 단부의 또 다른 어댑터 분자의 5' 단부에 대한 분자간 연결이 방지된다. 연결을 방지하기 위하여 각 어댑터의 차단은 그 3' 단부에 탄소 스페이서, ddCTP, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜 (TEG), 및/또는 헥사에틸렌 글리콜을 포함할 수 있다. 그러므로 한 양상에서, 단일-가닥 어댑터의 원형화 및 선형 연쇄동일서열(concatemers) (단일-가닥 폴리뉴클레오티드 및/또는 어댑터들을 내포)의 형성 모두는 연결 반응 동안 방지된다.
어댑터는 임의의 적합한 조합의, 하나 이상의 스페이서들의 하나 이상의 복제본들을 포함할 수 있다. 예를 들면, Gansauge 및 Meyer의 문헌은 C3Spacer와 비오티닐화 TEG 스페이서의 10개 복제본들을 포함하는 어댑터를 개시한다. Gansauge 및 Meyer의 문헌 (2013), "Single-stranded DNA library preparation for the sequencing of ancient or damaged DMA," Nature Protocols, 8(4): 737-48, 이는 본 명세서에 그 전문이 참고로 포함된다. 그러나 이 문헌은 연결 직후, 연결된 ssDNA를, 비오틴-스트렙타비딘 상호작용을 통해 포획할 것을 필요로 한다. 이 단계는 라이브러리에서 ssDNA 분자들의 상당한 소실을 유발할 수 있다. 이 문헌은 이후 ssDNA가 비드 상에 포획된 상태로 유지되는 동안 포획된 ssDNA를 dsDNA로 전환시킨다.
도 1에서 보는 바와 같이, 본 발명은 연결 직후 연결된 ssDNA를 포획하는 단계를 필요로 하지 않는다. 대신, 연결된 ssDNA가 dsDNA로 전환될 때 이는 연결 반응 부피 내에 잔류한다.
한 양상에서, 라이브러리에서 ssDNA의 연결 효율성은 높은데, 예를 들어, 샘플 내 단일-가닥 폴리뉴클레오티드의 최소한 약 40%, 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 95%, 또는 최소한 약 99%가 어댑터에 연결된다. 특정 구체예들에서, 연결 효율성은 약 80%이다. 이러한 매우 개선된 연결 효율성으로, 본 발명의 방법은 또한 아래 설명하는 바와 같이 선택된 게놈 영역들을 표적화할 수 있다.
한 양상에서, 어댑터는 다음과 같은 구조를 가진다: /5'Phos/N1N2...N i -UMI- M1M2....M j -차단기, 이 때 "5'Phos"는 5' 포스페이트기를 나타내고, "N1N2...N i "은 UMI 서열에 대한 5' 서열을 나타내고, "M1M2....M j "은 UMI 서열에 대한 3' 서열을 나타내고, "차단기"는 어댑터의 3' 단부가 연결을 방지하기 위해 차단됨을 표시한다. i j 모두는 정수이고, 이 때 i 는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 30 보다 클 수 있고; j는 5, 6, 7, 8. 9, 10, 11, 12, 13, 14, 15, 16. 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 또는 50 보다 클 수 있다.특정 구체예들에서, i는 2일 수 있다. 일부 구체예들에서, N1N2...N i 의 5' 단부의 다이뉴클레오티드 서열 N1N2는, 연결 효율성을 향상시키기 위해 GA (5' →3'), GG (5' → 3'), AA (5' → 3'), 또는 AG (5' →3')일 수 있다.
한 양상에서, M1M2....M j 서열의 일부 또는 전부는 연결된 단일-가닥 폴리뉴클레오티드를 이중-가닥 폴리뉴클레오티드로 전환시키기 위한 프라이머로서 사용되는 역-보체 서열을 설계하기 위해, 및/또는 선택된 표적 서열을 증폭시키기 위하여 간접 PCR 하기 위해 (프라이머 쌍 중 다른 하나의 프라이머는 표적-특이적 프라이머임) 차후 단계들에서 사용된다. 한 양상에서, M1M2....M j 서열은 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 1) 또는 약 18 내지 22개 뉴클레오티드 잔기를 포함하는 이의 일부를 포함한다.
또 다른 양상에서, "차단기"는 임의의 적합한 조합으로 그리고 5' → 3' 방향의 순서로 하나 이상의 차단기 그룹들의 하나 이상의 복제본에 탄소 스페이서, ddCTP, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜 (TEG), 및/또는 헥사에틸렌 글리콜을 포함한다.
한 양상에서, UMI의 사용은 표적 서열의 무오류 시퀀싱 리드의 결정, 선택, 및/또는 분리를 용이하게 하고 시퀀싱 리드는 높은 정확성과 고속 처리로 선택될 수 있다. 이러한 검증된 무오류 시퀀싱 리드들은 방법론에서의 편향을 방지하기 위한, 보다 큰 공지 서열 분자들의 제작, 다형태 및/또는 돌연변이 스크리닝, 대규모 병렬 시퀀싱 및 정량화 방법을 비롯한, 서열 충실도를 요구하는 모든 기술에서 유용하다.
한 양상에서, 고유 분자 식별자는 단일-가닥 표적 폴리뉴클레오티드 및 어댑터를 포함하는 연결된 구조체와 결합되어 이를 고유하게 식별한다.
다시 말하면, 동일 서열을 가지는 2개의 단일-가닥 표적 폴리뉴클레오티드는 그 UMI 서열에서 서로 상이한 2개의 상이한 어댑터들에 연결될 수 있으며; 생성된 연결 생성물은 상이하고, (동일 서열을 가지는 표적 폴리뉴클레오티드 이외의) 각 연결 생성물은 UMI에 의해 고유하게 식별된다. 또 다른 양상에서, 단일-가닥 연결 생성물이 이중-가닥 폴리뉴클레오티드로 전환되고 증폭될 때, 매우 높은 충실도의 중합효소들을 사용할 수 있다 하더라도 반복하여 복제하는 동안 증폭 오류가 도입될 수 있다. 결과적으로, 낮은 오류율이라 하더라도, 특히, 대형 라이브러리를 제작함에 있어서 상당한 영향을 줄 수 있다. 대규모 병렬 시퀀싱은 비용 및 처리량 면에서 이점이 있지만, 증폭 및/또는 탐지 기술의 한계에 리드의 정확성이 포함될 수 있다.
UMI를 사용함으로써, 본 발명의 방법은 무오류 증폭 생성물 및/또는 시퀀싱 리드들을 식별하고, 분석으로 인한 기술상의 오류를 가진 것들을 배제시킬 수 있다. 동일한 UMI를 가지는 증폭 생성물 및/또는 시퀀싱 리드는 관련된 (직계 동형) 것으로 확인 될 수 있으므로, 동일한 UMI를 가지는 분자들 간의 서열 차이는 서열에서의 실제 차이 (예컨대, 야생형 서열과 암 관련 돌연변이체 서열 간의 서열 차이)라기보다는 기술적 오류로서 식별 될 수 있다. 다시 말하면, 각 단일-가닥 연결 생성물은 그 UMI에 의해 고유하게 식별가능하기 때문에, (증폭 및/또는 시퀀싱으로 인한) 그 직계형들 모두는 기술적 오류가 전혀 도입되지 않는 경우 동일한 표적 서열을 가져야 한다. 그러나, 오류, 가령, 단일-뉴클레오티드 삽입이 증폭 및/또는 시퀀싱 중에 표적 서열에 도입되는 경우, 일부 증폭 생성물 및/또는 시퀀싱 리드 직계 동형 (예컨대, 동일한 UMI를 공유)은 삽입을 가지게 될 것이지만 다른 것들은 그렇지 않을 것이다. 삽입을 보유한 생성물과 삽입을 보유하지 않은 생성물들 사이의 정확한 비율은 증폭 및/또는 시퀀싱 과정에서 오류가 발생하는 시기에 따라 달라질 것이다. 일반적으로, 매우 높은 충실도의 중합효소들이 사용될 때, 오류없는 생성물이 다수일 것이다. 또 다른 양상에서, 직계 동형인 증폭 생성물 및/또는 시퀀싱 리드가 식별될 수 있기 때문에, 공통 서열은 다수의 분자들로부터 얻은 데이터를 사용하여 결정될 수 있으며, 이로써 고속 처리 시퀀싱에 대한 높은 정확도가 구현된다.
한 양상에서, UMI는 축퇴성 핵산 서열이고, UMI 내 뉴클레오티드의 수는 UMI 서열들에 의해 나타나는 가능한 그리고 실제 서열들의 수가 초기 라이브러리의 단일-가닥
표적 폴리뉴클레오티드의 전체 수 보다 더 크도록 설계된다. 한 양상에서 UMI 서열 다양성 (또는 각각의 단일 UMI 서열에 대한 "고유성 (uniqueness)")은 각 위치에서 4가지 염기들 모두의 혼합물로 합성하여 무작위로 생성된 서열들의 축퇴 컬렉션을 사용하여 제공될 수 있다. 대안적으로, 다양하지만 사전-정의된 서열들의 세트가 합성되어 초기 단일-가닥 폴리뉴클레오티드 라이브러리에 연결될 수 있다. UMI 세트의 다양성은 직계로 관련되지 않은 분자들이 이와 같이 오인되지 않도록 하기에 충분할 필요가 있다. 한 양상에서, "고유한" 분자 식별자는 절대적으로 고유할 필요는 없으며, 다른 표적 단일-가닥 폴리뉴클레오티드들이 상이함이 명확하고 직계 동형인 분자로 오인되지 않는 한 이들에 사용될 수 있다. 뉴클레오티드들을 무작위 어셈블리하여 생성될 수 있는 다수의 UMI 서열들은 각각의 개별적인 연결 생성물이 고유하게 식별될 수 있는 높은 가능성을 제공한다. 예를 들면, UMI가 각 위치에서 A, C, G 및 T의 혼합물로 합성된 12-량체를 포함하는 경우, 420개의 가능한 서열들이 존재한다. UMI가 각 위치에서 A, C, G 및 T의 혼합물로 합성된 20-량체를 포함하는 경우, 420 (약 1012)개의 가능한 서열들이 존재한다. 이러한 무작위 식별자들의 사용은 서로 간에 개별적으로 구별될 수 있는 단일-가닥 표적 폴리뉴클레오티드들을 가진 대형 라이브러리를 가능하게 한다.
특정 양상들에서, UMI는 5-량체, 6-량체, 7-량체, 8-량체, 9-량체, 10-량체, 11-량체, 12-량체, 13-량체, 14-량체, 15-량체, 16-량체, 17-량체, 18-량체, 19-량체, 20-량체, 21-량체, 22-량체, 23-량체, 24-량체, 25-량체, 또는 심지어 이보다 더 긴 축퇴 서열이다. 한 양상에서, 어댑터는 다음 구조를 가지며: /5'Phos/GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG/3SpC3/, 이 때, "NNNNNNNNNNNN"은 12-량체 UMI 서열을 나타내고, "3SpC3"은 3' 탄소 스페이서를 나타낸다. GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG 서열은 서열 번호: 2이다.
DNA의 농도는 축합제, 가령, 코발트 헥사민 및 생물기원 폴리아민, 가령, 스페르미딘을 추가함으로써, 또는 효소의 유효 농도를 또한 증가시키는 크라우딩제, 가령, 폴리에틸렌 글리콜 (PEG)을 사용함으로써 인공적으로 증가될 수 있다. 한 양상에서, 첨가제, 가령, 코발트 헥사민은 독점적으로 분자간 반응을 생성하여, 원형 생성물이 아닌 선형 연결 생성물을 생성할 수 있다. 그러므로, 단일-가닥 표적 폴리뉴클레오티드의 5' 단부들 및 단일-가닥 어댑터의 3' 단부들이 연결을 방지하기 위해 완전히 차단될 수 없는 경우, 첨가제, 가령, 코발트 헥사민을 사용하여 분자간 반응을 향상시키고 또한 단일-가닥 표적 폴리뉴클레오티드 및/또는 어댑터의 원형화를 방지할 수 있다.
일부 구체예들에서, 어댑터의 하나 이상의 구조들이 동일한 연결 반응에서 사용될 수 있다. 예를 들면, 다음과 같은 2개의 어댑터 구조들이 사용될 수 있다:
구조 번호 1: /5'Phos/N1N2...N i -UMI1- M1M2....M j -차단기1, 및
구조 번호 2: /5'Phos/P1P2...P k -UMI2- Q1Q2...Q l -차단기2.
N1N2...N i 및 ,P1P2...P k 는 동일하거나 상이할 수 있으며, UMI1과 UMI2는 동일하거나 상이할 수 있고, M1M2 ...M j 및 Q1Q2...Q l 은 동일 또는 상이할 수 있고, 차단기1 및 차단기2는 동일 또는 상이할 수 있다. 한 구체예에서, UMI1은 UMI2와 상이하지만 (예를 들어, UMI1은 12-량체 축퇴 서열인 반면, UMI2는 13-량체 축퇴 서열임), 어댑터들의 다른 특징들은 동일하다. 또 다른 구체예에서, N1N2...N i 는 P1P2...P k 와 상이하지만 (예를 들어, 하나는 AG이고 다른 하나는 GA임), 어댑터의 다른 특징들은 동일하다. 또 다른 구체예에서, M1M2 ...M j Q 1 Q 2 ...Q l 과 상이하지만 (예를 들어, 하나는 AG이고 다른 하나는 GA임), 어댑터의 다른 특징들은 동일하다.
또 다른 구체예에서, 차단기1 및 차단기2는 상이하지만, 어댑터의 다른 특징들은 동일하다.
연결 반응 후, 정제 (예컨대, 과량의 방해되는 어댑터 분자들로부터 연결 생성물의 분리)할 필요가 없는 단일-가닥 연결 생성물은 즉시 이중-가닥 연결 생성물로 전환될 수 있다. 또한, 후속하는 연결 생성물의 이중-가닥 폴리뉴클레오티드로의 전환 및/또는 증폭 단계를 위해 단일-가닥 표적 폴리뉴클레오티드 또는 어댑터 어떤 것도 고체 지지체에 포획될 필요가 없다 (예컨대, 비드에 대한 비오틴-스트렙타비딘 매개된 결합에 의해). 그러므로, 본 발명의 방법은 단일-가닥 연결 생성물의 정제 또는 분리로 인한, DNA 샘플 내 이미 작은 대립유전자 분율의 돌연변이체, 가령, ctDNA의 손실을 피하게 하거나 및/또는 감소시킨다. 대신에, 한 양상에서, 단일-가닥 연결 생성물은 용액 중에 잔류하며, 곧바로 프라이머 연장을 거친다.
D. 단일-가닥 폴리뉴클레오티드 라이브러리의 이중-가닥 폴리뉴클레오티드 라이브러리로의 전환.
1에 도시된 바와 같은 한 양상에서, 단일-가닥 연결 생성물을 내포하는 라이브러리의 제작 후, 상기 방법은 선형, 단일-가닥 연결 생성물의 라이브러리의, 선형, 이중-가닥 연결 생성물들의 라이브러리로의 전환 단계를 추가로 포함할 수 있다. 한 양상에서, 전환은 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 프라이머 또는 한 세트의 프라이머들을 사용한다.
다음 구조를 가지는 어댑터에 있어서: /5'Phos/N1N2...N i -UMI- M1M2....M j -차단기, 프라이머는 M1M2....M j 에 역-보체인 및/또는 혼성화가능한 서열을 포함한다. 이 예시에서, 프라이머가 ssDNA-N1N2...N i -UMI-M1M2....M j -차단기 구조를 가지는 연결된 생성물에 혼성화될 때, 프라이머 연장 반응은 ssDNA-N1N2...N i -UMI 서열 (그리고 선택적으로, M1M2....M j 서열 전부 또는 일부)을 이중-가닥 폴리뉴클레오티드로 전환시킬 수 있다. 한 특정 구체예에서, 역-보체 프라이머는 서열 번호: 3: CACTCTTTCCCTACACGACGC (5' → 3')에 제시된 서열을 포함한다.
일부 구체예들에서, 프라이머는 M1M2....M j 의 완전한 역-보체 또는 이의 일부가 아닐 수 있으며; 그럼에도 불구하고, 프라이머는 엄격한 조건하에서 M1M2....M j 에 혼성화가능하다 (그러므로 ssDNA는 어댑터에 연결됨).
임의의 전술한 구체예들에서, 상기 방법은 선형, 이중-가닥 연결 생성물의 라이브러리를 증폭 및/또는 정제하는 단계를 추가로 포함할 수 있다. 한 양상에서, 이중-가닥 연결 생성물은 결합되지 않은 어댑터 분자 및/또는 결합되지 않은 프라이머, 및/또는 어댑터와 그 역-보체 프라이머 간에 형성된 복합체들을 제거하도록 정제되고 크기 선택된다. 원하는 이중-가닥 연결 생성물 보다 일반적으로 더 짧은 이들 단편들을 제거하기 위해 임의의 적합한 방법들이 사용될 수 있다. 예를 들면, Qiagen사의 PCR 정제 컬럼을 사용하면 샘플들로부터 보다 작은 단편들을 제거함에 도움을 줄 수 있으며, 컬럼-정제된 샘플들을 2% 승인된 저 범위 울트라 아가로스 겔에서 정제하면 원하는 단편 크기를 선택함에 도움을 줄 수 있다. AMPure법을 비롯한 비드-기반 DNA 정제 또한 보다 작은 단편들을 제거함에 도움이 된다. 일부 구체예들에서, 원하는 이중-가닥 연결 생성물 크기는 약100bps 내지 약 600 bps, 가령, 약 100bps 내지 약 400 bps, 약 150bps 내지 약 200 bps, 약 200bps 내지 약 250 bps 그리고 약 250bps 내지 약 300 bps이다. 한 구체예에서 dsDNA (>150 bps 내지 <400 bps)는, 예를 들어, Tri-EDTA 완충액에 현탁시킨 비드들을 용리시킴으로써 정제되고, 그리고, 수집된다.
한 양상에서, 정제는 비드-기반이다. 또 다른 양상에서, 정제는 크기 선택에 기반하는데, 예를 들어, 정제 단계는 선택적으로 약 50개 뉴클레오티드 내지 약 1000개 뉴클레오티드 길이의 폴리뉴클레오티드를 정제하며, 예를 들어, 약 40개 뉴클레오티드 길이의 어댑터들 (및 약 40bp의 프라이머 이량체 및/또는 프라이머-어댑터 이중나선들)이 제거된다. 한 양상에서, 정제는, 예를 들어, 가령, Zymo 또는 Qiagen 사의 dsDNA 또는 ssDNA 정제 컬럼을 사용하는, 컬럼-기반이다.
또 다른 양상에서, 정제는, 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는다.
임의의 전술한 구체예들에서, 본 발명의 방법은 선형, 이중-가닥 연결 생성물의 라이브러리를, 예컨대, 중합효소 연쇄 반응 (PCR)으로 증폭시켜, 표적 서열의 서열 정보를 포함하는 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리를 수득하는 단계를 추가로 포함할 수 있다. 이러한 증폭은, 예를 들어, 이중-가닥 연결 생성물의 단부에 범용 어댑터 쌍을 연결시키고, 모든 태그된 이중-가닥 연결 생성물을 범용 프라이머 쌍으로 증폭시킴에 의한, 비편향 증폭 일 수 있다. 다른 구체예들에서, 비편향 증폭 대신 또는 이에 더하여 간접 증폭이 수행된다. 이러한 간접 증폭은 비편향 증폭 전 또는 후에 실시될 수 있다.
E. 이중-가닥 폴리뉴클레오티드 라이브러리의 간접 증폭.
한 양상에서 1에서 보는 바와 같이, 이중-가닥 연결 생성물 라이브러리의 간접 증폭은 어댑터에 역-보체인 및/또는 이에 혼성화가능한 서열을 포함하는 프라이머, 그리고 표적 서열 (예컨대, EGFR 유전자 서열)에 혼성화가능한 프라이머 또는 동일한 표적 서열 또는 다수의 표적 서열들에 혼성화가능한 프라이머를 사용하는 것을 포함한다.
다음 구조를 가지는 어댑터에 있어서: /5'Phos/N1N2...N i -UMI-M1M2....M j -차단기, 프라이머는 M1M2....M j 에 역-보체인 및/또는 혼성화가능한 서열을 포함한다. 이러한 방식으로, 상기 프라이머가 dsDNA 중 하나의 가닥에 혼성화하고 표적-특이적 프라이머가 dsDNA의 다른 하나의 가닥에 혼성화할 때, PCR 생성물은 표적 서열 뿐만 아니라 N1N2...N i -UMI 서열 (그리고 선택적으로, M1M2....M j 서열 모두 또는 일부)를 내포하게 될 것이다. 한 특정 예에서, 역-보체 프라이머는 서열 번호: 3: CACTCTTTCCCTACACGACGC (5' → 3')에 제시된 서열을 포함한다.
한 양상에서, 복수의 표적-특이적 프라이머들이 사용되며, 각각은 동일 또는 상이한 표적 서열에 특이적인 서열을 포함한다. 다시 말하면, 프라이머들은 동일 또는 상이한 표적 서열들을 가질 수 있다. 일부 구체예들에서, 표적-특이적 프라이머들의 풀은 약 5, 약 10, 약 25, 약 50, 약 100, 약 150, 약 200, 약 250, 약 300, 약 400, 약 500, 약 600, 약 700, 약 800, 약 900, 약 1000, 또는 약 1000개 이상의 상이한 프라이머들, 가령, 약 104, 약 105, 약 106개 또는 그 이상의 프라이머들을 포함한다. 다른 구체예들에서, 상기 풀은 약 20 내지 약 60, 약 60 내지 약 100, 약 100 내지 약 140, 약 140 내지 약 180, 약 180 내지 약 220, 약 220 내지 약 260, 약 260 내지 약 300, 약 300 내지 약 350, 또는 약 350 내지 약 400개의 상이한 프라이머들을 포함한다. 한 양상에서, 표적-특이적 프라이머들의 풀은 하나의 공통 역-보체 프라이머와 함께 사용되며, 이 때 공통 역-보체 프라이머는 상기 풀의 각각의 개개 표적-특이적 프라이머와 프라이머 쌍을 형성하여 간접 방식으로 프라이머들 간의 표적 서열을 증폭시킨다. 그러므로, 이 양상에서, 간접 증폭은 전체 게놈 증폭이 아니다.
ctDNA가 무작위로 단편화되기 때문에, 한 양상에서, 표적-특이적 프라이머의 프라이머 위치는 중요할 수 있다. 예를 들면, 프라이머 랜딩이 중단점에 이르는 경우, 전환율이 더 낮아질 수 있다. 보다 큰 표적-특이적 프라이머 풀 및/또는 동일한 표적 서열에 대해 다수의 부분 중첩 프라이머들을 사용하는 것은 이러한 문제를 해결할 수 있다.
한 양상에서, 표적 서열의 서열 정보는 돌연변이, 단일 뉴클레오티드 다형태 (SNP), 복제수 변이 (CNV), 또는 후성 변화를 포함할 수 있다. 한 양상에서, 돌연변이는 점 돌연변이, 삽입, 결실, 역전, 절두, 융합, 증폭, 또는 이의 임의의 조합을 포함한다.
일부 구체예들에서, 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리는 전체 게놈 라이브러리 이외의 라이브러리, 예를 들어, 간접 (semi-targeted) 게놈 라이브러리일 수 있다. 일부 구체예들에서, 상기 방법은 선형, 이중-가닥 연결 생성물들의 라이브러리 정제단계 및 증폭단계를 추가로 포함할 수 있다. 프라이머 이량체를 포함한 보다 작은 단편들을 제거하는 임의의 적합한 방법들이 사용될 수 있다. 예를 들면, Qiagen사의 PCR 정제 컬럼을 사용하면 샘플들로부터 보다 작은 단편들을 제거함에 도움을 줄 수 있으며, 컬럼-정제된 샘플들을 2% 승인된 저 범위 울트라 아가로스 겔에서 정제하면 원하는 단편 크기를 선택함에 도움을 줄 수 있다. AMPure 법을 비롯한 비드-기반 DNA 정제 또한 보다 작은 단편을 제거함에 도움이 된다. 일부 구체예들에서, 증폭 생성물 크기는 약100bps 내지 약 600 bps, 가령, 약 100bps 내지 약 400 bps, 약 150bps 내지 약 200 bps, 약 200bps 내지 약 250 bps, 그리고 약 250bps 내지 약 300 bps이다. 한 구체예에서 dsDNA (>150 bps 내지 <400 bps)는, 예를 들어, Tri-EDTA 완충액에 현탁시킨 비드들을 용리시킴으로써 정제되고, 그리고, 수집된다.
한 양상에서, 정제는 비드-기반이다. 또 다른 양상에서, 정제는 크기 선택에 기반하는데, 예를 들어, 정제 단계는 약 150 뉴클레오티드 길이 보다 큰 폴리뉴클레오티드들을 선택적으로 정제한다. 또 다른 양상에서, 정제는, 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는다. 한 양상에서, 정제는, 예를 들어, 가령, Zymo 또는 Qiagen 사의 dsDNA 또는 ssDNA 정제 컬럼을 사용하는, 컬럼-기반이다.
F. 서열 라이브러리의 제작 및 시퀀싱 리드의 분석.
한 양상에서, 상기 방법은 정제되고 증폭된 선형, 이중-가닥 연결 생성물의 라이브러리를 시퀀싱하는 단계를 추가로 포함한다. 한 양상에서, 시퀀싱 단계는 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 각각의 선형, 이중-가닥 연결 생성물에 부착하는 단계를 포함한다. 한 특정 양상에서, 상기 부착 단계는 중합효소 연쇄 반응 (PCR)을 사용하여 실시된다.
도 2는 시퀀싱을 위한 표적 분자를 포함하는 구조체의 예시적 구조를 보여준다. Illumina 시퀀싱에 있어서, 각 단부에서, 이들 구조체들은 유세포 결합 부위들, P5 및 P7을 가지며, 이들은 라이브러리 단편이 유세포 표면에 부착될 수 있게 한다. 단일-가닥 라이브러리 단편의 P5 및 P7 부위들은 유세포 표면의 상보적 올리고들에 어닐링된다. 유세포 올리고들은 프라이머로 기능하여 라이브러리 단편에 상보적인 가닥이 합성된다. 이어서, 원래 가닥은 세척되고, 유세포 표면에 공유 결합된 단편 복제본들이 배향 혼합물에 남게 된다. 이후 브릿지 증폭으로 각 단편의 복제본들을 생성하고 클러스터를 생성한다. 이어서, P5 영역이 끊어지고, P7 영역에 의해 부착된 단편들만 내포하는 클러스터들이 생성된다. 이렇게 하면 모든 복제본들이 동일한 방향으로 시퀀싱된다. 시퀀싱 프라이머는 해당 단편의 P5 단부에 어닐링하여 합성 과정에 의해 시퀀싱을 시작한다. 샘플을 바코드화 할 때 인덱스 리드가 수행된다. 리드 1이 끝나면, 리드 1에서 얻은 모든 것을 제거하고 인덱스 프라이머가 추가되며, 이는 해당 단편의 P7에서 어닐링하여 상기 바코드를 시퀀싱한다. 이어서, 주형으로부터 모든 내용이 제거되고 리드 1에서와 같이 브릿지 증폭에 의해 클러스터를 형성한다. 이것은 유세포 표면에 공유적으로 결합된 단편 복제본들을 배향 혼합물에 남긴다. 이번에는 P5 대신 P7을 잘라내어 P5 영역에 부착된 단편들만 내포하는 클러스터를 생성한다. 이렇게 하면 모든 복제본들이 동일한 방향으로 시퀀싱된다 (대면 리드 1). 시퀀싱 프라이머는 P7 영역에 어닐링하여 주형의 다른 쪽 단부를 시퀀싱한다.
차세대 시퀀싱 플랫폼, 가령, MiSeq (캘리포니아주, 샌디에고에 위치한 Illumina Inc.사)는, 고도의 다중화된 분석 판독에 사용될 수 있으며, 다양한 통계 도구, 가령, 비례 테스트, False Discovery Rates에 기반한 다중 비교 보정 ( Benjamini and Hochberg, 1995, Journal of the Royal Statistical Society Series 8 (Methodological) 57, 289- 300 참고), 및 다중 테스트를 위한 Bonferroni 보정을 사용하여 분석 결과를 분석할 수 있다. 또한, RNA-Seq 데이터로부터 차등 발현을 분석하기 위해 개발된 접근법을 사용하여 각각의 표적 서열에 대한 변이를 감소시키고 분석의 전반적인 검정력을 증가시킬 수 있다. Smyth, 2004, Stat, Appl. Genet. Mol. Biol. 3, Article 3 참고.
종합하면, 일부 구체예들에서, 본 발명의 방법의 전환율은 최소한 약 40%, 최소한 약 50%,. 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 90%, 또는 최소한 약 95%이다. 한 양상에서, 전환율은 시퀀싱 리드를 유발하는 초기 라이브러리 내 표적된 단일-가닥 폴리뉴클레오티드들의 백분율이다.
임의의 전술한 구체예들에서, 상기 방법은 대상체의 질환 또는 병태 진단 및/또는 예측, 치료에 대한 대상체의 반응성을 예측, 질환/병태 또는 치료에 대한 약리유전체학 마커를 식별, 및/또는 모집단을 유전 정보에 대해 스크리닝하기 위해 사용될 수 있다. 한 양상에서, 상기 질환 또는 병태는 암 또는 신생물이며, 치료는 암 또는 신생물 치료이다.
돌연변이체 DNA 분자들은 매우 특이적이기 때문에 암-관련 생물마커에 비해 우수한 고유한 이점들을 제공한다. 비록 돌연변이가 개별 정상 세포에서 낮은 비율 (약 10-9 내지 10-10 돌연변이/bp/세대)로 발생하지만, 이러한 돌연변이는 전체 정상 DNA의 작은 부분을 나타내며, 해당 분야의 특정방법의 탐지 한계 미만의 크기이다. 여러 연구에 따르면 CRC 환자의 대변, 소변 및 혈액에서 돌연변이 DNA가 탐지될 수 있는 것으로 나타났다 (Osborn and Ahlquist, Stool screening for colorectal cancer: molecular approaches, Gastroenterology 2005; 128:192-206).
본 발명의 시퀀싱 결과에 기초하여, 환자에서 순환 종양 DNA의 탐지가 이루어질 수 있고, 암의 진단 및 종양 재발에 관한 예측이 이루어질 수 있다. 예측을 기반으로 치료 및 감시 결정을 내릴 수 있다. 예를 들면, 미래의 재발을 나타내는 순환 종양 DNA는 부가적 또는 보다 공격적인 치료법, 뿐만 아니라 부가적 또는 보다 정교한 영상화 및 모니터링으로 이어질 수 있다. 순환 DNA는 종양에 이소성인 DNA를 지칭한다.
ctDNA를 모니터링 할 수 있는 샘플에는 혈액과 대변이 포함된다. 혈액 샘플은, 예를 들어, 혈액, 가령, 혈청 또는 혈장의 분획일 수 있다. 유사하게 대변은 보다 유분인 성분들로부터 DNA를 정제하기 위해 분획될 수 있다. 종양 샘플은 신체의 다른 위치에서 종양의 마커로 사용될 수 있는 종양의 체세포 돌연변이 유전자를 식별하기 위해 사용된다. 그러므로, 한 예로서, 종양 내 특정 체세포 돌연변이는 해당 분야에 공지된 임의의 표준 수단에 의해 확인될 수 있다. 통상적인 수단들에는 대립유전자-특이적 프로브, 대립유전자-특이적 증폭, 프라이머 연장, 등을 이용한 종양 DNA의 직접 시퀀싱이 포함된다. 체세포 돌연변이가 확인되면, 신체의 다른 세포들로부터 유래한 DNA와 종양 유래 DNA를 구별하기 위해, 이를 신체의 다른 구획들에서 사용할 수 있다. 체세포 돌연변이는 동일한 환자 신체의 정상적인 조직에서 발생하지 않음을 결정함으로써 확인된다. 이러한 방식으로 진단 및/또는 모니터 될 수 있는 종양의 유형들은 사실상 무제한이다. 세포 및/또는 DNA를 혈액 또는 대변 또는 다른 체액으로 방출시키는 임의의 종양이 사용될 수 있다. 이러한 종양에는 결장직장 종양 이외에도 유방, 폐, 신장, 간, 췌장, 위, 뇌, 두경부, 림프관, 난소, 자궁, 골, 혈액 의 암이 포함된다.
한 양상에서, 본 발명에 개시된 방법은 시퀀싱 및/또는 표적 서열의 하나 이상의 영역의 후성유전학적 상태/상태들을 결정함에 사용하기 위한 라이브러리를 제작하는데 사용될 수 있다. DNA 메틸화는 최초로 발견된 후성유전학적 표지였다. 후성유전학 (Epigenetics)은 변화 이외의 메커니즘에 의해 유발되는 유전자 발현 또는 세포 표현형의 변화에 대한 연구이다. 기본이 되는 DNA 서열에서, 메틸화는 주로 다이뉴클레오티드 CpG의 시토신 잔기의 탄소-5 위치에 대한 메틸기 부가를 포함하며, 전사 활성의 억압 또는 억제와 관련된다.
바이설파이트 전환은 DNA의 메틸화 패턴을 결정하기 위해 바이설파이트 시약을 사용하여 DNA를 처리하는 것이다. 바이설파이트를 이용한 DNA의 처리는 시토신 잔기를 우라실로 전환시키지만 5-메틸시토신 잔기는 영향받지 않은채로 남겨둔다. 그러므로, 바이설파이트 처리는 DNA 서열 내 특이적 변화를 도입시키며, 이는 개개 시토신 잔기의 메틸화 상태에 따라 달라진다. 이 정보를 검색하기 위해, 예를 들어, 바이설파이트 전환으로부터 생성된 단일 뉴클레오티드 다형태 (SNP)들을 서로 구별하기 위해, 변형된 서열에 대해 다양한 분석이 수행 될 수 있다. 미국 특허 제 7,620,386, 미국 특허 제 9,365,902, 및 미국 공개 특허출원 제 2006/0134643 (이들 모두는 본 명세서에 참고로 포함됨)은 바이설파이트 전환으로 인해 변형된 서열들의 탐지와 관련하여 해당 분야의 숙련된 기술자들에게 공지된 방법들을 예시한다. 바이설파이트 전환은 임의의 적합한 기술, 절차 또는 시약들을 사용하여 수행될 수 있다. 일부 구체예들에서, 바이설파이트 전환은 다음과 같은 키트 중 어느 하나 그리고 이러한 키트에 제공되는 절차들을 사용하여 수행될 수 있다: EpiMark 바이설파이트 전환 키트, New England Biosciences, E3318S, EZ DNA 메틸화 키트, Zymo Research, D5001: MethylCode 바이설파이트 전환 키트, Thermo Fisher Scientific, MECOV50; EZ DNA 메틸화 골드 키트, Zymo Research, D5005; EZ DNA 메틸화 다이렉트 키트, Zymo Research, D5020; EZ DNA 메틸화 라이트닝 키트, Zymo Research, D5030T, EpiJET 바이설파이트 전환 키트, Thermo Fisher Scientific, K1461; 또는 EpiTect 바이설파이트 키트, Qiagen, 59104.
상기 논의한 바와 같이, 바이설파이트 전환의 한 가지 결과는 서열 상보성의 손실로 인해 원래 표적의 이중-가닥 구조가 파괴된다는 것이다. 이는 이중-가닥 라이브러리를 제작하는 종래의 방법에 문제를 유발할 수 있지만, 한 양상에서, 본 발명의 방법은 시퀀싱 분석을 위해 바이설파이트 전환 샘플로부터 단일-가닥 라이브러리를 제작하기에 유일하게 적합하다.
또 다른 양상에서, 본 발명의 방법은, 예를 들어, 2017년 4월 19일 출원된 발명의 명칭 "Compositions and Methods for Detection of Genomic Variance and DNA Methylation Status"의 미국 가특허출원 제 62/487,422호 (대리인 관리 번호 737993000100) (이 문헌은 본 명세서에 그 전문이 참고로 포함됨)에 기재된 바와 같은 메틸화 상태/상태들을 결정하는 방법과 조합하여 사용될 수 있다. 한 구체예에서, 탈인산화 및/또는 변성단계 전에 샘플을 메틸화-민감성 제한 효소 (MSRE)와 접촉시키고, 이어서 본 발명에 개시된 바와 같이 연결에 의해 단일-가닥 라이브러리를 제작함으로써 메틸화 프로파일이 분석된다.
G. 라이브러리 제작 및/또는 시퀀싱을 위한 키트 .
또 다른 양상에서 본 발명은 연결 생성물의 라이브러리를 제작하기 위한 키트를 개시한다. 한 구체예에서, 상기 키트는 단일-가닥 DNA (ssDNA) 연결효소를 포함한다. 또 다른 양상에서, 상기 키트는 복수의 어댑터를 포함한다. 특정 양상들에서, 각 어댑터는 3' 단부에서 연결을 방지하기 위하여 차단되는 반면 어댑터의 5' 단부는 단일-가닥 폴리뉴클레오티드에 연결 가능하여 선형, 단일-가닥 연결 생성물을 형성한다. 또 다른 양상에서, 각 어댑터는 어댑터가 연결되는 단일- 가닥 폴리뉴클레오티드를 결정하는 고유한 분자 식별자 (UMI) 서열을 포함한다.
한 양상에서, 연결 생성물의 라이브러리 제작용 키트는 ssDNA 연결효소 및 복수의 어댑터를 포함할 수 있으며, 각 어댑터는 3' 단부에서 연결을 방지하기 위해 차단되는 반면 어댑터의 5' 단부는 단일-가닥 폴리뉴클레오티드에 연결 가능하여 선형, 단일-가닥 연결 생성물을 형성하고, 그리고 각 어댑터는 단일-가닥 폴리뉴클레오티드를 결정하는 UMI 서열을 포함한다.
또 다른 양상에서, 상기 키트는 단일-가닥 폴리뉴클레오티드를 얻기 위해 샘플로부터의 이중-가닥 폴리뉴클레오티드를 변성시키는 변성화 시약을 추가로 포함할 수 있다.
임의의 전술한 구체예들에서, 상기 키트는 테르무스 ( thermus ) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigase™및 CircLigase II™) 또는 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methcmobacterium thermoauiotrophicum) RNA 연결효소 1을 포함할 수 있다. 임의의 전술한 구체예들에서, 상기 키트는 RNA 연결효소, 가령, T4 RNA 연결효소, 예컨대, T4 RNA 연결효소 2, T4 RNA 연결효소 2 절두형, T4 RNA 연결효소 2 절두형 KQ, 또는 T4 RNA 연결효소 2 절두형 K227Q를 포함할 수 있다. 본 발명의 키트는 또한 다른 적합한 ssDNA 연결효소, 예컨대, T4 RNA 연결효소 1, 열안정성 5' App DNA/RNA 연결효소, T4 RNA 연결효소 2, 절두형 T4 RNA 연결효소 2, 예컨대, T4 RNA 연결효소 2 절두형, T4 RNA 연결효소2 절두형 K227Q, T4 RNA 연결효소2 절두형 KQ, 또는 T4 DNA 연결효소를 포함할 수 있다.
한 양상에서, 상기 키트는 연결 반응을 위한 크라우딩제를 추가로 포함할 수 있다. 한 양상에서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000 또는 PEG 6000, 덱스트란, 및/또는 Ficoll을 포함한다.
또 다른 양상에서, 상기 키트는 단일-가닥 폴리뉴클레오티드를 이중-가닥 폴리뉴클레오티드로 전환시키기 위해, 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 한 세트의 프라이머들을 추가로 포함할 수 있다.
한 양상에서, 상기 키트는 프라이머 이량체 및/또는 프라이머-어댑터 이중나선을 제거하기 위한 시약을 추가로 포함할 수 있다.
또 다른 양상에서, 상기 키트는 표적 서열의 서열 정보를 포함하는 증폭된 선형, 이중-가닥 연결 생성물을 수득하기 위하여 표적 서열 (예컨대, EGFR 유전자 서열)에 특이적인 서열을 포함하는 프라이머를 추가로 포함할 수 있다. 한 또 다른 양상에서, 상기 키트는 증폭된 선형, 이중-가닥 연결 생성물을 시퀀싱하기 위한, 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 추가로 포함할 수 있다.
상기 기재된 키트 성분들에 기초한 진단 키트가 또한 제공되며, 이들은 대상체의 질환 또는 병태, 예를 들어, 암을 진단하는데 사용될 수 있다. 또 다른 양상에서, 키트는 약물, 요법, 치료 또는 이들의 조합에 대한 개체의 반응을 예측하는데 사용될 수 있다. 이러한 테스트 키트는 의료 제공자의 도움없이도 대상체가, 예컨대, ctDNA의 샘플을 수득함에 사용할 수 있는 장치 및 설명서를 포함 할 수 있다.
상기 기재한 또는 제시한 분야에 사용하기 위한 제조업체의 키트 또는 물품이 또한 제공된다. 이러한 키트는 질환 또는 병태에 대한 마커를 유전자형 분석함에 특이적인 최소한 하나의 시약을 포함할 수 있으며, 본 명세서에 기재된 방법을 실시하기 위한 설명서를 추가로 포함 할 수 있다.
일부 구체예들에서, 프라이머 및 프라이머 쌍을 포함하는 조성물 및 키트가 제공되며, 이는 폴리뉴클레오티드 또는 이의 임의의 특정 부분, 그리고 정성적 또는 정량적 탐지를 목적으로 핵산 분자 또는 이의 임의의 일부분에 선택적으로 또는 특이적으로 혼성화되는 프로브의 특이적 증폭을 가능하게한다. 프로브는, 탐지가능한 마커, 가령, 예를 들어, 방사성 동위원소, 형광 화합물, 생물발광 화합물, 화학발광 화합물, 금속 킬레이터 또는 효소로 표지될 수 있다. 이러한 프로브 및 프라이머는 샘플에서 폴리뉴클레오티드의 존재를 탐지하기 위해 그리고 폴리뉴클레오티드에 의해 인코드되는 세포 발현 단백질을 탐지하기 위한 수단으로서 사용될 수 있다. 해당 분야의 숙련된 기술자에 의해 이해되는 바와 같이, 본 발명에 제공된 서열에 기초하여 매우 많은 상이한 프라이머 및 프로브가 제조되고, 폴리뉴클레오티드, 가령, 게놈 DNA, mtDNA 및 이의 단편들의 존재 및/또는 수준을 증폭, 클로닝 및/또는 결정함에 효과적으로 사용될 수 있다.
일부 구체예들에서, 상기 키트는 폴리펩티드의 존재를 탐지하기 위한 시약들을 추가로 포함할 수 있다. 이러한 시약들은 폴리펩티드에 특이적으로 결합하는 항체 또는 다른 결합 분자들일 수 있다. 일부 구체예들에서, 이러한 항체 또는 결합 분자는 다형태의 결과로서 폴리펩티드에 대한 구조적 변이를 구별할 수 있으며, 그러므로 유전자형 분석에 사용될 수 있다. 항체 또는 결합 분자들은, 탐지가능한 마커, 가령, 예를 들어, 방사성 동위원소, 형광 화합물, 생물발광 화합물, 화학발광 화합물, 금속 킬레이터 또는 효소로 표지될 수 있다. 결합 분석, 가령, ELISA를 수행하기 위한 다른 시약이 키트에 포함될 수 있다.
일부 구체예들에서, 키트는 최소한 2개, 최소한 3개, 최소한 5개, 최소한 10개의 마커를 유전자형 분석하기 위한 시약을 포함한다. 마커는 폴리뉴클레오티드 마커 (가령, 암-관련 돌연변이 또는 SNP) 또는 폴리펩티드 마커 (가령, 과발현 또는, 단백질의 고인산화 또는 저인산화를 포함한 번역후 변형) 또는 이의 임의의 조합일 수 있다. 일부 구체예들에서, 키트는 증폭된 핵산을 탐지하기 위한 포획 프로브를 위한 표면 또는 기질 (가령, 마이크로어레이)을 추가로 포함 할 수 있다.
키트는 하나 이상의 용기 수단을 좁은 공간에 수용하기 위하여 구획화되는 담체 수단, 가령, 바이얼, 튜브 등을 추가로 포함할 수 있으며, 각각의 용기 수단은 해당 방법에서 사용되는 별도의 구성성분들 중 하나를 포함한다. 예를 들면, 용기 수단들 중 하나는 탐지가능하게 표지되는 또는 표지될 수 있는 프로브를 포함 할 수 있다. 이러한 프로브는 생물마커에 특이적인 폴리뉴클레오티드 일 수 있다. 키트는 또한 표적 핵산 서열의 증폭을 위한 뉴클레오티드(들)을 함유하는 용기 및/또는 리포터 분자, 가령, 효소, 형광 또는 "방사성 동위원소 표지"에 결합된 리포터-수단을 포함하는 용기를 가질 수 있다.
키트는 전형적으로 상기 기재된 용기(들) 그리고 완충제, 희석제, 필터, 바늘, 주사기 및 패키지 삽입물을 포함하여 상업적 및 사용자 관점에서 필요한 물질을 포함하는 하나 이상의 다른 용기를 사용설명서와 함께 포함한다. 라벨은 조성물이 특정 요법 또는 비-치료적 적용에 사용됨을 표시하기 위해 용기에 제공될 수 있고, 또한 상기 기재된 바와 같은 생체내 또는 시험관내 사용을 위한 지시사항을 표시할 수 있다.
키트는 조직 또는 세포 또는 체액 샘플을 준비하고 샘플로부터 핵산 (가령, ctDNA)을 준비하기 위한 일련의 설명서 및 재료를 추가로 포함할 수 있다.
H. 또 다른 예시적 구체예들
임의의 전술한 구체예들에서, ssDNA 연결효소는 테르무스 ( thermus ) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigase™ 및 CircLigase II™) 또는 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methcmobacterium thermoauiotrophicum) RNA 연결효소 1을 포함할 수 있다. 다른 양상들에서, ssDNA 연결효소는 RNA 연결효소, 가령, T4 RNA 연결효소, 예컨대, T4 RNA 연결효소 I, 예컨대, New England Biosciences, M0204S, T4 RNA 연결효소 2, 예컨대, New England Biosciences, M0239S, T4 RNA 연결효소 2 절두형, 예컨대, New England Biosciences, M0242S, T4 RNA 연결효소 2 절두형 KQ, 예컨대, M0373S, 또는 T4 RNA 연결효소 2 절두형 K227Q, 예컨대, New England Biosciences, M0351S이다. 임의의 전술한 구체예들에서, ssDNA 연결효소는 또한 열안정성 5' App DNA/RNA 연결효소, 예컨대, New England Biosciences, M03I9S, 또는 T4 DNA 연결효소, 예컨대, New England Biosciences, M0202S 일 수도 있다.
일부 구체예들에서, 본 발명의 방법들은 단일-가닥 DNA (ssDNA) 연결효소를 사용하여 단일-가닥 폴리뉴클레오티드들의 라이브러리에 한 세트의 어댑터를 연결시키는 단계를 포함한다. 본 명세서에 개시된 것들을 비롯한 임의의 적합한 ssDNA 연결효소가 사용될 수 있다. 어댑터들은 임의의 적합한 수준 또는 농도, 예컨대, 약 1 μM 내지 약 100 μM, 가령, 약 1 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 또는 100 μM, 또는 이의 하위범위로 사용될 수 있다. 어댑터는 임의의 적합한 서열 또는 염기를 포함하거나 이것으로 시작할 수 있다. 예를 들면, 어댑터 서열은 모든 2 bp 염기 조합으로 시작할 수 있다.
일부 구체예들에서, 연결 반응은 크라우딩제의 존재하에서 수행될 수 있다. 한 양상에서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000, PEG 6000, 또는 PEG 8000, 덱스트란, 및/또는 Ficoll을 포함한다. 크라우딩제, 예컨대, PEG는 임의의 적합한 수준 또는 농도로 사용될 수 있다. 예를 들면, 크라우딩제, 예컨대, PEG는, 약 0% (w/v) 내지 약 25% (w/v), 예컨대, 약 0% (w/v), 1 % (w/v), 2% (w/v), 3% (w/v), 4%(w/v), 5% (w/v), 6% (w/v), 7%(w/v), 8% (w/v), 9%(w/v), 10% (w/v), 11%(w/v), 12% (w/v), 13%(w/v), 14% (w/v), 15% (w/v), 16% (w/v), 17% (w/v), 18% (w/v), 19% (w/v), 20% (w/v), 21% (w/v), 22% (w/v), 23% (w/v), 24% (w/v), 또는 25% (w/v), 또는 이의 임의의 하위범위의 수준 또는 농도로 사용될 수 있다.
일부 구체예들에서, 연결 반응은 임의의 적합한 길이의 시간 동안 수행될 수 있다. 예를 들면, 연결 반응은 약 2 내지 약 16 시간, 예컨대, 약 2 시간, 3 시간, 4 시간, 5 시간, 6 시간, 7 시간, 8 시간, 9 시간, 10 시간, 11 시간, 12 시간, 13 시간, 14 시간, 15 시간, 또는 16 시간, 또는 이의 임의의 하위범위의 시간 동안 수행될 수 있다.
일부 구체예들에서, 연결 반응에서 ssDNA 연결효소는 임의의 적합한 부피로 사용될 수 있는데, 예를 들면, 연결 반응에서 ssDNA 연결효소는 약 0.5 μl 내지 약 2 μl, 예컨대, 약 0.5 μl, 0.6 μl, 0.7 μl, 0.8 μl, 0.9 μl, 1 μl, 1.1 μl, 1.2 μl, 1.3 μl, 1.4 μl, 1.5 μl, 1.6 μl, 1.7 μl, 1.8 μl, 1.9 μl, 또는 2 μl, 또는 이의 임의의 하위범위의 부피로 사용될 수 있다.
일부 구체예들에서, 연결 반응은 연결 인핸서, 예컨대, 베타인의 존재하에서 수행될 수 있다. 연결 인핸서, 예컨대, 베타인은 임의의 적합한 부피로, 예컨대, 약 0 μl 내지 약 1 μl, 예컨대, 약 0 μl, 0.1 μl, 0.2 μl, 0.3 μl, 0.4 μl, 0,5 μl, 0.6 μl, 0.7 μl, 0.8 μl, 0.9 μl, 1 μl, 또는 이의 임의의 하위범위로 사용될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적인 반응 혼합물 (20 μl) 중의 T4 RNA 연결효소 I, 예컨대, New England Biosciences사의 T4 RNA 연결효소 I, M0204S를 사용하여 수행될 수 있다: 1 X 반응 완충액 (50 mM Tris-HCl, pH 7.5, 10 mM MgCl2, 1 mM DTT), 25% (중량/부피) PEG 8000, 1 mM 헥사민 코발트 클로라이드 (선택사항), 1 μl (10 유닛) T4 RNA 연결효소, 및 1 mM ATP. 반응은 25℃에서 16 시간 동안 배양될 수 있다. 반응은 40 μl의 10 mM Tris-HCl pH 8.0, 2.5 mM EDTA를 추가하여 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적인 반응 혼합물 (20 μl) 중의 열안정성 5' App DNA/RNA 연결효소, 예컨대, New England Biosciences사의 열안정성 5' App DNA/RNA 연결효소, M0319S를 사용하여 수행될 수 있다: ssDNA/RNA 기질 20 pmol (1 pmol/μl), 5' App DNA 올리고뉴클레오티드 40 pmol (2 pmol/μl), 10X NEBuffor 1 (2 μl), 50 mM MnCl2 (ssDNA 연결만을 위함) (2 μl), 열안정성 5' App DNA/RNA 연결효소 (2 μl (40 pmol)), 및 뉴클레아제가 없는 물 (최대 20 μl). 반응은 65 ℃에서 1 시간 동안 배양될 수 있다. 반응은 90℃에서 3분 동안 가열함으로써 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적 반응 혼합물 (20 μl) 중의 T4 RNA 연결효소 2, 예컨대, New England Biosciences사의 T4 RNA 연결효소 2, M0239S를 사용하여 수행될 수 있다: T4 RNA 연결효소 완충액 (2 μl), 효소 (1 μl), PEG (10 μl), DNA (1 μl), 어댑터 (2 μl), 및 물 (4 μl). 반응은 25℃에서 16 시간 동안 배양될 수 있다. 반응은 65℃에서 20분 동안 가열함으로써 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적 반응 혼합물 (20 μl) 중의 T4 RNA 연결효소 2 절두형, 예컨대, New England Biosciences사의 T4 RNA 연결효소 2 절두형, M0242S를 사용하여 수행될 수 있다: T4 RNA 연결효소 완충액 (2 μl), 효소 (1 μl), PEG (10 μl), DNA (1 μl), 어댑터 (2 μl), 및 물 (4 μl). 반응은 25℃에서 16 시간 동안 배양될 수 있다. 반응은 65℃에서 20분 동안 가열함으로써 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적 반응 혼합물 (20 μl) 중의 T4 RNA 연결효소 2 절두형 K227Q, 예컨대, New England Biosciences사의 T4 RNA 연결효소 2 절두형 K227Q, M0351S를 사용하여 수행될 수 있다: T4 RNA 연결효소 완충액 (2 μl), 효소 (1 μl), PEG (10 μl), DNA (1 μl), 아데닐화 어댑터 (0.72 μl), 및 물 (5.28 μl). 반응은 25℃에서 16 시간 동안 배양될 수 있다. 반응은 65℃에서 20분 동안 가열함으로써 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적 반응 혼합물 (20 μl) 중의 T4 RNA 연결효소 2 절두형 KQ, 예컨대, New England Biosciences사의 T4 RNA 연결효소 2 절두형 KQ, M0373S를 사용하여 수행될 수 있다: T4 RNA 연결효소 완충액 (2 μl), 효소 (1 μl), PEG (10 μl), DNA (1 μl), 아데닐화 어댑터 (0.72 μl), 및 물 (5.28 μl). 반응은 25℃에서 16 시간 동안 배양될 수 있다. 반응은 65℃에서 20분 동안 가열함으로써 중단될 수 있다.
일부 구체예들에서, 연결 반응은 다음과 같은 예시적 반응 혼합물 (20 μl) 중의 T4 DNA 연결효소, 예컨대, New England Biosciences사의 T4 DNA 연결효소, M0202S를 사용하여 수행될 수 있다: T4 RNA 연결효소 완충액 (2 μl), 효소 (1 μl), PEG (10 μl), DNA (1 μl), 아데닐화 어댑터 (0.72 μl), 및 물 (5.28 μl). 반응은 16℃에서 16 시간 동안 배양될 수 있다. 반응은 65℃에서 10분 동안 가열함으로써 중단될 수 있다.
두 번째 가닥 합성 단계는 임의의 적합한 효소를 사용하여 수행될 수 있다. 예를 들면, 두 번째 가닥 합성 단계는 Bst 중합효소, 예컨대, New England Biosciences사, M0275S 또는 클레나우 단편 (3' →5' 엑소-), 예컨대, New England Biosciences사, M0212S를 사용하여 수행될 수 있다.
일부 구체예들에서, 두 번째 가닥 합성 단계는 다음과 같은 예시적 반응 혼합물 (10 μl) 중의 Bst 중합효소, 예컨대, New England Biosciences사, M0275S를 사용하여 수행될 수 있다: 물 (1.5 μl), 프라이머 (0.5 μl), dNTP (1 μl), ThermoPol 반응 완충액 (5 μl), 및 Bst (2 μl). 반응은 62℃에서 2분 동안 그리고 65℃에서 30분 동안 배양될 수 있다. 반응 후, 이중 가닥 DNA 분자들은 추가로 정제될 수 있다.
일부 구체예들에서, 두 번째 가닥 합성 단계는 다음과 같은 예시적 반응 혼합물 (10 μl) 중의 클레나우 단편 (3'→5' 엑소-), 예컨대, New England Biosciences사, M0212S를 사용하여 수행될 수 있다: 물 (0.5 μl), 프라이머 (0.5 μl), dNTP (1 μl), NEB 완충액 (2 μl), 및 엑소- (3 μl). 반응은 37℃에서 5분 동안 그리고 75℃에서 20분 동안 배양될 수 있다. 반응 후, 이중 가닥 DNA 분자들은 추가로 정제될 수 있다.
두 번째 가닥 합성 후, 첫번째 또는 간접 PCR 전에, 이중 가닥 DNA는 정제될 수 있다. 이중 가닥 DNA는 임의의 적합한 기술 또는 절차를 사용하여 정제될 수 있다. 예를 들면, 이중 가닥 DNA는 다음 키트들 중 어느 하나를 사용하여 정제될 수 있다: Zymo 세척 및 농축장치, Zymo research, D4103; Qiaquick, Qiagen, 28104; Zymo ssDNA 정제 키트, Zymo Research, D7010; Zymo 올리고 정제 키트, Zymo Research, D4060; 및 AmpureXP 비드, Beckman Coulter, A63882: 1.2x-4x 비드 비율.
1차 또는 간접 PCR은 임의의 적합한 효소 또는 반응 조건을 사용하여 수행될 수 있다. 예를 들면, 폴리뉴클레오티드 또는 DNA 가닥들은 약 52℃ 내지 약 72℃의 온도 범위, 예컨대, 약 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 67℃, 68℃, 69℃, 70℃, 71℃, 또는 72℃, 또는 이의 임의의 하위범위의 온도 범위에서 어닐링 될 수 있다. 1차 또는 간접 PCR은 임의의 적합한 주기 횟수 동안 수행될 수 있다. 예를 들면, 1차 또는 간접 PCR은 10-40 주기 동안, 예컨대, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 주기 동안 수행될 수 있다. 프라이머 풀은 임의의 적합한 농도로 사용될 수 있다. 예를 들면, 프라이머 풀은 약 5 nM 내지 약 200 nM의 농도 범위, 예컨대 약 5 nM, 6 nM, 7 nM, 8 nM, 9 nM, 10 nM, 20 nM, 30 nM, 40 nM, 50 nM, 60 nM, 70 nM. 80 nM, 90 nM, 100 nM, 110 nM, 120 nM, 130 nM, 140 nM, 150 nM, 160 nM, 170 nM, 180 nM, 190 nM, 또는 200 nM로, 또는 이의 임의의 하위범위로 사용될 수 있다.
1차 또는 간접 PCR은 임의의 적합한 온도 주기 조건을 사용하여 수행될 수 있다. 예를 들면, 1차 또는 간접 PCR은 다음과 같은 주기 조건들 중 어느 하나를 사용하여 수행될 수 있다: 95℃ 3 분, (95℃ 15 초, 62℃ 30 초, 72℃ 90 초) x3 또는 x5, 또는 (95℃ 15 초, 72℃ 90 초) x23 또는 x 21, 72℃ 1 분, 4℃ 계속.
일부 구체예들에서, 1차 또는 간접 PCR은 다음과 같은 예시적 반응 혼합물 (50 μl) 중 KAPA SYBR FAST, 예컨대, KAPA biosciences사, KK4600을 사용하여 수행될 수 있다: DNA (2 μl), KAPASYBR (25 μl), 프라이머 풀 (각 26nM) (10 μl), Aprimer (100 μM) (4 μl), 및 물 (12.6 μl). 1차 또는 간접 PCR은 다음과 같은 주기 조건들 중 어느 하나를 사용하여 수행될 수 있다: 95℃ 30 초, (95℃ 10 초, 50-56℃ 45 초, 72℃ 35 초) x40.
일부 구체예들에서, 1차 또는 간접 PCR은 다음과 같은 예시적 반응 혼합물 (50 μl) 중 KAPA HiFi, 예컨대, KAPA Biosciences, KK2601을 사용하여 수행될 수 있다: DNA (15 μl), KAPAHiFi (25 μl), 프라이머 풀 (각 26nM) (10 μl), 및 Aprimer (100 μM) (0.4 μl). 1차 또는 간접 PCR은 다음과 같은 주기 조건들 중 어느 하나를 사용하여 수행될 수 있다: 95℃ 3 분, (98℃ 20 초, 53-54℃ 15 초, 72℃ 35 초) x15, 72℃ 2분, 4℃ 계속.
바이설파이트 전환은 임의의 적합한 기술, 절차 또는 시약들을 사용하여 수행될 수 있다. 일부 구체예들에서, 바이설파이트 전환은 다음과 같은 키트 중 어느 하나 그리고 이러한 키트에 제공되는 절차들을 사용하여 수행될 수 있다: EpiMark 바이설파이트 전환 키트, New England Biosciences, E3318S, EZ DNA 메틸화 키트, Zymo Research, D5001: MethylCode 바이설파이트 전환 키트, Thermo Fisher Scientific, MECOV50; EZ DNA 메틸화 골드 키트, Zymo Research, D5005; EZ DNA 메틸화 다이렉트 키트, Zymo Research, D5020; EZ DNA 메틸화 라이트닝 키트, Zymo Research, D5030T, EpiJET 바이설파이트 전환 키트, Thermo Fisher Scientific, K1461; 또는 EpiTect 바이설파이트 키트, Qiagen, 59104.
일부 구체예들에서, DNA 분자는 실시예 4에서 설명된 절차를 사용하여 제조될 수 있는데, 이 절차는 단일-가닥 폴리뉴클레오티드를 제작, 단일-가닥 폴리뉴클레오티드 라이브러리의 이중-가닥 폴리뉴클레오티드 라이브러리로의 전환, 이중-가닥 폴리뉴클레오티드 라이브러리의 간접 증폭, 및 서열 라이브러리의 제작 단계들을 포함한다. 이러한 DNA 분자들은 임의의 적합한 방법 또는 절차들을 사용하여 메틸화 상태에 대해 추가로 분석될 수 있다.
I. 실시예
실시예 1
본 실시예에서, 주형들 (예컨대, 시퀀싱될 폴리뉴클레오티드)은 약 200 bp길이 미만의 짧은 DNA 단편이다. 이들 DNA 단편은 혈장으로부터 추출된 DNA, 효소-처리된 (예컨대, 단편화효소) 게놈 DNA, 또는 물리적으로 전단된 DNA를 포함할 수 있다. 물리적으로 전단된 DNA는 단부 복구될 수 있다. 특정 양상들에서, 주형은 연결을 위한 3' 하이드록실기를 가진다.
전형적으로, 10-30 ng의 적절하게 제조된 주형 DNA는, 예를 들어, 100 mM MOPS (pH 7.5), 20 mM KCl, 10 mM MgCl2, 2 mM DTT, 및 5 mM MnCl2 중의 1 U FastAP 열민감성 알칼리 인산분해효소 (Thermo Scientific)를 사용하여 37℃에서 10분 동안 탈인산화되었다. 이어서 DNA를, 예를 들어, 95℃에서 2분 동안 변성시키고, 얼음 위에 1분 동안 두었다.단일-가닥 어댑터는 5' 포스페이트기 및 3' 탄소 스페이서를 가진 IDT로부터 합성되었다. 5' 단부는 GA 및 이에 이어서 12-량체 고유 분자 식별자 (UMI) 서열을 내포한다. 통상적인 단일-가닥 어댑터는 다음 서열을 가진다: /5Phos/GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG/3SpC3/,("5Phos"는 5' 포스페이트기를 나타내고, "NNNNNNNNNNNN"은 12-량체 UMI 서열을 나타내고, "3SpC3"은 3' 탄소 스페이서를 나타냄).
이어서 탈인산화된, 단일-가닥 DNA를 주형으로 사용하여 연결 반응을 실시하였다. 다음과 같은 최종 농도들이 연결 반응에서 사용되었다: 50 mM MOPS (pH 7.5), 10 mM KCl, 5 mM MgCl2, 1 mM DTT, 및 2.5 mM MnCl2, 50% PEG 4000, 0.5 uM 어댑터, 125 uM ATP, 및 200 U Epicentre CircLigase™ 반응을 60℃에서 2 시간 동안, 80℃에서 10분 동안, 85℃에서 2분 동안 배양하고, 4℃에서 보류시켰다.
이어서 이전의 반응 부피를 다음에 추가함으로써 DNA를 이중-가닥화하였다: 10 mM Tris-HCI (pH 8.3), 50 mM KCl, 1.5 mM MgCl2, 1.25 U Taq DNA 중합효소 (NEB), 1 uM 역-보체 프라이머 (어댑터에 역-보체인 프라이머), 및 200 uM dNTP 믹스. 반응을 95℃에서 30초 동안, 62℃에서 2분 동안, 68℃에서 10분 동안 배양하고, 4℃에서 보류시켰다. 전형적인 역-보체 프라이머는 서열 번호: 3: CACTCTTTCCCTACACGACGC (5' → 3')에 제시된 서열을 포함한다. 다음은 어댑터와 역-보체 프라이머 사이의 정렬이다:
Figure pct00001
이어서 반응을 1.6 (비드 비율)/AmPure® XP 비드를 사용하여 정제하였다. 비드를 추가하고 10분 동안 배양하였다. 이어서 혼합물이 5분 동안 마그넷으로 이동되었다. 다음으로 상청액을 제거하였다. 비드들을 각각 150 μl 80% 에탄올로 30 초 동안 2X 세척하였다. 이어서 모든 잔부 에탄올을 제거하고 비드들을 3분 동안 실온에서 마그넷에서 떨어뜨려 건조시켰다. 15 μl의 저 TE 완충액 (Thermo Fisher)을 비드들에 추가하고 2분 동안 배양하였다. 이어서 비드들이 1분 동안 마그넷으로 회수되었다. 상청액을 제거하고 다음 반응을 위해 보관하였다. 한 양상에서, 비드 비율은 정제 공정에서 크기 선택성을 유발하며, 약 100 bp 보다 짧은 분자를 제거하는 비드 비율 (가령, 1.6 x)이 선택될 수 있다.
프라이머-프라이머 상호작용 및 오프-타겟 어닐링을 최소화하기 위한 한 세트의 PCR 프라이머를 설계하였다. 특정 변이체들에 근접하여 랜드(land)하도록 프라이머들을 추가로 최적화하였다. 설계되었을 때, 프라이머들은 IDT에 의해 합성되었다. 프라이머들은 동일 부피 비율로 프라이머 풀에 혼합되었다. 간접 PCR 반응은 다음 시약들을 사용하여 수행되었다: 이전 반응으로부터 얻은 정제된 DNA 모두, 1 x KAPA 2G 멀티플렉스 마스터 믹스, 풀로부터 얻은 각 66 nM의 프라이머, 및 800 nM 역-보체 프라이머. 반응은 다음 열-주기 프로그램을 거쳤다: 95℃ 3 분, (95℃ 15 초, 72℃ 90 초) x 20, 72℃ 1 분, 및 4℃에서 보류.
이어서 반응을 1.6 (비드 비율) x AmPure®XP 비드를 사용하여 정제하였다. 비드들을 추가하고 10분 동안 배양하였다. 이어서 혼합물이 5분 동안 마그넷으로 이동되었다. 다음으로 상청액을 제거하였다. 비드들을 각각 150 μl 80% 에탄올로 30 초 동안 2X 세척하였다. 이어서 모든 잔부 에탄올을 제거하고 비드들을 3분 동안 실온에서 마그넷에서 떨어뜨려 건조시켰다. 20 μl의 저 TE 완충액 (Thermo Fisher)을 비드들에 추가하고 2분 동안 배양하였다. 이어서 비드들이 1분 동안 마그넷으로 회수되었다. 상청액을 제거하고 다음 반응을 위해 보관하였다. 유리 어댑터 분자, 유리 프라이머 분자, 및/또는 어댑터/프라이머 이량체를 포함하여, 약 100 bp 보다 짧은 분자들을 제거하는 비드 비율 (가령, 1.6 X)이 선택될 수 있다.
이어서 전장 시퀀싱 어댑터 및 샘플 특이적 바코드를 추가하기 위하여 또 다른 PCR 반응이 완료되었다. PCR 반응은 다음을 포함하였다: 이전 반응으로부터 얻은 2 μl 정제된 DNA, 1 x NEB 울트라 Q5 II 마스터 믹스, 400 nM 범용 프라이머, 및 400 nM 바코드 특이적 프라이머. 반응은 다음 열-주기 프로그램을 거쳤다: 95℃ 3 분, (98℃ 10 초, 65℃ 75 초) x 10, 65℃ 2 분, 및 4℃에서 보류.
이어서 반응을 0.8 (비드 비율) x AmPure®XP 비드를 사용하여 정제하였다. 비드들을 추가하고 10분 동안 배양하였다. 이어서 혼합물이 5분 동안 마그넷으로 이동되었다. 다음으로 상청액을 제거하였다. 비드들을 각각 150 μl 80% 에탄올로 30 초 동안 2X 세척하였다. 이어서 모든 잔부 에탄올을 제거하고 비드들을 3분 동안 실온에서 마그넷에서 떨어뜨려 건조시켰다. 25 μl의 저 TE 완충액 (Thermo Fisher)을 비드들에 추가하고 2분 동안 배양하였다. 이어서 비드들은 1분 동안 마그넷으로 회수되었다. 상청액을 제거하면 시퀀싱 준비가 된다. 약 200 bp 보다 짧은 대다수의 분자들을 제거하는 비드 비율 (가령, 0.8 x)이 선택될 수 있다.
실시예 2
본 실시예에서, 공지된 변이체를 가진 게놈 DNA (gDNA) 샘플들 및 혈장 샘플들 모두를 10 ng 및 20 ng 입력을 사용하여 테스트한다. gDNA 샘플들은 단일 뉴클레오티드 변이체 (SNV, "단일 뉴클레오티드 변화" SNC와 호환적으로 사용됨), 삽입-결실, CNV, 및 융합을 내포하였다. 각 변이체는 다양한 대립유전자 분율에서 정의되었다: 5%, 1%, 0.5%, 및 0.1%. 각각의 돌연변이 유형에 대한 각 대립유전자 분율에서의 민감도 및 특이성을 측정 하였다. 여기서 사용된 프라이머 풀을 표 1에 제시한다. 각각의 표적-특이적 프라이머는 전체 풀에 대해 동일한 부피 비율로 또는 상이한 부피 비율로 사용될 수 있다. 예를 들면,부피 비율 2의 프라이머의 경우, 이 프라이머는 비율 1의 프라이머의 2 x 부피로 추가된다.
표 1:
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
한 양상에서, 본 발명의 방법은 특정 유전자 좌위에서 증가된 민감도를 구현할 수 있다. 아래 표 2에서, 본 발명의 방법을 종래의 하이브리드 포획 방법과 비교한다. 본 발명의 방법은 하이브리드 포획에 의해 소실된 몇 가지 유전자 좌위를 정의하며, 이는 본 발명의 방법의 증가된 전환율과 직접 관련되는 것이다.
표 2:
Figure pct00016
~80%의 매우 높은 연결 효율성이 구현되었고, 그 결과 전환율은 ~60%였으며, 이에 비해 표준 라이브러리에서는 각각 ~25% 및 10% 였다. 본 발명의 방법의 예시적인 전환율을 표 3에 제시한다.
표 3:
Figure pct00017
Figure pct00018
Figure pct00019
도 6에서 보는 바와 같이, 상기 분포는 전환율이 하이브리드 포획에서 보다 본 발명의 방법에서 유의하게 더 높아짐을 보여준다. 본 실시예에서, 종래의 혼성화 포획 방법은 약 47%의 전환율을 구현할 수 있는 반면, 본 발명의 방법은 약 88%의 훨씬 더 높은 전환율을 구현한다. 이러한 유의하게 더 높은 전환율은, 단일 반응에서 수백 개의 유전자 좌위에 걸쳐 다중화 할 수 있는 능력과 함께, 본 발명의 방법을 폴리뉴클레오티드, 특히 매우 낮은 대립유전자 분율을 갖는 샘플, 가령, 암 관련 SNP 및 / 또는 돌연변이를 보유하는 ctDNA의 고속 처리 및 높은 정확성의 시퀀싱 및 분석에 이상적이게 한다.
또한, 매우 작은 표적 영역들 (~30,000개 염기)에 대한 온-타겟 비율은 최대 70%이고 이는 >40,000 x의 농축 인자 (enrichment factors)를 생성하며, 이에 비해 표준 라이브러리에 대한 농축 인자는 ~2000 x 이다. 향상된 효율성으로 인해 민감도가 커지게 되어 많은 변이체들에서 0.1 %까지 정확한 정의가 가능하다. SNV, 삽입-결실, CNV, 및 융합이 정확하게 정의되었다. 더욱이, 상기 절차는 0%의 실패율로 매우 강력하다.
실시예 3
이 실시예에서, 예를 들어, 순환 종양 DNA로부터 단일 뉴클레오티드 변화 (SNC), 삽입-결실, 복제수 변이 (CNV) 및 융합을 조사하기 위하여 추출된 혈장 DNA로부터 라이브러리를 구축하는 방법을 설명한다. 이 실시예의 한 원리로서, (예컨대, 인간으로부터) 추출된 혈장 DNA는 탈인산화되고 변성된다. 단일 가닥 DNA 연결은 각 분자의 3' 단부에 범용 어댑터를 추가한다. 이어서 DNA는 어댑터에 대한 역-보체 프라이머 및 부위-특이적 프라이머를 사용한 간접 PCR을 거친다. 전장 어댑터 및 바코드를 각 분자에 추가하기 위한 두 번째 PCR로 라이브러리가 제조된다.
본 실시예에서 사용되는 장비, 재료 및 소모품은 다음을 포함한다: Veriti 써모사이클러, 96 웰 마그넷, 96 웰 아이스 블록, 볼텍서, 플레이트 미니 원심분리기, 반-스커트형 96 웰 PCR 플레이트, 플레이트 씰, 피펫, 및 피펫 팁.
본 실시예에서 사용되는 시약 및 배지는 다음을 포함한다: 뉴클레아제가 없는 물 (Ambion/Thermo: AM9939), 저 TE 완충액 (Thermo fisher: 12090015), CircLigase 키트 (Epicenter: CL4115K), FastAP (Thermo Fisher: EF0651), 50% PEG 4000 (Sigma: 95904-250g- F. 뉴클레아제가 없는 물 Ambion/Thermo: AM9939 10 mL 중에 5g 희석), 10 μM N12 어댑터 (IDT), Taq 중합효소 (NEB: M0273S), dNTP 믹스 (NEB: N0447L), 표준 Taq 완충액 (NEB: M0273S), Ampure XP 비드 (Agincourt/Beckman Coulter: A63881), 100 μM 역 보체 프라이머 (IDT), 프라이머 믹스 (IDT), KAPA 2G 멀티플렉스 (KAPA: KK5802), NEBNext 울트라 Q5 II (NEB: M0544L), 및 10 μM NEBNext Multiplex Oligos (IDT).
절차
탈인산화:
1. 아래와 같은 마스터 믹스를 생성한다:
Figure pct00020
2. 마스터 믹스 및 DNA를 96 웰 플레이트에 추가한다.
3. 플레이트를 밀봉시켜 간단하게 볼텍싱하고 회전시킨다.
4. 다음 프로그램을 실행한다: 37℃ 10 분, 95℃ 2 분.
5. 바로 다음, 상기 플레이트를 96 웰 아이스 블록에 1 분 동안 둔 다음, 플레이트를 제거하고 즉시 아래의 연결을 계속한다.
연결:
1. 아래와 같은 마스터 믹스를 생성한다:
Figure pct00021
2. 탈인산화 생성물에 직접 마스터 믹스 18 μl를 추가한다.
3. 플레이트를 밀봉시켜 간단하게 볼텍싱하고 회전시킨다.
4. 다음 프로그램을 실행한다: 60℃ 2 시간, 80℃ 10 분, 85℃ 2분, 4℃ 보류.
5. 아래 두 번째 가닥 합성을 즉시 진행한다.
두 번째 가닥 합성:
1. 아래와 같은 마스터 믹스를 생성한다:
Figure pct00022
2. 연결 생성물에 직접 10 μl의 마스터 믹스를 추가한다.
3. 플레이트를 밀봉시켜 간단하게 볼텍싱하고 회전시킨다.
4. 다음 프로그램을 실행한다: 95℃ 30초, 62℃ 2분, 68℃ 10분, 4℃ 보류.
5. 아래 AmPure®XP 비드 세척을 즉시 진행한다.
AmPure®XP 비드 세척:
1. AmPure®비드들을 용액이 균질해 질 때까지 볼텍싱한다.
2. 80 μl의 비드들을 두 번째 가닥 합성 생성물에 추가하고, 상하로 피펫하여 비드를 균질화한다.
3. 실온에서 10분 동안 배양한다.
4. 플레이트를 마그넷에 옮기고 마그넷에서 5분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
5. 모든 상청액을 제거한다.
6. 150 μL의 80% EtOH를 추가하고 30초 동안 배양한다.
7. 상청액을 제거한다.
8. 단계 6-7을 반복한다.
9. 모든 잔부 에탄올을 제거하고 마그넷으로부터 플레이트를 제거하고 실온에서 3분 동안 배양한다.
10. 16 μl의 저 TE 완충액을 추가하고 상하로 피펫하여 비드를 균질화한다.
11. 실온에서 2분 동안 배양한다.
12. 플레이트를 마그넷에 옮기고 마그넷에서 1분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
13. 15 μl의 상청액을 제거하여 이를 깨끗한 플레이트에 넣는다.
14. 아래 1차 PCR을 진행하거나 -20℃에서 보관한다.
1차 PCR:
1. 아래와 같은 마스터 믹스를 생성한다:
Figure pct00023
2. 35 μl의 마스터 믹스를 15 μl의 정제된 DNA에 추가한다.
3. 플레이트를 밀봉시켜 간단하게 볼텍싱하고 회전시킨다.
4. 다음 프로그램을 실행한다: 95℃ 3분, (95℃ 15초, 72℃ 90초) x 20, 72℃ 1분, 4℃ 보류.
5. 아래 AmPure®XP 비드 세척을 즉시 진행한다.
AmPure®XP 비드 세척
1. AmPure®XP 비드들을 용액이 균질해 질 때까지 볼텍싱한다.
2. 80 μl의 비드들을 두 번째 가닥 합성 생성물에 추가하고, 상하로 피펫하여 비드를 균질화한다.
3. 실온에서 10 분 동안 배양한다.
4. 플레이트를 마그넷에 옮기고 마그넷에서 5분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
5. 모든 상청액을 제거한다.
6. 150 μL의 80% EtOH를 추가하고 30초 동안 배양한다.
7. 상청액을 제거한다.
8. 단계 6-7을 반복한다.
9. 모든 잔부 EtOH를 제거하고 마그넷으로부터 플레이트를 제거하고 실온에서 3분 동안 배양한다.
10. 20 μl의 저 TE 완충액을 추가하고 상하로 피펫하여 비드를 균질화한다.
11. 실온에서 2분 동안 배양한다.
12. 플레이트를 마그넷에 옮기고 마그넷에서 1분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
13. 19 μl의 상청액을 제거하여 이를 깨끗한 플레이트에 넣는다.
14. 아래 2차 PCR을 진행하거나 -20℃에서 보관한다.
2차 PCR
1. 아래 마스터 믹스를 생성하고, 인덱스 프라이머 및 DNA를 별도로 추가하고, 잔부 DNA를 -20℃에서 보관한다:
Figure pct00024
2. 새로운 플레이트에, 46 μL 마스터 믹스, 2 μL 인덱스 프라이머, 및 2 μL DNA를 추가한다.
3. 플레이트를 밀봉시켜 간단하게 볼텍싱하고 회전시킨다.
4. 다음 프로그램을 실행한다: 95℃ 3분, (98℃ 10초, 65℃ 75초) x 10, 65℃ 2 분, 4℃ 보류.
5. 아래 비드 세척을 즉시 진행한다.
AmPure®비드 세척
1. AmPure®비드들을 용액이 균질해 질 때까지 볼텍싱한다.
2. 40 μl의 비드들을 두 번째 가닥 합성 생성물에 추가하고, 상하로 피펫하여 비드를 균질화한다.
3. 실온에서 10 분 동안 배양한다.
4. 플레이트를 마그넷에 옮기고 마그넷에서 5분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
5. 모든 상청액을 제거한다.
6. 150 μL의 80% EtOH를 추가하고 30초 동안 배양한다.
7. 상청액을 제거한다.
8. 단계 6-7을 반복한다.
9. 모든 잔부 EtOH를 제거하고 마그넷으로부터 플레이트를 제거하고 실온에서 3분 동안 배양한다.
10. 25 μl의 저 TE 완충액을 추가하고 상하로 피펫하여 비드를 균질화한다.
11. 실온에서 2분 동안 배양한다.
12. 플레이트를 마그넷에 옮기고 마그넷에서 1분 동안 또는 비드가 마그넷 쪽으로 움직일 때까지 배양한다.
13. 24 μl의 상청액을 제거하여 이를 깨끗한 플레이트에 넣고 -20℃에서 보관한다.
랩칩 QC (LabChip QC)
랩칩 HS 키트용
1. 4℃에서 랩칩 및 시약을 제거하여 실온이 되게 한다 (10분).
2. 필요한 경우 새로운 겔-염료 용액을 준비한다.
3. 각각의 활성 칩을 분자 등급 H2O로 2회 흡인하고 헹군다.
4. 래더 (ladder) 튜브에서 12 μL 래더 용액과 108 μL H2O를 혼합하여 랩칩 래더를 준비한다.
5. 완충액 튜브에 750 μl H2O를 준비한다.
6. 역방향 피펫팅 기술을 사용하여 랩칩을 준비한다.
7. BioRad Hardshell 또는 Thermo Fisher Armadillo 96 웰 플레이트에서, 1 μL의 라이브러리를 19 μL 물에 희석시킨다.
8. 랩칩을 실행시킨다.
qPCR Quant
1. 필요한 경우, Kapa SYBR Fast qPCR MM - 5 mL (KK4601)의 새 병에 30 μl Illumina 정방향 및 역방향 프라이머를 추가하여 qPCR 마스터 믹스를 준비한다.
2. 모든 라이브러리의 1:10,000 희석액을 준비한다.
3. BioRad Hard-Shell 플레이트 또는 Thermo Fisher Armadillo 플레이트에서, 다음 반응을 준비하고 최소한 12개 웰을 비워둔다.
Figure pct00025
4. 동일한 96 웰 플레이트에서, 6 qPCR 표준을 2개씩 준비한다.
Figure pct00026
5. 플레이트 레이아웃 및 표준 농도를 반영하도록 플레이트 파일을 편집한다.
6. BioRad C1000 열 사이클러에서 다음 프로그램을 실행한다: 95℃ 5분 > (95℃ 30초 > 60℃ 45초 > 이미지 단계) x 35.
7. qPCR 데이터를 엑셀 쉬트로 내보낸다.
8. 출발 농도에 (452/300)를 곱하여 Kapa 표준과 라이브러리 간의 크기 차이를 조정한다.
9. 희석 인자를 조정하기 위해 단계 8의 농도에 10을 곱하여 pM를 nM로 변환하였다.
시퀀싱 (NextSeq)
1. 300회 주기로 NextSeq 시약 카트리지를 냉수에 넣어 해동시키고 유세포를 4 ℃에서 제거하고 실온이 되게 한다.
2. 시퀀싱될 라이브러리들을 1:1 몰비로 풀링한다.
3. 변성 및 희석 프로토콜을 사용하여 라이브러리 풀을 2.2 pM의 최종 농도 및 >1300 μL의 최종 부피로 희석시킨다.
4. 1300 μL를 NextSeq 시약 카트리지의 웰 10에 부하한다.
5. NextSeq 폐 용기를 비우고 새로운 유세포 및 완충액 카트리지를 부하한다.
6. 라이브러리들을 내포하는 NextSeq 시약 카트리지를 웰 10에 부하하였으며, NextSeq 리드 길이에 대한 설정은 아래에 제시한다:
Figure pct00027
7. 시퀀싱한다.

Claims (59)

  1. 한 세트의 어댑터들을 단일-가닥 폴리뉴클레오티드들의 라이브러리에 연결시키는 단계를 포함함으로써, 선형, 단일-가닥 연결 생성물들의 라이브러리를 수득하는 방법: 이 때
    연결은 단일-가닥 DNA (ssDNA) 연결효소에 의해 촉매되고,
    각 단일-가닥 폴리뉴클레오티드는 5' 단부에서의 연결을 방지하기 위해 5' 단부에서 차단되고;
    각 어댑터는 어댑터가 연결되는 단일-가닥 폴리뉴클레오티드를 결정하는 고유 분자 식별자 (UMI) 서열을 포함하고, 3' 단부에서 연결을 방지하기 위하여 3' 단부에서 차단되고; 그리고
    어댑터의 5' 단부는 ssDNA 연결효소에 의해 단일-가닥 폴리뉴클레오티드의 3' 단부에 연결되어 선형 연결 생성물을 형성함.
  2. 청구항 1에 있어서, 연결 단계 이전에, 샘플로부터 얻은 단일-가닥 폴리뉴클레오티드들의 라이브러리를 수득하는 단계를 추가로 포함하는 방법.
  3. 청구항 2에 있어서, 상기 수득 단계는 샘플로부터 얻은 이중-가닥 폴리뉴클레오티드들을 변성하는 단계를 포함하는, 방법.
  4. 청구항 2 또는 3에 있어서, 샘플은 생물학적 샘플이며, 선택적으로; (1) 이러한 생물학적 샘플은 어떠한 처리도 없이 대상체로부터 직접 수득되거나; (2) 생물학적 샘플의 폴리뉴클레오티드들은 바이설파이트 전환되지 않았거나; 또는 (3) 생물학적 샘플의 폴리뉴클레오티드들은 부분적으로 또는 완전히 바이설파이트 전환되는, 방법.
  5. 청구항 4에 있어서, 생물학적 샘플은 질환 또는 병태, 가령, 암 또는 신생물을 보유하는 또는 보유할 것으로 의심되는 대상체로부터 얻는, 방법.
  6. 청구항 5에 있어서, 생물학적 샘플은 순환 종양 DNA (ctDNA)를 포함하는 샘플, 가령, 혈액, 혈청, 혈장, 또는 체액 샘플, 또는 이의 임의의 조합인, 방법.
  7. 청구항 1-6 중 어느 한 항에 있어서, 상기 단일-가닥 폴리뉴클레오티드는 약 20 내지 약 400개 핵산 잔기 길이인, 방법.
  8. 청구항 1-7 중 어느 한 항에 있어서, ssDNA 연결효소는 테르무스 (thermus) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigase™ 및 CircLigase II™), 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methanohacterium thermociutoirophicim) RNA 연결효소 1, T4 RNA 연결효소 I, 열안정성 5' App DNA/RNA 연결효소, T4 RNA 연결효소 2, 절두형 T4 RNA 연결효소 2, 예컨대, T4 RNA 연결효소 2 절두형, T4 RNA 연결효소2 절두형 K227Q, T4 RNA 연결효소2 절두형 KQ, 또는 T4 DNA 연결효소인, 방법.
  9. 청구항 1-8 중 어느 한 항에 있어서, 각 단일-가닥 폴리뉴클레오티드의 차단은 그 5' 단부에서의 연결을 방지하기 위한 탈인산화를 포함하는, 방법.
  10. 청구항 1-9 중 어느 한 항에 있어서, 각 어댑터의 차단은 그 3' 단부에서 연결을 방지하기 위하여 탄소 스페이서, ddCTP, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜, 및/또는 헥사에틸렌 글리콜을 포함하는, 방법.
  11. 청구항 1-10 중 어느 한 항에 있어서, 각 어댑터는 5' 단부에 다이뉴클레오티드 서열, 가령, GA (5'→3'), GG (5'→3'), AA (5'→3'으로), 또는 AG (5'→3')를 포함하며, 이는 UMI 서열에 대해 5' 에 존재하는, 방법.
  12. 청구항 1-11 중 어느 한 항에 있어서, 각 어댑터에서 UMI 서열은 약 6 내지 약 15개 핵산 잔기 길이이고, 예를 들면, UMI 서열은 12-량체인, 방법.
  13. 청구항 1-12 중 어느 한 항에 있어서, 연결 반응은 크라우딩제의 존재하에서 수행되는, 방법.
  14. 청구항 13에 있어서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000 또는 PEG 6000, 덱스트란, 및/또는 Ficoll을 포함하는, 방법.
  15. 청구항 1-14 중 어느 한 항에 있어서, 선형, 단일-가닥 연결 생성물들의 라이브러리를 선형, 이중-가닥 연결 생성물들의 라이브러리로 전환시키는 단계를 추가로 포함하는, 방법.
  16. 청구항 15에 있어서, 상기 전환은, 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 프라이머 또는 한 세트의 프라이머들을 사용하는, 방법.
  17. 청구항 15 또는 16에 있어서, 선형, 이중-가닥 연결 생성물들의 라이브러리를 증폭 및/또는 정제하는 단계를 추가로 포함하는, 방법.
  18. 청구항 17에 있어서, 상기 정제는 약 50개 뉴클레오티드 내지 약 1000개 뉴클레오티드 길이의 폴리뉴클레오티드를 선택적으로 정제하고, 이러한 정제는 선택적으로 비드-기반 또는 컬럼-기반이며, 정제는, 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는, 방법.
  19. 청구항 15-18 중 어느 한 항에 있어서, 선형, 이중-가닥 연결 생성물들의 라이브러리를, 예컨대, 다음을 사용하여 중합효소 연쇄 반응 (PCR)으로 증폭시키는 단계를 포함함으로써, 표적 서열의 서열 정보를 포함하는 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리를 수득하는 방법:
    어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는 한 세트의 프라이머; 및
    표적 서열 (예컨대, EGFR 유전자 서열)에 혼성화가능한 프라이머, 이 프라이머는 서열 번호: 4-1529로 구성된 그룹에서 선택된 서열, 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위 범위의 서열을 선택적으로 포함함.
  20. 청구항 19에 있어서, 표적 서열에 특이적인 서열을 각각 포함하는 복수의 프라이머들이 사용되며, 이 때 프라이머들은 동일 또는 상이한 표적 서열들을 가지며, 선택적으로 상기 복수의 프라이머들은 서열 번호: 4-1529 중 하나 이상, 또는 이의 상보적 또는 실질적 상보적 서열 또는 이의 수치 범위 또는 하위범위의 서열을 포함하는, 방법.
  21. 청구항 19 또는 20에 있어서, 표적 서열의 서열 정보는 돌연변이, 단일 뉴클레오티드 다형태 (SNP), 복제수 변이 (CNV), 또는 후성 변화를 포함하는, 방법.
  22. 청구항 21에 있어서, 돌연변이는 점 돌연변이, 삽입, 결실, 삽입-결실, 역전, 절두, 융합, 전위, 증폭, 또는 이의 임의의 조합을 포함하는, 방법.
  23. 청구항 19-22 중 어느 한 항에 있어서, 상기 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리는 전체 게놈 라이브러리는 아닌, 방법.
  24. 청구항 19-23 중 어느 한 항에 있어서, 선형, 이중-가닥 연결 생성물들의 증폭된 라이브러리를 정제하는 단계를 추가로 포함하는, 방법.
  25. 청구항 24에 있어서, 정제는 비드-기반이고 선택적으로 약 150개 뉴클레오티드 길이 보다 큰 폴리뉴클레오티드들을 선택적으로 정제하고, 정제는 그 중 하나가 선형, 이중-가닥 연결 생성물에 부착하고 다른 하나가 고체 지지체 (가령, 비드)에 부착하는 특정 결합 쌍 (가령, 비오틴/스트렙타비딘)을 사용하는 것을 포함하지 않는, 방법.
  26. 청구항 24 또는 25에 있어서, 선형, 이중-가닥 연결 생성물들의 정제되고 증폭된 라이브러리를 시퀀싱하는 단계를 추가로 포함하는, 방법.
  27. 청구항 26에 있어서, 시퀀싱 단계는 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 각각의 선형, 이중-가닥 연결 생성물에 부착하는 단계를 포함하는, 방법.
  28. 청구항 27에 있어서, 상기 부착 단계는 중합효소 연쇄 반응 (PCR)을 사용하여 실시되는, 방법.
  29. 청구항 26에 있어서, 시퀀싱의 전환율 (시퀀싱 리드를 유발하는 라이브러리 내 단일-가닥 폴리뉴클레오티드들의 백분율)은 최소한 약 40%, 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 또는 최소한 약 90%인, 방법.
  30. 청구항 26-29 중 어느 한 항에 있어서, 대상체의 질환 또는 병태의 진단 및/또는 예측, 치료에 대한 대상체의 반응성을 예측, 질환/병태 또는 치료에 대한 약리유전체학 마커를 식별, 및/또는 모집단을 유전 정보에 대해 스크리닝하기 위해 사용되는, 방법.
  31. 청구항 30에 있어서, 상기 질환 또는 병태는 암 또는 신생물이며, 치료는 암 또는 신생물 치료인 방법.
  32. 청구항 1-14 중 어느 한 항의 방법에 의해 제조된 선형, 단일-가닥 연결 생성물의 라이브러리.
  33. 청구항 15-18 중 어느 한 항의 방법에 의해 제조된 선형, 이중-가닥 연결 생성물의 라이브러리.
  34. 청구항 19-25 중 어느 한 항의 방법에 의해 제조된 선형, 이중-가닥 연결 생성물의 증폭된 라이브러리.
  35. 청구항 26-31 중 어느 한 항의 방법에 의해 제조된 시퀀싱 라이브러리.
  36. 다음을 포함하는, 연결 생성물들의 라이브러리를 제작하기 위한 키트:
    단일-가닥 DNA (ssDNA) 연결효소;
    복수의 어댑터, 이 때 각 어댑터는 3' 단부에서 연결을 방지하기 위해 차단되는 반면 어댑터의 5' 단부는 단일-가닥 폴리뉴클레오티드에 연결 가능하여 선형, 단일-가닥 연결 생성물을 형성하고, 그리고 각 어댑터는 단일-가닥 폴리뉴클레오티드를 결정하는 고유 분자 식별자 (UMI) 서열을 포함함.
  37. 청구항 36에 있어서, 단일-가닥 폴리뉴클레오티드를 얻기 위해 샘플의 이중-가닥 폴리뉴클레오티드를 변성시키는 변성화 시약을 추가로 포함하는, 키트.
  38. 청구항 36 또는 37에 있어서, ssDNA 연결효소는 테르무스 (thermus) 박테리오파지 RNA 연결효소, 가령, 박테리오파지 TS2126 RNA 연결효소 (예컨대, CircLigase™및 CircLigase II™), 고세균 RNA 연결효소, 가령, 메타노박테리움 테르모아우토트로피쿰 (Methanohacterium thermociutoirophicim) RNA 연결효소 1, T4 RNA 연결효소 1, 열안정성 5' App DNA/RNA 연결효소, T4 RNA 연결효소 2, 절두형 T4 RNA 연결효소 2, 예컨대, T4 RNA 연결효소 2 절두형, T4 RNA 연결효소2 절두형 K227Q, T4 RNA 연결효소2 절두형 KQ, 또는 T4 DNA 연결효소인, 키트.
  39. 청구항 36-38 중 어느 한 항에 있어서, 단일-가닥 폴리뉴클레오티드의 5' 포스페이트기를 제거하기 위한 탈인산화 시약을 추가로 포함하는, 키트.
  40. 청구항 36-39 중 어느 한 항에 있어서, 각 어댑터는 그 3' 단부에서 연결을 방지하기 위하여 탄소 스페이서, ddCTP, ddATP, ddTTP, ddGTP, 헥세인다이올, 트라이에틸렌 글리콜, 및/또는 헥사에틸렌 글리콜을 포함하는, 키트.
  41. 청구항 36-40 중 어느 한 항에 있어서, 각 어댑터는 그 5' 단부에 다이뉴클레오티드 서열, 가령, GA (5'→3'), GG (5'→3'), AA (5'→3'으로), 또는 AG (5'→3')를 포함하는 키트.
  42. 청구항 36-41 중 어느 한 항에 있어서, 각 어댑터에서 UMI 서열은 약 6 내지 약 15개 핵산 잔기 길이일 수 있고, 예를 들면, UMI 서열은 12-량체인, 키트.
  43. 청구항 36-42 중 어느 한 항에 있어서, 연결 반응을 위한 크라우딩제를 추가로 포함하는, 키트.
  44. 청구항 43에 있어서, 크라우딩제는 폴리에틸렌 글리콜 (PEG), 가령, PEG 4000 또는 PEG 6000, 덱스트란, 및/또는 Ficoll을 포함하는, 키트.
  45. 청구항 36-44 중 어느 한 항에 있어서, 단일-가닥 폴리뉴클레오티드를 이중-가닥 폴리뉴클레오티드로 전환시키기 위해, 어댑터에 역-보체인 및/또는 어댑터에 혼성화가능한 서열을 각각 포함하는, 프라이머 또는 한 세트의 프라이머들을 추가로 포함하는 키트.
  46. 청구항 45에 있어서, 프라이머 이량체를 제거하기 위한 시약을 추가로 포함하는, 키트.
  47. 청구항 45 또는 46에 있어서, 표적 서열의 서열 정보를 포함하는 증폭된 선형, 이중-가닥 연결 생성물을 수득하기 위하여 표적 서열 (예컨대, EGFR 유전자 서열)에 특이적인 서열을 포함하는 프라이머를 추가로 포함하며, 이러한 프라이머는 서열 번호: 4- 1529로 구성된 그룹에서 선택된 서열, 또는 이의 상보적인 또는 실질적으로 상보적인 서열 또는 이의 수치 범위 또는 하위범위의 서열을 선택적으로 포함하는, 키트.
  48. 청구항 47에 있어서, 표적 서열에 특이적인 서열을 각각 포함하는 복수의 프라이머들을 포함하고, 이 때 프라이머들은 동일 또는 상이한 표적 서열들을 가지며, 선택적으로 상기 복수의 프라이머들은 서열 번호: 4-1529 중 하나 이상, 또는 이의 상보적인 또는 실질적으로 상보적인 서열 또는 이의 수치 범위 또는 하위범위의 서열을 포함하는, 키트.
  49. 청구항 47 또는 48에 있어서, 증폭된 선형, 이중-가닥 연결 생성물을 시퀀싱하기 위한, 시퀀싱 어댑터 및/또는 샘플-특이적 바코드를 추가로 포함하는, 키트.
  50. 청구항 36-49 중 어느 한 항에 있어서, 각 성분을 위한 개별 바이얼 및/또는 상기 구성성분들의 사용에 관한 설명서를 추가로 포함하는, 키트.
  51. 청구항 50에 있어서, 상기 키트는 대상체의 순환 종양 DNA (ctDNA)를 포함하는 샘플을 수득함에 관한 설명서 및/또는 샘플, 가령, 혈액, 혈청, 혈장, 또는 체액 샘플, 또는 이의 임의의 조합으로부터 단일-가닥 폴리뉴클레오티드들을 수득함에 관한 설명서를 추가로 포함하는, 키트.
  52. AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 1) 또는 이의 일부, 예컨대, 약 18 내지 22개 뉴클레오티드 잔기를 포함하는 일부를 포함하는 폴리뉴클레오티드.
  53. 청구항 52에 있어서, N 1 . . . N i KAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG 또는 이의 일부를 포함하며, 이 때 N 1 내지 N i 는 임의의 핵산 잔기, 예를 들어, A, T, C, 또는 G이고, i는 약 4 내지 약 25의 정수인, 폴리뉴클레오티드.
  54. 청구항 52 또는 53에 있어서, GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 2) 또는 이의 일부, 예컨대, 약 32 내지 36개 뉴클레오티드 잔기를 포함하는 일부를 포함하며, 이 때 N은 임의의 핵산 잔기, 예를 들어, A, T, C, 또는 G인, 폴리뉴클레오티드.
  55. CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 폴리뉴클레오티드 또는 이의 일부, 예컨대, 약 12개 내지 20개 뉴클레오티드 잔기를 포함하는 일부.
  56. 서열 번호: 4-1529로 구성된 그룹에서 선택된 하나 이상의 서열, 또는 이의 수치 범위 또는 하위범위의 서열을 포함하는 프라이머.
  57. 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 또는 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두, 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위 범위의 서열을 포함하는, 프라이머 세트.
  58. 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 또는 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두; 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위범위의 서열, 그리고 CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 프라이머 또는 이의 일부를 포함하는, 프라이머 세트.
  59. 서열 번호: 4-1529 중 하나 이상, 예컨대, 약 10, 20, 50, 100, 150, 200, 250, 또는 300, 400, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 또는 1529개 모두; 또는 이의 상보적인 또는 실질적으로 상보적인 서열, 또는 이의 수치 범위 또는 하위범위의 서열, CACTCTTTCCCTACACGACGC (서열 번호: 3)를 포함하는 프라이머 또는 이의 일부, 및/또는 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (서열 번호: 1)를 포함하는 폴리뉴클레오티드 또는 이의 일부를 포함하는 키트.
KR1020197033449A 2017-04-19 2018-04-18 라이브러리 제작 및 서열 분석을 위한 조성물 및 방법 KR102601593B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762487423P 2017-04-19 2017-04-19
US62/487,423 2017-04-19
US201862657544P 2018-04-13 2018-04-13
US62/657,544 2018-04-13
PCT/US2018/028191 WO2018195217A1 (en) 2017-04-19 2018-04-18 Compositions and methods for library construction and sequence analysis

Publications (2)

Publication Number Publication Date
KR20190140961A true KR20190140961A (ko) 2019-12-20
KR102601593B1 KR102601593B1 (ko) 2023-11-13

Family

ID=63856830

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197033449A KR102601593B1 (ko) 2017-04-19 2018-04-18 라이브러리 제작 및 서열 분석을 위한 조성물 및 방법

Country Status (10)

Country Link
US (1) US11965157B2 (ko)
EP (1) EP3612641A4 (ko)
JP (1) JP7220200B2 (ko)
KR (1) KR102601593B1 (ko)
CN (1) CN110770354B (ko)
AU (1) AU2018256387A1 (ko)
CA (1) CA3060555A1 (ko)
SG (2) SG11201909618TA (ko)
TW (1) TWI797118B (ko)
WO (1) WO2018195217A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230077435A (ko) * 2021-11-25 2023-06-01 안신애 유전체와 후성 유전체 동시 분석 방법 및 분석 시스템
WO2024123127A1 (ko) * 2022-12-08 2024-06-13 광주과학기술원 Dna 단편의 멀티 결합 조립 반응을 이용한 단일세포의 다중체 전장 시퀀싱 분석방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI834642B (zh) 2018-03-13 2024-03-11 美商格瑞爾有限責任公司 異常片段偵測及分類
CA3094717A1 (en) 2018-04-02 2019-10-10 Grail, Inc. Methylation markers and targeted methylation probe panels
US20210164048A1 (en) * 2018-08-07 2021-06-03 Singlera Genomics, Inc. A non-invasive prenatal test with accurate fetal fraction measurement
CN113286881A (zh) 2018-09-27 2021-08-20 格里尔公司 甲基化标记和标靶甲基化探针板
CN112080555A (zh) * 2019-06-14 2020-12-15 上海鹍远健康科技有限公司 Dna甲基化检测试剂盒及检测方法
CN110964782A (zh) * 2019-12-09 2020-04-07 上海鹍远健康科技有限公司 单链核酸连接效率检测方法
CN111321208B (zh) * 2020-02-14 2023-10-03 上海厦维医学检验实验室有限公司 一种基于高通量测序的建库方法
DK3969613T3 (da) * 2020-02-26 2024-01-08 Illumina Inc Kits til genotypebestemmelse
CN111979583B (zh) * 2020-09-10 2023-09-12 杭州求臻医学检验实验室有限公司 一种单链核酸分子高通量测序文库的构建方法及其应用
CN114250298B (zh) * 2020-09-23 2024-09-24 中国医学科学院北京协和医院 胰腺导管腺癌的dna甲基化标志物及其应用
WO2022181858A1 (ko) * 2021-02-26 2022-09-01 지니너스 주식회사 분자 바코딩 효율을 향상시키기 위한 조성물 및 이의 용도
KR20220122095A (ko) 2021-02-26 2022-09-02 지니너스 주식회사 분자 바코딩 효율을 향상시키기 위한 조성물 및 이의 용도
CN117255857A (zh) * 2022-04-18 2023-12-19 京东方科技集团股份有限公司 接头、接头连接试剂及试剂盒和文库构建方法
WO2024015869A2 (en) * 2022-07-12 2024-01-18 University Of Washington Systems and methods for variant detection in cells

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016114970A1 (en) * 2015-01-12 2016-07-21 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4917891B2 (ja) 2003-10-21 2012-04-18 オリオン ゲノミクス エルエルシー 差次的酵素的断片化の方法
US10731215B2 (en) 2005-04-15 2020-08-04 Epigenomics Ag Method for determining the presence or absence of methylation in a sample
ES2533767T3 (es) 2005-04-15 2015-04-15 Epigenomics Ag Métodos para el análisis de trastornos proliferativos celulares
US7582405B2 (en) 2005-10-26 2009-09-01 Hewlett-Packard Development Company, L.P. Image recording media and image layers
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US7901882B2 (en) 2006-03-31 2011-03-08 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
US20080261217A1 (en) 2006-10-17 2008-10-23 Melnikov Anatoliy A Methylation Profile of Cancer
US20130065233A1 (en) 2010-03-03 2013-03-14 Zymo Research Corporation Detection of dna methylation
AU2012212127B2 (en) 2011-02-02 2016-06-02 Exact Sciences Corporation Digital sequence analysis of DNA methylation
DK2729579T3 (en) 2011-07-08 2018-01-08 Epigenomics Ag PROCEDURES AND NUCLEIC ACIDS FOR DETERMINING THE PROGRAM FOR A CANCER PATIENT
EP3594366B1 (en) 2012-05-11 2021-06-23 Clinical Genomics Pty. Ltd. Diagnostic gene marker panel
US20150011396A1 (en) * 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
JP2015521862A (ja) 2012-07-13 2015-08-03 セクエノム, インコーポレイテッド 非侵襲性の出生前診断に有用な母体サンプル由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2954320B1 (en) 2013-02-07 2018-04-18 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Hybrid nanopores and uses thereof for detection of analytes
JP2016513959A (ja) * 2013-02-21 2016-05-19 トマ バイオサイエンシーズ, インコーポレイテッド 核酸分析のための方法、組成物およびキット
US10011862B2 (en) 2013-03-14 2018-07-03 Cornell University Method for relative quantification of changes in DNA methylation, using combined nuclease, ligation, and polymerase reactions
US10301680B2 (en) 2014-03-31 2019-05-28 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasm
NZ765010A (en) 2014-06-04 2024-08-30 Quest Diagnostics Invest Llc Methylated markers for colorectal cancer
KR20170012552A (ko) 2014-06-05 2017-02-02 클리니칼 게노믹스 피티와이. 엘티디. 메틸화 분석 방법
US10480021B2 (en) 2014-06-23 2019-11-19 Yale University Methods for closed chromatin mapping and DNA methylation analysis for single cells
WO2016019042A1 (en) 2014-07-30 2016-02-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984201B2 (en) 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
US10883138B2 (en) 2015-04-23 2021-01-05 Quest Diagnostics Investments Incorporated MLH1 methylation assay
US20170101674A1 (en) * 2015-08-21 2017-04-13 Toma Biosciences, Inc. Methods, compositions, and kits for nucleic acid analysis
GB201515557D0 (en) 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
EP3168309B8 (en) 2015-11-10 2020-06-03 Eurofins LifeCodexx GmbH Detection of foetal chromosomal aneuploidies using dna regions that are differentially methylated between the foetus and the pregnant female
KR102006803B1 (ko) 2016-10-06 2019-08-05 (주)지노믹트리 메틸화 dna 다중 검출방법
US20200048697A1 (en) 2017-04-19 2020-02-13 Singlera Genomics, Inc. Compositions and methods for detection of genomic variance and DNA methylation status

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016114970A1 (en) * 2015-01-12 2016-07-21 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230077435A (ko) * 2021-11-25 2023-06-01 안신애 유전체와 후성 유전체 동시 분석 방법 및 분석 시스템
WO2024123127A1 (ko) * 2022-12-08 2024-06-13 광주과학기술원 Dna 단편의 멀티 결합 조립 반응을 이용한 단일세포의 다중체 전장 시퀀싱 분석방법

Also Published As

Publication number Publication date
CA3060555A1 (en) 2018-10-25
TWI797118B (zh) 2023-04-01
SG10202111266VA (en) 2021-11-29
AU2018256387A1 (en) 2019-10-31
TW201842189A (zh) 2018-12-01
JP2020517298A (ja) 2020-06-18
US20200123538A1 (en) 2020-04-23
JP7220200B2 (ja) 2023-02-09
CN110770354B (zh) 2024-03-19
EP3612641A4 (en) 2021-01-20
CN110770354A (zh) 2020-02-07
SG11201909618TA (en) 2019-11-28
US11965157B2 (en) 2024-04-23
WO2018195217A1 (en) 2018-10-25
EP3612641A1 (en) 2020-02-26
KR102601593B1 (ko) 2023-11-13

Similar Documents

Publication Publication Date Title
US11965157B2 (en) Compositions and methods for library construction and sequence analysis
US10711269B2 (en) Method for making an asymmetrically-tagged sequencing library
US20200048697A1 (en) Compositions and methods for detection of genomic variance and DNA methylation status
US20210388445A1 (en) Compositions and methods for cancer and neoplasia assessment
JP7379418B2 (ja) 腫瘍のディープシークエンシングプロファイリング
EP2619329B1 (en) Direct capture, amplification and sequencing of target dna using immobilized primers
JP7514263B2 (ja) 試料核酸にアダプターを付着する方法
AU2018214075A1 (en) Systems and methods for prenatal genetic analysis
AU2015315103A1 (en) Methods and compositions for rapid nucleic acid library preparation
JP2016000046A (ja) 遺伝マーカーを評価するための方法および組成物
EP3670671A1 (en) Probe set for analyzing a dna sample and method for using the same
US10465241B2 (en) High resolution STR analysis using next generation sequencing
CN114787385A (zh) 用于检测核酸修饰的方法和系统
CN114450420A (zh) 用于肿瘤学精确测定的组合物和方法
WO2024137858A2 (en) Methods and compositions for assessing colorectal cancer
WO2023225515A1 (en) Compositions and methods for oncology assays

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant