KR20240013182A - 닉-결찰 stlfr - Google Patents

닉-결찰 stlfr Download PDF

Info

Publication number
KR20240013182A
KR20240013182A KR1020237044393A KR20237044393A KR20240013182A KR 20240013182 A KR20240013182 A KR 20240013182A KR 1020237044393 A KR1020237044393 A KR 1020237044393A KR 20237044393 A KR20237044393 A KR 20237044393A KR 20240013182 A KR20240013182 A KR 20240013182A
Authority
KR
South Korea
Prior art keywords
adapter
nucleic acid
stranded
double
barcode
Prior art date
Application number
KR1020237044393A
Other languages
English (en)
Inventor
라도제 티. 드르마낙
브록 에이. 페터스
안드레이 알렉시브
스네자나 드르마낙
아물야 나니세티
Original Assignee
엠쥐아이 테크 컴퍼니 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠쥐아이 테크 컴퍼니 엘티디. filed Critical 엠쥐아이 테크 컴퍼니 엘티디.
Publication of KR20240013182A publication Critical patent/KR20240013182A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/307Single strand endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Consolidation Of Soil By Introduction Of Solidifying Substances Into Soil (AREA)
  • Ceramic Products (AREA)
  • Earth Drilling (AREA)

Abstract

본 출원은 단일 반응 혼합물에서 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법 및 조성물에 관한 것이다. 방법은 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 중첩 핵산 단편을 생성하는 단계; 및 리가제의 존재 하에 부분적 이중-가닥 제1 어댑터를 핵산 단편 중 적어도 하나와 접촉시켜, 제1 어댑터의 이중-가닥 영역의 5' 말단을 3' 분지 결찰을 통해 DNA 리가제를 사용하여 핵산 단편 중 적어도 하나의 3' 말단에 결찰시키는 단계를 포함한다. 제1 어댑터는 (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 평활 영역 및 (ii) 바코드를 포함하는 단일-가닥 영역을 포함한다.

Description

닉-결찰 STLFR
관련 출원
[0001] 본 출원은 2021년 7월 22일에 출원된 미국 가출원 번호 63/224,731의 우선권 및 이익을 주장한다. 상기 가출원의 전체 내용은 모든 목적을 위해 본원에 참조로 포함된다.
배경
[0002] 일반적으로 사용되는 차세대 시퀀싱 플랫폼을 위한 시퀀싱 라이브러리를 작제하는 것은 종종 표적 핵산의 양쪽 말단에 어댑터를 첨가하는 것을 필요로 한다. 이러한 어댑터는 전형적으로 샘플 또는 분자 식별을 위한 바코드를 함유한다. 일부 경우에, 공동-바코딩은 전체-게놈 시퀀싱을 용이하게 하기 위해 단일 긴 게놈 DNA 분자의 서브-단편에 동일한 바코드를 추가하기 위해 구현된다. 시퀀싱 라이브러리의 현재 작제 프로세스는 종종 어댑터를 추가하기 위해 다단계 절차를 필요로 한다. 각각의 단계는 종종 별도의 반응 또는 용기에서 수행되며, 이는 노동 집약적이고 비효율적일 수 있다.
발명의 개요
[0003] 일 양태에서, 본 개시는 시퀀싱을 위한 어댑터된 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서, (a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편을 생성하는 단계; (b) 각각의 비드가 비드(b-BLA) 상에 고정된 복수의 분지 결찰 어댑터를 포함하는 복수의 비드를 제공하고, 3' 말단에 축퇴 서열을 갖는 L-어댑터의 집단을 제공하는 단계 및 (c) b-BLA를 리가제의 존재 하에 핵산 단편 중 적어도 하나와 접촉시키고, 이에 의해 b-BLA를 핵산 단편의 3' 말단에 결찰시키는 단계, (d) 리가제의 존재 하에 L-어댑터의 집단을 접촉시킴으로써 핵산 단편의 5' 말단에 L-어댑터를 결찰시키고, 이에 의해 5' 말단에 L-어댑터 서열 및 3' 말단에 b-BLA 어댑터 서열을 갖는 핵산 단편의 라이브러리를 수득하는 단계를 포함하는, 방법을 제공한다.
[0004] 또 다른 양태에서, 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서
(a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 중첩 핵산 단편을 생성하는 단계; 및
(b) 복수의 부분적 이중-가닥 제1 어댑터를 포함하는 비드를 리가제의 존재 하에 핵산 단편과 접촉시키는데, 여기서 각각의 제1 어댑터는 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 비드 상에 고정되는 단일-가닥 영역을 포함하고, 여기서 단일-가닥 영역은 바코드를 포함하며, 이에 의해 적어도 하나의 제1 어댑터의 이중-가닥 평활 말단에서 가닥의 5' 말단을 핵산 단편 중 적어도 하나의 3' 말단에 DNA 리가제를 사용하여 결찰시켜 결찰된 제1 어댑터를 생성하는 단계로서, 결찰된 제1 어댑터는 바코드 및 적어도 하나의 핵산 단편을 포함하는, 단계, (c) 결찰된 제1 어댑터를 변성시키는 단계, 및 (d) 결찰된 제1 어댑터에서 바코드에 대해 3'인 서열에 혼성화된 프라미어의 제어된 연장을 수행하고, 이에 의해 결찰 제1 어댑터에 상보적인 부분적으로 연장된 가닥을 생성하는 단계를 포함하는, 방법이 본원에 개시된다.
[0005] 또 다른 양태에서, (1) 하나 이상의 닉킹제, (2) 하나 이상의 리가제, (3) 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편, 및 (4) 부분적 이중-가닥 핵산 분자를 형성하기 위해 서로 혼성화된 혼성화 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드를 포함하는 부분적 이중-가닥 분지 어댑터를 포함하는 반응 혼합물로서, 바코드 올리고뉴클레오티드는 비드에 연결되고, 바코드를 포함하며, 혼성화 올리고뉴클레오티드는 비드에 연결되지 않으며, 부분적 이중-가닥 핵산 분자는 (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 평활 말단 및 (ii) 바코드를 포함하고, 단일-가닥 말단을 갖는 단일-가닥 영역을 포함하며, 이중-가닥 평활 말단의 5' 말단은 핵산 단편 중 적어도 하나의 3' 말단에 결찰되는, 반응 혼합물이 본원에 개시된다.
[0006] 도면 및 이의 설명은 본 발명의 예시적인 구체예를 예시한다. 본 개시에서 제공되는 본 발명은 이들 도면에 도시된 구체예로 제한되지 않는다.
[0007] 도 1은 라이브러리 제조 방법의 예시적인 작업 흐름을 나타낸다.
[0008] 도 2는 엇갈린 단일-가닥 파손(220)을 생성하기 위해 이중-가닥 표적 핵산(210)을 닉킹하는 것을 예시한다. 도 2는 또한 파손부를 크리에이터까지 연장시켜 어댑터의 결찰을 준비하기 위해 파손에 의해 분리된 단편(240) 사이의 갭(230)을 연장시키는 것을 예시한다.
[0009] 도 3a 및 3b는 분지 결찰(320)을 통해 표적 DNA(310)의 3' 말단에 b-BLA 어댑터(320)를 첨가하고 하나의 단일 반응 혼합물에서 표적 DNA의 5' 말단에 L-어댑터(340)를 첨가하는 예시적인 방법을 보여준다. 도 3a는 비드(300)가 그 위에 고정된 b-BLA를 포함함을 보여준다. 각각의 b-BLA는 2개의 가닥으로 구성된다: 1) 바코드 서열(330) 및 3' 말단에 디데옥시 차단제 뉴클레오티드를 포함하는 바코드 올리고뉴클레오티드, 및 2) 바코드 올리고뉴클레오티드에 혼성화되는 혼성화 올리고뉴클레오티드. 바코드 올리고뉴클레오티드의 5'는 비드(300)에 연결된다. 더 나은 예시 및 설명을 위해 별도의 단계로 도시되어 있지만, b-BLA 어댑터 및 L-어댑터의 첨가는 하나의 단일 반응으로 발생할 수 있다. b-BLA 어댑터(340)로부터의 바코드(330)는 비드에 연결되지 않은 가닥(350)을 연장함으로써 복사되었고, 이는 연장된 핵산 단편(360)을 생성하였다. 과량의 b-BLA 어댑터(370)(즉, 단편에 결찰되지 않은 b-BLA 어댑터)가 또한 연장될 것이다. 연장된 핵산 단편(360)은 2개의 말단에서 b-BLA 어댑터 서열 및 L-어댑터 서열에 어닐링된 2개의 프라이머를 사용하여 증폭될 수 있다. 대안적으로, 연장된 핵산 단편(360)은 하기에 추가로 기재된 바와 같이 둘 모두의 어댑터 서열에 어닐링되는 스플릿 올리고를 사용함으로써 원형화될 수 있다. "증폭"이라는 제목의 섹션 10을 참조한다. 과량의 어댑터(370)는 L-어댑터를 갖지 않으므로 PCR에 의해 증폭되거나 원형화될 수 없다.
[0010] 도 4는 하나의 단일 반응에서 표적 DNA의 3'에 b-BLA(410)를 첨가하고 5'에 L-어댑터(420)를 첨가하는 예시적인 방법을 보여준다. L-어댑터는 보호된 결합(예를 들어, (포스포로티오에이트 결합 등)을 포함하여 엑소뉴클레아제 분해(*로 표시됨)를 방지한다. 각각의 b-BLA의 바코드 올리고뉴클레오티드는 3 말단에서 차단된다(예를 들어, 디데옥시 차단제 뉴클레오티드를 가짐으로써). 동일한 b-BLA의 혼성화 올리고뉴클레오티드는 3' 분지 결찰을 통해 표적 핵산 단편에 결찰될 수 있다. 혼성화 올리고뉴클레오티드 및 표적 핵산 단편을 결찰시킴으로써 형성된 결찰된 생성물(450)은 b-BLA로부터 바코드(430)를 혼입시키도록 연장되어 연장된 핵산 단편(460)을 형성한다. 연장된 핵산 단편(460)은 변성에 의해 비드로부터 방출될 수 있고, 이후 방출된 단편은 PCR에 의해 증폭되거나 원형화된다. 선택적으로, 과량의 b-BLA(440)는 비결찰된 어댑터 증폭을 회피하기 위한 엑소뉴클레아제 및 람다 엑소뉴클레아제에 의해 분해될 수 있다.
[0011] 도 5는 도 4에 도시된 것과 유사한 하나의 단일 반응에서 표적 DNA의 3'에 b-BLA(510)를 첨가하고 5'에 L-어댑터(520)를 첨가하는 또 다른 예시적인 방법을 보여준다. b-BLA는 비드(500) 상에 고정된다. 바코드 올리고뉴클레오티드가 연장되는 것이 차단된 도 4와 달리, 도 5에서, 혼성화 올리고뉴클레오티드는 차단되고, 바코드 올리고뉴클레오티드는 표적 핵산 단편에 결찰되어 바코드된 핵산 단편(550)을 생성할 수 있으며; 연장에 의해 바코드를 복사할 필요는 없다. 그 후, 과량의 b-BLA(560) 및 결찰된 생성물 둘 모두가 변성되어, 비드에 연결된 상태로 유지되는 단일-가닥 바코드된 핵산 단편(530)을 발생시킨다. 한 접근법에서, b-BLA는 바코드 올리고뉴클레오티드의 3' 말단 근처에 우라실을 포함하고; 상기와 같이 생성된 바코드된 핵산 단편(530)은 USER에 접촉함으로써 비드로부터 방출될 수 있다. 그 후, 이 방출된 가닥(540)은 증폭되거나 직접 원형화될 수 있다. 선택적으로, 과량의 b-BLA(570)는 RecJ 또는 Exo7 처리에 의해 제거될 수 있다. "*"는 포스포로티오에이트 결합을 나타낸다.
[0012] 도 6은 닉카제 처리 동안 b-BLA가 표적 DNA와 접촉되는 본 발명의 예시적인 구체예를 나타낸 것이다. 도 4와 유사하게, 각 b-BLA의 바코드 올리고뉴클레오티드는 연장되는 것이 차단되고; 도 6에서는, 각 바코드 올리고뉴클레오티드는 또한 바코드 서열(620)과 디데옥시 차단제 뉴클레오티드 사이에 하나 이상의 우라실(610)을 포함할 수 있다. 혼성화 올리고뉴클레오티드(630)는 분지 결찰을 통해 표적 핵산 단편에 결찰될 수 있다. 그 후, USER이 첨가되어 바코드 올리고뉴클레오티드를 절단하고, 디데옥시 차단제 뉴클레오티드를 방출하며, 이는 연장된 말단(650)을 갖는 바코드 올리고뉴클레오티드를 발생시킨다. 결찰된 생성물(630)은 바코드를 혼입하도록 연장되어 바코드된 핵산 단편(640)을 형성한다. 3'(650)에서 차단제 뉴클레오티드가 없는 바코드 올리고뉴클레오티드가 또한 연장된다. 그 후, 3'->5' 엑소뉴클레아제 활성을 갖는 ExoIII를 첨가하여 과량의 b-BLA(660)를 완전히 분해하고, 또한 3'->5' 방향으로부터 바코드된 핵산 단편을 부분적으로 분해하여, 부분적으로 혼성화된 바코드된 표적 핵산 단편(670)을 발생시킨다. 상기 부분적으로 혼성화된 바코드된 표적 핵산 단편(670)은 이후 연장되어 이중-가닥 바코드된 핵산 단편(680)을 형성하고, 이어서 이는 평활 말단 결찰을 통해 제2 어댑터와 결찰된다. 일부 경우에, 제2 어댑터는 자가-결찰을 최소화하기 위해 5' 포스페이트 기를 포함하지 않는다. 결찰 생성물은 변성되어 단일-가닥 핵산 단편(690)을 형성하며, 이는 이제 양쪽 말단에 어댑터 서열을 갖는다. 단일-가닥 핵산 단편(690)은 이제 PCR에 의해 증폭되거나 원형화될 수 있다.
[0013] 도 7a 및 7b는 b-BLA가 비드(700)에 고정된 본 발명의 또 다른 구체예를 도시한다. 각각의 b-BLA는 서로 혼성화된 바코드 올리고뉴클레오티드(710) 및 혼성화 올리고뉴클레오티드(720)를 포함한다. 혼성화 올리고뉴클레오티드는 3' 말단에 디데옥시 차단제 뉴클레오티드를 포함하고, 바코드 올리고뉴클레오티드는 바코드 서열(790)에 대해 5'인 유전자좌에서 우라실을 포함한다. 도 7a 및 7b는 하기 이벤트를 예시한다: 1) 바코드 올리고뉴클레오티드는 닉카제-처리된 표적 핵산 단편에 결찰되고 분지 결찰을 통해 바코드된 핵산 단편(730)을 형성한다. 2) 혼성화 올리고뉴클레오티드는 변성에 의해 제거된다; 3) RecJ 또는 ExoVII와 같은 뉴클레아제를 첨가하여 단일 가닥 과량 b-BLA(740)를 분해하고; 4) 프라이머(750)는 바코드된 핵산 단편(730) 상의 바코드의 서열 5'에 어닐링되고 연장되어 이중-가닥 DNA 분자(760)를 형성한다; 이후, 이중-가닥 DNA 분자는 제2의 이중-가닥 어댑터(770)에 결찰되어 양쪽 말단에 어댑터 서열, 즉 분지 어댑터로부터의 하나의 어댑터 서열 및 제2의 이중-가닥 어댑터로부터의 다른 어댑터 서열을 갖는 이중-가닥 분자(780)를 형성한다. 임의적으로, 제2 어댑터는 자가-결찰을 피하기 위해 5' 포스페이트를 포함하지 않는다. 이중-어댑터 서열을 갖는 이중-가닥 분자(780)는 이후 변성되고 USER에 의해 비드로부터 방출되어, 단일-가닥 분자(781)를 발생시키며, 이는 이후 증폭 및/또는 원형화될 수 있다.
[0014] 도 8은 b-BLA가 비드(800)에 고정된 본 발명의 예시적인 구체예를 도시한다. 각각의 b-BLA는 바코드 올리고뉴클레오티드(820) 및 혼성화 올리고뉴클레오티드(810)를 포함한다. 바코드 올리고뉴클레오티드(820)는 3'에 디데옥시 차단제 뉴클레오티드를 포함한다. b-BLA에서 혼성화 올리고뉴클레오티드는 닉카제 처리 동안 분지 결찰을 통해 표적 핵산 단편에 결찰된다. 람다 엑소뉴클레아제 및 엑소뉴클레아제 I은 반응에 첨가되어 과량의 b-BLA(830)를 제거한다. 혼성화 올리고뉴클레오티드와 표적 핵산 단편을 결찰시킴으로써 형성된 결찰 생성물은 바코드를 복사하도록 연장되고, 이는 바코드된 핵산 단편(840)을 발생시키고, 이는 변성에 의해 바코드 올리고뉴클레오티드로부터 분리된다. 프라이머는 바코드 서열에 대한 서열 3'에서 단일-가닥 분자에 어닐링되고 연장된다. 연장은 이중-가닥 분자(850)를 형성한 후, 제2 어댑터에 결찰되어 양쪽 말단에 어댑터 서열을 갖는 이중-가닥 핵산 단편(860)을 형성한다. 이중-가닥 핵산 단편(860)은 이후 PCR에 의해 증폭될 수 있다. 대안적으로, 이중-가닥 핵산 단편은 변성되어 단일-가닥 핵산 단편을 형성할 수 있고, 이는 이후 원형화된다. 임의적으로, 제2 어댑터에는 5' 포스페이트가 결여되어 있으며, 이는 개별 제2 어댑터의 자가-결찰을 최소화할 수 있다.
[0015] 도 9a 및 도 9b는 b-BLA가 비드(900)에 고정화된 본 발명의 또 다른 구체예를 도시한다. 각각의 b-BLA는 서로 혼성화된 바코드 올리고뉴클레오티드(910) 및 혼성화 올리고뉴클레오티드(920)를 포함한다. 혼성화 올리고뉴클레오티드(920)는 3' 말단에 디데옥시 차단제 뉴클레오티드를 포함한다. 먼저, 바코드 올리고뉴클레오티드는 닉카제-처리된 표적 핵산 단편에 결찰되고 분지 결찰을 통해 바코드된 핵산 단편(930)을 형성한다. 두 번째, 혼성화 올리고뉴클레오티드는 변성에 의해 제거된다. 세 번째, 제어된 폴리머라제 연장이 수행되며, 이는 3' 분지 결찰에 사용될 수 있는 5' 오버행(940)을 남긴다. 제어된 연장은 단지 약 100-150개 염기로 진행되며, 3-5' 엑소뉴클레아제 활성을 갖지 않는 DNA 폴리머라제에 의해 수행되어 주형의 말단에 A 테일(950)을 발생시킨다. 이는 과량의 어댑터의 완전한 연장 및 A 테일링을 야기할 것이지만, 게놈 단편에 결찰된 이러한 어댑터는 불완전할 것이다. 다음으로, 연장된 과량의 어댑터의 A 테일에 상보적인 T 테일을 갖는 헤어핀 어댑터로 결찰이 수행되어, 과량의 어댑터(960)가 결찰 또는 연장으로부터 차단되는 한편, 표적 핵산 단편(970)에 결찰된 나머지 어댑터는 차단되지 않는다(즉, 이러한 나머지 어댑터는 헤어핀 어댑터에 결찰될 수 없다). 종결인자는 상이한 농도 또는 상이한 사이클 동안 상이한 시점에 첨가되어 상이한 길이를 갖는 연장 생성물을 생성할 수 있으며, 이는 시퀀싱 공정 동안 각 단편의 대부분의 염기에 걸쳐 중첩 적용 범위를 제공할 수 있다.
[0016] 나머지 어댑터(970)는 가역적 종결인자로 추가로 연장된 후, 종결인자 차단 기를 제거하는 반응을 수행한 다음, 3' 분지 결찰이 제2 어댑터(980)를 첨가하기 위해 수행되어 말단에서 핵산 단편을 표적화시킨다. 이어서, 반응이 변성되고, 그 후 양쪽 말단에 2개의 어댑터 서열을 포함하는 단일-가닥 분자(990)는 PCR에 의해 증폭되거나 원형화될 수 있다.
[0017] 도 10a 및 도 10b는 제어된 연장을 수행하는 것을 포함하는 본 발명의 또 다른 구체예를 도시한다. 도 9a 및 9b와 유사하다. 이 구체예에서 사용되는 b-BLA는 또한 서로 혼성화된 바코드 올리고뉴클레오티드 및 혼성화 올리고뉴클레오티드(1020)를 포함하는 분지 어댑터이다. 혼성화 올리고뉴클레오티드(1020)는 3' 말단에 디데옥시 차단제 뉴클레오티드를 포함한다. 먼저, 바코드 올리고뉴클레오티드는 닉카제-처리된 표적 핵산 단편에 결찰되고 분지 결찰을 통해 바코드된 핵산 단편(1030)을 형성한다. 두 번째, 혼성화 올리고뉴클레오티드는 변성에 의해 제거된다. 세 번째, 제어된 폴리머라제 연장은 연장을 약 100-150개 염기로 제한하는 조건 하에 3-5' 엑소뉴클레아제 활성을 갖는 폴리머라제를 사용하여 수행된다. 이는 3' 분지 결찰에 사용될 수 있는 5' 오버행(1040)을 남긴다. 이는 표적 핵산 단편(1040)에 결찰된 어댑터에 대한 불완전한 연장 및 과량의 어댑터(1050)에 대한 완전한 연장을 발생시키며, 이는 5' 포스페이트를 갖는 평활 말단 dsDNA 어댑터를 형성한다. 이어서, 람다 엑소뉴클레아제는 반응에 첨가되고, 람다는 5' 포스페이트(1050)를 갖는 평활 말단 dsDNA 어댑터를 분해한다. 람다 엑소뉴클레아제는 단일-가닥 DNA보다 인산화된 이중-가닥 DNA를 선호하므로, 어댑터된 짧은 삽입체(예를 들어, 1050)는 긴 DNA 삽입체(예를 들어, 1040)보다 우선적으로 분해될 것이다. 도 10b에 도시된 바와 같이 방법의 나머지 단계는 도 9a 및 9b에 묘사된 것과 유사하다.
[0018] 도 11a는 도 10a에 기술된 바와 같은 제어된 연장을 수행하고, 이는 과량의 어댑터(1150)를 완전히 연장하고, 결찰된 생성물(1140)을 부분적으로 연장시킴을 보여준다. 도 11b는 부분적으로 연장된 결찰 생성물(1140)이 그 후 가역적 종결인자의 존재 하에 추가로 연장되고, 이어서 가역적 종결인자에서 종결인자 차단 기가 제거된 후, 제2 어댑터(1160)로 결찰됨을 보여준다. 이는 과량의 어댑터(1150)의 평활-말단 결찰 및 바코드된 표적 핵산 단편(1170)의 3' 분지 결찰을 발생시켜 양쪽 말단에 어댑터 서열을 갖는 핵산 단편(1180)을 형성시킨다. 결찰되지 않은 가닥(1190)은 연장-제어 조건 하에 폴리머라제를 치환하는 가닥에 의해 연장되어 비결찰된 가닥이 단지 약 100-150개 염기로 연장된다. 이러한 연장은 비드 상에 고정된 채로 남아 있는 어댑터된 핵산 단편의 가닥 치환 및 어댑터된 핵산 단편의 방출(1190)을 발생시킨다. 어댑터된 핵산 단편의 방출은 용액에서 수집될 수 있다. 비드는 제어된 연장의 다음 사이클에 재사용될 수 있다. 가역적 종결인자를 포함하는 상기 기재된 다른 구체예와 유사하게, 종결인자는 상이한 길이를 갖는 연장 생성물을 생성하기 위해 상이한 사이클 동안 상이한 농도 또는 상이한 시점에 첨가될 수 있다. 이는 유리하게는 시퀀싱 공정 동안 각 단편의 대부분의 염기에 걸쳐 중첩 적용 범위를 제공한다.
[0019] 도 12a 및 도 12b는 본원에 개시된 방법을 사용하여 형성된 닉-결찰 생성물의 전기영동 결과를 보여준다. 세그멘타제(MGI, Shenzhen, P.R. China로부터 입수 가능)는 도 12a에 도시된 상이한 반응에서 점차적으로 증가하는 양으로 사용되었고, 마스터라제(Qiagen)는 도 12b에 도시된 상이한 반응에서 점차적으로 증가하는 양으로 사용되었다. 도 12c 및 도 12d는 2 라운드의 닉-결찰 반응으로부터 형성된 생성물의 전기영동 결과를 보여준다. 세그멘타제는 도 12c에 도시된 반응에 사용되었고 마스터라제는 도 12d에 도시된 반응에 사용되었다.
상세한 설명
I. 개요
[0020] 시퀀싱 라이브러리를 제조하기 위한 "닉-결찰" 또는 "닉-결찰" 단일 튜브 LFR 방법이 본원에 기재된다. 상기 방법은 제어된 속도, 빈도, 또는 둘 모두로 이중-가닥 표적 핵산에 단일-가닥 파손(예를 들어, 닉 또는 갭)을 도입한다. 본 방법은 또한 하기에 추가로 기재된 바와 같이 어댑터(들)를 파손의 3'(3-프라임) 측, 파손의 5'(5-프라임) 측, 또는 닉 또는 갭의 양측에 결찰시킨다. 하나 이상의 어댑터의 첨가는 "어댑터된 단편"을 생성한다. 라이브러리 제조에 관여하는 효소 반응, 예를 들어, 닉킹 및 결찰은 하나의 단일 혼합물에서 수행되어 원하는 어댑터 및 바코드를 갖는 표적 핵산의 라이브러리를 생성할 수 있다.
[0021] 닉-결찰 방법은 큰 게놈 단편 시퀀싱을 위한 서열 판독의 새로운 조립에 특히 적합한 특정 이점을 갖는다.
[0022] 첫째, 공정은 라이브러리 제조의 전체 공정 동안 서로 회합된 채로 남아 있는 중첩되는 단일-가닥 핵산 단편을 생성한다. DNA 가닥 파손 부위에서 이중-가닥 파손을 생성하는 방법(예를 들어, 트랜스포손 삽입-기반 방법)과 비교하여, 본원에 개시된 방법은 물질 손실을 피하고 표적 핵산의 클론 적용 범위를 증가시킨다.
[0023] 둘째, 트랜스포손-매개 공동-바코딩 방법과 비교하여(예를 들어, 문헌[Zhang et al., Nature Biotechnology, June 2017, doi 10.1038/nbt.3897]에 기술됨), 닉-결찰 방법은 특정 DNA 서열에 대한 트랜스포사제 선호에 의해 초래된 편향을 회피한다.
[0024] 셋째, 다단계 트랜스포손-기반 공동-바코딩 방법과 달리, 본원에 개시된 라이브러리 제조 및 공동-바코딩 공정은 단일-단계, 단일-튜브 제조로서 수행될 수 있다.
[0025] 넷째, 본원에 개시된 방법에 의해 생성된 어댑터된 단편의 크기는 표적 핵산에 관계없이 반응에서 성분을 조절함으로써 제어될 수 있다. 다른 기존의 트랜스포손-기반 방법에 의해 생성된 표적 핵산 단편의 크기는 반응에서 고분자량 게놈 DNA의 양에 의해 영향을 받으므로, 종종 조절하기 어렵다. 대조적으로, 본원에 개시된 방법에서, 크기는, 예를 들어, 닉킹제 및 리가제의 양의 균형을 맞추는 것에 의해 조절될 수 있다.
[0026] 예시적인 작업 흐름은 도 1에 도시되어 있다. 단계 1 및 2에서, 이중-가닥 핵산은 닉킹되어 엇갈린 단일-가닥 파손(220)을 생성한다. 단계 3에서, 파손은 (뉴클레오티드 부재 하에) Klenow 단편과 같은 "갭핑 효소"에 의해 연장된다(동등하게, "확장된다" 또는 "갭 개방된다"). 도 2에 도시된 바와 같이, 이러한 닉킹 및 갭핑 공정은 단일-가닥 갭 및 중첩 핵산 단편(240)("단편")을 생성한다. 이들 단편 각각의 일부는 상보적 서열을 갖는 또 다른 단편의 일부에 혼성화된 채로 유지된다.
[0027] 단계 3에서, 단편은 어댑터에 결찰된다. 어댑터 중 하나는 비드-연결된 분지 결찰 어댑터 또는 B-BLA로 지칭되는 비드 상에 고정된 분지 결찰 어댑터일 수 있다. 다른 어댑터는 용액으로 제공되는 L-어댑터일 수 있다. 임의적으로, 과량의 어댑터(즉, 임의의 단편에 결찰되지 않은 어댑터)는 뉴클레아제에 의해 제거될 수 있다(단계 4).
[0028] 단계 5에서, 일부 경우에, 어댑터된 단편은 바코드 서열을 포함하는 이중-가닥 단편을 생성하기 위해 확장된다. 본원에 별도의 단계로서 개시되어 있지만, 닉킹 및 결찰은 단일 반응으로 발생할 수 있고 동시에 발생할 수 있다. 일부 구체예에서, 닉킹 및 결찰 반응은 적어도 30분, 예를 들어, 적어도 60분, 적어도 90분, 또는 적어도 120+분 지속될 수 있다. 일부 구체예에서, 이중-가닥 단편은 변성되어 단일-가닥 분자를 형성한다.
[0029] 단계 6에서, 변성된 핵산 단편은 예를 들어, 단편의 양쪽 말단에서 어댑터 서열에 어닐링된 프라이머를 사용하여 PCR에 의해 증폭된다. 대안적으로, 변성된 핵산 단편은 원형화되고 증폭될 수 있다.
[0030] 이러한 작업 흐름의 변형은 또한 본 개시에 포함된다. 예시적인 변형은 도 3-8에 도시되어 있다.
II. 정의
[0031] "단일 반응 혼합물"에서의 성분 또는 반응은 태깅 단계 동안 별도의 튜브, 용기, 분취량, 웰, 챔버 또는 액적으로의 구획화 없이 단일 혼합물에서 반응이 일어나는 것을 의미한다. 성분은 동시에 또는 임의의 순서로 첨가되어 단일 반응 혼합물을 제조할 수 있다.
[0032] 용어 "엇갈린 단일-가닥 파손"은 이중-가닥 또는 부분적 이중-가닥 DNA 분자의 단일 가닥 내로 도입되어, 다른 단일-가닥 핵산 단편에 혼성화된 복수의 중첩 단일-가닥 핵산 단편을 발생시키는 파손(닉킹 또는 갭핑에 의해 생성됨)을 나타낸다. 핵산 단편의 적어도 일부의 경우, 5' 서열의 일부는 또 다른 핵산 단편의 5' 서열의 적어도 일부에 상보적이고, 3' 서열의 적어도 일부는 또 다른 핵산 단편의 3' 서열의 적어도 일부에 상보적이어서 혼성화 조건 하에 복수의 핵산 단편이 서로 혼성화되어 핵산 복합체를 형성한다. 비제한적으로, 예시를 위해, 엇갈린 단일-가닥 파손에 의해 분리된 4개의 핵산 단편을 포함하는 핵산 복합체가 도 2에 예시되어 있다. 핵산 복합체(또는 "복합체")는 4개 초과의 핵산 단편을 포함할 수 있고, 전형적으로 포함하는 것으로 이해될 것이다.
[0033] 용어 "부분적 이중 가닥"은 서로 혼성화되고 한 가닥의 적어도 일부가 다른 가닥에 혼성화되지 않은 2개의 DNA 가닥을 지칭한다. 부분적 이중-가닥 DNA의 2개의 DNA 가닥은 상이한 길이일 수 있거나 동일한 길이일 수 있다.
[0034] 본원에서 사용되는 바와 같은, "고유 분자 식별자"(UMI)는 개별 DNA 분자를 서로 구별하는데 사용될 수 있는 DNA 분자에 존재하는 뉴클레오티드의 서열을 지칭한다. 예를 들어, 문헌[Kivioja, Nature Methods 9, 72-74 (2012)] 참조. UMI는 동일한 공급원 핵산으로부터 유래된 서열 판독를 확인하기 위해 이들이 회합된 DNA 서열과 함께 시퀀싱될 수 있다. 용어 "UMI"는 문맥으로부터 명백할 바와 같이, UMI의 뉴클레오티드 서열 및 물리적 뉴클레오티드 둘 모두를 지칭하기 위해 본원에서 사용된다. UMI는 어댑터에 삽입되거나 그렇지 않으면 시퀀싱될 소스 핵산(예를 들어, DNA) 분자에 혼입되는 랜덤, 슈도-랜덤 또는 부분 랜덤, 또는 비랜덤 뉴클레오티드 서열일 수 있다. 일부 구현예에서, 각각의 UMI는 샘플에 존재하는 임의의 주어진 공급원 DNA 분자를 고유하게 식별할 것으로 예상된다.
[0035] 본원에서 사용되는 용어 "단일 튜브 LFR" 또는 "stLFR"은 예를 들어, 미국 특허 공개 2014/0323316 및 문헌 [Wang et al., Genome Research, 29: 798-808 (2019)]에 기재된 공정을 지칭하며, 전체 내용은 그 전체가 참조로서 본원에 포함되며, 여기서, 특히, 동일한 고유 바코드 서열(또는 "태그")의 다수의 복사체가 개별적인 긴 핵산 단편과 회합된다. 단일 튜브 LFR의 일 구체예에서, 긴 핵산 단편은 규칙적인 간격으로 "삽입 올리고뉴클레오티드"로 라벨링된다. 일 구체예에서, 삽입 올리고뉴클레오티드는 하나 이상의 효소, 예를 들어, 트랜스포사제, 닉카제 및 리가제에 의해 긴 핵산 분자로 도입된다. 상이한 긴 핵산 단편 간의 바코드 서열은 상이하다. 따라서, 개별 긴 핵산 단편을 라벨링하는 과정은 구획화 없이, 예를 들어, 단일 용기에서 편리하게 수행될 수 있다. 이 공정은 태깅 단계 동안 단편을 별도의 튜브, 용기, 분취액, 웰 또는 액적으로 분리할 필요 없이 다수의 개별 DNA 단편의 분석을 가능하게 한다.
[0036] 본원에서 사용되는 "고유한" 바코드는 개별 비드와 회합되고 이를 구별하기 위해 사용될 수 있는 뉴클레오티드 서열을 지칭한다. 각각 고유한 바코드를 갖는 비드의 집단에서, 하나의 비드와 관련된 바코드 서열은 집단에서 적어도 90%의 비드, 보다 종종 집단에서 적어도 99%의 비드, 훨씬 더 종종 집단에서 적어도 99.5%의 비드, 및 가장 흔히 집단에서 적어도 99.9%의 비드의 바코드 서열과 상이하다.
[0037] 폴리뉴클레오티드 및 기질(예를 들어, 비드)과 관련하여 사용되는 용어 "연결(join)"은 폴리뉴클레오티드(또는 폴리뉴클레오티드의 하나의 말단)가 기질에 직접 접촉하거나 공유적으로 연결되는 것을 지칭한다. 예를 들어, 표면은 폴리뉴클레오티드 분자 상의 작용기와 반응하여 공유 결합을 형성하는 반응성 작용기를 가질 수 있다. 하나의 예시적인 예로서, b-BLA는 바코드 올리고뉴클레오티드 또는 혼성화 올리고뉴클레오티드를 비드에 연결함으로써 비드 상에 고정화된다.
[0038] 본원에 개시된 방법 또는 조성물에서 사용되는 어댑터(또는 임의의 다른 폴리뉴클레오티드 또는 폴리뉴클레오티드 복합체)와 관련하여 사용될 때 용어 "용액 중"은 어댑터(또는 임의의 다른 폴리뉴클레오티드 또는 폴리뉴클레오티드 복합체)가 기질 상에 고정되지 않으며, 용액 중에 자유롭게 이동할 수 있음을 나타낸다. "용액에서 수행된 반응"에서와 같이 반응을 기술하기 위해 사용될 때, 반응이 모두 용액에 있는 핵산 사이에 발생하는 것을 지칭한다.
[0039] 용어 "어댑터"는 문맥으로부터 명백해지는 바와 같이 상이한 의미로 본원에서 사용된다. 일부 구체예에서, "어댑터"는 하기 논의되는 바와 같은 "분지 결찰 어댑터(BLA)"를 지칭한다. 일부 구체예에서, "어댑터"는 하기 논의되는 바와 같은 "L-어댑터"를 지칭한다. 비드 상에 고정된 BLA는 비드-연결된 분지 결찰 어댑터("b-BLA")로 지칭된다. 용액 중에 있는 BLA는 용액 분지 결찰 어댑터("s-BLA")로 지칭된다.
[0040] 용어 "어댑터된 핵산 단편"은 하나의 표적 핵산 단편 및 하나 이상의 어댑터 서열을 포함하는 폴리뉴클레오티드를 지칭한다. 예를 들어, 하나 이상의 어댑터 서열은 b-BLA의 서열 또는 L-어댑터의 서열, 또는 둘 모두일 수 있다.
[0041] 용어 "과량의 어댑터"(예를 들어, 과량의 b-BLA 어댑터) 또는 "결찰되지 않은 어댑터"는 비드 상에 고정되지만 다른 비드 어댑터가 표적 핵산 단편에 결찰되는 조건에도 불구하고 표적 핵산 단편에 결찰되지 않은 어댑터를 나타낸다.
[0042] 용어 "연장된 핵산 단편" 또는 "바코드된 연장 생성물"은 어댑터에 결찰되고 바코드의 복사체를 포함하도록 연장된 단편을 지칭한다.
[0043] 용어 "결찰된 생성물" 또는 "결찰된 어댑터"는 표적 핵산 단편 및 b-BLA 어댑터로부터의 적어도 어댑터 서열을 포함하는 생성물을 지칭한다. 일부 경우에, 결찰된 생성물은 한 말단에 b-BLA로부터의 어댑터 서열 및 다른 말단에 또 다른 어댑터(예를 들어, L-어댑터)로부터의 어댑터 서열을 추가로 포함할 수 있다.
[0044] 용어 "결찰된 제1 어댑터"는 표적 핵산 단편 및 제1 어댑터의 서열의 결찰에 의해 형성된 생성물을 나타낸다.
[0045] 용어 "어댑터 서열"은 문맥으로부터 명백할 바와 같이 어댑터의 어느 한 가닥 상의 서열을 나타낸다. 즉, "어댑터 서열"은 한 가닥 상의 어댑터의 서열 및 제2 가닥 상의 상보적 서열 둘 모두를 나타낼 수 있다. 예를 들어, b-BLA 어댑터 서열은 바코드 올리고뉴클레오티드 상의 서열 또는 혼성화 올리고뉴클레오티드 상의 서열일 수 있다.
[0046] 용어 "분지 결찰 어댑터", "분지 어댑터" 또는 "BLA"는 부분적 이중-가닥 어댑터를 나타낸다. 상기 부분적 이중-가닥 어댑터는 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 바코드 서열을 포함하는 단일-가닥 영역을 포함한다. 분지 어댑터의 이중-가닥 영역의 5' 말단은 하기에 추가로 기재된 바와 같이 분지 결찰을 통해 핵산 단편의 3' 말단에 결찰될 수 있다.
[0047] 용어 "비드-고정된 분지 결찰 어댑터" 또는 "b-BLA"는 비드 상에 고정된 분지 결찰 어댑터를 지칭한다. 본원에 개시된 b-BLA는 서로 혼성화된 바코드 올리고뉴클레오티드 및 혼성화 올리고뉴클레오티드를 포함한다.
[0048] 용어 "바코드 올리고뉴클레오티드"는 바코드 서열을 포함하는 b-BLA의 가닥을 나타낸다.
[0049] 용어 "혼성화 올리고뉴클레오티드"는 바코드 올리고뉴클레오티드에 상보적인 분지 결찰 어댑터의 가닥을 나타낸다.
[0050] 용어 "가역적 종결인자 뉴클레오티드" 또는 "가역적 종결인자"는 3' 가역적 차단 기를 갖는 뉴클레오티드를 나타낸다. "가역적 차단 기"는 절단되어 또 다른 뉴클레오티드의 5' 포스페이트 기에 결찰될 수 있는 뉴클레오티드의 3'-위치에 하이드록실 기를 제공할 수 있는 기를 나타낸다. 가역적 차단기는 효소, 화학 반응, 열 및/또는 광에 의해 절단될 수 있다. 3' 가역적 차단 기를 갖는 예시적인 뉴클레오티드는 당 분야에 공지되어 있으며, 미국 특허 번호 10,988,501에 기재되어 있으며, 관련 개시는 본원에 참조로서 포함된다.
[0051] 용어 "복사체"는 프라이머 연장에 의해 주형의 상보적 뉴클레오티드 가닥을 생성하는 것을 나타낸다.
III. 방법의 예시적인 구체예
[0052] 닉-결찰 방법은 다양한 반응식에 따라 수행될 수 있다. 이 섹션은 방법의 예시적인 구체예를 제공한다. 본 개시에 의해 안내되는 분자 생물학 및 시퀀싱 분야의 숙련가는 개별 단계의 수많은 변형을 인지할 것이며, 시약이 하기 반응식에 포함될 수 있다.
방법
1. 닉킹
[0053] 일 접근법에서, 표적 핵산은 이중-가닥 DNA에서 엇갈린 단일-가닥 파손을 생성하는 하나 이상의 닉킹제와 조합된다. 일부 구체예에서, 닉킹제는 효소(일반적으로 '닉카제'로 지칭됨), 예를 들어, 폴리뉴클레오티드 사슬 내의 포스포디에스테르 결합을 절단하거나 폴리뉴클레오티드 사슬로부터 하나 이상의 인접한 뉴클레오티드를 제거하는 엔도뉴클레아제이다. 일부 경우에, 닉카제는 무작위 위치에서 DNA 가닥을 닉킹하는 비-서열 특이적 엔도뉴클레아제이다. 닉킹제의 비제한적인 예는 비브리오 불니피쿠스 뉴클레아제(Vvn), 새우 dsDNA 특이적 엔도뉴클레아제, DNAse I, 세그멘타제(MGI), 및 마스터라제(Qiagen)를 포함한다. 일부 구체예에서, 닉킹제는 이의 인식 서열에서 DNA를 닉킹하는 부위- 또는 서열-특이적 뉴클레아제, 예컨대, 제한 엔도뉴클레아제이다. 부위-특이적 닉카제의 비제한적인 예는 전체 개시 내용이 본원에 참조로 포함된 문헌[Shuang-yong Xu, BioMol Concepts 2015; 6(4): 253-267]에 기재된 바와 같은 Nt.CviPII(CCD), Nt.BspQI 및 Nt.BbvCI를 포함한다.
[0054] 일부 구체예에서, 본원에 개시된 닉킹제는 또한 화학적 닉킹제일 수 있다. 화학적 닉킹제의 비제한적인 예는 디펩티드 세릴-히스티딘(Ser-His), Fe2+/H2O2, 또는 Cu(II) 착물/H2O2를 포함한다.
[0055] 따라서, 닉킹제는 비-특이적 닉카제, 부위-특이적 닉카제, 또는 화학적 닉킹제와 같은 카테고리로 그룹화될 수 있다. 일부 구체예에서, 방법은 2개 이상의 닉킹제를 사용한다. 일부 구체예에서, 방법은 동일한 카테고리의 닉킹제로부터의 2개 이상의 닉킹제를 사용하였다. 일부 구체예에서, 방법은 상이한 카테고리로부터의 닉킹제를 사용한다.
[0056] 다수의 파라미터는 파손에 의해 분리된 핵산 단편의 길이에 영향을 미칠 수 있다. 전형적으로, 닉킹제의 농도가 높을수록, 닉킹제에 의한 처리 시간이 길어질수록, 단편의 길이는 짧아진다. 이러한 파라미터 중 하나 이상을 조절함으로써, 단편의 길이는 원하는 범위 내에서 조절될 수 있다. 일부 구체예에서, 닉킹으로부터 생성된 핵산 단편의 평균 길이는 200 내지 10000개의 뉴클레오티드, 예를 들어, 200-500개의 뉴클레오티드 또는 400-1000개의 뉴클레오티드 또는 1000-10000개의 뉴클레오티드이다.
2. 갭핑
[0057] 일부 구체예에서, 닉카제에 의해 생성된 닉은 엑소뉴클레아제에 의해 연장(확대)되어 갭을 형성한다. 이 공정은 "갭핑"으로 지칭될 수 있고, 공정에 사용되는 엑소뉴클레아제는 "갭핑 효소"로 지칭될 수 있다. 3' 엑소뉴클레아제 활성을 갖는 효소의 예는 DNA 폴리머라제 I, Klenow 단편(뉴클레오티드의 부재 하에), 엑소뉴클레아제 III, 및 당 분야에 공지된 다른 것들을 포함한다. 5' 엑소뉴클레아제 활성을 갖는 효소의 예는 Bst DNA 폴리머라제, T7 엑소뉴클레아제, 절두된 엑소뉴클레아제 VIII, 람다 엑소뉴클레아제, T5 엑소뉴클레아제, 및 당 분야에 공지된 다른 엑소뉴클레아제를 포함한다. 낮은 공정성 엑소뉴클레아제(즉, 비교적 낮은 속도로 폴리뉴클레오티드의 말단으로부터 뉴클레오티드를 제거하는 엑소뉴클레아제)는 짧은 갭(예를 들어, 2-7개 염기, 3-10개 염기, 또는 3-20개 염기)을 개방하고 DNA로부터 분리되어 어댑터 결찰을 허용하는 것이 바람직하다. 엑소뉴클레아제가 사용되는 경우, 필요에 따라, 엑소뉴클레아제 분해로부터 DNA 어댑터의 보호는 어댑터의 5' 및 3' 말단에서 염기(또는 변형된 염기) 사이에 포스포로티오화된 결합을 도입함으로써 달성될 수 있다.
[0058] 도 2는 엇갈린 단일-가닥 파손(230)에 의해 분리된, 중첩 핵산 단편(240)을 생성하기 위해 하나 이상의 닉킹제 및 하나 이상의 갭핑 효소를 사용하는 공정을 예시한다.
3. 어댑터의 첨가(결찰)
[0059] 상기 논의되고 도 2에 예시된 바와 같이, 닉킹 및 갭핑은 각각이 5' 말단 및 3' 말단을 갖는 복수의 단편(240)을 생성한다. 일부 구체예에서, "단편"은 단일-가닥이지만, 상기 및 본원의 다른 곳에서 논의된 바와 같이, 단편은 예를 들어, 핵산 복합체를 형성하기 위해 상보적 가닥에 혼성화될 수 있다. 제1 어댑터는 단편의 한 말단(5' 말단 또는 3' 말단일 수 있음)에 결찰되고, 제2 어댑터(이는 제1 어댑터와 상이함)는 나머지 말단에 결찰된다. 결과는 2개의 상이한 어댑터 서열을 갖는 복수의 어댑터된 단편이고; 반응에서 생성된 어댑터된 단편 모두는 동일한 정의된 배열을 갖는다(예를 들어, 5'에서 제1 어댑터 서열 및 3'에서 제2 어댑터 서열, 또는 대안적으로, 5'에서 제2 어댑터 서열 및 3'에서 제1 어댑터 서열).
[0060] 본 발명의 일 양태에서, 제1 어댑터는 단편의 3' 말단에 결찰되고, 제2 어댑터는 단편의 5' 말단에 결찰된다. 일부 구체예에서, 제1 어댑터는 b-BLA이고, "3' 분지 결찰"의 과정에서 단편에 결찰된다. 일부 구체예에서, 제2 어댑터는 "L-어댑터"이다. 일부 구체예에서, 제1 어댑터 및 제2 어댑터의 결찰은 닉킹 및 갭핑 반응과 동일한 반응 혼합물에서 발생한다.
제1 어댑터 결찰
[0061] 일부 구체예에서, 제1 어댑터는 BLA이다. BLA는 당업계에 공지되어 있으며 상기 정의된다. BLA는 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 바코드 서열을 포함하는 단일-가닥 영역을 포함한다. 이중-가닥 평활 말단은 3' 분지 결찰을 통해 표적 핵산 단편의 3'에 결찰될 수 있는 5' 포스페이트를 제공한다. 3' 분지 결찰은 평활-말단 어댑터(공여체 DNA)로부터의 5' 포스페이트의 3' 리세스된 가닥, 갭 또는 닉에서 듀플렉스 DNA 수용체의 3' 하이드록실 말단으로의 공유 결합을 포함한다. 통상적인 DNA 결찰과 대조적으로, 3' 분지 결찰은 상보적 염기쌍을 필요로 하지 않는다. 3' 분지 결찰은 문헌[Wang et al., BioRxiv, June 29, 2018], doi:https//doi.org/10.1101/357863; PCT 공개 번호 WO 2019/217452; US Pat. Pub. US2018/0044668 및 국제 출원 WO 2016/037418, US Pat. Pub. 2018/0044667, 뿐만 아니라 [Wang et al., June 29, 2018, http://dx.doi.org/10.1101/357863]에 기재되어 있으며, 이들 모두는 모든 목적을 위해 참조로서 포함된다.
[0062] 3' 분지 결찰을 사용하여, 포획된 게놈 분자의 모든 서브-단편을 증폭하고 시퀀싱하는 것이 이론적으로 가능하다. 따라서, 3' 분지 결찰은, 예를 들어, NGS 라이브러리 제조 동안 DNA 또는 RNA에 어댑터를 부착하는 것을 포함하는 광범위한 분자 적용을 갖는다.
[0063] 또한, 이러한 결찰 단계는 샘플 바코드가 샘플링 멀티플렉싱을 위해 게놈 서열에 인접하게 배치될 수 있게 한다. 샘플 바코딩을 위해 이러한 어댑터를 사용하는 이점은 동일한 프라이머가 바코드 및 게놈 DNA를 시퀀싱하는데 사용될 수 있고 바코드를 판독하기 위해 추가적인 시퀀싱 프라이머가 필요하지 않도록 바코드가 게놈 DNA에 인접하게 배치될 수 있다는 것이다. 샘플 바코딩은 다수의 샘플로부터의 제조물이 시퀀싱 전에 풀링되고 바코드로 구별될 수 있게 한다. 3' 분지 결찰 어댑터는 96, 384 또는 1536 플레이트 포맷으로 합성될 수 있으며, 각각의 웰은 동일한 바코드를 수반하는 어댑터의 많은 복사체를 함유하고 각 바코드는 웰 간에 상이하다. 비드 상에 포획 후, 이러한 어댑터는 96, 384 또는 1536 플레이트 포맷의 결찰에 사용될 수 있다.
[0064] 3' 분지 결찰은 표준 시퀀싱 라이브러리 제조를 위한 간단하고 저비용의 편향 없는 방법으로서 또는 바코드된 비드(비드에 대한 부착은 바코드 어댑터의 3' 또는 5' 말단에 있을 수 있음)의 존재 하에 공동-바코딩 라이브러리 제조 방법으로서 수행될 수 있다. 이 전략은 T4 DNA 리가제의 특성에 의존하는데, 이는 문헌 [Wang et al., DNA Research, 2019 Feb 1 16(1):45-53]에 기술된 바와 같이 소위 "3' 분지 결찰"이라고 불리는 닉 또는 갭에서 DNA의 3' 말단에 이중-가닥 DNA 어댑터를 결찰할 수 있다. 이러한 신규한 결찰은 갭에서 혼성화하기 위해 어댑터의 말단에서 축퇴 단일-가닥 염기를 필요로 하지 않기 때문에, 제한된 어댑터 결합 능력을 갖는 비드 상에서 보다 효율적인 어댑터 결찰을 가능하게 한다. 더 큰 갭(예를 들어, 4-7개 염기)을 필요로 할 수 있는 L-어댑터의 결찰과 달리, 3' 분지 결찰은 닉 또는 매우 작은 갭(1-염기 갭)으로 수행될 수 있다. 또한, 5' 축퇴 L-어댑터의 결찰과 다른데, 이는 리가제가 혼성화 전에 L-어댑터의 단일-가닥 5'-포스페이트 말단에 결합할 수 없다는 점을 보상하기 위해 고농도의 이러한 5' 축퇴 L-어댑터를 필요로 할 수 있다.
[0065] 비드 상에서 가장 효율적인 3'-분지 결찰을 가능하게 하기 위해, 이러한 어댑터는 각각의 비드 주위에 불완전하게(예를 들어, 자유로운 느슨한 루프) 랩핑된 표적 DNA에 대한 접근을 개선하기 위해 동일한 염기의 스트레치 또는 단순 반복의 스트레치를 가질 수 있다. 단일-가닥 결합 단백질(SSB)은 비드를 게놈 DNA와 혼합하기 전에 각 어댑터의 단일-가닥 부분에 결합될 수 있다.
[0066] 일부 구체예에서, 제1 어댑터는 본원에서 "바코드 올리고뉴클레오티드" 및 "혼성화 올리고뉴클레오티드"로 지칭되는 2개의 폴리뉴클레오티드 가닥을 포함하는 b-BLA이다. 바코드 올리고뉴클레오티드는 혼성화 올리고뉴클레오티드보다 길고 적어도 하나의 바코드를 포함한다. 바코드 올리고뉴클레오티드는 혼성화 올리고뉴클레오티드에 혼성화되어 부분적 이중-가닥이고 평활 말단을 갖는 복합체를 형성한다.
[0067] 일부 구체예에서, 바코드 올리고뉴클레오티드는 분지 결찰에서 3' 리세스된 단편의 3' 말단에 결찰될 수 있는 5' 포스페이트를 가지며, 비드에 연결되는 3' 말단을 갖는 반면; 혼성화 올리고뉴클레오티드는 비드에 연결되지 않고, 혼성화 올리고뉴클레오티드는 포스포디에스테르 결합의 형성을 방지하여 분지 어댑터의 자가-결찰을 방지하는 3' 차단제 뉴클레오티드(예를 들어, 디데옥시 차단제 뉴클레오티드)를 포함한다. 3' 분지 결찰은 단편에 결찰된 바코드 올리고뉴클레오티드를 갖는다. 도 9a를 참조한다.
[0068] 일부 구체예에서, 혼성화 올리고뉴클레오티드는 분지 결찰에서 3' 리세스 단편의 3'에 결찰될 수 있는 5' 포스페이트를 가지며, 비드에 연결되는 3' 말단을 갖는 반면; 바코드 올리고뉴클레오티드는 비드에 연결되지 않고, 바코드 올리고뉴클레오티드는 포스포디에스테르 결합의 형성을 방지하는 3' 차단제 뉴클레오티드를 갖는다. 3' 분지 결찰(하기 논의됨)은 단편에 결찰된 혼성화 올리고뉴클레오티드를 발생시킨다(도 3 및 도 4 참조).
[0069] 일부 구체예에서, 제1 어댑터는 용액에 존재한다. 일부 구체예에서, 제1 어댑터의 일부는 비드 상에 고정되고, 제1 어댑터의 일부는 용액에 존재한다.
제2 어댑터 결찰
[0070] 닉킹되고 갭핑된 DNA의 단편(서로 회합됨)은 제2 어댑터에 결찰된다. 제2 어댑터는 L-어댑터, s-BLA, 또는 임의의 이중-가닥 또는 부분적 이중 가닥 어댑터일 수 있다.
[0071] 일부 구체예에서, 제2 어댑터는 L-어댑터이다. 일부 구체예에서, L-어댑터는 용액에 존재한다. L-어댑터는 US 특허 번호 10,479,991에 기술되어 있으며, 이의 전체 개시는 본원에 참조로서 포함된다. 본 방법에 사용되는 L-어댑터는 혼성화 영역 및 테일 영역을 포함하는 단일-가닥 어댑터이다. L-어댑터의 혼성화 영역은 3' 말단에 축퇴 염기, 예를 들어, 1-10개, 예를 들어, 3-8, 또는 4-7개의 축퇴 뉴클레오티드(N)를 3' 말단에 포함한다. 따라서, L-어댑터는 다양한 표적 서열에 혼성화할 수 있다. 상기 기재된 닉킹되고 갭핑된 DNA에서 핵산 단편과 접촉될 때, L-어댑터의 혼성화 영역은 표적 핵산에서 상보적 서열에 어닐링되는 한편, 테일 영역은 단일-가닥으로 유지된다. 결찰-허용 조건 하에, L-어댑터의 3' 말단은 핵산 단편의 5' 말단에 결찰된다. 예를 들어, 도 3-5를 참조한다.
[0072] 일부 구체예에서, L-어댑터는 결찰 효율 및 아티팩트의 감소를 개선하기 위해 혼성화 영역 옆에 특정 염기를 포함한다. 예를 들어, 반응에 사용된 닉카제가 특정 염기 또는 서열에서 우선적으로 절단하는 경우, 동일한 염기(또는 상보적 염기)가 L-어댑터의 말단에 조작되어 결찰 효율을 증가시킬 수 있다. 일부 구체예에서, 상이한 서열을 갖는, 예를 들어, 상이한 수의 축퇴 뉴클레오티드를 갖는 둘 이상의 L-어댑터가 동일한 반응에 사용될 수 있다.
[0073] 일부 구체예에서, 제2 어댑터는 부분적으로 가닥화된 어댑터이다(도 6, 7b, 및 8). 일부 구체예에서, 제2 어댑터는 이중-가닥 평활 말단을 갖는다. 일부 구체예에서, 닉킹되고 갭핑된 DNA의 단편이 제1 어댑터에 결찰되고 프라이머 연장을 통해 이중-가닥 DNA를 형성한 후, 제2 어댑터는 제1 어댑터의 반대쪽 말단에 결찰될 수 있다. 도 5, 6b 및 7을 참조한다. 일부 구체예에서, 제2 어댑터는 평활 말단 결찰에 의해 단편에 연결된다. 일부 구체예에서, A 테일을 남기는 연장 단계 동안 폴리머라제가 사용되었다면, 제2 어댑터는 단일 염기 오버행 결찰에 의해 단편에 연결된다.
동일한 반응에서 닉 또는 갭의 5' 및 3' 측에 대한 2개의 어댑터의 결찰
[0074] 일부 구체예에서, 제1 어댑터(예를 들어, b-BLA)는 단편의 3' 말단에 첨가될 수 있고, 제2 어댑터(예를 들어, L-어댑터)는 닉킹되고 갭핑된 DNA의 단편의 5' 말단에 결찰될 수 있다. 그리고 결찰은 닉킹 및 갭핑이 또한 발생하면서 동일한 혼합물에서 수행된다. 일부 구체예에서, 1 라운드의 닉-결찰 반응 후, 게놈 DNA로 래핑된 비드는 추가의 제1 및/또는 제2 어댑터의 존재 하에 닉카제 및/또는 갭핑 효소와 인큐베이션될 수 있어, 제2 라운드의 닉-결찰 반응이 일어난다. 이러한 닉-결찰 공정은 다수 라운드, 예를 들어, 2 라운드, 3 라운드 또는 4 라운드 동안 반복되어 2개의 어댑터로 결찰된 생성물의 수율을 개선시킬 수 있다. 예시적인 예는 실시예 6 및 7에 제시되어 있다.
[0075] 조건은 L-어댑터의 농도, 온도, 사이클링, pH, 염 농도, 게놈 단편에 결찰된 분지-어댑터로 3' 말단의 DNA 호흡을 향상시키기 위한 다른 첨가제를 조절함으로써 닉에서 둘 모두의 어댑터의 동시 결찰을 위해 최적화될 수 있으며, 이는 L-어댑터 혼성화 및 결찰을 위한 짧은 단일-가닥 영역을 허용한다. 하기 섹션 5, "동시 닉킹 및 결찰을 위한 조건"을 참조한다. 일부 구체예에서, 더 완전한 결찰 및 이에 따라 더 많은 비-중복된 판독 적용범위를 달성하기 위해, b-BLA에 추가하여, 추가적인 분지 결찰 어댑터가 반응에 용액(s-BLA)으로 첨가될 수 있다.
[0076] 일부 구체예에서, 5' 엑소뉴클레아제 활성을 갖는 효소가 반응에 첨가되어 과량의 제1 어댑터를 제거한다. 이는 L-어댑터 결찰 전에 또는 L-어댑터 결찰과 동시에 수행될 수 있다. 과량의 어댑터는 제거되기 때문에, 예를 들어, 0.01 내지 100 μM, 0.1 내지 50 μM, 0.5 내지 30 μM, 1 내지 20 μM의 범위의 더 높은 농도의 L-어댑터가 실질적인 양의 비드-어댑터 + L-어댑터 결찰 아티팩트의 생성 없이 사용될 수 있다. 제1 어댑터 서열 및 제2 어댑터 서열 둘 모두를 갖는 어댑터된 단편(예를 들어, L-어댑터)은 Illumina 유형 및 원형화를 필요로 하지 않는 다른 시스템에서 시퀀싱될 수 있다. 시퀀싱의 양태는 하기에 추가로 기재된다.
[0077] 일부 경우에, 3' 엑소뉴클레아제 활성(예를 들어, DNA 폴리머라제 I, 뉴클레오티드가 없는 Klenow 단편, 엑소뉴클레아제 III 등) 또는 5' 엑소뉴클레아제 활성(Bst DNA 폴리머라제 전장 또는 뉴클레오티드가 없는 Taq 폴리머라제, T7 엑소뉴클레아제, 절두된 엑소뉴클레아제 VIII, 람다 엑소뉴클레아제, T5 엑소뉴클레아제, 또는 유사체)을 갖는 추가적인 효소가 또한 첨가되어 제2 어댑터(예를 들어, L-어댑터)의 결찰을 위한 더 많은 공간을 위해 닉의 개방을 증가시킬 수 있다. 3' 및 5' 엑소뉴클레아제 활성 둘 모두를 갖는 효소 또는 효소의 조합은 분지 어댑터가 닉에서 결찰되더라도 L-어댑터 결찰을 위한 갭을 만드는 이점을 갖는다. 엑소뉴클레아제가 사용되는 경우, 필요에 따라, DNA 어댑터의 보호는 어댑터의 5' 및 3' 말단에서 염기 및/또는 변형된 염기 사이에 포스포로티오화된 결합을 통해 달성될 수 있다. 상기 논의된 바와 같이, 이 반응은 폴리에틸렌 글리콜 또는 베타인의 존재 하에 수행되어 결찰 및/또는 닉카제 효소의 활성을 증가시킬 수 있다.
[0078] 이 시점에서, 필요에 따라, 상기 논의된 바와 같이 과량의 어댑터가 제거될 수 있다. 낮은 농도의 L-어댑터 및 다른 조건은 어댑터-어댑터 결찰(예를 들어, L-어댑터 자체 사이의 결찰 또는 b-BLA와 L-어댑터 사이의 결찰)을 감소시키고 엑소뉴클레아제에 의한 과도한 어댑터 제거를 스킵하는데 사용될 수 있다. 그렇지 않으면, 이제 서브 단편의 양쪽이 이제 어댑터 서열을 갖기 때문에 PCR이 수행될 수 있다. PCR이 수행된 후 또는 PCR이 PCR-비함유 버전의 공정을 위해 스킵된 경우, 원형화에 이은 롤링 서클 증폭은 이전 섹션에 기재된 바와 같이 다음 단계이다.
[0079] 예시적인 일 구체예에서, 단일 반응 혼합물에서, 비특이적 닉킹 뉴클레아제, DNA 리가제, 및 제1 어댑터, 제2 어댑터는 이중-가닥 표적 핵산과 혼합되어 양쪽 말단에 어댑터 서열을 갖는 단편을 생성한다. 바람직한 구체예에서, 제1 및 제2 어댑터 중 하나는 미크론 크기의 비드에 결합되고 다른 어댑터는 용액에 존재한다.
[0080] 단일 반응 혼합물에 2개의 어댑터를 첨가하는 공정은 표준 시퀀싱 라이브러리 제조를 위한 단순하고, 저비용이며, 편향이 없는 방법으로서 용액에서 수행될 수 있다. 이 공정은 또한 어댑터가 부착된 바코드된 비드와 함께 사용되는 경우 공동-바코딩 라이브러리 제조 방법으로 사용될 수 있다.
4. 동시 닉킹 및 결찰을 위한 조건
[0081] 일부 구체예에서, 표적 핵산을 닉킹 및 갭핑하고, 닉킹 및 갭핑에 의해 생성된 단편에 하나 이상의 어댑터를 결찰시키는 것은 리가제의 활성, 닉킹제의 활성, 또는 이 둘 모두를 증가시키기 위한 첨가제(예를 들어, 폴리에틸렌 글리콜 또는 베타인)의 존재 하에 수행될 수 있다. 일부 구체예에서, 결찰은 적어도 비드-결합된 제1 어댑터(예를 들어, b-BLA)를 핵산 단편에 결찰시키는 것을 포함한다. 일부 구체예에서, 결찰은 용액에서 비드-결합된 제1 어댑터 및 제2 어댑터(예를 들어, L-어댑터) 둘 모두를 핵산 단편에 결찰시키는 것을 포함한다.
4.1 온도
[0082] 반응은 5-65℃, 예를 들어, 5-42℃, 10-37℃ 또는 5-15℃ 범위 내의 온도에서 유지될 수 있다. 일부 구체예에서, 반응은 실온, 37℃에서 유지된다. 일부 구체예에서, 열-안정성 리가제 및 닉킹 효소가 사용되는 경우, 반응은 37℃ 초과의 온도에서 유지될 수 있다. 일부 구체예에서, 반응은 다중 사이클(예를 들어, 5-100 사이클, 또는 20-60 사이클, 30-55 사이클 등) 동안 더 낮은 온도(5℃-25℃, 예를 들어, 10℃-15℃)와 더 높은 온도(예를 들어, 37℃ 이상) 사이에서 순환하는 조건으로 처리된다. 예시적인 예는 실시예 1-7에 제시되어 있다.
4.2 pH
[0083] 일부 구체예에서, 반응 혼합물의 pH는 라이브러리 제조에 필요한 모든 효소 기능을 수용하기 위해 5.0 내지 9.0, 예를 들어, 7.0 내지 9.0의 범위 내의 pH로 유지된다. 닉킹 및 결찰 반응의 지속기간은 핵산 단편의 원하는 크기 및 다른 조건, 예를 들어, 효소(폴리머라제, 엑소뉴클레아제, 또는 둘 모두를 포함함) 농도, 시간, 온도, 투입 DNA의 양에 따라 달라질 수 있다.
4.3 시간
[0084] 전형적으로, 닉킹 및 결찰 반응의 지속기간은 5분 내지 5시간, 예를 들어, 15-90분, 또는 30-120분 동안 지속될 수 있다. 반응은 당 분야에 널리 공지된 방법을 사용하여 종결될 수 있다. 일부 구체예에서, 닉킹 및 결찰은 용액에서 수행되고, 반응은 DNA 정제 방법(예를 들어, Beckman Coulter로부터의 Ampure XP 비드)을 통해 종결될 수 있다. 일부 구체예에서, 닉킹 및 결찰은 비드에서 수행되고, 비드를 완충제(예를 들어, Tris NaCl 완충제)로 세척하여 닉킹 및 결찰 반응에 필요한 효소 및 성분을 제거함으로써 반응이 종결될 수 있다.
4.4 효소
[0085] 본원에 기재된 방법 및 조성물은 닉킹 및 결찰이 단일 반응 혼합물에서 발생하도록 한다. 일부 구체예에서, 조건 및 효소는 결찰이 닉킹/갭핑보다 더 높은 비율로 발생하도록 선택된다. 이는 초기에 갭핑되는 닉의 분획이 후속 갭핑 전에 이들 대부분에 결찰된 어댑터를 얻도록 보장하여 DNA 손실을 최소화한다. 본원에 개시된 방법 및 조성물은 높은 닉-재밀봉율, 예를 들어, 70-100%의 닉-재밀봉율, 예를 들어, 70-90%, 80-90%, 80-95%, 90-99%를 허용한다. 본원에 개시된 닉-재밀봉율은 개방되는 갭이 리가제에 의해 재밀봉되는 백분율을 지칭한다. 높은 닉-재밀봉율은 다양한 방식으로 달성될 수 있다. 일부 구체예에서, 닉킹은 저활성 닉카제를 사용하여 수행된다. 일부 구체예에서, 닉킹은 낮은 농도, 예를 들어, 0000001-10 U/ul의 닉카제를 사용하여 수행된다. 일부 구체예에서, 결찰은 높은 결찰 속도를 갖는 리가제를 사용하여 수행된다. 일부 구체예에서, 결찰은 높은 농도, 예를 들어, 1-100 U/μl의 리가제를 사용하여 수행된다.
4.5 성분 추가 순서
[0086] 단일 반응 혼합물에 성분을 첨가하는 순서는 다양할 수 있다. 일부 구체예에서, 리가제는 닉카제를 첨가하기 전에 또는 닉카제를 첨가하는 것과 동시에 첨가된다. 리가제를 첨가하고 표적 핵산을 비드에 로딩하는 순서는 다양할 수 있다. 일부 구체예에서, 리가제는 표적 핵산(예를 들어, 게놈 DNA)을 첨가하기 전에 어댑터로 고정된 비드에 첨가된다. 일부 구체예에서, 표적 핵산은 리가제를 첨가하기 전에 비드에 로딩된다.
[0087] 일부 구체예에서, 임의의 닉카제, 리가제를 첨가하기 전에 표적 핵산을 비드 상에 로딩하여 닉킹 및 결찰 전에 표적 핵산이 비드에 결합되게 하는 것이 바람직하다. 게놈 DNA는 전형적으로 미크론 크기의 상자성 비드 주위에 매우 빠르게, 전형적으로 약 1-10분을 감쌀 수 있다. 일부 구체예에서, 비드에 대한 표적 핵산의 결합 효율을 증가시키기 위해 추가 절차가 취해질 수 있으며, 이는 긴 DNA(예를 들어, 200 kb 초과의 것)를 큰 비드(예를 들어, 3 미크론 이상의 직경을 갖는 비드)에 결합시키는데 특히 유용할 수 있다. 일부 구체예에서, 표적 핵산은 비교적 높은 농도, 예를 들어, 3-12%, 예를 들어, 5-10%를 갖는 PEG를 포함하는 완충제에서 비드에 결합되고, 더 높은 PEG 농도는 일반적으로 더 높은 결합을 발생시킨다. 일부 구체예에서, 표적 핵산은 비드에 대한 표적 핵산의 흡수를 향상시키기 위해 비교적 높은 pH를 갖는 완충제에서 비드에 결합된다. 일부 구체예에서, pH는 7.5 초과, 예를 들어, 7.5-9, 8.0-9.0, 또는 8.0-8.5이다. 높은 pH는 특히 더 낮은 PEG 농도, 예를 들어, 5%를 갖는 완충제에서 DNA 흡착을 증가시킨다. 일부 구체예에서, 완충제는 낮은 염 농도, 예를 들어, 10mM MgCl2를 포함한다. 본원에 개시된 방법 및 조성물은 긴 DNA가 이러한 조건에서 비드 주위를 빠르게(예를 들어, 5 내지 15분, 대부분의 DNA는 1 내지 5분 또는 2 내지 10분에 결합됨) 랩핑하여, 비드에 결합하기 전에 긴 DNA(예를 들어, > 200 kb, 또는 > 300 kb 또는 > 500 kb)의 단편화를 최소화할 수 있다. 일 예에서, 1 Mb 초과의 길이를 갖는 gDNA는 약 3 um의 직경을 갖는 비드에 결합할 수 있다.
[0088] 비드에 결합되는 표적 핵산은 닉킹(nicking), 갭핑(gapping), 또는 어댑터 결찰과 같은 효소 반응에 접근 가능한 상태로 유지될 수 있다. 이는 10-1000개의 접촉점에서 비드에 결합된 긴 DNA 단편(예를 들어, 20-500 kb)의 공동-바코딩을 가능하게 한다. 이는 특히, 상기 기재된 바와 같이 비드에 대한 DNA 결합을 유지하는 조건에서 비드-흡착된 DNA에 대한 다중 연속 효소 반응의 일반적인 프로토콜을 가능하게 한다.
[0089] DNA는 시퀀싱을 위한 준비시 비드로부터 방출될 수 있다. DNA를 방출하는 방법은 7 내지 8 범위, 예를 들어, 약 7.5의 pH를 10분 내지 1시간, 예를 들어, 약 15분 내지 약 45분, 약 15분 내지 약 45분, 또는 약 30분에 저염 완충제(< 200 mM)를 사용하는 것을 포함하나 이에 제한되지 않는다.
5. 과량의 비드-결합된 어댑터의 선택적 제거 단계
[0090] 선택적으로, 닉킹 및 결찰 후, 과량의 어댑터, 즉, 표적 핵산 단편과 결찰되지 않은 어댑터를 제거하기 위해 다양한 효소가 사용된다. 일부 구체예에서, 비드-결합된 어댑터는 부분적으로 이중-가닥이고, 이들 각각은 비교적 짧은 이중-가닥 영역(예를 들어, 6 내지 20개 염기)을 포함하고 비교적 쉽게 변성될 수 있다. 즉, 어댑터는 비드 상에 고정된 이중-가닥 게놈 DNA를 파괴시키지 않을 조건하에서 단일-가닥 DNA로 변성될 수 있다. 이는 짧은 이중-가닥 영역의 융점까지 온도를 증가시킴으로써 가장 쉽게 달성될 수 있다.
[0091] 표 1은 이러한 목적을 위해 사용될 수 있는 다양한 효소를 보여준다.
표 1. 과량의 비드-결합 어댑터를 제거하기 위해 사용될 수 있는 예시적인 효소
[0092] 변성된 단일 가닥 비드-결합된 어댑터는 이후 엑소뉴클레아제를 사용하여 제거될 수 있다. 일부 구체예에서, 비드에 연결된 3' 말단을 갖는 과량의 비드-결합된 어댑터는 5'에서 3' 방향으로 단일-가닥 DNA로부터 뉴클레오티드를 제거할 수 있는 엑소뉴클레아제(예를 들어, RecJ 또는 ExoVII)를 사용하여 제거된다. 일부 구체예에서, 비드에 부착된 5' 말단을 갖는 과량의 비드-결합된 어댑터는 3'에서 5' 방향으로 단일-가닥 DNA로부터 뉴클레오티드를 제거할 수 있는 엑소뉴클레아제(예를 들어, Exo1 또는 ExoT)를 사용하여 제거된다.
[0093] 대안적으로, 변성은 필요하지 않으며, 과량의 부분적 이중-가닥 비드-결합된 어댑터는 단일-가닥 특이적 엑소뉴클레아제 및 dsDNA에 대한 3' 내지 5' 엑소뉴클레아제 활성을 갖는 효소, 예를 들어, ExoIII, T4 DNA 폴리머라제 또는 Phi29 DNA 폴리머라제의 혼합물에 의해 dNTP 부재하에 분해될 수 있다. 이러한 구체예에서, 게놈 dsDNA는 DNA 닉 또는 갭의 3' 말단에 결찰된 어댑터에 의해 이러한 효소에 의한 분해로부터 보호될 것이다. 결찰은 이러한 dsDNA-특이적 엑소뉴클레아제에 대한 기질이 아닌 단일-가닥 말단을 갖는 핵산 단편을 생성한다.
[0094] 또 다른 접근법에서, 비드-결합된 어댑터의 짧은 이중-가닥 영역은 특정 염기(예를 들어, 우라실 또는 이노신)로 설계될 수 있고, 이러한 염기는 상응하는 DNA 글리코실라제(예를 들어, UDG 또는 hAAG)(예를 들어, 무염기성 부위를 생성하기 위해), 이후 EndoIV, EndoVIII, APE1, 또는 무염기성 부위를 제거할 수 있는 임의의 다른 효소로의 처리에 의해 제거될 수 있다. 이러한 전략을 사용하여, 짧은 이중-가닥 영역의 용융 온도는 이러한 염기의 제거 후 인접한 이중-가닥 영역의 길이가 추가로 감소함에 따라 추가로 낮아질 수 있다.
[0095] 또 다른 접근법에서, 반응이 용액에서 수행되는 경우, 과량의 어댑터는 DNA 정제 방법(예를 들어, Ampure XP 비드)을 통해 제거될 수 있다. 또 다른 접근법에서, 반응이 비드 상에서 수행될 때, 과량의 어댑터 및 어댑터에 결찰된 생성물은 효소 방출을 통해 비드로부터 방출될 수 있다. 일부 구체예에서, 비드-결합된 어댑터는 비드에 근접한 위치에서 우라실, 또는 이노신, 또는 둘 모두를 포함하고, 효소가 첨가되어 이러한 염기를 방출시키고, 따라서 비드로부터 어댑터를 방출할 수 있다. 일부 구체예에서, 어댑터는 화학적 처리에 민감한 결합을 통해 비드에 결합되고, 화학물질은 어댑터를 방출하기 위해 첨가될 수 있다. 일 예에서, 어댑터는 비오틴 스트렙타비딘 상호작용을 통해 비드에 결합되며, 비드-결합된 어댑터를 가열하거나 포름아미드로 처리하면 상호작용이 파괴될 수 있다. 또 다른 예에서, 어댑터는 광절단성 링커를 통해 비드에 결합되고, 광을 사용하여 링커를 절단하고 비드로부터 어댑터를 방출시킬 수 있다.
[0096] 일부 구체예에서, 방법은 과량의 비드-결합된 어댑터를 제거하는 단계를 포함하지 않으며; 상기 기재된 바와 같은 닉킹 및 결찰 단계 후에 프라이머 연장 단계가 수행된다. 일부 구체예에서, 프라이머 연장 단계는 과량의 비드-결합된 어댑터의 제거 후에 수행된다.
6. 바코드를 복사하는 연장
[0097] 일부 구체예에서, 분지 어댑터와 결찰된 핵산 단편은 이후 DNA 폴리머라제에 의해 연장되어 바코드를 복사한다. 하나의 예시적인 구체예가 도 6에 도시되어 있다.
[0098] 일부 구체예에서, 프라이머 연장 단계는 비드 상에서 또는 용액에서 수행되어 바코드를 복사할 수 있다. 일부 구체예에서, 변성 단계(예를 들어, 열에 의한)는 어댑터와 결찰된 단일-가닥 단편을 생성하기 위해 수행되고, 가닥 치환 활성이 없는 폴리머라제(예를 들어, pfu, pfuCx, Taq 폴리머라제, DNA pol 1)는 핵산 단편과 결찰되는 가닥을 연장시켜 바코드를 복사하는데 사용된다. 도 3 및 도 4. 일부 구체예에서, 변성 단계는 수행되지 않고, 프라이머는 가닥 치환 폴리머라제(예를 들어, phi29 폴리머라제 또는 Bst)를 사용하여 연장된다. 예시적인 한 예에서, 반응은 95℃에서 3분 동안 변성된 후, 프라이머를 55℃에서 3분 동안 어닐링하고, pfuCx를 사용하여 프라이머를 72℃에서 10분 동안 연장시킨다.
[0099] 일부 구체예에서, 바코드된 연장 생성물이 용액에 존재하는 경우, 이 단계에서 또 다른 라운드의 정제가 수행될 수 있다. 여전히 비드에 결합된 경우, 비드는 Tris NaCl 완충제에서 세척될 수 있다.
[0100] 도 3 및 4에 도시된 바와 같이, 연장된 핵산 단편이 핵산 단편의 각 말단에 하나씩 이미 2개의 어댑터를 함유하는 시나리오에서, 연장된 단편은 하기 기재된 바와 같이 추가 프로세싱을 위해 비드로부터 방출될 수 있다. 일부 구체예에서, 도 6 및 7a에 도시된 바와 같이, 단지 하나의 어댑터가 연장 생성물에 존재하며, 제1 어댑터로부터의 핵산 단편의 반대쪽 말단에 대한 제2 어댑터의 결찰이 수행될 수 있다. 일부 구체예에서, 제2 어댑터는 평활 말단 결찰에 의해 핵산 단편에 결찰된다. 일부 구체예에서, 폴리머라제가 A 테일을 남기는 연장 단계 동안 사용된 경우, 제2 어댑터는 단일 염기 오버행 결찰에 의해 핵산 단편에 결찰될 수 있다. 중요하게는, PCR-비함유 방식으로 이를 수행하기 위해, 어댑터의 3' OH가 생성물의 5' PO4에 결찰된다. 이것은 원래의 DNA 가닥이다(연장 동안 만들어진 복사체가 아님). PCR 기반 라이브러리 준비 전략의 경우, 전형적으로 이 시점에서 또 다른 라운드의 DNA 정제가 수행되고 이어서 PCR 증폭이 수행된다.
7. 결찰된 어댑터와 결찰되지 않은 어댑터를 분리하기 위한 제어된 연장
7.1 제어된 연장
[0101] 또 다른 양태에서, 상기 기재된 바와 같이 단일-가닥 파손에 의해 분리된 핵산 단편에 대한 제1 어댑터(예를 들어, b-BLA)의 분지 결찰을 수행한 후, 상기 방법은 연장 반응의 정도 제어를 허용하는 조건 하에서 제1 어댑터 서열에 혼성화된 프라이머를 연장하는 것을 포함한다. 이러한 연장-제어 조건은 적합한 중합 속도 또는 다른 특성을 갖는 폴리머라제(들)를 선택하고, 반응 온도, 반응 기간, 프라이머 조성물, DNA 폴리머라제, 프라이머 및 뉴클레오티드 농도, 첨가제, 및 완충제 조성물을 포함하는 (이에 제한되지 않음) 다양한 반응 파라미터를 사용하는 것을 포함하나 이에 제한되지 않는다. 일부 경우에, 연장은 연장을 위한 가역적 종결인자 및 정상 뉴클레오티드의 혼합물에 의해 제어될 수 있다. 정상 뉴클레오티드의 양에 대한 가역적 종결인자 뉴클레오티드의 양의 비율은 연장 정도를 달성하기 위해 조정될 수 있고; 일반적으로, 정상 뉴클레오티드의 양에 대한 가역적 종결인자 뉴클레오티드의 양의 비율이 높을수록 덜 완전한 연장이 초래될 것이다. 일부 구체예에서, 연장은 단지 약 100-150개 염기를 첨가하도록 제어된다.
[0102] 일부 구체예에서, 프라이머는 제1 어댑터의 바코드 서열에 대해 3'인 서열에 혼성화되고 연장-제어 조건 하에 연장된다. 이러한 조건 하에, 결찰 생성물 - 표적 단편에 제1 어댑터를 결찰시킴으로써 생성됨 - 을 복사하기 위한 프라이머의 연장은 불완전하며, 이는 부분적 이중-가닥 분자를 발생시키며; 반면 결찰되지 않은 b-BLA를 복사하기 위한 프라이머의 연장이 완전하며, 이는 이중-가닥 분자를 발생시킨다. 어댑터된 핵산 단편을 제조하기 위해 제어된 연장을 사용하는 예시적인 예는 도 10a-10b 및 도 11a-11b에 도시되어 있다.
[0103] 결찰된 제1 어댑터를 복사하기 위한 프라이머의 불완전한 연장은 3' 분지 결찰에 사용될 수 있는 5' 오버행을 남길 것이다. 가역적 종결인자가 사용되는 경우, 연장 반응의 말기에, 가역적 종결인자의 차단 기가 제거되어 3' OH 기가 복원된다. 이 시점에서, 3' 분지 결찰은 단편의 3' 말단에 제2 어댑터를 결찰하도록 수행되어, 하나의 말단에 제1 어댑터 서열 및 다른 말단에 제2 어댑터 서열을 갖는 어댑터된 단편을 생성할 수 있다. 일부 구체예에서, 가역적 종결인자는 핵산 단편에서 대부분의 뉴클레오티드에 걸쳐 중첩 적용범위를 제공하기 위해 상이한 농도, 상이한 시점, 또는 상이한 사이클에서 첨가될 수 있다.
[0104] 결찰되지 않은 제1 어댑터를 복사하기 위한 프라이머의 완전한 연장은 이중 가닥 분자를 생성하며, 이는 이중 가닥 DNA 엑소뉴클레아제 활성을 갖는 효소에 의해 분해 및 제거될 수 있다(표 1 참조).
7.2 과량의 어댑터 제거
[0105] 하기 예시적인 접근법을 사용하여 과량의 결찰되지 않은 어댑터(즉, 임의의 핵산 단편에 결찰되지 않은 어댑터)를 제거하여 라이브러리 제조물에서 이러한 결찰되지 않은 어댑터의 음성 간섭을 최소화할 수 있다.
7.2.1 비드 정제에 의해 결찰되지 않은 어댑터 제거
[0106] 일부 구체예에서, 용액 중 과량의 어댑터는 Ampure XP 비드 정제(Beckman Coulter, Brea, CA)에 의해 제거될 수 있다.
7.2.2 헤어핀 어댑터로 결찰되지 않은 어댑터 차단
[0107] 일부 구체예에서, 과량의 어댑터는 하기 접근법을 포함하나 이에 제한되지 않는 방법을 사용하여 분해되거나 차단될 수 있다. 도 9a 및 9b에 기재된 첫 번째 방법은 연장이 단지 약 100-150개의 염기를 첨가하게 하는 제어된 프라이머 연장을 사용한다. 이러한 연장에 사용된 폴리머라제(예를 들어, Tag 폴리머라제)는 3'-5' 엑소뉴클레아제 활성을 갖지 않으며, 이는 평활 말단을 생성하고, 3' 말단에 A 테일을 부가할 수 있다. 이는 과량의 어댑터의 완전한 연장 및 A 테일링(즉, 어댑터의 3' 말단에 A 첨가)(950)을 야기할 것이지만, 복사체 어댑터된 단편(940)으로의 연장은 불완전할 것이다. 다음으로, 완전히 연장된 과량의 어댑터(950)의 A 테일에 상보적인 T 테일을 갖는 헤어핀 어댑터로 결찰을 수행하여 이러한 과량의 어댑터가 연장되는 것을 차단한다. 그러나, 헤어핀 어댑터는 불완전하게 연장된 어댑터된 핵산 단편(970)에 결찰될 수 없다. 따라서, 이러한 단편(970)은 추가로 연장될 수 있다. 일부 구체예에서, 연장은 정상 뉴클레오티드 및 가역적 종결인자의 혼합물의 존재 하에 수행된 후, 종결인자 차단 기를 제거하는 반응, 및 이어서 BLA(980)로 3' 분지 결찰이 수행된다. 이 생성물(990)은 이제 변성되고 비드로부터 분리되고 시퀀싱을 위해 저장될 수 있다. 비드는 가역적 종결인자를 갖는 프라이머 연장, 차단 기의 제거, 3' 분지 결찰, 및 변성의 또 다른 라운드를 위해 재사용될 수 있다. 이 과정은 게놈 단편의 거의 완전한 중첩 DNA 적용 범위를 가능하게 하기 위해 다양한 농도의 종결인자로 여러 번 반복될 수 있다.
7.2.3 과량의 어댑터 분해
[0108] 또 다른 구체예에서, 도 10a 및 10b에 개시된 바와 같이, 제어된 연장은 3'-5' 엑소뉴클레아제 활성을 갖는 폴리머라제(예를 들어, Pfu, Q5, Phusion, T7, Vent, Klenow, T4)를 사용하여 수행된다. 연장은 약 100-150개의 염기로 제한된다. 다시, 결과는 게놈 단편에 결찰된 어댑터에 대해 불완전한 연장이 발생하고 이러한 과량의 어댑터(즉, 결찰되지 않은 어댑터)에 대해 완전한 연장이 발생한다는 것이다. 폴리머라제의 3-5' 엑소뉴클레아제 활성으로 인해, 결과는 5' 포스페이트를 갖는 평활 말단 dsDNA 어댑터이다. 이는 람다 엑소뉴클레아제에 대한 완벽한 기질인 반면, 이러한 어댑터된 단편에 대한 불완전한 연장 생성물은 람다 엑소뉴클레아제에 대한 우수한 기질이 아니다. 결과적으로, 람다 엑소뉴클레아제로의 처리는 결찰되지 않은 과량의 어댑터 모두를 분해하는데 사용될 수 있다. 도 9a 및 9b에 도시된 단계와 본질적으로 동일한 나머지 단계는 제2 어댑터를 게놈 단편에 결찰시키는데 사용된다.
[0109] 추가의 또 다른 구체예에서, 결찰되지 않은 어댑터의 완전한 연장 및 결찰된 생성물의 불완전한 연장을 초래하는 제어된 연장 후(도 11a), 반응에 첨가된 가역적 종결인자로 제어된 연장이 계속된다. 일정 기간 후, 종결인자 차단 기는 연장 생성물로부터 제거되고, 제2 어댑터가 결찰-허용 조건에서(예를 들어, 리가제 및 결찰 완충제의 존재 하에) 반응에 첨가된다. 도 11b. 이는 과량의 어댑터의 평활 말단 결찰 및 어댑터된 단편의 3' 분지 결찰을 발생시킨다. 이 시점에서, 가닥 치환 폴리머라제를 사용하여 새로 결찰된 분지 결찰 어댑터의 한 가닥(1190)을 연장함으로써 제어된 프라이머 연장이 수행된다. 이전과 같이, 이러한 연장은 시간, 온도, 및/또는 뉴클레오티드 농도에 의해 약 100-150개 염기만 연장되도록 제어된다. 이러한 연장은 제1 어댑터(예를 들어, b-BLA)의 가닥 변위 및 dsDNA 어댑터의 복사체(1180+ 1190)의 방출을 초래하며, 이는 비드로부터 분리되고 수집될 수 있다. 이전의 실시예에서와 같이, 비드가 저장될 수 있고, 이 과정은 게놈 DNA 단편에 결찰된 각 어댑터로부터 중첩 단편을 생성하기 위해 반복된다.
[0110] 일부 구체예에서, 결찰된 제1 어댑터가 상기 기재된 바와 같이(예를 들어, 신장-제어 조건 하에) 연장된 후, 제2 어댑터(도 8, 890)는, 예를 들어, 평활 결찰 또는 분지 결찰을 통해 연장된 생성물의 말단에 결찰될 수 있다.
8. 방출
[0111] 각 말단에 하나씩 2개의 어댑터를 갖는 연장된 단편이 비드로부터 방출된다. 비드로부터의 방출은 비드를 분해하거나 어댑터 올리고뉴클레오티드와 비드 사이의 화학적 연결을 절단함으로써 수행될 수 있다. 일부 경우에, 방출은 EndoV 효소를 사용하여 포획 올리고뉴클레오티드로부터 이노신 잔기의 제거 또는 우라실 데글리코실라제 및 EndoIV/EndoVIII 또는 유사한 기능을 갖는 다른 효소에 의한 우라실 뉴클레오티드의 제거에 의해 수행된다. 일부 경우에, 포획 올리고뉴클레오티드는 하나 이상의 디설파이드 결합을 통해 비드에 가교된다. 이러한 경우에, 방출은 비드를 환원제(예를 들어, 디티오트레이톨(DTT) 또는 트리스(2-카르복시에틸)포스핀(TCEP))에 노출시킴으로써 수행될 수 있다.
9. 증폭
[0112] 일부 구체예에서, 상기 기재된 방법 단계에서 생성된 연장된 단편이 증폭된다. 이러한 증폭 방법은 비제한적으로 하기를 포함한다: 다중 치환 증폭(MDA), 폴리머라제 연쇄 반응(PCR), 결찰 연쇄 반응(때때로 올리고뉴클레오티드 리가제 증폭 OLA로 지칭됨), 사이클링 프로브 기술(CPT), 가닥 치환 검정(SDA), 전사 매개 증폭(TMA), 핵산 서열 기반 증폭(NASBA), 롤링 서클 증폭(RCR)(원형화된 단편의 경우), 및 침습적 절단 기술. 증폭은 단편화 후 또는 본원에 개략된 임의의 단계 전 또는 후에 수행될 수 있다.
[0113] 도 3의 일 예시적인 예에서, 표적 핵산 단편과 비드 어댑터 및 L-어댑터의 결찰에 의해 형성된 결찰된 생성물은 L-어댑터 및 분지 어댑터에 프라이머를 어닐링함으로써 증폭된다.
[0114] 일부 구체예에서, 연장된 단편은 먼저 단일-가닥 핵산 분자로 변성될 수 있다. 일부 단일-가닥 핵산 분자 각각에 대해, 이어서, 스플린트 올리고가 그 후 첨가되고, 이는 표적 핵산 단편의 양쪽 말단에 첨가된 어댑터 서열에 혼성화되고, 이 후 단일-가닥 핵산은 리가제(예를 들어, T4 또는 Taq 리가제)의 존재하에 원형화된다. RCR에 사용되는 DNA 폴리머라제는 가닥-변위 활성을 갖는 임의의 DNA 폴리머라제, 예를 들어, Phi29, Bst DNA 폴리머라제, DNA 폴리머라제 I의 Klenow 단편, 및 Deep-VentR NDA 폴리머라제(NEB#MO258)일 수 있다. 이러한 DNA 폴리머라제는 상이한 강도의 가닥-변위 활성을 갖는 것으로 알려져 있다. 본 발명에 사용되는 하나 이상의 적합한 DNA 폴리머라제를 선택하는 것은 당업자의 능력 내에 있다.
10. 시퀀싱
[0115] 증폭된 연장된 단편은 예를 들어, 비제한적으로, 합성에 의한 폴리머라제-기반 시퀀싱(예를 들어, HiSeq 2500 시스템, Illumina, San Diego, CA), 결찰-기반 시퀀싱(예를 들어, SOLiD 5500, Life Technologies Corporation, Carlsbad, CA), 이온 반도체 시퀀싱(예를 들어, Ion PGM 또는 Ion Proton 시퀀서, Life Technologies Corporation, Carlsbad, CA), 제로-모드 도파관(예를 들어, PacBio RS 시퀀서, Pacific Biosciences, Menlo Park, CA), 나노포어 시퀀싱(예를 들어, Oxford Nanopore Technologies Ltd., Oxford, United Kingdom), 피로시퀀싱(예를 들어, 454 Life Sciences, Branford, CT), 또는 다른 시퀀싱 기술을 포함하는 당업계에 공지된 시퀀싱 방법을 사용하여 시퀀싱될 수 있다. 이러한 시퀀싱 기술 중 일부는 짧은 판독 기술이지만, 다른 것들은 더 긴 판독, 예를 들어, GS FLX+(454 Life Sciences; 최대 1000 bp), PacBio RS(Pacific Biosciences; 약 1000 bp) 및 나노포어 시퀀싱(Oxford Nanopore Technologies Ltd.; 100 kb)을 생성한다. 일배체형 페이싱의 경우, 더 긴 판독이 유리하고, 훨씬 적은 계산을 필요로 하지만, 이들이 더 높은 오류율을 갖는 경향이 있고 이러한 긴 판독에서의 오류는 일배체형 페이싱 전에 본원에 제시된 방법에 따라 확인 및 수정될 필요가 있을 수 있다.
[0116] 일 구체예에 따르면, 시퀀싱은 예를 들어, US 20140051588, U.S. 20130124100에 기재된 바와 같이 조합 프로브-앵커 결찰(cPAL)을 사용하여 수행되며, 이들 둘 모두는 모든 목적을 위해 그 전문이 본원에 참조로서 포함된다.
[0117] 일부 구체예에서, 어댑터와 결찰되는 단편, 또는 이의 증폭된 생성물은 변성되어 단일-가닥 분자를 생성할 수 있다. 예를 들어, 8-40개 염기의 스플린트 올리고뉴클레오티드는 단일-가닥 분자의 양쪽 말단에 어닐링된다. 이러한 어닐링된 올리고는 플라스미드 DNA의 제한 효소 분해 후에 생성된 오버행과 유사하게, 생성물의 2개의 말단 사이에 1-10개의 염기 중첩을 가능하게 한다. 이후, 결찰은 T4 DNA 리가제로 수행되어 결찰 부위에 이중-가닥 DNA의 작은 영역을 갖는 단일-가닥 원을 생성할 수 있다. 이러한 원은 이제 DNBseq 시퀀서에 대한 DNA 나노볼(DNB)을 제조하는데 사용될 수 있다.
[0118] 일부 구체예에서, 단편은 상기 기재된 바와 같이 3' 말단에 b-BLA 어댑터 서열 및 5' 말단에 L-어댑터 서열 둘 모두를 함유한다. 이러한 어댑터된 단편은 Illumina 유형 및 원형화를 필요로 하지 않는 다른 시스템에서 시퀀싱될 수 있다.
조성물
1. 샘플
[0119] 표적 핵산을 함유하는 샘플은 임의의 적합한 공급원으로부터 수득될 수 있다. 예를 들어, 샘플은 임의의 관심 유기체로부터 수득되거나 제공될 수 있다. 이러한 유기체는 예를 들어, 식물; 동물(예를 들어, 인간 및 비인간 영장류를 포함하는 포유동물); 또는 박테리아 및 바이러스와 같은 병원체를 포함한다. 일부 경우에, 샘플은 이러한 관심 유기체의 집단의 세포, 조직 또는 폴리뉴클레오티드일 수 있거나 이들로부터 수득될 수 있다. 또 다른 예로서, 샘플은 미생물군집 또는 미생물총일 수 있다. 선택적으로, 샘플은 물, 공기 또는 토양의 샘플과 같은 환경 샘플이다.
[0120] 관심 유기체 또는 이러한 관심 유기체의 집단으로부터의 샘플은 비제한적으로, 체액(비제한적으로, 혈액, 소변, 혈청, 림프, 타액, 항문 및 질 분비물, 땀 및 정액 포함); 세포; 조직; 생검, 연구 샘플(예를 들어, PCR 증폭 반응과 같은 핵산 증폭 반응의 생성물); 정제된 게놈 DNA와 같은 정제된 샘플; RNA 제조물; 및 미가공 샘플(박테리아, 바이러스, 게놈 DNA 등)을 포함한다. 유기체로부터 표적 폴리뉴클레오티드(예를 들어, 게놈 DNA)를 수득하는 방법은 당 분야에 널리 공지되어 있다.
2. 표적 핵산
[0121] 본원에서 사용되는 용어 "표적 핵산"(또는 폴리뉴클레오티드) 또는 "관심 핵산"은 본원에 기재된 방법에 의한 프로세싱 및 시퀀싱에 적합한 임의의 핵산(또는 폴리뉴클레오티드)을 지칭한다. 핵산은 단일-가닥 또는 이중-가닥일 수 있고, DNA, RNA, 또는 다른 공지된 핵산을 포함할 수 있다. 표적 핵산은 비제한적으로, 바이러스, 박테리아, 효모, 식물, 어류, 파충류, 양서류, 조류, 및 포유동물(비제한적으로, 마우스, 래트, 개, 고양이, 염소, 양, 소, 말, 돼지, 토끼, 원숭이 및 다른 비인간 영장류, 및 인간 포함)을 포함하는 임의의 유기체의 핵산일 수 있다. 표적 핵산은 개체 또는 다수의 개체(즉, 집단)로부터 수득될 수 있다. 핵산이 수득되는 샘플은 세포 또는 심지어 유기체의 혼합물, 예를 들어, 인간 세포 및 박테리아 세포를 포함하는 인간 타액 샘플; 마우스 세포 및 이식된 인간 종양으로부터의 세포를 포함하는 마우스 이종이식편; 등으로부터의 핵산을 함유할 수 있다. 표적 핵산은 증폭되지 않을 수 있거나 이들은 당 분야에 공지된 임의의 적합한 핵산 증폭 방법에 의해 증폭될 수 있다. 표적 핵산은 세포 및 세포하 오염물(지질, 단백질, 탄수화물, 시퀀싱되는 것 이외의 핵산 등)을 제거하기 위해 당 분야에 공지된 방법에 따라 정제될 수 있거나, 이들은 정제되지 않을 수 있으며, 즉, 프로세싱 및 시퀀싱을 위해 이들의 핵산을 방출하도록 파괴되는 온전한 세포를 비제한적으로 포함하는 적어도 일부 세포 및 세포하 오염물을 포함한다. 표적 핵산은 당 분야에 공지된 방법을 사용하여 임의의 적합한 샘플로부터 수득될 수 있다. 이러한 샘플은 비제한적으로, 생체샘플, 예컨대, 조직, 분리된 세포 또는 세포 배양물, 체액(비제한적으로, 혈액, 소변, 혈청, 림프, 타액, 항문 및 질 분비물, 땀 및 정액을 포함함); 및 공기, 농업, 물 및 토양 샘플 등과 같은 환경 샘플을 포함한다.
[0122] 표적 핵산은 (예를 들어, 단일 개체로부터의) 게놈 DNA, cDNA일 수 있고/있거나 다수의 개체 또는 게놈으로부터의 핵산을 포함하는 복합 핵산일 수 있다. 복합 핵산의 예는 미생물군집, 임산부의 혈류에서 순환하는 태아 세포(예를 들어, 문헌[Kavanagh et al., J. Chromatol. B 878: 1905-1911, 2010] 참조), 암 환자의 혈류로부터의 순환 종양 세포(CTC)를 포함한다. 일 구체예에서, 이러한 복합 핵산은 적어도 하나의 기가염기(Gb)를 포함하는 완전한 서열을 갖는다(이배체 인간 게놈은 대략 6 Gb의 서열을 포함한다).
[0123] 일부 경우에, 표적 핵산 또는 제1 복합체는 게놈 단편이다. 일부 구체예에서, 게놈 단편은 10 kb 초과, 예를 들어, 10-100 kb, 10-500 kb, 20-300 kb, 50-200 kb, 100-400 kb, 또는 500 kb 초과이다. 일부 경우에, 표적 핵산 또는 제1 복합체는 길이가 5,000 내지 100,000 Kb이다. 단일 혼합물에 사용되는 DNA(예를 들어, 인간 게놈 DNA)의 양은 <10 ng, <3 ng, <1 ng, <0.3 ng, 또는 <0.1 ng의 DNA일 수 있다. 일부 구체예에서, 단일 혼합물에 사용되는 DNA의 양은 반수체 DNA 양의 3,000x 미만, 예를 들어, 900x 미만, 300x 미만, 100x 미만, 또는 30x 미만일 수 있다. 일부 구체예에서, 단일 혼합물에 사용되는 DNA의 양은 적어도 1x 반수체 DNA, 예를 들어, 적어도 2x, 또는 적어도 10x 반수체 DNA 양일 수 있다.
[0124] 표적 핵산은 예를 들어, 상기 인용된 문헌 [Sambrook and Russell, Molecular Cloning: A Laboratory Manual]에 개시된 바와 같은 통상적인 기술을 사용하여 분리될 수 있다. 일부 경우에, 특히 소량의 핵산이 특정 단계에서 사용되는 경우, 단지 적은 양의 샘플 핵산만이 이용가능하고, 예를 들어, 용기 벽 등에의 비특이적 결합을 통해 손실 위험이 있을 때마다 샘플 핵산과 혼합되어 사용될 담체 DNA, 예를 들어, 비관련 원형 합성 이중-가닥 DNA를 제공하는 것이 유리하다.
[0125] 본 발명의 일부 구체예에 따르면, 게놈 DNA 또는 다른 복합 핵산은 임의의 공지된 방법에 의해 정제되거나 정제되지 않은 개별 세포 또는 소수의 세포로부터 수득된다.
[0126] 긴 단편이 본 발명의 방법에 바람직하다. 게놈 DNA의 긴 단편은 임의의 공지된 방법에 의해 세포로부터 분리될 수 있다. 인간 세포로부터 긴 게놈 DNA 단편의 분리를 위한 프로토콜은 예를 들어, 문헌[Peters et al., Nature 487:190-195 (2012)]에 기재되어 있다. 일 구체예에서, 세포는 용해되고 온전한 핵은 온화한 원심분리 단계로 펠렛화된다. 게놈 DNA는 이후 몇 시간 동안 프로테이나제 K 및 RNase 분해를 통해 방출된다. 물질은 예를 들어, 일정 기간(즉, 2 내지 16 시간) 동안 투석 및/또는 희석에 의해 잔류 세포 폐기물의 농도를 낮추기 위해 처리될 수 있다. 이러한 방법은 많은 파괴적 공정(예를 들어, 에탄올 침전, 원심분리, 및 볼텍싱)을 사용할 필요가 없기 때문에, 게놈 핵산은 대체로 온전하게 남아서 150 킬로염기를 초과하는 길이를 갖는 대부분의 단편을 생성한다. 일부 구체예에서, 단편은 약 5 내지 약 750 킬로염기의 길이이다. 추가 구체예에서, 단편은 길이가 약 150 내지 약 600, 약 200 내지 약 500, 약 250 내지 약 400, 및 약 300 내지 약 350 킬로염기이다. 일배체형 분석에 사용될 수 있는 가장 작은 단편은 대략 2-5 kb이고; 최대 이론적 크기는 없지만, 단편 길이는 출발 핵산 제조물의 조작으로 인한 전단에 의해 제한될 수 있다.
[0127] 다른 구체예에서, 긴 DNA 단편은 예를 들어, 아가로스 겔 플러그 중 아가로스 또는 오일에서 세포를 분리하거나 특수 코팅된 튜브 및 플레이트를 사용하는 것을 포함하는, DNA의 전단 또는 용기로의 흡수를 최소화하는 방식으로 분리되고 조작된다.
[0128] 또 다른 구체예에 따르면, 적은 수의 세포(예를 들어, 미생물생검 또는 순환 종양 또는 태아 세포로부터의 1, 2, 3, 4, 5, 10, 10, 15, 20, 30, 40, 50 또는 100개 세포)를 갖는 샘플의 경우 균일한 게놈 범위를 얻기 위해, 세포로부터 수득된 모든 긴 단편은 본원에 개시된 방법을 사용하여 바코드된다.
3. 바코드
[0129] 일 구체예에 따르면, 2개, 3개 또는 그 초과의 세그먼트를 갖는 바코드-함유 서열이 사용되며, 이 중 하나는, 예를 들어, 바코드 서열이다. 예를 들어, 도입된 서열은 공지된 서열의 하나 이상의 영역 및 바코드(들) 또는 태그(들)로서 작용하는 축퇴 서열의 하나 이상의 영역을 포함할 수 있다. 공지된 서열 (B)는 예를 들어, PCR 프라이머 결합 부위, 트랜스포손 말단, 제한 엔도뉴클레아제 인식 서열(예를 들어, 희귀 커터에 대한 부위, 예를 들어, Not I, Sac II, Mlu I, BssH II 등), 또는 다른 서열을 포함할 수 있다. 태그로서 작용하는 축퇴 서열(N)은 분석될 표적 핵산의 단편의 수와 동일하거나, 바람직하게는, 그보다 많은 상이한-서열 태그의 집단을 제공하기에 충분히 길다.
[0130] 일 구체예에 따르면, 바코드-함유 서열은 임의의 선택된 길이의 공지된 서열의 하나의 영역을 포함한다. 또 다른 구체예에 따르면, 바코드-함유 서열은 선택된 길이의 축퇴 서열의 영역, 즉, BnNnBn에 측접하는 선택된 길이의 공지된 서열의 2개의 영역을 포함하고, 여기서 N은 표적 핵산의 긴 단편을 태깅하기에 충분한 임의의 길이를 가질 수 있으며, 비제한적으로 N = 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20을 포함하고, B는 트랜스포손 말단, 프라이머 결합 부위, 등과 같은 요망되는 서열을 수용하는 임의의 길이를 가질 수 있다. 예를 들어, 이러한 구체예는 B20N15B20일 수 있다.
[0131] 일 구체예에서, 2 또는 3-세그먼트 디자인은 긴 단편을 태깅하는데 사용되는 바코드에 이용된다. 이러한 설계는 상이한 바코드 세그먼트를 함께 결찰시켜 완전한 바코드 세그먼트를 형성하거나 올리고뉴클레오티드 합성에서 시약으로서 세그먼트를 사용함으로써 조합 바코드 세그먼트가 생성되도록 함으로써 더 넓은 범위의 가능한 바코드를 허용한다. 이러한 조합 설계는 생성될 필요가 있는 전체-크기 바코드의 수를 감소시키면서 가능한 바코드의 더 큰 레퍼토리를 제공한다. 추가 구체예에서, 각각의 긴 단편의 고유한 식별은 8-12개의 염기쌍(또는 그 이상)의 바코드로 달성된다.
[0132] 일 구체예에서, 2개의 상이한 바코드 세그먼트가 사용된다. A 및 B 세그먼트는 수천 개의 조합을 생성하기 위해 각각 상이한 하프-바코드 서열을 함유하도록 쉽게 수정된다. 추가 구체예에서, 바코드 서열은 동일한 어댑터에 혼입된다. 이는 B 어댑터를 2개의 부분으로 파괴함으로써 달성될 수 있으며, 이들 각각은 결찰에 사용되는 공통 중첩 서열에 의해 분리된 절반 바코드 서열을 갖는다. 2개의 태그 성분은 각각 4-6개의 염기를 갖는다. 8-염기(2 x 4 염기) 태그 세트는 65,000개의 서열을 고유하게 태깅할 수 있다. 2 x 5 염기 및 2 x 6 염기 태그 둘 모두는 최적의 디코딩 효율을 달성하기 위해 축퇴 염기(즉, "와일드-카드")의 사용을 포함할 수 있다.
[0133] 추가 구체예에서, 각 서열의 고유한 식별은 8-12개의 염기쌍 오류 정정 바코드로 달성된다. 바코드는 비제한적으로 예시를 위해 5-20개의 정보성 염기, 일반적으로 8-16개의 정보성 염기의 길이를 가질 수 있다.
4. UMI
[0134] 다양한 구체예에서, 고유 분자 식별인자(UMI)는 개별 DNA 분자를 서로 구별하는데 사용된다. 예를 들어, UMI는 제1 비드 상에 고정된 포획 올리고뉴클레오티드를 구별하는데 사용된다. 각각 UMI를 갖는 어댑터의 컬렉션이 생성되고, 이러한 어댑터는 시퀀싱될 단편 또는 다른 공급원 DNA 분자에 부착되고, 개별 시퀀싱된 분자는 각각 이를 모든 다른 단편과 구별하는 데 도움이 되는 UMI를 갖는다. 이러한 구현예에서, 샘플에서 DNA 단편을 고유하게 식별하기 위해 매우 많은 수의 상이한 UMI(예를 들어, 수천 내지 수백만)가 사용될 수 있다.
[0135] UMI는 각각의 모든 공급원 DNA 분자의 고유성을 보장하기에 충분한 길이이다. 일부 구체예에서, 고유한 분자 식별인자는 약 3-12개의 뉴클레오티드 길이, 또는 3-5개의 뉴클레오티드 길이이다. 일부 경우에, 각각의 고유한 분자 식별인자는 약 3-12개의 뉴클레오티드 길이, 또는 3-5개의 뉴클레오티드 길이이다. 따라서, 고유한 분자 식별인자는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 이상의 뉴클레오티드 길이일 수 있다.
5. 바코드된 비드
[0136] 비드는 그 위에 고정된 b-BLA에서 바코드 올리고뉴클레오티드에 의해 바코드된다. 각각의 비드는 다수의 b-BLA 및 이에 따른 다수의 바코드 올리고뉴클레오티드를 포함한다. 각각의 바코드 올리고뉴클레오티드는 적어도 하나의 바코드를 포함한다. 동일한 비드 상의 바코드 올리고뉴클레오티드는 동일한 바코드 서열을 공유하고 상이한 비드 상의 바코드 올리고뉴클레오티드는 상이한 바코드 서열을 갖는다. 이와 같이, 각각의 비드 담체는 상기 기재된 바와 같은 방법을 사용하여 표적 핵산 단편으로 전달될 수 있는 고유한 바코드 서열의 많은 복사체를 운반한다.
[0137] 사용되는 비드는 1-20 um, 대안적으로 2-8 um, 3-6 um 또는 1-3 um 범위의 직경, 예를 들어, 약 2.8 μm의 직경을 가질 수 있다. 예를 들어, 비드 상의 바코드된 올리고뉴클레오티드의 간격은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6 또는 적어도 7 nm일 수 있다. 일부 구체예에서, 간격은 10 nm 미만(예를 들어, 5-10 nm), 15 nm 미만, 20 nm 미만, 30 nm 미만, 40 nm 미만, 또는 50 nm 미만이다. 일부 구체예에서, 혼합물 당 사용되는 상이한 바코드의 수는 >1 M, >10 M, >30 M, >100 M, >300 M 또는 >1 B일 수 있다. 하기 논의되는 바와 같이, 예를 들어, 본원에 기재된 방법을 사용하여 본 발명에 사용하기 위해 매우 많은 수의 바코드가 생성될 수 있다. 일부 구체예에서, 혼합물 당 사용되는 상이한 바코드의 수는 >1 M, >10 M, >30 M, >100 M, >300 M, 또는 >1 B일 수 있고, 이들은 적어도 10배 더 큰 다양성의 풀로부터 샘플링된다(예를 들어, 비드 상의 >10 M, >0.1 B, >0.3 B, >0.5 B, >1 B, >3 B, >10 B 상이한 바코드). 일부 구체예에서, 비드 당 바코드의 수는 100 k 내지 10 M, 예를 들어, 200 k 내지 1 M, 300 k 내지 800 k, 또는 약 400 k이다.
[0138] 일부 구체예에서, 바코드 영역은 약 3-15개의 뉴클레오티드 길이, 예를 들어, 5-12, 8-12, 또는 10개의 뉴클레오티드 길이이다. 일부 경우에, 바코드 영역의 각각의 바코드는 약 3-12개 뉴클레오티드 길이, 또는 3-5개 뉴클레오티드 길이이다. 따라서, 샘플 바코드, 세포 바코드 또는 다른 바코드와 상관없이, 바코드는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 뉴클레오티드 길이일 수 있다. 하나의 특정 예에서, 각각의 바코드 영역은 각각 10개의 염기로 구성된 3개의 바코드를 포함하고, 3개의 바코드는 공통 서열의 6개 염기에 의해 분리된다.
[0139] 바코드 비드는 표적 핵산 서열에 전달된다. 일부 구체예에서, 전달은 개시된 바와 같은 닉킹 및 갭핑에 의해 생성된 핵산 단편에 어댑터 올리고뉴클레오티드의 3' 말단을 결찰시킴으로써 규칙적인 간격으로 발생하였다.
[0140] 일부 구체예에서, 바코드된 비드는 3개 세트의 이중-가닥 바코드 DNA 분자를 사용하여 분할 및 풀 결찰-기반 전략을 통해 작제된다. 일부 구체예에서, 이중-가닥 바코드 DNA 분자의 각각의 세트는 10개의 염기쌍으로 구성되고, 3개의 세트는 핵산 서열이 상이하다. 바코드된 비드를 생성하기 위한 스플릿 및 풀 결찰의 예시적인 방법은 PCT 공개 번호 WO 2019/217452에 기재되어 있으며, 이의 개시 내용은 그 전체가 본원에 참조로 포함된다. WO 2019/217452의 도 12 및 13은 또한 스플릿 및 풀 방법의 방법론을 예시한다. 한 접근법에서, PCR 프라이머 어닐링 부위를 포함하는 공통 어댑터 서열은 5' 이중-비오틴 링커로 Dynabeads™ M-280 Streptavidin(ThermoFisher, Waltham, MA) 자기 비드에 부착되었다. 중첩 서열의 영역을 함유하는 바코드 올리고의 3개 세트 1,536을 Integrated DNA Technologies(Coralville, IA)에 의해 작제하였다. 결찰은 50 mM Tris-HCl(pH 7.5), 10 mM MgCl2, 1 mM ATP, 2.5% PEG-8000, 571 유닛 T4 리가제, 580 pmol의 바코드 올리고, 및 65 백만 M-280 비드를 함유하는 15 μL 반응의 384 웰 플레이트에서 수행되었다. 결찰 반응을 로테이터 상에서 실온에서 1시간 동안 인큐베이션하였다. 결찰 사이에 비드를 원심분리를 통해 단일 용기에 풀링하고, 자석을 사용하여 용기의 측면으로 수집하고, 고염 세척 완충제(50 mM Tris-HCl(pH 7.5), 500 mM NaCl, 0.1 mM EDTA, 및 0.05% Tween 20)로 1회 및 저염 세척 완충제(50 mM Tris-HCl(pH 7.5), 150 mM NaCl, 및 0.05% Tween 20)로 2회 세척하였다. 비드를 1X 결찰 완충제에 재현탁시키고, 384 웰 플레이트에 걸쳐 분배하고 결찰 단계를 반복하였다.
[0141] 일 양태에서, 본 발명은 부착된 클론 바코드를 포함하는 어댑터 올리고뉴클레오티드를 갖는 비드를 포함하는 조성물을 제공하며, 여기서 조성물은 30억 초과의 상이한 바코드를 포함하고, 바코드는 구조 5'-CS1-BC1-CS2-BC2-CS3-BC3-CS4를 갖는 트리파르테이트 바코드이다. 일부 구체예에서, CS1 및 CS4는 CS2 및 CS3보다 길다. 일부 구체예에서, CS2 및 CS3은 4-20개 염기 길이이고, CS1 및 CS4는 5 또는 10 내지 40개 염기 길이이고, 예를 들어, 20-30개 길이이고, BC 서열은 4-20개 염기(예를 들어, 10개 염기) 길이이다. 일부 구체예에서, CS4는 스플린트 올리고뉴클레오티드에 상보적이다. 일부 구체예에서, 조성물은 브릿지 올리고뉴클레오티드를 포함한다. 일부 구체예에서, 조성물은 브릿지 올리고뉴클레오티드, 상기 논의된 바와 같은 트리파르테이트 바코드를 포함하는 비드, 및 브릿지 올리고뉴클레오티드에 상보적인 영역을 갖는 혼성화 서열을 포함하는 게놈 DNA를 포함한다.
[0142] 태그의 다중 복사체와 관련된 비드 또는 다른 지지체와 같은 클론 바코드의 또 다른 공급원은 에멀젼 PCR 또는 CPG(제어-공극 유리) 또는 어댑트된-바코드의 복사체를 갖는 다른 입자를 제조하는 화학적 합성에 의해 제조될 수 있다. 태그-함유 DNA 서열의 집단은 공지된 방법에 의해 유중수(w/o) 에멀젼의 비드 상에서 PCR 증폭될 수 있다. 예를 들어, 문헌 [Tawfik and Griffiths Nature Biotechnology 16: 652-656 (1998); Dressman et al., Proc. Natl. Acad. Sci. USA 100:8817-8820, 2003; and Shendure et al., Science 309:1728-1732 (2005)] 참조. 이는 각 비드 상에 각각의 단일 태그-함유 서열의 많은 복사체를 발생시킨다.
[0143] 클론 바코드의 공급원을 제조하기 위한 또 다른 방법은 "혼합 및 분할" 조합 공정에서 마이크로-비드 또는 CPG 상의 올리고뉴클레오티드 합성에 의한 것이다. 이 공정을 이용하여, 각각이 바코드의 복사체 집단을 갖는 비드 세트를 생성할 수 있다. 예를 들어, 평균적으로 약 10억개의 각각이 100개의 비드 각각에 대해 ~1000+개의 복사체로 표시되는 모든 B20N15B20을 제조하기 위해, ~ 1000억 개의 비드로 시작하고, 이들 모두에서 B20 공통 서열(어댑터)을 합성한 다음 이들을 1024개의 합성 컬럼으로 분할하여 각각 상이한 5-량체를 만든 다음, 이들을 혼합하고, 그 후 이를 다시 1024개의 컬럼으로 분할하고 추가의 5-량체를 만들고, 이어서 이를 다시 한 번 반복하여 N15를 완료하고, 이들을 혼합하고, 하나의 큰 컬럼에서 마지막 B20을 제2 어댑터로서 합성할 수 있다. 따라서, 10개 비드 중 1개만이 출발 주형을 가져(나머지 9개는 없음) 비드 당 상이한 바코드를 갖는 2개의 주형을 갖는 것을 방지하기 때문에 3050 합성에서 ~10000억 개의 비드(112개 비드)를 사용한 하나의 큰 에뮬레이션 PCR 반응에서와 동일한 "클론-유사" 세트의 바코드를 제조할 수 있다.
[0144] 바코드 서열 어셈블리를 위한 예시적인 공정은 PCT 공개 번호 WO 2019/217452에 개시되어 있으며, 이의 개시 내용은 본원에 참조로 포함된다.
6. 고정화
[0145] 폴리뉴클레오티드는 공유 및 비공유 부착을 포함하는 다양한 기술에 의해 기질(예를 들어, 비드) 상에 고정될 수 있다. 폴리뉴클레오티드는 다양한 기술에 의해 기질에 고정될 수 있다. 일부 구체예에서, 폴리뉴클레오티드는 기질(예를 들어, 비드)에 연결되고, 즉, 폴리뉴클레오티드의 한 말단은 기질에 직접 접촉하거나 연결된다. 예를 들어, 표면은 폴리뉴클레오티드 분자 상의 상보적 작용기와 반응하여 공유 결합을 형성하는 반응성 작용기를 가질 수 있다. 긴 DNA 분자, 예를 들어, 수개 이상의 뉴클레오티드는 또한 -OH 기와 같은 낮은 농도의 다양한 반응성 작용기를 갖는 깨끗한 유리 표면과 같은 소수성 표면에 효율적으로 부착될 수 있다. 또 다른 구체예에서, 폴리뉴클레오티드 분자는 표면과의 비-특이적 상호작용을 통해, 또는 수소 결합, 반 데르 발스 힘 등과 같은 비공유 상호작용을 통해 표면에 흡착될 수 있다.
[0146] 일부 구체예에서, 폴리뉴클레오티드는 표면 상의 포획 올리고뉴클레오티드에 혼성화되고 포획 올리고뉴클레오티드의 성분과 복합체, 예를 들어, 이중-가닥 듀플렉스 또는 부분적 이중-가닥 듀플렉스를 형성함으로써 표면에 고정화된다.
7. 반응 혼합물
[0147] 하나 이상의 닉킹제, 하나 이상의 리가제, 복수의 비드, 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편을 포함하는 반응 혼합물이 본원에 제공된다. 각각의 비드는 그 위에 고정된 적어도 하나의 분지 결찰 어댑터를 포함한다. 각각의 분지 결찰 어댑터는 혼성화 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드를 포함한다. 바코드 올리고뉴클레오티드는 바코드를 포함하고 비드에 연결되는 반면, 혼성화 올리고뉴클레오티드는 비드에 연결되지 않는다. 복수의 비드 각각은 고유한 바코드 서열을 포함하며, 즉, 동일한 비드 상의 분지 결찰 어댑터는 동일한 바코드 서열을 공유하고 상이한 비드 상의 분지 결찰 어댑터는 상이한 바코드 서열을 갖는다.
[0148] 바코드 올리고뉴클레오티드는 혼성화 올리고뉴클레오티드에 혼성화되어 단일-가닥 영역 및 이중-가닥 영역을 포함하는 부분적 이중-가닥 핵산 분자를 형성한다. 이중-가닥 영역은 5' 말단 및 3' 말단을 갖는 이중-가닥 평활 말단을 포함하고, 이중-가닥 평활 말단의 상기 5' 말단은 핵산 단편의 3' 말단에 결찰된다.
예시적인 구체예
[0149] 다음은 본원에 개시된 방법 및 조성물의 비제한적인 예시적인 구체예이다.
[0150] 구체예 1. 시퀀싱을 위한 어댑터된 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서, (a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편을 생성하는 단계; (b) 비드(b-BLA) 상에 고정된 복수의 분지 결찰 어댑터를 각각 포함하는 복수의 비드를 제공하고, 3' 말단에 축퇴 서열을 갖는 L-어댑터의 집단을 제공하는 단계 및 (c) b-BLA를 리가제의 존재 하에 상기 핵산 단편 중 적어도 하나와 접촉시키고, 이에 의해 b-BLA를 상기 핵산 단편의 3' 말단에 결찰시키는 단계, (d) 리가제의 존재 하에 L-어댑터의 집단을 접촉시킴으로써 핵산 단편의 5' 말단에 L-어댑터를 결찰시키고, 이에 의해 5' 말단에 L-어댑터 서열 및 3' 말단에 b-BLA 어댑터 서열을 갖는 핵산 단편의 라이브러리를 수득하는 단계를 포함하며, 여기서 각각의 b-BLA는 b-BLA 어댑터 서열을 포함하는 바코드 올리고뉴클레오티드, 및 바코드 올리고뉴클레오티드에 혼성화되는 혼성화 올리고뉴클레오티드를 포함하며, 각각의 L 어댑터는 L-어댑터 서열을 포함하는, 방법. 임의적으로, 혼성화 올리고뉴클레오티드의 3' 말단은 차단제 뉴클레오티드이다.
[0151] 구체예 2 구체예 1에 있어서, L-어댑터의 3' 말단이 핵산 단편 중 적어도 하나의 5' 말단에 결찰되는, 방법.
[0152] 구체예 3. 구체예 1에 있어서, 각각의 BLA가 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 바코드 서열을 포함하는 단일-가닥 영역을 포함하며, 이중-가닥 평활 말단에서 가닥의 5' 말단은 분지 결찰을 통해 핵산 단편 중 적어도 하나의 3' 말단에 결찰되는, 방법.
[0153] 구체예 4. 구체예 1에 있어서, 방법이 효소를 반응에 첨가하는 것을 추가로 포함하고, 효소는 L-어댑터를 결찰시키기 전에 과량의 b-BLA를 분해하는, 방법.
[0154] 구체예 5. 구체예 1에 있어서, L-어댑터가 3' 말단에 1-10개의 축퇴 염기를 포함하는, 방법.
[0155] 구체예 6. 구체예 1에 있어서, L-어댑터가 용액 중에 존재하고, 바코드 올리고뉴클레오티드는 비드에 연결되고, 혼성화 올리고뉴클레오티드는 비드에 연결되지 않는, 방법.
[0156] 구체예 7. 구체예 5에 있어서, b-BLA가 우라실을 포함하고, 이는 제거되어 비드로부터 b-BLA를 방출할 수 있는, 방법.
[0157] 구체예 8. 구체예 5에 있어서, 각각의 비드가 그 위에 복수의 b-BLA로 고정화되고, 복수의 b-BLA 각각이 동일한 바코드 서열을 갖는, 방법.
[0158] 구체예 9. 구체예 1에 있어서, 방법이 b-BLA 및 L-어댑터 둘 모두와 결찰되는 핵산 단편 중 적어도 하나를 연장하여 연장된 핵산 단편을 생성하는 것을 추가로 포함하고, 여기서 연장된 핵산 단편은 바코드의 복사체를 포함하는, 방법.
[0159] 구체예 10. 구체예 8에 있어서, 방법이 연장된 핵산 단편을 원형화시키는 것을 추가로 포함하는, 방법.
[0160] 구체예 11. 구체예 5에 있어서, 방법이 복수의 비드를 포함하고, 각각이 고유한 바코드 서열을 포함하는, 방법.
[0161] 구체예 12. 구체예 1에 있어서, 이중-가닥 영역의 3' 말단 또는 혼성화 올리고뉴클레오티드의 3' 말단이 디데옥시 차단제 뉴클레오티드인, 방법.
[0162] 구체예 13. 구체예 1에 있어서, 핵산 단편의 평균 길이가 200개 뉴클레오티드 내지 10000개 뉴클레오티드인, 방법.
[0163] 구체예 14. 구체예에 있어서, 단계 (a)에서 생성된 엇갈린 단일-가닥 파손의 50% 초과가 단계 (b)에서 결찰에 의해 폐쇄되는, 방법.
[0164] 구체예 15. 구체예 1에 있어서, 하나 이상의 닉킹제가 비-특이적 닉킹 뉴클레아제, 부위-특이적 닉킹 뉴클레아제 및 화학적 닉킹제로 구성된 군으로부터 선택되는, 방법.
[0165] 구체예 16. 구체예 1에 있어서, 비-특이적 닉카제가 Vvn, 새우 dsDNA 특이적 엔도뉴클레아제, 및 DNAse I로 구성된 군으로부터 선택되는, 방법.
[0166] 구체예 17. 구체예 1에 있어서, 리가제가 T4 DNA 리가제인, 방법.
[0167] 구체예 18. 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서
(a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 중첩 핵산 단편을 생성하는 단계; 및
(b) 복수의 부분적 이중-가닥 제1 어댑터를 포함하는 비드를 리가제의 존재 하에 핵산 단편과 접촉시키는데, 여기서 각각의 제1 어댑터는 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 비드 상에 고정되는 단일-가닥 영역을 포함하며, 단일-가닥 영역은 바코드를 포함하며, 이에 의해 적어도 하나의 제1 어댑터의 이중-가닥 평활에서 가닥의 5' 말단을 DNA 리가제를 사용하여 핵산 단편 중 적어도 하나의 3' 말단에 결찰시켜 결찰된 제1 어댑터를 생성하는 단계로서, 결찰된 제1 어댑터는 바코드 및 적어도 하나의 핵산 단편을 포함하는, 단계,
(c) 결찰된 제1 어댑터를 변성시키는 단계, 및
(d) 결찰된 제1 어댑터에서 바코드에 대해 3'인 서열에 혼성화된 프라미어의 제어된 연장을 수행하고, 이에 의해 결찰 제1 어댑터에 상보적인 부분적으로 연장된 가닥을 생성하는 단계를 포함하는, 방법.
[0168] 구체예 19. 구체예 18에 있어서, 부분적 이중-가닥 제1 어댑터 중 적어도 하나가 결찰되지 않은 채로 남아 있고, 제어된 연장을 수행하는 것이 결찰된 제1 어댑터 및 결찰되지 않은 제1 어댑터 둘 모두에서 바코드에 대해 3'인 서열에 혼성화된 프라이머를 혼성화하여, 결찰된 제1 어댑터에 상보적인 부분적으로 연장된 가닥 및 결찰되지 않은 제1 어댑터에 상보적인 전체 연장된 가닥을 생성하고, 이에 의해 결찰된 제1 어댑터를 포함하는 부분적 이중-가닥 분자로서, 부분적 이중-가닥 분자가 더 짧은 가닥 및 더 긴 가닥을 포함하는 부분적 이중-가닥 분자, 및 결찰되지 않은 어댑터를 포함하는 이중-가닥 분자를 포함하는 혼합물을 생성하는 것을 포함하는, 방법.
[0169] 구체예 20. 구체예 19에 있어서, 방법이 이중 가닥 DNA 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제를 첨가하는 것을 추가로 포함하여, 엑소뉴클레아제가 이중-가닥 분자를 분해시키는, 방법.
[0170] 구체예 21. 구체예 19에 있어서, 방법이 결찰-허용 조건 하에 단계 (d)에서 헤어핀 어댑터를 혼합물에 첨가하는 것을 추가로 포함하여, 이중-가닥 분자가 하나의 헤어핀 어댑터에 결찰되고, 부분적 이중-가닥 분자가 헤어핀 어댑터에 결찰되지 않은 채로 남아 있는, 방법.
[0171] 구체예 22. 구체예 21 또는 구체예 20에 있어서, 방법이 (e) 부분적 이중-가닥 분자 가닥에서 더 짧은 가닥을 연장하여 더 긴 가닥에서 핵산 단편의 서열을 복사함으로써, 추가의 연장된 가닥을 생성하는 단계 및 (f) 제2 어댑터를 추가 연장된 가닥의 3' 말단에 결찰시키는 단계를 포함하는, 방법.
[0172] 구체예 23. 구체예 22에 있어서, 단계 (e)에서 더 짧은 가닥을 연장하는 것이 연장 가능한 뉴클레오티드 및 3' 가역적 차단 기를 갖는 뉴클레오티드의 혼합물의 존재 하에 수행되고, 단계 (f)에서 제2 어댑터를 결찰시키는 것이 3' 차단 기의 제거 후에 수행되는, 방법.
[0173] 구체예 24. 구체예 23에 있어서, 3' 가역적 차단 기를 갖는 뉴클레오티드가 상이한 사이클 동안 첨가되는, 방법.
[0174] 구체예 25. 구체예 23에 있어서, 제2 어댑터가 분지 결찰 어댑터(BLA)인, 방법.
[0175] 구체예 26. 구체예 23에 있어서, 방법이 결찰된 제2 분지 결찰 어댑터를 가닥 치환 폴리머라제로 연장하는 단계를 추가로 포함하는, 방법.
[0176] 구체예 27. 구체예 1-26 중 어느 한 구체예에 있어서, 표적 핵산이 단계 (a) 및 단계 (b) 전에 비드에 결합되는, 방법.
[0177] 구체예 28. 구체예 27에 있어서, 방법이 단계 (a)에서 닉킹 전에 0-30분의 기간 동안 표적 핵산을 비드와 인큐베이션하는 단계를 포함하는, 방법.
[0178] 구체예 29. 구체예 28에 있어서, 표적 핵산이 3-12% PEG를 포함하는 완충제에서 비드와 인큐베이션되는, 방법.
[0179] 구체예 30. 구체예 1-26 중 어느 한 구체예에 있어서, 단일 반응 혼합물의 pH가 7-9인, 방법.
[0180] 구체예 31. 구체예 1-26 중 어느 한 구체예에 있어서, 단계 (a)가 리가제의 존재 하에 발생하는, 방법.
[0181] 구체예 32. 구체예 1-26 중 어느 한 구체예에 있어서, 하나 이상의 닉킹제 및 리가제가 결찰 속도가 닉킹 속도보다 높게 되도록 선택되는, 방법.
[0182] 구체예 33. 구체예 1에 있어서, 방법이 단계 (b) 후에, 반응 혼합물을 변성시킴으로써 핵산 단편에 결찰되지 않은 제1 어댑터의 DNA 가닥을 제거하는 단계를 추가로 포함하는, 방법.
[0183] 구체예 34. 구체예 1-26 중 어느 한 구체예에 있어서, 단계 (a)가 단일 반응에 엑소뉴클레아제를 첨가하여 엇갈린 단일-가닥 파손의 갭을 증가시키는 것을 추가로 포함하는, 방법.
[0184] 구체예 35. 구체예 34에 있어서, 증가된 갭이 엇갈린 단일-가닥 파손에서 1-30개 염기의 길이를 갖는, 방법.
[0185] 구체예 36. (1) 하나 이상의 닉킹제, (2) 하나 이상의 리가제, 및 (3) 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편, 및 (4) 부분적 이중-가닥 핵산 분자를 형성하기 위해 서로 혼성화된 혼성화 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드를 포함하는 부분적 이중-가닥 분지 어댑터를 포함하는 반응 혼합물로서, 바코드 올리고뉴클레오티드는 비드에 연결되고, 바코드를 포함하며, 혼성화 올리고뉴클레오티드는 비드에 연결되지 않으며, 부분적 이중-가닥 핵산 분자는 (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 평활 말단 및 (ii) 바코드를 포함하고, 단일-가닥 말단을 갖는 단일-가닥 영역을 포함하며, 이중-가닥 평활 말단의 5' 말단은 핵산 단편 중 적어도 하나의 3' 말단에 결찰되는, 반응 혼합물.
[0186] 구체예 37. 구체예 36에 있어서, 핵산 단편 중 적어도 하나의 5' 말단이 L-어댑터에 결찰되는, 반응 혼합물.
[0187] 구체예 38. 구체예 37에 있어서, L-어댑터가 3' 말단에 1-10개의 축퇴 염기를 포함하는, 반응 혼합물.
[0188] 구체예 39. 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서
(a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편을 생성하는 단계; 및
(b) 리가제의 존재 하에 부분적 이중-가닥 제1 어댑터를 핵산 단편 중 적어도 하나와 접촉시키고, 이에 의해 3' 분지 결찰을 통해 DNA 리가제를 사용하여 제1 어댑터의 이중-가닥 영역의 5' 말단을 핵산 단편 중 적어도 하나의 3' 말단에 연결시키는 단계로서,
제1 어댑터는 (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 영역 및 (ii) 바코드를 포함하는 단일-가닥 영역을 포함하는, 단계,
(c) 제2 어댑터를 핵산 단편 중 적어도 하나의 반대 말단에 접촉시키는 단계를 포함하며,
제1 및 제2 어댑터를 결찰시키는 것이 단일 반응으로 일어나는, 방법.
[0189] 구체예 40. 구체예 39에 있어서, 제2 어댑터가 L-어댑터이고, L-어댑터가 표 적 핵산의 단일-가닥 영역에 혼성화되는 핵산 서열을 3' 말단에 포함하고,
L-어댑터의 3' 말단이 핵산 단편 중 적어도 하나의 5' 말단에 결찰되는, 방법.
[0190] 구체예 41. 구체예 39에 있어서, 방법이 효소를 반응물에 첨가하는 단계를 추가로 포함하고, 효소는 제2 어댑터를 결찰시키기 전에 과량의 제1 어댑터를 분해하는, 방법.
[0191] 구체예 42. 구체예 39에 있어서, 제2 어댑터가 3' 말단에 1-10개의 축퇴 염기를 포함하는, 방법.
[0192] 구체예 43. 구체예 39에 있어서, 방법이 제1 및 제2 어댑터 중 하나 또는 둘 모두와 연결되는 핵산 단편 중 적어도 하나를 연장시켜 연장된 핵산 단편을 생성하는 것을 추가로 포함하며, 여기서 연장된 핵산 단편은 바코드의 복사체를 포함하는, 방법.
[0193] 구체예 44. 구체예 39에 있어서, 제1 어댑터가 바코드를 포함하는 단일-가닥 영역을 통해 비드 상에 고정화되고, 비드가 각각 동일한 바코 서열을 포함하는 제1 어댑터의 다중 복사체로 고정화되는, 방법.
[0194] 구체예 45. 구체예 39에 있어서, 이중-가닥 영역의 3' 말단이 디데옥시 차단제 뉴클레오티드인, 방법.
[0195] 구체예 46. 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서, (a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 중첩 핵산 단편을 생성하는 단계; 및 (b) 리가제의 존재 하에 복수의 부분적 이중-가닥 제1 어댑터를 포함하는 비드를 핵산 단편과 접촉시키고, 이에 의해 제1 어댑터 중 적어도 하나의 이중-가닥 영역의 5' 말단을 3' 분지 결찰을 통해 DNA 리가제를 사용하여 핵산 단편 중 적어도 하나의 3' 말단에 연결하여 결찰된 제1 어댑터를 생성하는 단계로서,
각각의 제1 어댑터는 (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 영역 및 (ii) 비드 상에 고정되는 단일-가닥 영역을 포함하고, 여기서 단일-가닥 영역은 바코드를 포함하며,
결찰된 제1 어댑터는 바코드 및 적어도 하나의 핵산 단편을 포함하고,
제1 어댑터 중 적어도 하나가 결찰되지 않은 제1 어댑터로서 남아 있는, 단계,
(c) 반응 혼합물을 변성시키는 단계로서, 결찰된 제1 어댑터 및 결찰되지 않은 제1 어댑터가 단일-가닥 형태인, 단계,
(d) (i) 결찰된 제1 어댑터에서 및 (ii) 결찰되지 않은 제1 어댑터에서 바코드에 대해 3'인 서열에 혼성화된 프라이머의 제어된 연장을 수행하여 결찰 제1 어댑터에 상보적인 부분적으로 연장된 가닥 및 비결찰된 제1 어댑터에 상보적인 전체 연장된 가닥을 생성하고, 이에 의해 결찰된 제1 어댑터를 포함하는 부분적 이중 가닥 분자 및 결찰되지 않은 어댑터를 포함하는 이중 가닥 분자를 포함하는 제1 혼합물을 생성하는 단계를 포함하는, 방법.
[0196] 구체예 47. 구체예 46에 있어서, 제어된 연장이 Tag 폴리머라제로 수행되고, 방법이 헤어핀 어댑터를 이중 가닥 분자에 결찰시키는 것을 허용하는 조건 하에 단계 (d)에서 헤어핀 어댑터를 제1 혼합물에 첨가하고, 이에 의해 헤어핀 어댑터에 결찰된 이중 가닥 분자 및 헤어핀 어댑터에 결찰되지 않은 부분적 이중 가닥 분자를 포함하는 제2 혼합물을 생성하는 단계를 추가로 포함하는, 방법.
[0197] 구체예 48. 구체예 46에 있어서, 방법이 이중 가닥 DNA 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제를 첨가하고, 이에 의해 엑소뉴클레아제가 이중-가닥 분자를 분해하는 단계를 추가로 포함하는, 방법.
[0198] 구체예 49. 구체예 48의 제47항에 있어서, 방법이 (e) 부분적으로 연장된 가닥을 연장하여 핵산 단편의 서열을 혼입시켜 추가의 연장된 생성물을 생성하는 단계, 및 (f) 제2 분지 어댑터를 추가 연장된 생성물의 말단에 결찰시키는 단계를 추가로 포함하는, 방법.
[0199] 구체예 50. 상기 구체예 중 어느 한 구체예에 있어서, (1) 표적 핵산을 닉킹하고 b-BLA 및 L-어댑터 둘 모두를 핵산 단편에 결찰시키는 것을 적어도 30분 지속하거나, 이중-가닥 표적 핵산을 닉킹하고 제1 어댑터를 핵산 단편에 결찰시키는 것을 적어도 30분 지속하는, 방법.
***
[0200] 본 발명은 특정 양태 및 구체예를 참조하여 개시되었지만, 본 발명의 다른 구체예 및 변형예는 본 발명의 진정한 사상 및 범위를 벗어남이 없이 당업자에 의해 고안될 수 있음이 명백하다.
[0201] 본 개시에 인용된 각각의 및 모든 간행물 및 특허 문헌은 각각의 이러한 간행물 또는 문헌이 참조로서 본원에 포함되는 것으로 구체적이고 개별적으로 지시된 것처럼 본원에 참조로 포함된다. 간행물 및 특허 문헌의 인용은 그러한 문헌이 관련 선행 기술이라는 표시로 의도되지 않으며, 이는 그 내용 또는 날짜에 대한 인정을 구성하지 않는다.
실시예
[0202] 하기 실시예는 본 출원에 개시된 구체예를 예시하기 위해 제공되지만 이를 제한하기 위해 제공되는 것은 아니다.
실시예 1 세그멘타제를 사용한 닉 결찰 프로토콜
1. 비드에 대한 사전-결합 게놈 DNA
[0203] 마이크로리터 당 1백만 개의 비드를 함유하는 바코드된 비드 스톡 용액. 비드를 문헌[Cheng, et al. 2018, A simple bead-based method for generating cost-effective co-barcoded sequence reads. Protocol Exchange, available at https://doi.org/10.1038/protex.2018.116; Wang, et al. Genome Res. 2019 May;29(5):798-808. doi: 10.1101/gr.245126.118. Epub Aprl 2., 2019]에 기술된 방법을 이용하여 바코드 서열을 포함하는 분지 어댑터로 고정화시키고, 먼저 LSWB 완충제(저염 세척 완충제: 0.05 M Tris-HCl pH 7.5, 0.15 M NaCl 및 0.05% Tween 20)를 사용하여 2회 세척한 다음, 1X HB 완충제(3X HB 완충제는 30% PEG8000, 150 mM Tris-HCl pH 7.8, 30 mM MgCl2, 3 mM ATP 및 0.15 mg/mL BSA, pH 8.3을 포함함)로 1회 세척하였다.
[0204] 분지 어댑터는 서로 어닐링된 바코드 올리고뉴클레오티드 및 혼성화 올리고뉴클레오티드를 포함한다. 바코드 올리고뉴클레오티드의 5-말단은 포스페이트 기를 가지며, 혼성화 올리고뉴클레오티드의 3-말단은 디데옥시 뉴클레오티드이다. 바코드 올리고뉴클레오티드는 하기의 서열을 갖는다:
/5Phos/GTGCACT*GA*CG*AC*ATGATCACCAAGGATCGCCATAGTCCATGCTA[Barcode]GGAAGG[Barcode]CGCAGA[Barcode]CCAGAGCAACTCCTTGGCTCACAUAAAAAAAAAAAAAAA/3BioTEG/ (각각의 *는 뉴클레아제에 내성인 포스포티올레이트 결합을 나타낸다)
[0205] 혼성화 올리고뉴클레오티드는 G*TC*GT*CIGTGC*A*/3ddC/의 서열을 가지며, 여기서 3ddC는 3 프라임에서 디데옥시 사이토신을 나타낸다.
[0206] 20 μL 3xHB 완충제 및 물을 약 1 ng의 게놈 DNA를 함유하는 각 샘플에 첨가하여, 총 부피가 45 μL인 혼합물을 생성하였다. 상기와 같이 제조된 3천만 개의 비드를 각 샘플에 첨가하고 실온에서 15분 동안 인큐베이션하였다.
2. 단일 가닥 결합 단백질(SSB)과의 인큐베이션
[0207] 10.25 μL 1x HB 완충제에서 4.75 μL(총 7.5 ug)의 SSB 스톡 용액(Novus Biologicals #NBP2-35314-1mg)을 혼합하여 SSB 혼합물을 제조하였다. 15 μL SSB 혼합물을 이전 단계로부터의 게놈 DNA 및 비드 혼합물에 첨가하고 37℃에서 15분 동안 인큐베이션하였다.
3. 닉-결찰
[0208] L-올리고, 리가제(NEB # M0202T), 세그멘타제 작업 용액(MGIEasy FS PCR-Free DNA Library Prep Set-MGI-Leading Life Science Innovation, MGI, 항목 번호 1000013454 또는 1000013455에 포함된 닉카제), 및 Exo III (NEB # M0206S]는 하기 표 2에 따라 1X HB("희석된 농도")로 희석함으로써 제조되었다. L-올리고는 GAGACGTTCTCGACTCAGCAGANNNN*N*N*N의 서열을 갖는다(N은 A, T, C, G 중 임의의 하나를 나타내고, 각각의 *는 뉴클레아제에 내성인 포스포티올레이트 결합을 나타낸다).
표 2.
[0209] 제조된 L-올리고, 리가제, 세그멘타제 및 ExoIII 작업 용액을 60 μL 비드-gDNA 혼합물에 첨가하고, 각각의 비드를 바코드를 포함하는 분지 어댑터로 고정시키고, 상기 얼음 상에서 형성하고 혼합하였다. 반응 혼합물의 총 부피는 75 μL였다. 표 3을 참조한다.
표 3
[0210] 반응 혼합물을 총 54 사이클 동안 15℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이어서, 혼합물 중 비드를 40 μL의 0.1 M 소듐 하이드록사이드로 세척하였다. 이후, 비드를 100 μL LSWB로 2회 세척하였다. 비드를 50 μL LSWB에 재현탁시키고, 비드 현탁액을 4℃에서 유지시킨 후 PCR 증폭시켰으며, 이는 하기에 추가로 설명된다.
4. PCR
[0211] LSWB 완충제를 비드 현탁액으로부터 제거한 다음, 비드를 프라이머 PCR1 및 PCR2(하기 서열) 및 2X KAPA HiFi(Roche # 7958935001)를 함유하는 PCR 혼합물에 재현탁시켜 닉-결찰 반응에서 형성된 생성물을 증폭시켰다. 표 4에 기재된 바와 같음:
표 4
PCR1 TGTGAGCCAAGGAGTTG (SEQ ID NO: 1)
PCR2 GCCTCCCTCGCGCCATCAG (SEQ ID NO: 2)
[0212] 하기 표 5의 조건에 따라 PCR 사이클링을 수행하였다:
표 5.
[0213] 그 후, PCR 생성물을 0.8X Ampure XP 비드(160 μL)(Beckman Coulter # A63881)를 사용하여 정제하였다. 비드를 200 ul의 0.8X Ampure 세척 완충제에서 1회 세척하였다(800 ul의 신선한 Ampure 비드 및 1 ml의 TE를 혼합하고, 비드를 자석 상에 놓고, 상청액을 수집하고, 이는 세척 완충제임). 나머지 단계는 제조업체의 프로토콜에 따라 수행되었다. 정제된 생성물을 60 μL의 TE 완충제에서 Ampure XP 비드로부터 용리시켰다. 표 6 및 7의 혼합 및 사이클링 조건으로 2 라운드의 PCR을 수행하였다:
표 6.
표 7.
[0214] PCR 생성물을 상기와 동일한 단계를 이용하여 0.8X Ampure XP 비드(320 ul)를 사용하여 다시 정제하고, 50 ul의 TE에서 용리시켰다. 정제된 생성물을 전기영동으로 분석하였다.
실시예 2 생성물 크기에 대한 세그멘타제의 농도의 효과
[0215] 표 8에 제시된 바와 같이 상이한 농도의 세그멘타제 및 T4 DNA 리가제의 존재 하에, 실시예 1에 기재된 바와 같이 닉 결찰 반응을 수행하였다.
표 8
[0216] 닉-결찰 생성물의 전기영동 결과(증폭 후)는 도 12a에 도시되어 있다. 결과는 세그멘타제의 양이 증가하면 평균 삽입 크기가 점진적으로 더 짧아지는 반면, T4 DNA 리가제의 양이 증가하면 평균 삽입 크기가 점진적으로 더 길어짐을 나타낸다. 이러한 개별 반응 #1-#10에서 형성된 생성물은 300bp-2kb 범위의 길이를 가지며 시퀀싱에 적합하였다.
실시예 3 마스터라제를 사용한 닉 결찰 프로토콜
1. 비드에 대한 사전-결합 게놈 DNA
[0217] 분지 어댑터로 고정화된 비드에 대한 게놈 DNA의 사전-결합을 실시예 1에 기재된 바와 같이 수행하였다.
2. 단일 가닥 결합 단백질(SSB)과의 인큐베이션
[0218] 게놈 DNA 및 비드와 SSB의 인큐베이션을 실시예 1에 기재된 바와 같이 수행하였다.
3. 닉-결찰
[0219] L-올리고(실시예 1에 기재된 것과 동일한 서열), 리가제(NEB # M0202T), 마스터라제(Qiagen # EN31-005) 및 Exo III(NEB # M0206S)를 하기 표 9에 따라 1X HB("희석된 농도")에 각각 희석하였다:
표 9
[0220] L-올리고(실시예 1에 기재된 것과 동일), 리가제, 세그멘타제 및 ExoIII를 얼음 상에서 상기 형성된 55 μL 비드-gDNA 혼합물에 첨가하고 혼합하였다. 반응물의 총 부피는 75 μL였다. 표 3 참조.
표 3
[0221] 반응물을 총 54 사이클 동안 10℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 반응 혼합물을 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이어서, 혼합물 중 비드를 40 μL의 0.1 M 소듐 하이드록사이드로 세척하였다. 이후, 비드를 100 μL LSWB로 2회 세척하였다. 비드를 50 μL LSWB에 재현탁시키고, 비드 현탁액을 4℃에서 유지시킨 후 PCR 증폭시켰으며, 이는 하기에 추가로 설명된다.
4. PCR
[0222] LSWB 완충제를 비드 현탁액으로부터 제거한 후, 비드를 프라이머 PCR1(SEQ ID NO: 1) 및 2X KAPA HiFi(Roche # 7958935001)를 함유하는 PCR 혼합물에 재현탁시켰다. 하기 표 10에 기재된 바와 같음:
표 10
하기 표 5의 조건에 따라 프라이머 연장을 수행하였다:
[0223] 프라이머 연장 반응물을 자기 랙에 2분 동안 두었다. 상청액을 수집하고, 표 11에 열거된 성분을 포함하는 혼합물을 첨가하였다:
표 11
[0224] 표 5에 제시된 하기 사이클링 조건으로 1회의 연장 사이클을 수행하였다.
[0225] 하기 성분을 포함하는 믹스를 사용하여 임의의 단일 가닥 인공 생성물을 제거하기 위해 ExoVII를 첨가하고(표 12), 이어서 반응물을 30분 동안 인큐베이션하였다.
표 12
[0226] 이어서, 연장 생성물을 상기 기술된 바와 같이 0.8X Ampure XP 비드(85 μL)(Beckman Coulter # A63881)를 사용하여 정제하였다. 정제된 생성물을 60 μL의 TE 완충제에서 용리시켰다. PCR을 9회 사이클 동안 수행한 것을 제외하고, 표 5에 제시된 사이클링 조건 하에 믹스를 사용하여 PCR의 최종 라운드를 수행하였다.
[0227] PCR 생성물을 상기와 동일한 단계를 이용하여 0.8X Ampure XP 비드(320 ul)를 사용하여 다시 정제하고, 40 ul의 TE에서 용리시켰다. 정제된 생성물을 전기영동으로 분석하였다.
실시예 4. 생성물 크기에 대한 마스터라제의 농도의 효과
[0228] 상이한 농도의 마스터라제 및 T4 DNA 리가제의 존재 하에 실시예 3에 기재된 바와 같은 프로토콜에 따라 닉 결찰 반응을 수행하였다. 하기 표 13을 참조한다.
표 13
[0229] 닉 결찰 생성물의 전기영동 결과(증폭 후)는 도 12b에 도시되어 있다. 결과는 마스터라제의 양이 증가하면 삽입 길이가 점진적으로 더 짧아짐을 나타낸다. 반응 #1-#6에서 형성된 생성물은 300bp-3kb 범위의 길이를 가지며, 시퀀싱에 적합하였다.
실시예 5 세그멘타제를 사용한 2 라운드의 닉 결찰
1. 비드에 대한 사전-결합 게놈 DNA
[0230] 분지 어댑터로 고정화된 비드에 대한 게놈 DNA의 사전-결합을 실시예 1에 기재된 바와 같이 수행하였다.
2. 단일 가닥 결합 단백질(SSB)과의 인큐베이션
[0231] 게놈 DNA 및 비드와 SSB의 인큐베이션을 실시예 1에 기재된 바와 같이 수행하였다.
3. 닉-결찰
[0232] L-올리고(실시예 1에 기재된 것과 동일함), 리가제(NEB # M0202T), 세그멘타제(MGI) 및 Exo III(NEB # M0206S)를 하기 표 14에 따라 1X HB("희석된 농도")에 각각 희석하였다:
표 14.
[0233] L-올리고(실시예 1에 기재된 것과 동일), 리가제, 세그멘타제 및 ExoIII를 얼음 상에서 상기 형성된 60 μL 비드-gDNA 혼합물에 첨가하고 혼합하였다. 반응물의 총 부피는 실시예 1에 기재된 바와 같이 75 μL이었다.
[0234] 반응 혼합물을 총 36 사이클 동안 15℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이후, 비드를 100 μL LSWB로 1회 세척하였다. 비드를 60 μL 1X HB에 재현탁시켰다.
4. 제2 L-올리고 결찰
[0235] L-올리고(실시예 1에 기재된 것과 동일함), 리가제(NEB # M0202T) 및 T7 엑소 (NEB # M0263S)를 하기 표 15에 따라 1X HB("희석된 농도")에 각각 희석하였다:
표 15.
[0236] L-올리고(실시예 1에 기재된 바와 같음), 리가제 및 T7 엑소를 이전 단계로부터의 60 μL의 비드에 첨가하였다. 반응물의 총 부피는 75 μL였다. 상기 표 3 참조.
[0237] 반응 혼합물을 총 36 사이클 동안 10℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이후, 비드를 100 μL LSWB로 2회 세척하였다. 비드를 60 μL LSWB에 재현탁시켰다.
5. PCR
[0238] LSWB 완충제를 비드 현탁액으로부터 제거한 다음, 비드를 프라이머 PCR1 및 PCR2(하기 서열) 및 2X KAPA HiFi(Roche # 7958935001)를 함유하는 PCR 혼합물에 재현탁시켰다. 하기 표 16에 기재된 바와 같음:
표 16.
[0239] 하기 표 5의 조건에 따라 PCR 사이클링을 5 사이클 동안 수행하였다. 이어서, PCR 생성물을 상기 기재된 바와 같이 0.8X Ampure XP 비드(160 μL)를 사용하여 정제하였다. 정제된 생성물을 60 μL의 TE 완충제에서 용리시켰다. 표 17의 성분을 포함하는 믹스 및 표 5에 제시된 바와 같은 사이클링 조건을 사용하여 5 사이클 동안 제2 라운드의 PCR을 수행하였다.
표 17.
[0240] PCR 생성물을 상기와 동일한 단계를 이용하여 0.8X Ampure XP 비드(320 ul)를 사용하여 다시 정제하고 60 ul의 TE에서 용리시켰다. 정제된 생성물을 전기영동으로 분석하였다.
실시예 6 2 단계 프로토콜에 따른 생성물 크기에 대한 세그멘타제의 농도의 효과
[0241] 닉 결찰 반응은 실시예 5에 기재된 프로토콜에 따라 상이한 농도의 세그멘타제 및 T4 DNA 리가제의 존재하에서 수행되었다. 하기 표 18을 참조한다.
표 18
[0242] 닉 결찰 생성물의 전기영동 결과(증폭 후)는 도 12c에 도시되어 있다.
[0243] 결과는 세그멘타제의 양이 증가하면 삽입 길이가 점진적으로 더 짧아지고, 이들 반응에서 형성되는 단편이 시퀀싱에 적합하다는 것을 나타낸다.
실시예 7 마스터라제를 사용한 2 라운드의 닉 결찰
1. 비드에 대한 사전-결합 게놈 DNA
[0244] 마이크로리터 당 1백만 개의 비드를 함유하는 바코드된 비드 원액(비드를 제조하기 위한 설명 및 프로토콜은 (Cheng, et al. 2018; Wang, et al. 2019) 참조)을 먼저 LSWB 완충제(저염 세척 완충제: 0.05 M Tris-HCl pH 7.5, 0.15 M NaCl, 및 0.05% Tween 20)를 사용하여 2회 먼저 세척하고, 이어서 1X HB 완충제(3X HB: 30% PEG8000, 150 mM Tris-HCl pH 7.8, 30 mM MgCl2, 3 mM ATP 및 0.15 mg/mL BSA, pH 8.3)로 1회 세척하였다.
[0245] 20 μL 3xHB 완충제 및 물을 약 1 ng의 게놈 DNA를 함유하는 각 샘플에 첨가하여, 총 부피가 45 μL인 혼합물을 생성하였다. 상기와 같이 제조된 3000만 개의 비드를 각 샘플에 첨가하고 실온에서 15분 동안 인큐베이션하였다.
2. 단일 가닥 결합 단백질(SSB)과의 인큐베이션
[0246] 7.63 μL 1x HB 완충제에서 2.37 μL(총 3.75 ug)의 SSB 원액을 혼합하여 10 μL SSB 혼합물을 생성함으로써 SSB 반응물을 제조하였다. 10 μL SSB 혼합물을 이전 단계로부터의 게놈 DNA 및 비드 혼합물에 첨가하고 37℃에서 15분 동안 인큐베이션하였다.
3. 닉-결찰
[0247] L-올리고, 리가제(NEB # M0202T), 마스터라제(Qiagen # EN31-005), 및 Exo III(NEB # M0206S)를 하기 표 19에 따라 1X HB("희석된 농도")에 각각 희석하였다.
표 19.
[0248] L-올리고(실시예 1에 기재된 바와 같음), 리가제, 세그멘타제 및 ExoIII를 얼음 상에서 상기 형성된 55 μL 비드-gDNA 혼합물에 첨가하고, 혼합하였다. 반응물의 총 부피는 75 μL였다. 표 3을 참조한다.
[0249] 반응 혼합물을 총 36 사이클 동안 10℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이후, 비드를 100 μL LSWB로 1회 세척하였다. 비드를 60 μL 1X HB에 재현탁시켰다.
4. 제2 L-올리고 결찰
[0250] L-올리고(실시예 1에 기재됨), 리가제(NEB # M0202T) 및 T7 엑소(NEB # M0263S)를 하기 표 20에 따라 1X HB("희석된 농도")에 각각 희석하였다:
표 20
[0251] L-올리고(실시예 1에 기재된 바와 같음), 리가제 및 T7 엑소를 이전 단계로부터의 60 μL의 비드에 첨가하였다. 반응물의 총 부피는 표 3에 기재된 바와 같이 75 μL이었다.
[0252] 반응 혼합물을 총 36 사이클 동안 10℃에서 30초 및 37℃에서 30초 동안 사이클링하는 조건으로 처리하였다. 반응 혼합물을 간단히 회전시키고, 2분 동안 자석에 놓았다. 이후, 비드를 100 μL LSWB로 2회 세척하였다. 비드를 60 μL LSWB에 재현탁시켰다.
5. PCR
[0253] LSWB 완충제를 비드 현탁액으로부터 제거한 다음, 비드를 프라이머 PCR1 및 PCR2(하기 서열) 및 2X KAPA HiFi(Roche # 7958935001)를 함유하는 PCR 혼합물에 재현탁시켰다. 하기 표 21에 기재된 바와 같음:
표 21
[0254] 하기 표 5의 조건에 따라 PCR 사이클링을 수행하였다:
[0255] 그 후, PCR 생성물을 0.8X Ampure XP 비드(160 μL)(Beckman Coulter # A63881)를 사용하여 정제하였다. 비드를 200 ul의 0.8X Ampure 세척 완충제에서 1회 세척하였다(800 ul의 신선한 Ampure 비드 및 1 ml의 TE를 혼합하고, 비드를 자석 상에 놓고, 상청액을 수집하고, 이는 세척 완충제임). 나머지 단계는 제조업체의 프로토콜에 따라 수행하고, 생성물을 60 μL의 TE 완충제에서 용리시켰다. PCR을 7 사이클 동안 수행한 것을 제외하고는 표 22의 성분을 포함하는 믹스 및 표 5에 제시된 바와 같은 사이클링 조건으로 제2 라운드의 PCR을 수행하였다.
표 22.
[0256] PCR 생성물을 상기와 동일한 단계를 이용하여 0.8X Ampure XP 비드(320 ul)를 사용하여 다시 정제하고 60 ul의 TE에서 용리시켰다. 정제된 생성물을 전기영동으로 분석하였다.
실시예 8 2 단계 프로토콜에 따른 생성물 크기에 대한 마스터라제의 농도의 효과
[0257] 닉 결찰 반응은 실시예 7에 기재된 프로토콜에 따라 상이한 농도의 마스터라제 및 T4 DNA 리가제의 존재하에서 수행되었다. 하기 표 23 및 표 24를 참조한다.
표 23
표 24.
* 실시예에 기재된 바와 같이, 예를 들어, 표 23 및 24에서, "10C/37C, x36"은 반응을 총 36 사이클 동안 10℃에서 30초 내지 37℃에서 30초의 사이클링 조건으로 반응물을 처리하는 것을 나타낸다.
[0258] 닉 결찰 생성물의 전기영동 결과(증폭 후)는 마스터라제의 양이 증가하면 삽입 길이가 점진적으로 더 짧아지고, T4 리가제의 양이 증가하면 삽입 길이가 점진적으로 더 길어짐을 나타낸다. 이들 반응에서 형성되는 단편은 시퀀싱에 적합하였다. 도 12d 참조.

Claims (40)

  1. 시퀀싱을 위한 어댑터된 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편을 생성하는 단계;
    (a) 각각의 비드(b-BLA)가 비드 상에 고정된 복수의 분지 결찰 어댑터를 포함하는 복수의 비드를 제공하고, 3' 말단에 축퇴 서열을 갖는 L-어댑터의 집단을 제공하는 단계로서,
    여기서 각각의 b-BLA는 b-BLA 어댑터 서열을 포함하는 바코드 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드에 혼성화되는 혼성화 올리고뉴클레오티드를 포함하고,
    각각의 L 어댑터는 L-어댑터 서열을 포함하는, 단계,
    (b) 리가제의 존재 하에 b-BLA를 핵산 단편 중 적어도 하나와 접촉시켜, b-BLA를 핵산 단편의 3' 말단에 결찰시키는 단계, 및
    (c) 리가제의 존재 하에 L-어댑터의 집단을 접촉시킴으로써 L-어댑터를 핵산 단편의 5' 말단에 결찰시키고,
    이에 의해 5' 말단에 L-어댑터 서열 및 3' 말단에 b-BLA 어댑터 서열을 갖는 핵산 단편의 라이브러리를 수득하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, L-어댑터의 3' 말단이 핵산 단편 중 적어도 하나의 5' 말단에 결찰되는, 방법.
  3. 제1항에 있어서, 각각의 BLA가 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 바코드 서열을 포함하는 단일-가닥 영역을 포함하며,
    이중-가닥 평활 말단에서 가닥의 5' 말단은 분지 결찰을 통해 핵산 단편 중 적어도 하나의 3' 말단에 결찰되는, 방법.
  4. 제1항에 있어서, 방법이 효소를 반응 혼합물에 첨가하는 단계로서, 효소가 L-어댑터를 결찰시키기 전에 과량의 b-BLA를 분해하는, 단계를 추가로 포함하는, 방법.
  5. 제1항에 있어서, L-어댑터가 3' 말단에 1-10개의 축퇴 염기를 포함하는, 방법.
  6. 제1항에 있어서, L-어댑터가 용액에 존재하며,
    바코드 올리고뉴클레오티드가 비드에 연결되고,
    혼성화 올리고뉴클레오티드는 비드에 연결되지 않은, 방법.
  7. 제5항에 있어서, b-BLA가 우라실을 포함하고, 이는 제거되어 비드로부터 b-BLA를 방출할 수 있는, 방법.
  8. 제5항에 있어서, 각각의 비드가 그 위에 복수의 b-BLA로 고정화되고, 복수의 b-BLA 각각은 동일한 바코드 서열을 갖는, 방법.
  9. 제1항에 있어서, 방법이 b-BLA 및 L-어댑터 둘 모두와 결찰되는 핵산 단편 중 적어도 하나를 연장하여 연장된 핵산 단편을 생성하는 단계로서, 연장된 핵산 단편은 바코드의 복사체를 포함하는, 단계를 추가로 포함하는, 방법.
  10. 제8항에 있어서, 방법이 연장된 핵산 단편을 원형화시키는 단계를 추가로 포함하는, 방법.
  11. 제5항에 있어서, 방법이 복수의 비드를 포함하고, 각각의 비드는 고유한 바코드 서열을 포함하는, 방법.
  12. 제1항에 있어서, 이중-가닥 영역의 3' 말단이 디데옥시 차단제 뉴클레오티드인, 방법.
  13. 제1항에 있어서, 핵산 단편의 평균 길이가 200개 뉴클레오티드 내지 10000개 뉴클레오티드인, 방법.
  14. 제1항에 있어서, 단계 (a)에서 생성된 엇갈린 단일-가닥 파손의 50% 초과가 단계 (b)에서 결찰에 의해 폐쇄되는, 방법.
  15. 제1항에 있어서, 하나 이상의 닉킹제가 비-특이적 닉킹 뉴클레아제, 부위-특이적 닉킹 뉴클레아제 및 화학적 닉킹제로 구성된 군으로부터 선택되는, 방법.
  16. 제1항에 있어서, 비-특이적 닉카제가 Vvn, 새우 dsDNA 특이적 엔도뉴클레아제 및 DNAse I로 구성된 군으로부터 선택되는, 방법.
  17. 제1항에 있어서, 리가제가 T4 DNA 리가제인, 방법.
  18. 시퀀싱을 위한 폴리뉴클레오티드의 라이브러리를 제조하기 위한 방법으로서, 단일 반응 혼합물에서
    (a) 이중-가닥 표적 핵산을 하나 이상의 닉킹제와 접촉시켜 엇갈린 단일-가닥 파손에 의해 분리된 중첩 핵산 단편을 생성하는 단계; 및
    (b) 리가제의 존재 하에 복수의 부분적 이중-가닥 제1 어댑터를 포함하는 비드를 핵산 단편과 접촉시키는데, 여기서 각각의 제1 어댑터는 (i) 한 가닥의 5' 말단 및 상보적 가닥의 3' 말단을 포함하는 이중-가닥 평활 말단 및 (ii) 비드 상에 고정된 단일-가닥 영역을 포함하고, 단일-가닥 영역은 바코드를 포함하며,
    이에 의해 적어도 하나의 제1 어댑터의 이중-가닥 평활 말단에서 가닥의 5' 말단을 핵산 단편의 적어도 하나의 3' 말단에 DNA 리가제를 사용하여 결찰시켜 결찰된 제1 어댑터를 생성하는 단계로서,
    결찰된 제1 어댑터는 바코드 및 적어도 하나의 핵산 단편을 포함하는, 단계,
    (c) 결찰된 제1 어댑터를 변성시키는 단계,
    (d) 결찰된 제1 어댑터에서 바코드에 대해 3'인 서열에 혼성화된 프라미어의 제어된 연장을 수행하여, 결찰 제1 어댑터에 상보적인 부분적으로 연장된 가닥을 생성하는 단계를 포함하는, 방법.
  19. 제18항에 있어서, 부분적 이중-가닥 제1 어댑터 중 적어도 하나가 결찰되지 않은 채로 유지되며,
    여기서 제어된 연장을 수행하는 것은, 결찰된 제1 어댑터 및 결찰되지 않은 제1 어댑터 둘 모두에서 바코드에 대해 3'인 서열에 혼성화된 프라이머를 혼성화시켜, 결찰된 제1 어댑터에 상보적인 부분적으로 연장된 가닥 및 결찰되지 않은 제1 어댑터에 상보적인 완전히 연장된 가닥을 생성하고, 이에 의해
    결찰된 제1 어댑터를 포함하는 부분적 이중-가닥 분자로서, 부분적 이중-가닥 분자가 더 짧은 가닥 및 더 긴 가닥을 포함하는, 부분적 이중-가닥 분자, 및
    결찰되지 않은 어댑터를 포함하는 이중-가닥 분자를 포함하는 혼합물을 생성하는 것을 포함하는 방법.
  20. 제19항에 있어서, 방법이 이중 가닥 DNA 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제를 첨가하고, 이에 의해 엑소뉴클레아제가 이중-가닥 분자를 분해하는 단계를 추가로 포함하는, 방법.
  21. 제19항에 있어서, 방법이
    결찰-허용 조건 하에 단계 (d)에서 헤어핀 어댑터를 혼합물에 첨가하여, 이중-가닥 분자를 하나의 헤어핀 어댑터에 결찰시키는 단계로서, 부분적 이중-가닥 분자는 헤어핀 어댑터에 결찰되지 않은 채로 남아 있는, 단계를 추가로 포함하는, 방법.
  22. 제21항 또는 제20항에 있어서, 방법이
    (a) 부분적 이중-가닥 분자 가닥에서 더 짧은 가닥을 연장하여 더 긴 가닥의 핵산 단편의 서열을 복사함으로써 추가의 연장된 가닥을 생성하는 단계, 및
    (b) 추가의 연장된 가닥의 3' 말단에 제2 어댑터를 결찰시키는 단계를 추가로 포함하는, 방법.
  23. 제22항에 있어서, 단계 (e)에서 더 짧은 가닥을 연장하는 것이 연장가능한 뉴클레오티드 및 3' 가역적 차단 기를 갖는 뉴클레오티드의 혼합물의 존재 하에 수행되고,
    단계 (f)에서 제2 어댑터를 결찰시키는 것은 3' 차단 기의 제거 후에 수행되는, 방법.
  24. 제23항에 있어서, 3' 가역적 차단 기를 갖는 뉴클레오티드가 상이한 사이클 동안 첨가되는, 방법.
  25. 제23항에 있어서, 제2 어댑터가 분지 결찰 어댑터(BLA)인, 방법.
  26. 제23항에 있어서, 방법이 결찰된 제2 분지 결찰 어댑터를 가닥 치환 폴리머라제로 연장하는 단계를 추가로 포함하는, 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 표적 핵산이 단계 (a) 및 단계 (b) 전에 비드에 결합되는, 방법.
  28. 제27항에 있어서, 방법이 단계 (a)에서 닉킹 전에 0-30분의 기간 동안 표적 핵산을 비드와 인큐베이션하는 단계를 포함하는, 방법.
  29. 제28항에 있어서, 표적 핵산이 3-12% PEG를 포함하는 완충제에서 비드와 인큐베이션되는, 방법.
  30. 제1항 내지 제26항 중 어느 한 항에 있어서, 단일 반응 혼합물의 pH가 7-9인, 방법.
  31. 제1항 내지 제26항 중 어느 한 항에 있어서, 단계 (a)가 리가제의 존재 하에 발생하는, 방법.
  32. 제1항 내지 제26항 중 어느 한 항에 있어서, 하나 이상의 닉킹제 및 리가제가 닉킹 속도보다 결찰 속도가 더 높게 되도록 선택되는, 방법.
  33. 제1항에 있어서, 방법이 단계 (b) 후에, 반응 혼합물을 변성시킴으로써 핵산 단편에 결찰되지 않은 제1 어댑터의 DNA 가닥을 제거하는 단계를 추가로 포함하는, 방법.
  34. 제1항 내지 제26항 중 어느 한 항에 있어서, 단계 (a)가 단일 반응 혼합물에 엑소뉴클레아제를 첨가하여 엇갈린 단일-가닥 파손의 갭을 증가시키는 단계를 추가로 포함하는, 방법.
  35. 제34항에 있어서, 증가된 갭이 1-30개 염기의 길이를 갖는, 방법.
  36. 제1항에 있어서, 표적 핵산을 닉킹하고, b-BLA 및 L-어댑터를 핵산 단편에 결찰시키는 것이 적어도 30분 지속되는, 방법.
  37. 제18항에 있어서, 이중-가닥 표적 핵산을 닉킹하고 제1 어댑터를 핵산 단편으로 결찰시키는 것이 적어도 30분 지속되는, 방법.
  38. (1) 하나 이상의 닉킹제,
    (2) 하나 이상의 리가제,
    (3) 엇갈린 단일-가닥 파손에 의해 분리된 복수의 중첩 핵산 단편,
    (4) 서로 혼성화되어 부분적 이중-가닥 핵산 분자를 형성하는 혼성화 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드를 포함하는 부분적 이중-가닥 분지 어댑터를 포함하는 반응 혼합물로서,
    바코드 올리고뉴클레오티드는 비드에 연결되고, 바코드를 포함하며,
    혼성화 올리고뉴클레오티드가 비드에 연결되지 않으며,
    부분적 이중-가닥 핵산 분자는
    (i) 5' 말단 및 3' 말단을 갖는 이중-가닥 평활 말단 및
    (ii) 바코드를 포함하고 단일-가닥 말단을 갖는 단일-가닥 영역을 포함하며,
    이중-가닥 평활 말단의 5' 말단은 중첩 핵산 단편 중 적어도 하나의 3' 말단에 결찰되는, 반응 혼합물.
  39. 제38항에 있어서, 핵산 단편 중 적어도 하나의 5' 말단이 L-어댑터에 결찰되는, 반응 혼합물.
  40. 제38항에 있어서, L-어댑터가 3' 말단에 1-10개의 축퇴 염기를 포함하는, 반응 혼합물.
KR1020237044393A 2021-07-22 2022-07-22 닉-결찰 stlfr KR20240013182A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163224731P 2021-07-22 2021-07-22
US63/224,731 2021-07-22
PCT/CN2022/107241 WO2023001262A1 (en) 2021-07-22 2022-07-22 Nick-ligate stlfr

Publications (1)

Publication Number Publication Date
KR20240013182A true KR20240013182A (ko) 2024-01-30

Family

ID=84978956

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237044393A KR20240013182A (ko) 2021-07-22 2022-07-22 닉-결찰 stlfr

Country Status (7)

Country Link
EP (1) EP4373959A1 (ko)
KR (1) KR20240013182A (ko)
CN (1) CN118019856A (ko)
AU (1) AU2022313376A1 (ko)
CA (1) CA3219555A1 (ko)
IL (1) IL310293A (ko)
WO (1) WO2023001262A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2929281T3 (es) * 2017-03-23 2022-11-28 Univ Washington Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores
CN111295443B (zh) * 2017-11-02 2024-04-16 生物辐射实验室股份有限公司 基于转座酶的基因组分析
US20220195624A1 (en) * 2019-01-29 2022-06-23 Mgi Tech Co., Ltd. High coverage stlfr
US11952613B2 (en) * 2019-03-11 2024-04-09 Phillip N. Gray Methods and reagents for enhanced next generation sequencing library conversion and incorporation of molecular barcodes into targeted and random nucleic acid sequences

Also Published As

Publication number Publication date
CA3219555A1 (en) 2023-01-26
EP4373959A1 (en) 2024-05-29
IL310293A (en) 2024-03-01
AU2022313376A1 (en) 2023-11-16
WO2023001262A1 (en) 2023-01-26
CN118019856A (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
JP7127104B2 (ja) 連続性を維持した転位
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
JP7290228B2 (ja) 混合物中の核酸を配列決定する方法およびそれに関する組成物
CN108060191B (zh) 一种双链核酸片段加接头的方法、文库构建方法和试剂盒
US10640818B2 (en) Compositions and methods for selection of nucleic acids
US20210254051A1 (en) Compositions and methods for preparing nucleic acid libraries
EP2585593A2 (en) Methods and compositions for polynucleotide library production, immortalization and region of interest extraction
WO2016154540A1 (en) Physical linkage preservation in dna storage
CN113366115A (zh) 高覆盖率stlfr
JP2023513606A (ja) 核酸を評価するための方法および材料
JP2022527612A (ja) ヌクレオチド修飾に基づく枯渇のための組成物及び方法
CN107002290B9 (zh) 样品制备方法
US20220307081A1 (en) Method for Removing and/or Detecting Nucleic Acids Having Mismatched Nucleotides
WO2023001262A1 (en) Nick-ligate stlfr
CN111989406A (zh) 一种测序文库的构建方法
US20240043924A1 (en) Determining long dna sequence using short mps reads
WO2024022207A1 (en) Methods of in-solution positional co-barcoding for sequencing long dna molecules
US20210198718A1 (en) Method of attaching adaptors to single-stranded regions of double-stranded polynucleotides