KR20230035237A - 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성 - Google Patents

재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성 Download PDF

Info

Publication number
KR20230035237A
KR20230035237A KR1020227042792A KR20227042792A KR20230035237A KR 20230035237 A KR20230035237 A KR 20230035237A KR 1020227042792 A KR1020227042792 A KR 1020227042792A KR 20227042792 A KR20227042792 A KR 20227042792A KR 20230035237 A KR20230035237 A KR 20230035237A
Authority
KR
South Korea
Prior art keywords
nucleic acid
tdt
amino acid
seq
oligonucleotide
Prior art date
Application number
KR1020227042792A
Other languages
English (en)
Inventor
사우라브 라젠드라 니란타르
세르지오 페이사조비치
에릭 브루스태드
Original Assignee
일루미나, 인코포레이티드
일루미나, 싱가포르 피티이 엘티디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드, 일루미나, 싱가포르 피티이 엘티디 filed Critical 일루미나, 인코포레이티드
Publication of KR20230035237A publication Critical patent/KR20230035237A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/131Terminal transferase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 사용하여, 변형된 염기를 갖는 뉴클레오티드를 포함하는 단일 가닥 데옥시리보핵산(ssDNA) 스캐폴드를 생성하는 방법이 본 명세서에 개시된다. 재조합 TdT는 보스 타우루스(Bos taurus) TdT 또는 이의 단편과 적어도 80% 동일한 아미노산 서열을 포함할 수 있으며, 예를 들어 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.

Description

재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성
관련 출원에 대한 상호 참조
본 출원은 2020년 5월 12일자로 출원된 미국 가특허 출원 제63/023,736호에 대한 우선권의 이익을 주장하며, 이의 내용은 전체적으로 본 명세서에 참고로 포함된다.
서열 목록에 대한 언급
본 출원은 전자 포맷의 서열 목록과 함께 제출된다. 서열 목록은, 2020년 5월 11일자로 생성되고 크기가 52 킬로바이트인, 파일명이 Sequences_Listing_47CX-311973-WO인 파일로서 제공된다. 서열 목록의 전자 포맷의 정보는 본 명세서에 전체적으로 참고로 포함된다.
기술분야
대체적으로, 본 발명은 핵산 생성 분야, 예를 들어 변형된 염기를 갖는 핵산을 생성하는 분야에 관한 것이다.
단일클론성은 합성에 의한 서열분석(sequencing-by-synthesis, SBS)의 효율을 개선할 수 있다. SBS를 위한 단일클론성은 개별 주형 폴리뉴클레오티드들이 시딩되고 클러스터링될 때, 또는 개별 주형 폴리뉴클레오티드들로부터의 시딩 및 클러스터링으로부터의 폴리뉴클레오티드 생성물이 기재(substrate) 표면 상에서 공간적으로 구별되는 위치에 있을 때 일어날 수 있다.
핵산을 변형시키는 방법의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 상기 방법은 (a) 단일 가닥 데옥시리보핵산(ssDNA), 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함한다. 상기 방법은 (b) ssDNA, 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 ssDNA 스캐폴드를 생성하는 단계를 포함할 수 있다. ssDNA 스캐폴드는 뉴클레오시드 트라이포스페이트로부터의 변형된 염기를 포함하는 하나 이상의 뉴클레오티드가 도입된 ssDNA를 포함할 수 있다. 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스(Bos taurus) TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
일부 실시 형태에서, 상기 방법은 (c) ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드와 접촉시켜 핵산 담체를 생성하는 단계를 추가로 포함한다. ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드와 접촉시키는 단계는 ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드 및 제1 중합체를 포함하는 제1 어댑터와 접촉시키는 단계를 포함할 수 있다. ssDNA 스캐폴드를 제2 어댑터 올리고뉴클레오티드와 접촉시키는 단계는 ssDNA 스캐폴드를 제2 어댑터 올리고뉴클레오티드 및 제2 중합체를 포함하는 제2 어댑터와 접촉시키는 단계를 포함할 수 있다. 제1 어댑터는 공유 연결된 제1 어댑터 올리고뉴클레오티드 및 제1 중합체를 포함할 수 있다. 제2 어댑터는 공유 연결된 제2 어댑터 올리고뉴클레오티드 및 제2 중합체를 포함할 수 있다. ssDNA 스캐폴드는 제3 중합체를 포함할 수 있다. 제1 어댑터 올리고뉴클레오티드는 제1 어댑터 서열 또는 이의 역방향 상보체를 포함할 수 있다. 제2 어댑터 올리고뉴클레오티드는 제2 어댑터 서열 또는 이의 역방향 상보체를 포함할 수 있다. 핵산 담체는 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드에 부착된 ssDNA 스캐폴드를 포함할 수 있다. 일부 실시 형태에서, 상기 방법은 (d) 제1 어댑터 서열 또는 이의 역방향 상보체, 제2 어댑터 서열 또는 이의 역방향 상보체, 및 핵산 혼성화 서열을 포함하는 핵산 주형을 제공하는 단계를 추가로 포함한다. 상기 방법은 (e) 핵산 담체를 핵산 주형과 접촉시켜, 핵산 주형이 핵산 주형의 핵산 혼성화 서열을 통해 핵산 담체의 주형 포획 부위에 혼성화된 핵산 담체를 생성하는 단계를 포함할 수 있다. 상기 방법은 (f) 핵산 주형과 혼성화된 핵산 담체 상에서 증폭을 수행하여 복수의 증폭된 핵산들을 생성하는 단계를 포함할 수 있으며, 각각의 증폭된 핵산은 핵산 주형의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드를 포함한다. 증폭은, 예를 들어 가교 증폭 또는 배제 증폭일 수 있다. 상기 방법은 (g) 복수의 증폭된 핵산들을 사용하여 핵산 주형의 서열을 결정하는 단계를 포함할 수 있다.
핵산을 변형시키는 방법의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 상기 방법은 (a) 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함한다. 상기 방법은 (b) 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 제2 핵산을 생성하는 단계를 포함할 수 있다. 제2 핵산은 제1 뉴클레오시드 트라이포스페이트로부터의 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드가 도입된 제1 핵산을 포함할 수 있다. 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
일부 실시 형태에서, 제1 핵산 및 제2 핵산 중 하나 이상은 단일 가닥 핵산, 3' 오버행(overhang)을 갖는 이중 가닥 핵산, 3' 리세스(recess)를 갖는 이중 가닥 핵산, 또는 이들의 조합을 포함한다. 제1 핵산 및 제2 핵산 중 하나 이상은 데옥시리보핵산(DNA)을 포함할 수 있다. 제1 핵산 및 제2 핵산 중 하나 이상의 적어도 50%의 뉴클레오티드는 데옥시리보뉴클레오티드를 포함할 수 있다. 제1 핵산 및 제2 핵산 중 하나 이상은 단일 가닥 데옥시리보핵산(ssDNA)을 포함할 수 있다. 제1 핵산 및 제2 핵산 중 하나 이상은 적어도 하나의 리보뉴클레오티드를 포함할 수 있다.
일부 실시 형태에서, 제2 핵산은 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 제1 뉴클레오티드들이 도입된 제1 핵산을 포함한다. 제2 핵산 내의 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 제1 뉴클레오티드들은 연속적일 수 있다. 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트는 5-(15-아지도-4,7,10,13-테트라옥사-펜타데카노일-아미노알릴)-2'-데옥시우리딘-5'-트라이포스페이트(아지드-PEG4-아미노알릴-dUTP), N6-(6-아지도)헥실-3'-데옥시아데노신-5'-트라이포스페이트(N6-(6-아지도)헥실-3'-dATP), 또는 이들의 조합을 포함할 수 있다. 일부 실시 형태에서, 제1 뉴클레오시드 트라이포스페이트는 공유 연결된 제1 변형된 염기 및 제1 부속(accessory) 올리고뉴클레오티드를 포함한다.
일부 실시 형태에서, 제1 반응 시간은 적어도 1초이다. 제1 온도는 적어도 16 ℃ 내지 적어도 58 ℃일 수 있다. 제1 반응에서의 제1 핵산의 농도는 적어도 10 nM일 수 있다. 제1 반응에서의 제1 뉴클레오시드 트라이포스페이트의 농도는 적어도 0.1 μM일 수 있다. 제1 반응에서의 재조합 TdT의 농도는 적어도 10 nM일 수 있다.
일부 실시 형태에서, 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 제2 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함한다. 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 재조합 TdT와 접촉시키는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 제2 뉴클레오시드 트라이포스페이트를 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 TdT와 접촉시켜 제2 핵산을 생성하는 단계를 포함할 수 있다. 제2 핵산은 (i) 제1 뉴클레오시드 트라이포스페이트로부터의 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드 및 (ii) 하나 이상의 제2 뉴클레오티드가 도입된 제1 핵산을 포함할 수 있다.
일부 실시 형태에서, 하나 이상의 제2 뉴클레오티드 각각은 제2 뉴클레오시드 트라이포스페이트로부터의 제2 변형된 염기를 포함한다. 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 동일한 비변형된 염기의 변형을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 상이한 비변형된 염기의 변형을 포함할 수 있다. 일부 실시 형태에서, 제2 뉴클레오시드 트라이포스페이트는 공유 연결된 제2 변형된 염기 및 제2 부속 올리고뉴클레오티드를 포함한다.
일부 실시 형태에서, 제2 뉴클레오티드 각각은 제2 뉴클레오시드 트라이포스페이트로부터의 제2 비변형된 염기를 포함한다. 제2 뉴클레오시드 트라이포스페이트의 제2 비변형된 염기는 아데닌, 구아닌, 시토신, 티민, 또는 우라실을 포함할 수 있다. 제1 변형된 염기는 제2 비변형된 염기의 변형을 포함할 수 있다.
일부 실시 형태에서, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트와 제2 뉴클레오시드 트라이포스페이트는 약 1:100 내지 약 100:1 범위의 비로 제1 핵산과 접촉된다. 제1 변형된 염기를 포함하는 제1 뉴클레오티드와 제2 뉴클레오티드는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산 내로 도입될 수 있다.
일부 실시 형태에서, 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 복수의 제2 뉴클레오시드 트라이포스페이트들을 제공하는 단계를 포함한다. 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 재조합 TdT와 접촉시키는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 복수의 제2 뉴클레오시드 트라이포스페이트들을 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 TdT와 접촉시켜 제2 핵산을 생성하는 단계를 포함할 수 있다. 제2 핵산은 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드 및 복수의 제2 뉴클레오시드 트라이포스페이트들로부터의 하나 이상의 제2 뉴클레오티드가 도입된 제1 핵산을 포함할 수 있다.
일부 실시 형태에서, 복수의 제2 뉴클레오시드 트라이포스페이트들은 데옥시리보스 아데닌 트라이포스페이트, 데옥시리보스 구아닌 트라이포스페이트, 데옥시리보스 시토신 트라이포스페이트, 데옥시리보스 티민 트라이포스페이트, 데옥시리보스 우라실 트라이포스페이트, 또는 이들의 조합을 포함한다. 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 제1 핵산과 접촉될 수 있다. 제2 뉴클레오티드들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산 내로 도입될 수 있다. 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 비변형된 염기를 포함할 수 있다. 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 변형된 염기를 포함할 수 있다.
일부 실시 형태에서, 변형된 염기와 비변형된 염기는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산 내로 도입될 수 있다. 변형된 염기들은 제2 핵산 내로 도입된 제1 변형된 염기, 및/또는 복수의 제2 뉴클레오티드들 중 적어도 하나 또는 각각의 염기를 포함할 수 있다. 비변형된 염기는 제2 핵산 내로 도입된 복수의 제2 뉴클레오티드들 중 적어도 하나 또는 각각의 염기를 포함할 수 있다.
일부 실시 형태에서, 제2 핵산의 뉴클레오티드 염기의 적어도 1%는 변형된 염기를 포함한다. 변형된 염기들은 제2 핵산 전체에 걸쳐 분포될 수 있다. 변형된 염기들은 제2 핵산 전체에 걸쳐 랜덤하게 분포될 수 있다. 제2 핵산은 복수의 2개 이상의 연속적인 변형된 염기들을 포함할 수 있다. 복수의 연속적인 변형된 염기들은 3개 이상의 연속적인 변형된 염기들을 포함할 수 있다. 일부 실시 형태에서, 제2 핵산의 뉴클레오티드 염기의 적어도 1%는 제1 변형된 염기를 포함한다.
일부 실시 형태에서, 제1 핵산은 핵산 주형과 결합할 수 있는 주형 포획 부위를 포함한다. 주형 포획 부위는 주형 포획 서열을 포함할 수 있다. 핵산 주형은, 주형 포획 서열의 역방향 상보체와 적어도 90%의 서열 동일성을 갖고 주형 포획 서열과 혼성화될 수 있는 서열을 포함할 수 있다. 핵산 주형은 단일 가닥 DNA를 포함할 수 있다.
일부 실시 형태에서, 제2 핵산 내의 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 상기 제1 뉴클레오티드 중 하나 이상은 작용 모이어티(functional moiety)를 포함한다. 제1 변형된 염기의 작용 모이어티는 클릭 화학 반응에 참여할 수 있다. 제2 핵산 내의 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 제1 뉴클레오티드는 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬을 포함할 수 있다. 제1 변형된 염기의 작용 모이어티와 염기는 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬에 의해 연결된 제1 변형된 염기의 2개의 말단 상에 존재할 수 있다.
일부 실시 형태에서, 상기 방법은 제1 부속 올리고뉴클레오티드를 제공하는 단계를 추가로 포함한다. 상기 방법은 제2 핵산을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속 올리고뉴클레오티드와 접촉시켜, 하나 이상의 제1 부속 올리고뉴클레오티드에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드를 제공하는 단계는 제1 부속 올리고뉴클레오티드 및 제2 부속 올리고뉴클레오티드를 제공하는 단계를 포함한다. 제2 핵산을 제1 부속 올리고뉴클레오티드와 접촉시키는 단계는 제2 핵산을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속 올리고뉴클레오티드 및 제2 부속 올리고뉴클레오티드와 접촉시켜, 하나 이상의 제1 부속 올리고뉴클레오티드 및 하나 이상의 제2 부속 올리고뉴클레오티드에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드는 제1 어댑터 서열 또는 이의 역방향 상보체를 포함한다. 제2 부속 올리고뉴클레오티드는 제2 어댑터 서열 또는 이의 역방향 상보체를 포함할 수 있다. 일부 실시 형태에서, 제1 어댑터 서열은 P5 서열을 포함한다. 제2 어댑터 서열은 P7 서열을 포함할 수 있다.
일부 실시 형태에서, 하나 이상의 제1 부속 올리고뉴클레오티드 및 제2 부속 올리고뉴클레오티드는 약 10개의 뉴클레오티드 길이 내지 약 100개의 뉴클레오티드 길이이다. 제3 핵산은 약 10 내지 약 1,000,000개의 제1 부속 올리고뉴클레오티드를 포함할 수 있다. 제3 핵산은 약 10 내지 약 1,000,000개의 제2 부속 올리고뉴클레오티드를 포함할 수 있다. 일부 실시 형태에서, 제3 핵산은 하나 이상의 제1 부속 올리고뉴클레오티드에 부착된 제2 핵산을 포함한다. 제3 핵산은 하나 이상의 제2 부속 올리고뉴클레오티드에 부착된 제2 핵산을 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드를 제공하는 단계는 제1 부속 올리고뉴클레오티드 및 제1 중합체를 포함하는 제1 부속물을 제공하는 단계를 포함한다. 제2 핵산을 제1 부속 올리고뉴클레오티드와 접촉시키는 단계는 제2 핵산을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속물과 접촉시켜, 하나 이상의 제1 부속물에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다. 제2 부속 올리고뉴클레오티드를 제공하는 단계는 제2 부속 올리고뉴클레오티드 및 제2 중합체를 포함하는 제2 부속물을 제공하는 단계를 포함할 수 있다. 제2 핵산을 제2 부속물과 접촉시키는 단계는 제2 핵산과 제2 부속물을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 접촉시켜, 하나 이상의 제2 부속물에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다. 제1 부속물은 공유 연결된 제1 부속 올리고뉴클레오티드 및 제1 중합체를 포함할 수 있다. 제2 부속물은 공유 연결된 제2 부속 올리고뉴클레오티드 및 제2 중합체를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드 또는 제1 중합체는 제1 작용 모이어티를 포함한다. 제2 부속 올리고뉴클레오티드는 제2 작용 모이어티를 포함할 수 있다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티와 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티는 동일하다. 제1 부속 올리고뉴클레오티드의 제1 작용 모이어티는 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있다. 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티는 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티는 클릭 화학 반응에 참여할 수 있다. 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티는 클릭 화학 반응에 참여할 수 있다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티는 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와의 클릭 화학 반응에 참여할 수 있다. 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티는 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와의 클릭 화학 반응에 참여할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티, 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티, 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기의 작용 모이어티, 및 제1 뉴클레오티드의 작용 모이어티 중 하나 이상은 독립적으로 아지드, 알키닐, 알케닐, 티올, 또는 니트론이다. 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티 및 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티, 또는 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티 및 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티, 또는 둘 모두는 하기 쌍으로부터 선택될 수 있다: (i) 아지도/알키닐; (ii) 알키닐/아지도; (iii) 티올/알키닐; (iv) 알키닐/티올; (v) 알케닐/티올; (vi) 티올/알케닐; (vii) 아지도/사이클로옥티닐; (viii) 사이클로옥티닐/아지도; (ix) 니트론/사이클로옥티닐; 및 (x) 사이클로옥티닐/니트론. 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티는 아지도일 수 있다. 제1 부속 올리고뉴클레오티드 또는 제1 중합체의 제1 작용 모이어티 및 제2 부속 올리고뉴클레오티드 또는 제2 중합체의 제2 작용 모이어티 중 하나 이상은 독립적으로 알키닐일 수 있다.
일부 실시 형태에서, 클릭 화학 반응은 구리 촉매된 아지드-알킨 부가환화(CuAAC)를 포함한다. 공유 결합은 트라이아졸릴을 포함할 수 있다. CuAAC는 Cu(I) 안정화 리간드를 포함할 수 있다. Cu(I) 안정화 리간드는 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)- 1H-1,2,3-트라이아졸-1-일]프로판올(BTTP), 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]프로필 하이드로겐 설페이트(BTTPS), 2-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]에틸 하이드로겐 설페이트(BTTES), 2-[4-{(비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노)메틸}-1H-1,2,3-트라이아졸-1-일]-아세트산(BTTAA), 바토페난트롤린 다이설포네이트 다이소듐 염(BPS), N,N,N′,N",N"-펜타메틸다이에틸렌트라이아민(PMDETA), 트리스-((1-벤질-1H-1,2,3-트라이아졸-4-일)메틸)아민(TBTA), 트리스(3-하이드록시프로필트라이아졸릴메틸)아민(THPTA), Nε-((1R,2R)-2-아지도사이클로펜틸옥시)카르보닐)-L-라이신(ACPK), 및 4-N,N-다이메틸 아미노-1,8-나프탈이미드(4-DMN)로 이루어진 군으로부터 선택될 수 있다.
일부 실시 형태에서, 클릭 화학 반응은 변형-촉진된 아지드-알킨 부가환화(SPAAC)를 포함한다. 공유 결합은 사이클로옥타-트라이아졸릴을 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 알킨 하이드로티올화를 포함한다. 공유 결합은 알케닐 설파이드를 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 알켄 하이드로티올화를 포함한다. 공유 결합은 알킬 설파이드를 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 변형-촉진된 알킨-니트론 부가환화(SPANC)를 포함한다. 공유 결합은 옥타하이드로사이클로옥타-아이소옥사졸릴을 포함할 수 있다. 사이클로옥티닐은 다이벤질사이클로옥틴(DBCO) 또는 이들의 유도체일 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 생체적합성이다.
일부 실시 형태에서, 제2 온도는 약 20 ℃ 내지 약 65 ℃이다. 제2 온도는 0 ℃ 미만일 수 있다. 제2 온도는 약 -4 ℃ 내지 약 -20 ℃일 수 있다. 일부 실시 형태에서, 제2 반응 시간은 적어도 1초이다.
일부 실시 형태에서, 상기 방법은 (c) 제1 어댑터 서열 또는 이의 역방향 상보체, 제2 어댑터 서열 또는 이의 역방향 상보체, 및 제3 핵산 상의 주형 포획 부위에 혼성화될 수 있는 핵산 혼성화 서열을 포함하는 핵산 주형을 제공하는 단계를 추가로 포함한다. 상기 방법은 (d) 제3 핵산을 핵산 주형과 접촉시켜, 핵산 주형이 핵산 주형의 핵산 혼성화 서열을 통해 제3 핵산 상의 주형 포획 부위에 혼성화된 제3 핵산을 생성하는 단계를 포함할 수 있다. 상기 방법은 (e) 핵산 주형과 혼성화된 제3 핵산 상에서 증폭을 수행하여, 핵산 주형의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 하나 이상의 제1 부속 올리고뉴클레오티드 및 하나 이상의 제2 부속 올리고뉴클레오티드에 부착된 제3 핵산을 포함하는 제4 핵산을 생성하는 단계를 포함할 수 있다. 증폭은, 예를 들어 가교 증폭 또는 배제 증폭일 수 있다. 상기 방법은 (f) 제4 핵산을 사용하여 핵산 주형의 서열을 결정하는 단계를 추가로 포함할 수 있다. 핵산 주형의 핵산 혼성화 서열은 주형 포획 부위의 역방향 상보체를 포함할 수 있다.
일부 실시 형태에서, 제1 핵산, 제2 핵산, 제3 핵산, 및/또는 제4 핵산은 제3 중합체를 포함한다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Gly, Glu191Ile, Glu191Leu, Glu191Met, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Val일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn, Lys193Gln, Lys193Ser, 또는 Lys193Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Gly, Glu194Ile, Glu194Leu, Glu194Met, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Gly일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 방향족 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Asn, Asp242Gln, Asp242Phe, Asp242Ser, Asp242Thr, Asp242Trp, 또는 Asp242Tyr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Tyr일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 음으로 하전된 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Asp 또는 Lys287Glu일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Glu일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Gly, Phe296Ile, Phe296Leu, Phe296Met, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Leu일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Arg, Met299His, 또는 Met299Lys일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Lys일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Asn, Thr342Cys, Thr342Gln, Thr342Pro, 또는 Thr342Ser일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ser일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Asn, His421Cys, His421Gln, His421Pro, His421Ser, 또는 His421Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 8개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 90% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 11과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 12와 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다.
일부 실시 형태에서, 재조합 TdT는 47 ℃ 이상의 온도에서 안정하다. 재조합 TdT는 50 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 55 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 58 ℃ 이상의 온도에서 안정할 수 있다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%이다. 시험 온도는 37 ℃, 47 ℃, 50 ℃, 55 ℃, 또는 58 ℃일 수 있다.
일부 실시 형태에서, 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단편을 포함한다. SUMO 단편은 서열 번호 13과 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 재조합 TdT의 N-말단 상에 SUMO 단편을 포함할 수 있다. 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 재조합 TdT의 C-말단 상에 SUMO 단편을 포함할 수 있다.
본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제2 핵산의 실시 형태가 본 명세서에 개시된다. 본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제3 핵산의 실시 형태가 본 명세서에 개시된다. 본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제4 핵산의 실시 형태가 본 명세서에 개시된다.
본 명세서에 기재된 발명 요지의 하나 이상의 구현 형태들에 대한 상세사항들이 첨부 도면 및 이하의 설명에 기재되어 있다. 다른 특징들, 태양들, 및 이점들이 설명, 도면, 및 청구범위로부터 명백해질 것이다. 본 개요 또는 하기의 상세한 설명 어느 것도 본 발명 요지의 범주를 한정하거나 제한하고자 하지 않는다.
도 1은 단일 가닥 DNA 스캐폴드, 담체, 및 나노입자를 생성하는 비제한적인 예시적인 과정을 나타낸 개략도이다.
도 2는 보스 타우루스 TdT(서열 번호 12)의 아미노산 139 내지 520(서열 번호 1)과 SUMO-TdT(서열 번호 14)의 비제한적인 예시적인 서열 정렬을 나타낸다. SUMO-TdT는, 아미노산 위치 123 내지 504에서 보스 타우루스 TdT의 아미노산 139 내지 520을 함유하고, 아미노산 위치 22 내지 119에서 N-말단 SUMO-태그(서열 번호 13)를 함유하는 재조합 TdT를 지칭한다. 강조된 9개의 아미노산은 본 명세서에서 확인된 SUMO-TdT에서의 치환 돌연변이이다. SUMO-TdT(및 이의 변이체)에서의 치환 돌연변이의 아미노산 위치 및 보스 타우루스 TdT에서의 상응하는 위치가 나타나 있다.
도 3은 NEB로부터의 시판 TdT 및 TdT3-2의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성을 나타낸 비제한적인 예시적인 겔 그래프이다.
도 4a 및 도 4b는 1분 및 60분 동안 시판 NEB TdT에 의해 아지드-PEG4-dUTP 및 천연 뉴클레오티드에 의한 TdT 연장의 결과를 나타낸 비제한적인 예시적인 겔 그래프이다.
도 5a 내지 도 5c는 1분 및 60분 동안 TdT3-2 및 시판 NEB TdT에 의해 아지드-PEG4-dUTP 또는 아지드-헥실-dATP에 의한 TdT 연장의 결과를 나타낸 비제한적인 예시적인 겔 그래프이다.
하기의 상세한 설명에서는 첨부 도면을 참조하며, 이들 도면은 본 명세서의 일부를 형성한다. 도면에서, 유사한 기호는, 문맥이 달리 지시하지 않는 한, 전형적으로 유사한 구성요소를 나타낸다. 상세한 설명, 도면, 및 청구범위에 기재된 예시적인 실시 형태는 제한적인 것으로 의미되지 않는다. 본 명세서에 제시된 발명 요지의 사상 또는 범주로부터 벗어남이 없이 다른 실시 형태가 이용될 수 있고, 다른 변경이 이루어질 수 있다. 본 명세서에 대체적으로 기재되고 도면에 예시된 바와 같은 본 발명의 태양은 각종 매우 다양한 구성으로 배열, 치환, 조합, 분리, 및 설계될 수 있으며, 이들 모두는 본 명세서에서 명백하게 고려되고 본 발명의 일부를 구성함이 쉽게 이해될 것이다.
본 명세서에 언급된 모든 특허, 공개된 특허 출원, 다른 간행물, 및 GenBank로부터의 서열, 및 다른 데이터베이스는 관련 기술에 대해 전체적으로 참고로 포함된다.
많은 서열분석 플랫폼은 "합성에 의한 서열분석" (SBS) 기술 및 검출을 위한 형광-기반 방법을 사용한다. 예를 들어, 주형 폴리뉴클레오티드들의 라이브러리가 시딩된 주형 폴리뉴클레오티드를 생성하기 위하여 시딩으로 알려진 과정에서 기재의 표면에 부착될 수 있다. 이어서, 클러스터링된 폴리뉴클레오티드로 불리는 각각의 시딩된 주형 폴리뉴클레오티드의 다수의 카피가, 클러스터링이라 불리는 과정에서, 주형 폴리뉴클레오티드가 시딩된 위치에 근접한 표면에 부착 시에 합성될 수 있다. 후속으로, 클러스터링된 폴리뉴클레오티드의 신생(nascent) 카피가, 예를 들어 형광 표지를 갖는 뉴클레오티드를 도입함으로써 합성될 수 있다. 클러스터링된 폴리뉴클레오티드의 신생 카피 내로 도입된 뉴클레오티드는 도입된 각각의 뉴클레오티드를 확인시켜 주는 신호(예를 들어, 형광 신호)를 방출할 수 있다. 주형 폴리뉴클레오티드가 초기에 시딩된 위치에 근접한 시딩된 주형 폴리뉴클레오티드의 카피들의 클러스터링은 신호의 증폭을 가져오며, 이에 따라 검출을 개선한다.
시딩 및 클러스터링은 서로 충분히 원위에 있는 표면의 위치에 서로 상이한 주형 폴리뉴클레오티드가 시딩되거나 그에 부착될 때 잘 작동하여, 단일 주형 폴리뉴클레오티드의 시딩으로부터 각각 생성되는 공간적으로 구별되는 카피된 폴리뉴클레오티드의 클러스터를 생성하며, 이 상태는 단일클론성으로 지칭된다. 예를 들어, 주형 폴리뉴클레오티드들의 라이브러리는 상이한 뉴클레오티드 서열을 갖는 다수의 주형 폴리뉴클레오티드를 포함할 수 있다. 2개의 이러한 주형 폴리뉴클레오티드가 기재의 표면에 너무 밀접하게 함께 시딩되는 경우, 클러스터링은 클러스터링된 폴리뉴클레오티드의 공간적으로 조합된 집단을 초래할 수 있으며, 이들 중 일부는 가까이 시딩된 주형 폴리뉴클레오티드 중 하나의 서열을 가질 수 있고 나머지는 표면 상에 가까이 또한 시딩된 다른 주형 폴리뉴클레오티드의 서열을 가질 수 있다. 또는, 서로 너무 근접하게 시딩된 2개의 상이한 주형 폴리뉴클레오티드로부터 형성된 2개의 클러스터는 클러스터들 사이의 기재-부착 클러스터링된 폴리뉴클레오티드의 공간적 조합이 없거나 최소화될 수 있더라도 SBS 과정에서 사용되는 이미징 시스템이, 도입된 뉴클레오티드에 의해 생성되는 신호를 개별 클러스터들로 구별할 수 없도록 서로 너무 인접하게 있거나 또는 서로 붙어있을 수 있다. 그러한 불리한 조건은 다중클론성으로 지칭될 수 있다. 이는 더 어렵고, 시간 소모적이고, 비싸고, 덜 효율적일 수 있으며, 존재하는 경우 다중클론 클러스터로부터 모호한 서열 정보를 얻기 위해 더 복잡한 데이터 분석을 필요로 할 수 있다.
단일클론성은 또한, 주형 폴리뉴클레오티드로부터의 카피된 폴리뉴클레오티드를 각각 갖는 단일 나노입자들을 기재(예를 들어, 플로우 셀)의 단일 웰에 분포시킴으로써 달성될 수 있다. 스캐폴드(예를 들어, 단일 가닥 DNA(ssDNA) 스캐폴드)는 주형 폴리뉴클레오티드의 다수의 카피를 위한 "담체"로서의 역할을 할 수 있다. 주형 분자의 다수의 카피를 갖는 담체는 기재 상의 단일 웰을 점유할 수 있는 나노입자일 수 있는데, 이때 이러한 점유는 다른 거대분자가 입체 충돌 또는 장애에 의해 동일한 웰을 점유하는 것을 배제시킴으로써 가능하다. 기재의 단일 웰을 점유하는 단일 나노입자는 단일클론성을 가져오거나 단일클론성에 근접해질 수 있다.
스캐폴드를 생성하는 방법의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 상기 방법은 (a) 단일 가닥 데옥시리보핵산(ssDNA), 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함한다. 상기 방법은 (b) ssDNA, 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 ssDNA 스캐폴드를 생성하는 단계를 포함할 수 있다. ssDNA 스캐폴드는 뉴클레오시드 트라이포스페이트로부터의 변형된 염기를 포함하는 하나 이상의 뉴클레오티드가 도입된 ssDNA를 포함할 수 있다. 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 상기 방법은 (c) ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드와 접촉시켜 핵산 담체를 생성하는 단계를 추가로 포함할 수 있다. 제1 어댑터 올리고뉴클레오티드는 제1 어댑터 서열을 포함할 수 있다. 제2 어댑터 올리고뉴클레오티드는 제2 어댑터 서열을 포함할 수 있다. 핵산 담체는 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드에 부착된 ssDNA 스캐폴드를 포함할 수 있다. 상기 방법은 담체로부터 나노입자를 생성하는 데 사용될 수 있다. 예를 들어, 상기 방법은 (d) 제1 어댑터 서열 또는 이의 역방향 상보체, 제2 어댑터 서열 또는 이의 역방향 상보체, 및 핵산 혼성화 서열을 포함하는 핵산 주형을 제공하는 단계를 포함할 수 있다. 상기 방법은 (e) 핵산 담체를 핵산 주형과 접촉시켜, 핵산 주형이 핵산 주형의 핵산 혼성화 서열을 통해 핵산 담체의 주형 포획 부위에 혼성화된 핵산 담체를 생성하는 단계를 포함할 수 있다. 상기 방법은 (f) 핵산 주형과 혼성화된 핵산 담체 상에서 증폭을 수행하여 복수의 증폭된 핵산들을 생성하는 단계를 포함할 수 있으며, 각각의 증폭된 핵산은 핵산 주형의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 올리고뉴클레오티드를 포함한다. 증폭은, 예를 들어 가교 증폭 또는 배제 증폭일 수 있다. 복수의 증폭된 핵산들을 갖는 담체는 본 명세서에서 나노입자로 지칭된다. 상기 방법은 (g) 복수의 증폭된 핵산들을 사용하여 핵산 주형의 서열을 결정하는 단계를 포함할 수 있다. 충분한 공간 치수를 갖는 나노입자는 기재(예를 들어, 플로우 셀) 상의 단일 웰을 점유할 수 있으며 - 이때 이러한 점유는 다른 나노입자가 입체 충돌 또는 장애에 의해 동일한 웰을 점유하는 것을 배재시킴으로써 가능함 -, 이에 따라 단일클론성을 가져오거나 단일클론성에 근접해질 수 있다.
핵산을 변형시키는 방법의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 상기 방법은 (a) 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함한다. 상기 방법은 (b) 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 제2 핵산을 생성하는 단계를 포함할 수 있다. 제2 핵산은 제1 뉴클레오시드 트라이포스페이트로부터의 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드가 도입된 제1 핵산을 포함할 수 있다. 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
다수의 변형된 염기를 도입시킨 단일 가닥 DNA 분자의 생성
변형된 뉴클레오티드를 도입시킨 스캐폴드(예를 들어, 단일 가닥 DNA(ssDNA) 스캐폴드)가 생성될 수 있다. 스캐폴드는 주형 분자의 다수의 카피를 위한 "담체"로서의 역할을 할 수 있다. 주형 분자의 다수의 카피를 갖는 담체는 기재(예를 들어, 다수의 웰, 예컨대 100, 1,000, 10,000개 또는 그 이상의 웰을 포함하는 플로우 셀) 상의 단일 웰(예를 들어, 마이크로웰)을 점유할 수 있는 나노입자일 수 있는데, 이때 이러한 점유는 다른 거대분자가 입체 충돌 또는 장애에 의해 동일한 웰을 점유하는 것을 배제시킴으로써 가능하다. 각각이 하나의 나노입자를 갖는 기재 상의 단일 웰들은 단일클론성을 가져오거나 단일클론성에 근접해질 수 있다. 대안적으로, ssDNA 스캐폴드는 주형의 단일 카피를 담지할 수 있다. 스캐폴드는 고정 올리고(anchoring oligo)의 역방향 상보체 또는 고정 올리고들의 역방향 상보체들의 다수의 카피를 가질 수 있다. 스캐폴드는 고정 올리고의 역방향 상보체 또는 고정 올리고들의 역방향 상보체들의 다수의 카피의 존재로 인해 주어진 웰 내의 모든 "고정" 올리고에 결합하고 봉쇄시킬 수 있으며, 이로써 단일 주형이 웰당 포착될 수 있게 된다.
그러한 ssDNA 스캐폴드를 생성하거나 작제하는 한 가지 방법은 ssDNA 폴리머라제, 예컨대 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 사용하여 염기 상의 변형, 예컨대 아지드 기를 담지하는 뉴클레오티드를 프라이머 가닥 내로 랜덤하게 도입시키는 것이다. 그러나, 구매가능한 TdT는 다수의 일련의 염기 변형된 뉴클레오티드들을 용이하게 도입시키지 않는데, 이는 추정컨대 입체 충돌 때문일 것이다.
본 명세서에 개시된 재조합 TdT의 실시 형태는 열안정성이며, 염기 변형된 뉴클레오티드, 예컨대 PEG 사슬이 염기에 접합된 뉴클레오티드(본 명세서에서, PEG-뉴클레오티드로 지칭됨)를 도입시키는 데 있어서, 구매가능한 TdT, 예컨대 New England Biolabs®, Inc.(NEB; 미국 매사추세츠주 입스위치 소재)로부터의 TdT보다 우수하다(예를 들어, 훨씬 더 우수하다). 예를 들어, NEB TdT는 1개 또는 2개의 PEG-뉴클레오티드를 도입시킨 후에 정지할 것이며, 재조합 TdT는 다수의 PEG-뉴클레오티드를 연속적으로 도입시킬 수 있다.
따라서, 본 명세서에 개시된 임의의 재조합 TdT는, 단일클론 클러스터링을 위한 "담체"의 생성을 포함한, 각종 목적을 위한 다양한 유형의 염기 변형된 뉴클레오티드를 담지하는 ssDNA를 생성하기 위한 탁월한 촉매일 수 있다.
도 1은 단일 가닥 DNA 스캐폴드, 담체, 및 나노입자를 생성하는 비제한적인 예시적인 과정을 나타낸 개략도이다. 단일 가닥 DNA(ssDNA) 스캐폴드(120s)는 말단 데옥시뉴클레오티딜 트랜스퍼라제(112)(TdT)의 사용에 의해 합성될 수 있다. TdT(112)는 주형을 필요로 하거나 카피하지 않고서 단일 가닥 DNA 가닥(104)의 3' 하이드록실 말단에 데옥시뉴클레오티드(108nt_m, 108nt_u)를 도입시킬 수 있다. TdT(112)의 사용에 의해 합성된 ssDNA 스캐폴드(120s)의 크기는 스캐폴드(120s)가 합성되는 동안의 중합 공정의 지속시간을 변경시킴으로써 제어될 수 있다.
DNA 스캐폴드(120s)는 변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nst_m) 및 비변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nst_u)의 존재 하에서 합성될 수 있다. 변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nst_m)와 비변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nst_u)의 상대 농도에 따라, DNA 스캐폴드(120s) 내로 도입된 뉴클레오티드(108nt_m, 108nt_u)의 소정의 백분율은 변형된 염기를 갖는 뉴클레오티드(108nt_m)이다. DNA 스캐폴드(120s)를 합성할 때, 변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nt_m)의 하나 이상의 유형이 존재할 수 있고, 변형된 염기를 갖는 뉴클레오티드(120nt_m)의 하나 이상의 유형이 DNA 스캐폴드(120s) 내로 도입될 수 있다.
이 비제한적인 예에서는, 부속 올리고뉴클레오티드(124as1, 124as2)가 핵산 담체(120c)를 형성하기 위하여 ssDNA 스캐폴드에 결합하는 것으로 나타나 있다. 부속 올리고뉴클레오티드(124as1, 124as2)는 클릭 화학 반응에서 뉴클레오티드(108nt_m)의 변형된 염기의 작용 모이어티(108fm)와 상호작용할 수 있다. 예를 들어, 스캐폴드(120s) 내로 도입된 뉴클레오티드(108nt_m)의 변형된 염기의 작용 모이어티(108fm)는 부속 올리고뉴클레오티드(124ao1, 124ao2) 상의 작용 모이어티(124fm1, 124fm2)와 반응할 수 있다.
단일 주형 포획 부위(104tcs)가 ssDNA 스캐폴드(120s)의 말단(예를 들어, 5' 말단) 상에 존재한다. 사각별은 스캐폴드(120s) 상의 뉴클레오티드(108nt_m)의 변형된 염기의 작용 모이어티(108fm)를 나타낸다. 부속 올리고뉴클레오티드(124ao1, 124ao2)는 P5 서열 또는 이의 역방향 상보체, 또는 P7 서열 또는 이의 역방향 상보체를 포함할 수 있다. 부속 올리고뉴클레오티드(124ao1, 124ao2) 상의 오각별은 스캐폴드(120s) 내의 뉴클레오티드(108nt_m)의 변형된 염기의 작용 모이어티(108fm)와 상호작용할 수 있는 작용 모이어티(124fm1, 124m2)를 나타낸다.
이어서, 주형 핵산 또는 폴리뉴클레오티드(128)의 5' 말단은 비공유 왓슨-크릭 염기쌍 형성 혼성화에 의해 핵산 담체(120c)의 상보적 5' 말단에서 단일 주형 포획 부위(104tcs)에 결합하는 것으로 나타나 있다. 이어서, 클러스터링 과정이 핵산 담체(120c) 상에서 수행된다. 핵산 담체(120c)에 혼성화되지 않은 주형 핵산(128)의 부분은 P5 서열 또는 이의 역방향 상보체, 및 P7 서열 또는 이의 역방향 상보체에 혼성화될 수 있는 서열을 함유할 수 있다. 예를 들어, 주형 핵산(128)은 P5 서열 또는 이의 역방향 상보체, 및 P7 서열 또는 이의 역방향 상보체를 함유할 수 있다. 다회 라운드의 중합 후에, 주형 포획 부위(104tcs)에 혼성화될 수 있는 주형 핵산(128)의 5' 말단 이외의, 주형 폴리뉴클레오티드(128)의 담체-결합된 카피 및/또는 역방향 상보체가 P5 및 P7 부속 올리고뉴클레오티드의 3' 말단으로부터 연장됨으로써 합성된다.
핵산 변형
스캐폴드를 생성하는 방법, 담체를 생성하는 방법, 나노입자를 생성하는 방법, 및 핵산 주형을 서열분석하는 방법이 본 명세서에 개시된다. 도 1을 참조하면, 상기 방법은 단일 가닥 데옥시리보핵산(ssDNA)(104), 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트(108nst_m)를 제공하는 단계를 포함할 수 있다. 상기 방법은 ssDNA(104), 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트(108nst_m)를 작업(116a)에서 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)(112)와 접촉시켜 ssDNA 스캐폴드(120s)를 생성하는 단계를 포함할 수 있다. ssDNA 스캐폴드(120s)는 뉴클레오시드 트라이포스페이트(108nst_m)로부터의 변형된 염기를 포함하는 하나 이상의 뉴클레오티드(108nt_m)가 도입된 ssDNA(104)를 포함할 수 있다. 재조합 TdT(108)는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
상기 방법은 ssDNA 스캐폴드(120s)를 작업(116b)에서 제1 어댑터 올리고뉴클레오티드(124ao1)(예를 들어, P5 서열을 포함하는 올리고뉴클레오티드), 또는 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제2 어댑터 올리고뉴클레오티드(124ao2)(예를 들어, P7 서열을 포함하는 올리고뉴클레오티드)를 포함하는 제1 어댑터, 또는 제2 어댑터 올리고뉴클레오티드(124ao2)를 포함하는 제2 어댑터를 접촉시켜 핵산 담체(120c)를 생성하는 단계를 포함할 수 있다. 제1 어댑터 올리고뉴클레오티드(124ao1)는 제1 어댑터 서열(124as1)(예를 들어, P5 서열) 또는 이의 역방향 상보체를 포함할 수 있다. 제2 어댑터 올리고뉴클레오티드(124ao2)는 제2 어댑터 서열(124as)(예를 들어, P7 서열) 또는 이의 역방향 상보체 또는 이의 역방향 상보체를 포함할 수 있다. 핵산 담체(120c)는 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제2 어댑터 올리고뉴클레오티드(124ao2)에 부착된 ssDNA 스캐폴드(120s)를 포함할 수 있다.
일부 실시 형태에서, ssDNA 스캐폴드(120s)를 제1 어댑터 올리고뉴클레오티드(124ao1)와 접촉시키는 단계는 ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함하는 제1 어댑터와 접촉시키는 단계를 포함한다. ssDNA 스캐폴드(120s)를 제2 어댑터 올리고뉴클레오티드(124ao2)와 접촉시키는 단계는 ssDNA 스캐폴드를 제2 어댑터 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함하는 제2 어댑터와 접촉시키는 단계를 포함할 수 있다. 제1 어댑터는 공유 연결된 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함할 수 있다. 제2 어댑터는 공유 연결된 제2 어댑터 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함할 수 있다. ssDNA 스캐폴드(120s)는 제3 중합체를 포함할 수 있다.
상기 방법은 제1 어댑터 서열(124as1) 또는 이의 역방향 상보체, 제2 어댑터 서열(124as2) 또는 이의 역방향 상보체, 및 주형 포획 부위(104tcs)에 혼성화될 수 있는 핵산 혼성화 서열(128tcs)을 포함하는 핵산 주형(128)을 제공하는 단계를 포함할 수 있다. 상기 방법은 작업(116c)에서 핵산 담체(120c)를 핵산 주형과 접촉시켜, 핵산 주형(128)이 핵산 주형(128)의 핵산 혼성화 서열(128tcs)을 통해 핵산 담체(120c)의 주형 포획 부위(104tcs)에 혼성화된 핵산 담체(120c)를 생성하는 단계를 포함할 수 있다. 주형 포획 부위(104tcs)는 핵산 주형(128)의 핵산 혼성화 서열(128tcs)에 혼성화될 수 있다. 주형 포획 부위(104tcs)와, 핵산 주형(128)의 핵산 혼성화 서열(128tcs)은 역방향 상보체일 수 있다. 주형 포획 부위(104tcs)와, 핵산 주형(128)의 핵산 혼성화 서열(128tcs)의 역방향 상보체는 동일하거나, 실질적으로 동일할(예를 들어, 75%, 80%, 85%, 90%, 95%, 99% 동일할) 수 있다. 상기 방법은 핵산 주형(128)과 혼성화된 핵산 담체(120c) 상에서 작업(116d)에서 증폭(예를 들어, 가교 증폭 또는 배제 증폭)을 수행하여 복수의 증폭된 핵산(132)들을 생성하는 단계를 포함할 수 있으며, 각각의 증폭된 핵산은 핵산 주형(128)의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 제1 어댑터 올리고뉴클레오티드(124ao1) 또는 제2 어댑터 올리고뉴클레오티드(124ao2)를 포함한다. 복수의 증폭된 핵산들을 갖는 담체는 본 명세서에서 나노입자(120n)로 지칭된다. 상기 방법은 복수의 증폭된 핵산(132)들 중 하나 이상을 사용하여 핵산 주형(128)의 서열을 결정하는 단계를 포함할 수 있다.
핵산을 변형시키는 방법이 본 명세서에 개시된다. 도 1을 참조하면, 상기 방법은 제1 핵산(104)(예를 들어, 단일 가닥 데옥시리보핵산), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)를 제공하는 단계를 포함할 수 있다. 상기 방법은 제1 핵산(104), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)를, 상호작용(116a)에서, 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)(112)와 접촉시켜 제2 핵산(120s)(예를 들어, 담체)을 생성하는 단계를 포함할 수 있다. 제2 핵산(120s)(예를 들어, 핵산 스캐폴드)은 제1 뉴클레오시드 트라이포스페이트(108nst_m)로부터의 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드(108nt_m)가 도입된 제1 핵산(104)을 포함할 수 있다. 재조합 TdT(112)는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
핵산, 뉴클레오티드, 및 뉴클레오시드 트라이포스페이트
일부 실시 형태에서, 제1 핵산(104)은 단일 가닥 핵산, 3' 오버행을 갖는 이중 가닥 핵산, 3' 리세스를 갖는 이중 가닥 핵산, 또는 이들의 조합을 포함한다. 제2 핵산(120c)은 단일 가닥 핵산, 3' 오버행을 갖는 이중 가닥 핵산, 3' 리세스를 갖는 이중 가닥 핵산, 또는 이들의 조합을 포함할 수 있다. 제1 핵산(104)은 데옥시리보핵산(DNA)을 포함할 수 있다. 제2 핵산(120s)은 데옥시리보핵산을 포함할 수 있다.
제1 핵산(104), 또는 제2 핵산(120c)(또는 본 발명의 임의의 핵산)의 길이는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 핵산, 또는 제2 핵산(또는 본 발명의 임의의 핵산)의 길이는 정확히 또는 약 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 개수의 뉴클레오티드이다. 일부 실시 형태에서, 제1 핵산, 또는 제2 핵산(또는 본 발명의 임의의 핵산)의 길이는 적어도, 적어도 약, 최대, 또는 최대 약 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 또는 10000000개의 뉴클레오티드이다.
데옥시리보뉴클레오티드를 포함하는, 제1 핵산(104) 또는 제2 핵산(120c)의 뉴클레오티드(108nt_m, 108nt_u)의 백분율 및 수는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 데옥시리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 백분율은 정확히 또는 약 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 데옥시리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 백분율은 적어도, 적어도 약, 최대, 또는 최대 약 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%이다. 예를 들어, 제1 핵산(104)의 뉴클레오티드의 적어도 50%는 데옥시리보뉴클레오티드를 포함할 수 있다. 예를 들어, 제2 핵산(120s)의 뉴클레오티드(108nt_m, 108nt_u)의 적어도 50%는 데옥시리보뉴클레오티드를 포함할 수 있다. 일부 실시 형태에서, 데옥시리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 수는 정확히 또는 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 데옥시리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 수는 적어도, 적어도 약, 최대, 또는 최대 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000이다.
일부 실시 형태에서, 제1 핵산(104)은 단일 가닥 핵산을 포함한다. 제2 핵산(120c)은 단일 가닥 핵산을 포함할 수 있다. 제1 핵산(104)은 단일 가닥 데옥시리보핵산을 포함할 수 있다. 제2 핵산(120c)은 단일 가닥 데옥시리보핵산을 포함할 수 있다. 리보뉴클레오티드를 포함하는, 제1 핵산(104) 또는 제2 핵산(120c)의 뉴클레오티드(108nt_m, 108nt_u)의 백분율 및 수는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 백분율은 정확히 또는 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 데옥시리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 백분율은 적어도, 적어도 약, 최대, 또는 최대 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 또는 10%이다. 예를 들어, 제1 핵산의 뉴클레오티드의 최대 1%는 리보뉴클레오티드를 포함할 수 있다. 예를 들어, 제2 핵산의 뉴클레오티드의 최대 1%는 리보뉴클레오티드를 포함할 수 있다. 일부 실시 형태에서, 리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 수는 정확히 또는 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 리보뉴클레오티드를 포함하는, 제1 핵산 또는 제2 핵산의 뉴클레오티드의 수는 적어도, 적어도 약, 최대, 또는 최대 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 또는 10000000이다. 예를 들어, 제1 핵산(104)은 적어도 하나의 리보뉴클레오티드를 포함할 수 있다. 예를 들어, 제2 핵산(120c)은 적어도 하나의 리보뉴클레오티드를 포함할 수 있다.
제2 핵산(120c)은 제1 변형된 염기를 포함하는 다수의 제1 뉴클레오티드(108nst_m)가 도입된 제1 핵산(104)을 포함할 수 있다. 제2 핵산(120s) 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드(108nst_m)의 수는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제2 핵산 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드의 수는 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드의 수는 적어도, 적어도 약, 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 또는 10000000이다. 예를 들어, 제2 핵산(120c)은 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 제1 뉴클레오티드(108nst_m)가 도입된 제1 핵산(104)을 포함한다.
제2 핵산(120s) 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드(108nst_m)의 백분율은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제2 핵산 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드의 백분율은 정확히 또는 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산 내에 도입된 제1 변형된 염기를 포함하는 제1 뉴클레오티드의 백분율은 적어도, 적어도 약, 최대, 또는 최대 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다.
제2 핵산(120c) 내의 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 제1 뉴클레오티드(108nt_m)들은 연속적일 수 있다. 제2 핵산(120c)은 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드(108nt_m)들의 하나 이상의 영역을 포함할 수 있다. 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드(108nt_m)들의 영역(들)의 수는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드들의 영역(들)의 수는 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드들의 영역(들)의 수는 적어도, 적어도 약, 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 또는 10000이다. 제2 핵산(120c)의 영역 내의 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드(108nt_m)들의 수는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제2 핵산의 영역 내의 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드들의 수는 정확히 또는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산의 영역 내의 제1 변형된 염기를 포함하는 연속적인 제1 뉴클레오티드들의 수는 정확히 또는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 또는 10000이다.
제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기(또는 본 발명의 뉴클레오시드 트라이포스페이트의 임의의 변형된 염기)는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오시드 트라이포스페이트)는, 예를 들어 5-(15-아지도-4,7,10,13-테트라옥사-펜타데카노일-아미노알릴)-2'-데옥시우리딘-5'-트라이포스페이트(아지드-PEG4-아미노알릴-dUTP), N6-(6-아지도)헥실-3'-데옥시아데노신-5'-트라이포스페이트(N6-(6-아지도)헥실-3'-dATP), 또는 이들의 조합을 포함할 수 있다.
일부 실시 형태에서, 제1 뉴클레오시드 트라이포스페이트(108nst_m)는 제1 변형된 염기 및 제1 부속 올리고뉴클레오티드(예를 들어, P7 어댑터 올리고뉴클레오티드, 또는 (예를 들어, P 어댑터 올리고뉴클레오티드)를 포함한다. 제1 뉴클레오시드 트라이포스페이트(108nst_m)는 공유 연결된 제1 변형된 염기 및 제1 부속 올리고뉴클레오티드를 포함할 수 있다.
반응
제1 핵산(104), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)가 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(112)와 접촉되는 동안의 제1 반응 시간은 상이한 실시 형태에서 상이할 수 있다. 예를 들어, 제1 반응 시간은 적어도 10분(min)이다. 일부 실시 형태에서, 제1 반응 시간(또는 본 발명의 임의의 반응 시간)은 정확히 또는 약 1초(sec), 2초, 3초, 4초, 5초, 6초, 7초, 8초, 9초, 10초, 11초, 12초, 13초, 14초, 15초, 16초, 17초, 18초, 19초, 20초, 21초, 22초, 23초, 24초, 25초, 26초, 27초, 28초, 29초, 30초, 31초, 32초, 33초, 34초, 35초, 36초, 37초, 38초, 39초, 40초, 41초, 42초, 43초, 44초, 45초, 46초, 47초, 48초, 49초, 50초, 51초, 52초, 53초, 54초, 55초, 56초, 57초, 58초, 59초, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 11분, 12분, 13분, 14분, 15분, 16분, 17분, 18분, 19분, 20분, 21분, 22분, 23분, 24분, 25분, 26분, 27분, 28분, 29분, 30분, 31분, 32분, 33분, 34분, 35분, 36분, 37분, 38분, 39분, 40분, 41분, 42분, 43분, 44분, 45분, 46분, 47분, 48분, 49분, 50분, 51분, 52분, 53분, 54분, 55분, 56분, 57분, 58분, 59분, 60분, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 24시간, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응 시간(또는 본 발명의 임의의 반응 시간)은 적어도, 적어도 약, 최대, 또는 최대 약 1초, 2초, 3초, 4초, 5초, 6초, 7초, 8초, 9초, 10초, 11초, 12초, 13초, 14초, 15초, 16초, 17초, 18초, 19초, 20초, 21초, 22초, 23초, 24초, 25초, 26초, 27초, 28초, 29초, 30초, 31초, 32초, 33초, 34초, 35초, 36초, 37초, 38초, 39초, 40초, 41초, 42초, 43초, 44초, 45초, 46초, 47초, 48초, 49초, 50초, 51초, 52초, 53초, 54초, 55초, 56초, 57초, 58초, 59초, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 11분, 12분, 13분, 14분, 15분, 16분, 17분, 18분, 19분, 20분, 21분, 22분, 23분, 24분, 25분, 26분, 27분, 28분, 29분, 30분, 31분, 32분, 33분, 34분, 35분, 36분, 37분, 38분, 39분, 40분, 41분, 42분, 43분, 44분, 45분, 46분, 47분, 48분, 49분, 50분, 51분, 52분, 53분, 54분, 55분, 56분, 57분, 58분, 59분, 60분, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 24시간, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다.
제1 핵산(104), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)가 제1 반응에서 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(112)와 접촉되는 제1 반응 온도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 반응 온도(또는 본 발명의 임의의 반응 온도)는 정확히 또는 약 1 ℃, 2 ℃, 3 ℃, 4 ℃, 5 ℃, 6 ℃, 7 ℃, 8 ℃, 9 ℃, 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 15 ℃, 16 ℃, 17 ℃, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응 온도(또는 본 발명의 임의의 반응 온도)는 적어도, 적어도 약, 최대, 또는 최대 약 1 ℃, 2 ℃, 3 ℃, 4 ℃, 5 ℃, 6 ℃, 7 ℃, 8 ℃, 9 ℃, 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 15 ℃, 16 ℃, 17 ℃, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 예를 들어, 제1 온도는 적어도 37 ℃ 내지 적어도 58 ℃일 수 있다.
제1 반응에서의 제1 핵산(104)의 농도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 반응(또는 본 발명의 임의의 반응)에서의 제1 핵산(또는 본 발명의 임의의 핵산)의 농도는 정확히 또는 약 0.01 nM, 0.02 nM, 0.03 nM, 0.04 nM, 0.05 nM, 0.06 nM, 0.07 nM, 0.08 nM, 0.09 nM, 0.1 nM, 0.2 nM, 0.3 nM, 0.4 nM, 0.5 nM, 0.6 nM, 0.7 nM, 0.8 nM, 0.9 nM, 1 nM, 2 nM, 3 nM, 4 nM, 5 nM, 6 nM, 7 nM, 8 nM, 9 nM, 10 nM, 20 nM, 30 nM, 40 nM, 50 nM, 60 nM, 70 nM, 80 nM, 90 nM, 100 nM, 200 nM, 300 nM, 400 nM, 500 nM, 600 nM, 700 nM, 800 nM, 900 nM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응(또는 본 발명의 임의의 반응)에서의 제1 핵산(또는 본 발명의 임의의 핵산)의 농도는 적어도, 적어도 약, 최대, 또는 최대 약 0.01 nM, 0.02 nM, 0.03 nM, 0.04 nM, 0.05 nM, 0.06 nM, 0.07 nM, 0.08 nM, 0.09 nM, 0.1 nM, 0.2 nM, 0.3 nM, 0.4 nM, 0.5 nM, 0.6 nM, 0.7 nM, 0.8 nM, 0.9 nM, 1 nM, 2 nM, 3 nM, 4 nM, 5 nM, 6 nM, 7 nM, 8 nM, 9 nM, 10 nM, 20 nM, 30 nM, 40 nM, 50 nM, 60 nM, 70 nM, 80 nM, 90 nM, 100 nM, 200 nM, 300 nM, 400 nM, 500 nM, 600 nM, 700 nM, 800 nM, 900 nM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 또는 100 μM이다. 예를 들어, 제1 반응에서의 제1 핵산(104)의 농도는 적어도 10 nM일 수 있다.
제1 반응에서 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 농도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 반응(또는 본 발명의 임의의 반응)에서의 제1 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오티드 트라이포스페이트)의 농도는 정확히 또는 약 0.001 μM, 0.002 μM, 0.003 μM, 0.004 μM, 0.005 μM, 0.006 μM, 0.007 μM, 0.008 μM, 0.009 μM, 0.01 μM, 0.02 μM, 0.03 μM, 0.04 μM, 0.05 μM, 0.06 μM, 0.07 μM, 0.08 μM, 0.09 μM, 0.1 μM, 0.2 μM, 0.3 μM, 0.4 μM, 0.5 μM, 0.6 μM, 0.7 μM, 0.8 μM, 0.9 μM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응(또는 본 발명의 임의의 반응)에서의 제1 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오티드 트라이포스페이트)의 농도는 적어도, 적어도 약, 최대, 또는 최대 약 0.001 μM, 0.002 μM, 0.003 μM, 0.004 μM, 0.005 μM, 0.006 μM, 0.007 μM, 0.008 μM, 0.009 μM, 0.01 μM, 0.02 μM, 0.03 μM, 0.04 μM, 0.05 μM, 0.06 μM, 0.07 μM, 0.08 μM, 0.09 μM, 0.1 μM, 0.2 μM, 0.3 μM, 0.4 μM, 0.5 μM, 0.6 μM, 0.7 μM, 0.8 μM, 0.9 μM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 또는 100 μM이다. 예를 들어, 제1 반응에서의 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 농도는 적어도 0.1 μM일 수 있다.
제1 반응에서의 재조합 TdT(112)의 농도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 반응에서의 재조합 TdT의 농도는 정확히 또는 약 0.01 nM, 0.02 nM, 0.03 nM, 0.04 nM, 0.05 nM, 0.06 nM, 0.07 nM, 0.08 nM, 0.09 nM, 0.1 nM, 0.2 nM, 0.3 nM, 0.4 nM, 0.5 nM, 0.6 nM, 0.7 nM, 0.8 nM, 0.9 nM, 1 nM, 2 nM, 3 nM, 4 nM, 5 nM, 6 nM, 7 nM, 8 nM, 9 nM, 10 nM, 20 nM, 30 nM, 40 nM, 50 nM, 60 nM, 70 nM, 80 nM, 90 nM, 100 nM, 200 nM, 300 nM, 400 nM, 500 nM, 600 nM, 700 nM, 800 nM, 900 nM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응에서의 재조합 TdT의 농도는 적어도, 적어도 약, 최대, 또는 최대 약 0.01 nM, 0.02 nM, 0.03 nM, 0.04 nM, 0.05 nM, 0.06 nM, 0.07 nM, 0.08 nM, 0.09 nM, 0.1 nM, 0.2 nM, 0.3 nM, 0.4 nM, 0.5 nM, 0.6 nM, 0.7 nM, 0.8 nM, 0.9 nM, 1 nM, 2 nM, 3 nM, 4 nM, 5 nM, 6 nM, 7 nM, 8 nM, 9 nM, 10 nM, 20 nM, 30 nM, 40 nM, 50 nM, 60 nM, 70 nM, 80 nM, 90 nM, 100 nM, 200 nM, 300 nM, 400 nM, 500 nM, 600 nM, 700 nM, 800 nM, 900 nM, 1 μM, 2 μM, 3 μM, 4 μM, 5 μM, 6 μM, 7 μM, 8 μM, 9 μM, 10 μM, 20 μM, 30 μM, 40 μM, 50 μM, 60 μM, 70 μM, 80 μM, 90 μM, 또는 100 μM이다. 예를 들어, 제1 반응에서의 재조합 TdT(112)의 농도는 적어도 0.1 μM일 수 있다.
추가의 뉴클레오티드 및 뉴클레오시드 트라이포스페이트
일부 실시 형태에서, 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 제2 뉴클레오시드 트라이포스페이트(예를 들어, 뉴클레오티드 트라이포스페이트(108nst_u))를 제공하는 단계를 포함한다. 블록(116a)에서 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 재조합 TdT와 접촉시키는 단계는 제1 핵산, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 제2 뉴클레오시드 트라이포스페이트를 블록(116a)에서 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 TdT와 접촉시켜 제2 핵산(120c)을 생성하는 단계를 포함할 수 있다. 제2 핵산(120s)은 (i) 제1 뉴클레오시드 트라이포스페이트로부터의 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드(108nst_m) 및 (ii) 하나 이상의 제2 뉴클레오티드(예를 들어, 비변형된 염기를 갖는 뉴클레오티드(108nt_u))가 도입된 제1 핵산(104)을 포함할 수 있다.
일부 실시 형태에서, 하나 이상의 제2 뉴클레오티드 각각은 제2 뉴클레오시드 트라이포스페이트로부터의 제2 변형된 염기를 포함한다. 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함할 수 있다. 제2 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오시드 트라이포스페이트)는, 예를 들어 5-(15-아지도-4,7,10,13-테트라옥사-펜타데카노일-아미노알릴)-2'-데옥시우리딘-5'-트라이포스페이트(아지드-PEG4-아미노알릴-dUTP), N6-(6-아지도)헥실-3'-데옥시아데노신-5'-트라이포스페이트(N6-(6-아지도)헥실-3'-dATP), 또는 이들의 조합을 포함할 수 있다.
일부 실시 형태에서, 제2 뉴클레오시드 트라이포스페이트는 제2 변형된 염기 및 제2 부속 올리고뉴클레오티드(예를 들어, P7 어댑터 올리고뉴클레오티드, 또는 P5 어댑터 올리고뉴클레오티드)를 포함한다. 제2 뉴클레오시드 트라이포스페이트는 공유 연결된 제2 변형된 염기 및 제2 부속 올리고뉴클레오티드를 포함할 수 있다.
제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기와 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 동일한 비변형된 염기의 변형, 예컨대 아데닌(또는 구아닌, 시토신, 티민, 또는 우라실)의 변형을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기와 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 상이한 비변형된 염기의 변형, 예컨대 아데닌 및 구아닌의 변형을 포함할 수 있다.
일부 실시 형태에서, 제2 뉴클레오티드 각각은 제2 뉴클레오시드 트라이포스페이트(예를 들어, 비변형된 염기를 갖는 뉴클레오시드 트라이포스페이트(108nst_u))로부터의 제2 비변형된 염기를 포함한다. 제2 뉴클레오시드 트라이포스페이트의 제2 비변형된 염기는 아데닌, 구아닌, 시토신, 티민, 또는 우라실을 포함할 수 있다. 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기는 제2 비변형된 염기의 변형을 포함할 수 있다. 예를 들어, 제1 뉴클레오시드 트라이포스페이트(108nst_m)는 변형된 아데닌을 포함할 수 있고, 제2 뉴클레오시드 트라이포스페이트는 아데닌을 포함할 수 있다.
제1 반응에서 제1 뉴클레오시드 트라이포스페이트(108nst_m)(또는 본 발명의 임의의 뉴클레오시드 트라이포스페이트, 예컨대 제2 뉴클레오시드 트라이포스페이트)인 총 뉴클레오시드 트라이포스페이트의 백분율은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 반응에서 제1 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오시드 트라이포스페이트)인 총 뉴클레오시드 트라이포스페이트의 백분율은 정확히 또는 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 반응에서 제1 뉴클레오시드 트라이포스페이트(또는 본 발명의 임의의 뉴클레오시드 트라이포스페이트)인 총 뉴클레오시드 트라이포스페이트의 백분율은 적어도, 적어도 약, 최대, 또는 최대 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 99.9%이다.
제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)와 제2 뉴클레오시드 트라이포스페이트(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)는 상이한 실시 형태에서 상이한 비로 제1 핵산(104)과 접촉될 수 있다. 일부 실시 형태에서, 제1 핵산과 접촉되는, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트와 제2 뉴클레오시드 트라이포스페이트(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)의 비는 정확히 또는 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1000:1, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 핵산과 접촉되는, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트와 제2 뉴클레오시드 트라이포스페이트(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)의 비는 적어도, 적어도 약, 최대, 또는 최대 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1이다. 예를 들어, 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)와 제2 뉴클레오시드 트라이포스페이트는 약 1:100 내지 약 100:1 범위의 비로 제1 핵산(104)과 접촉된다.
제1 변형된 염기를 포함하는 제1 뉴클레오티드(108nt_m)와 제2 뉴클레오티드(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)는 상이한 실시 형태에서 상이한 비로 제2 핵산(120s) 내에 도입될 수 있다. 일부 실시 형태에서, 제2 핵산 내에 도입된, 제1 변형된 염기를 포함하는 제1 뉴클레오티드와 제2 뉴클레오티드(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)의 비는 정확히 또는 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1000:1, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산 내에 도입된, 제1 변형된 염기를 포함하는 제1 뉴클레오티드와 제2 뉴클레오티드(또는, 모두 제2 뉴클레오시드 트라이포스페이트를 포함한, 2개 이상의 제2 뉴클레오시드 트라이포스페이트)의 비는 적어도, 적어도 약, 최대, 또는 최대 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1이다. 예를 들어, 제1 변형된 염기를 포함하는 제1 뉴클레오티드(108nt_m)와 제2 뉴클레오티드(예를 들어, 108nt_u)는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산(120s) 내로 도입될 수 있다.
일부 실시 형태에서, 제1 핵산(104), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)를 제공하는 단계는 제1 핵산(104), 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m), 및 복수의 제2 뉴클레오시드 트라이포스페이트들을 제공하는 단계를 포함한다. 작업(116a)에서 제1 핵산(104), 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m)를 재조합 TdT(112)와 접촉시키는 단계는 제1 핵산(104), 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트(108nst_m), 및 복수의 제2 뉴클레오시드 트라이포스페이트들을 1116a에서 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 TdT(112)와 접촉시켜 제2 핵산(120s)을 생성하는 단계를 포함할 수 있다. 제2 핵산(120s)은 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드(1108nt_m) 및 복수의 제2 뉴클레오시드 트라이포스페이트들로부터의 하나 이상의 제2 뉴클레오티드가 도입된 제1 핵산(104)을 포함할 수 있다.
일부 실시 형태에서, 복수의 제2 뉴클레오시드 트라이포스페이트들은 데옥시리보스 아데닌 트라이포스페이트, 데옥시리보스 구아닌 트라이포스페이트, 데옥시리보스 시토신 트라이포스페이트, 데옥시리보스 티민 트라이포스페이트, 데옥시리보스 우라실 트라이포스페이트, 또는 이들의 조합을 포함한다. 각각이 제2 비변형된 염기를 포함하는 복수의 뉴클레오시드 트라이포스페이트들의 제2 뉴클레오시드 트라이포스페이트의 수는 상이한 실시 형태에서 상이할 수 있으며, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위일 수 있다. 예를 들어, 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 비변형된 염기를 포함할 수 있다. 각각이 제2 변형된 염기를 포함하는 복수의 뉴클레오시드 트라이포스페이트들의 제2 뉴클레오시드 트라이포스페이트의 수는 상이한 실시 형태에서 상이할 수 있으며, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위일 수 있다. 예를 들어, 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 변형된 염기를 포함할 수 있다. 각각이 제2 변형된 염기를 포함하는 제2 뉴클레오시드 트라이포스페이트들과 각각이 제2 비변형된 염기를 포함하는 제2 뉴클레오시드 트라이포스페이트들의 비는 상이한 실시 형태에서 상이할 수 있으며, 예를 들어 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1일 수 있다.
복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개가 상이한 실시 형태에서 상이한 비로 제1 핵산(104)과 접촉될 수 있다. 일부 실시 형태에서, 제1 핵산과 접촉되는 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개의 비는 정확히 또는 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1000:1, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제1 핵산과 접촉되는 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개의 비는 적어도, 적어도 약, 최대, 또는 최대 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1이다. 예를 들어, 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 제1 핵산과 접촉될 수 있다.
복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개는 상이한 실시 형태에서 상이한 비로 제2 핵산(120s) 내에 도입될 수 있다. 일부 실시 형태에서, 제2 핵산 내에 도입된 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개의 비는 정확히 또는 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1000:1, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산 내에 도입된 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개의 비는 적어도, 적어도 약, 최대, 또는 최대 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1이다. 예를 들어, 제2 뉴클레오티드들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산 내로 도입될 수 있다.
뉴클레오티드의 변형된 염기와 비변형된 염기는 상이한 실시 형태에서 상이한 비로 제2 핵산(120c) 내로 도입될 수 있다. 일부 실시 형태에서, 뉴클레오티드의 변형된 염기와 비변형된 염기는 정확히 또는 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1000:1, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 비로 제2 핵산(120c) 내로 도입될 수 있다. 일부 실시 형태에서, 뉴클레오티드의 변형된 염기와 비변형된 염기는 적어도, 적어도 약, 최대, 또는 최대 약 1:1000, 1:900, 1:800, 1:700, 1:600, 1:500, 1:400, 1:300, 1:200, 1:100, 1:90, 1:80, 1:70, 1:60, 1:50, 1:40, 1:30, 1:20, 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 또는 1000:1의 비로 제2 핵산 내로 도입될 수 있다. 예를 들어, 변형된 염기와 비변형된 염기는 약 1:100 내지 약 100:1 범위의 비로 제2 핵산 내로 도입될 수 있다. 변형된 염기는 제2 핵산 내로 도입된 제1 변형된 염기, 및/또는 복수의 제2 뉴클레오티드들 중 적어도 하나(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개) 또는 각각의 염기를 포함할 수 있다. 비변형된 염기는 제2 핵산 내로 도입된 복수의 제2 뉴클레오티드들 중 적어도 하나 또는 각각의 염기를 포함할 수 있다.
변형된 염기를 포함하는 제2 핵산(120s)의 뉴클레오티드 염기의 백분율은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 변형된 염기(또는 비변형된 염기)를 포함하는 제2 핵산의 뉴클레오티드 염기의 백분율은 정확히 또는 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.9%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 변형된 염기(또는 비변형된 염기)를 포함하는 제2 핵산의 뉴클레오티드 염기의 백분율은 적어도, 적어도 약, 최대, 또는 최대 약 0.001%, 0.002%, 0.003%, 0.004%, 0.005%, 0.006%, 0.007%, 0.008%, 0.009%, 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.9%이다. 예를 들어, 제2 핵산의 뉴클레오티드 염기의 적어도 1%는 변형된 염기를 포함한다. 예를 들어, 제2 핵산의 뉴클레오티드 염기의 적어도 1%는 제1 변형된 염기를 포함한다. 변형된 염기들은 제2 핵산 전체에 걸쳐 분포될 수 있다. 변형된 염기들은 제2 핵산 전체에 걸쳐 랜덤하게 분포될 수 있다.
제2 핵산(120c)은 연속적인 변형된(또는 비변형된) 염기들의 다수의 영역(들)을 포함할 수 있다. 일부 실시 형태에서, 제2 핵산(120c) 내의 연속적인 변형된(또는 비변형된) 염기들의 영역(들)의 수는 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산(120c) 내의 연속적인 변형된(또는 비변형된) 염기들의 영역(들)의 수는 적어도, 적어도 약, 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 또는 10000이다. 제2 핵산(120c) 내의 연속적인 변형된(또는 비변형된) 염기들의 영역의 길이는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제2 핵산 내의 연속적인 변형된(또는 비변형된) 염기들의 영역의 길이는 정확히 또는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 핵산 내의 연속적인 변형된(또는 비변형된) 염기들의 영역의 길이는 적어도, 적어도 약, 최대, 또는 최대 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 또는 10000이다. 예를 들어, 제2 핵산(120c)은 복수의 연속적인 변형된 염기들, 예컨대 2개 이상 또는 3개 이상의 연속적인 변형된 염기들을 포함할 수 있다.
담체
도 1을 참고하면, 제1 핵산(104)은 핵산 주형(128)에 결합할(혼성화될) 수 있는 주형 포획 부위(104tcs)를 포함할 수 있다. 주형 포획 부위(104tcs)는 주형 포획 서열을 포함할 수 있다. 핵산 주형(128)은 주형 포획 서열에 혼성화될 수 있는 서열을 포함할 수 있다. 주형 포획 서열, 및 주형 포획 서열의 역방향 상보체에 혼성화될 수 있는 핵산 주형(128)의 서열은 상이한 실시 형태에서 상이한 서열 동일성을 가질 수 있다. 일부 실시 형태에서, 주형 포획 서열, 및 주형 포획 서열의 역방향 상보체에 혼성화될 수 있는 핵산 주형의 서열은 정확히 또는 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 서열 동일성을 갖는다. 일부 실시 형태에서, 주형 포획 서열, 및 주형 포획 서열의 역방향 상보체에 혼성화될 수 있는 핵산 주형의 서열은 적어도, 적어도 약, 최대, 또는 최대 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다. 예를 들어, 핵산 주형(128)은 주형 포획의 역방향 상보체와 적어도 90%의 서열 동일성을 갖는 서열을 포함할 수 있다. 핵산 주형(128)은 단일 가닥 핵산, 예컨대 단일 가닥 DNA를 포함할 수 있다.
일부 실시 형태에서, 제2 핵산(120s) 내에 도입된 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기 및 제1 뉴클레오티드(108nt_m) 중 하나 이상은 작용 모이어티(108fm)를 포함한다. 제1 변형된 염기의 작용 모이어티(108fm)는 클릭 화학 반응에 참여할 수 있다. 제2 핵산(120s) 내의 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기 및 제1 뉴클레오티드(108nt_m)는 제1 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬을 포함할 수 있다. 제1 변형된 염기의 작용 모이어티와 염기는 제1 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬에 의해 공유 연결된 제1 변형된 염기의 2개의 말단 상에 존재할 수 있다. 예를 들어, 제1 뉴클레오시드 트라이포스페이트는 5-(15-아지도-4,7,10,13-테트라옥사-펜타데카노일-아미노알릴)-2'-데옥시우리딘-5'-트라이포스페이트(아지드-PEG4-아미노알릴-dUTP) 또는 N6-(6-아지도)헥실-2'데옥시-아데노신-5'-트라이포스페이트(N6-(6-아지도)헥실-dATP)일 수 있다.
제2 핵산(120s) 내에 도입된 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기 및 제2 뉴클레오티드 중 하나 이상은 작용 모이어티를 포함할 수 있다. 제2 변형된 염기의 작용 모이어티는 클릭 화학 반응에 참여할 수 있다. 제2 핵산(120s) 내의 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기 및 제2 뉴클레오티드는 제2 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬을 포함할 수 있다. 제2 변형된 염기의 작용 모이어티와 염기는 제2 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬에 의해 공유 연결된 제2 변형된 염기의 2개의 말단 상에 존재할 수 있다.
지방족 탄소 사슬은 변형된 염기(예를 들어, 제2 핵산(120s) 내의 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기 및 제1 뉴클레오티드(108nt_m), 또는 제2 핵산(120s) 내의 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기 및 제2 뉴클레오티드)의 염기에 공유 연결될(예를 들어, 단일 결합, 이중 결합, 또는 삼중 결합에 의해, 또는 접합될) 수 있다. 작용 모이어티(예를 들어, 제1 작용 모이어티(108fm) 또는 제2 작용 모이어티)는 단일 결합, 이중 결합, 또는 삼중 결합에 의해 지방족 탄소 사슬에 의해 공유 연결될 수 있다.
지방족 탄소 사슬은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 지방족 탄소 사슬은 포화된다. 일부 실시 형태에서, 지방족 탄소 사슬은 불포화된다. 일부 실시 형태에서, 지방족 탄소 사슬은 치환된다. 일부 실시 형태에서, 지방족 탄소 사슬은 비치환된다. 일부 실시 형태에서, 지방족 탄소 사슬은 직쇄이다. 일부 실시 형태에서, 지방족 탄소 사슬은 분지형이다. 일부 실시 형태에서, 지방족 탄소 사슬의 길이는 정확히 또는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 지방족 탄소 사슬의 길이는 적어도, 적어도 약, 최대, 또는 최대 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000이다. 지방족 탄소 사슬은 폴리에틸렌 글리콜(PEG)을 포함할 수 있다. 일부 실시 형태에서, PEG는 에틸렌 글리콜(-OCH2CH2-) 반복 단위의 수, n이 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, PEG는 에틸렌 글리콜(-OCH2CH2-) 반복 단위의 수, n이 적어도, 적어도 약, 또는 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100이다.
제2 핵산(120s) 내에 도입된 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기 및 제1 뉴클레오티드(108nt_m)의 108fm의 작용 모이어티와 제2 핵산(120s) 내에 도입된 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기 및 제2 뉴클레오티드의 작용 모이어티는 동일하거나 상이할 수 있다. 제2 핵산(120s) 내에 도입된 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개의 변형된 염기와 제2 뉴클레오티드의 작용 모이어티들은 동일하거나 상이할 수 있다. 제2 핵산(120s) 내에 도입된 복수의 제2 뉴클레오시드 트라이포스페이트들 중 전부의 변형된 염기와 제2 뉴클레오티드의 작용 모이어티들은 동일하거나 상이할 수 있다.
상기 방법은 제1 부속 올리고뉴클레오티드(124ao1)(예를 들어, P5 어댑터 올리고뉴클레오티드), 또는 제1 부속 올리고뉴클레오티드(124ao1)를 포함하는 제1 부속물을 제공하는 단계를 포함한다. 상기 방법은, 작업(116c)에서, 제2 핵산(120s)을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속 올리고뉴클레오티드(124ao1)와 접촉시켜, 하나 이상의 제1 부속 올리고뉴클레오티드(124ao1)에 부착된 제2 핵산(120c)을 포함하는 제3 핵산(120c)(예를 들어, 담체)을 생성하는 단계를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao1)를 제공하는 단계는 제1 부속 올리고뉴클레오티드(124ao1) 및 제2 부속 올리고뉴클레오티드(124ao2)(예를 들어, P7 어댑터 올리고뉴클레오티드), 또는 제2 부속 올리고뉴클레오티드(124ao2)를 포함하는 제2 부속물을 제공하는 단계를 포함한다. 제2 핵산(120s)을 제1 부속 올리고뉴클레오티드(124ao1)와 접촉시키는 단계는 제2 핵산(120s)을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속 올리고뉴클레오티드(124ao1) 및 제2 부속 올리고뉴클레오티드(124ao2)와 접촉시켜, 하나 이상의 제1 부속 올리고뉴클레오티드(124ao1) 및 하나 이상의 제2 부속 올리고뉴클레오티드(124ao2)에 부착된 제2 핵산(120s)을 포함하는 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드를 제공하는 단계는 제1 부속 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함하는 제1 부속물을 제공하는 단계를 포함한다. 제2 핵산(120s)을 제1 부속 올리고뉴클레오티드(124ao1)와 접촉시키는 단계는 제2 핵산(120s)을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속물과 접촉시켜, 하나 이상의 제1 부속물에 부착된 제2 핵산(120s)을 포함하는 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)를 제공하는 단계는 제2 부속 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함하는 제2 부속물을 제공하는 단계를 포함할 수 있다. 제2 핵산(120s)을 제2 부속물과 접촉시키는 단계는 제2 핵산(120s)과 제2 부속물을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 접촉시켜, 하나 이상의 제2 부속물에 부착된 제2 핵산(120s)을 포함하는 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다. 제1 부속물은 공유 연결된 제1 부속 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함할 수 있다. 제2 부속물은 공유 연결된 제2 부속 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함할 수 있다.
임의의 부속 올리고뉴클레오티드가 부착되거나 부착되지 않은 제3 핵산(128c)(또는 본 발명의 임의의 핵산)의 치수(예를 들어, 직경)는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제3 핵산(또는 본 발명의 임의의 핵산)의 치수는 정확히 또는 약 0.4 nm, 0.5 nm, 0.6 nm, 0.7 nm, 0.8 nm, 0.9 nm, 1 nm, 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, 900 nm, 1000 nm, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제3 핵산(또는 본 발명의 임의의 핵산)의 치수는 적어도, 적어도 약, 최대, 또는 최대 약 0.04 nm, 0.05 nm, 0.06 nm, 0.07 nm, 0.08 nm, 0.09 nm, 0.1 nm, 0.2 nm, 0.3 nm, 0.4 nm, 0.5 nm, 0.6 nm, 0.7 nm, 0.8 nm, 0.9 nm, 1 nm, 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, 900 nm, 또는 1000 nm이다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao2)는 제1 어댑터 서열(124as1) 또는 이의 역방향 상보체를 포함한다. 제2 부속 올리고뉴클레오티드는 제2 어댑터 서열(124as2) 또는 이의 역방향 상보체를 포함할 수 있다. 일부 실시 형태에서, 제1 어댑터 서열은 P5 서열을 포함한다. 제2 어댑터 서열은 P7 서열을 포함할 수 있다.
제1 부속 올리고뉴클레오티드(예를 들어, 제1 부속 올리고뉴클레오티드(124ao1) 또는 제1 뉴클레오티드 트라이포스페이트(108nst_m) 내의 제1 부속 올리고뉴클레오티드), 제2 부속 올리고뉴클레오티드(예를 들어, 제2 부속 올리고뉴클레오티드(124ao2) 또는 제2 뉴클레오티드 트라이포스페이트 내의 제2 부속 올리고뉴클레오티드), 또는 본 발명의 임의의 올리고뉴클레오티드의 길이는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(또는 제2 부속 올리고뉴클레오티드, 또는 본 발명의 임의의 올리고뉴클레오티드)의 길이는 정확히 또는 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 개수의 뉴클레오티드이다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(또는 제2 부속 올리고뉴클레오티드, 또는 본 발명의 임의의 올리고뉴클레오티드)의 길이는 적어도, 적어도 약, 최대, 또는 최대 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000개의 뉴클레오티드이다. 예를 들어, 제1 부속 올리고뉴클레오티드 및/또는 제2 부속 올리고뉴클레오티드 각각은 약 10개의 뉴클레오티드 길이 내지 약 100개의 뉴클레오티드 길이일 수 있다.
제3 핵산(120c)은 하나 이상의 제1 부속 올리고뉴클레오티드(124ao1)에 부착된 제2 핵산(120s)을 포함할 수 있다. 제3 핵산(120c)은 하나 이상의 제2 부속 올리고뉴클레오티드에 부착된 제2 핵산(120s)을 포함할 수 있다. 제3 핵산(120c)은 상이한 실시 형태에서 상이한 수의 제1 부속 올리고뉴클레오티드 또는 제2 부속 올리고뉴클레오티드를 포함할 수 있다. 일부 실시 형태에서, 제3 핵산은 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 10000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 개수의 제1 부속 올리고뉴클레오티드 또는 제2 부속 올리고뉴클레오티드를 포함한다. 일부 실시 형태에서, 제3 핵산은 적어도, 적어도 약, 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 9000000, 또는 10000000개의 제1 부속 올리고뉴클레오티드 또는 제2 부속 올리고뉴클레오티드를 포함한다. 예를 들어, 제3 핵산은 약 10 내지 약 1000000개의 제1 부속 올리고뉴클레오티드를 포함할 수 있다. 예를 들어, 제3 핵산은 약 10 내지 약 1,000,000개의 제2 부속 올리고뉴클레오티드를 포함할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드를 제공하는 단계는 제1 부속 올리고뉴클레오티드 및 제1 중합체를 포함하는 제1 부속물을 제공하는 단계를 포함한다. 제2 핵산을 제1 부속 올리고뉴클레오티드와 접촉시키는 단계는 제2 핵산을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속물과 접촉시켜, 하나 이상의 제1 부속물에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다. 제2 부속 올리고뉴클레오티드를 제공하는 단계는 제2 중합체와 함께 제2 부속 올리고뉴클레오티드를 포함하는 제2 부속물을 제공하는 단계를 포함할 수 있다. 제2 핵산을 제2 부속물과 접촉시키는 단계는 제2 핵산과 제2 부속물을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 접촉시켜, 하나 이상의 제2 부속물에 부착된 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 포함할 수 있다. 제1 부속물은 공유 연결된 제1 부속 올리고뉴클레오티드 및 제1 중합체를 포함할 수 있다. 제2 부속물은 공유 연결된 제2 부속 올리고뉴클레오티드 및 제2 중합체를 포함할 수 있다.
도 1을 참조하면, 제1 부속 올리고뉴클레오티드(124ao1)는 제1 작용 모이어티(124fm1)를 포함한다. 제2 부속 올리고뉴클레오티드(124ao2)는 제2 작용 모이어티(124fm2)를 포함할 수 있다. 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제1 부속 올리고뉴클레오티드(124ao1)의 5' 말단 상에 존재할 수 있다. 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제1 부속 올리고뉴클레오티드(124ao1)의 뉴클레오티드간 결합에 부착될 수 있다. 제1 부속 올리고뉴클레오티드 내의 뉴클레오티드의 변형된 염기는 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)를 포함할 수 있다. 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제1 부속 올리고뉴클레오티드(124ao1)의 뉴클레오티드의 당에 부착될 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제2 부속 올리고뉴클레오티드(124ao2)의 5' 말단 상에 존재할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제2 부속 올리고뉴클레오티드(124ao2)의 뉴클레오티드간 결합에 부착될 수 있다. 제2 부속 올리고뉴클레오티드 내의 뉴클레오티드의 변형된 염기는 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)를 포함할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제2 부속 올리고뉴클레오티드(124ao2)의 뉴클레오티드의 당에 부착될 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)와 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 동일하다. 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제1 뉴클레오티드(108nt_m)의 제1 변형된 염기의 작용 모이어티(108fm)와 반응하여 공유 결합을 형성할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제1 뉴클레오티드(108nt_m)의 제1 변형된 염기의 작용 모이어티(108fm)와 반응하여 공유 결합을 형성할 수 있다. 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 클릭 화학 반응에 참여할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 클릭 화학 반응에 참여할 수 있다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1)는 제2 핵산 내에 도입된 제1 뉴클레오티드(128nt_m)의 제1 변형된 염기의 작용 모이어티(108fm)(또는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티)와의 클릭 화학 반응에 참여할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)의 제2 작용 모이어티(124fm2)는 제1 뉴클레오티드(108nt_m)의 제1 변형된 염기의 작용 모이어티(108fm)(또는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티)와의 클릭 화학 반응에 참여할 수 있다.
일부 실시 형태에서, 제1 부속 올리고뉴클레오티드(124ao1)의 제1 작용 모이어티(124fm1), 제2 부속 올리고뉴클레오티드(124ao1)의 제2 작용 모이어티(124fm2), 제1 뉴클레오시드 트라이포스페이트(108nst_m)의 제1 변형된 염기의 작용 모이어티(108fm), 제1 뉴클레오티드(108nt_m)의 작용 모이어티(108fm), 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기의 작용 모이어티, 및 제2 뉴클레오티드의 작용 모이어티는 독립적으로 아지드, 알키닐, 알케닐, 티올, 니트론, 또는 이들의 조합이다. 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 제1 부속 올리고뉴클레오티드의 제1 작용 모이어티, 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 제2 부속 올리고뉴클레오티드의 제2 작용 모이어티, 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티와 제1 부속 올리고뉴클레오티드의 제1 작용 모이어티, 및/또는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티와 제2 부속 올리고뉴클레오티드의 제2 작용 모이어티는 독립적으로 하기 쌍으로부터 선택될 수 있다: (i) 아지도/알키닐; (ii) 알키닐/아지도; (iii) 티올/알키닐; (iv) 알키닐/티올; (v) 알케닐/티올; (vi) 티올/알케닐; (vii) 아지도/사이클로옥티닐; (viii) 사이클로옥티닐/아지도; (ix) 니트론/사이클로옥티닐; 및 (x) 사이클로옥티닐/니트론. 예를 들어, 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티 및/또는 제2 뉴클레오티드의 제2 변형된 염기의 작용 모이어티는 독립적으로 아지도일 수 있다. 제1 부속 올리고뉴클레오티드의 제1 작용 모이어티 및/또는 제2 부속 올리고뉴클레오티드의 제2 작용 모이어티는 독립적으로 알키닐일 수 있다.
일부 실시 형태에서, 클릭 화학 반응은 구리 촉매된 아지드-알킨 부가환화(CuAAC)를 포함한다. 공유 결합은 트라이아졸릴을 포함할 수 있다. CuAAC는 Cu(I) 안정화 리간드를 포함할 수 있다. Cu(I) 안정화 리간드는 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)- 1H-1,2,3-트라이아졸-1-일]프로판올(BTTP), 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]프로필 하이드로겐 설페이트(BTTPS), 2-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]에틸 하이드로겐 설페이트(BTTES), 2-[4-{(비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노)메틸}-1H-1,2,3-트라이아졸-1-일]-아세트산(BTTAA), 바토페난트롤린 다이설포네이트 다이소듐 염(BPS), N,N,N′,N",N"-펜타메틸다이에틸렌트라이아민(PMDETA), 트리스-((1-벤질-1H-1,2,3-트라이아졸-4-일)메틸)아민(TBTA), 트리스(3-하이드록시프로필트라이아졸릴메틸)아민(THPTA), Nε-((1R,2R)-2-아지도사이클로펜틸옥시)카르보닐)-L-라이신(ACPK), 및 4-N,N-다이메틸 아미노-1,8-나프탈이미드(4-DMN)로 이루어진 군으로부터 선택될 수 있다.
일부 실시 형태에서, 클릭 화학 반응은 변형-촉진된 아지드-알킨 부가환화(SPAAC)를 포함한다. 공유 결합은 사이클로옥타-트라이아졸릴을 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 알킨 하이드로티올화를 포함한다. 공유 결합은 알케닐 설파이드를 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 알켄 하이드로티올화를 포함한다. 공유 결합은 알킬 설파이드를 포함할 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 변형-촉진된 알킨-니트론 부가환화(SPANC)를 포함한다. 공유 결합은 옥타하이드로사이클로옥타-아이소옥사졸릴을 포함할 수 있다. 사이클로옥티닐은 다이벤질사이클로옥틴(DBCO) 또는 이들의 유도체일 수 있다. 일부 실시 형태에서, 클릭 화학 반응은 생체적합성이다.
제2 핵산(120s)이 상호작용(116c)에서 제2 반응에서 제1 부속 올리고뉴클레오티드(124ao1) 및/또는 제2 부속 올리고뉴클레오티드(124ao2)와 접촉되는 제2 온도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 제2 온도는 정확히 또는 약 -90 ℃, -89 ℃, -88 ℃, -87 ℃, -86 ℃, -85 ℃, -84 ℃, -83 ℃, -82 ℃, -81 ℃, -80 ℃, -79 ℃, -78 ℃, -77 ℃, -76 ℃, -75 ℃, -74 ℃, -73 ℃, -72 ℃, -71 ℃, -70 ℃, -69 ℃, -68 ℃, -67 ℃, -66 ℃, -65 ℃, -64 ℃, -63 ℃, -62 ℃, -61 ℃, -60 ℃, -59 ℃, -58 ℃, -57 ℃, -56 ℃, -55 ℃, -54 ℃, -53 ℃, -52 ℃, -51 ℃, -50 ℃, -49 ℃, -48 ℃, -47 ℃, -46 ℃, -45 ℃, -44 ℃, -43 ℃, -42 ℃, -41 ℃, -40 ℃, -39 ℃, -38 ℃, -37 ℃, -36 ℃, -35 ℃, -34 ℃, -33 ℃, -32 ℃, -31 ℃, -30 ℃, -29 ℃, -28 ℃, -27 ℃, -26 ℃, -25 ℃, -24 ℃, -23 ℃, -22 ℃, -21 ℃, -20 ℃, -19 ℃, -18 ℃, -17 ℃, -16 ℃, -15 ℃, -14 ℃, -13 ℃, -12 ℃, -11 ℃, -10 ℃, -9 ℃, -8 ℃, -7 ℃, -6 ℃, -5 ℃, -4 ℃, -3 ℃, -2 ℃, -1 ℃, 0 ℃, 1 ℃, 2 ℃, 3 ℃, 4 ℃, 5 ℃, 6 ℃, 7 ℃, 8 ℃, 9 ℃, 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 15 ℃, 16 ℃, 17 ℃, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 온도는 적어도, 적어도 약, 최대, 또는 최대 약 -90 ℃, -89 ℃, -88 ℃, -87 ℃, -86 ℃, -85 ℃, -84 ℃, -83 ℃, -82 ℃, -81 ℃, -80 ℃, -79 ℃, -78 ℃, -77 ℃, -76 ℃, -75 ℃, -74 ℃, -73 ℃, -72 ℃, -71 ℃, -70 ℃, -69 ℃, -68 ℃, -67 ℃, -66 ℃, -65 ℃, -64 ℃, -63 ℃, -62 ℃, -61 ℃, -60 ℃, -59 ℃, -58 ℃, -57 ℃, -56 ℃, -55 ℃, -54 ℃, -53 ℃, -52 ℃, -51 ℃, -50 ℃, -49 ℃, -48 ℃, -47 ℃, -46 ℃, -45 ℃, -44 ℃, -43 ℃, -42 ℃, -41 ℃, -40 ℃, -39 ℃, -38 ℃, -37 ℃, -36 ℃, -35 ℃, -34 ℃, -33 ℃, -32 ℃, -31 ℃, -30 ℃, -29 ℃, -28 ℃, -27 ℃, -26 ℃, -25 ℃, -24 ℃, -23 ℃, -22 ℃, -21 ℃, -20 ℃, -19 ℃, -18 ℃, -17 ℃, -16 ℃, -15 ℃, -14 ℃, -13 ℃, -12 ℃, -11 ℃, -10 ℃, -9 ℃, -8 ℃, -7 ℃, -6 ℃, -5 ℃, -4 ℃, -3 ℃, -2 ℃, -1 ℃, 0 ℃, 1 ℃, 2 ℃, 3 ℃, 4 ℃, 5 ℃, 6 ℃, 7 ℃, 8 ℃, 9 ℃, 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 15 ℃, 16 ℃, 17 ℃, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 또는 90 ℃이다. 예를 들어, 제2 온도는 약 20 ℃ 내지 약 65 ℃이다. 예를 들어, 제2 온도는 0 ℃ 미만일 수 있다. 예를 들어, 제2 온도는 약 -4 ℃ 내지 약 -20 ℃일 수 있다.
제2 핵산(120s)이 상호작용(116c)에서 제2 반응에서 제1 부속 올리고뉴클레오티드(124ao1) 및/또는 제2 부속 올리고뉴클레오티드(124ao2)와 접촉되는 동안의 제2 반응 시간은 상이한 실시 형태에서 상이할 수 있다. 예를 들어, 제2 반응 시간은 적어도 10분(min)이다. 일부 실시 형태에서, 제2 반응 시간(또는 본 발명의 임의의 반응 시간)은 정확히 또는 약 1초(sec), 2초, 3초, 4초, 5초, 6초, 7초, 8초, 9초, 10초, 11초, 12초, 13초, 14초, 15초, 16초, 17초, 18초, 19초, 20초, 21초, 22초, 23초, 24초, 25초, 26초, 27초, 28초, 29초, 30초, 31초, 32초, 33초, 34초, 35초, 36초, 37초, 38초, 39초, 40초, 41초, 42초, 43초, 44초, 45초, 46초, 47초, 48초, 49초, 50초, 51초, 52초, 53초, 54초, 55초, 56초, 57초, 58초, 59초, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 11분, 12분, 13분, 14분, 15분, 16분, 17분, 18분, 19분, 20분, 21분, 22분, 23분, 24분, 25분, 26분, 27분, 28분, 29분, 30분, 31분, 32분, 33분, 34분, 35분, 36분, 37분, 38분, 39분, 40분, 41분, 42분, 43분, 44분, 45분, 46분, 47분, 48분, 49분, 50분, 51분, 52분, 53분, 54분, 55분, 56분, 57분, 58분, 59분, 60분, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 24시간, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 제2 반응 시간(또는 본 발명의 임의의 반응 시간)은 적어도, 적어도 약, 최대, 또는 최대 약 1초, 2초, 3초, 4초, 5초, 6초, 7초, 8초, 9초, 10초, 11초, 12초, 13초, 14초, 15초, 16초, 17초, 18초, 19초, 20초, 21초, 22초, 23초, 24초, 25초, 26초, 27초, 28초, 29초, 30초, 31초, 32초, 33초, 34초, 35초, 36초, 37초, 38초, 39초, 40초, 41초, 42초, 43초, 44초, 45초, 46초, 47초, 48초, 49초, 50초, 51초, 52초, 53초, 54초, 55초, 56초, 57초, 58초, 59초, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 11분, 12분, 13분, 14분, 15분, 16분, 17분, 18분, 19분, 20분, 21분, 22분, 23분, 24분, 25분, 26분, 27분, 28분, 29분, 30분, 31분, 32분, 33분, 34분, 35분, 36분, 37분, 38분, 39분, 40분, 41분, 42분, 43분, 44분, 45분, 46분, 47분, 48분, 49분, 50분, 51분, 52분, 53분, 54분, 55분, 56분, 57분, 58분, 59분, 60분, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 24시간, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다.
도 1을 참조하면, 상기 방법은 제1 어댑터 서열(124as1) 또는 이의 역방향 상보체, 및 제2 어댑터 서열(124as2) 또는 이의 역방향 상보체를 포함하는 핵산 주형(128)을 제공하는 단계를 포함할 수 있다. 상기 방법은 작업(116c)에서 제3 핵산(120c)을 핵산 주형(128)과 접촉시켜, 핵산 주형(128)이 제3 핵산(120c) 상의 주형 포획 부위(104tcs)에 혼성화된 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다. 상기 방법은, 작업(116d)에서, 핵산 주형(128)과 혼성화된 제3 핵산(120c) 상에서 증폭(예를 들어, 가교 증폭 또는 배제 증폭)을 수행하여, 핵산 주형(128)의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 하나 이상의 제1 부속 올리고뉴클레오티드(124ao1) 및 하나 이상의 제2 부속 올리고뉴클레오티드(124ao2)에 부착된 제3 핵산(120c)을 포함하는 제4 핵산(120n)(본 명세서에서 나노입자로 지칭됨)을 생성하는 단계를 포함할 수 있다. 상기 방법은 제4 핵산(120n)을 사용하여 핵산 주형(128)의 서열을 결정하는 단계를 포함할 수 있다.
나노입자(120n)(또는 제2 핵산(120s), 예컨대 스캐폴드, 또는 제3 핵산(120c), 예컨대 담체)의 치수(예를 들어, 직경)는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 나노입자(또는 제2 핵산 또는 제3 핵산)의 치수는 정확히 또는 약 0.4 nm, 0.5 nm, 0.6 nm, 0.7 nm, 0.8 nm, 0.9 nm, 1 nm, 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, 900 nm, 1000 nm, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 일부 실시 형태에서, 나노입자(또는 제2 핵산 또는 제3 핵산)의 치수는 적어도, 적어도 약, 최대, 또는 최대 약 0.4 nm, 0.5 nm, 0.6 nm, 0.7 nm, 0.8 nm, 0.9 nm, 1 nm, 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, 900 nm, 또는 1000 nm이다. 충분한 공간 치수를 갖는 나노입자는 기재(예를 들어, 플로우 셀) 상의 단일 웰을 점유할 수 있으며 - 이때 이러한 점유는 다른 나노입자가 입체 충돌 또는 장애에 의해 동일한 웰을 점유하는 것을 배재시킴으로써 가능함 -, 이에 따라 합성에 의한 서열분석에서 단일클론성을 가져오거나 단일클론성에 근접해질 수 있다.
중합체
일부 실시 형태에서, ssDNA 스캐폴드(120s)를 제1 어댑터 올리고뉴클레오티드(124ao1)와 접촉시키는 단계는 ssDNA 스캐폴드를 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함하는 제1 어댑터와 접촉시키는 단계를 포함한다. ssDNA 스캐폴드(120s)를 제2 어댑터 올리고뉴클레오티드(124ao2)와 접촉시키는 단계는 ssDNA 스캐폴드를 제2 어댑터 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함하는 제2 어댑터와 접촉시키는 단계를 포함할 수 있다. 제1 어댑터는 공유 연결된 제1 어댑터 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함할 수 있다. 제2 어댑터는 공유 연결된 제2 어댑터 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함할 수 있다. 일부 실시 형태에서, 제1 부속 올리고뉴클레오티드를 제공하는 단계는 제1 부속 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함하는 제1 부속물을 제공하는 단계를 포함한다. 제2 핵산(120s)을 제1 부속 올리고뉴클레오티드(124ao1)와 접촉시키는 단계는 제2 핵산(120s)을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 제1 부속물과 접촉시켜, 하나 이상의 제1 부속물에 부착된 제2 핵산(120s)을 포함하는 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다. 제2 부속 올리고뉴클레오티드(124ao2)를 제공하는 단계는 제2 부속 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함하는 제2 부속물을 제공하는 단계를 포함할 수 있다. 제2 핵산(120s)을 제2 부속물과 접촉시키는 단계는 제2 핵산(120s)과 제2 부속물을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 접촉시켜, 하나 이상의 제2 부속물에 부착된 제2 핵산(120s)을 포함하는 제3 핵산(120c)을 생성하는 단계를 포함할 수 있다. 제1 부속물은 공유 연결된 제1 부속 올리고뉴클레오티드(124ao1) 및 제1 중합체를 포함할 수 있다. 제2 부속물은 공유 연결된 제2 부속 올리고뉴클레오티드(124ao2) 및 제2 중합체를 포함할 수 있다.
일부 실시 형태에서, 제1 핵산(예를 들어, 단일 가닥 DNA 가닥(104)), 제2 핵산(예를 들어, 스캐폴드(120s)), 제3 핵산(예를 들어, 담체(120c)), 및/또는 제4 핵산(예를 들어, 나노입자(120n))은 제3 중합체를 포함한다. 제1 핵산, 제2 핵산, 제3 핵산 및/또는 제4 핵산은 각각 하나 이상의 제3 중합체를 포함할 수 있다. 일부 실시 형태에서, 제1 핵산, 제2 핵산, 제3 핵산 및/또는 제4 핵산은 각각 정확히 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 개수의 제3 중합체를 포함한다. 일부 실시 형태에서, 제1 핵산, 제2 핵산, 제3 핵산 및/또는 제4 핵산은 각각 적어도, 적어도 약, 최대, 또는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000개의 제3 중합체를 포함한다.
일부 실시 형태에서, 중합체(예를 들어, 제1 어댑터 또는 제1 부속물의 제1 부속 올리고뉴클레오티드(124ao1)에 공유 연결된 제1 중합체, 또는 제2 어댑터 또는 제2 부속물의 제2 부속 올리고뉴클레오티드(124ao1)에 공유 연결된 제2 중합체, 또는 제1 핵산, 제2 핵산, 제3 핵산, 및/또는 제4 핵산의 제3 중합체)는 하나의 반복 단위를 갖는 단일중합체일 수 있다. 예를 들어, 중합체는 폴리스티렌을 포함할 수 있다. 다른 예로서, 중합체는 폴리(다이메틸실록산)을 포함할 수 있다. 예를 들어, 중합체는 폴리에틸렌 테레프탈레이트를 포함할 수 있다. 다른 예로서, 중합체는 폴리에틸렌 글리콜(PEG)을 포함할 수 있다. 일부 실시 형태에서, 중합체는 2개 이상의 상이한 반복 단위(예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 상이한 반복 단위)를 갖는 헤테로중합체(공중합체로도 알려짐)일 수 있다. 일부 실시 형태에서, 중합체의 반복 단위는 반복 단위의 수, n이 정확히 또는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위일 수 있다.
한 예에서, 사용된 중합체는 PAZAM으로도 알려진 폴리(N-(5-아지도아세트아미도펜틸)아크릴아미드-코-아크릴아미드):
Figure pct00001
또는
Figure pct00002
와 같은 예를 포함할 수 있으며, 여기서 n은 1 내지 20,000 범위의 정수이고, m은 1 내지 100,000 범위의 정수이다.
일부 예에서, 아크릴아미드 단량체는 아지도 아세트아미도 펜틸 아크릴아미드 단량체:
Figure pct00003
를 포함할 수 있다. 일부 예에서, 아크릴아미드 단량체는 N-아이소프로필아크릴아미드
Figure pct00004
를 포함할 수 있다.
"헤테로중합체"는 적어도 2개의 상이한 반복 하위단위(단량체)의 큰 분자이다. "아크릴아미드 단량체"는 구조
Figure pct00005
를 갖는 단량체 또는 이의 치환된 유사체(예를 들어, 메타크릴아미드 또는 N-아이소프로필아크릴아미드)이다. 아크릴아미드 기와 아지도 기를 포함하는 단량체의 예는 상기에 나타낸 아지도 아세트아미도 펜틸 아크릴아미드이다. "알킬"은 완전 포화된(즉, 이중 또는 삼중 결합을 함유하지 않는) 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 예시적인 알킬 기에는 메틸, 에틸, 프로필, 아이소프로필, 부틸, 아이소부틸 및 3차 부틸이 포함된다. 한 예로서, 표기 "C1-4알킬"은 알킬 사슬 내에 1 내지 4개의 탄소 원자가 있음을 나타내는데, 즉, 알킬 사슬은 메틸, 에틸, 프로필, 아이소-프로필, n-부틸, 아이소부틸, sec-부틸, 및 t-부틸로 이루어진 군으로부터 선택된다.
한 예에서, 중합체는 헤테로중합체일 수 있고, 헤테로중합체는 아크릴아미드 단량체, 예컨대
Figure pct00006
또는 이의 치환된 유사체("치환된"은 특정 기에서 하나 이상의 수소 원자를 또 다른 원자 또는 기로 대체하는 것을 지칭함)를 포함할 수 있다. 한 예에서, 중합체는 헤테로중합체이고, 아지도-함유 아크릴아미드 단량체를 추가로 포함할 수 있다. 일부 태양에서, 헤테로중합체는
Figure pct00007
및 선택적으로
Figure pct00008
를 포함하고, 여기서 각각의 Rz는 독립적으로 H 또는 C1-4 알킬이다.
일부 태양에서, 헤테로중합체는 하기 구조를 포함할 수 있다:
Figure pct00009
(여기서, x는 1 내지 20,000 범위의 정수이고, y는 1 내지 100,000 범위의 정수임), 또는
Figure pct00010
(여기서, y는 1 내지 20,000 범위의 정수이고, x 및 z는 x와 z의 합이 1 내지 100,000의 범위 내에 있을 수 있는 정수이고, 여기서 각각의 Rz는 독립적으로 H 또는 C1-4 알킬이고, 각각, x:y의 비는 대략 10:90 내지 대략 1:99일 수 있거나, 또는 대략 5:95일 수 있거나, 또는 (x:y):z의 비는 대략 85:15 내지 대략 95:5일 수 있거나, 또는 대략 90:10일 수 있음(여기서, x:(y:z)의 비는 대략 1:(99) 내지 대략 10:(90)일 수 있거나 또는 대략 5:(95)일 수 있음)). 이들 예에서, '대략'은 하나의 상대적인 양이 열거된 수준에서 언급된 양과 최대 5%만큼 상이할 수 있음을 의미한다.
핵산 산물
본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제2 핵산(예를 들어, 스캐폴드(120s))의 실시 형태가 본 명세서에 개시된다. 본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제3 핵산(예를 들어, 담체(120c))의 실시 형태가 본 명세서에 개시된다. 본 발명의 핵산을 변형시키는 임의의 방법에 의해 얻어진 제4 핵산(예를 들어, 나노입자(120n))의 실시 형태가 본 명세서에 개시된다.
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제
서열
일부 실시 형태에서, 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 90% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 11과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 12와 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다.
일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT(예를 들어, 서열 번호 12) 또는 이의 단편(예를 들어, 서열 번호 12)과 정확히 또는 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT(예를 들어, 서열 번호 12) 또는 이의 단편(예를 들어, 서열 번호 12)과 적어도, 적어도 약, 최대 또는 최대 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위와 동일한 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 90% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다.
일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT의 단편, 예컨대 보스 타우루스 TdT의 아미노산 139 내지 520(예를 들어, 서열 번호 1)과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함한다. 도 2는 보스 타우루스 TdT의 아미노산 139 내지 520의 서열을 나타낸다. 예를 들어, 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT의 변이체, 또는 소 또는 보스 타우루스 TdT 단편(예를 들어, 서열 번호 11)의 변이체와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT는 서열 번호 11과 적어도 95% 동일할 수 있는 아미노산 서열을 포함할 수 있다.
치환 돌연변이
재조합 TdT는 보스 타우루스 TdT(예를 들어, 서열 번호 12)에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 각각의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다.
각각의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 친수성 아미노산, 또는 분지쇄 아미노산에 대한 치환 돌연변이일 수 있다. 비극성 아미노산은, 예를 들어 알라닌, 시스테인, 글리신, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 또는 발린일 수 있다. 극성 아미노산은, 예를 들어 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 아스파라긴, 글루타민, 세린, 트레오닌, 또는 티로신일 수 있다. 극성 아미노산은, 예를 들어 산성 극성 아미노산, 염기성 극성 아미노산, 또는 비산성 비염기성 극성 아미노산일 수 있다. 염기성 극성 아미노산 또는 양으로 하전된 아미노산은, 예를 들어 아르기닌, 히스티딘, 또는 라이신일 수 있다. 산성 아미노산 또는 음으로 하전된 아미노산은, 예를 들어 아스파르트산 또는 글루탐산일 수 있다. 비산성 비염기성 아미노산은, 예를 들어 아스파라긴, 글루타민, 세린, 트레오닌, 또는 티로신일 수 있다. 소수성 아미노산은, 예를 들어 아이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신, 또는 발린일 수 있다. 방향족 아미노산은, 예를 들어 히스티딘, 페닐알라닌, 트립토판, 또는 티로신일 수 있다. 지방족(비방향족) 아미노산은, 예를 들어 아이소류신, 류신, 메티오닌, 또는 발린일 수 있다. 작은 아미노산은, 예를 들어 알라닌, 글리신, 프롤린, 또는 세린일 수 있다. 친수성 아미노산은, 예를 들어 아르기닌, 아스파라긴, 아스파르트산, 글루타민, 글루탐산, 히스티딘, 라이신, 세린, 또는 트레오닌일 수 있다. 분지쇄 아미노산은, 예를 들어 아이소류신, 류신, 발린일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Gly, Glu191Ile, Glu191Leu, Glu191Met, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Val일 수 있다. 재조합 TdT는 서열 번호 2와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 글루타민, 세린, 또는 트레오닌에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn, Lys193Gln, Lys193Ser, 또는 Lys193Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn일 수 있다. 재조합 TdT는 서열 번호 3과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Gly, Glu194Ile, Glu194Leu, Glu194Met, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Gly일 수 있다. 재조합 TdT는 서열 번호 4와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 방향족 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 글루타민, 페닐알라닌, 세린, 트레오닌, 트립토판, 또는 티로신에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Asn, Asp242Gln, Asp242Phe, Asp242Ser, Asp242Thr, Asp242Trp, 또는 Asp242Tyr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Tyr일 수 있다. 재조합 TdT는 서열 번호 5와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 음으로 하전된 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파르트산 또는 글루탐산에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Asp 또는 Lys287Glu일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Glu일 수 있다. 재조합 TdT는 서열 번호 6과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Gly, Phe296Ile, Phe296Leu, Phe296Met, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Leu일 수 있다. 재조합 TdT는 서열 번호 7과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아르기닌, 아르기닌, 히스티딘, 또는 라이신에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Arg, Met299His, 또는 Met299Lys일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Lys일 수 있다. 재조합 TdT는 서열 번호 8과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 시스틴, 글루타민, 프롤린, 또는 세린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Asn, Thr342Cys, Thr342Gln, Thr342Pro, 또는 Thr342Ser일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ser일 수 있다. 재조합 TdT는 서열 번호 9와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 시스틴, 글루타민, 프롤린, 세린, 또는 트레오닌에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Asn, His421Cys, His421Gln, His421Pro, His421Ser, 또는 His421Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Pro일 수 있다. 재조합 TdT는 서열 번호 10과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함한다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, 및 His421과 기능적으로 동등한 위치에서 8개의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, 및 His421과 기능적으로 동등한 위치에서의 8개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, 및 His421Pro를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 9개의 위치에서의 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro를 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다. 일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
열안정성
일부 실시 형태에서, 재조합 TdT는 47 ℃ 이상의 온도에서 안정하다. 재조합 TdT는 50 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 55 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 58 ℃ 이상의 온도에서 안정할 수 있다.
재조합 TdT는 열적으로 안정할 수 있다. 재조합 TdT는 상이한 실시 형태에서 상이한 온도에서 안정할 수 있다. 일부 실시 형태에서, 재조합 TdT는 정확히 또는 약 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 그 이상의 온도에서 안정할 수 있다. 예를 들어, 재조합 TdT는 47 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 50 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 55 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 58 ℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 적어도, 적어도 약, 최대, 또는 최대 약 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 온도에서 안정할 수 있다.
활성
일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%이다. 시험 온도는 37 ℃, 47 ℃, 50 ℃, 55 ℃, 또는 58 ℃일 수 있다.
재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 소 또는 보스 타우루스 TdT 또는 이의 단편보다 더 높거나 더 낮을 수 있다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 정확히 또는 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 101%, 102%, 103%, 104%, 105%, 106%, 107%, 108%, 109%, 110%, 111%, 112%, 113%, 114%, 115%, 116%, 117%, 118%, 119%, 120%, 121%, 122%, 123%, 124%, 125%, 126%, 127%, 128%, 129%, 130%, 131%, 132%, 133%, 134%, 135%, 136%, 137%, 138%, 139%, 140%, 141%, 142%, 143%, 144%, 145%, 146%, 147%, 148%, 149%, 150%, 151%, 152%, 153%, 154%, 155%, 156%, 157%, 158%, 159%, 160%, 161%, 162%, 163%, 164%, 165%, 166%, 167%, 168%, 169%, 170%, 171%, 172%, 173%, 174%, 175%, 176%, 177%, 178%, 179%, 180%, 181%, 182%, 183%, 184%, 185%, 186%, 187%, 188%, 189%, 190%, 191%, 192%, 193%, 194%, 195%, 196%, 197%, 198%, 199%, 200%, 또는 그 이상이다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도, 적어도 약, 최대, 또는 최대 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 101%, 102%, 103%, 104%, 105%, 106%, 107%, 108%, 109%, 110%, 111%, 112%, 113%, 114%, 115%, 116%, 117%, 118%, 119%, 120%, 121%, 122%, 123%, 124%, 125%, 126%, 127%, 128%, 129%, 130%, 131%, 132%, 133%, 134%, 135%, 136%, 137%, 138%, 139%, 140%, 141%, 142%, 143%, 144%, 145%, 146%, 147%, 148%, 149%, 150%, 151%, 152%, 153%, 154%, 155%, 156%, 157%, 158%, 159%, 160%, 161%, 162%, 163%, 164%, 165%, 166%, 167%, 168%, 169%, 170%, 171%, 172%, 173%, 174%, 175%, 176%, 177%, 178%, 179%, 180%, 181%, 182%, 183%, 184%, 185%, 186%, 187%, 188%, 189%, 190%, 191%, 192%, 193%, 194%, 195%, 196%, 197%, 198%, 199%, 200%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 예를 들어, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 정확히 또는 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%일 수 있다.
시험 온도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 시험 온도는 정확히 또는 약 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 그 이상이다. 예를 들어, 시험 온도는 37 ℃, 47 ℃, 50 ℃, 55 ℃, 또는 58 ℃일 수 있다. 일부 실시 형태에서, 시험 온도는 적어도, 적어도 약, 최대, 또는 최대 약 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃, 30 ℃, 31 ℃, 32 ℃, 33 ℃, 34 ℃, 35 ℃, 36 ℃, 37 ℃, 38 ℃, 39 ℃, 40 ℃, 41 ℃, 42 ℃, 43 ℃, 44 ℃, 45 ℃, 46 ℃, 47 ℃, 48 ℃, 49 ℃, 50 ℃, 51 ℃, 52 ℃, 53 ℃, 54 ℃, 55 ℃, 56 ℃, 57 ℃, 58 ℃, 59 ℃, 60 ℃, 61 ℃, 62 ℃, 63 ℃, 64 ℃, 65 ℃, 66 ℃, 67 ℃, 68 ℃, 69 ℃, 70 ℃, 71 ℃, 72 ℃, 73 ℃, 74 ℃, 75 ℃, 76 ℃, 77 ℃, 78 ℃, 79 ℃, 80 ℃, 81 ℃, 82 ℃, 83 ℃, 84 ℃, 85 ℃, 86 ℃, 87 ℃, 88 ℃, 89 ℃, 90 ℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다.
추가의 성분
일부 실시 형태에서, 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단편을 포함한다. SUMO 단편은 서열 번호 13과 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 재조합 TdT의 N-말단 상에 SUMO 단편을 포함할 수 있다. 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 재조합 TdT의 C-말단 상에 SUMO 단편을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 정제를 위한 태그, 예컨대 His-태그 또는 글루타티온 S-트랜스퍼라제를 포함한다. 정제를 위한 태그는 재조합 TdT의 N-말단 상에, 재조합 TdT의 C-말단 상에, 또는 재조합 TdT의 내부에 존재할 수 있다. 재조합 TdT는 정제를 위한 태그와 다른 성분(예를 들어, 보스 타우루스 TdT 단편) 또는 재조합 TdT의 나머지 부분 사이에 프로테아제 절단 서열, 예컨대 LeuValProArg/GlySer(트롬빈 절단 부위) 또는 LeuGluValLeuPheGln/GlyPro(PreScission Protease 절단 부위)를 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단백질 또는 이의 단편을 포함한다. 재조합 TdT에서의 SUMO 단백질 또는 이의 단편의 서열은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 재조합 TdT에서의 SUMO 단백질 또는 이의 단편은 SUMO 단백질(예를 들어, 효모에서의 SMT3(suppressor of mif two 3)) 또는 이의 단편(예를 들어, 서열 번호 13의 아미노산 서열을 포함하는 SUMO 단편)과 정확히 또는 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT에서의 SUMO 단편은 서열 번호 13과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 일부 실시 형태에서, 재조합 TdT에서의 SUMO 단백질 또는 이의 단편은 SUMO 단백질(예를 들어, 효모에서의 SMT3(suppressor of mif two 3)) 또는 이의 단편(예를 들어, 서열 번호 13의 아미노산 서열을 포함하는 SUMO 단편)과 적어도, 적어도 약, 최대, 또는 최대 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.
재조합 TdT에서의 SUMO 단편의 위치는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 재조합 TdT는 재조합 TdT의 N-말단 상에 SUMO 단편을 포함한다. 일부 실시 형태에서, 재조합 TdT는 재조합 TdT의 C-말단 상에 SUMO 단편을 포함한다.
재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15의 아미노산 서열을 포함하는 SUMO 단편을 갖는 재조합 TdT)와 정확히 또는 약 서열 동일성 역치의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15)와 서열 동일성 역치를 초과, 약 초과, 미만, 또는 약 미만의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15)와 적어도, 적어도 약, 최대, 또는 최대 약 서열 동일성 역치의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 서열 동일성 역치는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 서열 동일성 역치는 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 예를 들어, 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 다른 예로서, 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다.
서열
라이브러리 제조
폴리뉴클레오티드들을 포함하는 라이브러리는 올리고뉴클레오티드 어댑터를 표적 폴리뉴클레오티드에 부착시키기에 적합한 임의의 방식으로 제조될 수 있다. 본 명세서에 사용되는 바와 같이, "라이브러리"는 주어진 공급원 또는 샘플로부터의 폴리뉴클레오티드들의 집단이다. 라이브러리는 복수의 표적 폴리뉴클레오티드들을 포함한다. 본 명세서에 사용되는 바와 같이, "표적 폴리뉴클레오티드"는 서열분석이 요구되는 폴리뉴클레오티드이다. 표적 폴리뉴클레오티드는 본질적으로 기지 또는 미지의 서열의 임의의 폴리뉴클레오티드일 수 있다. 이는, 예를 들어 게놈 DNA 또는 cDNA의 단편일 수 있다. 서열분석은 표적 폴리뉴클레오티드의 전체 또는 일부의 서열을 결정할 수 있다. 표적 폴리뉴클레오티드는 랜덤하게 단편화된 1차 폴리뉴클레오티드 샘플로부터 유래될 수 있다. 표적 폴리뉴클레오티드는 각각의 표적 단편의 말단에서의 범용 프라이머 서열의 배치에 의해 증폭에 적합한 주형으로 처리될 수 있다. 표적 폴리뉴클레오티드는 또한 cDNA로의 역전사에 의해 1차 RNA 샘플로부터 얻어질 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "폴리뉴클레오티드"와 "올리고뉴클레오티드"는 상호교환 가능하게 사용될 수 있으며, 전형적으로 포스포다이에스테르 결합을 통해 서로 공유 결합된 2개 이상의 뉴클레오티드 단량체를 포함하는 분자를 지칭할 수 있다. 폴리뉴클레오티드는 전형적으로 올리고뉴클레오티드보다 더 많은 뉴클레오티드를 함유한다. 제한이 아닌 예시를 목적으로, 폴리뉴클레오티드는 15, 20, 30, 40, 50, 100, 200, 300, 400, 500개, 또는 그 이상의 뉴클레오티드를 함유하는 것으로 간주될 수 있는 반면, 올리고뉴클레오티드는 100, 50, 20, 15개 또는 그 이하의 뉴클레오티드를 함유하는 것으로 간주될 수 있다.
폴리뉴클레오티드 및 올리고뉴클레오티드는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함할 수 있다. 이 용어는, 등가물로서, 뉴클레오티드 유사체로부터 제조된 DNA 또는 RNA의 유사체를 포함하고, 단일 가닥(예컨대, 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오티드에 적용가능한 것으로 이해되어야 한다. 본 명세서에 사용되는 바와 같이, 이 용어는 또한, 예를 들어 역전사효소의 작용에 의해 RNA 주형으로부터 생성된 상보적 또는 카피 DNA인 cDNA를 포함한다.
1차 폴리뉴클레오티드 분자는 이중 가닥 DNA(dsDNA) 형태(예를 들어, 게놈 DNA 단편, PCR 및 증폭 산물 등)에서 기원될 수 있거나, DNA 또는 RNA로서의 단일 가닥 형태에서 기원되었고 dsDNA 형태로 전환되었을 수 있다. 예로서, mRNA 분자는 당업계에 잘 알려진 표준 기법을 사용하여 이중 가닥 cDNA로 카피될 수 있다. 1차 폴리뉴클레오티드의 정확한 서열은 일반적으로 본 명세서에 제시된 본 발명에 중요하지 않으며, 알려져 있거나 알려져 있지 않을 수 있다.
일부 실시 형태에서, 1차 표적 폴리뉴클레오티드는 RNA 분자이다. 그러한 실시 형태의 일 태양에서는, 특정 샘플로부터 단리된 RNA를 먼저 당업계에 알려진 기법을 사용하여 이중 가닥 DNA로 전환시킨다. 이어서, 이중 가닥 DNA를 라이브러리 특이적 태그로 인덱스 태깅할 수 있다. 라이브러리 특이적 인덱스 태그를 포함하는 그러한 이중 가닥 DNA의 상이한 제제들은 상이한 공급원 또는 샘플로부터 단리된 RNA로부터, 병행적으로, 생성될 수 있다. 후속으로, 상이한 라이브러리 특이적 인덱스 태그를 포함하는 이중 가닥 DNA의 상이한 제제들은 혼합되고, 일제히 서열분석되고, 각각의 서열분석된 단편의 정체가, 라이브러리 특이적 인덱스 태그 서열의 존재에 의해 단리되고/유래된 라이브러리에 대해 결정될 수 있다.
일부 실시 형태에서, 1차 표적 폴리뉴클레오티드는 DNA 분자이다. 예를 들어, 1차 폴리뉴클레오티드는 유기체의 전체 유전자 상보체를 나타낼 수 있고, 게놈 DNA 분자, 예컨대 인간 DNA 분자인데, 이것은 인트론 및 엑손 서열(코딩 서열) 둘 모두를 포함할 뿐만 아니라, 비코딩 조절 서열, 예컨대 프로모터 및 인핸서 서열도 포함한다. 그렇더라도, 폴리뉴클레오티드 서열 또는 게놈 DNA의 특정 하위세트, 예컨대 특정 염색체 또는 이의 일부분이 또한 사용될 수 있는 것으로 구상될 수 있다. 많은 실시 형태에서, 1차 폴리뉴클레오티드의 서열은 알려져 있지 않다. DNA 표적 폴리뉴클레오티드는 단편화 과정, 예컨대 랜덤 단편화 과정 전에 또는 이에 후속하여, 그리고 어댑터 올리고뉴클레오티드의 라이게이션 전에, 동안에, 또는 이에 후속하여 화학적으로 또는 효소적으로 처리될 수 있다.
바람직하게는, 1차 표적 폴리뉴클레오티드는 서열분석에 적합한 적절한 길이로 단편화된다. 표적 폴리뉴클레오티드는 임의의 적합한 방식으로 단편화될 수 있다. 바람직하게는, 표적 폴리뉴클레오티드는 랜덤하게 단편화된다. 랜덤 단편화는, 예를 들어 효소적, 화학적 또는 기계적 수단에 의한 비정렬된 방식으로의 폴리뉴클레오티드의 단편화를 지칭한다. 그러한 단편화 방법은 당업계에 알려져 있고, 표준 방법을 이용한다(문헌[Sambrook and Russell, Molecular Cloning, A Laboratory Manual, third edition]). 명확함을 위하여, 더 큰 조각의 폴리뉴클레오티드의 더 작은 단편을, 그러한 더 작은 단편의 특정 PCR 증폭을 통해 생성하는 것은 더 큰 조각의 폴리뉴클레오티드를 단편화하는 것과 동등하지 않은데, 그 이유는, 더 큰 조각의 폴리뉴클레오티드는 온전한 상태로 남아 있기 때문이다(즉, PCR 증폭에 의해 단편화되지 않기 때문이다). 더욱이, 랜덤 단편화는 파단을 포함하고/하거나 둘러싸는 뉴클레오티드의 서열 동일성 또는 위치와 무관하게 단편을 생성하도록 설계된다.
일부 실시 형태에서, 랜덤 단편화는 약 50개의 염기쌍 길이 내지 약 1500개의 염기쌍 길이, 예컨대 50 내지 700개의 염기쌍 길이 또는 50 내지 500개의 염기쌍 길이의 단편을 생성하기 위한 네뷸라이제이션 또는 초음파 처리와 같은 기계적 수단에 의해 이루어진다.
기계적 수단(예를 들어, 네뷸라이제이션, 초음파 처리 및 하이드로전단(Hydroshear))에 의한 폴리뉴클레오티드 분자의 단편화는 블런트 및 3'- 및 5'-오버행 말단의 불균질한 믹스를 갖는 단편을 가져올 수 있다. 단편 말단은, 예를 들어 클로닝 벡터의 블런트 부위 내로의 삽입을 위해 최적인 말단을 생성하는 것으로 당업계에 알려진 방법 또는 키트(예컨대, Lucigen DNA 종결자 말단 수복 키트(End Repair Kit))를 사용하여 수복될 수 있다. 일부 실시 형태에서, 핵산 집단의 단편 말단은 블런트 말단(blunt ended)이다. 단편 말단은 블런트 말단화되고 인산화될 수 있다. 포스페이트 모이어티는 효소 처리를 통해, 예를 들어 폴리뉴클레오티드 키나제를 사용하여 도입될 수 있다.
일부 실시 형태에서, 표적 폴리뉴클레오티드 서열은, 예를 들어, 단일 데옥시뉴클레오티드, 예를 들어 데옥시아데노신(A)을, 예를 들어 PCR 산물의 3' 말단에 부가하는 비주형-의존성 말단 트랜스페라제 활성을 갖는 Taq 폴리머라제 또는 클레나우 엑소 마이너스 폴리머라제와 같은 소정 유형의 DNA 폴리머라제의 활성에 의해 단일 오버행 뉴클레오티드를 갖도록 제조된다. 그러한 효소는 표적 폴리뉴클레오티드 이중체의 각각의 가닥의 블런트 말단의 3' 말단에 단일 뉴클레오티드 'A'를 부가하는 데 이용될 수 있다. 따라서, 'A'는 Taq 또는 클레나우 엑소 마이너스 폴리머라제와의 반응에 의해 표적 폴리뉴클레오티드 이중체의 각각의 말단 수복된 이중체 가닥의 3' 말단에 부가될 수 있는 반면에, 어댑터 폴리뉴클레오티드 작제물은 어댑터 작제물의 각각의 이중체 영역의 3' 말단 상에 양립가능한 'T' 오버행이 존재하는 T-작제물일 수 있다. 이러한 말단 변형은 또한 표적 폴리뉴클레오티드들의 자가-라이게이겐을 방지하며, 이에 따라 조합된 라이게이션된 어댑터-표적 폴리뉴클레오티드의 형성에 대한 편향이 있다.
일부 실시 형태에서, 단편화는, 예를 들어 국제 특허 출원 공개 WO 2016/130704호에 기재된 바와 같이 태그멘테이션(tagmentation)을 통해 달성된다. 그러한 방법에서는, 이중 가닥 폴리뉴클레오티드를 단편화하고 범용 프라이머 서열을 이중 가닥 폴리뉴클레오티드의 한쪽 가닥 내로 부착하기 위하여 트랜스포사제가 사용된다. 생성된 분자는 갭-충전되고, 부착된 범용 프라이머 서열에 상보적인 서열을 갖는 3' 말단 및 어댑터의 다른 서열을 함유하는 5' 말단을 포함하는 프라이머를 사용하여, 예를 들어 PCR 증폭에 의해 연장을 거칠 수 있다.
어댑터는 임의의 다른 적합한 방식으로 표적 폴리뉴클레오티드에 부착될 수 있다. 일부 실시 형태에서, 어댑터는 범용 프라이머 서열을 갖는 표적 폴리뉴클레오티드에 대한 어댑터의 일부분의 라이게이션을 수반하는 다단계 과정, 예컨대 2-단계 과정에 도입된다. 제2 단계는 부착된 범용 프라이머 서열에 상보적인 서열을 갖는 3' 말단 및 어댑터의 다른 서열을 함유하는 5' 말단을 포함하는 프라이머를 사용하여, 예를 들어 PCR 증폭에 의해 연장을 포함한다. 예로서, 그러한 연장은 미국 특허 제8,053,192호에 기재된 바와 같이 수행될 수 있다. 생성된 앞서 연장된 폴리뉴클레오티드의 5' 말단에 추가의 서열을 제공하기 위해 추가의 연장이 수행될 수 있다.
일부 실시 형태에서, 전체 어댑터는 단편화된 표적 폴리뉴클레오티드에 라이게이션된다. 바람직하게는, 라이게이션된 어댑터는 이중 가닥 표적 폴리뉴클레오티드에 라이게이션되는 이중 가닥 영역을 포함한다. 바람직하게는, 이중 가닥 영역은 기능 손실 없이 가능한 한 짧다. 이와 관련하여, "기능"은 표준 반응 조건 하에서 안정한 이중체를 형성하는 이중 가닥 영역의 능력을 지칭한다. 일부 실시 형태에서, 표준 반응 조건은 숙련된 독자에게 잘 알려져 있을 효소-촉매된 폴리뉴클레오티드 라이게이션 반응을 위한 반응 조건(예를 들어, 효소에 적절한 라이게이션 완충액 중에서 4 ºC 내지 25 ºC 범위의 온도에서의 인큐베이션)을 지칭하며, 이에 따라 어댑터를 형성하는 2개의 가닥은 표적 분자에 대한 어댑터의 라이게이션 동안 부분 어닐링된 채로 남아 있게 된다. 라이게이션 방법은 당업계에 알려져 있고, 표준 방법을 이용할 수 있다(문헌[Sambrook and Russell, Molecular Cloning, A Laboratory Manual, third edition]). 그러한 방법은 리가제 효소, 예컨대 DNA 리가제를 이용하여 2개의 폴리뉴클레오티드 가닥 - 이 경우에, 어댑터 이중체 올리고뉴클레오티드와 표적 폴리뉴클레오티드 이중체 - 의 말단들의 결합을 달성하거나 촉매하며, 이에 따라 공유 결합이 형성된다. 어댑터 이중체 올리고뉴클레오티드는 표적 폴리뉴클레오티드 3'-OH에 대한 라이게이션을 촉진하기 위하여 5'-포스페이트 모이어티를 함유할 수 있다. 표적 폴리뉴클레오티드는, 전단 과정으로부터 잔류되었거나 효소적 처리 단계를 사용하여 부가된 5'-포스페이트 모이어티를 함유할 수 있으며, 말단 수복되었고, 선택적으로 오버행 염기 또는 염기들에 의해 연장되어 라이게이션에 적합한 3'-OH를 제공하였다. 이와 관련하여, 부착은, 이전에 공유 연결되지 않은 폴리뉴클레오티드 가닥들의 공유 결합을 의미한다. 본 발명의 특정 태양에서, 그러한 부착은 2개의 폴리뉴클레오티드 가닥 사이의 포스포다이에스테르 결합의 형성에 의해 일어나지만, 공유 결합의 다른 수단(예를 들어, 비-포스포다이에스테르 골격 결합)이 사용될 수 있다. 표적 폴리뉴클레오티드에 대한 어댑터의 라이게이션은, 예를 들어 미국 특허 제8,053,192호에 더 상세히 기재되어 있다.
임의의 적합한 어댑터가 상기 논의된 것들과 같은 임의의 적합한 과정을 통해 표적 폴리뉴클레오티드에 부착될 수 있다. 어댑터는 라이브러리-특이적 인덱스 태그 서열을 포함한다. 인덱스 태그 서열은 샘플이 서열분석을 위해 고정화되기 전에 각각의 라이브러리로부터의 표적 폴리뉴클레오티드들에 부착될 수 있다. 인덱스 태그는 그 자체가 표적 폴리뉴클레오티드의 일부에 의해 형성되지 않지만, 증폭을 위한 주형의 일부가 된다. 인덱스 태그는 주형 제조 단계의 일부로서 표적에 부가되는 뉴클레오티드의 합성 서열일 수 있다. 따라서, 라이브러리-특이적 인덱스 태그는 특정 라이브러리의 표적 분자 각각에 부착된 핵산 서열 태그이며, 이의 존재는 표적 분자가 단리된 라이브러리를 나타내거나 이를 확인하는 데 사용된다.
바람직하게는, 인덱스 태그 서열은 20개의 뉴클레오티드 또는 그 이하의 길이이다. 예를 들어, 인덱스 태그 서열은 1 내지 10개의 뉴클레오티드 길이 또는 4 내지 6개의 뉴클레오티드 길이일 수 있다. 4-뉴클레오티드 인덱스 태그는 동일한 어레이 상에서 256개의 샘플을 멀티플렉싱할 가능성을 제공하고, 6-염기 인덱스 태그는 4,096개의 샘플이 동일한 어레이 상에서 처리될 수 있게 한다.
어댑터는 하나 초과의 인덱스 태그를 함유하여, 멀티플렉싱 가능성이 증가될 수 있도록 할 수 있다.
어댑터는 바람직하게는 이중 가닥 영역, 및 2개의 비상보적 단일 가닥을 포함하는 영역을 포함한다. 어댑터의 이중 가닥 영역은 임의의 적합한 수의 염기쌍을 가질 수 있다. 바람직하게는, 이중 가닥 영역은 2개의 부분적으로 상보적인 폴리뉴클레오티드 가닥을 어닐링함으로써 형성되는 짧은 이중 가닥 영역이며, 이는 전형적으로 5개 이상의 연속적인 염기쌍을 포함한다. 어댑터의 "이중 가닥 영역"은, 2개의 가닥이 어닐링되고 어떠한 특정 구조적 입체형태도 내포하지 않는 영역을 지칭한다. 일부 실시 형태에서, 이중 가닥 영역은 20개 이하의 연속적인 염기쌍, 예컨대 10개 이하 또는 5개 이하의 연속적인 염기쌍을 포함한다.
이중 가닥 영역의 안정성은 표준 왓슨-크릭 염기쌍보다 더 강한 염기쌍을 나타내는 비천연 뉴클레오티드의 포함에 의해 증가될 수 있으며, 이에 따라 그의 길이는 잠재적으로 감소될 수 있다. 바람직하게는, 어댑터의 2개의 가닥은 이중 가닥 영역에서 100% 상보적이다.
어댑터가 표적 폴리뉴클레오티드에 부착될 때, 비상보적 단일 가닥 영역은 서열분석될 폴리뉴클레오티드의 5' 및 3' 말단을 형성할 수 있다. 용어 "비상보적 단일 가닥 영역"은, 어댑터를 형성하는 2개의 폴리뉴클레오티드 가닥의 서열이, 이들 2개의 가닥이 PCR 반응을 위한 표준 어닐링 조건 하에서 서로 완전히 어닐링할 수 없도록 어느 정도의 비상보성을 나타내는 어댑터의 영역을 지칭한다.
비상보적 단일 가닥 영역은 이중 가닥 영역을 형성하는 동일한 2개의 폴리뉴클레오티드 가닥의 상이한 부분들에 의해 제공된다. 단일 가닥 부분의 길이에 대한 하한치는 전형적으로, 예를 들어 프라이머 연장, PCR 및/또는 서열분석을 위한 프라이머의 결합에 적합한 서열을 제공하는 기능에 의해 결정될 것이다. 이론적으로, 일반적으로, 예를 들어 부착 단계 또는 단계들 후에 어댑터-표적 작제물로부터 결합되지 않은 어댑터의 분리를 촉진시키기 위하여 어댑터의 전체 길이를 최소화하는 데 유리한 것을 제외하고, 매칭되지 않은 영역의 길이에 대한 상한치는 없다. 따라서, 일반적으로, 어댑터의 비상보적 단일 가닥 영역이 50개 이하의 연속적인 뉴클레오티드 길이, 예컨대 40개 이하, 30개 이하, 또는 25개 이하의 연속적인 뉴클레오티드 길이인 것이 바람직하다.
라이브러리-특이적 인덱스 태그 서열은 단일 가닥, 이중 가닥 영역에 위치될 수 있거나, 또는 어댑터의 단일 가닥 영역과 이중 가닥 영역에 걸쳐 있을 수 있다. 바람직하게는, 인덱스 태그 서열은 어댑터의 단일 가닥 영역에 있다.
어댑터는 인덱스 태그 서열에 더하여 임의의 다른 적합한 서열을 포함할 수 있다. 예를 들어, 어댑터는 범용 연장 프라이머 서열을 포함할 수 있으며, 이는 전형적으로 어댑터 및 서열분석을 위하여 생성된 폴리뉴클레오티드의 5' 또는 3' 말단에 위치한다. 범용 연장 프라이머 서열은 고체 기재의 표면에 결합된 상보적 프라이머에 혼성화될 수 있다. 상보적 프라이머는 자유 3' 말단을 포함하며, 이로부터 폴리머라제 또는 다른 적합한 효소가, 주형으로서 혼성화된 라이브러리 폴리뉴클레오티드를 사용하여 뉴클레오티드를 부가하여 서열을 연장시켜, 라이브러리 폴리뉴클레오티드의 역방향 가닥이 고체 표면에 커플링되게 할 수 있다. 그러한 연장은 서열분석 실행 또는 클러스터 증폭의 일부일 수 있다.
일부 실시 형태에서, 어댑터는 하나 이상의 범용 서열분석 프라이머 서열을 포함한다. 범용 서열분석 프라이머 서열은 서열분석 프라이머에 결합하여 인덱스 태그 서열, 표적 서열, 또는 인덱스 태그 서열 및 표적 서열의 서열분석을 가능하게 할 수 있다.
어댑터의 정확한 뉴클레오티드 서열은 일반적으로 본 발명에 중요하지 않으며, 사용자에 의해 선택될 수 있어서, 원하는 서열 요소들이 어댑터로부터 유래되는 주형의 라이브러리의 공통 서열 내에 궁극적으로 포함되게 하여, 예를 들어 범용 연장 프라이머들 및/또는 서열분석 프라이머들의 특정 세트를 위한 결합 부위를 제공할 수 있다.
어댑터 올리고뉴클레오티드는 엑소뉴클레아제 저항성 변형, 예컨대 포스포로티오에이트 결합을 함유할 수 있다.
바람직하게는, 어댑터는 표적 폴리펩티드의 양쪽 말단에 부착되어 뉴클레오티드의 제1 어댑터-표적-제2 어댑터 서열을 갖는 폴리뉴클레오티드를 생성한다. 제1 어댑터와 제2 어댑터는 동일하거나 상이할 수 있다. 바람직하게는, 제1 어댑터와 제2 어댑터는 동일하다. 제1 어댑터와 제2 어댑터가 상이한 경우, 제1 어댑터 및 제2 어댑터 중 적어도 하나는 라이브러리-특이적 인덱스 태그 서열을 포함한다.
"제1 어댑터-표적-제2 어댑터 서열" 또는 "어댑터-표적-어댑터" 서열은 서로에 대한 그리고 표적에 대한 어댑터들의 배향을 지칭하고, 서열이 추가의 서열, 예컨대 링커 서열을 포함할 수 없음을 반드시 의미하는 것은 아님이 이해될 것이다.
다른 라이브러리들이 유사한 방식으로 제조될 수 있으며, 각각은 나머지 다른 라이브러리들로부터의 인덱스 태그 서열 또는 인덱스 태그 서열들의 조합과 상이한 적어도 하나의 라이브러리-특이적 인덱스 태그 서열 또는 인덱스 태그 서열들의 조합을 포함한다.
본 명세서에 사용되는 바와 같이, "부착된" 또는 "결합된"은 표적 서열에 대해 어댑터와 관련하여 상호교환 가능하게 사용된다. 상기에 기재된 바와 같이, 어댑터를 표적 폴리뉴클레오티드에 부착하는 데 임의의 적합한 과정이 사용될 수 있다. 예를 들어, 어댑터는 하기를 통해 표적에 부착될 수 있다: 리가제를 사용하여 라이게이션을 통해; 어댑터의 일부분의 라이게이션, 및 연장, 예컨대 PCR을 통한 어댑터의 추가의 또는 나머지 부분들의 부가의 조합을 통해 - 이때, 프라이머는 어댑터의 추가의 또는 나머지 부분들을 함유함 -; 어댑터의 일부분을 도입시키는 트랜스포지션, 및 연장, 예컨대 PCR을 통한 어댑터의 추가의 또는 나머지 부분들의 부가를 통해 - 이때, 프라이머는 어댑터의 추가의 또는 나머지 부분들을 함유함 -; 또는 기타 등등. 바람직하게는, 부착된 어댑터 올리고뉴클레오티드는 표적 폴리뉴클레오티드에 공유 결합된다.
어댑터가 표적 폴리뉴클레오티드에 부착된 후에, 생성된 폴리뉴클레오티드는 도입되지 않은 어댑터의 적어도 일부분을 제거함으로써 어댑터-표적-어댑터 폴리뉴클레오티드에 대해 순도를 향상시키기 위한 클린-업 과정을 거칠 수 있다. 전기영동, 크기 배제 크로마토그래피 등과 같은 임의의 적합한 클린업(clean-up) 과정이 사용될 수 있다. 일부 실시 형태에서, 고상 역방향 고정화(SPRI) 상자성 비드가 어댑터-표적-어댑터 폴리뉴클레오티드를 부착되지 않은 어댑터로부터 분리하는 데 사용될 수 있다. 그러한 과정은 생성된 어댑터-표적-어댑터 폴리뉴클레오티드의 순도를 향상시킬 수 있지만, 일부 부착되지 않은 어댑터 올리고뉴클레오티드가 남아 있을 가능성이 높다.
서열분석을 위한 고정화된 샘플의 준비
이어서, 하나 이상의 공급원으로부터의 복수의 어댑터-표적-어댑터 분자들을 서열분석 전에 고정화하고 증폭시킨다. 하나 이상의 공급원으로부터의 어댑터-표적-어댑터 분자를 기재에 부착하는 방법은 당업계에 알려져 있다. 마찬가지로, 고정화된 어댑터-표적-어댑터 분자를 증폭시키는 방법은 가교 증폭 및 동력학적 배제(kinetic exclusion)를 포함하지만 이로 한정되지 않는다. 서열분석 전에 고정화하고 증폭시키는 방법은, 예를 들어 Bignell et al.(미국 특허 제8,053,192호), Gunderson et al.(국제 특허 출원 공개 WO2016/130704호), Shen et al.(미국 특허 제8,895,249호), 및 Pipenburg et al.(미국 특허 제9,309,502호)에 기재되어 있다.
이어서, 샘플 - 풀링된 샘플들을 포함함 - 이 서열분석을 위한 준비에서 고정화될 수 있다. 서열분석은 단일 분자들의 어레이로서 수행될 수 있거나, 서열분석 전에 증폭될 수 있다. 증폭은 하나 이상의 고정화된 프라이머를 사용하여 수행될 수 있다. 고정화된 프라이머(들)는 평면 표면 상의 또는 비드들의 풀 상의 론(lawn)일 수 있다. 비드들의 풀은 에멀젼의 각각의 "구획" 내에 단일 비드를 갖는 에멀젼 중에 단리될 수 있다. "구획"당 단지 하나의 주형의 농도로, 단지 단일 주형만이 각각의 비드 상에서 증폭된다.
본 명세서에 사용되는 바와 같이, 용어 "고상 증폭"은 증폭 산물의 전부 또는 일부분이 형성될 때 고체 지지체 상에 고정화되도록 고체 지지체 상에서 또는 이와 회합된 상태로 수행되는 임의의 핵산 증폭 반응을 지칭한다. 특히, 이 용어는, 정방향 및 역방향 증폭 프라이머 중 하나 또는 둘 모두가 고체 지지체 상에 고정화된 것을 제외하고는, 표준 용액상 증폭과 유사한 반응인 고상 폴리머라제 연쇄 반응(고상 PCR) 및 고상 등온 증폭을 포함한다. 고상 PCR은, 하나의 프라이머는 비드에 고정되고 다른 하나는 자유 용액 중에 있는 에멀젼과 같은 시스템과, 하나의 프라이머는 표면에 고정되고 다른 하나는 자유 용액 중에 있는 고상 겔 매트릭스에서의 콜로니 형성을 포함한다.
일부 실시 형태에서, 고체 지지체는 패턴화된 표면을 포함한다. "패턴화된 표면"은 고체 지지체의 노출된 층 내의 또는 그 상에서의 상이한 영역들의 배열을 지칭한다. 예를 들어, 영역들 중 하나 이상은 하나 이상의 증폭 프라이머들이 존재하는 특징부들일 수 있다. 특징부들은 증폭 프라이머들이 존재하지 않는 틈새 영역(interstitial region)들에 의해 분리될 수 있다. 일부 실시 형태에서, 패턴은 행(row)과 열(column)로 존재하는 특징부들의 x-y 포맷일 수 있다. 일부 실시 형태에서, 패턴은 특징부 및/또는 틈새 영역의 반복 배열일 수 있다. 일부 실시 형태에서, 패턴은 특징부 및/또는 틈새 영역의 랜덤 배열일 수 있다. 본 명세서에 제시된 방법 및 조성물에 사용될 수 있는 예시적인 패턴화된 표면이 미국 특허 제8,778,848호, 제8,778,849호 및 제9,079,148호, 및 미국 특허 출원 공개 제2014/0243224호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
일부 실시 형태에서, 고체 지지체는 표면에 함몰부(depression)들 또는 웰(well)들의 어레이를 포함한다. 이는, 포토리소그래피, 스탬핑 기법, 몰딩 기법 및 마이크로에칭 기법을 포함하지만 이로 한정되지 않는 다양한 기법을 사용하여 당업계에 일반적으로 알려진 바와 같이 제조될 수 있다. 당업자에 의해 이해되는 바와 같이, 사용되는 기법은 어레이 기재의 조성 및 형상에 의존할 것이다.
패턴화된 표면에서의 특징부들은 유리, 규소, 플라스틱, 또는 폴리(N-(5-아지도아세트아미딜펜틸)아크릴아미드-코-아크릴아미드)(PAZAM, 예를 들어, 각각 그 전체가 본 명세서에 참고로 포함되는 미국 특허 출원 공개 제2013/184796호, 국제 특허 출원 공개 WO 2016/066586호, 및 WO 2015/002813호 참조)와 같은 패턴화된 공유 연결된 겔이 있는 다른 적합한 고체 지지체들 상의 웰들(예컨대, 마이크로웰들 또는 나노웰들)의 어레이 내의 웰들일 수 있다. 이 프로세스는 다회의 사이클의 서열분석 실행들에 걸쳐서 안정적일 수 있는 서열분석을 위해 사용되는 겔 패드들을 생성한다. 웰들에 대한 중합체의 공유 연결은 다양한 사용들 동안 구조화된 기재의 수명 전체에 걸쳐서 구조화된 특징부들 내에 겔을 유지하는 데 도움이 된다. 그러나, 다수의 실시 형태에서, 겔은 웰에 공유 연결될 필요는 없다. 예를 들어, 일부 조건들에서, 구조화된 기재의 어떠한 부분에도 공유적으로 부착되지 않은 실란 무함유 아크릴아미드(SFA, 예를 들어, 전체적으로 본 명세서에 참고로 포함되는 미국 특허 제8,563,477호 참조)가 겔 재료로서 사용될 수 있다.
특정 실시 형태에서, 구조화된 기재는, 고체 지지체 재료를 웰(예를 들어, 마이크로웰 또는 나노웰)로 패턴화시키고, 패턴화된 지지체를 겔 재료(예를 들어, PAZAM, SFA 또는 이들의 화학적으로 변형된 변이체, 예컨대 SFA의 아지도 분해된(azidolyzed) 버전(아지도-SFA))로 코팅하고, 예를 들어, 화학적 또는 기계적 폴리싱을 통해서, 겔 코팅된 지지체를 폴리싱하여 웰 내에 겔을 보유시키지만 웰들 사이의 구조화된 기재의 표면 상의 틈새 영역으로부터 실질적으로 모든 겔을 제거하거나 비활성화시킴으로써 제조될 수 있다. 프라이머 핵산은 겔 재료에 부착될 수 있다. 이어서, 표적 핵산(단편화된 인간 게놈)의 용액이 폴리싱된 기재와 접촉될 수 있고, 따라서, 개별 표적 핵산이 겔 재료에 부착된 프라이머들과의 상호작용들을 통해 개별 웰들을 시딩할 것이지만; 표적 핵산은 겔 재료의 부재 또는 비활성으로 인해 사이 영역들을 점유하지 않을 것이다. 표적 핵산의 증폭은 틈새 영역들 내의 겔의 부재 또는 비활성이 성장하는 핵산 콜로니의 외향 이동을 방지하기 때문에 웰들에 국한될 것이다. 이 프로세스는 편리하게 제조가능하여, 스케일링가능하고 통상적인 마이크로-제조 또는 나노-제조 방법들을 활용한다.
본 발명은 단지 하나의 증폭 프라이머만이 고정화되는 "고상" 증폭 방법을 포함하지만(다른 하나의 프라이머는 통상적으로 자유 용액 중에 존재함), 고체 지지체에는 고정화된 정방향 및 역방향 프라이머 둘 모두가 제공되는 것이 바람직하다. 실제로, 증폭 과정은 증폭을 지속하는 데 과량의 프라이머를 필요로 하기 때문에, 고체 지지체 상에 고정화된 '복수'의 동일한 정방향 프라이머 및/또는 '복수'의 동일한 역방향 프라이머가 존재할 것이다. 따라서, 정방향 및 역방향 프라이머에 대한 본 명세서에서의 언급은, 문맥이 달리 지시하지 않는 한, '복수'의 그러한 프라이머를 포함하는 것으로 해석되어야 한다.
숙련된 독자에 의해 이해되는 바와 같이, 임의의 주어진 증폭 반응은 증폭될 주형에 특이적인 적어도 하나의 유형의 정방향 프라이머 및 적어도 하나의 유형의 역방향 프라이머를 필요로 한다. 그러나, 소정 실시 형태에서, 정방향 및 역방향 프라이머는 동일한 서열의 주형-특이적 부분을 포함할 수 있고, 완전히 동일한 뉴클레오티드 서열 및 구조(임의의 비-뉴클레오티드 변형을 포함함)를 가질 수 있다. 다시 말해서, 단지 하나의 유형의 프라이머만을 사용하여 고상 증폭을 수행하는 것이 가능하며, 그러한 단일 프라이머 방법은 본 발명의 범주 내에 포함된다. 다른 실시 형태는, 동일한 주형-특이적 서열을 함유하지만 일부 다른 구조적 특징이 상이한 정방향 및 역방향 프라이머를 사용할 수 있다. 예를 들어, 한 유형의 프라이머는 다른 유형에 존재하지 않는 비-뉴클레오티드 변형을 함유할 수 있다.
본 발명의 모든 실시 형태에서, 고상 증폭을 위한 프라이머는 바람직하게는 프라이머의 5' 말단 또는 그 부근에서 고체 지지체에 단일점 공유 부착에 의해 고정화되어, 프라이머의 주형-특이적 부분을 자유롭게 남겨두어 이의 동종 주형에 어닐링할 수 있으며, 프라이머 연장을 위해 3' 하이드록실 기를 자유로운 상태로 둘 수 있다. 당업계에 알려진 임의의 적합한 공유 부착 수단이 이러한 목적을 위해 사용될 수 있다. 선택된 부착 화학은 고체 지지체의 성질, 및 그에 적용되는 임의의 유도체화 또는 작용화에 따라 좌우될 것이다. 프라이머 그 자체는 부착을 용이하게 하기 위하여, 비-뉴클레오티드 화학적 변형일 수 있는 모이어티를 포함할 수 있다. 특정 실시 형태에서, 프라이머는 5' 말단에 황-함유 친핵체, 예컨대 포스포로티오에이트 또는 티오포스페이트를 포함할 수 있다. 고체-지지된 폴리아크릴아미드 하이드로겔의 경우, 이러한 친핵체는 하이드로겔에 존재하는 브로모아세트아미드 기에 결합할 것이다. 프라이머 및 주형을 고체 지지체에 부착시키는 더 특별한 수단은 국제 특허 출원 공개 WO 05/065814호에 자세히 기재된 바와 같이, 중합된 아크릴아마이드 및 N-(5-브로모아세트아미딜펜틸)아크릴아미드(BRAPA)로 구성된 하이드로겔에 대한 5' 포스포로티오에이트 부착을 통한 것이다.
본 발명의 소정의 실시 형태는, 예를 들어 생체 분자, 예컨대 폴리뉴클레오티드에 대한 공유 부착을 가능하게 하는 반응성 기를 포함하는 중간 재료의 층 또는 코팅의 적용에 의해, "기능화된" 불활성 기재 또는 매트릭스(예를 들어, 유리 슬라이드, 중합체 비드 등)로 구성되는 고체 지지체를 사용할 수 있다. 이러한 지지체의 예에는 유리와 같은 불활성 기재 상에 지지된 폴리아크릴아미드 하이드로겔이 포함되지만 이로 한정되지 않는다. 그러한 실시 형태에서, 생체분자(예를 들어, 폴리뉴클레오티드)는 중간 재료(예를 들어, 하이드로겔)에 직접 공유 부착될 수 있지만, 중간 재료는 그 자체가 기재 또는 매트릭스(예를 들어, 유리 기재)에 비공유 부착될 수 있다. 따라서, 용어 "고체 지지체에 대한 공유 부착"은 이러한 유형의 배열을 포함하는 것으로 해석되어야 한다.
풀링된 샘플은 비드 상에서 증폭될 수 있으며, 여기서 각각의 비드는 정방향 및 역방향 증폭 프라이머를 함유한다. 특정 실시 형태에서, 본 발명의 제1 태양, 제2 태양 또는 제3 태양에 따라 제조된 주형들의 라이브러리는 고상 증폭, 그리고 더 구체적으로는 고상 등온 증폭에 의해, 미국 특허 출원 공개 제2005/0100900호, 미국 특허 제7,115,400호, 국제 특허 출원 공개 WO 00/18957호 및 WO 98/44151호에 기재된 것들과 유사하게, 핵산 콜로니들의 클러스터링된 어레이를 제조하는 데 사용되며, 이들 내용은 전체적으로 본 명세서에 참고로 포함된다. 용어 '클러스터'와 '콜로니'는 복수의 동일한 고정화된 핵산 가닥들 및 복수의 동일한 고정화된 상보적 핵산 가닥들로 구성되는 고체 지지체 상의 별개의 부위를 지칭하기 위해 본 명세서에서 상호교환가능하게 사용된다. 용어 "클러스터링된 어레이"는 그러한 클러스터들 또는 콜로니들로부터 형성된 어레이를 지칭한다. 이와 관련하여, 용어 "어레이"는 클러스터들의 정렬된 배열을 필요로 하는 것으로 이해되어서는 안 된다.
용어 "고상" 또는 "표면"은 프라이머를 평탄한 표면, 예를 들어 유리, 실리카 또는 플라스틱 현미경 슬라이드 또는 유사한 플로우 셀 장치에 부착하는 평면 어레이; 1개 또는 2개의 프라이머가 비드에 부착되고, 비드가 증폭되는 비드; 또는 비드가 증폭된 후 표면 상의 비드 어레이를 의미하도록 사용된다.
클러스터링된 어레이는 국제 특허 출원 공개 WO 98/44151호에 기재된 바와 같은 서모사이클링 공정, 또는 온도가 일정하게 유지되는 공정 중 어느 하나를 사용하여 제조될 수 있으며, 연장 및 변성의 사이클은 시약의 변화를 사용하여 수행된다. 그러한 등온 증폭 방법은 국제 특허 출원 공개 WO 02/46456호 및 미국 특허 출원 공개 제2008/0009420호에 기재되어 있으며, 이들은 전체적으로 본 명세서에 참고로 포함된다. 더 낮은 온도가 등온 과정에 필요하기 때문에, 이것이 특히 바람직하다.
본 명세서에 기재되거나 당업계에 일반적으로 알려진 임의의 증폭 방법은 범용 또는 표적-특이적 프라이머와 함께 이용되어 고정화된 DNA 단편을 증폭시킬 수 있음이 이해될 것이다. 증폭에 적합한 방법은, 전체적으로 본 명세서에 참고로 포함된 미국 특허 제8,003,354호에 기재된 바와 같이, 폴리머라제 연쇄 반응(PCR), 가닥 치환 증폭(SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)을 포함하지만 이로 한정되지 않는다. 상기 증폭 방법은 하나 이상의 관심 핵산을 증폭시키기 위해 사용될 수 있다. 예를 들어, 멀티플렉스 PCR을 비롯한 PCR, SDA, TMA, NASBA 등이 고정화된 DNA 단편을 증폭시키는 데 이용될 수 있다. 일부 실시 형태에서, 관심 폴리뉴클레오티드에 특이적으로 유도되는 프라이머가 증폭 반응에 포함된다.
폴리뉴클레오티드의 증폭을 위한 다른 적합한 방법은 올리고뉴클레오티드 연장 및 라이게이션, 롤링 서클 증폭(RCA)(문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)]) 및 올리고뉴클레오티드 라이게이션 분석(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; 유럽 특허 제0 320 308 B1호; 유럽 특허 제0 336 731 B1호; 유럽 특허 제0 439 182 B1호; 국제 특허 출원 공개 WO 90/01069호; WO 89/12696호; 및 WO 89/09835호 참조) 기술을 포함할 수 있다. 이들 증폭 방법은 고정화된 DNA 단편을 증폭시키도록 설계될 수 있음이 이해될 것이다. 예를 들어, 일부 실시 형태에서, 증폭 방법은 관심 핵산에 특이적으로 유도되는 프라이머를 함유하는 라이게이션 프로브 증폭 또는 올리고뉴클레오티드 라이게이션 검정(OLA) 반응을 포함할 수 있다. 일부 실시 형태에서, 증폭 방법은, 관심 핵산에 특이적으로 유도되는 프라이머를 함유하는 프라이머 연장-라이게이션 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 라이게이션 프라이머의 비제한적인 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 의해 예시된 바와 같은 골든게이트(GoldenGate) 검정(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.)에 사용되는 프라이머를 포함할 수 있다.
본 발명의 방법에 사용될 수 있는 예시적인 등온 증폭 방법은, 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 의해 예시된 바와 같은 다치환 증폭(MDA) 또는, 예를 들어, 미국 특허 제6,214,587호에 의해 예시된 등온 가닥 치환 핵산 증폭을 포함하만 이로 한정되지 않는다. 본 발명에 사용될 수 있는 다른 비-PCR-기반 방법은, 예를 들어 보자면, 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호, 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 치환 증폭(SDA), 또는 예를 들어 문헌[Lage et al., Genome Res. 13:294-307 (2003)]에 기재된 초분지형 가닥 치환 증폭을 포함한다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥-치환 파이(Phi) 29 폴리머라제 또는 Bst DNA 폴리머라제 큰 단편, 5'->3′ 엑소-와 함께 사용될 수 있다. 이들 폴리머라제의 사용은 그들의 높은 진행성(processivity) 및 가닥 치환 활성을 활용한다. 높은 진행성으로 인해 폴리머라제는 길이가 10 내지 20 kb인 단편을 생성할 수 있다. 상술한 바와 같이, 클레노우 폴리머라제와 같이 낮은 진행성 및 가닥-치환 활성을 갖는 폴리머라제를 사용하여 등온 조건 하에서 더 작은 단편을 생성할 수 있다. 증폭 반응, 조건 및 구성요소에 대한 추가 설명은, 전체적으로 본 명세서에 참고로 포함된 미국 특허 제7,670,810호의 개시내용에 상세히 기재되어 있다.
본 발명에 유용한 다른 폴리뉴클레오티드 증폭 방법은, 예를 들어 문헌[Grothues et al. Nucleic Acids Res. 21(5):1321-2 (1993)]에 기재된 바와 같은 불변 5' 영역 다음에 랜덤 3' 영역을 갖는 2-도메인 프라이머의 집단을 사용하는 태깅된 PCR이다. 랜덤으로 합성된 3' 영역으로부터의 개별 혼성화에 기초하여 열 변성된 DNA에 대한 다수의 개시를 가능하게 하도록 제1 증폭 라운드가 수행된다. 3' 영역의 성질로 인해, 개시 부위는 게놈 전체에 걸쳐 랜덤한 것으로 고려된다. 그 후에, 비결합된 프라이머는 제거될 수 있고 불변 5' 영역에 상보적인 프라이머를 사용하여 추가의 복제가 일어날 수 있다.
일부 실시 형태에서, 등온 증폭은 배제 증폭(ExAmp)이라고도 지칭되는 동력학적 배제 증폭(kinetic exclusion amplification, KEA)을 사용하여 수행될 수 있다. 본 발명의 핵산 라이브러리는 증폭 시약을 반응시켜 복수의 증폭 부위들을 생성하는 단계를 포함하는 방법을 사용하여 제조될 수 있으며, 복수의 증폭 부위들은 각각, 그 부위를 시딩한 개별 표적 핵산으로부터의 앰플리콘들의 실질적인 클론 집단을 포함한다. 일부 실시 형태에서, 증폭 반응은 각각의 증폭 부위의 용량을 충전하기에 충분한 수의 앰플리콘이 생성될 때까지 진행된다. 이러한 방식으로 이미 시딩된 부위를 최대한으로 충전시키면, 표적 핵산이 그 부위에서 랜딩하고 증폭하여, 그 부위에서 앰플리콘의 클론 집단을 생성하는 것을 억제한다. 일부 실시 형태에서, 제2 표적 핵산이 그 부위에 도달하기 전에 증폭 부위가 최대한으로 충전되지 않은 경우에도 명백한 클론성이 달성될 수 있다. 일부 조건 하에서, 제1 표적 핵산의 증폭은 그 부위로 수송되는 제2 표적 핵산으로부터의 카피의 생성을 효과적으로 능가하거나 압도하기에 충분한 수의 카피가 만들어지는 지점까지 진행될 수 있다. 예를 들어, 직경이 500 nm 미만인 원형 특징부 상에서 가교 증폭 과정을 사용하는 실시 형태에서, 제1 표적 핵산에 대한 14회 사이클의 지수함수적 증폭 후에, 동일한 부위에서 제2 표적 핵산으로부터의 오염은 일루미나 서열분석 플랫폼 상에서의 합성에 의한 서열분석의 분석에 악영향을 미치기에 불충분한 수의 오염된 앰블리콘을 생성할 것임을 알았다.
어레이 내의 증폭 부위들은 특정 실시 형태에서 완전히 클론일 수 있지만 그럴 필요는 없다. 오히려, 일부 응용에 있어서는, 개별 증폭 부위는 제1 표적 핵산으로부터의 앰플리콘이 우세하게 존재할 수 있고, 제2 표적 핵산으로부터의 낮은 수준의 오염 앰플리콘을 또한 가질 수 있다. 어레이는, 오염 수준이 어레이의 후속 사용에 허용 불가능한 영향을 갖지 않는 한, 낮은 수준의 오염 앰플리콘을 갖는 하나 이상의 증폭 부위를 가질 수 있다. 예를 들어, 어레이를 검출 응용에서 사용하려는 경우, 허용가능한 수준의 오염은 검출 기법의 신호 대 노이즈 또는 분해능에 허용 불가능한 방식으로 영향을 주지 않는 수준일 것이다. 따라서, 명백한 클론성은 일반적으로 본 명세서에 언급된 방법에 의해 제조된 어레이의 특정 용도 또는 응용과 관련될 것이다. 특정 응용을 위해 개별 증폭 부위에서 허용가능할 수 있는 예시적인 오염 수준은 최대 0.1%, 0.5%, 1%, 5%, 10% 또는 25%의 오염 앰플리콘을 포함하지만 이로 한정되지 않는다. 어레이는 이러한 예시적인 수준의 오염 앰플리콘을 갖는 하나 이상의 증폭 부위를 포함할 수 있다. 예를 들어, 어레이 내의 증폭 부위들 중 최대 5%, 10%, 25%, 50%, 75% 또는 심지어 100%가 일부 오염 앰플리콘을 가질 수 있다. 부위의 어레이 또는 다른 집합체에서, 부위의 적어도 50%, 75%, 80%, 85%, 90%, 95% 또는 99% 또는 그 이상이 클론이거나 명백히 클론일 수 있음이 이해될 것이다.
일부 실시 형태에서, 또 다른 사건 또는 과정이 일어나는 것을 효과적으로 배제하기에 충분히 신속한 속도로 과정이 일어나는 경우 동력학적 배제가 일어날 수 있다. 예를 들어, 핵산 어레이의 제조를 고려하여, 어레이의 부위들이 용액으로부터의 표적 핵산으로 랜덤하게 시딩되고, 표적 핵산의 카피가 증폭 과정에서 생성되어 시딩된 부위 각각을 최대한으로 충전시킨다. 본 발명의 동력학적 배제 방법에 따라, 시딩 및 증폭 과정은 증폭 속도가 시딩 속도를 초과하는 조건 하에서 동시에 진행될 수 있다. 그러한 바와 같이, 카피가 제1 표적 핵산에 의해 시딩된 부위에서 제조되는 속도가 비교적 신속한 경우에는, 제2 핵산이 증폭을 위해 그 부위를 시딩하는 것을 효과적으로 배제시킬 것이다. 동력학적 배제 증폭 방법은 미국 특허 출원 공개 제2013/0338042호의 개시내용에 상세하게 기술된 바와 같이 수행될 수 있으며, 이는 전체적으로 본 명세서에 참고로 포함된다.
동력학적 배제는 증폭을 개시하기 위해 상대적으로 느린 속도(예를 들어, 표적 핵산의 제1 카피를 제조하는 느린 속도)를 이용하는 반면, 반면 표적 핵산(또는 표적 핵산의 제1 카피)의 후속 카피를 제조하기 위해 상대적으로 빠른 속도를 이용할 수 있다. 앞선 단락의 예에서, 동력학적 배제는, 표적 핵산 시딩은 비교적 느린 속도(예를 들어, 비교적 느린 확산 또는 수송)로 일어나는 반면, 그 부위를 효적 핵산 시드의 카피로 충전시키는 증폭은 상대적으로 빠른 속도로 일어나기 때문에 발생한다. 다른 예시적인 실시 형태에서, 동력학적 배제는, 부위를 시딩한 표적 핵산의 제1 카피의 형성은 지연되는(예를 들어, 지연된 또는 느린 활성화) 반면, 그 부위를 충전시키는 후속 카피는 상대적으로 빠른 속도로 일어나기 때문에 발생할 수 있다. 이 예에서, 개별 부위는 몇몇 상이한 표적 핵산으로 시딩되었을 수 있다(예를 들어, 몇몇 표적 핵산은 증폭 이전에 각각의 부위에서 존재할 수 있다). 그러나, 임의의 주어진 표적 핵산을 위한 제1 카피 형성은 랜덤하게 활성화될 수 있어서, 제1 카피 형성의 평균 속도는 후속 카피가 생성되는 속도에 비해 상대적으로 느리다. 이러한 경우, 개별 부위가 몇몇 상이한 표적 핵산으로 시딩되었을 수 있지만, 동력학적 배제는 이러한 표적 핵산들 중 단지 하나만이 증폭될 수 있게 할 것이다. 더 구체적으로는, 일단 제1 표적 핵산이 증폭을 위해 활성화되었으면, 그 부위는 이의 카피로 신속하게 최대한으로 충전되어, 제2 표적 핵산의 카피가 그 부위에서 제조되는 것을 방지할 것이다.
증폭 시약은, 앰플리콘 형성을 용이하게 하고, 일부 경우에 앰플리콘 형성의 속도를 증가시키는 추가의 성분을 포함할 수 있다. 예에는 재조합효소가 있다. 재조합효소는 반복된 침입/연장을 가능하게 함으로써 앰플리콘 형성을 용이하게 할 수 있다. 더 구체적으로는, 재조합효소는 앰플리콘 형성을 위한 주형으로서 표적 핵산을 사용하여 폴리머라제에 의한 프라이머의 연장 및 폴리머라제에 의한 표적 핵산의 침입을 용이하게 할 수 있다. 이러한 과정은 연쇄 반응으로서 반복될 수 있는데, 여기서는 침입/연장의 매 라운드마다 그로부터 생성된 앰플리콘이 후속 라운드에서 주형으로서의 역할을 한다. 이러한 과정은 표준 PCR보다 더 신속하게 일어날 수 있는데, 그 이유는 (예를 들어, 가열 또는 화학적 변성을 통한) 변성 사이클이 필요하지 않기 때문이다. 그러한 바와 같이, 재조합효소-촉진 증폭은 등온적으로 수행될 수 있다. 증폭을 용이하게 하기 위해 재조합효소-촉진 증폭 시약에 ATP 또는 다른 뉴클레오티드(또는 일부 경우에는 이의 비가수분해성 유사체)를 포함하는 것이 일반적으로 바람직하다. 재조합효소와 단일 가닥 결합(SSB) 단백질의 혼합물은 SSB가 증폭을 더욱 용이하게 할 수 있기 때문에 특히 유용하다. 재조합효소-촉진 증폭을 위한 예시적인 제형은 TwistDx(영국 케임브리지 소재)에 의해 TwistAmp 키트로서 상업적으로 판매되는 것들을 포함한다. 재조합효소-촉진 증폭 시약의 유용한 성분 및 반응 조건은 미국 특허 제5,223,414호 및 미국 특허 제7,399,590호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
앰플리콘 형성을 용이하게 하기 위해 그리고 일부 경우에 앰플리콘 형성의 속도를 증가시키기 위해 증폭 시약 내에 포함될 수 있는 성분의 다른 예는 헬리카제이다. 헬리카제는 앰플리콘 형성의 연쇄 반응을 가능하게 함으로써 앰플리콘 형성을 용이하게 할 수 있다. 이러한 과정은 표준 PCR보다 더 신속하게 일어날 수 있는데, 그 이유는 (예를 들어, 가열 또는 화학적 변성을 통한) 변성 사이클이 필요하지 않기 때문이다. 그러한 바와 같이, 헬리카제-촉진 증폭은 등온적으로 수행될 수 있다. 헬리카제와 단일 가닥 결합(SSB) 단백질의 혼합물은 SSB가 증폭을 더욱 용이하게 할 수 있기 때문에 특히 유용하다. 헬리카제-촉진 증폭을 위한 예시적인 제형은 Biohelix(미국 매사추세츠주 비벌리 소재)로부터 IsoAmp 키트로서 상업적으로 판매되는 것들을 포함한다. 또한, 헬리카제 단백질을 포함하는 유용한 제형의 예는 미국 특허 제7,399,590호 및 미국 특허 제7,829,284호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
앰플리콘 형성을 용이하게 하기 위해 그리고 일부 경우에 앰플리콘 형성의 속도를 증가시키기 위해 증폭 시약 내에 포함될 수 있는 성분의 또 다른 예는 기점 결합 단백질(origin binding protein)이다.
서열분석에서의 사용
어댑터-표적-어댑터 분자를 표면에 부착한 후에, 고정화되고 증폭된 어댑터-표적-어댑터 분자의 서열을 결정한다. 서열분석은 임의의 적합한 서열분석 기법을 사용하여 수행할 수 있으며, 가닥 재합성을 포함한, 고정화되고 증폭된 어댑터-표적-어댑터 분자의 서열을 결정하는 방법은 당업계에 알려져 있으며, 예를 들어 Bignell et al.(미국 특허 제8,053,192호), Gunderson et al.(국제 특허 출원 공개 WO2016/130704호), Shen et al.(미국 특허 제8,895,249호), 및 Pipenburg et al.(미국 특허 제9,309,502호)에 기재되어 있다.
본 명세서에 기재된 방법은 다양한 핵산 서열분석 기법과 함께 사용될 수 있다. 특히 적용가능한 기법은, 핵산들이 어레이 내의 고정된 위치에 부착되어, 이들의 상대 위치가 변화하지 않고, 어레이가 반복적으로 이미징되는 것들이다. 예를 들어, 하나의 뉴클레오티드 염기 유형을 다른 것과 구별하는 데 사용되는 상이한 표지들과 일치하는 상이한 색상 채널들에서 이미지가 획득되는 실시 형태가 특히 적용가능하다. 일부 실시 형태에서, 표적 핵산의 뉴클레오티드 서열을 결정하는 과정은 자동화 과정일 수 있다. 바람직한 실시 형태는 합성에 의한 서열분석("SBS") 기법을 포함한다.
SBS 기법은 일반적으로 주형 가닥에 대한 뉴클레오티드의 반복적 부가를 통한 신생 핵산 가닥의 효소적 연장을 수반한다. SBS의 전통적인 방법에서는, 단일 뉴클레오티드 단량체가 매 전달 시마다 폴리머라제의 존재 하에서 표적 뉴클레오티드에 제공될 수 있다. 그러나, 본 명세서에 기재된 방법에서는, 하나 초과의 유형의 뉴클레오티드 단량체가 전달 시에 폴리머라제의 존재 하에서 표적 핵산에 제공될 수 있다.
SBS는, 종결자 모이어티를 갖는 뉴클레오티드 단량체 또는 어떠한 종결자 모이어티도 결여되어 있는 것들을 이용할 수 있다. 종결자가 결여되어 있는 뉴클레오티드 단량체를 이용하는 방법은, 예를 들어, 하기에 더 상세히 설명되는 바와 같이, γ-포스페이트-표지화된 뉴클레오티드를 사용하는 파이로시퀀싱(pyrosequencing) 및 서열분석을 포함한다. 종결자가 결여되어 있는 뉴클레오티드 단량체를 사용하는 방법에서는, 매 사이클마다 부가되는 뉴클레오티드의 수는 일반적으로 가변적이며, 주형 서열 및 뉴클레오티드 전달 방식에 좌우된다. 종결자 모이어티를 갖는 뉴클레오티드 단량체를 이용하는 SBS 기법에서, 종결자는 다이데옥시뉴클레오티드를 이용하는 기존의 생어(Sanger) 서열분석의 경우와 같이, 사용된 서열분석 조건 하에서 실질적으로 비가역적일 수 있거나, 종결자는 Solexa(현재, Illumina, Inc.)에 의해 개발된 서열분석 방법의 경우와 같이 가역적일 수 있다.
SBS 기법은 표지 모이어티를 갖는 뉴클레오티드 단량체 또는 표지 모이어티가 결여되어 있는 것들을 이용할 수 있다. 따라서, 하기에 기초하여 도입 사건이 검출될 수 있다: 표지의 특성, 예컨대 표지의 형광; 뉴클레오티드 단량체의 특성, 예컨대 분자량 또는 전하; 뉴클레오티드의 도입의 부산물, 예컨대, 파이로포스페이트의 방출; 또는 기타 등등. 2개 이상의 상이한 뉴클레오티드가 서열분석 시약 중에 존재하는 실시 형태에서, 상이한 뉴클레오티드들은 서로 구별가능할 수 있거나, 대안적으로 2개 이상의 상이한 표지가 사용되고 있는 검출 기법 하에서 구별 불가능할 수 있다. 예를 들어, 서열분석 시약 중에 존재하는 상이한 뉴클레오티드들은 상이한 표지들을 가질 수 있고, 이들은 Solexa(현재 Illumina, Inc.)에 의해 개발된 서열분석 방법에 의해 예시된 바와 같이 적절한 광학체를 사용하여 구별될 수 있다.
바람직한 실시 형태는 파이로시퀀싱 기법을 포함한다. 파이로시퀀싱은, 특정 뉴클레오티드가 신생 가닥 내로 도입될 때, 무기 파이로포스페이트(PPi)의 방출을 검출한다(문헌[Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9]; 문헌[Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11]; 문헌[Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363]; 미국 특허 제6,210,891호; 제6,258,568호 및 제6,274,320호, 이들의 개시내용은 전체적으로 본 명세서에 참고로 포함됨). 파이로시퀀싱에서는, 방출된 PPi가 ATP 설퍼라제에 의해 아데노신 트라이포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 수준은 루시퍼라제-생성된 광자를 통해 검출된다. 서열분석될 핵산은 어레이 내의 특징부에 부착될 수 있고, 어레이는 어레이의 특징부에서의 뉴클레오티드의 도입으로 인해 생성되는 화학발광 신호를 포획하기 위해 이미징될 수 있다. 이미지는 어레이가 특정 뉴클레오티드 유형(예를 들어, A, T, C 또는 G)으로 처리된 후에 얻어질 수 있다. 각각의 뉴클레오티드 유형의 첨가 후에 얻어지는 이미지는 어레이 내의 어떠한 특징부가 검출되는지와 관련하여 상이할 것이다. 이미지에서의 이러한 차이는 어레이 상의 특징부들의 상이한 서열 내용물을 반영한다. 그러나, 각각의 특징부의 상대적인 위치는 이미지에서 변하지 않은 채로 유지될 것이다. 이미지는 본 명세서에 기재된 방법을 사용하여 저장, 처리 및 분석될 수 있다. 예를 들어, 어레이를 각각의 상이한 뉴클레오티드 유형으로 처리한 후에 얻어진 이미지는 가역적 종결자-기반 서열분석 방법을 위해 상이한 검출 채널들로부터 얻어진 이미지에 대해 본 명세서에 예시된 것과 동일한 방식으로 취급될 수 있다.
SBS의 다른 예시적인 유형에서는, 사이클 서열분석이, 예를 들어 보자면, 예를 들어 국제 특허 출원 공개 WO 04/018497호 및 미국 특허 제7,057,026호에 기재된 바와 같은 절단가능한 또는 광표백성 염료 표지를 함유하는 가역적 종결자 뉴클레오티드의 단계적 부가에 의해 달성되며, 이의 개시내용은 본 명세서에 참고로 포함된다. 이러한 접근법은 Solexa(현재 Illumina Inc.)에 의해 상업화되고 있으며, 또한 국제 특허 출원 공개 WO 91/06678호 및 WO 07/123,744호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 종결이 역전될 수 있고 또한 형광 표지가 절단될 수 있는 형광-표지화된 종결자의 이용가능성은 효율적인 주기적 가역적 종결(CRT) 서열분석을 용이하게 한다. 폴리머라제는 또한 이들 변형된 뉴클레오티드를 효율적으로 도입하고 그로부터 연장하도록 공동조작될 수 있다.
바람직하게는, 가역적 종결자-기반 서열분석 실시 형태에서, 표지는 SBS 반응 조건 하에서 연장을 실질적으로 억제하지 않는다. 그러나, 검출 표지는, 예를 들어 절단 또는 분해에 의해 제거가능할 수 있다. 어레이된 핵산 특징부들 내로 표지를 도입한 후에 이미지가 캡처될 수 있다. 특정 실시 형태에서, 매 사이클마다 어레이에 4개의 상이한 뉴클레오티드 유형을 동시에 전달하는 것을 포함하고, 각각의 뉴클레오티드 유형은 스펙트럼적으로 구별되는 표지를 갖는다. 이어서, 4개의 이미지가 얻어질 수 있는데, 이들은 각각, 4개의 상이한 표지들 중 하나에 대해 선택적인 검출 채널을 사용한다. 대안적으로, 상이한 뉴클레오티드 유형들은 순차적으로 부가될 수 있으며, 각각의 부가 단계 사이에 어레이의 이미지가 얻어질 수 있다. 그러한 실시 형태에서, 각각의 이미지는 특정 유형의 뉴클레오티드가 도입된 핵산 특징을 나타낼 것이다. 상이한 특징부들은 각각의 특징부의 상이한 서열 내용물로 인해 상이한 이미지들에 존재하거나 부재할 것이다. 그러나, 특징부들의 상대적인 위치는 이미지에서 변하지 않은 채로 유지될 것이다. 그러한 가역적 종결자-SBS 방법으로부터 얻어진 이미지는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 이미지 캡처 단계 후에, 표지는 제거될 수 있고, 가역적 종결자 모이어티는 뉴클레오티드 부가 및 검출의 후속 사이클 동안 제거될 수 있다. 특정 사이클에서 검출된 후에 그리고 후속 사이클 전에 표지를 제거하는 것은 사이클들 사이의 백그라운드 신호 및 크로스토크(crosstalk)를 감소시킨다는 이점을 제공할 수 있다. 유용한 표지 및 제거 방법의 예가 하기에 기재되어 있다.
특정 실시 형태에서, 뉴클레오티드 단량체들 중 일부 또는 전부는 가역적 종결자를 포함할 수 있다. 그러한 실시 형태에서, 가역적 종결자/절단가능한 형광단은 3' 에스테르 결합을 통해 리보스 모이어티에 연결된 형광단을 포함할 수 있다(문헌[Metzker, Genome Res. 15:1767-1776 (2005)]), 이는 본 명세서에 참고로 포함됨). 다른 접근법은 형광 표지의 절단으로부터 종결자 화학물질을 분리하였다(문헌[Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005)], 이는 전체적으로 본 명세서에 참고로 포함됨). Ruparel et al.은, 작은 3' 알릴 기를 사용하여 연장을 차단하지만, 팔라듐 촉매를 사용한 짧은 처리에 의해 쉽게 탈블록킹될 수 있는 가역적 종결자의 개발을 기술하였다. 형광단은 장파장 UV 광에 30초간 노출시킴으로써 용이하게 절단될 수 있는 광절단가능한 링커를 통해 염기에 부착되었다. 따라서, 이황화물 환원 또는 광절단 중 어느 하나가 절단가능한 링커로서 사용될 수 있다. 가역적 종결에 대한 다른 접근법은 dNTP 상에 벌키한 염료를 배치한 후에 보장되는 천연 종결의 사용이다. dNTP 상의 하전된 벌키한 염료의 존재는 입체 및/또는 정전기 장애를 통해 효과적인 종결자로서 작용할 수 있다. 하나의 도입 사건의 존재는, 염료가 제거되지 않는 한, 추가의 도입을 방지한다. 염료의 절단은 형광단을 제거하고, 종결을 효과적으로 역전시킨다. 변형된 뉴클레오티드의 예는 또한 미국 특허 제7,427,673호 및 제7,057,026호에 기재되어 있으며, 이의 개시내용은 전체적으로 본 명세서에 참고로 포함된다.
본 명세서에 기재된 방법 및 시스템과 함께 이용될 수 있는 추가의 예시적인 SBS 시스템 및 방법이 미국 특허 출원 공개 제2007/0166705호, 제2006/0188901호, 제2006/0240439호, 제2006/0281109호, 제2012/0270305호, 및 제2013/0260372호, 미국 특허 제7,057,026호, PCT 공개 WO 05/065814호, 미국 특허 출원 공개 제2005/0100900호, 및 PCT 공개 WO 06/064199호 및 WO 07/010,251호에 기재되어 있으며, 이의 개시내용은 전체적으로 본 명세서에 참고로 포함된다.
일부 실시 형태는 4개 미만의 상이한 표지를 사용하는 4개의 상이한 뉴클레오티드의 검출을 이용할 수 있다. 예를 들어, SBS는 미국 특허 출원 공개 제2013/0079232호에 포함된 자료에 기술된 방법 및 시스템을 이용하여 수행될 수 있다. 첫 번째 예로서, 한 쌍의 뉴클레오티드 유형이 동일한 파장에서 검출될 수 있지만, 그 쌍의 하나의 구성원에 대해 다른 하나의 구성원과 비교한 강도의 차이에 기초하여, 또는 그 쌍의 하나의 구성원에 대해, 그 쌍의 다른 구성원에 대해 검출된 신호와 비교하여, 명백한 신호가 출현되게 하거나 소실되게 하는 (예를 들어, 화학적 변형, 광화학적 변형 또는 물리적 변형을 통한) 변화에 기초하여 구별될 수 있다. 두 번째 예로서, 4개의 상이한 뉴클레오티드 유형 중 3개는 특정 조건 하에서 검출될 수 있는 반면, 제4 뉴클레오티드 유형은 그러한 조건 하에서 검출가능한 표지가 결여되어 있거나, 그러한 조건 하에서 최소한으로 검출된다(예를 들어, 백그라운드 형광 등으로 인한 최소 검출 등). 핵산 내로의 처음 3개의 뉴클레오티드 유형의 도입은 이들 각각의 신호의 존재를 기반으로 결정될 수 있고, 핵산 내로의 제4 뉴클레오티드 유형의 도입은 임의의 신호의 부재 또는 최소한의 검출에 기초하여 결정될 수 있다. 세 번째 예로서, 하나의 뉴클레오티드 유형은 2개의 상이한 채널에서 검출되는 표지(들)를 포함할 수 있는 반면, 다른 뉴클레오티드 유형들은 단 하나의 채널에서만 검출된다. 상술한 3개의 예시적인 구성은 상호배타적인 것으로 간주되지 않으며, 다양한 조합으로 사용될 수 있다. 3개의 모든 예를 조합한 예시적인 실시 형태는 제1 채널에서 검출되는 제1 뉴클레오티드 유형(예를 들어, 제1 여기 파장에 의해 여기되는 경우 제1 채널에서 검출되는 표지를 갖는 dATP), 제2 채널에서 검출되는 제2 뉴클레오티드 유형(예를 들어, 제2 여기 파장에 의해 여기되는 경우 제2 채널에서 검출되는 표지를 갖는 dCTP), 제1 채널 및 제2 채널 둘 모두에서 검출되는 제3 뉴클레오티드 유형(예를 들어, 제1 여기 파장 및/또는 제2 여기 파장에 의해 여기되는 경우 두 채널 모두에서 검출되는 적어도 하나의 표지를 갖는 dTTP) 및 어느 하나의 채널에서도 검출되지 않거나 최소한으로 검출되는 표지가 결여된 제4 뉴클레오티드 유형(예를 들어, 표지를 갖지 않는 dGTP)을 사용하는 형광-기반 SBS 방법이다.
또한, 미국 특허 출원 공개 제2013/0079232호에 포함된 자료에 기재된 바와 같이, 단일 채널을 사용하여 서열분석 데이터가 얻어질 수 있다. 그러한 이른바 1-염료 서열분석 접근법에서는, 제1 뉴클레오티드 유형은 표지화되지만, 표지는 제1 이미지가 생성된 후에 제거되고, 제2 뉴클레오티드 유형은 제1 이미지가 생성된 후에만 표지화된다. 제3 뉴클레오티드 유형은 제1 이미지 및 제2 이미지 둘 모두에서 그의 표지를 보유하고, 제4 뉴클레오티드 유형은 두 이미지 모두에서 표지화되지 않은 상태로 유지된다.
일부 실시 형태는 라이게이션 기법에 의한 서열분석을 이용할 수 있다. 그러한 기법은 DNA 리가제를 이용하여 올리고뉴클레오티드를 도입하고 그러한 올리고뉴클레오티드의 도입을 확인한다. 올리고뉴클레오티드는 전형적으로, 올리고뉴클레오티드가 혼성화되는 서열에서 특정 뉴클레오티드의 동일성과 상관관계가 있는 상이한 표지들을 갖는다. 다른 SBS 방법과 마찬가지로, 이미지는 핵산 특징부들의 어레이를 표지화된 서열분석 시약으로 처리한 후에 얻어질 수 있다. 각각의 이미지는 특정 유형의 표지가 도입된 핵산 특징부를 나타낼 것이다. 상이한 특징부들은 각각의 특징부의 상이한 서열 내용물로 인해 상이한 이미지들로 존재하거나 부재하겠지만, 특징부들의 상대적인 위치는 이미지에서 변하지 않은 채로 유지될 것이다. 라이게이션-기반 서열분석 방법으로부터 얻어진 이미지들은 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 본 명세서에 기술된 방법 및 시스템과 함께 이용될 수 있는 예시적인 SBS 시스템 및 방법이 미국 특허 제6,969,488호, 제6,172,218호, 및 제6,306,597호에 기술되어 있으며, 이들의 개시내용은 전체적으로 본 명세서에 참고로 포함된다.
일부 실시 형태는 나노포어 서열분석을 이용할 수 있다(문헌[Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)], 이들의 개시내용은 전체적으로 본 명세서에 참고로 포함됨). 그러한 실시 형태에서, 표적 핵산은 나노포어를 통과한다. 나노포어는 합성 포어 또는 생물학적 막 단백질, 예컨대, α-용혈소일 수 있다. 표적 핵산이 나노포어를 통과할 때, 기공의 전기 전도도의 변동을 측정함으로써 각각의 염기쌍이 확인될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008)], 이들의 개시내용은 전체적으로 본 명세서에 참고로 포함됨). 나노포어 서열분석으로부터 얻어진 데이터는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다. 특히, 데이터는 본 명세서에 기재된 광학 이미지 및 다른 이미지의 예시적인 처리에 따라 이미지으로서 처리될 수 있다.
일부 실시 형태는 DNA 폴리머라제 활성의 실시간 모니터링을 수반하는 방법을 이용할 수 있다. 뉴클레오티드 도입은, 예를 들어 미국 특허 제7,329,492호 및 제7,211,414호 - 이들 둘 모두는 본 명세서에 참고로 포함됨 - 에 기술된 바와 같이 형광단 보유 폴리머라제와 γ-포스페이트 표지화된 뉴클레오티드 사이의 형광 공명 에너지 전달(FRET) 상호작용을 통해 검출될 수 있거나, 뉴클레오티드 도입은, 예를 들어 미국 특허 제7,315,019호 - 이는 본 명세서에 참고로 포함됨 - 에 기술된 바와 같은 제로-모드 도파관으로 그리고, 예를 들어 미국 특허 제7,405,281호 및 미국 특허 공개 제2008/0108082호 - 이들 둘 모두는 본 명세서에 참고로 포함됨 - 에 기술된 바와 같은 형광 뉴클레오티드 유사체 및 조작된 폴리머라제를 사용하여 검출될 수 있다. 조명은 표면-테터링된 폴리머라제 주위에서 젭토리터-규모(zeptoliter-scale) 부피로 제한될 수 있으며, 이에 따라 형광 표지화된 뉴클레오티드의 도입이 낮은 백그라운드에 의해 관찰될 수 있다(문헌[Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003)]; 문헌[Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)], 이들의 개시내용은 전체적으로 본 명세서에 참고로 포함됨). 그러한 방법으로부터 얻어진 이미지는 본 명세서에 기재된 바와 같이 저장, 처리 및 분석될 수 있다.
일부 SBS 실시 형태는 연장 산물 내로의 뉴클레오티드의 도입 시에 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출에 기초한 서열분석은 전기적 검출기 및 Ion Torrent(미국 코네티컷주 길포드 소재, Life Technologies의 자회사)로부터 구매가능한 관련 기법 또는 미국 특허 출원 공개 제2009/0026082호; 제2009/0127589호; 제2010/0137143호; 및 제2010/0282617호에 기재된 서열분석 방법 및 시스템을 사용할 수 있으며, 이들 모두는 본 명세서에 참고로 포함된다. 동력학적 배제를 사용하여 표적 핵산을 증폭하기 위한 본 명세서에 기재된 방법은 양성자를 검출하는 데 사용되는 기재에 용이하게 적용될 수 있다. 더 구체적으로는, 본 명세서에 기재된 방법은 양성자를 검출하는 데 사용되는 앰플리콘들의 클론 집단을 생성하는 데 사용될 수 있다.
상기 SBS 방법은 멀티플렉스 포맷으로 유리하게 수행되어 다수의 상이한 표적 핵산들이 동시에 조작될 수 있다. 특정 실시 형태에서, 상이한 표적 핵산들이 공통 반응 용기 내에서 또는 특정 기재의 표면 상에서 처리될 수 있다. 이것은 멀티플렉스 방식으로 서열분석 시약의 편리한 전달, 미반응 시약의 제거 및 도입 사건의 검출을 가능하게 한다. 표면-결합된 표적 핵산들을 사용하는 실시 형태에서, 표적 핵산들은 어레이 포맷으로 존재할 수 있다. 어레이 포맷에서, 표적 핵산들은 전형적으로 공간적으로 구별가능한 방식으로 표면에 결합될 수 있다. 표적 핵산들은 직접 공유 부착, 비드 또는 다른 입자에 대한 부착, 또는 표면에 부착된 폴리머라제 또는 다른 분자에 대한 결합에 의해 결합될 수 있다. 어레이는 각각의 부위(특징부라고도 지칭됨)에서 표적 핵산의 단일 카피를 포함할 수 있거나, 동일한 서열을 갖는 다수의 카피가 각각의 부위 또는 특징부에 존재할 수 있다. 다수의 카피는 하기에 더 상세하게 기술된 바와 같은 증폭 방법, 예컨대 가교 증폭 또는 에멀젼 PCR에 의해 생성될 수 있다.
본 명세서에 기재된 방법은, 예를 들어 적어도 약 10개의 특징부/cm2, 100개의 특징부/cm2, 500개의 특징부/cm2, 1,000개의 특징부/cm2, 5,000개의 특징부/cm2, 10,000개의 특징부/cm2, 50,000개의 특징부/cm2, 100,000개의 특징부/cm2, 1,000,000개의 특징부/cm2, 5,000,000개의 특징부/cm2 또는 그 이상을 포함하는, 다양한 밀도들 중 임의의 밀도의 특징부를 갖는 어레이를 사용할 수 있다.
본 명세서에 제시된 방법의 이점은 이들이 병렬로 복수의 표적 핵산의 신속하고 효율적인 검출을 제공한다는 것이다. 따라서, 본 발명은 상기에 예시된 것들과 같은 당업계에 알려진 기법을 사용하여 핵산을 제조 및 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 발명의 통합 시스템은 증폭 시약 및/또는 서열분석 시약을 하나 이상의 고정된 DNA 단편으로 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우 셀은 표적 핵산의 검출을 위한 통합된 시스템 내에 구성되고/되거나 그것에 사용될 수 있다. 예시적인 플로우 셀은, 예를 들어 미국 특허 출원 공개 제2010/0111768호 및 미국 특허 출원 제13/273,666호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 플로우 셀에 대해 예시된 바와 같이, 통합 시스템의 유체 구성요소 중 하나 이상이 증폭 방법 및 검출 방법에 사용될 수 있다. 핵산 서열분석 실시 형태를 예로 들면, 통합된 시스템의 하나 이상의 유체 구성요소가 본 명세서에 제시된 증폭 방법을 위해 그리고 상기 예시된 것들과 같은 서열분석 방법에서 서열분석 시약의 전달을 위해 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하기 위해 그리고 검출 방법을 수행하기 위해 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 통합 서열분석 시스템의 예는, 제한 없이, MiSeq™ 플랫폼(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.) 및 본 명세서에 참고로 포함된 미국 특허 출원 제13/273,666호에 기재된 장치를 포함한다.
실시예
상기에 논의된 실시 형태의 일부 태양은 하기의 실시예에서 더 상세히 개시되며, 이러한 실시예는 결코 본 발명의 범주를 제한하는 것으로 의도되지 않는다.
실시예 1
열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제의 발전
이 실시예는 무작위 돌연변이생성 및 확인된 돌연변이들의 조합에 의해 열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제를 발전시키는 것을 보여준다. 약 10,000개의 TdT 돌연변이체를 스크리닝한 후, 촉매 특성을 보존하면서, SUMO-TdT보다 10 ℃ 더 열안정성인 TdT 3-2를 발견하였다.
무작위 돌연변이생성을 통해 돌연변이체 라이브러리를 생성하였다. 제1 돌연변이체 라이브러리는 모 주형(parent template)으로서 SUMO-TdT를 사용하였다. 본 명세서에서의 SUMO-TdT는 소(보스 타우루스) TdT의 아미노산 139 내지 520 및 가용성 및 발현을 개선하는 N-말단 SUMO-태그를 함유하는 재조합 TdT를 지칭한다. 표 1은 SUMO-TdT의 서열을 제시한다. 도 2는 보스 타우루스 TdT(서열 번호 12)의 아미노산 139 내지 520(서열 번호 1)과 SUMO-TdT(서열 번호 14)의 비제한적인 예시적인 서열 정렬을 나타낸다. 2790개의 돌연변이체의 라이브러리를 47 ℃에서 1분 동안 열처리하여 스크리닝하였다. 이 라운드는 열안정성 돌연변이체 TdT1-1 및 TdT1-2를 열안정성으로 확인시켜 주었다(표 2A 및 표 2B). TdT1-1 및 TdT1-2는 SUMO-TdT와 비교하여 열처리 없이 그리고 열처리에 의해 유의하게 더 높은 FRET 판독치를 갖는다. 또한, TdT1-1 및 TdT1-2는 열처리 후에 이들의 활성을 더 큰 비율로 보유하였다.
Figure pct00011
Figure pct00012
Figure pct00013
스크리닝의 제2 라운드의 경우, TdT1-1을 모체로서 사용하여 7636개의 라이브러리 크기를 생성하였다. TdT1-1은 TdT1-2와 비교하여 열처리 없이 더 높은 FRET 판독치를 가졌기 때문에 모 주형으로서 TdT1-1을 선택하였다. TdT 돌연변이체의 FRET 판독치는 TdT 돌연변이체의 효소 활성을 나타내었다. 스크리닝의 제2 라운드를 1분 동안 50 ℃의 열처리로 수행하고, 4개의 열안정성 돌연변이체를 확인하였다(TdT2-1, TdT2-2, TdT2-3, TdT2-4)(표 2A 및 표 2B). 4개의 돌연변이체는 무열처리 조건 및 열처리 조건 둘 모두 하에서 TdT1-1보다 유의하게 더 높은 FRET 판독치를 갖는다. 4개의 모든 돌연변이체는 또한 1분 동안 50 ℃에 노출된 후에 그들의 활성을 훨씬 더 높은 비율로 보유하였다.
TdT2-1, TdT2-2, TdT2-3 및 TdT2-4로부터 확인된 돌연변이들의 조합은 열안정성의 상승적 증가를 제공하는 것으로 추론되었다. 열안정성 스크리닝의 제3 라운드의 경우, 2개의 돌연변이체 라이브러리를 생성하였다. 이들 돌연변이체 라이브러리 중 하나는 TdT2-1, TdT2-2, TdT2-3 및 TdT2-4에서 발견되는 돌연변이들의 상이한 조합을 가지면서 TdT1-1 주형에 기반하였다. 모 주형으로서 TdT1-3을 이용한 것을 제외하고는, 다른 하나의 돌연변이 라이브러리를 유사하게 생성하였다. TdT1-3은 TdT1-1 및 TdT1-2에서의 돌연변이들의 조합으로 구성되었다(표 2A 및 표 2B). TdT1-1-기반 돌연변이체 라이브러리를 55 ℃에서의 1분간의 열충격을 사용하여 스크리닝하였다. 이 라이브러리로부터의 상단 돌연변이체로서 확인된 TdT3-1(표 2A 및 표 2B)은 열충격이 없는 상태 및 열충격을 갖는 상태 둘 모두에서 훨씬 더 높은 FRET 판독치를 가졌으며, 열충격 후에 이의 FRET 활성이 더 높은 분율을 보유하였다. 58 ℃에서 1분 동안의 열처리에 의한 TdT1-3-기반 돌연변이체 라이브러리의 스크리닝은 실온 및 열충격 처리 둘 모두 하에서 유의하게 더 높은 FRET 판독치를 갖는 TdT3-2의 발견으로 이어졌다(표 2A 및 표 2B). TdT3-2는 1분 동안 58 ℃에 노출된 후에 이의 FRET 활성의 적어도 절반을 보유하였다. 이는 TdT3-2가 TdT1-3보다 유의하게 더 활성이고 열안정성임을 시사한다. 표 2A 및 표 2B에 나타낸 바와 같이, TdT3-2는, T326S를 제외한, 스크리닝의 매 라운드마다 상단 돌연변이들로부터 확인된 돌연변이들의 대부분을 담지한다. 표 1은 TdT3-2의 아미노산 서열을 제시한다.
47 ℃에서, 시판 TdT 및 SUMO-TdT는 5분 이내에 변성되었는데, 그 이유는, 도입을 갖는 밴드의 강도가 5분, 10분 및 20분 동안 동일하게 유지되었기 때문이다. 대조적으로, TdT3-2는 20분 동안 활성이었는데, 그 이유는, 이는 더 많은 도입이 20분간의 반응 동안 관찰될 수 있었기 때문이다. 58 ℃에서, 시판 TdT 및 SUMO-TdT는 활성이 아닌 반면, TdT3-2는 5분 이내에 변성되었는데, 그 이유는, 밴드의 강도가 이후에 동일하게 유지되기 때문이다. 이러한 관찰은 TdT3-2가 SUMO-TdT보다 더 열안정성이고, TdT3-2가 더 높은 온도에서 활성을 유지한다는 것을 확인시켜 준다.
종합하면, 이들 데이터는 이 실시예에서 확인된 9개의 아미노산 치환이 개별적으로 또는 임의의 조합으로, TdT 촉매 활성을 보존하면서 아미노산 치환(들)을 함유하는 TdT 돌연변이체의 열안정성을 증가시킬 수 있음을 나타낸다. 더욱이, 이 실시예에서 확인된 TdT 돌연변이체는 TdT 촉매 활성을 보존하면서 열안정성일 수 있다.
실시예 2
다수의 변형된 염기를 도입시킨 단일 가닥 DNA 분자의 생성
이 실시예는 TdT 돌연변이체를 사용하여 다수의 변형된 염기를 도입시킨 단일 가닥 DNA(ssDNA) 분자를 생성하는 것을 보여준다.
변형된 뉴클레오티드를 도입시킨 스캐폴드(예를 들어, 단일 가닥 DNA(ssDNA) 스캐폴드)가 생성될 수 있다. 스캐폴드는 주형 분자의 다수의 카피를 위한 "담체"로서의 역할을 할 수 있다. 주형 분자의 다수의 카피를 갖는 담체는 기재(예를 들어, 다수의 웰, 예컨대 100, 1,000, 10,000개 또는 그 이상의 웰을 포함하는 플로우 셀) 상의 단일 웰(예를 들어, 마이크로웰)을 점유할 수 있는 나노입자일 수 있는데, 이때 이러한 점유는 다른 거대분자가 입체 충돌 또는 장애에 의해 동일한 웰을 점유하는 것을 배제시킴으로써 가능하다. 각각이 하나의 나노입자를 갖는 기재 상의 단일 웰들은 단일클론성을 가져오거나 단일클론성에 근접해질 수 있다. 대안적으로, ssDNA 스캐폴드는 주형의 단일 카피를 담지할 수 있다. 스캐폴드는 고정 올리고의 역방향 상보체 또는 고정 올리고들의 역방향 상보체들의 다수의 카피를 가질 수 있다. 스캐폴드는 고정 올리고의 역방향 상보체 또는 고정 올리고들의 역방향 상보체들의 다수의 카피의 존재로 인해 주어진 웰 내의 모든 "고정" 올리고에 결합하고 봉쇄시킬 수 있으며, 이로써 단일 주형이 웰당 포착될 수 있게 된다.
그러한 ssDNA 스캐폴드를 생성하거나 작제하는 한 가지 방법은 ssDNA 폴리머라제, 예컨대 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 사용하여 염기 상의 변형, 예컨대 아지드 기를 담지하는 뉴클레오티드를 프라이머 가닥 내로 랜덤하게 도입시키는 것이다. 그러나, 구매가능한 TdT는 다수의 일련의 염기 변형된 뉴클레오티드들을 용이하게 도입시키지 않는데, 이는 추정컨대 입체 충돌 때문일 것이다.
열안정성 TdT 돌연변이체(본 명세서에서 TdT3-2 또는 CM12로 지칭됨)는 염기-변형된 뉴클레오티드를 도입시키는 데 있어서 시판 NEB TdT보다 훨씬 더 우수하였다. 이러한 특성은 NEB로부터의 시판 TdT 및 TdT3-2를 PEG 사슬이 염기에 접합된 뉴클레오티드의 도입에 대해 시험하였을 때 발견되었다. NEB TdT는 일반적으로 1개 또는 2개의 PEG-뉴클레오티드를 도입시킨 후에 정지한 반면, TdT3-2는 다수의 PEG-뉴클레오티드를 연속적으로 도입시켰다.
따라서, 이 돌연변이체는, 단일클론 클러스터링을 위한 본 발명의 "담체"의 생성을 포함한, 각종 목적을 위한 다양한 유형의 염기 변형된 뉴클레오티드를 담지하는 ssDNA를 생성하기 위한 탁월한 촉매를 나타낸다.
도 3은 TdT3-2 또는 시판 NEB TdT에 의한 5-카르복시플루오레세인(5' FAM) 표지화된 올리고뉴클레오티드 프라이머 상으로의, 이 실시예에서 아지드-PEG4-dUTP 또는 Az-U로 지칭된 아지드-PEG4-아미노알릴-dUTP(Jena Biosciences; #NU-1705S)의 시도된 도입을 나타낸 비제한적인 예시적인 겔 그래프이다. 상기 개별 레인들에 나타낸 바와 같이, 상이한 반응들을 100% 아지드-PEG4-dUTP 또는 50% 아지드-PEG4-dUTP + 50% dNTP로, TdT3-2 또는 NEB TdT에 대해 셋업하였다. 도 3에서 레인 1과 레인 3을 비교하면, 60분만에, TdT3-2는 NEB로부터의 시판 TdT(레인 3 바로 옆에 별표로 표시된 산물을 참조)와 비교하여 훨씬 더 많은 아지드-PEG4-dUTP를 도입시킬 수 있었다(레인 1 바로 옆에 별표로 표시된 산물을 참조). TdT3-2는 시판 NEB TdT와 비교하여 100% 아지드-PEG4-dUTP의 존재 하에서 크게 개선된 다수의 도입을 보여주었다(별표들 바로 옆의 밴드들을 비교한다). 도 3의 레인 3에 나타낸 바와 같이, NEB TdT는 아지드-PEG4-dUTP를 매우 느리게 도입시켰다. NEB TdT는 장시간(예컨대, 60분) 후에만 아지드-PEG4-dUTP의 분자를 5 내지 7개 도입시킬 수 있었다. 레인 2 및 레인 4는 아지드-PEG4-dUTP와 dNTP의 50:50 믹스를 사용하며, 그 결과 NEB TdT는 풍부한 뉴클레오티드 도입을 보여주었는데, 이는 레인 3에서 관찰된 NEB TdT에 의한 100% 아지드-PEG4-dUTP의 제한된 도입이 더 낮은 활성에 기인하지 않고, 오히려 염기 변형된 뉴클레오티드들의 일련의 도입으로부터 발생되는 입체 충돌에 기인하였음을 나타내는데, 이는 PEG 변형된 뉴클레오티드 데이터와 일치한다.
도 4a 및 도 4b는 1분 및 60분 동안 시판 NEB TdT에 의해 아지드-PEG4-dUTP 및 천연 뉴클레오티드에 의한 TdT 연장의 결과를 나타낸 비제한적인 예시적인 겔 그래프이다. 도 4a는 1분만에 우수한 도입이 관찰되었음을 보여준다(좌측(LHS) 절반). 다이벤조사이클로옥틴-Cy3(DBCO-Cy3)의 부가는 작용하는 것으로 보였지만, 고강도의 뉴클레오티드-DBCO-Cy3 접합체에 의해 가려졌다(우측(RHS) 절반의 얼룩덜룩한 부분). 도 4b는 60분간의 인큐베이션이 훨씬 더 높은 분자량 산물을 제공하였음을 보여준다. 더 높은 아지드-PEG4-dUTP 뉴클레오티드 농도에서, DBCO-Cy3의 부가는 그러한 산물의 소실로 이어졌는데(LHS 절반 및 RHS 절반에서의 별표 참조), 이는 성공적인 접합을 시사한다.
도 5a 내지 도 5c는 TdT3-2 및 시판 NEB TdT에 의해 아지드-PEG4-dUTP 또는 N6-(6-아지도)헥실-dATP(이 실시예에서 아지드-헥실-dATP, 또는 Az-A로 지칭됨)에 의한 TdT 연장의 결과를 나타낸 비제한적인 예시적인 겔 그래프이다. 도 5a는 아지드-dU의 몇몇 도입이 NEB TdT보다 TdT3-2에 대해 더 많이 관찰되었음을 나타낸다. 도 5b는 수십개의 도입이 순수한 아지드-PEG4-dUTP에 대해 관찰되었음을 나타낸다(좌측에 있는 제1 레인). dNTP와의 혼합은 NEB TdT의 경우 높은 MW 산물을 제공하였지만; 도입된 아지드-PEG4-dUTP의 비율은 알려져 있지 않았다. PEG4-dUTP는 시험된 조건에서 아지드-헥실-dATP보다 더 잘 작동하는 것으로 보였다. 도 5b에서 시각화된 겔을 SYBR-Gold로 염색하였으며, 도 5c에서 시각화하였다.
따라서, 더 높은 열안정성을 가능하게 하는 것과는 별도로, TdT3-2에서의 돌연변이는 또한 염기 변형된 뉴클레오티드의 도입에서 더 큰 유연성을 가능하게 하였다. 이러한 특성은 ssDNA 스캐폴드의 생성에서, 그리고 염기 변형된 뉴클레오티드들의 일련의 도입이 요구되는 다른 응용에서 큰 관심을 갖는다. 예를 들어, TdT3-2는 아지드-PEG4-dUTP 뉴클레오티드의 일련의 부가를 함유하는 스캐폴드를 생성하기 위한 촉매로서 사용될 수 있다. 이어서, 적합한 모이어티를, 예를 들어 클릭 화학을 사용하여 아지드 기에 접합할 것이다.
종합하면, 이들 데이터는 TdT의 아미노산 치환이 열안정성을 개선하고 아미노산 치환을 함유하는 TdT가 다수의 염기 변형된 뉴클레오티드를 도입시키는 능력을 개선할 수 있음을 나타낸다.
용어
앞서 기재된 실시 형태들 중 적어도 일부에서, 일 실시 형태에서 사용되는 하나 이상의 요소는 다른 실시 형태에서 상호교환 가능하게 사용될 수 있는데, 이는, 그러한 대체가 기술적으로 실현 불가능하지 않는 한 그러하다. 청구된 발명 요지의 범주로부터 벗어나지 않고서 전술된 방법 및 구조에 대해 다양한 다른 생략, 첨가 및 변형이 이루어질 수 있음이 당업자에 의해 이해될 것이다. 모든 그러한 변형 및 변경은 첨부된 청구범위에 의해 정의된 바와 같은 발명 요지의 범주 내에 속하는 것으로 의도된다.
본 명세서에서 실질적으로 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 당업자는 문맥 및/또는 적용에 적절하게 복수를 단수로 번역하고/하거나 단수를 복수로 번역할 수 있다. 다양한 단수/복수 교환이 명료함을 위해 본 명세서에 명시적으로 기재될 수 있다. 본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수형("a", "an" 및 "the")은 문맥이 명확하게 달리 지시하지 않으면, 복수의 지시대상을 포함한다. 본 명세서에서 "또는"에 대한 임의의 언급은 달리 언급되지 않는 한 "및/또는"을 포함하는 것으로 의도된다.
일반적으로, 본 명세서에서, 그리고 특히 첨부된 청구범위(예를 들어, 첨부된 청구범위의 청구항 본문)에서 사용된 용어는 일반적으로 "개방된" 용어(예를 들어, "포함하는"이라는 용어는 "포함하지만 이로 한정되지 않는"으로 해석되어야 하고, 용어 "갖는"은 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 이로 한정되지 않는다" 등으로 해석되어야 함)로 의도된다는 것을 당업자는 이해할 것이다. 특정 수의 도입된 청구범위 인용이 의도되는 경우, 그러한 의도는 청구범위에서 명시적으로 인용될 것이며, 그러한 인용이 부재시, 그러한 의도가 존재하지 않는다는 점을 당업자는 추가로 이해할 것이다. 예를 들어, 이해를 돕기 위해, 하기에 첨부된 청구범위는 청구 인용을 소개하기 위해 "적어도 하나", 및 "하나 이상"이라는 소개 문구의 사용을 포함할 수 있다. 그러나, 이러한 문구의 사용은 부정관사 "a", 또는 'an"에 의한 청구범위 인용의 도입이 그러한 도입된 청구범위 인용을 포함하는 임의의 특정 청구범위를 그러한 인용을 오직 하나만 포함하는 실시 형태로, 심지어 동일한 청구범위가 도입구 "하나 이상" 또는 "적어도 하나" 및 "a" 또는 "an"과 같은 부정관사를 포함할 경우에도 제한하는 것으로 의미하는 것으로 해석되어서는 안 되며(예를 들어, "an" 및/또는 "an"은 "적어도 하나" 또는 "하나 이상"을 의미하는 것으로 해석되어야 함); 청구범위 인용을 도입하는 데 사용된 정관사를 이용하는 경우에도 마찬가지이다. 또한, 특정수의 도입된 청구항 인용이 명시적으로 인용된 경우라 할지라도, 당업자는 그러한 인용이 적어도 해당 인용된 수를 의미하는 것으로 해석되어야 하는 것으로 인지할 것이다(예를 들어, "2개의 인용"의 최소(bare) 인용은 다른 수식어 없이 적어도 2개의 인용, 또는 2개 이상의 인용을 의미한다). 나아가, "A, B 및 C 등 중 적어도 하나"와 유사한 관례(convention)가 사용되는 경우에서, 일반적으로, 그러한 구성은 당업자가 상기 관례를 이해할 수 있는 의미에서 의도된다(예를 들어, "A, B 및 C 중 적어도 하나를 가진 시스템"은 A 단독, B 단독, C 단독, A와 B 함께, A와 C 함께, B와 C 함께, 및/또는 A, B 및 C와 함께 등을 가진 시스템을 포함하지만 이로 한정되지 않음). "A, B, 또는 C 등 중 적어도 하나"와 유사한 관례가 사용되는 경우에서, 일반적으로 그러한 구성은 당업자가 상기 관례를 이해할 수 있는 의미에서 의도된다(예를 들어, "A, B, 또는 C 중 적어도 하나를 가진 시스템"은 A 단독, B 단독, C 단독, A와 B 함께, A와 C 함께, B와 C 함께, 및/또는 A, B, 및 C와 함께 등을 가진 시스템을 포함하지만 이로 한정되지 않음). 발명의 설명, 청구범위 또는 도면에 있든지 간에 둘 이상의 대안적인 용어를 제시하는 사실상 임의의 이접적인 단어 및/또는 구가 그 용어 중 하나, 그 용어 중 어느 하나, 또는 두 용어 모두를 포함하는 가능성을 고려하는 것으로 이해되어야 한다는 것을 당업자는 추가로 이해할 것이다. 예를 들어, "A 또는 B"라는 문구는 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
또한, 본 발명의 특징 또는 태양이 마쿠쉬(Markush) 군의 관점에서 기재된 경우, 당업자는 본 발명이 또한 마쿠쉬 군의 임의의 개별적인 구성원 또는 구성원들의 하위군의 관점에서 기재됨을 인식할 것이다.
당업자에게 이해되는 바와 같이, 임의의 그리고 모든 목적을 위해, 예컨대 기록된 설명을 제공하는 관점에서, 본 명세서에 개시된 모든 범위는 그의 임의의 그리고 모든 가능한 하위범위, 및 하위범위들의 조합을 또한 포함한다. 임의의 열거된 범위는 동일한 범위가 적어도 동일한 1/2, 1/3, 1/4, 1/5, 1/10 등으로 분해되는 것을 충분히 설명하고 가능하게 하는 것으로 용이하게 인식될 수 있다. 비제한적인 예로서, 본 명세서에 논의된 각각의 범위는 하부 1/3, 중앙 1/3, 상부 1/3 등으로 용이하게 분해될 수 있다. 또한 당업자에 의해 이해되는 바와 같이, "이하", "이상", "초과", "미만" 등과 같은 모든 언어는 언급된 수를 포함하며, 이어서 상술한 바와 같이 하위범위로 분해될 수 있는 범위를 지칭한다. 마지막으로, 당업자에 의해 이해되는 바와 같이, 범위는 각각의 개별 구성원을 포함한다. 따라서, 예를 들어 1 내지 3개의 항목을 갖는 군은 1, 2, 또는 3개의 항목을 갖는 군을 지칭한다. 유사하게, 1 내지 5개의 항목을 갖는 군은 1, 2, 3, 4, 또는 5개의 항목을 갖는 군을 지칭하는 등등이다.
다양한 태양 및 실시 형태가 본 명세서에 개시되어 있지만, 다른 태양 및 실시 형태가 당업자에게 명백해질 것이다. 본 명세서에 개시된 다양한 태양 및 실시 형태는 예시를 위한 것으로, 제한하려는 의도는 아니며, 진정한 범주 및 사상은 하기의 청구범위에 의해 나타낸다.
SEQUENCE LISTING <110> Illumina Inc. Illumina Singapore Pte. Ltd. Nirantar, Saurabh Rajendra Peisajovich, Sergio Brustad, Eric <120> GENERATING NUCLEIC ACIDS WITH MODIFIED BASES USING RECOMBINANT TERMINAL DEOXYNUCLEOTIDYL TRANSFERASE <130> 47CX-311973-WO <150> 63/023,736 <151> 2020-05-12 <160> 15 <170> PatentIn version 3.5 <210> 1 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> Bos taurus TdT 139-520 <220> <221> NON_TER <222> (1)..(1) <400> 1 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 2 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Glu53Val in TdT 139-520/Glu191Val in WT <220> <221> NON_TER <222> (1)..(1) <400> 2 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Val Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Lys55Asn in TdT 139-520/Lys193Asn in WT <220> <221> NON_TER <222> (1)..(1) <400> 3 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Asn Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Glu56Gly in TdT 139-520/Glu194Gly in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 4 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Gly Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 5 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Asp104Tyr in TdT 139-520/Asp242Tyr in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 5 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 6 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Lys149Glu in TdT 139-520/Lys287Glu in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 6 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Glu Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 7 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Phe158Leu in TdT 139-520/Phe296Leu in WT TdT. <220> <221> NON_TER <222> (1)..(1) <400> 7 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 8 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Met161Lys in TdT 139-520/Met299Lys in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 8 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Lys Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 9 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Thr204Ser in TdT 139-520/Thr342Ser in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 9 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Ser Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with His283Pro in TdT 139-520/His421Pro in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 10 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Pro His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 11 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with TdT3-2 Substitution Mutations <220> <221> NON_TER <222> (1)..(1) <400> 11 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Val Phe Asn Gly Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Glu Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Lys 145 150 155 160 Lys Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Pro His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 12 <211> 520 <212> PRT <213> Bos taurus <400> 12 Met Ala Gln Gln Arg Gln His Gln Arg Leu Pro Met Asp Pro Leu Cys 1 5 10 15 Thr Ala Ser Ser Gly Pro Arg Lys Lys Arg Pro Arg Gln Val Gly Ala 20 25 30 Ser Met Ala Ser Pro Pro His Asp Ile Lys Phe Gln Asn Leu Val Leu 35 40 45 Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg Arg Asn Phe Leu Met 50 55 60 Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu Asn Glu Leu Ser Asp 65 70 75 80 Ser Val Thr His Ile Val Ala Glu Asn Asn Ser Gly Ser Glu Val Leu 85 90 95 Glu Trp Leu Gln Val Gln Asn Ile Arg Ala Ser Ser Gln Leu Glu Leu 100 105 110 Leu Asp Val Ser Trp Leu Ile Glu Ser Met Gly Ala Gly Lys Pro Val 115 120 125 Glu Ile Thr Gly Lys His Gln Leu Val Val Arg Thr Asp Tyr Ser Ala 130 135 140 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 145 150 155 160 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 165 170 175 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe 180 185 190 Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 195 200 205 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 210 215 220 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 225 230 235 240 Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 245 250 255 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 260 265 270 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile 275 280 285 Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe 290 295 300 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 305 310 315 320 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 325 330 335 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 340 345 350 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 355 360 365 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 370 375 380 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 385 390 395 400 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 405 410 415 Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 420 425 430 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 435 440 445 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 450 455 460 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 465 470 475 480 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 485 490 495 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 500 505 510 Ile Glu Pro Trp Glu Arg Asn Ala 515 520 <210> 13 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> Saccharomyces cerevisiae SUMO 1-98 <220> <221> NON_TER <222> (98)..(98) <400> 13 Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro 1 5 10 15 Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser 20 25 30 Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu 35 40 45 Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Arg 50 55 60 Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu Asp 65 70 75 80 Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile 85 90 95 Gly Gly <210> 14 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> HIS-SUMO-TdT 139-520 <400> 14 Met Gly Ser Ser His His His His His His Gly Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser Ala Ser Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys 20 25 30 Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys 35 40 45 Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr 50 55 60 Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu 65 70 75 80 Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp 85 90 95 Gln Thr Pro Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala 100 105 110 His Arg Glu Gln Ile Gly Gly Glu Leu Met Arg Thr Asp Tyr Ser Ala 115 120 125 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 130 135 140 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 145 150 155 160 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe 165 170 175 Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 180 185 190 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 195 200 205 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 210 215 220 Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 225 230 235 240 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 245 250 255 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile 260 265 270 Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe 275 280 285 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 290 295 300 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 305 310 315 320 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 325 330 335 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 340 345 350 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 355 360 365 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 370 375 380 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 385 390 395 400 Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 405 410 415 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 420 425 430 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 435 440 445 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 450 455 460 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 465 470 475 480 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 485 490 495 Ile Glu Pro Trp Glu Arg Asn Ala 500 <210> 15 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> TdT3-2 <400> 15 Met Gly Ser Ser His His His His His His Gly Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser Ala Ser Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys 20 25 30 Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys 35 40 45 Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr 50 55 60 Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu 65 70 75 80 Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp 85 90 95 Gln Thr Pro Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala 100 105 110 His Arg Glu Gln Ile Gly Gly Glu Leu Met Arg Thr Asp Tyr Ser Ala 115 120 125 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 130 135 140 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 145 150 155 160 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Val Phe 165 170 175 Asn Gly Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 180 185 190 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 195 200 205 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 210 215 220 Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 225 230 235 240 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 245 250 255 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Glu Ile 260 265 270 Met Ser Asp Lys Thr Leu Lys Leu Thr Lys Lys Gln Lys Ala Gly Phe 275 280 285 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 290 295 300 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 305 310 315 320 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 325 330 335 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 340 345 350 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 355 360 365 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 370 375 380 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 385 390 395 400 Ile Leu Lys Leu Pro His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 405 410 415 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 420 425 430 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 435 440 445 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 450 455 460 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 465 470 475 480 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 485 490 495 Ile Glu Pro Trp Glu Arg Asn Ala 500

Claims (162)

  1. 핵산을 변형시키는 방법으로서,
    (a) 단일 가닥 데옥시리보핵산(ssDNA), 및 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 제공하는 단계; 및
    (b) 상기 ssDNA, 및 상기 변형된 염기를 포함하는 뉴클레오시드 트라이포스페이트를 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 ssDNA 스캐폴드를 생성하는 단계를 포함하며, 여기서 상기 ssDNA 스캐폴드는 상기 뉴클레오시드 트라이포스페이트로부터의 상기 변형된 염기를 포함하는 하나 이상의 뉴클레오티드가 도입된 상기 ssDNA를 포함하고,
    상기 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스(Bos taurus) TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  2. 제1항에 있어서,
    (c) 상기 ssDNA 스캐폴드를 제1 어댑터 서열을 포함하는 제1 어댑터 올리고뉴클레오티드 및 제2 어댑터 서열을 포함하는 제2 어댑터 올리고뉴클레오티드와 접촉시켜, 상기 제1 어댑터 올리고뉴클레오티드 및 상기 제2 어댑터 올리고뉴클레오티드에 부착된 상기 ssDNA 스캐폴드를 포함하는 핵산 담체를 생성하는 단계를 추가로 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 ssDNA 스캐폴드를 상기 제1 어댑터 올리고뉴클레오티드와 접촉시키는 단계는 상기 ssDNA 스캐폴드를 상기 제1 어댑터 올리고뉴클레오티드 및 제1 중합체를 포함하는 제1 어댑터와 접촉시키는 단계를 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 ssDNA 스캐폴드를 상기 제2 어댑터 올리고뉴클레오티드와 접촉시키는 단계는 상기 ssDNA 스캐폴드를 상기 제2 어댑터 올리고뉴클레오티드 및 제2 중합체를 포함하는 제2 어댑터와 접촉시키는 단계를 포함하는, 방법.
  5. 제3항 또는 제4항에 있어서, 상기 제1 어댑터는 공유 연결된 상기 제1 어댑터 올리고뉴클레오티드를 포함하고, 상기 제2 어댑터는 공유 연결된 상기 제2 어댑터 올리고뉴클레오티드를 포함하는, 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 ssDNA 스캐폴드는 제3 중합체를 포함하는, 방법.
  7. 제2항 내지 제6항 중 어느 한 항에 있어서,
    (d) 상기 제1 어댑터 서열 또는 이의 역방향 상보체, 상기 제2 어댑터 서열 또는 이의 역방향 상보체, 및 핵산 혼성화 서열을 포함하는 핵산 주형을 제공하는 단계;
    (e) 상기 핵산 담체를 상기 핵산 주형과 접촉시켜, 상기 핵산 주형이 상기 핵산 주형의 상기 핵산 혼성화 서열을 통해 상기 핵산 담체의 주형 포획 부위에 혼성화된 상기 핵산 담체를 생성하는 단계;
    (f) 상기 핵산 주형과 혼성화된 상기 핵산 담체 상에서 증폭을 수행하여 복수의 증폭된 핵산들을 생성하는 단계로서, 각각의 상기 증폭된 핵산은 상기 핵산 주형의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 상기 제1 어댑터 올리고뉴클레오티드 및 상기 제2 어댑터 올리고뉴클레오티드를 포함하는, 상기 단계; 및
    (g) 상기 복수의 증폭된 핵산들을 사용하여 상기 핵산 주형의 서열을 결정하는 단계를 추가로 포함하는, 방법.
  8. 핵산을 변형시키는 방법으로서,
    (a) 제1 핵산, 및 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계; 및
    (b) 상기 제1 핵산, 및 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제1 반응에서 제1 온도에서 제1 반응 시간 동안 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 접촉시켜 제2 핵산을 생성하는 단계를 포함하며, 여기서 상기 제2 핵산은 상기 제1 뉴클레오시드 트라이포스페이트로부터의 상기 제1 변형된 염기를 포함하는 하나 이상의 제1 뉴클레오티드가 도입된 상기 제1 핵산을 포함하고,
    상기 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His420과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  9. 제8항에 있어서, 상기 제1 핵산 및 상기 제2 핵산 중 하나 이상은 단일 가닥 핵산, 3' 오버행(overhang)을 갖는 이중 가닥 핵산, 3' 리세스(recess)를 갖는 이중 가닥 핵산, 또는 이들의 조합을 포함하는, 방법.
  10. 제8항 또는 제9항에 있어서, 상기 제1 핵산 및 상기 제2 핵산 중 하나 이상은 데옥시리보핵산(DNA)을 포함하는, 방법.
  11. 제8항 내지 제10항 중 어느 한 항에 있어서, 상기 제1 핵산 및 상기 제2 핵산 중 하나 이상의 적어도 50%의 뉴클레오티드는 데옥시리보뉴클레오티드를 포함하는, 방법.
  12. 제8항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 핵산 및 상기 제2 핵산 중 하나 이상은 단일 가닥 데옥시리보핵산(ssDNA)을 포함하는, 방법.
  13. 제8항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 핵산 및 상기 제2 핵산 중 하나 이상은 적어도 하나의 리보뉴클레오티드를 포함하는, 방법.
  14. 제8항 내지 제13항 중 어느 한 항에 있어서, 상기 제2 핵산은 상기 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 상기 제1 뉴클레오티드들이 도입된 상기 제1 핵산을 포함하는, 방법.
  15. 제14항에 있어서, 상기 제2 핵산 내의 상기 제1 변형된 염기를 포함하는 2개 이상 또는 3개 이상의 상기 제1 뉴클레오티드들은 연속적인, 방법.
  16. 제8항 내지 제15항 중 어느 한 항에 있어서, 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함하는, 방법.
  17. 제8항 내지 제16항 중 어느 한 항에 있어서, 상기 제1 뉴클레오시드 트라이포스페이트는 5-(15-아지도-4,7,10,13-테트라옥사-펜타데카노일-아미노알릴)-2'-데옥시우리딘-5'-트라이포스페이트(아지드-PEG4-아미노알릴-dUTP), N6-(6-아지도)헥실-3'-데옥시아데노신-5'-트라이포스페이트(N6-(6-아지도)헥실-3'-dATP), 또는 이들의 조합을 포함하는, 방법.
  18. 제8항 내지 제16항 중 어느 한 항에 있어서, 상기 제1 뉴클레오시드 트라이포스페이트는 공유 연결된 상기 제1 변형된 염기 및 제1 부속(accessory) 올리고뉴클레오티드를 포함하는, 방법.
  19. 제8항 내지 제17항 중 어느 한 항에 있어서, 상기 제1 반응 시간은 적어도 1초인, 방법.
  20. 제8항 내지 제19항 중 어느 한 항에 있어서, 상기 제1 온도는 적어도 16 ℃ 내지 적어도 58 ℃인, 방법.
  21. 제8항 내지 제20항 중 어느 한 항에 있어서, 상기 제1 반응에서의 상기 제1 핵산의 농도는 적어도 10 nM인, 방법.
  22. 제8항 내지 제21항 중 어느 한 항에 있어서, 상기 제1 반응에서의 상기 제1 뉴클레오시드 트라이포스페이트의 농도는 적어도 0.1 μM인, 방법.
  23. 제8항 내지 제22항 중 어느 한 항에 있어서, 상기 제1 반응에서의 상기 재조합 TdT의 농도는 적어도 10 nM인, 방법.
  24. 제8항 내지 제23항 중 어느 한 항에 있어서,
    상기 제1 핵산, 및 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계는 상기 제1 핵산, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 제2 뉴클레오시드 트라이포스페이트를 제공하는 단계를 포함하고,
    상기 제1 핵산, 및 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 상기 재조합 TdT와 접촉시키는 단계는 상기 제1 핵산, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 상기 제2 뉴클레오시드 트라이포스페이트를 상기 제1 반응에서 상기 제1 온도에서 상기 제1 반응 시간 동안 상기 재조합 TdT와 접촉시켜 상기 제2 핵산을 생성하는 단계를 포함하고,
    여기서 상기 제2 핵산은 (i) 상기 제1 뉴클레오시드 트라이포스페이트로부터의 상기 제1 변형된 염기를 포함하는 하나 이상의 상기 제1 뉴클레오티드 및 (ii) 하나 이상의 제2 뉴클레오티드가 도입된 상기 제1 핵산을 포함하는, 방법.
  25. 제24항에 있어서, 상기 하나 이상의 제2 뉴클레오티드 각각은 상기 제2 뉴클레오시드 트라이포스페이트로부터의 제2 변형된 염기를 포함하는, 방법.
  26. 제25항에 있어서, 상기 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 변형된 아데닌, 변형된 구아닌, 변형된 시토신, 변형된 티민, 또는 변형된 우라실을 포함하는, 방법.
  27. 제25항 또는 제26항에 있어서, 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 상기 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 동일한 비변형된 염기의 변형을 포함하는, 방법.
  28. 제25항 또는 제26항에 있어서, 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 상기 제2 뉴클레오시드 트라이포스페이트의 제2 변형된 염기는 상이한 비변형된 염기의 변형을 포함하는, 방법.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 제2 뉴클레오시드 트라이포스페이트는 공유 연결된 상기 제2 변형된 염기 및 제2 부속 올리고뉴클레오티드를 포함하는, 방법.
  30. 제24항에 있어서, 상기 제2 뉴클레오티드 각각은 상기 제2 뉴클레오시드 트라이포스페이트로부터의 제2 비변형된 염기를 포함하는, 방법.
  31. 제30항에 있어서, 상기 제2 뉴클레오시드 트라이포스페이트의 제2 비변형된 염기는 아데닌, 구아닌, 시토신, 티민, 또는 우라실을 포함하는, 방법.
  32. 제30항 또는 제31항에 있어서, 상기 제1 변형된 염기는 상기 제2 비변형된 염기의 변형을 포함하는, 방법.
  33. 제24항 내지 제32항 중 어느 한 항에 있어서, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트와 상기 제2 뉴클레오시드 트라이포스페이트는 약 1:100 내지 약 100:1 범위의 비로 상기 제1 핵산과 접촉되는, 방법.
  34. 제24항 내지 제33항 중 어느 한 항에 있어서, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오티드와 상기 제2 뉴클레오티드는 약 1:100 내지 약 100:1 범위의 비로 상기 제2 핵산 내로 도입되는, 방법.
  35. 제8항 내지 제20항 중 어느 한 항에 있어서,
    상기 제1 핵산, 및 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 제공하는 단계는 상기 제1 핵산, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 복수의 제2 뉴클레오시드 트라이포스페이트들을 제공하는 단계를 포함하고,
    상기 제1 핵산, 및 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트를 상기 재조합 TdT와 접촉시키는 단계는 상기 제1 핵산, 상기 제1 변형된 염기를 포함하는 제1 뉴클레오시드 트라이포스페이트, 및 상기 복수의 제2 뉴클레오시드 트라이포스페이트들을 상기 제1 반응에서 상기 제1 온도에서 상기 제1 반응 시간 동안 상기 재조합 TdT와 접촉시켜 상기 제2 핵산을 생성하는 단계를 포함하고,
    여기서 상기 제2 핵산은 상기 제1 변형된 염기를 포함하는 하나 이상의 상기 제1 뉴클레오티드 및 상기 복수의 제2 뉴클레오시드 트라이포스페이트들로부터의 하나 이상의 제2 뉴클레오티드가 도입된 상기 제1 핵산을 포함하는, 방법.
  36. 제35항에 있어서, 상기 복수의 제2 뉴클레오시드 트라이포스페이트들은 데옥시리보스 아데닌 트라이포스페이트, 데옥시리보스 구아닌 트라이포스페이트, 데옥시리보스 시토신 트라이포스페이트, 데옥시리보스 티민 트라이포스페이트, 데옥시리보스 우라실 트라이포스페이트, 또는 이들의 조합을 포함하는, 방법.
  37. 제35항 또는 제36항에 있어서, 상기 복수의 제2 뉴클레오시드 트라이포스페이트들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 상기 제1 핵산과 접촉되는, 방법.
  38. 제35항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 뉴클레오티드들 중 2개는 약 1:100 내지 약 100:1 범위의 비로 상기 제2 핵산 내로 도입되는, 방법.
  39. 제35항 내지 제38항 중 어느 한 항에 있어서, 상기 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 비변형된 염기를 포함하는, 방법.
  40. 제35항 내지 제39항 중 어느 한 항에 있어서, 상기 복수의 제2 뉴클레오시드 트라이포스페이트들 중 적어도 하나 또는 각각은 제2 변형된 염기를 포함하는, 방법.
  41. 제8항 내지 제40항 중 어느 한 항에 있어서, 뉴클레오티드의 변형된 염기들과 비변형된 염기들은 약 1:100 내지 약 100:1 범위의 비로 상기 제2 핵산 내로 도입되는, 방법.
  42. 제41항에 있어서, 상기 변형된 염기들은 상기 제2 핵산 내로 도입된 상기 제1 변형된 염기, 및 상기 복수의 제2 뉴클레오티드들 중 적어도 하나 또는 각각의 염기를 포함하는, 방법.
  43. 제41항 또는 제42항에 있어서, 상기 비변형된 염기들은 상기 제2 핵산 내로 도입된 상기 복수의 제2 뉴클레오티드들 중 적어도 하나 또는 각각의 염기를 포함하는, 방법.
  44. 제35항 내지 제43항 중 어느 한 항에 있어서, 상기 제2 핵산의 뉴클레오티드 염기들의 적어도 1%는 변형된 염기들을 포함하는, 방법.
  45. 제44항에 있어서, 상기 변형된 염기들은 상기 제2 핵산 전체에 걸쳐 분포되는, 방법.
  46. 제45항에 있어서, 상기 변형된 염기들은 상기 제2 핵산 전체에 걸쳐 랜덤하게 분포되는, 방법.
  47. 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 제2 핵산은 복수의 2개 이상의 연속적인 변형된 염기들을 포함하는, 방법.
  48. 제47항에 있어서, 상기 복수의 연속적인 변형된 염기들은 3개 이상의 연속적인 변형된 염기들을 포함하는, 방법.
  49. 제8항 내지 제48항 중 어느 한 항에 있어서, 상기 제2 핵산의 뉴클레오티드 염기들의 적어도 1%는 상기 제1 변형된 염기를 포함하는, 방법.
  50. 제8항 내지 제49항 중 어느 한 항에 있어서, 상기 제1 핵산은 핵산 주형과 결합할 수 있는 주형 포획 부위를 포함하는, 방법.
  51. 제50항에 있어서, 상기 주형 포획 부위는 주형 포획 서열을 포함하고, 상기 핵산 주형은, 상기 주형 포획 서열의 역방향 상보체와 적어도 90% 서열 동일성을 갖고 상기 주형 포획 서열에 혼성화될 수 있는 서열을 포함하는, 방법.
  52. 제51항에 있어서, 상기 핵산 주형은 단일 가닥 DNA를 포함하는, 방법.
  53. 제8항 내지 제52항 중 어느 한 항에 있어서, 상기 제2 핵산 내의 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 상기 제1 뉴클레오티드 중 하나 이상은 작용 모이어티(functional moiety)를 포함하는, 방법.
  54. 제53항에 있어서, 상기 제1 변형된 염기의 작용 모이어티는 클릭 화학 반응에 참여할 수 있는, 방법.
  55. 제53항 또는 제54항에 있어서, 상기 제2 핵산 내의 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기 및 상기 제1 뉴클레오티드는 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬을 포함하는, 방법.
  56. 제55항에 있어서, 상기 제1 변형된 염기의 작용 모이어티와 염기는 상기 포화 또는 불포화, 치환 또는 비치환, 직쇄 또는 분지형 지방족 탄소 사슬에 의해 연결된 상기 제1 변형된 염기의 2개의 말단 상에 존재하는, 방법.
  57. 제8항 내지 제56항 중 어느 한 항에 있어서,
    제1 부속 올리고뉴클레오티드를 제공하는 단계; 및
    상기 제2 핵산을 제2 반응에서 제2 온도에서 제2 반응 시간 동안 상기 제1 부속 올리고뉴클레오티드와 접촉시켜, 하나 이상의 상기 제1 부속 올리고뉴클레오티드에 부착된 상기 제2 핵산을 포함하는 제3 핵산을 생성하는 단계를 추가로 포함하는, 방법.
  58. 제57항에 있어서,
    상기 제1 부속 올리고뉴클레오티드를 제공하는 단계는 상기 제1 부속 올리고뉴클레오티드 및 제2 부속 올리고뉴클레오티드를 제공하는 단계를 포함하고,
    상기 제2 핵산을 상기 제1 부속 올리고뉴클레오티드와 접촉시키는 단계는 상기 제2 핵산을 상기 제2 반응에서 상기 제2 온도에서 상기 제2 반응 시간 동안 상기 제1 부속 올리고뉴클레오티드 및 상기 제2 부속 올리고뉴클레오티드와 접촉시켜, 하나 이상의 상기 제1 부속 올리고뉴클레오티드 및 하나 이상의 상기 제2 부속 올리고뉴클레오티드에 부착된 상기 제2 핵산을 포함하는 상기 제3 핵산을 생성하는 단계를 포함하는, 방법.
  59. 제57항 또는 제58항에 있어서, 상기 제1 부속 올리고뉴클레오티드는 제1 어댑터 서열 또는 이의 역방향 상보체를 포함하는, 방법.
  60. 제57항 내지 제59항 중 어느 한 항에 있어서, 상기 제2 부속 올리고뉴클레오티드는 제2 어댑터 서열 또는 이의 역방향 상보체를 포함하는, 방법.
  61. 제59항 또는 제60항에 있어서, 상기 제1 어댑터 서열은 P5 서열을 포함하는, 방법.
  62. 제59항 내지 제61항 중 어느 한 항에 있어서, 상기 제2 어댑터 서열은 P7 서열을 포함하는, 방법.
  63. 제57항 내지 제62항 중 어느 한 항에 있어서, 하나 이상의 상기 제1 부속 올리고뉴클레오티드 및 상기 제2 부속 올리고뉴클레오티드는 약 10개의 뉴클레오티드 길이 내지 약 100개의 뉴클레오티드 길이인, 방법.
  64. 제57항 내지 제63항 중 어느 한 항에 있어서, 상기 제3 핵산은 약 10 내지 약 1,000,000개의 상기 제1 부속 올리고뉴클레오티드를 포함하는, 방법.
  65. 제57항 내지 제64항 중 어느 한 항에 있어서, 상기 제3 핵산은 약 10 내지 약 1,000,000개의 상기 제2 부속 올리고뉴클레오티드를 포함하는, 방법.
  66. 제57항 내지 제65항 중 어느 한 항에 있어서, 상기 제3 핵산은 하나 이상의 상기 제1 부속 올리고뉴클레오티드에 부착된 상기 제2 핵산을 포함하는, 방법.
  67. 제57항 내지 제66항 중 어느 한 항에 있어서, 상기 제3 핵산은 하나 이상의 상기 제2 부속 올리고뉴클레오티드에 부착된 상기 제2 핵산을 포함하는, 방법.
  68. 제57항 내지 제67항 중 어느 한 항에 있어서, 상기 제1 부속 올리고뉴클레오티드를 제공하는 단계는 상기 제1 부속 올리고뉴클레오티드 및 제1 중합체를 포함하는 제1 부속물을 제공하는 단계를 포함하고, 상기 제2 핵산을 상기 제1 부속 올리고뉴클레오티드와 접촉시키는 단계는 상기 제2 핵산을 상기 제2 반응에서 상기 제2 온도에서 상기 제2 반응 시간 동안 상기 제1 부속물과 접촉시켜, 하나 이상의 상기 제1 부속물에 부착된 상기 제2 핵산을 포함하는 상기 제3 핵산을 생성하는 단계를 포함하는, 방법.
  69. 제57항 내지 제68항 중 어느 한 항에 있어서, 상기 제2 부속 올리고뉴클레오티드를 제공하는 단계는 상기 제2 부속 올리고뉴클레오티드 및 제2 중합체를 포함하는 제2 부속물을 제공하는 단계를 포함하고/하거나, 상기 제2 핵산을 상기 제2 부속물과 접촉시키는 단계는 상기 제2 반응에서 상기 제2 온도에서 상기 제2 반응 시간 동안 상기 제2 핵산과 상기 제2 부속물을 접촉시켜, 하나 이상의 상기 제2 부속물에 부착된 상기 제2 핵산을 포함하는 상기 제3 핵산을 생성하는 단계를 포함하는, 방법.
  70. 제68항 또는 제69항에 있어서, 상기 제1 부속물은 공유 연결된 상기 제1 부속 올리고뉴클레오티드 및 상기 제1 중합체를 포함하고, 상기 제2 부속물은 공유 연결된 상기 제2 부속 올리고뉴클레오티드 및 상기 제2 중합체를 포함하는, 방법.
  71. 제57항 내지 제67항 중 어느 한 항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체는 제1 작용 모이어티를 포함하는, 방법.
  72. 제57항 내지 제67항 중 어느 한 항에 있어서, 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체는 제2 작용 모이어티를 포함하는, 방법.
  73. 제57항 내지 제73항 중 어느 한 항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티와 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티는 동일한, 방법.
  74. 제73항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티는 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있는, 방법.
  75. 제73항 또는 제74항에 있어서, 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티는 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와 반응하여 공유 결합을 형성할 수 있는, 방법.
  76. 제71항 내지 제75항 중 어느 한 항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티는 클릭 화학 반응에 참여할 수 있는, 방법.
  77. 제71항 내지 제76항 중 어느 한 항에 있어서, 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티는 클릭 화학 반응에 참여할 수 있는, 방법.
  78. 제76항 또는 제77항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티는 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와의 클릭 화학 반응에 참여할 수 있는, 방법.
  79. 제76항 내지 제78항 중 어느 한 항에 있어서, 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티는 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티와의 클릭 화학 반응에 참여할 수 있는, 방법.
  80. 제76항 내지 제79항 중 어느 한 항에 있어서, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티, 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티, 상기 제1 뉴클레오시드 트라이포스페이트의 제1 변형된 염기의 작용 모이어티, 및 상기 제1 뉴클레오티드의 작용 모이어티 중 하나 이상은 독립적으로 아지드, 알키닐, 알케닐, 티올, 또는 니트론인, 방법.
  81. 제76항 내지 제80항 중 어느 한 항에 있어서, 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티 및 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티, 또는 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티 및 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티, 또는 둘 모두는 하기 쌍으로부터 선택되는, 방법:
    (i) 아지도/알키닐;
    (ii) 알키닐/아지도;
    (iii) 티올/알키닐;
    (iv) 알키닐/티올;
    (v) 알케닐/티올;
    (vi) 티올/알케닐;
    (vii) 아지도/사이클로옥티닐;
    (viii) 사이클로옥티닐/아지도;
    (ix) 니트론/사이클로옥티닐; 및
    (x) 사이클로옥티닐/니트론.
  82. 제76항 내지 제81항 중 어느 한 항에 있어서, 상기 제1 뉴클레오티드의 제1 변형된 염기의 작용 모이어티는 아지도이고, 상기 제1 부속 올리고뉴클레오티드 또는 상기 제1 중합체의 제1 작용 모이어티 및 상기 제2 부속 올리고뉴클레오티드 또는 상기 제2 중합체의 제2 작용 모이어티 중 하나 이상은 독립적으로 알키닐인, 방법.
  83. 제76항 내지 제82항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 구리 촉매된 아지드-알킨 부가환화(CuAAC)를 포함하고, 상기 공유 결합은 트라이아졸릴을 포함하는, 방법.
  84. 제83항에 있어서, 상기 CuAAC는 Cu(I) 안정화 리간드를 포함하는, 방법.
  85. 제84항에 있어서, 상기 Cu(I) 안정화 리간드는 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)- 1H-1,2,3-트라이아졸-1-일]프로판올(BTTP), 3-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]프로필 하이드로겐 설페이트(BTTPS), 2-[4-({비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노}메틸)-1H-1,2,3-트라이아졸-1-일]에틸 하이드로겐 설페이트(BTTES), 2-[4-{(비스[(1-tert-부틸-1H-1,2,3-트라이아졸-4-일)메틸]아미노)메틸}-1H-1,2,3-트라이아졸-1-일]-아세트산(BTTAA), 바토페난트롤린 다이설포네이트 다이소듐 염(BPS), N,N,N′,N",N"-펜타메틸다이에틸렌트라이아민(PMDETA), 트리스-((1-벤질-1H-1,2,3-트라이아졸-4-일)메틸)아민(TBTA), 트리스(3-하이드록시프로필트라이아졸릴메틸)아민(THPTA), Nε-((1R,2R)-2-아지도사이클로펜틸옥시)카르보닐)-L-라이신(ACPK), 및 4-N,N-다이메틸 아미노-1,8-나프탈이미드(4-DMN)로 이루어진 군으로부터 선택되는, 방법.
  86. 제76항 내지 제82항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 변형-촉진된 아지드-알킨 부가환화(SPAAC)를 포함하고, 상기 공유 결합은 사이클로옥타-트라이아졸릴을 포함하는, 방법.
  87. 제76항 내지 제82항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 알킨 하이드로티올화를 포함하고, 상기 공유 결합은 알케닐 설파이드를 포함하는, 방법.
  88. 제76항 내지 제82항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 알켄 하이드로티올화를 포함하고, 상기 공유 결합은 알킬 설파이드를 포함하는, 방법.
  89. 제76항 내지 제82항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 변형-촉진된 알킨-니트론 부가환화(SPANC)를 포함하고, 상기 공유 결합은 옥타하이드로사이클로옥타-아이소옥사졸릴을 포함하는, 방법.
  90. 제89항에 있어서, 상기 사이클로옥티닐은 다이벤질사이클로옥틴(DBCO) 또는 이들의 유도체인, 방법.
  91. 제76항 내지 제90항 중 어느 한 항에 있어서, 상기 클릭 화학 반응은 생체적합성인, 방법.
  92. 제57항 내지 제91항 중 어느 한 항에 있어서, 상기 제2 온도는 약 20 ℃ 내지 약 65 ℃인, 방법.
  93. 제57항 내지 제91항 중 어느 한 항에 있어서, 상기 제2 온도는 0 ℃ 미만인, 방법.
  94. 제57항 내지 제91항 중 어느 한 항에 있어서, 상기 제2 온도는 약 -4℃ 내지 약 -20 ℃인, 방법.
  95. 제57항 내지 제94항 중 어느 한 항에 있어서, 상기 제2 반응 시간은 적어도 1초인, 방법.
  96. 제59항 내지 제95항 중 어느 한 항에 있어서,
    (c) 상기 제1 어댑터 서열 또는 이의 역방향 상보체, 상기 제2 어댑터 서열 또는 이의 역방향 상보체, 및 상기 제3 핵산 상의 상기 주형 포획 부위에 혼성화될 수 있는 핵산 혼성화 서열을 포함하는 상기 핵산 주형을 제공하는 단계;
    (d) 상기 제3 핵산을 상기 핵산 주형과 접촉시켜, 상기 핵산 주형이 상기 핵산 주형의 상기 핵산 혼성화 서열을 통해 상기 제3 핵산 상의 상기 주형 포획 부위에 혼성화된 상기 제3 핵산을 생성하는 단계;
    (e) 상기 핵산 주형과 혼성화된 상기 제3 핵산 상에서 증폭을 수행하여, 상기 핵산 주형의 서열 또는 이의 역방향 상보체를 포함하도록 연장된 하나 이상의 상기 제1 부속 올리고뉴클레오티드 및 하나 이상의 상기 제2 부속 올리고뉴클레오티드에 부착된 상기 제3 핵산을 포함하는 제4 핵산을 생성하는 단계; 및
    (f) 상기 제4 핵산을 사용하여 상기 핵산 주형의 서열을 결정하는 단계를 추가로 포함하는, 방법.
  97. 제96항에 있어서, 상기 핵산 주형의 핵산 혼성화 서열은 상기 주형 포획 부위의 역방향 상보체를 포함하는, 방법.
  98. 제8항 내지 제97항 중 어느 한 항에 있어서, 상기 제1 핵산, 상기 제2 핵산, 상기 제3 핵산, 및/또는 상기 제4 핵산은 제3 중합체를 포함하는, 방법.
  99. 제1항 내지 제98항 중 어느 한 항에 있어서, Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산을 포함하는, 방법.
  100. 제1항 내지 제98항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val인, 방법.
  101. 제1항 내지 제98항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu191Val인, 방법.
  102. 제1항 내지 제101항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 방법.
  103. 제1항 내지 제101항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val인, 방법.
  104. 제1항 내지 제101항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys193Asn인, 방법.
  105. 제1항 내지 제104항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 방법.
  106. 제1항 내지 제104항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val인, 방법.
  107. 제1항 내지 제104항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu194Gly인, 방법.
  108. 제1항 내지 제107항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 방법.
  109. 제1항 내지 제107항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val인, 방법.
  110. 제1항 내지 제107항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Asp242Tyr인, 방법.
  111. 제1항 내지 제110항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 방법.
  112. 제1항 내지 제110항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val인, 방법.
  113. 제1항 내지 제110항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys287Glu인, 방법.
  114. 제1항 내지 제113항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함하는, 방법.
  115. 제1항 내지 제113항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val인, 방법.
  116. 제1항 내지 제113항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Phe296Leu인, 방법.
  117. 제1항 내지 제116항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함하는, 방법.
  118. 제1항 내지 제116항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val인, 방법.
  119. 제1항 내지 제116항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Met299Lys인, 방법.
  120. 제1항 내지 제119항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함하는, 방법.
  121. 제1항 내지 제119항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val인, 방법.
  122. 제1항 내지 제119항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Thr342Ser인, 방법.
  123. 제1항 내지 제122항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함하는, 방법.
  124. 제1항 내지 제122항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val인, 방법.
  125. 제1항 내지 제122항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 His421Pro인, 방법.
  126. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  127. 제126항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 상기 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함하는, 방법.
  128. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  129. 제128항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 상기 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함하는, 방법.
  130. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  131. 제130항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 상기 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함하는, 방법.
  132. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  133. 제132항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 상기 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함하는, 방법.
  134. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  135. 제134항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 상기 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함하는, 방법.
  136. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  137. 제136항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 상기 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함하는, 방법.
  138. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함하는, 방법.
  139. 제138항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 상기 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 8개 이상을 포함하는, 방법.
  140. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함하는, 방법.
  141. 제140항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 상기 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro인, 방법.
  142. 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함하는, 방법.
  143. 제142항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 상기 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro인, 방법.
  144. 제1항 내지 제142항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함하는, 방법.
  145. 제1항 내지 제142항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 90% 동일한 아미노산 서열을 포함하는, 방법.
  146. 제1항 내지 제142항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 포함하는, 방법.
  147. 제1항 내지 제142항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 11과 적어도 95% 동일한 아미노산 서열을 포함하는, 방법.
  148. 제1항 내지 제142항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12와 적어도 80% 동일한 아미노산 서열을 포함하는, 방법.
  149. 제1항 내지 제148항 중 어느 한 항에 있어서, 상기 재조합 TdT는 47 ℃ 이상의 온도에서 안정한, 방법.
  150. 제1항 내지 제148항 중 어느 한 항에 있어서, 상기 재조합 TdT는 50 ℃ 이상의 온도에서 안정한, 방법.
  151. 제1항 내지 제148항 중 어느 한 항에 있어서, 상기 재조합 TdT는 55 ℃ 이상의 온도에서 안정한, 방법.
  152. 제1항 내지 제148항 중 어느 한 항에 있어서, 상기 재조합 TdT는 58 ℃ 이상의 온도에서 안정한, 방법.
  153. 제1항 내지 제152항 중 어느 한 항에 있어서, 상기 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%인, 방법.
  154. 제153항에 있어서, 상기 시험 온도는 37 ℃, 47 ℃, 50 ℃, 55 ℃, 또는 58 ℃인, 방법.
  155. 제1항 내지 제154항 중 어느 한 항에 있어서, 상기 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단편을 포함하는, 방법.
  156. 제155항에 있어서, 상기 SUMO 단편은 서열 번호 13과 적어도 80% 동일한 아미노산 서열을 포함하는, 방법.
  157. 제155항 또는 제156항에 있어서, 상기 재조합 TdT는 상기 재조합 TdT의 N-말단 상에 상기 SUMO 단편을 포함하는, 방법.
  158. 제156항에 있어서, 상기 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함하는, 방법.
  159. 제156항에 있어서, 상기 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함하는, 방법.
    제155항 또는 제156항에 있어서, 상기 재조합 TdT는 상기 재조합 TdT의 C-말단 상에 상기 SUMO 단편을 포함하는, 방법.
  160. 제8항 내지 제159항 중 어느 한 항의 방법에 의해 얻어지는 제2 핵산.
  161. 제57항 내지 제159항 중 어느 한 항의 방법에 의해 얻어지는 제3 핵산.
  162. 제96항 내지 제159항 중 어느 한 항의 방법에 의해 얻어지는 제4 핵산.
KR1020227042792A 2020-05-12 2021-05-11 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성 KR20230035237A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063023736P 2020-05-12 2020-05-12
US63/023,736 2020-05-12
PCT/US2021/031843 WO2021231477A2 (en) 2020-05-12 2021-05-11 Generating nucleic acids with modified bases using recombinant terminal deoxynucleotidyl transferase

Publications (1)

Publication Number Publication Date
KR20230035237A true KR20230035237A (ko) 2023-03-13

Family

ID=76284169

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227042792A KR20230035237A (ko) 2020-05-12 2021-05-11 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성

Country Status (8)

Country Link
US (1) US20210355518A1 (ko)
EP (1) EP4150065A2 (ko)
JP (1) JP2023526062A (ko)
KR (1) KR20230035237A (ko)
CN (1) CN115916967A (ko)
AU (1) AU2021271637A1 (ko)
CA (1) CA3177286A1 (ko)
WO (1) WO2021231477A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3182305A1 (en) 2020-07-21 2022-01-27 Pin Koon EE Base-modified nucleotides as substrates for tdt-based enzymatic nucleic acid
CN116836955B (zh) * 2023-05-17 2024-05-10 中国科学院深圳先进技术研究院 末端脱氧核苷酸转移酶及其制备方法
CN118256467B (zh) * 2024-03-22 2024-09-20 上海交通大学 末端脱氧核苷酸转移酶变体、核酸及应用

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
AU3539089A (en) 1988-04-08 1989-11-03 Salk Institute For Biological Studies, The Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
JP2801051B2 (ja) 1988-06-24 1998-09-21 アムジエン・インコーポレーテツド 核酸塩基配列を検出するための方法及び試薬
WO1990001069A1 (en) 1988-07-20 1990-02-08 Segev Diagnostics, Inc. Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
DE69118930T2 (de) 1990-01-26 1997-01-09 Abbott Lab Verbessertes Verfahren zur Amplifikation von Nuklein säurezielsequenz, einsetzbar für die Polymerase und Ligasekettenreaktion
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
JP3175110B2 (ja) 1994-02-07 2001-06-11 オーキッド・バイオサイエンシーズ・インコーポレイテッド リガーゼ/ポリメラーゼ媒体された単一ヌクレオチド多型のジェネティックビットアナリシスおよび遺伝子解析におけるその使用
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US8030000B2 (en) 2002-02-21 2011-10-04 Alere San Diego, Inc. Recombinase polymerase amplification
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
DE10215035A1 (de) * 2002-04-05 2003-10-23 Roche Diagnostics Gmbh Rekombinante terminale Deoxynukleotidyltransferase mit verbesserter Funktionalität
EP3002289B1 (en) 2002-08-23 2018-02-28 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
US7282328B2 (en) 2002-09-20 2007-10-16 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007107710A1 (en) 2006-03-17 2007-09-27 Solexa Limited Isothermal methods for creating clonal single molecule arrays
US8241573B2 (en) 2006-03-31 2012-08-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
EP2677308B1 (en) 2006-12-14 2017-04-26 Life Technologies Corporation Method for fabricating large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
US8034910B2 (en) * 2008-05-06 2011-10-11 Academia Sinica, Taiwan SUMO fusion protein expression system for producing native proteins
EP2291533B2 (en) 2008-07-02 2020-09-30 Illumina Cambridge Limited Using populations of beads for the fabrication of arrays on surfaces
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
EP2718465B1 (en) 2011-06-09 2022-04-13 Illumina, Inc. Method of making an analyte array
RS62530B1 (sr) 2011-09-23 2021-11-30 Illumina Inc Sastavi za sekvenciranje nukleinskih kiselina
EP2771103B1 (en) 2011-10-28 2017-08-16 Illumina, Inc. Microarray fabrication system and method
EP2628504A1 (en) 2012-01-16 2013-08-21 Greatbatch Ltd. EMI filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
MX337140B (es) 2012-04-03 2016-02-12 Illumina Inc Cabazal integrado de lectura optoelectrónica y cartucho fluído útil para secuenciación de ácidos nucleicos.
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
CA2915598C (en) 2013-07-01 2020-03-24 Illumina, Inc. Catalyst-free surface functionalization and polymer grafting
US10774316B2 (en) * 2014-10-20 2020-09-15 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
US11390858B2 (en) * 2014-10-20 2022-07-19 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
AU2015340767B2 (en) 2014-10-31 2020-01-30 Illumina Cambridge Limited Novel polymers and DNA copolymer coatings
RU2761432C2 (ru) 2015-02-10 2021-12-08 Иллюмина, Инк. Способ и композиция для анализа клеточных компонентов
GB201502152D0 (en) * 2015-02-10 2015-03-25 Nuclera Nucleics Ltd Novel use
WO2018217689A1 (en) * 2017-05-22 2018-11-29 The Charles Stark Draper Laboratory, Inc. Modified template-independent dna polymerase
EP3707274B1 (en) * 2017-11-07 2023-09-13 Life Technologies Corporation Methods and compositions for manipulating nucleic acids
US10752887B2 (en) * 2018-01-08 2020-08-25 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
GB201901501D0 (en) * 2019-02-04 2019-03-27 Nuclera Nucleics Ltd Modified terminal deoxynucleotidyl transferase (TdT) enzymes

Also Published As

Publication number Publication date
WO2021231477A3 (en) 2022-03-17
AU2021271637A1 (en) 2022-12-08
WO2021231477A9 (en) 2022-01-06
CA3177286A1 (en) 2021-11-18
JP2023526062A (ja) 2023-06-20
WO2021231477A2 (en) 2021-11-18
EP4150065A2 (en) 2023-03-22
US20210355518A1 (en) 2021-11-18
CN115916967A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
ES2889585T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES2929837T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2882608T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
US20210155985A1 (en) Surface concatemerization of templates
KR20230035237A (ko) 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 변형된 염기를 갖는 핵산의 생성
US8168388B2 (en) Preparation of nucleic acid templates for solid phase amplification
CN110997932A (zh) 用于甲基化测序的单细胞全基因组文库
AU2018259206B2 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA2895260A1 (en) Sample preparation on a solid support
KR20180014054A (ko) 뉴클레오타이드의 직교 비블록화
WO2018013724A1 (en) System and method for transposase-mediated amplicon sequencing
CA3211172A1 (en) Methods of preparing directional tagmentation sequencing libraries using transposon-based technology with unique molecular identifiers for error correction
WO2023122491A1 (en) Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides
AU2022413575A1 (en) Methods for metal directed cleavage of surface-bound polynucleotides