KR20230038415A - 열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제 - Google Patents

열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제 Download PDF

Info

Publication number
KR20230038415A
KR20230038415A KR1020227042776A KR20227042776A KR20230038415A KR 20230038415 A KR20230038415 A KR 20230038415A KR 1020227042776 A KR1020227042776 A KR 1020227042776A KR 20227042776 A KR20227042776 A KR 20227042776A KR 20230038415 A KR20230038415 A KR 20230038415A
Authority
KR
South Korea
Prior art keywords
tdt
amino acid
recombinant
seq
functionally equivalent
Prior art date
Application number
KR1020227042776A
Other languages
English (en)
Inventor
사우라브 라젠드라 니란타르
자스민 푸아이 수잔 추아
세르지오 페이사조비치
웬 샨 예
메이벨 달린 코 고
Original Assignee
일루미나, 인코포레이티드
일루미나, 싱가포르 피티이 엘티디
내셔널 유니버시티 오브 싱가포르
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드, 일루미나, 싱가포르 피티이 엘티디, 내셔널 유니버시티 오브 싱가포르 filed Critical 일루미나, 인코포레이티드
Publication of KR20230038415A publication Critical patent/KR20230038415A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)가 본 명세서에 개시된다. 일부 실시 형태에서, 재조합 TdT는 소 TdT와 적어도 80% 동일한 아미노산 서열을 포함하고, 재조합 TdT는 소 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함한다.

Description

열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제
관련 출원에 대한 상호 참조
본 출원은 2020년 5월 12일자로 출원된 미국 가특허 출원 제63/023,734호에 대한 우선권의 이익을 주장하며, 이의 내용은 전체적으로 본 명세서에 참고로 포함된다.
서열 목록에 대한 언급
본 출원은 전자 포맷의 서열 목록과 함께 제출된다. 서열 목록은, 2021년 5월 11일자로 생성되고 크기가 56 킬로바이트인, 파일명이 Sequences_Listing_47CX-311971-WO인 파일로서 제공된다. 서열 목록의 전자 포맷의 정보는 본 명세서에 전체적으로 참고로 포함된다.
기술분야
대체적으로, 본 발명은 재조합 단백질, 예를 들어 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제의 분야에 관한 것이다.
말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 단일 가닥 DNA 상에의 임의적인 뉴클레오티드의 무주형 도입(template free incorporation)을 촉매한다. 그러나, 야생형(WT) TdT는 3' 변형된 뉴클레오티드의 도입에 최적화되어 있지 않다. 더욱이, TdT는 미미하게 안정하며, 이에 따라 3' 블록 도입을 위한 능력에 있어서의 진전은 불안정한 돌연변이체로 이어질 가능성이 높을 것인데, 그 이유는, 대부분의 돌연변이는 열안정성의 하락으로 이어지기 때문이다. 따라서, 3'-변형된 뉴클레오티드의 효율적인 도입을 가능하게 하는 돌연변이체의 진전을 위한 출발점으로서의 역할을 할 수 있는 열안정성 TdT 변이체에 대한 필요성이 있다.
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 재조합 TdT는 서열 번호 12의 보스 타우루스(Bos taurus) TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함한다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Gly, Glu191Ile, Glu191Leu, Glu191Met, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Val일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn, Lys193Gln, Lys193Ser, 또는 Lys193Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Gly, Glu194Ile, Glu194Leu, Glu194Met, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Gly일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 방향족 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Asn, Asp242Gln, Asp242Phe, Asp242Ser, Asp242Thr, Asp242Trp, 또는 Asp242Tyr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Tyr일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 음으로 하전된 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Asp 또는 Lys287Glu일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Glu일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Gly, Phe296Ile, Phe296Leu, Phe296Met, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Leu일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Arg, Met299His, 또는 Met299Lys일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Lys일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Asn, Thr342Cys, Thr342Gln, Thr342Pro, 또는 Thr342Ser일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ser일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Asn, His421Cys, His421Gln, His421Pro, His421Ser, 또는 His421Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 8개 이상을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 90% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 11과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 12와 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다.
일부 실시 형태에서, 재조합 TdT는 47℃ 이상의 온도에서 안정하다. 재조합 TdT는 50℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 55℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 58℃ 이상의 온도에서 안정할 수 있다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%이다. 시험 온도는 37℃, 47℃, 50℃, 55℃, 또는 58℃일 수 있다.
일부 실시 형태에서, 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단편을 포함한다. SUMO 단편은 서열 번호 13과 적어도 80% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 재조합 TdT의 N-말단 상에 SUMO 단편을 포함할 수 있다. 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 재조합 TdT는 재조합 TdT의 C-말단 상에 SUMO 단편을 포함할 수 있다.
본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드의 실시 형태가 본 명세서에 개시된다. 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터의 실시 형태가 본 명세서에 개시된다. 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다.
키트가 본 명세서에 개시된다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT); 및 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드 및/또는 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터; 및 상기 발현 벡터, 상기 폴리뉴클레오티드 및/또는 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제, 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드, 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터, 또는 이들의 조합을 포함하는 숙주 세포; 및 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제, 상기 폴리뉴클레오티드, 상기 발현 벡터, 상기 숙주 세포, 또는 이들의 조합을 사용하기 위한 설명서를 포함한다.
본 명세서에 기재된 발명 요지의 하나 이상의 구현 형태들에 대한 상세사항들이 첨부 도면 및 이하의 설명에 기재되어 있다. 다른 특징들, 태양들, 및 이점들이 설명, 도면, 및 청구범위로부터 명백해질 것이다. 본 개요 또는 하기의 상세한 설명 어느 것도 본 발명 요지의 범주를 한정하거나 제한하고자 하지 않는다.
도 1은 보스 타우루스 TdT(서열 번호 12)의 아미노산 139 내지 520(서열 번호 1)과 SUMO-TdT(서열 번호 14)의 비제한적인 예시적인 서열 정렬을 나타낸다. SUMO-TdT는, 아미노산 위치 123 내지 504에서 보스 타우루스 TdT의 아미노산 139 내지 520을 함유하고, 아미노산 위치 22 내지 119에서 N-말단 SUMO-태그(서열 번호 13)를 함유하는 재조합 TdT를 지칭한다. 여기서 확인된 SUMO-TdT(및 이의 TdT 변이체)에서의 치환 돌연변이의 위치 및 보스 타우루스 TdT에서의 상응하는 위치가 강조되어 있다.
도 2는 3'-OH로부터 2개의 염기가 떨어진 뉴클레오티드 상에 FAM 염료(2bA FAM)를 갖는 올리고 상에의 활성 TdT에 의한 Cy5-dCTP의 도입을 검출하기 위한 FRET 반응의 비제한적인 예시적인 개략도이다. 스크리닝의 제1 라운드는 모 주형(parent template)으로서 SUMO-TdT(이는, 소 TdT의 처음 138개의 아미노산이 결실되고 용해성 및 발현을 개선하는 N-말단 SUMO-태그를 함유하는 재조합 소 TdT임)를 사용하였으며, 돌연변이체 TdT1-1 및 TdT1-2를 열안정성으로서 확인시켜 주었다. 스크리닝의 제2 라운드는 모 주형으로서 TdT1-2를 사용하였으며, 1분 동안 50℃의 열처리로 수행하고, 4개의 열안정성 돌연변이체를 확인하였다(TdT2-1, TdT2-2, TdT2-3, TdT2-4). 스크리닝의 제3 라운드는, TdT2-1, TdT2-2, TdT2-3 및 TdT2-4에서 발견된 돌연변이들의 상이한 조합과 함께, 모 주형으로서 TdT1-1 및 TdT1-3을 사용하였으며, TdT3-2가 열안정성인 것으로 확인되었다.
도 3a 내지 도 3e는 TdT 활성의 검출을 위한 FRET 검정의 확립을 나타낸다. 도 3a는 3'-OH로부터 2개의 염기가 떨어진 뉴클레오티드 상에 FAM 염료(2bA FAM)를 갖는 올리고 상에의 활성 TdT에 의한 Cy5-dCTP의 도입을 검출하기 위한 FRET 반응의 비제한적인 예시적인 개략도이다. 도 3b는 450 nm의 FAM 여기 파장으로 670 nm에서의 Cy5 방출의 증가에 상응하는 정제된 TdT 활성을 검출하기 위한 도 3a에서의 개략도의 예비 시험을 나타낸다. 도 3c는, 높은 농도에서, 세포 용해물 내의 내인성 뉴클레아제가 올리고 기질을 분해하는 것을 나타내는 비제한적인 예시적인 개략도이다. 용해물의 희석은 TdT와 대비하여 뉴클레아제 활성을 불균형적으로 낮추는데, 이는 TdT 활성의 검출을 가능하게 한다. 가위 기호는 뉴클레아제를 지칭한다. 별 기호는 활성 TdT를 지칭한다. 도 3d는 5' FAM-태그된 올리고(FAM20) 및 dCTP와 함께 인큐베이션된, TdT 완충액 중 TdT 발현 세포 용해물의 다양한 희석의 결과를 보여주는 겔 이미지이다. TdT 활성을 나타내는 더 높은 밴드(박스로 표시되어 있음)는 단지 50배 및 500배 희석에서만 관찰되는 반면, 더 낮은 희석은 내인성 뉴클레아제에 의한 분해로 이어진다(청색선 아래). 도 3e는 50배 희석된 세포 용해물을 사용한 SUMO-TdT 및 빈 플라스미드에 대한 96웰 플레이트 FRET 검정의 결과를 보여주는 비제한적인 예시적인 도표이다. 670 nm에서의 더 높은 FRET 신호는 SUMO-TdT(적색선)를 발현하는 세포 용해물에 대해서는 관찰되었지만, 빈 플라스미드(청색선)를 갖는 것들에 대해서는 관찰되지 않았는데, 이는 이 검정이 활성 TdT를 스크리닝하는 데 사용될 수 있었음을 시사한다.
도 4a 내지 도 4d는 450 nm에서의 여기로 TAMRA-dCTP가 있는 상태에서의 상이한 FAM-태그된 올리고의 방출 파장 스캔을 나타낸다. 도 4a는 TdT의 존재 또는 부재 하에서의 TAMRA-dCTP가 있는 상태에서의 올리고 1bA FAM의 방출 파장 스캔의 비제한적인 예시적인 도표이다. 520 nm에서의 FAM의 방출의 감소는 낮았는데, 이는 TAMRA 염료로의 비효율적인 에너지 전달을 시사한다. 도 4b는 TdT의 존재 또는 부재 하에서의 TAMRA-dCTP가 있는 상태에서의 올리고 2bA FAM의 방출 파장 스캔의 비제한적인 예시적인 도표이다. TdT와의 인큐베이션 시에, FAM으로부터의 방출 신호의 감소 및 TAMRA로부터의 방출 신호의 이득(gain)은 조사된 4개의 올리고 중에서 최상인 것으로 보인다. 도 4c는 TdT의 존재 또는 부재 하에서의 TAMRA-dCTP가 있는 상태에서의 올리고 5bA FAM의 방출 파장 스캔의 비제한적인 예시적인 도표이다. TdT가 존재할 때, FAM의 방출 신호의 감소 및 TAMRA의 방출 신호의 이득은 도 4b에 나타낸 것보다 더 낮았다. 도 4d는 TdT의 존재 또는 부재 하에서의 TAMRA-dCTP가 있는 상태에서의 올리고 10bA FAM의 방출 파장 스캔의 비제한적인 예시적인 도표이다. TdT의 존재 및 부재 하에서 FAM과 TAMRA의 방출 신호에 차이가 없었다.
도 5a 내지 도 5c는 상이한 FRET 쌍들의 방출 파장 스캔을 나타낸다. 도 5a는 TdT의 존재 또는 부재 하에서의 2bA FAM 올리고 및 TAMRA-dCTP의 방출 파장 스캔의 비제한적인 예시적인 도표이다. 방출 파장을 450 nm에서의 여기로 480 nm부터 700 nm까지 스캐닝하였다. 2bA 올리고는 TAMRA 수용체 염료의 방출에 상응하는 575 nm에서 강한 신호를 나타내지 않았다. 도 5b는 TdT의 존재 또는 부재 하에서의 2bA FAM 올리고 및 Cy5-dCTP의 방출 파장 스캔의 비제한적인 예시적인 도표이다. 방출 파장을 450 nm에서의 여기로 480 nm부터 700 nm까지 스캐닝하였다. TdT가 존재할 때 670 nm에서 신호의 증가가 있었다. 이는 FAM 및 Cy5 FRET 쌍을 사용한 활성 TdT의 성공적인 검출을 시사한다. 도 5c는 TdT의 존재 또는 부재 하에서의 2bA FAM 올리고 및 Cy3-dCTP의 방출 파장 스캔의 비제한적인 예시적인 도표이다. 방출 파장을 500 nm에서의 여기로 530 nm부터 700 nm까지 스캐닝하였다. 3'-OH로부터 2개의 염기가 떨어진 염기 상에 표지화된 Cy3 염료를 갖는 올리고를 Cy5-dCTP 및 TdT와 함께 인큐베이션하였다. 도 5b에서의 것과 대비하여 670 nm에서 신호의 더 낮은 이득이 있었다.
도 6은 TdT 열안정성 스크리닝을 위한 비제한적인 예시적인 방법을 보여주는 개략도이다. 2개의 연속 희석 단계(10배 및 5배)는 순(net) 50배 희석된 용해물을 가져온다.
도 7a 내지 도 7d는 열안정성 스크리닝의 3회의 라운드들에 걸친 TdT 변이체의 FRET 판독치를 나타낸다. 도 7a는 SUMO-TdT 및 돌연변이체 TdT1-1 및 TdT1-2의 FRET 활성의 비교를 보여주는 비제한적인 예시적인 히스토그램이다. 비가열된 처리는 도입 반응 전에 세포 용해물의 무열처리를 지칭하고, 가열된 처리는 반응 전에 47℃에서 1분 동안 가열된 세포 용해물을 지칭한다. 반응 시간 과정의 15번째 분과 30번째 분 사이의 SUMO-TdT, TdT1-1, TdT1-2의 FRET 판독치를 기록하였으며, 평균값이 상기 히스토그램에 표시되어 있다. 부등 분산과 함께 스튜던트 T-검정(Student's T-Test)을 사용한 분석을 수행하였으며, 이는 SUMO-TdT, TdT1-1 및 TdT1-2의 평균 FRET 판독치가 유의하게 상이함을 나타낸다. 평균 가열된 FRET 판독치를 평균 비가열된 FRET 판독치로 나눔으로써 TdT1-1 및 TdT1-2의 평균 활성비를 계산하였다. TdT1-1 및 TdT1-2는 열처리 후에 더 높은 활성을 보유하였다. 둘 모두는 SUMO-TdT보다 유의하게 더 높다. 도 7b는 스크리닝의 제2 라운드를 보여주는 비제한적인 예시적인 히스토그램으로서, 50℃에서 1분 동안의 열처리는 돌연변이체 TdT2-1, TdT2-2, TdT2-3 및 TdT2-4가 모 TdT1-1보다 유의하게 더 높은 FRET 값 및 활성비를 가졌음을 확인시켜 주었다. 도 7c는 모 주형 TdT1-1을 사용한 스크리닝의 제3 라운드를 보여주는 비제한적인 예시적인 히스토그램으로서, TdT3-1이 55℃에서의 열처리 후에 TdT1-1보다 유의하게 더 높은 FRET 판독치 및 활성비를 갖는다는 것을 확인시켜 주었다. 도 7d는 모 주형 TdT1-3(TdT1-1과 TdT1-2의 혼성체)을 사용한 스크리닝의 제3 라운드를 보여주는 비제한적인 예시적인 히스토그램으로서, TdT3-2는 58℃에서의 1분간 열처리 후에 TdT1-3보다 유의하게 더 높은 FRET 판독치를 갖는 것으로 확인되었으며, 유의하게 더 높은 활성 비율을 보유하였다.
도 8a 및 도 8b는 SUMO-TdT 및 TdT3-2의 정제 및 정제된 TdT에서의 뉴클레아제 오염의 검증을 보여준다. 도 8a는 SUMO-TdT 및 TdT3-2의 정제를 보여주는 비제한적인 예시적인 겔 이미지이다. 정제된 SUMO-TdT 및 TdT3-2의 수율은 각각 8.5 mg/L 배양물 및 14.1 mg/L 배양물이었다. 1 ㎍의 각각 투석되고 정제된 SUMO-TdT 및 TdT3-2의 SDS-PAGE 겔. SUMO-TdT의 예상된 크기는 57.9 kD이고, TdT3-2는 57.7 kD이다. 58 kD 래더(ladder) 주위의 주요 밴드들이 SUMO-TdT 및 TdT3-2 둘 모두에 대해 관찰되었는데, 이는 각각의 단백질들에 상응한다. 주요 밴드들의 위치는 Nickel IMAC 및 Q Sepharose IEX 크로마토그래피를 통한 SUMO-TdT 및 TdT3-2의 성공적인 정제를 시사한다. 도 8b는 정제된 SUMO-TdT 및 TdT3-2에 대한 뉴클레아제 오염의 존재를 조사하기 위한 뉴클레아제 시험을 보여주는 비제한적인 예시적인 겔 이미지이다. 35개의 염기의 단일 가닥 올리고 기질을 개별적으로 SUMO-TdT 및 TdT3-2와 함께 인큐베이션하였다. 샘플을 TBE-우레아 겔 상에서 시각화하였다. 35개의 염기보다 더 적게 관찰된 밴드는 단일 가닥 올리고 기질을 분해시킨 단백질 샘플 내의 뉴클레아제의 존재를 시사할 것이다. 레인(lane) 3은 뉴클레아제가 존재하였을 때 분해된 DNA 산물의 예상된 관찰을 입증하기 위한 대조군이다. 레인 3, 레인 4, 및 레인 5를 비교하면, 훨씬 더 적은 크기가 더 작은 밴드가 레인 4 및 레인 5에서 관찰된다. 이는 최소한의 뉴클레아제가 정제된 SUMO-TdT 및 TdT3-2에 존재하였음을 시사한다.
도 9a 내지 도 9d는 정제된 SUMO-TdT 및 TdT3-2의 Tm 측정치를 나타낸다. 도 9a는 정제된 SUMO-TdT 및 TdT3-2의 시차 주사 열량측정법(DSC)의 비제한적인 예시적인 도표이다. 이 그래프의 피크는 단백질의 50%가 풀린 단백질의 전이 중간점(Tm 또는 용융 온도)에 상응한다. SUMO-TdT의 평균 Tm은 40.2℃이고, TdT3-2는 50.7℃였다. 도 9b는 정제된 SUMO-TdT 및 TdT3-2의 시차 주사 형광측정법(DSF)의 비제한적인 예시적인 도표이다. 온도에 대한 F350nm/F330nm의 음의 도함수의 그래프에서 관찰된 피크는 단백질의 Tm에 상응한다. SUMO-TdT의 평균 Tm은 43.5℃이고, TdT3-2는 53.1℃였다. 도 9c는 정제된 SUMO-TdT 및 TdT3-2의 SYPRO Orange 열이동 검정(thermal shift assay)의 결과의 비제한적인 예시적인 도표이다. SYPRO Orange 염료는 풀린 단백질 내의 소수성 영역에 비특이적으로 결합한다. 온도에 대한 -dRFU/온도 그래프에서 관찰된 피크는 SUMO-TdT 및 TdT3-2의 Tm에 상응한다. SUMO-TdT의 평균 Tm은 41.5℃이고, TdT3-2는 51.5℃였다. 도 9d는 온도의 함수로서 222 nm에서의 CD 타원율(Ellipticity)의 1차 도함수의 비제한적인 예시적인 도표이다. 이 그래프에서 관찰된 피크는 단백질의 Tm에 상응한다. SUMO-TdT의 평균 Tm은 45.7℃이고, TdT3-2는 52.5℃였다.
도 10a 내지 도 10d는 상이한 온도에서의 시판(NEB) TdT, SUMO-TdT 및 TdT3-2 활성의 관찰을 보여주는 비제한적인 예시적인 겔 이미지이다. 모든 TdT는 (도 10a) 25℃ 및 (도 10b) 36℃에서 활성이었다. 도 10c는, NEB TdT 및 SUMO-TdT는 5분 이내에 변성된 반면에, 더 높은 크기의 밴드 DNA 산물로부터 관찰된 바와 같이, 47℃에서 20분 동안 TdT3-2가 dCTP를 5' FAM 표지화된 올리고 상에 도입시킬 수 있음을 나타낸다. 도 10d는 단지 TdT3-2만이 5분 미만 동안에도 불구하고 58℃에서 활성이었음을 나타낸다. NEB TdT 및 SUMO-TdT는 변성되었다.
도 11은 ds 블런트 말단 DNA 기질 상에서의 시판 TdT(NEB TdT) 및 TdT3-2 활성을 조사하는 비제한적인 예시적인 도표이다. TdT3-2는 37℃ 및 50℃ 둘 모두에서 더 높은 양의 ddCTP를 ds 블런트 말단 DNA 기질 상에 도입시킬 수 있었다. 백분율은 50℃에서 증가하였다. 37℃에서 4분 동안, NEB TdT에 의해 ddCTP가 도입된 프라이머의 백분율은 약 13.4%인 반면에, TdT3-2는 55.7%이다. 50℃에서 동일한 지속시간 동안, NEB TdT에 의한 프라이머 상에의 ddCTP의 도입의 백분율은 약 8%인 반면, TdT3-2는 약 89.9%이다.
도 12는 NEB TdT 및 TdT3-2에 의해, ddCTP가 FAM-태그된 올리고 상에 도입된 것을 보여주는 비제한적인 예시적인 겔 그래프이다. 밴드들의 강도를 Bio-Rad Image Lab 소프트웨어를 사용하여 분석하고, GraphPad를 사용하여 플롯팅하였다. TdT3-2는 +1 밴드들의 더 높은 강도에 의해 관찰된 바와 같이, NEB TdT보다 더 많은 ddCTP를 도입시켰다. 50℃의 승온에서, TdT3-2는 50℃에서의 +1 밴드들의 증가된 비율에 의해 관찰된 바와 같이, 37℃에서보다 더 많은 ddCTP를 도입시켰다.
도 13은 형광 편광을 통한 올리고 기질에 대한 SUMO-TdT 및 TdT3-2의 결합 친화성에 대한 데이터를 나타낸다. 다양한 양의 SUMO-TdT 및 TdT3-2를 37℃에서 10분 동안 5 nM 5'-FAM-표지화된 올리고와 함께 인큐베이션한 후, 마이크로플레이트 판독기 상에서 편광을 판독하였다.
도 14는 Phyre2 웹 포털을 사용하여 TdT3-2의 예상된 단백질 구조를 보여주는 비제한적인 예시적인 이미지이다. SUMO-TdT와 상이한 TdT3-2 내의 아미노산 잔기들은 더 어두운 음영으로 강조되어 있고, 표시된 바와 같이 표지화되어 있다. 더 밝은 음영으로 강조된 잔기들(338D, 340D 및 428D)은 도입 반응 동안 2가 금속 이온에 결합하는 잔기들에 상응한다. DNA에 결합하는 잔기들은 강조된 알파 나선(잔기 253 내지 257) 상에 있다. TdT3-2의 루프1(Loop1)이 강조되어 있다(잔기 376 내지 394).
하기의 상세한 설명에서는 첨부 도면을 참조하며, 이들 도면은 본 명세서의 일부를 형성한다. 도면에서, 유사한 기호는, 문맥이 달리 지시하지 않는 한, 전형적으로 유사한 구성요소를 나타낸다. 상세한 설명, 도면, 및 청구범위에 기재된 예시적인 실시 형태는 제한적인 것으로 의미되지 않는다. 본 명세서에 제시된 발명 요지의 사상 또는 범주로부터 벗어남이 없이 다른 실시 형태가 이용될 수 있고, 다른 변경이 이루어질 수 있다. 본 명세서에 대체적으로 기재되고 도면에 예시된 바와 같은 본 발명의 태양은 각종 매우 다양한 구성으로 배열, 치환, 조합, 분리, 및 설계될 수 있으며, 이들 모두는 본 명세서에서 명백하게 고려되고 본 발명의 일부를 구성함이 쉽게 이해될 것이다.
본 명세서에 언급된 모든 특허, 공개된 특허 출원, 다른 간행물, 및 GenBank로부터의 서열, 및 다른 데이터베이스는 관련 기술에 대해 전체적으로 참고로 포함된다.
합성에 의한 서열분석 기술은 생명의 기저 소스 코드(underlying source code)에 대한 막대한 양의 정보의 발견을 가능하게 하였다. 이러한 정보로부터 충분히 이익을 얻기 위하여, 서열분석으로부터 도출된 이해가 예측가능하게 새로운 시스템을 생성하는 데 사용될 수 있는지의 여부를 시험하기 위해 완전 합성 유전자 및 게놈을 생성하는 것이 필요하다. 예를 들어, 화학적으로 합성된 올리고를 사용하여 작제된 게놈을 사용한 합성 유기체의 작제가 입증되어 있다. 유사하게, 64개의 코돈 대신에 단지 57개의 코돈만으로 합성 효모 및 E. 콜라이(E. coli)를 생성하거나 심지어 멸종된 유기체(참조 6 및 7)를 재생하기 위한 노력은 생물학적 조작에서 다음 단계로의 전진을 나타낸다.
그러나, 이러한 노력은 현재의 올리고뉴클레오티드 및 유전자 합성 방법이 포스포르아미다이트 화학을 사용하는 화학적 합성에 의지한다는 사실에 의해 방해받고 있다. 이 방법은 결실 및 부반응으로 인한 200 bp 미만의 최대 크기뿐만 아니라, 환경적으로 유해한 유기 화학물질 및 폐기물의 사용 및 생성과 같은 많은 제한을 부과한다. 그 결과, 게놈 규모 작제의 비용은 수백만 달러가 투입되고, 이는 큰 장애물을 나타낸다.
야생형 말단 데옥시뉴클레오티딜 트랜스퍼라제는 매우 불안정하고, 성장하는 ssDNA 가닥 내로의 단일 3' 블록킹된 뉴클레오티드의 단계별 도입 및 탈보호를 사용하는 효소적 올리고뉴클레오티드 및 유전자 합성에 최적화되어 있지 않다. 3' 블록킹된 뉴클레오티드를 받아들일 수 있고 증가된 활성 및 견고성을 갖는 조작된 TdT가 필요하다.
말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 단일 가닥 DNA 상에의 임의적인 뉴클레오티드의 무주형 도입을 촉매한다. TdT는 생명공학 및 임상 응용에서 널리 사용되어 왔다. 한 가지 가능한 사용은 3' 가역적으로 블록킹된 뉴클레오티드의 TdT-매개 반복 도입 후 탈블록킹에 의한 긴 드 노보(de novo) DNA 분자의 합성이다. 그러나, 야생형(WT) TdT는 3' 변형된 뉴클레오티드의 도입에 최적화되어 있지 않으며, TdT 조작은, TdT가 미미하게 안정하고 단지 중온성 유기체에만 존재한다는 사실에 의해 방해된다. 열안정성 TdT 변이체는 3'-변형된 뉴클레오티드의 효율적인 도입을 가능하게 하는 후속 진전을 위한 중추적인 역할을 할 수 있다. 열안정성 변이체는 그러한 노력을 위한 우수한 출발점이 될 것인데, 그 이유는, 벌키한 변형된 뉴클레오티드를 도입시키는 진전은 일반적으로 더 낮은 안정성을 초래하기 때문이다. 게다가, DNA 2차 구조가 WT 활성을 억제하는 상황에서 열안정성 TdT가 또한 유용할 것인데, 그 이유는, dsDNA를 용융시키는 데 더 높은 온도가 사용될 수 있기 때문이다. 본 명세서에 기재된 검정은 열안정성 TdT 변이체를 확인하기 위해 개발되었다. 약 10,000개의 TdT 돌연변이체를 스크리닝한 후, SUMO-TdT보다 10℃ 더 열안정성이고 WT 효소의 촉매 특성을 보존한, TdT3-2로 명명되는 돌연변이체를 확인하였다. 본 명세서에 개시된 임의의 재조합 TdT가 단일 가닥 DNA 상에 3' 블록킹된 뉴클레오티드를 도입시킬 수 있는 TdT의 진전을 위한 스캐폴드로서 사용될 수 있다.
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)의 일부 실시 형태가 본 명세서에 제공되어 있다. 일부 실시 형태에서, 재조합 TdT는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함한다. 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드의 실시 형태가 본 명세서에 개시된다. 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터의 실시 형태가 본 명세서에 개시된다. 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 본 발명의 재조합 말단 데옥시뉴클레오티딜을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다.
정의
달리 정의되지 않으면, 본 명세서에서 사용되는 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 예를 들어, 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, NY 1994)]; 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY 1989)]을 참조한다. 본 발명의 목적상, 하기 용어는 하기에 정의된다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여, 용어 "동일한" 또는 "퍼센트 동일성"은, 시각적 검사에 의해, 또는 서열 비교 알고리즘을 사용하여 측정되는 바와 같이, 최대 일치도(maximum correspondence)에 대해 비교되고 정렬될 때, 동일하거나, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다.
2개의 핵산 또는 폴리펩티드(예를 들어, 단백질, 또는 단백질의 아미노산 서열을 인코딩하는 DNA)와 관련하여, 어구 "실질적으로 동일한"은, 시각적 검사에 의해, 또는 서열 비교 알고리즘을 사용하여 측정되는 바와 같이, 최대 일치도에 대해 비교되고 정렬될 때, 적어도 약 60%, 약 80%, 약 90 내지 95%, 약 98%, 약 99% 또는 그 이상의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 그러한 "실질적으로 동일한" 서열들은 전형적으로 실제 선조에 대한 참조 없이 "상동성"인 것으로 여겨진다. "실질적인 동일성"은 적어도 약 50개의 잔기 길이인 서열들의 영역에 걸쳐, 더 바람직하게는 적어도 약 100개의 잔기의 영역에 걸쳐 존재할 수 있으며, 가장 바람직하게는 서열들은 적어도 약 150개의 잔기에 걸쳐, 또는 비교될 2개의 서열의 전장에 걸쳐 실질적으로 동일하다.
단백질들 및/또는 단백질 서열들은 이들이 공통 선조 단백질 또는 단백질 서열로부터 천연적으로 또는 인공적으로 유래될 때, "상동성"이다. 유사하게, 핵산들 및/또는 핵산 서열들은 이들이 공통 선조 핵산 또는 핵산 서열로부터 천연적으로 또는 인공적으로 유래될 때, 상동성이다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질(또는 이들의 서열) 사이의 서열 유사성으로부터 추론된다. 상동성을 확립하는 데 유용한 서열들 사이의 유사성의 정확한 백분율은 대상이 되는 핵산 및 단백질에 따라 달라지지만, 50, 100, 150개 또는 그 이상의 잔기에 걸쳐 25% 정도로 적은 서열 유사성이 상동성을 확립하는 데 일상적으로 사용된다. 더 높은 수준의 서열 유사성, 예를 들어 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 또는 그 이상이 또한 상동성을 확립하는 데 사용될 수 있다. 서열 유사성 백분율을 결정하기 위한 방법(예를 들어, BLASTP 및 BLASTN)이 이용가능하다.
서열 비교 및 상동성 결정을 위하여, 전형적으로 하나의 서열이 시험 서열의 비교 대상이 되는 참조 서열로서 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 서열 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서, 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여, 참조 서열과 대비하여 시험 서열(들)에 대한 퍼센트 서열 동일성을 계산한다.
비교를 위한 서열의 최적 정렬은, 예를 들어 국부 상동성 알고리즘에 의해, 상동성 정렬 알고리즘에 의해, 유사성 검색 방법에 의해, 이들 알고리즘의 전산화 구현에 의해, 또는 시각적 검사에 의해 수행될 수 있다. 퍼센트 서열 동일성 및 서열 유사성을 결정하는 데 적합한 알고리즘의 한 예는 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해 공개적으로 입수가능하다. 이 알고리즘은 먼저, 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양성-값의 임계치 점수 T와 일치하거나 이를 만족하는, 질의 서열에서 길이 W의 짧은 단어를 식별함으로써 높은 점수의 서열 쌍(HSP: high scoring sequence pair)을 식별하는 단계를 수반한다. T는 이웃 단어 점수 역치(neighborhood word score threshold)라고 한다. 이들 초기 이웃 단어 히트는 검색을 개시하여 이들을 함유하는 더 긴 HSP를 찾기 위한 종자로서 작용한다. 이어서, 누적 정렬 점수가 증가될 수 있는 한, 각각의 서열을 따라 양 방향으로 단어 히트를 연장한다. 뉴클레오티드 서열의 경우, 누적 점수를 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 >0) 및 N(일치하지 않는 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산한다. 아미노산 서열의 경우, 점수 매트릭스를 사용하여 누적 점수를 계산한다. 각 방향으로의 단어 히트의 연장은, 누적 정렬 점수가 이의 달성된 최대 값으로부터 X의 양만큼 떨어질 때; 누적 점수가 하나 이상의 음성-점수 잔기 정렬의 집적으로 인해 0 또는 그 아래가 될 때; 또는 서열의 말단에 도달할 때 중단된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도와 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 디폴트로 11의 단어 길이(W), 10의 기대치(E), 100의 컷오프(cutoff), M=5, N=-4 및 두 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로 3의 단어 길이(W), 10의 예상치(E) 및 BLOSUM62 점수 매트릭스를 사용한다.
퍼센트 서열 동일성을 계산하는 단계에 더하여, BLAST 알고리즘은 또한 2개의 서열 사이의 유사성의 통계적 분석을 수행한다. BLAST 알고리즘에 의해 제공되는 유사성의 일 척도는 최소 합계 확률(P(N))이며, 이는 2개의 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 참조 핵산에 대한 시험 핵산의 비교에서 최소 합계 확률이 약 0.1 미만, 더 바람직하게는 약 0.01 미만, 그리고 가장 바람직하게는 약 0.001 미만인 경우, 핵산은 참조 서열과 유사한 것으로 간주된다.
"기능적으로 동등한" 아미노산 위치에서의 아미노산은 단백질(예를 들어, 효소)에서 동일한 기능적 역할을 가질 수 있다. 일반적으로, 2개 이상의 상이한 단백질에서의 기능적으로 동등한 치환 돌연변이는 단백질의 아미노산 서열에서의 상동적 아미노산 위치에서 일어난다. 따라서, 본 명세서에 사용될 때, 용어 "기능적으로 동등한"은 또한, 돌연변이된 아미노산의 특정 기능이 알려져 있는지의 여부와 관계없이, 주어진 돌연변이와 "위치적으로 동등한" 또는 "상동성"인 돌연변이를 포함한다. 서열 정렬 및/또는 분자 모델링에 기초하여 2개 이상의 상이한 단백질의 아미노산 서열에서 위치적으로 동등한 또는 상동성인 아미노산 잔기들을 확인하는 것이 가능하다.
말단 데옥시뉴클레오티딜 트랜스퍼라제의 조작
말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 포유동물에서 발견되는 제1 DNA 폴리머라제들 중 하나이다. TdT는 주형-비의존성 활성을 갖는다. TdT의 주형-비의존성 활성은 신체의 항체 레퍼토리의 다양성을 증가시킬 수 있다. TdT는 2가 금속 이온의 존재 하에서 적어도 3개의 뉴클레오티드 길이인 단일 가닥 DNA 프라이머 상에의 뉴클레오티드의 부가를 촉매할 수 있다. DNA 폴리머라제의 X 패밀리의 구성원으로서, TdT는 주형-의존성 DNA 폴리머라제인 Pol μ와 가장 유사하다. 어떠한 특정 이론에 의해서도 구애되지 않고서, Pol μ와 42%의 서열 유사성을 갖는 경우, 주형 의존성에서 TdT와 Pol μ 사이의 차이에 기여하는 인자는 가요성 루프(루프1로 명명됨)의 존재에 기인되어 왔다. TdT에서 루프1의 불안정화는 그것에 주형-의존성 활성을 부여하는 것으로 밝혀져 있다. TdT와 Pol μ 사이의 루프1의 스위칭은 DNA 기질 선호도(substrate preference)의 부분적인 변경으로 이어질 수 있다.
TdT의 특유의 활성으로, TdT는 임상 및 생명공학 분야에서 사용되어 왔다. TdT의 한 가지 사용은 TUNEL 검정에서이다. TUNEL 검정에서는, 아폽토시스 세포로부터의 DNA 단편이 노출된 DNA 단편 상에의 형광단-태그된 뉴클레오티드의 TdT 촉매된 도입에 의해 검출된다. TdT는 또한 유전자적 질병의 진단 및 바이러스 검출을 위하여 낮은 양의 DNA 및 RNA를 검출하는 방법에 사용될 수 있다.
주형-비의존성 DNA 폴리머라제인 TdT는 효소적 DNA 합성을 위한 이상적인 후보이다. 뉴클레오티드 접합된 TdT는 DNA 개시제 상에의 단일 도입을 가능하게 하는 데 사용되어 왔다. 드 노보 DNA 합성을 위한 TdT의 잠재성이 또한 DNA에서 데이터 저장을 가능하게 할 수 있도록 영향을 줄 수 있다. DNA는 엄청나게 높은 정보 밀도 및 낮은 유지 저장에 대한 이점을 갖는다 - 데이터의 품질을 보존하면서 수백년 동안 DNA 그램당 1015 내지 1020 바이트의 데이터. 단일중합체들의 스트레치의 TdT 매개 합성 및 이들 사이의 전이(transition)가 디지털 데이터를 인코딩하는 데 사용되어 왔다. 그러나, 이들 방법은 복잡한 합성 과정 또는 불균질한 산물의 생성과 같은 몇몇 고유의 불리한 점을 갖는다. 임의적인 DNA 서열을 효소적으로 생성하는 대안적인 방법은 TdT를 사용하여 3' 블록킹된 뉴클레오티드, 예컨대 3'-O-블록킹된 뉴클레오티드 - 3'-O-아미노 블록킹된 뉴클레오티드 및 3'-O-아지도메틸 블록킹된 뉴클레오티드를 포함함 - 를 가역적으로 도입시키는 것일 것이다. 효소적 합성 방법을 사용하는 사용자-친화적 DNA 합성 기기는 개시되어 있지 않다.
야생형(WT) TdT는 입체 충돌로 인해 벌키한 3'-블록킹된 뉴클레오티드를 도입시킬 수 없다. TdT는 서열분석, 예컨대 합성에 의한 서열분석에 사용되는 가역적으로 블록킹된 뉴클레오티드를 받아들이도록 조작될 수 있다. 그러나, 가역적으로 블록킹된 뉴클레오티드를 도입시키도록 TdT를 조작하는 것은 어렵다. 이는 TdT가, 약 40℃의 Tm을 갖고 미미한 안정성을 갖는 중온성 폴리머라제인 것에 부분적으로 기인한다. 원하는 활성을 부여하는 돌연변이는 종종 불안정화될 수 있다. 따라서, 추가의 조작을 위해 더 안정한 초기 작제물을 얻기 위해서는, TdT의 열안정성이 먼저 개선되는 것이 필요하다.
게다가, 효소적 DNA 합성은 DNA 산물의 길이가 증가함에 따라 강한 DNA 2차 구조, 예컨대 헤어핀(hairpin)의 형성을 극복하는 것이 필요할 수 있다. 하나의 잠재적인 해결책은 효소적 DNA 합성 과정의 온도를 상승시키는 것이다. 그러나, WT TdT의 최적 온도는 대략 37℃이며, 이때 풀림 Tm은 약 40℃이다. 따라서, 열안정성 TdT의 조작은 더 높은 온도에서의 합성을 가능하게 함으로써 드 노보 DNA 합성 동안 2차 DNA 구조의 형성을 최소화하는 것을 도울 것이다.
개선된 열안정성을 갖도록 진전된 TdT 변이체(본 명세서에서 TdT 돌연변이체 및 재조합 TdT로도 지칭됨)가 본 명세서에 개시된다. 증가하는 온도에서의 인큐베이션 후 세포 용해물에서 구현될 수 있는 형광-기반 TdT 활성 검정을 개발하였다(도 2 및 도 3). 둘째, 발현 및 정제 프로토콜을 최적화하여 WT 및 돌연변이 효소에 대하여 적절한 수율을 얻었다. 셋째, TdT 변이체의 열안정성을 DSC, DSF, SYPRO Orange 열이동 검정 및 CD에 의해 검증하였다. 마지막으로, 본 명세서에서 TdT3-2로 지칭되는 열안정화된 TdT 돌연변이체의 동력학적 특성화를 수행하여, 열안정성의 획득이 효소의 활성을 희생하여 일어나지 않았음을 입증하였다.
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제
서열
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)의 실시 형태가 본 명세서에 개시된다. 일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT(예를 들어, 서열 번호 12) 또는 이의 단편(예를 들어, 서열 번호 12)과 정확히 또는 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT(예를 들어, 서열 번호 12) 또는 이의 단편(예를 들어, 서열 번호 12)과 적어도, 적어도 약, 최대 또는 최대 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위와 동일한 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 90% 동일할 수 있는 아미노산 서열을 포함한다. 재조합 TdT는 서열 번호 1과 적어도 95% 동일할 수 있는 아미노산 서열을 포함한다.
일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT의 단편, 예컨대 보스 타우루스 TdT의 아미노산 139 내지 520(예를 들어, 서열 번호 1)과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함한다. 도 1은 보스 타우루스 TdT의 아미노산 139 내지 520의 서열을 나타낸다. 예를 들어, 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 일부 실시 형태에서, 재조합 TdT는 소 또는 보스 타우루스 TdT의 변이체, 또는 소 또는 보스 타우루스 TdT 단편(예를 들어, 서열 번호 11)의 변이체와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT는 서열 번호 11과 적어도 95% 동일할 수 있는 아미노산 서열을 포함할 수 있다.
치환 돌연변이
재조합 TdT는 보스 타우루스 TdT(예를 들어, 서열 번호 12)에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 각각의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다.
각각의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 친수성 아미노산, 또는 분지쇄 아미노산에 대한 치환 돌연변이일 수 있다. 비극성 아미노산은, 예를 들어 알라닌, 시스테인, 글리신, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 또는 발린일 수 있다. 극성 아미노산은, 예를 들어 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 아스파라긴, 글루타민, 세린, 트레오닌, 또는 티로신일 수 있다. 극성 아미노산은, 예를 들어 산성 극성 아미노산, 염기성 극성 아미노산, 또는 비산성 비염기성 극성 아미노산일 수 있다. 염기성 극성 아미노산 또는 양으로 하전된 아미노산은, 예를 들어 아르기닌, 히스티딘, 또는 라이신일 수 있다. 산성 아미노산 또는 음으로 하전된 아미노산은, 예를 들어 아스파르트산 또는 글루탐산일 수 있다. 비산성 비염기성 아미노산은, 예를 들어 아스파라긴, 글루타민, 세린, 트레오닌, 또는 티로신일 수 있다. 소수성 아미노산은, 예를 들어 아이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신, 또는 발린일 수 있다. 방향족 아미노산은, 예를 들어 히스티딘, 페닐알라닌, 트립토판, 또는 티로신일 수 있다. 지방족(비방향족) 아미노산은, 예를 들어 아이소류신, 류신, 메티오닌, 또는 발린일 수 있다. 작은 아미노산은, 예를 들어 알라닌, 글리신, 프롤린, 또는 세린일 수 있다. 친수성 아미노산은, 예를 들어 아르기닌, 아스파라긴, 아스파르트산, 글루타민, 글루탐산, 히스티딘, 라이신, 세린, 또는 트레오닌일 수 있다. 분지쇄 아미노산은, 예를 들어 아이소류신, 류신, 발린일 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Ala, Glu191Gly, Glu191Ile, Glu191Leu, Glu191Met, 또는 Glu191Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu191Val일 수 있다. 재조합 TdT는 서열 번호 2와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 글루타민, 세린, 또는 트레오닌에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn, Lys193Gln, Lys193Ser, 또는 Lys193Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys193Asn일 수 있다. 재조합 TdT는 서열 번호 3과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Ala, Glu194Gly, Glu194Ile, Glu194Leu, Glu194Met, 또는 Glu194Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Glu194Gly일 수 있다. 재조합 TdT는 서열 번호 4와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산 또는 방향족 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 글루타민, 페닐알라닌, 세린, 트레오닌, 트립토판, 또는 티로신에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Asn, Asp242Gln, Asp242Phe, Asp242Ser, Asp242Thr, Asp242Trp, 또는 Asp242Tyr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Asp242Tyr일 수 있다. 재조합 TdT는 서열 번호 5와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 음으로 하전된 아미노산 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파르트산 또는 글루탐산에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Asp 또는 Lys287Glu일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Lys287Glu일 수 있다. 재조합 TdT는 서열 번호 6과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 비극성 아미노산, 소수성 아미노산, 지방족 아미노산, 또는 분지쇄 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 글리신, 아이소류신, 류신, 메티오닌, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Ala, Phe296Gly, Phe296Ile, Phe296Leu, Phe296Met, 또는 Phe296Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Phe296Leu일 수 있다. 재조합 TdT는 서열 번호 7과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 양으로 하전된 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아르기닌, 아르기닌, 히스티딘, 또는 라이신에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Arg, Met299His, 또는 Met299Lys일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Met299Lys일 수 있다. 재조합 TdT는 서열 번호 8과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 시스틴, 글루타민, 프롤린, 또는 세린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Asn, Thr342Cys, Thr342Gln, Thr342Pro, 또는 Thr342Ser일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 Thr342Ser일 수 있다. 재조합 TdT는 서열 번호 9와 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이, 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 극성 아미노산, 지방족 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 아스파라긴, 시스틴, 글루타민, 프롤린, 세린, 또는 트레오닌에 대한 아미노산 치환 돌연변이일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Asn, His421Cys, His421Gln, His421Pro, His421Ser, 또는 His421Thr일 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 아미노산 치환 돌연변이는 His421Pro일 수 있다. 재조합 TdT는 서열 번호 10과 서열 동일성 역치를 초과하는 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함한다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함할 수 있다. 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함할 수 있다.
일부 실시 형태에서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함할 수 있다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro를 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다. 일부 실시 형태에서, 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함한다. 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro일 수 있다.
열안정성
재조합 TdT는 열적으로 안정할 수 있다. 재조합 TdT는 상이한 실시 형태에서 상이한 온도에서 안정할 수 있다. 일부 실시 형태에서, 재조합 TdT는 정확히 또는 약 40℃, 41℃, 42℃, 43℃, 44℃, 45℃, 46℃, 47℃, 48℃, 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 67℃, 68℃, 69℃, 70℃, 71℃, 72℃, 73℃, 74℃, 75℃, 76℃, 77℃, 78℃, 79℃, 80℃, 81℃, 82℃, 83℃, 84℃, 85℃, 86℃, 87℃, 88℃, 89℃, 90℃, 또는 그 이상의 온도에서 안정할 수 있다. 예를 들어, 재조합 TdT는 47℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 50℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 55℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 58℃ 이상의 온도에서 안정할 수 있다. 재조합 TdT는 적어도, 적어도 약, 최대, 또는 최대 약 40℃, 41℃, 42℃, 43℃, 44℃, 45℃, 46℃, 47℃, 48℃, 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 67℃, 68℃, 69℃, 70℃, 71℃, 72℃, 73℃, 74℃, 75℃, 76℃, 77℃, 78℃, 79℃, 80℃, 81℃, 82℃, 83℃, 84℃, 85℃, 86℃, 87℃, 88℃, 89℃, 90℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위의 온도에서 안정할 수 있다.
활성
재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 소 또는 보스 타우루스 TdT 또는 이의 단편보다 더 높거나 더 낮을 수 있다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 정확히 또는 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 101%, 102%, 103%, 104%, 105%, 106%, 107%, 108%, 109%, 110%, 111%, 112%, 113%, 114%, 115%, 116%, 117%, 118%, 119%, 120%, 121%, 122%, 123%, 124%, 125%, 126%, 127%, 128%, 129%, 130%, 131%, 132%, 133%, 134%, 135%, 136%, 137%, 138%, 139%, 140%, 141%, 142%, 143%, 144%, 145%, 146%, 147%, 148%, 149%, 150%, 151%, 152%, 153%, 154%, 155%, 156%, 157%, 158%, 159%, 160%, 161%, 162%, 163%, 164%, 165%, 166%, 167%, 168%, 169%, 170%, 171%, 172%, 173%, 174%, 175%, 176%, 177%, 178%, 179%, 180%, 181%, 182%, 183%, 184%, 185%, 186%, 187%, 188%, 189%, 190%, 191%, 192%, 193%, 194%, 195%, 196%, 197%, 198%, 199%, 200%, 또는 그 이상이다. 일부 실시 형태에서, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도, 적어도 약, 최대, 또는 최대 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 101%, 102%, 103%, 104%, 105%, 106%, 107%, 108%, 109%, 110%, 111%, 112%, 113%, 114%, 115%, 116%, 117%, 118%, 119%, 120%, 121%, 122%, 123%, 124%, 125%, 126%, 127%, 128%, 129%, 130%, 131%, 132%, 133%, 134%, 135%, 136%, 137%, 138%, 139%, 140%, 141%, 142%, 143%, 144%, 145%, 146%, 147%, 148%, 149%, 150%, 151%, 152%, 153%, 154%, 155%, 156%, 157%, 158%, 159%, 160%, 161%, 162%, 163%, 164%, 165%, 166%, 167%, 168%, 169%, 170%, 171%, 172%, 173%, 174%, 175%, 176%, 177%, 178%, 179%, 180%, 181%, 182%, 183%, 184%, 185%, 186%, 187%, 188%, 189%, 190%, 191%, 192%, 193%, 194%, 195%, 196%, 197%, 198%, 199%, 200%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 예를 들어, 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT 또는 서열 번호 14의 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 정확히 또는 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%일 수 있다.
시험 온도는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 시험 온도는 정확히 또는 약 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃, 45℃, 46℃, 47℃, 48℃, 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 67℃, 68℃, 69℃, 70℃, 71℃, 72℃, 73℃, 74℃, 75℃, 76℃, 77℃, 78℃, 79℃, 80℃, 81℃, 82℃, 83℃, 84℃, 85℃, 86℃, 87℃, 88℃, 89℃, 90℃, 또는 그 이상일 수 있다. 예를 들어, 시험 온도는 37℃, 47℃, 50℃, 55℃, 또는 58℃일 수 있다. 일부 실시 형태에서, 시험 온도는 적어도, 적어도 약, 최대, 또는 최대 약 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃, 45℃, 46℃, 47℃, 48℃, 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 67℃, 68℃, 69℃, 70℃, 71℃, 72℃, 73℃, 74℃, 75℃, 76℃, 77℃, 78℃, 79℃, 80℃, 81℃, 82℃, 83℃, 84℃, 85℃, 86℃, 87℃, 88℃, 89℃, 90℃, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위일 수 있다.
추가의 성분
일부 실시 형태에서, 재조합 TdT는 정제를 위한 태그, 예컨대 His-태그 또는 글루타티온 S-트랜스퍼라제를 포함한다. 정제를 위한 태그는 재조합 TdT의 N-말단 상에, 재조합 TdT의 C-말단 상에, 또는 재조합 TdT의 내부에 존재할 수 있다. 재조합 TdT는 정제를 위한 태그와 다른 성분(예를 들어, 보스 타우루스 TdT 단편) 또는 재조합 TdT의 나머지 부분 사이에 프로테아제 절단 서열, 예컨대 LeuValProArg/GlySer(트롬빈 절단 부위) 또는 LeuGluValLeuPheGln/GlyPro(PreScission Protease 절단 부위)를 포함할 수 있다.
일부 실시 형태에서, 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단백질 또는 이의 단편을 포함한다. 재조합 TdT에서의 SUMO 단백질 또는 이의 단편의 서열은 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 재조합 TdT에서의 SUMO 단백질 또는 이의 단편은 SUMO 단백질(예를 들어, 효모에서의 SMT3(suppressor of mif two 3)) 또는 이의 단편(예를 들어, 서열 번호 13의 아미노산 서열을 포함하는 SUMO 단편)과 정확히 또는 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 예를 들어, 재조합 TdT에서의 SUMO 단편은 서열 번호 13과 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 일부 실시 형태에서, 재조합 TdT에서의 SUMO 단백질 또는 이의 단편은 SUMO 단백질(예를 들어, 효모에서의 SMT3(suppressor of mif two 3)) 또는 이의 단편(예를 들어, 서열 번호 13의 아미노산 서열을 포함하는 SUMO 단편)과 적어도, 적어도 약, 최대, 또는 최대 약 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.
재조합 TdT에서의 SUMO 단편의 위치는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 재조합 TdT는 재조합 TdT의 N-말단 상에 SUMO 단편을 포함한다. 일부 실시 형태에서, 재조합 TdT는 재조합 TdT의 C-말단 상에 SUMO 단편을 포함한다.
재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15의 아미노산 서열을 포함하는 SUMO 단편을 갖는 재조합 TdT)와 정확히 또는 약 서열 동일성 역치의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15)와 서열 동일성 역치를 초과, 약 초과, 미만, 또는 약 미만의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 재조합 TdT는 SUMO 단편을 포함하는 재조합 TdT(예를 들어, 서열 번호 14 또는 서열 번호 15)와 적어도, 적어도 약, 최대, 또는 최대 약 서열 동일성 역치의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 서열 동일성 역치는 상이한 실시 형태에서 상이할 수 있다. 일부 실시 형태에서, 서열 동일성 역치는 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 2개 사이의 수 또는 범위이다. 예를 들어, 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다. 다른 예로서, 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함할 수 있다.
말단 데옥시뉴클레오티딜 트랜스퍼라제의 돌연변이화
본 발명에서는, 예를 들어 TdT를, 예를 들어 TdT 모델 및 모델 예측에 따라, 또는 무작위 또는 반무작위 돌연변이 접근법을 사용하여 변형시켜 변이체를 생성하기 위해 다양한 유형의 돌연변이생성이 사용될 수 있다. 일반적으로, 임의의 이용가능한 돌연변이생성 절차가 TdT 돌연변이체를 제조하는 데 사용될 수 있다. 그러한 돌연변이생성 절차는 하나 이상의 관심 활성(예를 들어, 고체 지지체 상에의 향상된 시딩 및/또는 증폭)을 위하여 돌연변이 핵산 및 폴리펩티드의 선택을 포함할 수 있다. 사용될 수 있는 절차는 하기를 포함하지만 이로 한정되지 않는다: 부위-지정 점 돌연변이생성, 무작위 점 돌연변이생성, 시험관내(in vitro) 또는 생체내(in vivo) 상동성 재조합(DNA 셔플링 및 조합 오버랩 PCR), 우라실 함유 주형을 사용하는 돌연변이생성, 올리고뉴클레오티드-지정 돌연변이생성, 포스포로티오에이트-변형된 DNA 돌연변이생성, 갭 형성된(gapped) 이중체 DNA를 사용하는 돌연변이생성, 점 불일치 수복, 수복-결손 숙주 균주를 사용하는 돌연변이생성, 제한-선택 및 제한-정제, 결실 돌연변이생성, 총 유전자 합성에 의한 돌연변이생성, 축퇴 PCR, 이중 가닥 절단 수복, 및 당업자에게 알려진 많은 다른 것들. 돌연변이를 위한 출발 TdT는 본 명세서에 언급된 것들 중 임의의 것일 수 있다.
돌연변이생성은 천연 발생 TdT 분자로부터의, 또는 알려진 변경된 또는 돌연변이된 TdT에 대한 알려진 정보에 의해, 예를 들어 본 명세서에 논의된 바와 같은 서열, 서열 비교, 물리적 특성 및/또는 결정 구조 등에 의해 유도될 수 있다. 그러나, 다른 실시 형태 부류에서, 변형은 본질적으로 무작위일 수 있다(예를 들어, 고전적인 또는 "패밀리" DNA 셔플링에서와 같이).
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제의 제조 및 단리
일반적으로, 본 명세서에 제시된 바와 같은 재조합 TdT를 인코딩하는 폴리뉴클레오티드 또는 핵산은 클로닝, 재조합, 시험관내 합성, 시험관내 증폭 및/또는 다른 이용가능한 방법에 의해 제조될 수 있다. 본 명세서에 제시된 바와 같은 재조합 TdT를 인코딩하는 발현 벡터를 발현시키기 위하여 다양한 재조합 방법이 사용될 수 있다. 재조합 핵산의 제조, 발현 및 발현된 산물의 단리 방법은 알려져 있다. 다수의 예시적인 돌연변이 및 돌연변이들의 조합뿐만 아니라, 바람직한 돌연변이의 설계를 위한 전략이 본 명세서에 기재되어 있다.
게다가, 세포로부터의 플라스미드 또는 다른 관련 핵산의 정제를 위하여 키트가 구매가능하다. 임의의 단리된 및/또는 정제된 핵산은 다른 핵산을 생성하기 위하여 추가로 조작되고/되거나, 세포를 형질감염시키는 데 사용되고/되거나, 발현을 위하여 유기체를 감염시키기 위해 관련 벡터 내로 도입되는 등등이 행해질 수 있다. 전형적인 클로닝 벡터는 전사 및 번역 종결자, 전사 및 번역 개시 서열, 및 특정 표적 핵산의 발현의 조절에 유용한 프로모터를 함유한다. 벡터는 선택적으로 적어도 하나의 독립적인 종결자 서열을 함유하는 총칭 발현 카세트, 진핵생물 또는 원핵생물, 또는 둘 모두에서 상기 카세트의 복제를 가능하게 하는 서열(예를 들어, 셔틀 벡터), 및 원핵생물 시스템 및 진핵생물 시스템 둘 모두를 위한 선택 마커를 포함한다. 벡터는 원핵생물, 진핵생물, 또는 둘 모두에서 복제 및 통합에 적합하다.
특정 아미노산이 다수의 코돈에 의해 인코딩될 수 있고, 소정의 번역 시스템(예를 들어, 원핵 세포 또는 진핵 세포)은 종종 코돈 편향을 나타내는데, 예를 들어 상이한 유기체는 종종 동일한 아미노산을 인코딩하는 몇몇 동의어 코돈들 중 하나를 선호한다. 그러한 바와 같이, 본 명세서에 제시된 폴리뉴클레오티드 또는 핵산은 "코돈 최적화될" 수 있는데, 이는 폴리뉴클레오티드 또는 핵산이 재조합 TdT를 발현하는 데 사용되는 특정 번역 시스템에 의해 선호되는 코돈을 포함하도록 합성됨을 의미한다. 예를 들어, 세균 세포(또는 심지어는 특정 세균 균주)에서 재조합 TdT를 발현하는 것이 바람직할 때, 폴리뉴클레오티드 또는 핵산은 재조합 TdT의 효율적인 발현을 위하여 그러한 세균 세포의 게놈에서 가장 빈번하게 발견되는 코돈을 포함하도록 합성될 수 있다. 진핵 세포에서 재조합 TdT를 발현하는 것이 바람직할 때, 유사한 전략이 사용될 수 있으며, 예를 들어 핵산은 그러한 진핵 세포에 의해 선호되는 코돈을 포함할 수 있다.
다양한 단백질 단리 및 검출 방법이 알려져 있으며, 예를 들어 본 명세서에 제시된 재조합 TdT를 발현하는 세포의 재조합 배양물로부터 재조합 TdT를 단리하는 데 사용될 수 있다. 다양한 단백질 단리 및 검출 방법이 알려져 있다. 재조합 TdT가 본 명세서에 개시된 바와 같이 단리되고 검출될 수 있다.
재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 핵산
본 발명의 임의의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드의 실시 형태가 본 명세서에 개시된다. 본 발명의 임의의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터의 실시 형태가 본 명세서에 개시된다.
본 명세서에 제시된 TdT를 인코딩하는 핵산 분자(예를 들어, 폴리뉴클레오티드)가 본 명세서에 추가로 제시된다. TdT를 인코딩하는 아미노산 서열 및 바람직하게는 또한 야생형 뉴클레오티드 서열이 알려져 있는 종의 TdT의 돌연변이체 버전인 임의의 주어진 변경된 TdT의 경우, 분자 생물학의 기본 원리에 따라 돌연변이체를 인코딩하는 뉴클레오티드 서열을 얻는 것이 가능하다. 예를 들어, TdT를 인코딩하는 야생형 뉴클레오티드 서열이 알려져 있는 것을 고려하면, 표준 유전자 코드를 사용하여 하나 이상의 아미노산 치환을 갖는 TdT의 임의의 주어진 돌연변이체 버전을 인코딩하는 뉴클레오티드 서열을 추론하는 것이 가능하다. 유사하게, 다른 종의 TdT의 돌연변이체 버전에 대해 뉴클레오티드 서열이 용이하게 도출될 수 있다. 이어서, 필요한 뉴클레오티드 서열을 갖는 핵산 분자가 표준 분자 생물학 기법을 사용하여 작제될 수 있다.
본 명세서에 제시된 실시 형태에 따르면, 정의된 핵산은 동일한 핵산뿐만 아니라, 특히 보존적 아미노산 치환에서 축퇴 코드로 인해 동의어 코돈(동일한 아미노산 잔기를 명시하는 상이한 코돈)을 가져오는 경우에서의 치환을 포함한 임의의 미소한 염기 변형도 포함한다. 용어 "핵산 서열"은 또한, 염기 변형에 관하여 고려하여 임의의 단일 가닥 서열에 대한 상보적 서열을 포함한다.
본 명세서에 기재된 핵산 분자는 또한 유리하게는, 적합한 숙주에서 그로부터 인코딩되는 TdT를 발현시키기에 적합한 발현 벡터 내에 포함될 수 있다. 상기 세포의 후속 형질전환 및 형질전환된 세포의 후속 선택에 적합한 발현 벡터 내로의 클로닝된 DNA의 도입은 알려져 있다.
그러한 발현 벡터는 상기 DNA 단편의 발현을 달성할 수 있는 조절 서열, 예컨대 프로모터 영역에 작동가능하게 연결된 본 명세서에 제시된 실시 형태에 따른 핵산을 갖는 벡터를 포함한다. 용어 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능할 수 있게 하는 관계에 있는 병치(juxtaposition)를 지칭한다. 그러한 벡터는 본 명세서에 제시된 실시 형태에 따른 단백질의 발현을 제공하도록 적합한 숙주 세포 내로 형질전환될 수 있다.
핵산 분자는 성숙 단백질을 인코딩할 수 있거나 또는 프로서열(prosequence)을 갖는 단백질을 인코딩할 수 있는데, 이에는 프리단백질 상의 리더 서열을 인코딩하는 것이 포함되며, 이어서 이것을 숙주 세포에 의해 절단하여 성숙 단백질을 형성한다. 예를 들어, 벡터는, 복제 기점, 및 선택적으로 상기 뉴클레오티드의 발현을 위한 프로모터 및 선택적으로 프로모터의 조절인자가 제공된 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는 하나 이상의 선택가능한 마커, 예컨대 항생제 저항성 유전자를 함유할 수 있다.
발현에 필요한 조절성 요소는, RNA 폴리머라제와 결합하고 적절한 수준의 전사 개시를 유도하기 위한 프로모터 서열, 및 또한 리보솜 결합을 위한 번역 개시 서열을 포함한다. 예를 들어, 세균 발현 벡터는 프로모터, 예컨대 lac 프로모터를 포함하고, 번역 개시를 위하여 샤인-달가르노(Shine-Dalgarno) 서열 및 시작 코돈 AUG를 포함할 수 있다. 유사하게, 진핵 발현 벡터는 RNA 폴리머라제 II를 위한 이종성 또는 상동성 프로모터, 하류 폴리아데닐화 신호, 시작 코돈 AUG, 및 리보솜의 탈착을 위한 종결 코돈을 포함할 수 있다. 그러한 벡터는 상업적으로 입수될 수 있거나, 당업계에 잘 알려진 방법에 의해 기재된 서열들로부터 조립될 수 있다.
고등 진핵생물에 의해 TdT를 인코딩하는 DNA의 전사는 벡터에서 인핸서 서열을 포함함으로써 최적화될 수 있다. 인핸서는 전사의 수준을 증가시키기 위해 프로모터 상에 작용하는 DNA의 시스-작용 효소이다. 벡터는 또한 일반적으로 선택가능한 마커에 더하여 복제 기점을 포함할 것이다.
세포
본 발명의 임의의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 본 발명의 임의의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다. 본 발명의 임의의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터를 포함하는 숙주 세포의 실시 형태가 본 명세서에 개시된다.
키트
키트가 본 명세서에 개시된다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT); 및 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드 및/또는 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터; 및 상기 발현 벡터, 상기 폴리뉴클레오티드 및/또는 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하기 위한 설명서를 포함한다. 일부 실시 형태에서, 키트는 본 발명의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제, 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드, 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제를 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터, 또는 이들의 조합을 포함하는 숙주 세포; 및 상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제, 상기 폴리뉴클레오티드, 상기 발현 벡터, 상기 숙주 세포, 또는 이들의 조합을 사용하기 위한 설명서를 포함한다.
실시예
상기에 논의된 실시 형태의 일부 태양은 하기의 실시예에서 더 상세히 개시되며, 이러한 실시예는 결코 본 발명의 범주를 제한하는 것으로 의도되지 않는다.
실시예 1
열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제의 발전
말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)는 단일 가닥 DNA 상에의 임의적인 뉴클레오티드의 무주형 도입을 촉매한다. 이러한 특유의 특징으로 인해, TdT는 생명공학 및 임상 응용에서 널리 사용된다. 한 가지 가능한 사용은 3' 가역적으로 블록킹된 뉴클레오티드의 TdT-매개 반복 도입 후 탈블록킹에 의한 긴 드 노보 DNA 분자의 합성이다. 그러나, 야생형(WT) TdT는 3' 변형된 뉴클레오티드의 도입에 최적화되어 있지 않으며, TdT 조작은, TdT가 미미하게 안정하고 단지 중온성 유기체에만 존재한다는 사실에 의해 방해된다. 이 실시예는 3'-변형된 뉴클레오티드의 효율적인 도입을 가능하게 하는 후속 진전을 위한 중추적인 역할을 할 수 있도록 열안정성 TdT 변이체를 진전시키는 것을 설명한다. 열안정성 변이체는 그러한 노력을 위한 우수한 출발점이 될 것인데, 그 이유는, 벌키한 변형된 뉴클레오티드를 도입시키는 진전은 일반적으로 TdT의 더 낮은 안정성을 초래하기 때문이다. 게다가, DNA 2차 구조가 WT 활성을 억제하는 경우에 열안정성 TdT가 또한 유용할 것인데, 그 이유는, dsDNA를 용융시키는 데 더 높은 온도가 사용될 수 있기 때문이다. 열안정성 TdT 변이체를 확인하기 위해 검정을 개발하였다. 약 10,000개의 TdT 돌연변이체를 스크리닝한 후, TdT 촉매 특성을 보존하면서, SUMO-TdT보다 10℃ 더 열안정성인 TdT3-2로 명명되는 돌연변이체를 발견하였다.
재료 및 방법
플레이트-기반 FRET 검정의 확립
올리고뉴클레오티드 2bA FAM(5' - CGC TTG CAC AGG TGC GTT/iFluorT/CA - 3', 서열 번호 16)은 3'-OH로부터 2개의 염기가 떨어진 T 염기 상의 플루오레세인(FAM) 염료로 이루어지며, Integrated DNA Technologies(IDT, 미국 아이오와주 코랄빌 소재)로부터 구입하였다. Cy5-dCTP(NU-809-CY5)는 JenaBioscience(독일 소재)로부터 구입하였다. 말단 트랜스퍼라제(NEB TdT)는 New England Biolabs(NEB, 미국 매사추세츠주 입스위치 소재)로부터 구입하였다.
FAM과 Cy5
Figure pct00001
또는 형광 공명 에너지 전달(FRET) 쌍을 사용하는 신호의 이득을 1X TdT 완충액(200 mM 포타슘 아세테이트, 25 mM Tris, 0.01% (v/v) TritonX-100, 1 mM 염화코발트, pH 7.2) 중 200 nM 2bA FAM 올리고, 600 nM Cy5-dCTP, 20 U의 NEB TdT를 50 μL의 최종 부피로 사용하여 시험하였다. NEB TdT가 없는 음성 대조군을 포함시켰다. 반응 샘플을 TdT에 의해 2bA FAM 올리고 상에의 Cy5-dCTP의 도입을 위하여 실온에서 1분 동안 인큐베이션하였다. 반응물을 80℃에서 5분 동안 가열함으로써 켄칭하였다. 샘플을 Biotek Synergy H1 하이브리드 멀티모드 판독기(미국 벌링턴 위누스키 소재) 상에서의 신호 검출을 위하여 검정색 바닥 384웰 플레이트(Greiner, 오스트리아 소재)에 옮겼다. 450 nm의 여기를 설정하고, 방출 파장을 480 nm부터 700 nm까지 스캐닝하였다.
본 명세서에서의 SUMO-TdT는 소(보스 타우루스) TdT의 아미노산 139 내지 520 및 가용성 및 발현을 개선하는 N-말단 SUMO-태그를 함유하는 재조합 TdT를 지칭한다. 표 1은 SUMO-TdT의 서열을 제시한다. 도 1은 보스 타우루스 TdT의 아미노산 139 내지 520과 SUMO-TdT의 비제한적인 예시적인 서열 정렬을 나타낸다. SUMO-TdT를 담지하는 pET28b 플라스미드를 제조자의 프로토콜에 따라 E. 콜라이 BL21(DE3)(NEB, 미국 소재) 내로 형질전환시키고, 진탕기에서 250 rpm으로 15℃에서 하룻밤 1 mM 아이소프로필-β-D-티오갈락토피라노시드(IPTG) (Sigma, 미국 미주리주 세인트 루이스 소재)를 사용하여 유도하였다. TdT를 발현하는 유도된 세포 용해물을 4개의 부분으로 분취하고(희석되지 않은 것, 1X TdT 완충액을 사용하여 10배 희석시킨 것, 100배 희석시킨 것 및 1000배 희석시킨 것), Q700 혼 초음파처리기(Qsonica, 미국 코네티컷주 뉴타운 소재)를 사용하여 용해시켰다. 올리고 FAM20(5' - /56-FAM/CGCTTGCACAGGTGCGTTCG - 3', 서열 번호 17)(IDT, 미국 소재) 및 데옥시시티딘 트라이포스페이트(dCTP(Invitrogen, 미국 매사추세츠주 월섬 소재))를 용해 및 희석된 세포 용해물에 첨가하여, 최종 세포 용해물 희석이 5배, 50배, 500배 및 5000배가 되게 하였다. 샘플을 TdT에 의해 FAM20 상에의 dCTP의 도입을 위하여 37℃에서 1분 동안 인큐베이션하였다. 반응 용액을 80℃에서 5분 동안 가열하고, 등부피의 2X TBE-우레아 샘플 완충액(Invitrogen, 미국 소재)을 첨가함으로써 반응물을 켄칭하였다.
켄칭된 반응 샘플을 20% 폴리아크릴아미드 겔 상에서 분석하였다. S2 유리 플레이트(Apogee, 미국 메릴랜드주 볼티모어 소재)를 Alconox 및 물로 세척한 후, 에탄올, 물, 5% 다이클로로다이메틸실란(DCDMS)(Sigma, 미국 소재), 그리고 물로 닦아내었다. 플레이트들을 0.8 mm 스페이서(Apogee, 미국 소재), 겔 밀봉 테이프(Apogee, 미국 소재) 및 바인더 클립을 사용하여 조립하였다. 1 mL의 물 중 0.2% (v/v) 과황산암모늄(APS)(Sigma, 미국 소재) 및 0.2% (v/v) 테트라메틸에틸렌다이아민(TEMED)(Bio-Rad, 미국 캘리포니아주 허큘레스 소재) 용액을 제조하고, 조립된 유리 플레이트들 내로 부었다. 45 mL의 40% 아크릴아미드/비스 19:1 용액(Bio-Rad, 미국 소재)과 45 mL의 물을 혼합한 후, 225 μL의 10% APS 및 22.5 μL의 TEMED 첨가함으로써 20% 아크릴아미드 용액(90 mL)을 제조하였다. 20% 아크릴아미드 용액을 50 mL 시린지를 사용하여 유리 플레이트들 내로 로딩하였다. 0.8 mm 두께의 32웰 플라스틱 콤(comb)(Apogee, 미국 소재)을 겔 내로 삽입하고, 1시간 30분 동안 중합되게 하였다. 콤 및 겔 테이프를 조심스럽게 제거한 후, S2 서열분석 겔 전기영동 장치(S2 Sequencing Gel Electrophoresis Apparatus)(Biometra-Analytik Jena, 독일 소재) 상에 겔 플레이트들을 마운팅하였다. 전개 완충액, 1X Tris/보레이트(TBE) 완충액을 상부 및 하부 저장소에서 겔 위 약 3 cm에 부었다. 웰 내의 임의의 겔 단편을 제거하였다. 예비전기영동을 15분 동안 1700 V에서 수행하여 약 50℃의 겔 표면 온도를 얻은 후 샘플을 로딩하였다. 각각의 켄칭된 반응 샘플 15 μL를 각각의 웰 내로 로딩하고, 1700 V에서 1시간 30분 동안 전개하였다. 겔을 Sybr Green 노출을 사용하여 Bio-Rad Gel Doc XR+(미국 소재) 상에서 이미징하였다.
플레이트-기반 FRET 검정의 워크플로우를 도 6에 나타낸 바와 같이 확립하였다. 이 검정의 견고성을 조사하기 위해, 맹검 시험을 수행하였다. 빈 pET28b 벡터 및 SUMO-TdT를 발현하는 E. 콜라이 BL21(DE3)(New England Biolabs, 미국 소재) 콜로니를 250 rpm으로 37℃에서 하룻밤 성장된 96-딥웰 플레이트(Eppendorf, 독일 소재)의 각각의 웰 내에 50 ㎍/mL의 카나마이신이 보충된 200 μL의 Luria 브로쓰(Broth) 내로 접종하였다. 성장된 배양물을 새로운 96-딥웰 플레이트 내의 50 ㎍/ml의 카나마이신이 보충된 신선한 495 μL의 LB 중에 100배로 계대배양하고, 24℃에서 4시간 동안 인큐베이션한 후, 800 rpm으로 24℃에서 적어도 16시간 동안 0.5 mM 아이소프로필 β-d-1-티오갈락토피라노시드(IPTG)를 사용하여 유도하였다. 유도된 세포 용해물을 0.2 mL PCR 튜브 플레이트(AITbiotech, 싱가포르 소재) 내에서 1X TdT 완충액을 사용하여 10배로 희석시켰다. 세포 용해물을 다음 파라미터와 함께 혼 초음파처리기를 사용하여 용해시켰다: Amp 90, 3분의 처리 시간, 5초 펄스-온 및 15초 펄스-오프. 200 nM 2bA FAM 올리고, 600 nM Cy5-dCTP 및 1X TdT 완충액을 함유하는 24 μL의 마스터 믹스를 검정색 384웰 플레이트 내의 각각의 웰 내로 첨가하였다. 용해된 세포의 현탁액(6 μL)을 각각의 개별 웰 내로 첨가하였다. 450 nm에서의 여기 및 670 nm에서의 방출 검출을 사용하여 30분 동안 PerkinElmer(미국 매사추세츠주 월섬 소재) EnSpire Multimode 플레이트 판독기 상에서 FRET 신호 검출을 수행하였다.
TdT 돌연변이체 라이브러리의 생성
SUMO-TdT 플라스미드를 돌연변이생성을 위한 백본 주형으로서 사용하였다. 오류-유발(error-prone) 폴리머라제 뮤타자임(mutazyme) II(Agilent Technologies, 미국 소재)를 사용하여, 유전자 프라이머 1(5' -AAAAAACACCTGCGGCCTGGTGCCGCGCGGCAGCGCTAGCATG - 3', 서열 번호 18) 및 유전자 프라이머 2(5' - AAAAAACACCTGCGGGATCCGGTACCGCGGCCGCCTA - 3', 서열 번호 19)를 사용하여 유전자 길이당 평균 2 내지 5개의 돌연변이의 라이브러리를 생성하였다. 돌연변이 유발된 풀을 pET28b 벡터 내로 라이게이션하고, 플라스미드의 증폭을 위하여 E. 콜라이 10-베타 컴피턴트 세포(New England Biolabs, 미국 소재) 내로 형질전환시켰다. 세포를 회수하고, 50 ㎍/mL의 카나마이신이 보충된 50 mL의 LB 중에 규모확대시키고, OD600nm = 약 0.5가 달성될 때까지 37℃에서 성장시켰다. 세포 배양물을 수합하고, Miniprep 키트(Qiagen, 독일 소재)를 사용하여 플라스미드를 추출하였다. 스크리닝의 제2 라운드를 위해 모 주형으로서 TdT1-1을 사용하여 동일한 돌연변이생성 과정을 수행하였다.
스크리닝의 제3 라운드를 위한 돌연변이체 라이브러리는 TdT2-1, TdT2-2, TdT2-3 및 TdT2-4로부터 확인된 돌연변이들의 상이한 조합의 도입을 위하여 모 주형으로서 TdT1-1 및 TdT1-3을 사용하였다. 모 주형에 돌연변이를 도입하는 데 사용된 프라이머:
프라이머 A: 5' - AATTCTGTGTTTAAWGRAAATGAAGTCTCTTATGTG - 3' (서열 번호 20)
프라이머 B: 5' - AGATCTCTGAGTRAAATAATGTCAGACAAAACCCTGAA - 3' (서열 번호 21)
프라이머 C: 5' - AGACAAAACCCTGAAATTMACAAAAAWGCAGAAAGCAGGAT - 3' (서열 번호 22)
프라이머 D: 5' - TTTGTCACCATGWCAGGAGGATTCCGCAG - 3' (서열 번호 23)
프라이머 E: 5' - GATTTTAAAATTGCMCCATCAGAGAGTAGACAGT - 3' (서열 번호 24)
잠재적으로 열안정성인 TdT 돌연변이체에 대한 스크리닝
증폭된 돌연변이체 라이브러리 플라스미드를 E. 콜라이 BL21(DE3)의 발현 균주 내로 형질전환시켰다. 회수된 세포를 50 ㎍/mL의 카나마이신이 보충된 LB 한천 상에 플레이팅하고, 37℃에서 하룻밤 인큐베이션하였다. 개별 콜로니들을 선별하고, 96-딥웰 플레이트 내의 50 ㎍/mL의 카나마이신이 보충된 200 μL의 LB 내로 접종하였다. 성장된 세포 배양 및 하류 과정을 '플레이트-기반 FRET 검정의 확립' 하에서 상기에 언급된 바와 같이 수행하였다(도 6). 희석되고 용해된 세포 용해물에 상이한 열처리를 가한 후, 2bA FAM 올리고 및 Cy5-dCTP를 첨가하였다.
SUMO-TdT 주형-기반 돌연변이체 라이브러리에 대한 스크리닝의 제1 라운드를 위하여, 희석되고 용해된 세포 용해물을 2개의 샘플로 나누고, 하나는 열처리를 가하지 않고 다른 하나는 1분 동안 47℃에 노출시켰다. 2790개의 돌연변이체의 라이브러리 크기를 스크리닝하였다.
열안정성 스크리닝의 제2 라운드를 위하여, 라운드 1로부터 확인된 TdT1-1을 돌연변이생성을 위한 주형으로서 사용하였다. 7356개의 라이브러리 크기를 열처리를 거치치 않은 각각의 세포 용해물의 분취물에 대해 스크리닝하고, 나머지 분취물에 50℃에서 1분 동안 열처리를 가하였다.
열안정성 스크리닝의 제3 라운드를 위한 돌연변이체 라이브러리들 중 하나를, TdT1-1 주형에 기반한 라운드 2로부터의 상단 4개의 돌연변이체(TdT2-1, TdT2-2, TdT2-3 및 TdT2-4)로부터 확인된 돌연변이들 또는 WT 서열 중 어느 하나로 각각이 이루어진 축퇴 프라이머들을 사용하여 생성하여 조합적인 혼합된 풀을 생성하였다. 736개의 라이브러리 크기를 열처리가 가해지지 않은 각각의 세포 용해물 샘플 및 1분 동안 55℃에 노출된 나머지 세포 용해물의 분취물에 대해 스크리닝하였다. TdT1-3 주형-기반 돌연변이체 라이브러리에 대해서도, 열처리가 가해지지 않은 각각의 세포 용해물 샘플의 분취물 및 1분 동안 58℃에 노출된 나머지 분취물에 대해 동일하게 수행하였다.
각각의 라이브러리로부터의 상단 돌연변이체(들)를 확인하였으며; 이들 유전자를 서열분석을 위해 준비하였다. 얻어진 돌연변이에 대한 정보를 모 플라스미드 내로 삽입하고, E. 콜라이 발현 균주 내로 재형질전환시켰다. 동일한 돌연변이체의 대략 5개 또는 6개의 콜로니를 선택하고, FRET 검정의 반복을 행하였다. 각각의 돌연변이체에 대한 15번째 분부터 30번째 분까지의 판독치로부터의 평균 FRET 신호로부터의 평균 데이터를 얻고 플롯팅하였다. 열처리 하에서의 평균 FRET 판독치를 열 무처리 하에서의 평균 FRET 판독치로 나눔으로써 각각의 TdT에 대한 활성비를 얻었다. 부등 분산을 가정하는 스튜던트 T-검정을 행하여 모 TdT와 돌연변이 TdT로부터의 평균 FRET 신호 사이의 유의성 차이를 결정하였다.
TdT의 정제
SUMO-TdT 및 TdT3-2를 함유하는 플라스미드를 E. 콜라이 BL21(DE3)에서 발현시켰다. 각각의 E. 콜라이 작제물을 50 ㎍/mL의 카나마이신이 보충된 6 L의 2xYT 브로쓰(Bio Basic, 캐나다 소재) 중에서 성장시켰다. OD600nm = 약 0.8일 때 1 mM IPTG를 사용하여 세포 배양을 유도하였다. 250 rpm으로 15℃에서 적어도 16시간 동안 유도를 수행하였다. 유도된 세포를 500 mL Beckman Coulter(미국 캘리포니아주 브레아 소재) 플라스틱 용기 내에서 Beckman Coulter JLA10.500 회전자를 사용하여 6500 rpm으로 4℃에서 6분 동안 원심분리에 의해 수합하였다. 세포 펠릿을 4℃에서 총 120 mL의 결합 완충액(20 mM Tris-HCl(pH 7.9), 500 mM NaCl 및 5 mM 이미다졸) 중에 재현탁시켰다. 재현탁된 세포를 5회 통과 동안 20 000 psi의 압력으로 미세유체화기(microfluidizer)(Microfluidics International Corporation, 미국 매사추세츠주 웨스트우드 소재)를 사용하여 용해시켰다. Beckman Coulter JA25.5 회전자를 사용하여 20 000 rpm으로 4℃에서 20분 동안 원심분리 후에 상층액을 수집하였다. AKTA Pure 기기(GE Healthcare Life Science, 미국 일리노이주 시카고 소재) 상에서 Ni2+로 충전된 Chelating Sepharose Fast Flow 컬럼(Pharmacia Biotech, 미국 뉴저지주 피스카타웨이 소재)을 사용하여 상층액으로부터 His-태그된 TdT를 정제하였다. 몇몇 분획으로부터의 샘플을 15% 소듐 도데실 설페이트 폴리아크릴아미드 겔 전기영동(SDS-PAGE) 겔 상에서 분석하였다. TdT에 상응하는 원하는 밴드를 함유하는 분획을 풀링하고, 4℃에서 적어도 6시간 동안 10 kD 분자량 컷오프(MWCO) 투석막(Spectrum Chemical, 미국 소재)을 사용하여 완충액 1(20 mM Tris-HCl, pH 8, 100 mM NaCl, 100 mM 히스티딘, 0.1 mM 2,2'-바이피리딜)로 투석하였다. 완충액 1을 4℃에서 적어도 4시간 동안 완충액 2(50 mM Tris-HCl, pH 8)로 변경시킨 후, 투석된 단백질을 10 mL Q Sepharose 컬럼(GE Healthcare Life Sciences) 상에 로딩하였다. 용리를 1 CV에 걸쳐 (1 M NaCl)로 행하였다. 크로마토그램 상에서 높은 Abs280nm를 갖는 분획의 소량의 분취물을 15% SDS-PAGE 겔 상에서 분석하였다. 각각의 TdT에 상응하는 예상된 밴드들을 함유하는 분획을 풀링하고, 단백질 저장 완충액(20 mM Tris-HCl pH 8, 100 mM NaCl)으로 투석하였다. 투석된 단백질을 작은 부피로 분취하고, 액체 질소 중에 동결시키고, -80℃에서 저장하였다.
정제된 SUMO-TdT 및 TdT3-2 순도를 뉴클레아제 검정 시험을 통해 분석하였다. 각각의 단백질(0.5 ㎍)을 37℃에서 16시간 동안 1X Tris/아세테이트(TA) 완충액(30 mM Tris, 66 mM 포타슘 아세테이트, 10 mM 마그네슘 아세테이트, 0.5 mM DTT, pH 7.8) 중 1 ㎍의 단일 가닥 DNA(5' - TCTAGAGCCCGCCTAATCAGCGGGCTTTTTTTTAT - 3', 서열 번호 25)와 인큐베이션하였다. 뉴클레아제-무함유 효소, 예컨대 Illumina, Inc.(미국 캘리포니아주 샌디에고 소재)로부터의 폴리머라제 샘플을 사용하는 음성 대조군 및 DNaseI(New England Biolabs, 미국 소재)을 사용하는 양성 대조군을 포함시켰다. 샘플을 15% TBE-우레아 겔(Invitrogen, 미국 소재) 상에서 시각화하였다.
TdT3-2의 열안정성의 결정
시차 주사 열량측정법(DSC)(TA Instruments, 미국 델라웨어주 뉴캐슬 소재)을 수행하여 SUMO-TdT 및 TdT3-2의 열안정성을 검증하였다. 20℃ 내지 80℃의 온도 범위 및 60℃/h의 스캔 속도를 사용하였다. SUMO-TdT 및 TdT3-2를 1X TdT 완충액을 사용하여 약 1 mg/mL로 희석시키고, 1 mL의 각각의 단백질을 DSC 내로 로딩하였다. 각각의 단백질의 2회 반복 시험물을 로딩하고, 열용량의 평균을 그래프 상에 플롯팅하였다.
나노-시차 주사 형광측정법(DSF)(NanoTemper, 독일 소재)을 수행하여 SUMO-TdT 및 TdT3-2의 열안정성을 검증하였다. 20℃부터 80℃까지 60℃/h의 스캔 속도를 가지면서, 여기 출력을 14%로 설정하였다. 470 nm의 여기 파장에서 형광 측정을 수행하였다. DSF 신호비 F350/F330를 330 nm(F330) 및 350 nm(F350)에서의 방출 강도로부터 계산하였다. 광산란 측정을 병행적으로 수행하였다. 대략 1 mg/mL의 각각의 단백질 샘플(10 μL)을 NanoDSF 내로 로딩하고, 각각의 샘플의 2회 반복 시험물을 측정하였다. 비 F350/F330의 -1차 도함수의 평균을 플롯팅하였다.
SYPRO Orange 열이동 검정을 수행하여 SUMO-TdT 및 TdT3-2 열안정성을 검증하였다. 최종 5X SYPRO Orange 염료(Life Technologies, 미국 캘리포니아주 칼스배드 소재)와 함께, 각각의 단백질의 매회 4 ㎍의 2회 반복 시험물을 이 검정에 사용하였다. 30초당 0.5℃ 증분으로 4℃ 내지 95℃의 온도 범위를 프로그래밍하였다. 온도에 걸친 상대 형광(RFU)의 변화(-dRFU/온도)를 얻었으며, 온도에 대해 평균을 플롯팅하였다.
원편광 이색성(CD)을 사용하여 SUMO-TdT 및 TdT3-2의 열안정성을 평가하였다. 0.1 mm 수동 석영 큐베트를 갖는 Chirascan(Applied Photophysics, 영국 소재) Q100을 이 연구에 사용하였다. 단백질 풀림을 온도의 함수로서 198 nm 내지 260 nm 파장에서 모니터링하고, 222 nm 파장을 데이터 분석에 사용하였다. 샘플을 1.6 mg/ml의 최종 단백질 농도로 1X TdT 완충액 중에 희석시켰다. 온도 램프(ramp)를 25℃부터 70℃까지 1℃/분의 속도 및 0.2℃ 허용오차로 설정하였다. 기기 밴드폭을 포인트당 1초 획득 시간으로 1 nm로 설정하였다. 각각의 조건에 대해 2개의 별개의 측정을 수행하였다. CD(222 nm)의 -1차 도함수의 평균을 플롯팅하였다.
종점 검정을 수행하여 25℃, 36℃, 47℃ 및 58℃에서의 SUMO-TdT 및 TdT3-2의 활성을 검증하였다. NEB TdT(5 단위) 및 정제된 SUMO-TdT 및 TdT3-2(각각 100 nM)를 25℃, 36℃, 47℃ 및 58℃에서 5분, 10분 및 20분 동안 200 nM FAM 올리고(5' - /56-FAM/ATTCAGGACGAGCCTCAGACC - 3', 서열 번호 26), 5 μM dCTP 및 1X TdT 완충액과 함께 인큐베이션하였다. 샘플을 5분 동안 90℃에 노출시킴으로써 반응을 켄칭하였다. 등부피의 2X TBE-우레아 샘플 완충액을 각각의 샘플에 첨가한 후, 80℃에서 5분 동안 가열하였다. 샘플을 15% TBE-우레아 겔(240 V, 62분) 상에서 시각화하였다. 겔을 Gel Doc XR+(Bio-Rad, 미국 소재) 상에서 이미징하였다.
블런트 말단 DNA 기질에 대한 시판 NEB TdT 및 TdT3-2의 활성을 시험하였다. 블런트 말단 DNA 기질은 프라이머(5' - /56-FAM/TTTCGGTGGTCGCCGTATCCGC - 3', 서열 번호 27) 및 주형(5' - GCGGATACGGCGACCACCGAGATCTACACTCTGAG/3Phos/ - 3', 서열 번호 28)(IDT, 미국 소재)으로 이루어졌다. 이중 가닥 DNA(ds DNA) 산물을 95℃에서 5분 동안 4 μM DNA(프라이머 대 주형, 1:3)와 1X TdT 완충액의 혼합물을 가열함으로써 제조하고, 적어도 15분 동안 실온까지 냉각되게 하였다. 효소(10 μL)와 반응 믹스(30 μL)를 30초 동안 각각의 반응 온도로 평형을 이루게 하였다. 이어서, 효소를 분취하여 200 nM ds DNA, 50 μM 2', 3' - 디데옥시시티딘 5' - 트리포스페이트(ddCTP)(JenaBioscience, 독일 소재), 1X TdT 완충액 및 0.5 μM 효소(또는 NEB TdT를 위해 25 U/20 μL 반응물)를 함유하는 반응 믹스 내로 1분, 2분 및 4분 동안 37℃ 또는 50℃까지 넣어두었다. 8.3 μM 치환제(displacer) 올리고 및 2X TBE-우레아 샘플 염료(Invitrogen, 미국 소재)(12 μL)를 혼합함으로써 매 시점마다 샘플(10 μL)을 켄칭하고, 95℃에서 5분 동안 가열한 후 실온으로 냉각되게 하였다. 치환제 올리고(5' - TTTCTCAGAGTGTAGATCTCGGTGGTCGCCGTATCCGC/3Phos/ - 3', 서열 번호 29)(IDT, 미국 소재)를 주형에 대해 어닐링하고, 프라이머가 치환되게 하고 ssDNA로서 존재하게 할 것인 반면, 샘플 완충액 및 고온은 효소를 변성시킨다. 샘플을 15% TBE-우레아 겔(240 V, 68분) 상에서 시각화하고, 겔을 Gel Doc 상에서 이미징하였다. 각각의 샘플에서의 밴드의 정량화를 Image Lab 소프트웨어(Bio-Rad, 미국 소재)를 사용하여 완료하였다. 반응을 2회 반복하여 행하고, ddCTP 도입을 갖는 프라이머의 평균 백분율을 GraphPad(GraphPad Software, Inc., 미국 캘리포니아주 샌디에고 소재)를 사용하여 플롯팅하였다.
SUMO-TdT 및 TdT3-2의 동력학적 연구
최종 부피 20 μL 중 200 nM FAM 올리고, 변동하는 dCTP 농도, 및 86 nM의 SUMO-TdT 및 TdT3-2가 되도록 반응 검정을 셋업하였다. TdT에 의한 dCTP의 도입을 37℃에서 15초 동안 행되었다. 80℃에서 5분 동안 가열하면서, 10 mM EDTA 중에서 2X TBE-우레아 샘플 완충액의 동일한 총 샘플 부피를 첨가함으로써 반응물을 켄칭하였다. 샘플을 15% TBE-우레아 겔 상에 로딩하고, 1시간 30분 동안 180 V에서 전개되게 하였다. 겔을 Gel Doc XR+ 상에서 이미징하고, 밴드를 Image Lab 상에서 분석하였다. 레인 내의 각각의 밴드의 밴드 백분율을 소프트웨어로부터 얻고 각각의 밴드에 대해 상응하는 FAM 올리고의 양으로 전환시켰다. 밴드의 크기는 TdT에 의해 수행된 dCTP의 도입의 수에 대한 정보를 제공해주었으며, 20 μL의 반응물에 대한 총 턴오버(turnover)(단위: nM)를 계산하였다. 얻어진 값을 μM로 전환시키고, 효소 턴오버 속도(단위: μM dCTP/s)를 얻었다. 효소 턴오버 속도를 미카엘리스-멘텐(Michaelis-Menten) 분석을 사용하여 GraphPad Prism 8에서 dCTP의 농도에 대해 플롯팅하였다.
SUMO-TdT 및 TdT3-2의 동력학적 특성을 또한 47℃에서 연구하였다. 200 nM FAM 올리고, 173 nM SUMO-TdT 및 TdT3-2, 및 변동하는 dCTP 농도(최종 20 μL)가 되도록 반응을 셋업하였다. dCTP의 도입을 47℃에서 5초 동안 수행하였다. 후속 켄칭 및 분석은 상기 단락에서 37℃에서 수행된 동력학과 동일하다.
TdT3-2 3D 구조의 모델링
TdT3-2의 아미노산 서열(표 1)을 Phyre2 웹 포털(http: //www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)에 입력하였다. 'NORMAL' 모드를 선택하였다. 3D 구조를 모델링하였다.
[표 1]
Figure pct00002
결과 및 논의
TdT 활성의 검출을 위한 플레이트-기반 FRET 검정의 확립
이 실시예에 기재된 열안정성 TdT 변이체를 스크리닝하기 위한 고처리량 검정은 프라이머를 뉴클레오티드에 공유 연결시키는 TdT 활성을 결정하는 FRET(Fㆆrster resonance energy transfer)-기반 검정이다(도 2 및 도 3a). 먼저, 공여체 염료와 수용체 염료의 최적 거리가 결정될 필요가 있었다. 3' 말단으로부터 FAM의 거리를 변동시키면서, FAM-TAMRA FRET 쌍을 이용하였다. FAM 공여체 염료가 올리고의 3' 말단으로부터 2개의 염기가 떨어진 위치에 있음으로써 FAM 방출의 최대 감소를 제공하였다. 그러나, 카르복시테트라메틸로다민(TAMRA)으로부터의 방출의 상응하는 증가가 낮았다(도 4, 표 2). 더 높은 수용체 방출 신호를 얻기 위하여, 3' 말단으로부터 최적 2개의 염기가 떨어진 위치에서의 공여체를 보유하면서, 상이한 FRET 쌍들(FAM-Cy5 및 Cy3-Cy5)을 시험하였다(도 4, 표 3). FAM-Cy5는 670 nm에서의 수용체 Cy5의 방출로부터 검출된 신호에서 최상의 증가를 제공하였다(도 3b 및 도 5a 내지 도 5c). Cy5-dCTP 및 3' 말단으로부터 2개의 염기가 떨어진 위치에 FAM(2bA FAM)을 갖는 프라이머를 활성 TdT 돌연변이체에 대한 후속 스크리닝에 사용하였다(도 3a).
[표 2]
Figure pct00003
[표 3]
Figure pct00004
실제의 고처리량 스크리닝을 위하여, 이 검정은 미정제 용해물을 사용하여 최상으로 수행될 것인데, 그 이유는, 정제 단계는 시간 및 비용 부담을 추가할 것이기 때문이다. 그러나, 조 세포 용해물을 이용하는 것은 문제가 있었는데, 그 이유는, 내인성 E. 콜라이 뉴클레아제의 존재는 TdT 활성을 차폐할 수 있었기 때문이다(도 3c, 상부 행). 이 문제를 극복하기 위한 하나의 잠재적인 방식은 세포 용해물을 희석시키는 것이었다. 어떠한 특정 이론에 의해서도 구애되지 않고서, 세포 용해물을 희석시키는 것은, 예를 들어 TdT가 올리고 기질에 대한 더 높은 결합 친화성을 갖는다면, 또는 TdT의 과발현이 세포 용해물 희석 후 뉴클레아제와 대비하여 TdT의 더 높은 농도로 이어진다면, TdT와 대비하여 뉴클레아제 활성을 불균형적으로 저하시킬 수 있다(도 3c, 하부 행). 이러한 가설의 타당성을 결정하기 위하여, SUMO-TdT를 발현시키는 세포 용해물을 5, 50, 500 및 5000배로 희석시키고, 이어서 도입 반응을 폴리아크릴아미드 겔 상에서 분석하였다. +1 이상에 상응하는 밴드가 50배 및 500배 희석된 세포 용해물에 대해 관찰된 반면, 뉴클레아제 활성은 5배 희석에서 우세하였다(도 3d). 상기에서 관찰된 FAM-Cy5 FRET 쌍과 함께 열안정성 스크리닝을 위하여 50배 희석 인자를 선택하였다.
얻어진 플레이트-기반 FRET 검정의 견고성을 결정하기 위하여, SUMO-TdT 또는 빈 플라스미드 중 어느 하나를 발현하는 콜로니(각각 48개)를 96-딥웰 플레이트에 접종하고, 각각의 용해물들을 50배 희석 후에 앞서 개발된 FRET 검정을 사용하여 검정하였다. SUMO-TdT를 발현하는 세포 용해물은 더 높은 FRET 판독치를 가지며, 음성 대조군과 구별될 수 있었다(도 3e). 이 결과에 기초하여, 잠재적으로 열안정성인 TdT 돌연변이체를 스크리닝하기 위한 96웰 플레이트-기반 FRET 검정에 대한 워크플로우를 확립하였으며, 이는 도 6에 도시된 바와 같다. 이는 열안정성 돌연변이체와 열감수성 돌연변이체 사이를 구별하기 위한 초기 열충격 단계를 포함한다. 열충격 단계의 온도 및 지속시간을 변화시킴으로써 선택 압력이 조정될 수 있음에 유의한다.
열안정성 TdT3-2의 발견
무작위 돌연변이생성을 통해 돌연변이체 라이브러리를 생성하였다. 제1 돌연변이체 라이브러리는 모 주형으로서 SUMO-TdT(즉, N-말단의 138개의 아미노산이 결실되고 N-말단 SUMO-태그를 함유하는 소 기원의 TdT)를 사용하였다. 2790개의 돌연변이체의 라이브러리를 47℃에서 1분 동안 열처리하여 스크리닝하였다. 이 라운드는 열안정성 돌연변이체 TdT1-1 및 TdT1-2를 열안정성으로 확인시켜 주었다(도 2 및 표 4A 및 표 4B). TdT1-1 및 TdT1-2는 SUMO-TdT와 비교하여 열처리 없이 그리고 열처리에 의해 유의하게 더 높은 FRET 판독치를 갖는다(도 7a). 또한, TdT1-1 및 TdT1-2는 열처리 후에 이들의 활성을 더 큰 비율로 보유하였다(도 7a).
[표 4A]
Figure pct00005
[표 4B]
Figure pct00006
스크리닝의 제2 라운드의 경우, TdT1-1을 모체로서 사용하여 7636개의 라이브러리 크기를 생성하였다. TdT1-1은 TdT1-2와 비교하여 열처리 없이 더 높은 FRET 판독치를 가졌기 때문에 모 주형으로서 TdT1-1을 선택하였다. 스크리닝의 제2 라운드를 1분 동안 50℃의 열처리로 수행하고, 4개의 열안정성 돌연변이체를 확인하였다(TdT2-1, TdT2-2, TdT2-3, TdT2-4)(표 4A 및 표 4B). 4개의 돌연변이체는 무열처리 조건 및 열처리 조건 둘 모두 하에서 TdT1-1보다 유의하게 더 높은 FRET 판독치를 갖는다(도 7b). 4개의 모든 돌연변이체는 또한 1분 동안 50℃에 노출된 후에 그들의 활성을 훨씬 더 높은 비율로 보유하였다(도 7b).
TdT2-1, TdT2-2, TdT2-3 및 TdT2-4로부터 확인된 돌연변이들의 조합은 열안정성의 상승적 증가를 제공하는 것으로 추론되었다. 열안정성 스크리닝의 제3 라운드의 경우, 2개의 돌연변이체 라이브러리를 생성하였다. 이들 돌연변이체 라이브러리 중 하나는 TdT2-1, TdT2-2, TdT2-3 및 TdT2-4에서 발견되는 돌연변이들의 상이한 조합을 가지면서 TdT1-1 주형에 기반하였다. 모 주형으로서 TdT1-3을 이용한 것을 제외하고는, 다른 하나의 돌연변이 라이브러리를 유사하게 생성하였다. TdT1-3은 TdT1-1 및 TdT1-2에서의 돌연변이들의 조합으로 구성되었다(표 4A 및 표 4B). TdT1-1-기반 돌연변이체 라이브러리를 55℃에서의 1분간의 열충격을 사용하여 스크리닝하였다. 이 라이브러리로부터의 상단 돌연변이체로서 확인된 TdT3-1(표 4A 및 표 4B)은 열충격이 없는 상태 및 열충격을 갖는 상태 둘 모두에서 훨씬 더 높은 FRET 판독치를 가졌으며, 열충격 후에 이의 FRET 활성이 더 높은 분율을 보유하였다(도 7c). 58℃에서 1분 동안의 열처리에 의한 TdT1-3-기반 돌연변이체 라이브러리의 스크리닝은 실온 및 열충격 처리 둘 모두 하에서 유의하게 더 높은 FRET 판독치를 갖는 TdT3-2의 발견으로 이어졌다(도 7d 및 표 4A 및 표 4B). TdT3-2는 1분 동안 58℃에 노출된 후에 이의 FRET 활성의 적어도 절반을 보유하였다(도 7d). 이는 TdT3-2가 TdT1-3보다 유의하게 더 활성이고 열안정성임을 시사한다. 표 4A 및 표 4B에 나타낸 바와 같이, TdT3-2는, T326S를 제외한, 스크리닝의 매 라운드마다 상단 돌연변이들로부터 확인된 돌연변이들의 대부분을 담지한다.
최적으로 열안정성인 돌연변이체로서 TdT3-2를 확인한 후에, 발현 및 정제 과정을 최적화하여, 최소한의 뉴클레아제 오염을 갖는 SUMO-TdT 및 TdT3-2를 성공적으로 얻었다(도 8). 정제된 SUMO-TdT 및 TdT3-2는 최소한의 뉴클레아제 활성을 갖는 것이 중요한데, 그 이유는, 뉴클레아제는 하류 특성화 연구를 방해할 것이기 때문이다.
TdT3-2의 열안정성 검증
시차 주사 열량측정법(DSC), 시차 주사 형광측정법(DSF), SYPRO Orange 열이동 검정 및 원편광 이색성(CD)을 통해 TdT3-2 열안정성의 특성화를 수행하였다. DSC는 단백질의 3차 구조를 안정화시키는 상호작용을 파괴하는 데 필요한 에너지를 측정한다. SUMO-TdT에 대한 DSC로부터 얻어진 Tm은 40.2℃이고, TdT3-2에 대해서는 50.7℃이다(도 9a). DSC로부터의 SUMO-TdT 및 TdT3-2의 Tm을 추가로 검증하기 위하여, 동일한 단백질들을 DSF에 의해 시험하였다. DSF는 단백질이 풀림에 따라 내재성 티로신 및 트립토판 잔기의 형광 이동을 측정한다. 형광 판독치의 음의 도함수를 온도에 대해 플롯팅하였으며, 이러한 도함수 곡선의 최대치는 단백질의 Tm에 상응한다. SUMO-TdT는 관찰된 Tm이 43.5℃인 반면, TdT3-2는 Tm이 53.1℃이다(도 9b). SUMO-TdT 및 TdT3-2의 Tm은 SYPRO Orange 열이동 검정에 의해 추가로 검증되었다. SYPRO Orange 염료는 단백질 풀림 동안 노출된 소수성 영역에 비특이적으로 결합한다. 형광 신호의 변화의 도함수는 단백질의 Tm에 상응한다. 41.5℃의 Tm이 SUMO-TdT에 대해 기록된 반면, 51.5℃가 TdT3-2에 대해 관찰되었다(도 9c). 원편광 이색성(CD)은 온도의 함수로서 단백질의 풀림을 추적하기 위한 분광학적 기법이다. CD는 α-나선 및 β-시트에 기인될 수 있는 특징적인 스펙트럼 밴드를 측정한다. 특징적인 파장에서의 온도의 함수로서의 CD의 변화는 단백질에 대한 풀림 전이의 중간점(Tm)을 결정하는 데 사용될 수 있다. 222 nm 파장에서의 CD의 1차 도함수를 온도에 대해 플롯팅하였으며, 이때 최대치는 Tm으로서 설정하였다. SUMO-TdT는 관찰된 Tm이 45.7℃이고, TdT3-2는 Tm이 52.5℃이다(도 9d).
두 단백질 모두에 대한 Tm 전이의 CD 측정치는 다른 기법과 비교할 때 약간 더 높았다. 더 높은 용융 온도는 기기 셋업과 관련될 수 있다. 샘플 큐벳은 금속 어댑터를 통해 펠티에(Peltier) 홀더와 접촉해 있었는데, 이는 작은 열 소산으로 이어졌고, 샘플 온도의 1 내지 2℃만큼의 작은 과대추정으로 이어질 수 있다. 그럼에도 불구하고, CD 데이터는 2개의 단백질 사이에서 동일한 안정성 경향을 보여주는 나머지 다른 실험 기법과 우수하게 일치하였다. 이 데이터는 TdT3-2가 SUMO-TdT보다 약 10℃ 더 열안정성이라는 것을 확인시켜 주었다.
시판(NEB) TdT, SUMO-TdT, 및 TdT3-2를 사용하여 프라이머 연장 반응을 수행하여, TdT3-2가 승온에서 뉴클레오티드를 도입시키는지를 결정하였다. 반응을 25℃, 36℃, 47℃ 및 58℃에서 수행하고, DNA 산물을 TBE-우레아 겔 상에서 시각화하였다. 3개의 모든 효소는 25℃ 및 36℃에서 활성이었다(도 10a 및 도 10b). 47℃에서, 시판 TdT 및 SUMO-TdT는 5분 이내에 변성되었는데, 그 이유는, 도입을 갖는 밴드의 강도가 5분, 10분 및 20분 동안 동일하게 유지되었기 때문이다. 대조적으로, TdT3-2는 20분 동안 활성이었는데, 그 이유는, 이는 더 많은 도입이 20분간의 반응 동안 관찰될 수 있었기 때문이다(도 10c). 58℃에서, 시판 TdT 및 SUMO-TdT는 활성이 아닌 반면, TdT3-2는 5분 이내에 변성되었는데, 그 이유는, 밴드의 강도가 이후에 동일하게 유지되기 때문이다(도 10d). 이러한 관찰은 TdT3-2가 SUMO-TdT보다 더 열안정성이고, TdT3-2가 더 높은 온도에서 활성을 유지한다는 것을 강력하게 확인시켜 준다.
TdT는, 라이브러리 제조에서, 증폭 전에 dsDNA 샘플을 신장시키는 데 사용되어 왔다. TdT가 뉴클레오티드를 ssDNA에 부가함에 따라, ds 블런트 말단 DNA는 TdT가 제1 몇몇 뉴클레오티드를 도입하도록 프라이머의 3' 말단에서 일시적으로 용융된 DNA에 의지할 것이다. 높은 GC 함량을 갖는 DNA 샘플은 TdT가 더 높은 Tm으로 인해 신장시키는 데 어려움을 제기할 수 있다. TdT를 사용한 라이브러리 제조 동안 온도를 증가시킴으로써, 그것은 TdT가 뉴클레오티드를 도입시키도록 프라이머의 3' 말단에서 ssDNA에 대한 일시적으로 용융된 dsDNA의 비율을 증가시킬 것이다. 그러나, 라이브러리 제조에 사용된 TdT는 열안정성이 아니다. 본 발명자들은 프라이머의 3'에서 4개의 GC 염기쌍을 함유하는 블런트 말단 dsDNA 상에서 TdT3-2를 시험하여, 라이브러리 제조 과정을 개선하는 데 있어서의 그의 잠재성을 입증하였다. 시판 TdT와 TdT3-2 사이에 ddCTP의 도입의 백분율을 비교한 결과, TdT3-2가 37℃ 및 50℃ 둘 모두에서 시판 TdT보다 더 우수하게 수행한다. 게다가, 프라이머의 신장은 50℃에서 TdT3-2에 대해 더 높다(도 11 및 도 12). 이는 현재 라이브러리 제조를 개선하는 데 있어서의 TdT3-2의 잠재적인 성능을 시사한다.
SUMO-TdT 및 TdT3-2의 동력학적 특성화.
열안정화된 TdT 변이체가 그의 말단 트랜스퍼라제 활성을 유지하였는지의 여부를 더 정확하게 결정하기 위하여, 그의 안정-상태 활성을 SUMO-TdT의 것과 비교하였다. 효소 턴오버당 도입 사건의 수를 구별하는 것이 가능하지 않을지라도 다회의 턴오버가 관찰될 수 있도록 과량의 DNA를 사용하여 안정-상태 검정을 셋업하였다. dCTP 농도의 적정과 함께 37℃에서의 반응물들을 각각 15초에서 켄칭하고, 산물의 양을 우레아-PAGE 상에서 정량화하였으며, 이는 초당 마이크로몰 dCTP에서의 총 턴오버가 대략적으로 추정될 수 있게 하였다(재료 및 방법, 표 5 및 표 6에서의 원시 데이터 참조). 이 속도를 dCTP 농도에 대해 플롯팅하였을 때, 쌍곡선 관계가 관찰되었으며, 이는 미카엘리스-멘텐 반응속도론과 일치하였는데, 이는 최대 신장률 및 미카엘리스 상수(K M)의 추정을 가능하게 한다. TdT3-2는 약간 상승된 신장률 및 더 낮은 K M을 가지면서 SUMO-TdT와 비견되는 활성을 나타내었는데, 이는 이러한 효소가 촉매 활성을 약간 개선하였음을 시사한다(표 7). 47℃의 승온에서 SUMO-TdT 및 TdT3-2의 동력학적 연구를 수행하였다. 동일한 분석 방법을 채택하고, 초당 마이크로몰 dCTP의 추정된 총 턴오버를 얻었다(표 8 및 표 9). TdT3-2는 37℃ 및 47℃ 둘 모두에서 비견되는 활성을 가진 반면, SUMO-TdT는 포화가 달성될 수 없었기 때문에 47℃에서 훨씬 더 낮은 활성을 가졌다(표 7).
[표 5]
Figure pct00007
[표 6]
Figure pct00008
Figure pct00009
[표 7]
Figure pct00010
[표 8]
Figure pct00011
[표 9]
Figure pct00012
이들 조건은 연장 반응에 사용되는 ssDNA 올리고에 대한 TdT3-2의 친화성을 추정함으로써 안정-상태임을 확인시켜 주었다. TdT의 적정의 존재 하에서의 FAM-올리고의 형광 편광을 측정하였으며, 본 발명의 돌연변이체 및 SUMO-TdT 둘 모두에 대한 친화성은 1 μM보다 더 큰 것으로 추정되었다(도 13). 열안정화된 돌연변이체, TdT3-2는 SUMO-TdT 효소의 기질 결합 친화성 및 촉매 특성을 보유하였으며, 이와 함께 아마도 활성에 있어서의 약간의 개선을 가질 것이다.
TdT3-2의 상동성-기반 모델링
뮤린 TdT 결정 구조를 입수하였다(PDB ID 4I27). TdT3-2가 소 공급원으로부터 기원되기 때문에, 3D 구조 상에서 돌연변이의 위치를 시각화하는 것은 단지 상동성 모델링에 의해서만 행해질 수 있었다. 이용가능한 상동성 서열 및 알려진 구조에 기초하여, Phyre2 서버는 TdT3-2의 3D 구조를 그의 아미노산 질의 서열로부터 생성하였다. 8개의 돌연변이 및 다른 중요한 잔기의 위치가 Phyre2로부터 얻어진 모델 상에서 시각화될 수 있었다(도 14). 그러나, 이 모델은 개선된 열안정성에 기여하는 TdT3-2에서 획득된 돌연변이의 효과를 정확하게 설명할 수 없었다.
결론
열안정성 TdT 변이체는 온도를 증가시킴으로써 올리고뉴클레오티드 합성 동안 2차 구조의 존재를 최소화하는 것과 같이 실제의 응용에 유용할 것이다. 마우스 TdT로부터의 열안정성 변이체는 도입 반응 동안 온도를 증가시킴으로써 몇몇 GC-풍부 헤어핀 프라이머의 신장률을 개선할 수 있었다. 이 실시예에서 TdT3-2를 발견하는 단백질 조작 방법은 광범위한 서열 공간의 탐구를 가능하게 하였다. 이 실시예는 DNA 합성에서의 응용을 위하여 열안정성 TdT를 진전시키는 것의 가치 및 의의를 보여준다.
이 실시예는 E. 콜라이 세포 용해물을 사용하는 돌연변이체 라이브러리의 스크리닝을 위한 적응가능한 플레이트-기반 FRET 검정을 확립한다. 스크리닝의 3회의 라운드들은 유의하게 더 열안정성인 변이체 TdT3-2의 발견으로 이어졌다. TdT3-2를 DSC, DSF, SYPRO Orange 열이동 검정 및 CD 상에서 검증하였으며, Tm이 SUMO-TdT보다 약 10℃ 더 높은 것으로 확인되었다. 게다가, 열안정성의 개선은 효소 활성을 희생하여 일어나지 않았다. TdT3-2는 그의 개선된 열안정성 및 견고한 활성으로 인해 현재 SUMO-TdT를 사용하는 광범위한 응용을 위한 더 우수한 툴이다. 더욱이, TdT3-2는 또한, 궁극적으로, 가역적으로 블록킹된 뉴클레오티드를 효율적으로 도입시킬 수 있는 TdT를 진전시키기 위한 추가의 조작을 위한 이상적인 출발점으로, 이는 DNA에서의 드 노보 유전자 합성 및 정보 저장의 신생 분야에서 특히 유용할 것이다.
종합하면, 이들 데이터는 이 실시예에서 확인된 9개의 아미노산 치환이 개별적으로 또는 임의의 조합으로, TdT 촉매 활성을 보존하면서 아미노산 치환(들)을 함유하는 TdT 돌연변이체의 열안정성을 증가시킬 수 있음을 나타낸다. 더욱이, 이 실시예에서 확인된 TdT 돌연변이체는 TdT 촉매 활성을 보존하면서 열안정성일 수 있다.
용어
앞서 기재된 실시 형태들 중 적어도 일부에서, 일 실시 형태에서 사용되는 하나 이상의 요소는 다른 실시 형태에서 상호교환 가능하게 사용될 수 있는데, 이는, 그러한 대체가 기술적으로 실현 불가능하지 않는 한 그러하다. 청구된 발명 요지의 범주로부터 벗어나지 않고서 전술된 방법 및 구조에 대해 다양한 다른 생략, 첨가 및 변형이 이루어질 수 있음이 당업자에 의해 이해될 것이다. 모든 그러한 변형 및 변경은 첨부된 청구범위에 의해 정의된 바와 같은 발명 요지의 범주 내에 속하는 것으로 의도된다.
본 명세서에서 실질적으로 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 당업자는 문맥 및/또는 적용에 적절하게 복수를 단수로 번역하고/하거나 단수를 복수로 번역할 수 있다. 다양한 단수/복수 교환이 명료함을 위해 본 명세서에 명시적으로 기재될 수 있다. 본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수형("a", "an" 및 "the")은 문맥이 명확하게 달리 지시하지 않으면, 복수의 지시대상을 포함한다. 본 명세서에서 "또는"에 대한 임의의 언급은 달리 언급되지 않는 한 "및/또는"을 포함하는 것으로 의도된다.
일반적으로, 본 명세서에서, 그리고 특히 첨부된 청구범위(예를 들어, 첨부된 청구범위의 청구항 본문)에서 사용된 용어는 일반적으로 "개방된" 용어(예를 들어, "포함하는"이라는 용어는 "포함하지만 이로 한정되지 않는"으로 해석되어야 하고, 용어 "갖는"은 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 이로 한정되지 않는다" 등으로 해석되어야 함)로 의도된다는 것을 당업자는 이해할 것이다. 특정 수의 도입된 청구범위 인용이 의도되는 경우, 그러한 의도는 청구범위에서 명시적으로 인용될 것이며, 그러한 인용이 부재시, 그러한 의도가 존재하지 않는다는 점을 당업자는 추가로 이해할 것이다. 예를 들어, 이해를 돕기 위해, 하기에 첨부된 청구범위는 청구 인용을 소개하기 위해 "적어도 하나", 및 "하나 이상"이라는 소개 문구의 사용을 포함할 수 있다. 그러나, 이러한 문구의 사용은 부정관사 "a", 또는 'an"에 의한 청구범위 인용의 도입이 그러한 도입된 청구범위 인용을 포함하는 임의의 특정 청구범위를 그러한 인용을 오직 하나만 포함하는 실시 형태로, 심지어 동일한 청구범위가 도입구 "하나 이상" 또는 "적어도 하나" 및 "a" 또는 "an"과 같은 부정관사를 포함할 경우에도 제한하는 것으로 의미하는 것으로 해석되어서는 안 되며(예를 들어, "an" 및/또는 "an"은 "적어도 하나" 또는 "하나 이상"을 의미하는 것으로 해석되어야 함); 청구범위 인용을 도입하는 데 사용된 정관사를 이용하는 경우에도 마찬가지이다. 또한, 특정수의 도입된 청구항 인용이 명시적으로 인용된 경우라 할지라도, 당업자는 그러한 인용이 적어도 해당 인용된 수를 의미하는 것으로 해석되어야 하는 것으로 인지할 것이다(예를 들어, "2개의 인용"의 최소(bare) 인용은 다른 수식어 없이 적어도 2개의 인용, 또는 2개 이상의 인용을 의미한다). 나아가, "A, B 및 C 등 중 적어도 하나"와 유사한 관례(convention)가 사용되는 경우에서, 일반적으로, 그러한 구성은 당업자가 상기 관례를 이해할 수 있는 의미에서 의도된다(예를 들어, "A, B 및 C 중 적어도 하나를 가진 시스템"은 A 단독, B 단독, C 단독, A와 B 함께, A와 C 함께, B와 C 함께, 및/또는 A, B 및 C와 함께 등을 가진 시스템을 포함하지만 이로 한정되지 않음). "A, B, 또는 C 등 중 적어도 하나"와 유사한 관례가 사용되는 경우에서, 일반적으로 그러한 구성은 당업자가 상기 관례를 이해할 수 있는 의미에서 의도된다(예를 들어, "A, B, 또는 C 중 적어도 하나를 가진 시스템"은 A 단독, B 단독, C 단독, A와 B 함께, A와 C 함께, B와 C 함께, 및/또는 A, B, 및 C와 함께 등을 가진 시스템을 포함하지만 이로 한정되지 않음). 발명의 설명, 청구범위 또는 도면에 있든지 간에 둘 이상의 대안적인 용어를 제시하는 사실상 임의의 이접적인 단어 및/또는 구가 그 용어 중 하나, 그 용어 중 어느 하나, 또는 두 용어 모두를 포함하는 가능성을 고려하는 것으로 이해되어야 한다는 것을 당업자는 추가로 이해할 것이다. 예를 들어, "A 또는 B"라는 문구는 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
또한, 본 발명의 특징 또는 태양이 마쿠쉬(Markush) 군의 관점에서 기재된 경우, 당업자는 본 발명이 또한 마쿠쉬 군의 임의의 개별적인 구성원 또는 구성원들의 하위군의 관점에서 기재됨을 인식할 것이다.
당업자에게 이해되는 바와 같이, 임의의 그리고 모든 목적을 위해, 예컨대 기록된 설명을 제공하는 관점에서, 본 명세서에 개시된 모든 범위는 그의 임의의 그리고 모든 가능한 하위범위, 및 하위범위들의 조합을 또한 포함한다. 임의의 열거된 범위는 동일한 범위가 적어도 동일한 1/2, 1/3, 1/4, 1/5, 1/10 등으로 분해되는 것을 충분히 설명하고 가능하게 하는 것으로 용이하게 인식될 수 있다. 비제한적인 예로서, 본 명세서에 논의된 각각의 범위는 하부 1/3, 중앙 1/3, 상부 1/3 등으로 용이하게 분해될 수 있다. 또한 당업자에 의해 이해되는 바와 같이, "이하", "이상", "초과", "미만" 등과 같은 모든 언어는 언급된 수를 포함하며, 이어서 상술한 바와 같이 하위범위로 분해될 수 있는 범위를 지칭한다. 마지막으로, 당업자에 의해 이해되는 바와 같이, 범위는 각각의 개별 구성원을 포함한다. 따라서, 예를 들어 1 내지 3개의 항목을 갖는 군은 1, 2, 또는 3개의 항목을 갖는 군을 지칭한다. 유사하게, 1 내지 5개의 항목을 갖는 군은 1, 2, 3, 4, 또는 5개의 항목을 갖는 군을 지칭하는 등등이다.
다양한 태양 및 실시 형태가 본 명세서에 개시되어 있지만, 다른 태양 및 실시 형태가 당업자에게 명백해질 것이다. 본 명세서에 개시된 다양한 태양 및 실시 형태는 예시를 위한 것으로, 제한하려는 의도는 아니며, 진정한 범주 및 사상은 하기의 청구범위에 의해 나타낸다.
SEQUENCE LISTING <110> Illumina Inc. Illumina Singapore Pte. Ltd. National University of Singapore Nirantar, Saurabh Rajendra Chua, Jasmine Puay Suan Peisajovich, Sergio Yew, Wen Shan Go, Maybelle Darlene Kho <120> THERMOSTABLE TERMINAL DEOXYNUCLEOTIDYL TRANSFERASE <130> 47CX-311971-WO <150> 63/023,734 <151> 2020-05-12 <160> 33 <170> PatentIn version 3.5 <210> 1 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> Bos taurus TdT 139-520 <220> <221> NON_TER <222> (1)..(1) <400> 1 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 2 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Glu53Val in TdT 139-520/Glu191Val in WT <220> <221> NON_TER <222> (1)..(1) <400> 2 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Val Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Lys55Asn in TdT 139-520/Lys193Asn in WT <220> <221> NON_TER <222> (1)..(1) <400> 3 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Asn Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Glu56Gly in TdT 139-520/Glu194Gly in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 4 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Gly Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 5 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Asp104Tyr in TdT 139-520/Asp242Tyr in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 5 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 6 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Lys149Glu in TdT 139-520/Lys287Glu in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 6 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Glu Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 7 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Phe158Leu in TdT 139-520/Phe296Leu in WT TdT. <220> <221> NON_TER <222> (1)..(1) <400> 7 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 8 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Met161Lys in TdT 139-520/Met299Lys in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 8 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Lys Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 9 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with Thr204Ser in TdT 139-520/Thr342Ser in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 9 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Ser Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with His283Pro in TdT 139-520/His421Pro in WT TdT <220> <221> NON_TER <222> (1)..(1) <400> 10 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys 145 150 155 160 Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Pro His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 11 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> TdT 139-520 with TdT3-2 Substitution Mutations <220> <221> NON_TER <222> (1)..(1) <400> 11 Arg Thr Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro 1 5 10 15 Pro Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr 20 25 30 Thr Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu 35 40 45 Ala Glu Asn Ser Val Phe Asn Gly Asn Glu Val Ser Tyr Val Thr Phe 50 55 60 Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser 65 70 75 80 Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys 85 90 95 Ile Ile Glu Glu Ile Ile Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala 100 105 110 Val Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val 115 120 125 Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe 130 135 140 Arg Ser Leu Ser Glu Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Lys 145 150 155 160 Lys Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val 165 170 175 Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val 180 185 190 Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg 195 200 205 Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro 210 215 220 Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu 225 230 235 240 Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 245 250 255 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Pro His Gln Arg Val Asp 275 280 285 Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 12 <211> 520 <212> PRT <213> Bos taurus <400> 12 Met Ala Gln Gln Arg Gln His Gln Arg Leu Pro Met Asp Pro Leu Cys 1 5 10 15 Thr Ala Ser Ser Gly Pro Arg Lys Lys Arg Pro Arg Gln Val Gly Ala 20 25 30 Ser Met Ala Ser Pro Pro His Asp Ile Lys Phe Gln Asn Leu Val Leu 35 40 45 Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg Arg Asn Phe Leu Met 50 55 60 Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu Asn Glu Leu Ser Asp 65 70 75 80 Ser Val Thr His Ile Val Ala Glu Asn Asn Ser Gly Ser Glu Val Leu 85 90 95 Glu Trp Leu Gln Val Gln Asn Ile Arg Ala Ser Ser Gln Leu Glu Leu 100 105 110 Leu Asp Val Ser Trp Leu Ile Glu Ser Met Gly Ala Gly Lys Pro Val 115 120 125 Glu Ile Thr Gly Lys His Gln Leu Val Val Arg Thr Asp Tyr Ser Ala 130 135 140 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 145 150 155 160 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 165 170 175 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe 180 185 190 Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 195 200 205 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 210 215 220 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 225 230 235 240 Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 245 250 255 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 260 265 270 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile 275 280 285 Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe 290 295 300 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 305 310 315 320 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 325 330 335 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 340 345 350 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 355 360 365 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 370 375 380 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 385 390 395 400 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 405 410 415 Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 420 425 430 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 435 440 445 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 450 455 460 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 465 470 475 480 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 485 490 495 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 500 505 510 Ile Glu Pro Trp Glu Arg Asn Ala 515 520 <210> 13 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> Saccharomyces cerevisiae SUMO 1-98 <220> <221> NON_TER <222> (98)..(98) <400> 13 Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro 1 5 10 15 Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser 20 25 30 Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu 35 40 45 Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Arg 50 55 60 Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu Asp 65 70 75 80 Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile 85 90 95 Gly Gly <210> 14 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> HIS-SUMO-TdT 139-520 <400> 14 Met Gly Ser Ser His His His His His His Gly Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser Ala Ser Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys 20 25 30 Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys 35 40 45 Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr 50 55 60 Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu 65 70 75 80 Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp 85 90 95 Gln Thr Pro Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala 100 105 110 His Arg Glu Gln Ile Gly Gly Glu Leu Met Arg Thr Asp Tyr Ser Ala 115 120 125 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 130 135 140 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 145 150 155 160 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe 165 170 175 Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 180 185 190 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 195 200 205 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 210 215 220 Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 225 230 235 240 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 245 250 255 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile 260 265 270 Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe 275 280 285 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 290 295 300 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 305 310 315 320 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 325 330 335 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 340 345 350 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 355 360 365 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 370 375 380 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 385 390 395 400 Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 405 410 415 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 420 425 430 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 435 440 445 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 450 455 460 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 465 470 475 480 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 485 490 495 Ile Glu Pro Trp Glu Arg Asn Ala 500 <210> 15 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> TdT3-2 <400> 15 Met Gly Ser Ser His His His His His His Gly Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser Ala Ser Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys 20 25 30 Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys 35 40 45 Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr 50 55 60 Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu 65 70 75 80 Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp 85 90 95 Gln Thr Pro Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala 100 105 110 His Arg Glu Gln Ile Gly Gly Glu Leu Met Arg Thr Asp Tyr Ser Ala 115 120 125 Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys 130 135 140 Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn 145 150 155 160 His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Val Phe 165 170 175 Asn Gly Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val 180 185 190 Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly 195 200 205 Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile 210 215 220 Glu Tyr Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg 225 230 235 240 Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys 245 250 255 Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Glu Ile 260 265 270 Met Ser Asp Lys Thr Leu Lys Leu Thr Lys Lys Gln Lys Ala Gly Phe 275 280 285 Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu 290 295 300 Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp 305 310 315 320 Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly 325 330 335 His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu 340 345 350 Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu 355 360 365 Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu 370 375 380 Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu 385 390 395 400 Ile Leu Lys Leu Pro His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln 405 410 415 Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys 420 425 430 Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg 435 440 445 Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met 450 455 460 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu 465 470 475 480 Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 485 490 495 Ile Glu Pro Trp Glu Arg Asn Ala 500 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> modified_base <222> (19)..(19) <223> Fluorescein T <400> 16 cgcttgcaca ggtgcgtttc a 21 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (1)..(1) <223> 5' 6-Fluorescein <400> 17 cgcttgcaca ggtgcgttcg 20 <210> 18 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 18 aaaaaacacc tgcggcctgg tgccgcgcgg cagcgctagc atg 43 <210> 19 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 19 aaaaaacacc tgcgggatcc ggtaccgcgg ccgccta 37 <210> 20 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 20 attctgtgtt taawgraaat gaagtctctt atgtg 35 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 21 agatctctga gtraaataat gtcagacaaa accctgaa 38 <210> 22 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 22 agacaaaacc ctgaaattma caaaaawgca gaaagcagga t 41 <210> 23 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 23 tttgtcacca tgwcaggagg attccgcag 29 <210> 24 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 24 gattttaaaa ttgcmccatc agagagtaga cagt 34 <210> 25 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 25 tctagagccc gcctaatcag cgggcttttt tttat 35 <210> 26 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (1)..(1) <223> 5' 6-Fluorescein <400> 26 attcaggacg agcctcagac c 21 <210> 27 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (1)..(1) <223> 5' 6-Fluorescein <400> 27 tttcggtggt cgccgtatcc gc 22 <210> 28 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (35)..(35) <223> 3' Phosphate <400> 28 gcggatacgg cgaccaccga gatctacact ctgag 35 <210> 29 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (38)..(38) <223> 3' Phosphate <400> 29 tttctcagag tgtagatctc ggtggtcgcc gtatccgc 38 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> modified_base <222> (20)..(20) <223> Fluorescein T <400> 30 cgcttgcaca ggtgcgttct a 21 <210> 31 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> modified_base <222> (16)..(16) <223> Fluorescein T <400> 31 cgcttgcaca ggtgctgttc a 21 <210> 32 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> modified_base <222> (11)..(11) <223> Fluorescein T <400> 32 cgcttgcaca tggtgcgttc a 21 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_difference <222> (17)..(18) <223> T Cy3 T <400> 33 cgcttgcaca ggtgcgttca 20

Claims (67)

  1. 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)로서,
    서열 번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스(Bos taurus) TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 하나 이상의 위치에서 하나 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  2. 제1항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  3. 제1항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu191Ala, Glu191Arg, Glu191Asn, Glu191Asp, Glu191Cys, Glu191Gln, Glu191Gly, Glu191His, Glu191Ile, Glu191Leu, Glu191Lys, Glu191Met, Glu191Phe, Glu191Pro, Glu191Ser, Glu191Thr, Glu191Trp, Glu191Tyr, 또는 Glu191Val인, 재조합 TdT.
  4. 제1항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu191Val인, 재조합 TdT.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys193Ala, Lys193Arg, Lys193Asn, Lys193Asp, Lys193Cys, Lys193Gln, Lys193Glu, Lys193Gly, Lys193His, Lys193Ile, Lys193Leu, Lys193Met, Lys193Phe, Lys193Pro, Lys193Ser, Lys193Thr, Lys193Trp, Lys193Tyr, 또는 Lys193Val인, 재조합 TdT.
  7. 제1항 내지 제4항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys193Asn인, 재조합 TdT.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu194Ala, Glu194Arg, Glu194Asn, Glu194Asp, Glu194Cys, Glu194Gln, Glu194Gly, Glu194His, Glu194Ile, Glu194Leu, Glu194Lys, Glu194Met, Glu194Phe, Glu194Pro, Glu194Ser, Glu194Thr, Glu194Trp, Glu194Tyr, 또는 Glu194Val인, 재조합 TdT.
  10. 제1항 내지 제7항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu194와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Glu194Gly인, 재조합 TdT.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Asp242Ala, Asp242Arg, Asp242Asn, Asp242Cys, Asp242Gln, Asp242Glu, Asp242Gly, Asp242His, Asp242Ile, Asp242Leu, Asp242Lys, Asp242Met, Asp242Phe, Asp242Pro, Asp242Ser, Asp242Thr, Asp242Trp, Asp242Tyr, 또는 Asp242Val인, 재조합 TdT.
  13. 제1항 내지 제10항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Asp242와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Asp242Tyr인, 재조합 TdT.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  15. 제1항 내지 제13항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys287Ala, Lys287Arg, Lys287Asn, Lys287Asp, Lys287Cys, Lys287Gln, Lys287Glu, Lys287Gly, Lys287His, Lys287Ile, Lys287Leu, Lys287Met, Lys287Phe, Lys287Pro, Lys287Ser, Lys287Thr, Lys287Trp, Lys287Tyr, 또는 Lys287Val인, 재조합 TdT.
  16. 제1항 내지 제13항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys287과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Lys287Glu인, 재조합 TdT.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  18. 제1항 내지 제16항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Phe296Ala, Phe296Arg, Phe296Asn, Phe296Asp, Phe296Cys, Phe296Gln, Phe296Glu, Phe296Gly, Phe296His, Phe296Ile, Phe296Leu, Phe296Lys, Phe296Met, Phe296Pro, Phe296Ser, Phe296Thr, Phe296Trp, Phe296Tyr, 또는 Phe296Val인, 재조합 TdT.
  19. 제1항 내지 제16항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Phe296과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Phe296Leu인, 재조합 TdT.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  21. 제1항 내지 제19항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Met299Ala, Met299Arg, Met299Asn, Met299Asp, Met299Cys, Met299Gln, Met299Glu, Met299Gly, Met299His, Met299Ile, Met299Leu, Met299Lys, Met299Phe, Met299Pro, Met299Ser, Met299Thr, Met299Trp, Met299Tyr, 또는 Met299Val인, 재조합 TdT.
  22. 제1항 내지 제19항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Met299와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Met299Lys인, 재조합 TdT.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  24. 제1항 내지 제22항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Thr342Ala, Thr342Arg, Thr342Asn, Thr342Asp, Thr342Cys, Thr342Gln, Thr342Glu, Thr342Gly, Thr342His, Thr342Ile, Thr342Leu, Thr342Lys, Thr342Met, Thr342Phe, Thr342Pro, Thr342Ser, Thr342Trp, Thr342Tyr, 또는 Thr342Val인, 재조합 TdT.
  25. 제1항 내지 제22항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Thr342와 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 Thr342Ser인, 재조합 TdT.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 비극성 아미노산, 극성 아미노산, 양으로 하전된 아미노산, 음으로 하전된 아미노산, 소수성 아미노산, 방향족 아미노산, 지방족 아미노산, 작은 아미노산, 또는 친수성 아미노산에 대한 돌연변이를 포함하는, 재조합 TdT.
  27. 제1항 내지 제25항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 His421Ala, His421Arg, His421Asn, His421Asp, His421Cys, His421Gln, His421Glu, His421Gly, His421Ile, His421Leu, His421Lys, His421Met, His421Phe, His421Pro, His421Ser, His421Thr, His421Trp, His421Tyr, 또는 His421Val인, 재조합 TdT.
  28. 제1항 내지 제25항 중 어느 한 항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 His421과 기능적으로 동등한 위치에서의 상기 아미노산 치환 돌연변이는 His421Pro인, 재조합 TdT.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서 2개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  30. 제29항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 2개 이상의 위치에서의 상기 2개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 2개 이상을 포함하는, 방법.
  31. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서 3개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  32. 제31항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 3개 이상의 위치에서의 상기 3개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 3개 이상을 포함하는, 방법.
  33. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서 4개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  34. 제33항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 4개 이상의 위치에서의 상기 4개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 4개 이상을 포함하는, 방법.
  35. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서 5개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  36. 제35항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 5개 이상의 위치에서의 상기 5개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 5개 이상을 포함하는, 방법.
  37. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서 6개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  38. 제37항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 6개 이상의 위치에서의 상기 6개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 6개 이상을 포함하는, 방법.
  39. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서 7개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  40. 제39항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 7개 이상의 위치에서의 상기 7개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 7개 이상을 포함하는, 방법.
  41. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서 8개 이상의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  42. 제41항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개 이상의 위치에서의 상기 8개 이상의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro 중 8개 이상을 포함하는, 방법.
  43. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서 8개의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  44. 제43항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 8개의 위치에서의 상기 8개의 아미노산 치환 돌연변이는 각각 Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro인, 방법.
  45. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서 9개의 아미노산 치환 돌연변이를 포함하는, 재조합 TdT.
  46. 제45항에 있어서, 서열 번호 12의 보스 타우루스 TdT에서 Glu191, Lys193, Glu194, Asp242, Lys287, Phe296, Met299, Thr342, 및 His421과 기능적으로 동등한 위치에서의 상기 9개의 아미노산 치환 돌연변이는 각각 Glu191Val, Lys193Asn, Glu194Gly, Asp242Tyr, Lys287Glu, Phe296Leu, Met299Lys, Thr342Ser, 및 His421Pro인, 방법.
  47. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 85% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  48. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 90% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  49. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  50. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 11과 적어도 95% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  51. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 재조합 TdT는 서열 번호 12와 적어도 80% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 재조합 TdT는 47℃ 이상의 온도에서 안정한, 재조합 TdT.
  53. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 재조합 TdT는 50℃ 이상의 온도에서 안정한, 재조합 TdT.
  54. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 재조합 TdT는 55℃ 이상의 온도에서 안정한, 재조합 TdT.
  55. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 재조합 TdT는 58℃ 이상의 온도에서 안정한, 재조합 TdT.
  56. 제1항 내지 제55항 중 어느 한 항에 있어서, 상기 재조합 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 동일한 시험 온도에서 서열 번호 12의 보스 타우루스 TdT의 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성의 적어도 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 또는 120%인, 재조합 TdT.
  57. 제56항에 있어서, 상기 시험 온도는 37℃, 47℃, 50℃, 55℃, 또는 58℃인, 재조합 TdT.
  58. 제1항 내지 제57항 중 어느 한 항에 있어서, 상기 재조합 TdT는 작은 유비퀴틴-유사 변경인자(SUMO) 단편을 포함하는, 재조합 TdT.
  59. 제58항에 있어서, 상기 SUMO 단편은 서열 번호 13과 적어도 80% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  60. 제58항 또는 제59항에 있어서, 상기 재조합 TdT는 상기 재조합 TdT의 N-말단 상에 상기 SUMO 단편을 포함하는, 재조합 TdT.
  61. 제59항에 있어서, 상기 재조합 TdT는 서열 번호 14와 적어도 80% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  62. 제59항에 있어서, 상기 재조합 TdT는 서열 번호 15와 적어도 80% 동일한 아미노산 서열을 포함하는, 재조합 TdT.
  63. 제58항 또는 제59항에 있어서, 상기 재조합 TdT는 상기 재조합 TdT의 C-말단 상에 상기 SUMO 단편을 포함하는, 재조합 TdT.
  64. 제1항 내지 제63항 중 어느 한 항의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)를 인코딩하는 폴리뉴클레오티드.
  65. 제64항의 폴리뉴클레오티드를 포함하는 발현 벡터.
  66. 하기 중 하나 이상을 포함하는 숙주 세포:
    제1항 내지 제63항 중 어느 한 항의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT),
    제64항의 폴리뉴클레오티드, 및
    제65항의 발현 벡터.
  67. 키트로서,
    제1항 내지 제63항 중 어느 한 항의 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT), 제64항의 폴리뉴클레오티드, 제65항의 발현 벡터, 제66항의 숙주 세포, 또는 이들의 조합, 및
    상기 재조합 말단 데옥시뉴클레오티딜 트랜스퍼라제, 상기 폴리뉴클레오티드, 상기 발현 벡터, 상기 숙주 세포, 또는 이들의 조합을 사용하기 위한 설명서를 포함하는, 키트.
KR1020227042776A 2020-05-12 2021-05-11 열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제 KR20230038415A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063023734P 2020-05-12 2020-05-12
US63/023,734 2020-05-12
PCT/US2021/031852 WO2021231483A1 (en) 2020-05-12 2021-05-11 Thermostable terminal deoxynucleotidyl transferase

Publications (1)

Publication Number Publication Date
KR20230038415A true KR20230038415A (ko) 2023-03-20

Family

ID=76444534

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227042776A KR20230038415A (ko) 2020-05-12 2021-05-11 열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제

Country Status (8)

Country Link
US (1) US20210355460A1 (ko)
EP (1) EP4150066A1 (ko)
JP (1) JP2023526061A (ko)
KR (1) KR20230038415A (ko)
CN (1) CN116096872A (ko)
AU (1) AU2021271831A1 (ko)
CA (1) CA3177282A1 (ko)
WO (1) WO2021231483A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115867670A (zh) 2020-07-21 2023-03-28 伊鲁米纳新加坡有限公司 作为底物用于基于tdt的酶核酸的碱基修饰的核苷酸
WO2022220748A1 (en) * 2021-04-14 2022-10-20 Illumina Singapore Pte. Ltd. Synthesis of polynucleotide bottlebrush polymer

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8034910B2 (en) * 2008-05-06 2011-10-11 Academia Sinica, Taiwan SUMO fusion protein expression system for producing native proteins
US10774316B2 (en) * 2014-10-20 2020-09-15 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
US11390858B2 (en) * 2014-10-20 2022-07-19 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
GB201502152D0 (en) * 2015-02-10 2015-03-25 Nuclera Nucleics Ltd Novel use
WO2018217689A1 (en) * 2017-05-22 2018-11-29 The Charles Stark Draper Laboratory, Inc. Modified template-independent dna polymerase
US10752887B2 (en) * 2018-01-08 2020-08-25 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
GB201901501D0 (en) * 2019-02-04 2019-03-27 Nuclera Nucleics Ltd Modified terminal deoxynucleotidyl transferase (TdT) enzymes
IL293820A (en) * 2019-12-12 2022-08-01 Dna Script Chimeric-terminal deoxynucleotidyltransferases for template-independent enzymatic synthesis of polynucleotides

Also Published As

Publication number Publication date
JP2023526061A (ja) 2023-06-20
CA3177282A1 (en) 2021-11-18
WO2021231483A1 (en) 2021-11-18
US20210355460A1 (en) 2021-11-18
CN116096872A (zh) 2023-05-09
AU2021271831A1 (en) 2022-12-08
EP4150066A1 (en) 2023-03-22

Similar Documents

Publication Publication Date Title
JP7061078B2 (ja) 耐熱性の逆転写酵素変異体
JP5851709B2 (ja) 増強された熱安定性を有する新規なt7rnaポリメラーゼ変異体
JP6429773B2 (ja) 酵素構築物
JP6959931B2 (ja) エキソヌクレアーゼ欠損ポリメラーゼ
KR20230038415A (ko) 열안정성 말단 데옥시뉴클레오티딜 트랜스퍼라제
Anindya et al. Tyrosine 66 of Pepper vein banding virus genome-linked protein is uridylylated by RNA-dependent RNA polymerase
Ma et al. Enhancement of polymerase activity of the large fragment in DNA polymerase I from Geobacillus stearothermophilus by site-directed mutagenesis at the active site
JP2022543569A (ja) ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成
CN113195521A (zh) Mtu ΔI-CM内含肽变体和其应用
KR102168695B1 (ko) 재조합효소 돌연변이체
JP7363063B2 (ja) 変異型dnaポリメラーゼ
JP6720632B2 (ja) 融合タンパク質
CN114561374A (zh) 一种新型嗜热核酸内切酶突变体及其制备方法和应用
JP7014256B2 (ja) 核酸増幅試薬
WO2024032020A1 (zh) 一种增强型单体StayGold蛋白及其应用
CN108064278B (zh) 聚合酶
JP5617075B2 (ja) 酵素
JP7180944B1 (ja) 改変型dnaポリメラーゼ
JP2008245604A (ja) 高効率耐熱性dnaリガーゼ
JP2006180886A (ja) Dnaポリメラーゼの製造方法
JP4714848B2 (ja) Dnaポリメラーゼ変異体
US20230416708A1 (en) Novel Variants of Endonuclease V and Uses Thereof
JP4217922B2 (ja) サーモコッカス・ペプトノフィラス由来の熱安定性dnaポリメラーゼ、該酵素をコードする遺伝子およびその用途
JP6070180B2 (ja) 酵素のスクリーニング方法
JP3829174B2 (ja) Dnaポリメラーゼ活性と3’−5’エキソヌクレアーゼ活性を有する耐熱性ヘテロダイマー酵素およびその製法