KR20230002825A - 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 - Google Patents

말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 Download PDF

Info

Publication number
KR20230002825A
KR20230002825A KR1020227040201A KR20227040201A KR20230002825A KR 20230002825 A KR20230002825 A KR 20230002825A KR 1020227040201 A KR1020227040201 A KR 1020227040201A KR 20227040201 A KR20227040201 A KR 20227040201A KR 20230002825 A KR20230002825 A KR 20230002825A
Authority
KR
South Korea
Prior art keywords
leu
glu
lys
ala
arg
Prior art date
Application number
KR1020227040201A
Other languages
English (en)
Inventor
미카엘 소스킨
엘리스 챰피온
Original Assignee
디엔에이 스크립트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디엔에이 스크립트 filed Critical 디엔에이 스크립트
Publication of KR20230002825A publication Critical patent/KR20230002825A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 폴리뉴클레오타이드에 통합시킴에 있어서 향상된 효율을 보이는 다양한 종으로부터의 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체, 및 임의의 소정의 서열의 폴리뉴클레오타이드를 합성함에 있어서 이와 같은 TdT의 용도에 관한 것이다.

Description

말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도
소정의 서열의 합성 폴리뉴클레오타이드는 분자 진단, 게놈 및 진단 서열분석, 핵산 증폭, 치료 항체 개발, 합성 생물학, 핵산-기반 요법, DNA 접기기술(origami), DNA-기반 데이터 저장 등을 포함하는 기술의 주최의 중심이다. 최근에는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 같은 무-주형 폴리머라제 효소의 입증된 효율 및 순한 무독성 반응 조건의 이득으로 인해, 화학-기반 합성 방법을 상기와 같은 효소를 사용하는 효소-기반 방법으로 보완하거나 대체하는 데 관심이 높아지고 있다. 예를 들어 이버트(Ybert) 등의 국제 특허 공보 WO2015/159023; 하이아트(Hiatt) 등의 미국특허 제5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)] 등. 효소-기반 합성의 대부분의 접근법은 폴리뉴클레오타이드 생성물에서 목적하는 서열을 얻기 위해 가역적으로 차단된 뉴클레오사이드 트라이포스페이트의 사용을 필요로 한다. 그러나 불행하게도, 천연 TdT는 상기와 같은 변형된 뉴클레오사이드 트라이포스페이트를, 변형되지 않은 뉴클레오사이드 트라이스포페이트에 비해 크게 감소된 효율로 통합시킨다.
이에 비추어, 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 더 큰 효율로 통합시킬 수 있는 변형 TdT와 같은 신규의 무-주형 폴리머라제를 이용할 수 있다면, 무-주형 효소-기반 폴리뉴클레오타이드의 합성 분야는 발전할 것이다.
본 발명은 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 폴리뉴클레오타이드에 통합시킴에 있어서 향상된 효율을 나타내는 다양한 종으로부터의 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체, 및 임의의 소정의 서열의 폴리뉴클레오타이드의 합성에서 그의 용도에 관한 것이다.
일부 실시태양에서, 본 발명은 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며, 이때
서열번호 2에 관하여, 61번 위치의 류신이 치환되고, 170번 위치의 시스테인이 치환되고, 204번 위치의 아르기닌이 치환되고, 326번 위치의 아르기닌이 치환되고, 329번 위치의 글리신이 치환되고;
서열번호 5에 관하여, 48번 위치의 류신이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 314번 위치의 아르기닌이 치환되고, 317번 위치의 글리신이 치환되고;
서열번호 8에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 329번 위치의 글루탐산이 치환되고;
서열번호 11에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 324번 위치의 아르기닌이 치환되고, 327번 위치의 글루탐산이 치환되고;
서열번호 14에 관하여, 61번 위치의 글리신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 330번 위치의 글루탐산이 치환되고;
서열번호 17에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 158번 위치의 알라닌이 치환되고, 192번 위치의 아르기닌이 치환되고, 311번 위치의 아르기닌이 치환되고, 314번 위치의 글루탐산이 치환되고;
서열번호 20에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 프롤린이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 321번 위치의 쓰레오닌이 치환되고, 324번 위치의 글루탐산이 치환되고;
서열번호 23에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 325번 위치의 글루탐산이 치환되고;
서열번호 26에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 아르기닌이 치환되고, 325번 위치의 글루탐산이 치환되고;
서열번호 29에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 310번 위치의 아르기닌이 치환되고, 313번 위치의 글루탐산이 치환되고;
서열번호 32에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 35에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 38에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 41에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 44에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 309번 위치의 아르기닌이 치환되고, 312번 위치의 글루탐산이 치환되고;
서열번호 47에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다.
일부 실시태양에서, 서열번호 2, 8 또는 11의 61번 위치 또는 서열번호 5의 48번 위치에서 류신에 대한 상기 치환은 R 및 Q로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 170번 위치 또는 서열번호 5, 29 또는 44의 158번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 171번 위치에서 시스테인에 대한 상기 치환은 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 시스테인에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 8 또는 11의 171번 위치에서 타이로신에 대한 상기 치환은 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 17의 158번 위치 또는 서열번호 23 또는 26의 171번 위치에서 알라닌에 대한 상기 치환은 G, R, P, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 알라닌에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 20의 171번 위치에서 프롤린에 대한 상기 치환은 G, R, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 204번 위치 또는 서열번호 5, 17, 29 또는 44의 192번 위치 또는 서열번호 8, 11, 14, 20, 23, 26, 32, 35, 38, 41 또는 47의 205번 위치에서 아르기닌에 대한 상기 치환은 L 및 N으로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 326번 위치 또는 서열번호 5의 314번 위치 또는 서열번호 8 또는 14의 327번 위치 또는 서열번호 11의 324번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 321번 위치 또는 서열번호 23 또는 26의 322번 위치 또는 서열번호 29의 310번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 323번 위치 또는 서열번호 44의 309번 위치에서 아르기닌에 대한 상기 치환은 P, N 및 A로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 20의 321번 위치에서 쓰레오닌에 대한 상기 치환은 P, N 및 A로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2 또는 5의 329번 위치에서 글리신에 대한 상기 치환은 N, L, T 및 S로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 8 또는 14의 330번 위치 또는 서열번호 11의 327번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 324번 위치 또는 서열번호 23 또는 26의 325번 위치 또는 서열번호 29의 313번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 326번 위치 또는 서열번호 44의 312번 위치에서 글루탐산에 대한 상기 치환은 N, L, T 및 S로 이루어지는 그룹 중에서 선택된다.
추가의 실시태양에서, 본 발명은 상술한 바와 같이 치환되고 하기와 같이 추가로 치환된, 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며:
서열번호 2에 관하여 327번 위치의 글루타민이 치환되고;
서열번호 5에 관하여 315번 위치의 글루탐산이 치환되고;
서열번호 8에 관하여 328번 위치의 글루타민이 치환되고;
서열번호 11에 관하여 325번 위치의 글루타민이 치환되고;
서열번호 14에 관하여 328번 위치의 글루타민이 치환되고;
서열번호 17에 관하여 312번 위치의 글루타민이 치환되고;
서열번호 20에 관하여 322번 위치의 글루타민이 치환되고;
서열번호 23에 관하여 323번 위치의 글루타민이 치환되고;
서열번호 26에 관하여 323번 위치의 메티오닌이 치환되고;
서열번호 29에 관하여 311번 위치의 글루타민이 치환되고;
서열번호 32에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 35에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 38에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 41에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 44에 관하여 310번 위치의 글루타민이 치환되고;
서열번호 47에 관하여 324번 위치의 글루타민이 치환되고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다. 일부 실시태양에서, 글루타민 및 글루탐산의 상기 치환은 T, F, L 또는 M이다.
일부 실시태양에서, 본 발명은 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며, 이때:
서열번호 3에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 6에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 314는 P이고, 아미노산 위치 317은 N이고;
서열번호 9에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 12에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 A이고, 아미노산 위치 205는 L이고, 아미노산 위치 324는 P이고, 아미노산 위치 327은 N이고;
서열번호 15에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 328은 P이고, 아미노산 위치 331은 N이고;
서열번호 18에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 311은 P이고, 아미노산 위치 314는 N이고;
서열번호 21에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 P이고, 아미노산 위치 205는 L이고, 아미노산 위치 321은 A이고, 아미노산 위치 324는 N이고;
서열번호 24에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 A이고, 아미노산 위치 205는 L이고, 아미노산 위치 322는 A이고, 아미노산 위치 325는 N이고;
서열번호 27에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 30에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 310은 P이고, 아미노산 위치 313은 N이고;
서열번호 33에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326는 N이고;
서열번호 36에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 A이고, 아미노산 위치 326은 N이고;
서열번호 39에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326은 N이고;
서열번호 42에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 A이고, 아미노산 위치 326은 N이고;
서열번호 45에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 310은 A이고, 아미노산 위치 313은 N이고;
서열번호 48에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326은 N이고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다.
일부 실시태양에서, 상기 TdT 변이체에서, 서열번호 3에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 6에 관하여 아미노산 위치 315는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 9에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 12에 관하여 아미노산 위치 325는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 15에 관하여 아미노산 위치 329는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 18에 관하여 아미노산 위치 312는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 21에 관하여 아미노산 위치 322는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 24에 관하여 아미노산 위치 323은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 27에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 30에 관하여 아미노산 위치 311은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 33에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 36에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 39에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 42에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 45에 관하여 아미노산 위치 311은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 48에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택된다.
일부 실시태양에서, 본 발명은 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이다.
일부 실시태양에서, 각각의 상기 TdT 변이체에 관하여 일치성 퍼센트 값은 표시된 서열번호와 적어도 80%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 표시된 서열번호와 적어도 90%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 표시된 서열번호와 적어도 95%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 97%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 98%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 99%의 일치성이다. 본원에 사용된 바와 같이, 참소 서열과 변이체 서열을 비교하는 데 사용된 일치성 퍼센트 값은 상기 변이체 서열의 치환을 함유하는 명확히 명시된 아미노산 위치를 포함하지 않는다; 즉, 일치성 퍼센트 관계는 참조 단백질의 서열과 변이체 중의 치환을 함유하는 명확히 명시된 위치 밖의 변이체 단백질의 서열간의 관계이다. 따라서, 예를 들어 참조 서열 및 변이체 서열이 각각 100개 아미노산을 포함하고 상기 변이체 서열이 25번 및 81번 위치에 돌연변이를 갖는 경우, 상동성 퍼센트는 서열 1-24, 26-80 및 82-100에 관하여 있을 수 있다. 상기 (ii)에 관하여, 일부 실시태양에서, 상기와 같은 3'-O-변형된 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트, 3'-O-알릴-뉴클레오사이드 트라이포스페이트, 3'-O-(2-나이트로벤질)-뉴클레오사이드 트라이포스페이트, 3'-O-나이트로-뉴클레오사이드 트라이포스페이트 또는 3'-O-프로파길-뉴클레오사이드 트라이포스페이트를 포함할 수 있다. 다른 실시태양에서, 상기와 같은 3'-O-변형된 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트라이포스페이트 또는 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트를 포함할 수 있다.
본 발명은 또한 핵산 단편에 하나 이상의 3'-O-변형된 뉴클레오타디의 연속 첨가에 의해 주형 없이 핵산 분자를 합성하기 위한 본 발명의 TdT 변이체의 용도에 관한 것이다. 일부 실시태양에서, 이와 같은 방법은 (a) 유리 3'-하이드록실을 갖는 올리고뉴클레오타이드를 포함하는 개시제를 제공하는 단계; (b) 효소 연장 조건하에서 본 발명의 TdT 변이체를 상기 개시제 또는 연장된 개시제와 3'-O-가역적으로 차단된 뉴클레오사이드 트라이포스페이트 존재하에서 반응시키는 단계를 포함한다. 일부 실시태양에서, 이와 같은 방법은 (c) 상기 연장된 개시제를 차단해제(deblocking)하여 유리 3'-하이드록실을 갖는 연장된 개시제를 형성하는 단계 및 (d) 소정의 서열의 핵산 분자가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 추가로 포함한다.
추가의 실시태양에서, 본 발명은 상술한 변형 TdT를 암호화하는 핵산 분자, 이와 같은 핵산 분자를 포함하는 발현 벡터, 및 상기 언급한 핵산 분자 또는 상기 언급한 발현 벡터를 포함하는 숙주 세포를 포함한다. 더욱 추가의 실시태양에서, 본 발명은 본 발명의 변형 TdT의 생성 공정을 포함하며, 이때 숙주 세포를, 상기 변형 TdT를 암호화하는 핵산의 발현을 허용하는 배양 조건하에서 배양하고, 임의로 상기 변형 TdT를 회수한다. 본 발명은 또한 임의의 소정의 서열의 무-주형 폴리뉴클레오타이드 신장을 수행하기 위한 키트를 포함하며, 이때 상기 키트는 본 발명의 TdT 변이체를 포함한다. 이와 같은 키트는 DNA 신장을 위해서 A, C, G 및 T에 대해 3'-O-차단된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP), 또는 RNA 신장을 위해서 rA, rC, rG 및 U에 대해 3'-O-차단된 리보뉴클레오사이드 트라이포스페이트(rNTP)를 추가로 포함할 수 있다.
본 발명은 유리하게는, 3'-O-변형된 뉴클레오타이드를 야생형 TdT 또는 이전의 입수가능한 TdT 변이체보다 더 큰 효율 또는 더 높은 비율로 통합시키는 능력을 갖는 새로운 TdT 변이체를 제공함으로써 3'-O-변형된 뉴클레오사이드 트라이포스페이트의 효율적인 통합과 관련된 무-주형 효소 핵산 합성 분야의 문제점을 극복한다. 일부 실시태양에서, 본 발명은 또한 유리하게는, 야생형 TdT와 비교하여 증가된 안정성을 갖는 새로운 TdT 변이체를 제공함으로써 상기 분야의 문제점을 극복한다.
도 1은 본 발명의 TdT 변이체를 사용하는 무-주형 효소 핵산 합성 방법의 단계를 도식적으로 예시한다.
본 발명을 다양한 변형 및 대안 형태로 수행할 수 있지만, 그의 특징은 도면에 예로서 도시되었으며 상세히 기재될 것이다. 본 발명을 기재된 특정 실시태양으로 제한하고자 하지 않음을 알아야 한다. 본 발명의 진의 및 범위내에 있는 모든 변형, 균등물 및 대안을 포함하고자 한다. 본 발명의 태양에 대한 지침은 당업자에게 주지된 다수의 입수 가능한 참고문헌 및 교시, 예를 들어 문헌[Sambrook et al. (1989), Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory] 등에서 발견된다.
본 발명은 주형 가닥의 사용 없이 소정의 서열의 폴리뉴클레오타이드, 예를 들어 DNA 또는 RNA를 합성하는 데 사용될 수 있는 TdT 폴리머라제의 변이체를 제공한다. 본 발명의 TdT 변이체는 변형된 뉴클레오타이드, 및 보다 특히 3'O-가역적으로 차단된 뉴클레오사이드 트라이포스페이트를, 폴리뉴클레오타이드의 효소-기반 합성 방법에 사용할 수 있게 한다. 본 발명의 변이체를 특정 잔기(그의 위치는 명시된 서열번호에 관하여 지정된다)에서의 그의 돌연변이 또는 치환에 따라 기재한다.
본 발명의 TdT 변이체는 그의 BRCT-유사 N-말단 아미노산 서열이 없는 천연 TdT로부터 유래한다. 이와 같은 절두된 서열을 본원에서 때때로 "절두된 야생형" TdT라 칭한다. 보다 특히, 본 발명의 TdT 변이체는 하기의 천연 TdT로부터 유래한다:

명칭

NCBI
수납 번호

서열번호
B10 절두된 야생형 세리누스 카나리아
(Serinus canaria)
XP_030097130.1 2
B10 변이체 세리누스 카나리아 XP_030097130.1 3
B10 태그된 변이체 세리누스 카나리아 XP_030097130.1 4
B19 절두된 야생형 네오펠마 크리소세팔룸
(Neopelma chrysocephalum)
XP_027527888.1 5
B19 변이체 네오펠마 크리소세팔룸 XP_027527888.1 6
B19 태그된 변이체 네오펠마 크리소세팔룸 XP_027527888.1 7
B57 절두된 야생형 알리가토르 시넨시스
(Alligator sinensis)
XP_025069068.1 8
B57 변이체 알리가토르 시넨시스 XP_025069068.1 9
B57 태그된 변이체 알리가토르 시넨시스 XP_025069068.1 10
B59 절두된 야생형 제노푸스 라에비스
(Xenopus laevis)
AAI29712.1 11
B59 변이체 제노푸스 라에비스 AAI29712.1 12
B59 태그된 변이체 제노푸스 라에비스 AAI29712.1 13
B63 절두된 야생형 노테키스 스쿠타투스
(Notechis scutatus)
XP_026526500.1 14
B63 변이체 노테키스 스쿠타투스 XP_026526500.1 15
B63 태그된 변이체 노테키스 스쿠타투스 XP_026526500.1 16
F15 절두된 야생형 살모 트루탈
(Salmo truttal)
XP_029608991.1 17
F15 변이체 살모 트루탈 XP_029608991.1 18
F15 태그된 변이체 살모 트루탈 XP_029608991.1 19
F24 절두된 야생형 엘렉트로포루스 엘렉트리쿠스(Electrophorus electricus) XP_026869907.1 20
F24 변이체 엘렉트로포루스 엘렉트리쿠스 XP_026869907.1 21
F24 태그된 변이체 엘렉트로포루스 엘렉트리쿠스 XP_026869907.1 22
F32 절두된 야생형 아나바스 테스투디네우스
(Anabas testudineus)
XP_026209749.1 23
F32 변이체 아나바스 테스투디네우스 XP_026209749.1 24
F32 태그된 변이체 아나바스 테스투디네우스 XP_026209749.1 25
F57 절두된 야생형 포에실리아 레티쿨라타
(Poecilia reticulata)
XP_008428203.1 26
F57 변이체 포에실리아 레티쿨라타 XP_008428203.1 27
F57 태그된 변이체 포에실리아 레티쿨라타 XP_008428203.1 28
N100 절두된 야생형 라투스 노르베기쿠스
(Rattus norvegicus)
XP_ 001012479.1 29
N100 변이체 라투스 노르베기쿠스 XP_ 001012479.1 30
N100 태그된 변이체 라투스 노르베기쿠스 XP_ 001012479.1 31
N100or 절두된 야생형 라투스 노르베기쿠스
XP_ 001012479.1 32
N100or 변이체 라투스 노르베기쿠스
XP_ 001012479.1 33
N100or 태그된 변이체 라투스 노르베기쿠스
XP_ 001012479.1 34
N14 절두된 야생형 필리오콜로부스 테프로스셀레스(Piliocolobus tephrosceles) XP_023062037.1 35
N14 변이체 필리오콜로부스 테프로스셀레스 XP_023062037.1 36
N14 태그된 변이체 필리오콜로부스 테프로스셀레스 XP_023062037.1 37
N27 절두된 야생형 수스 스크로파
(Sus scrofa)
XP_003133204.1 38
N27 변이체 수스 스크로파 XP_003133204.1 39
N27 태그된 변이체 수스 스크로파 XP_003133204.1 40
N35 절두된 야생형 판테라 티그리스 알타이카
(Panthera tigris altaica)
XP_007080320.1 41
N35 변이체 판테라 티그리스 알타이카 XP_007080320.1 42
N35 태그된 변이체 판테라 티그리스 알타이카 XP_007080320.1 43
N72 절두된 야생형 부발루스 부발리스
(Bubalus bubalis)
XP_006061247.1 44
N72 변이체 부발루스 부발리스 XP_006061247.1 45
N72 태그된 변이체 부발루스 부발리스 XP_006061247.1 46
N93or 절두된 야생형 마르모타 플라비벤트리스
(Marmota flaviventris)
XP_027786017.1 47
N93or 변이체 마르모타 플라비벤트리스 XP_027786017.1 48
N93or 태그된 변이체 마르모타 플라비벤트리스 XP_027786017.1 49
일부 실시태양에서, TdT 변이체를 공유 또는 비-공유 결합; 아미노산 태그(예를 들어 폴리-아미노산 태그, 폴리-His 태그, 6His-태그); 화학적 화합물(예를 들어 폴리에틸렌 글리콜); 단백질-단백질 결합 쌍(예를 들어 비오틴-아비딘); 친화성 커플링; 포획 탐침; 또는 이들의 임의의 조합을 포함하는 링커 모이어티에 작동적으로 연결시킬 수 있다. 상기 링커 모이어티는 TdT 변이체와 별개이거나 그의 부분일 수 있다(예를 들어 재조합 His-태그된 폴리머라제, 예를 들어 하기 서열번호의 쌍에 의해 예시된다: (3,4), (6,7), (9,10), (12,13), (15,16), (18,19), (21,22), (24,25), (27,28), (30,31), (33,34), (36,37), (39,40), (42,43), (45,46) 및 (48,49)). 전형적으로, 상기 링커 모이어티는 뉴클레오타이드 결합 활성, 또는 TdT 변이체의 촉매 활성을 방해하지 않는다.
상술한 실시태양 중 일부에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 105%이고; 다른 실시태양에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 110%이고; 다른 실시태양에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 150%이다.
상술한 바와 같은 본 발명의 TdT 변이체는 각각 지정된 치환의 존재에 따라, 명시된 서열번호와 서열 일치성 퍼센트를 갖는 아미노산 서열을 포함한다. 일부 실시태양에서, 이러한 방식으로 기재된 본 발명의 TdT 변이체와 명시된 서열번호간의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입에 기인할 수 있으며, 상기 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시태양에서, 이와 같은 결실, 치환 및/또는 삽입은 단지 자연적으로 발생하는 아미노산을 포함한다. 일부 실시태양에서, 치환은 문헌[Grantham, Science, 185: 862-864 (1974)]에 기재된 바와 같은 보존적, 또는 아주 밀접한, 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 아주 밀접한 아미노산 세트의 구성원에서만 발생할 수 있다. 일부 실시태양에서, 사용될 수 있는 아주 밀접한 아미노산 세트를 하기 표 2A에 제시한다.
[표 2A]
Figure pct00001
일부 실시태양에서, 사용될 수 있는 아주 밀접한 아미노산 세트를 하기 표 2B에 제시한다.
[표 2B]
Figure pct00002
뉴클레오타이드 통합 활성의 측정
본 발명의 변이체에 의한 뉴클레오타이드 통합의 효율을 예를 들어 문헌[Boule et al](하기에 인용됨); 문헌[Bentolila et al](하기에 인용됨); 및 하이아트 등의 미국특허 제5808045호(이 중 후자는 본원에 참고로 인용된다)에 기재된 바와 같은 연장 또는 신장에 의해 측정할 수 있다. 간단히, 이와 같은 분석의 한 형태에서, 유리 3'-하이드록실을 갖는 형광 표지된 올리고뉴클레오타이드를 TdT 연장 조건 하에서, 가역적으로 차단된 뉴클레오사이드 트라이포스페이트의 존재 하에 소정의 지속기간 동안 시험하고자 하는 변형 TdT와 반응시키고, 그 후에 상기 연장 반응을 정지시키고 연장 생성물 및 연장되지 않은 개시제 올리고뉴클레오타이드의 양을 젤 전기영동에 의한 분리 후에 정량화한다. 이와 같은 분석에 의해, 변형 TdT의 통합 효율을 다른 변이체의 효율 또는 야생형 또는 참조 TdT, 또는 다른 폴리머라제의 효율에 쉽게 비교할 수 있다. 일부 실시태양에서, 변형 TdT 효율의 척도는 균등한 분석에서 야생형 TdT를 사용하여 연장된 생성물의 양에 대한, 변형 TdT를 사용하여 연장된 생성물의 양의 비(백분율로서 주어진다)일 수 있다.
일부 실시태양에서, 하기의 특정한 연장 분석을 사용하여 TdT의 통합 효율을 측정할 수 있다: 사용된 프라이머는 하기와 같다:
5'-AAAAAAAAAAAAAAGGGG-3'(서열번호 50)
상기 프라이머는 또한 5' 극단상에 ATTO 형광 염료를 갖는다. 사용된 전형적인 변형된 뉴클레오타이드(표 3에서 dNTP로서 나타냄)는 3'-O-아미노-2',3'-다이데옥시뉴클레오타이드-5'-트라이포스페이트(ONH2, 화이어버드 바이오사이언시즈(Firebird Biosciences)), 예를 들어 3'-O-아미노-2',3'-다이데옥시아데노신-5'-트라이포스페이트를 포함한다. 시험된 각각의 상이한 변이체에 대해서, 하나의 튜브만이 반응에 사용된다. 시약을, 물에서 출발하여 하기 표 3의 순서로 상기 튜브에 첨가한다. 37℃에서 30분 후에, 포름아미드(시그마(Sigma))를 첨가하여 반응을 정지시킨다.
연장 활성 분석 시약
시약 농도 부피
H2O - 12 ㎕
활성 완충액 10x 2 ㎕
dNTP 250 μM 2 ㎕
정제된 효소 20 μM 2 ㎕
형광 프라이머 500 nM 2 ㎕
상기 활성 완충액은 예를 들어 CoCl2가 보충된 TdT 반응 완충액(뉴잉글랜드 바이오랩스(New England Biolabs)로부터 입수할 수 있다)을 포함한다.
상기 분석의 생성물을 통상적인 폴리아크릴아미드 젤 전기영동에 의해 분석한다. 예를 들어, 상기 분석의 생성물을 16% 폴리아크릴아미드 변성 젤(바이오-래드(Bio-Rad))에서 분석할 수 있다. 젤을 유리 플레이트 내부에 폴리아크릴아미드를 부어 분석 직전에 제조하고 이를 중합되도록 둔다. 상기 유리 플레이트 내부의 젤을 전기영동 단계를 위해 TBE 완충액(시그마)이 채워진 개조 탱크상에 올려놓는다. 분석하고자 하는 샘플을 상기 젤의 상부에 로딩한다. 500 내지 2,000 V의 전압을 실온에서 3 내지 6시간 동안 상기 젤의 상부와 기부 사이에 인가한다. 분리 후에, 젤 형광을, 예를 들어 타이푼(Typhoon) 스캐너(GE 라이프 사이언시즈(GE Life Sciences))를 사용하여 스캐닝한다. 상기 젤 상을 ImageJ 소프트웨어(imagej.nih.gov/ij/), 또는 그의 균등물을 사용하여 분석하여, 변형된 뉴클레오타이드의 통합 백분율을 계산한다.
헤어핀 완료 분석. 하나의 태양에서, 본 발명은 폴리뉴클레오타이드(즉, "시험 폴리뉴클레오타이드")의 3' 단부에 dNTP를 통합시키는 TdT 변이체와 같은 폴리머라제의 능력을 측정하는 방법을 포함한다. 이러한 방법 중 하나는, 실질적으로 단일 가닥이지만 TdT 변이체와 같은 폴리머라제로 연장시, 단일 가닥 루프 및 이중 가닥 스템을 포함하는 안정한 헤어핀 구조를 형성하고, 이에 의해 상기 이중 가닥 폴리뉴클레오타이드의 존재에 의해 상기 3' 단부의 연장의 검출을 허용하는 반응 조건하에서 유리 3' 하이드록실을 갖는 시험 폴리뉴클레오타이드를 제공함을 포함한다. 상기 이중 가닥 구조는 다양한 방식, 예를 들어 비제한적으로 이중 가닥 구조에 삽입시 우선적으로 형광을 발하는 형광 염료, 연장된 폴리뉴클레오타이드상의 수용체(또는 공여체)와, 새로 형성된 헤어핀 스템과 트리플렉스를 형성하는 올리고뉴클레오타이드상의 공여체(또는 수용체)간의 형광 공명 에너지 전달(FRET), 시험 폴리뉴클레오타이드에 부착되고 헤어핀 형성시 FRET 근접하게 되는 FRET 수용체 및 공여체 등의 방식으로 검출될 수 있다. 일부 실시태양에서, 단일 뉴클레오타이드에 의한 연장 후 시험 폴리뉴클레오타이드의 스템 부분은 길이가 4 내지 6 염기쌍의 범위이고; 다른 실시태양에서, 이와 같은 스템 부분은 길이가 4 내지 5 염기쌍이며; 더욱 다른 실시태양에서, 이와 같은 스템 부분은 길이가 4 염기쌍이다. 일부 실시태양에서, 시험 폴리뉴클레오타이드는 길이가 10 내지 20 뉴클레오타이드의 범위이고; 다른 실시태양에서, 시험 폴리뉴클레오타이드는 12 내지 15 뉴클레오타이드 범위의 길이를 갖는다. 일부 실시태양에서, 시험 폴리뉴클레오타이드를, 연장이 없는 스템과 연장을 갖는 스템의 용융 온도간의 차이를 최대화하는 뉴클레오타이드로 연장시키는 것이 유리하거나 편리하며; 따라서, 일부 실시태양에서, 시험 폴리뉴클레오타이드를 dC 또는 dG로 연장시킨다(또, 상응하게, 스템 형성에 적합한 상보성 뉴클레오타이드를 갖는 시험 폴리뉴클레오타이드를 선택한다).
헤어핀 완료 분석을 위한 예시적인 시험 폴리뉴클레오타이드는 dGTP로 연장함으로써 완료되는 p875(5'-CAGTTAAAAACT)(서열번호 51); dCTP로 연장함으로써 완료되는 p876(5'-GAGTTAAAACT)(서열번호 52); 및 dGTP로 연장함으로써 완료되는 p877(5'-CAGCAAGGCT)(서열번호 53)를 포함한다. 이와 같은 시험 폴리뉴클레오타이드에 대한 예시적인 반응 조건은 2.5 내지 5 μM의 시험 폴리뉴클레오타이드, GelRed(등록상표)(바이오슘 인코포레이티드(Biotium, Inc., 미국 캘리포니아주 프레몬트 소재)로부터의 삽입 연료)의 1:4000 희석, 200 mM 카코딜레이트(Cacodylate) KOH pH 6.8, 1 mM CoCl2, 0-20%의 DMSO 및 목적하는 농도의 3' ONH2 dGTP 및 TdT를 포함할 수 있다. 상기 헤어핀의 완료를, 28-38℃의 반응 온도에서 360 ㎚로 설정된 여기 필터 및 635 ㎚로 설정된 방출 필터로, 통상적인 형광측정기, 예를 들어 TECAN 판독기를 사용하여 GelRed(등록상표) 염료의 형광의 증가에 의해 모니터링할 수 있다. 본 발명의 상기 태양의 일부 실시태양에서, TdT 변이체를 하기의 단계에 의해 뉴클레오사이드 트라이포스페이트의 무-주형 통합에 대한 그의 능력에 대해 시험할 수 있다: (a) 유리 3'-하이드록실을 갖는 시험 폴리뉴클레오타이드, TdT 변이체 및 뉴클레오사이드 트라이포스페이트를, 상기 시험 폴리뉴클레오타이드가 단일 가닥이지만 상기 뉴클레오사이드 트라이포스페이트의 통합시 이중 가닥 스템 영역을 갖는 헤어핀을 형성하는 조건하에서 결합시키는 단계, 및 (b) 상기 뉴클레오사이드 트라이포스페이트를 통합하는 상기 TdT 변이체의 능력의 척도로서, 상기 형성된 이중 가닥 스템 영역의 양을 검출하는 단계. 일부 실시태양에서, 상기 뉴클레오사이드 트라이포스페이트는 3'-O-차단된 뉴클레오사이드 트라이포스페이트이다.
올리고뉴클레오타이드의 무-주형 효소 합성
일반적으로, 무-주형(또는 균등하게, "주형-독립적인") 효소적 DNA 합성 방법은 도 1에 예시된 바와 같은 단계의 반복된 주기를 포함하며, 이때 소정의 뉴클레오타이드를 각 주기에서 개시제 또는 성장하는 쇄에 커플링시킨다. 무-주형 효소 합성의 일반적인 요소는 하기의 참고문헌에 기재되어 있다: 이버트 등의 국제 특허 공보 WO/2015/159023; 이버트 등의 국제 특허 공보 WO/2017/216472; 하이만(Hyman)의 미국특허 제5436143호; 하이아트 등의 미국특허 제5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)]; 문헌[Mathews et al, Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f (2016)]; 문헌[Schmitz et al, Organic Lett., 1(11): 1729-1731 (1999)].
예를 들어, 고체 지지체(102)(유리 3'-하이드록실기(103)를 갖는다)에 부착된 개시제 폴리뉴클레오타이드(100)를 제공한다. 상기 개시제 폴리뉴클레오타이드(100)(또는 후속 주기에서 신장된 개시제 폴리뉴클레오타이드)에, (104) 3'-O-보호된-dNTP 및 무-주형 폴리머라제, 예를 들어 TdT 또는 그의 변이체(예를 들어 이버트 등의 WO/2017/216472; 챔피온(Champion) 등의 WO2019/135007)를, 상기 개시제 폴리뉴클레오타이드(100)(또는 신장된 개시제 폴리뉴클레오타이드)의 3' 단부상에 상기 3'-O-보호된-dNTP의 효소적 통합에 유효한 조건 하에서 가한다. 이 반응은 3'-하이드록실이 보호된(106) 신장된 개시제 폴리뉴클레오타이드를 생성시킨다. 상기 신장된 서열이 완료되지 않은 경우, 또 다른 주기의 첨가를 실행한다(108). 상기 신장된 개시제 폴리뉴클레오타이드가 경쟁 서열을 함유하는 경우, 상기 3'-O-보호기를 제거하거나 탈보호할 수 있으며, 목적하는 서열을 원래의 개시제 폴리뉴클레오타이드(110)로부터 절단할 수 있다. 이와 같은 절단은 다양한 단일 가닥 절단 기법 중 어느 하나를 사용하여, 예를 들어 원래 개시제 폴리뉴클레오타이드 내의 소정의 위치에 절단가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단가능한 뉴클레오타이드는, 우라실 DNA 글리코실라제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 상기 신장된 개시제 폴리뉴클레오타이드가 완료된 서열을 함유하지 않는 경우, 3'-O-보호기를 제거하여 유리 3'-하이드록실(103)을 노출시키고 상기 신장된 개시제 폴리뉴클레오타이드에 또 다른 주기의 뉴클레오타이드 부가 및 탈보호를 가한다.
본원에 사용되는 바와 같이, 명시된 기, 예를 들어 뉴클레오타이드 또는 뉴클레오사이드의 3'-하이드록실과 관련하여 "보호된" 및 "차단된"이란 용어는 호환가능하게 사용되며, 화학 또는 효소 공정 동안 명시된 기에 대한 화학 변화를 방지하기 위해 상기 기에 모이어티를 공유적으로 부착시킴을 의미하고자 한다. 상기 명시된 기가 뉴클레오사이드 트라이포스페이트의 3'-하이드록실, 또는 3'-보호된(또는 차단된)-뉴클레오사이드 트라이포스페이트가 통합된 연장된 단편(또는 "연장 중간체")인 경우는 언제든, 상기 방지된 화학 변화는 효소 커플링 반응에 의한 상기 연장된 단편(또는 "연장 중간체")의 추가의 또는 후속적인 연장이다.
본원에 사용된 바와 같이, "개시제"(또는 균등한 용어, 예를 들어 "개시 단편", "개시제 핵산", "개시제 올리고뉴클레오타이드" 등)는 대개, 단부에 유리 3'-하이드록실을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭하며, 이는 무-주형 폴리머라제, 예를 들어 TdT에 의해 추가로 신장될 수 있다. 하나의 실시태양에서, 상기 개시 단편은 DNA 개시 단편이다. 대안의 실시태양에서, 상기 개시 단편은 RNA 개시 단편이다. 일부 실시태양에서, 개시 단편은 3 내지 100개 뉴클레오타이드, 특히 3 내지 20개 뉴클레오타이드를 갖는다. 일부 실시태양에서, 상기 개시 단편은 단일 가닥이다. 대안의 실시태양에서, 상기 개시 단편은 이중 가닥일 수 있다. 일부 실시태양에서, 개시제 올리고뉴클레오타이드를 그의 5' 단부에 의해 합성 지지체에 부착시킬 수 있고; 다른 실시태양에서, 개시제 올리고뉴클레오타이드를, 예를 들어 공유 결합을 통해 합성 지지체에 직접 부착되는 상보성 올리고뉴클레오타이드와 듀플렉스를 형성시킴으로써 상기 합성 지지체에 간접적으로 부착시킬 수도 있다. 일부 실시태양에서 합성 지지체는 고체 지지체이며, 이는 고형 평면 고체의 분리된 영역이거나, 비드일 수 있다.
일부 실시태양에서, 개시제는 TdT가 3'-O-보호된 dNTP에 커플링할 수 있는 유리 하이드록실을 갖는 비-핵산 화합물을 포함한다(예를 들어 바이가(Baiga)의 미국 특허 공보 US2019/0078065 및 US2019/0078126).
합성의 완료 후에, 목적하는 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드를 절단에 의해 개시제 및 고체 지지체로부터 방출시킬 수 있다. 광범위하게 다양한 절단가능한 연결 또는 절단가능한 뉴클레오타이드를 상기 목적을 위해 사용할 수 있다. 일부 실시태양에서, 목적하는 폴리뉴클레오타이드의 절단은 절단된 가닥상에 천연의 유리 5'-하이드록실을 남기지만; 대안의 실시태양에서, 절단 단계는 예를 들어 포스파타제 처리에 의해 후속 단계에서 제거될 수도 있는 모이어티, 예를 들어 5'-포스페이트를 남길 수 있다. 절단 단계를 화학적으로, 열적으로, 효소적으로, 또는 광화학적 방법에 의해 수행할 수 있다. 일부 실시태양에서, 절단가능한 뉴클레오타이드는 뉴클레오타이드 유사체, 예를 들어 데옥시유리딘 또는 8-옥소-데옥시구아노신일 수 있으며, 이들은 특이적인 글리코실라제(예를 들어 각각 우라실 데옥시글리코실라제에 이어서 엔도뉴클레아제 VIII, 및 8-옥소구아닌 DNA 글리코실라제)에 의해 인식된다. 일부 실시태양에서, 절단은 끝에서 두 번째 3' 뉴클레오타이드로서 데옥시이노신(이는 개시제의 3' 단부에서 엔도뉴클레아제 V에 의해 절단되어, 방출된 폴리뉴클레오타이드 상에 5'-포스페이트를 남길 수 있다)을 갖는 개시제를 제공함으로써 수행될 수 있다. 단일 가닥 폴리뉴클레오타이드를 절단하기 위한 추가의 방법은 참고로 인용된 하기의 참고문헌에 개시되어 있다: 미국특허 제5,739,386호, 미국특허 제5,700,642호 및 미국특허 제5,830,655호; 및 미국 특허 공보 2003/0186226 및 2004/0106728; 및 우르데아(Urdea)와 혼(Horn)의 미국특허 제5367066호.
일부 실시태양에서, 글리코실라제 및/또는 엔도뉴클레아제에 의한 절단은 이중 가닥 DNA 기질을 필요로 할 수 있다.
도 1을 참조하면, 일부 실시태양에서, 정렬된 순서의 뉴클레오타이드를 각각의 합성 단계에서 3'-O-보호된 dNTP의 존재 하에 무-주형 폴리머라제, 예를 들어 TdT를 사용하여 개시제 핵산에 커플링시킨다. 일부 실시태양에서, 올리고뉴클레오타이드의 합성 방법은 (a) 유리 3'-하이드록실(103)을 갖는 개시제(예를 들어 (100))를 제공하는 단계; (b) 연장 조건 하에서 유리 3'-하이드록실을 갖는 상기 개시제 또는 연장 중간체를, 3'-O-보호된 뉴클레오사이드 트라이포스페이트의 존재 하에 무-주형 폴리머라제와 반응시켜(104) 3'-O-보호된 연장 중간체(106)를 생성시키는 단계; (c) 상기 연장 중간체를 탈보호시켜 유리 3'-하이드록실을 갖는 연장 중간체를 생성시키는 단계; 및 (d) 폴리펩타이드가 합성될 때까지(110) 단계 (b) 및 (c)(108)를 반복하는 단계를 포함한다. (때때로 "연장 중간체" 및 "신장 단편"이란 용어는 호환가능하게 사용된다). 일부 실시태양에서, 개시제는, 예를 들어 5' 단부에 의해 고체 지지체에 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 반응 또는 연장 단계 후뿐만 아니라 탈-보호 단계 후에 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는 통합되지 않은 뉴클레오사이드 트라이포스페이트를, 예를 들어 세척에 의해, 소정의 배양 기간 또는 반응 시간 후에 제거하는 하위-단계를 포함할 수 있다. 이와 같은 소정의 배양 기간 또는 반응 시간은 수초, 예를 들어 30초 내지 수분, 예를 들어 30분일 수 있다.
합성 지지체상의 폴리뉴클레오타이드의 서열이 역 상보성 하위서열을 포함할 때, 상기 역 상보성 영역간에 수소 결합을 형성시켜 2차 분자-내 또는 분자-간 구조를 생성시킬 수 있다. 일부 실시태양에서, 환외(exocyclic) 아민에 대한 염기 보호 모이어티를, 상기 보호된 질소의 수소가 수소 결합에 참여할 수 없고, 이에 의해 상기와 같은 2차 구조의 형성이 방지되도록 선택한다. 즉, 염기 보호 모이어티를 사용하여, 예를 들어 뉴클레오사이드 A와 T 및 G와 C간의 통상적인 염기 짝짓기에서 형성되는 바와 같은 수소 결합의 형성을 방지할 수 있다. 합성의 끝에서, 상기 염기 보호 모이어티를 제거하고 폴리뉴클레오타이드 생성물을, 예를 들어 상기 생성물을 그의 개시제로부터 절단함으로써 고체 지지체로부터 절단할 수 있다.
염기 보호기를 갖는 3'-O-차단된 dNTP 단량체를 제공하는 것 외에, 신장 반응을 열 안정성 무-주형 폴리머라제를 사용하여 보다 높은 온도에서 수행할 수 있다. 예를 들어, 40℃ 초과에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용하거나; 일부 실시태양에서 40 내지 85℃ 범위에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용하거나; 일부 실시태양에서 40 내지 65℃ 범위에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용할 수 있다.
일부 실시태양에서, 신장 조건은 수소 결합 또는 염기 적층을 억제하는 용매를 신장 반응 혼합물에 첨가함을 포함할 수 있다. 이와 같은 용매는 낮은 유전 상수를 갖는 수 혼화성 용매, 예를 들어 다이메틸 설폭사이드(DMSO), 메탄올 등을 포함한다. 마찬가지로, 일부 실시태양에서, 신장 조건은 수소결합 억제제(chaotropic agent)의 제공을 포함할 수 있으며, 상기 억제제는 비제한적으로 n-부탄올, 에탄올, 구아니디늄 클로라이드, 리튬 퍼클로레이트, 리튬 아세테이트, 염화 마그네슘, 페놀, 2-프로판올, 나트륨 도데실 설페이트, 티오우레아, 우레아 등을 포함한다. 일부 실시태양에서, 신장 조건은 2차-구조-억제량의 DMSO의 존재를 포함한다. 일부 실시태양에서, 신장 조건은 2차 구조의 형성을 억제하는 DNA 결합 단백질의 제공을 포함할 수 있으며, 이때 상기와 같은 단백질은 비제한적으로 단일-가닥 결합 단백질, 헬리카제, DNA 글리콜라제 등을 포함한다.
염기 보호 없는 3'-O-차단된 dNTP를 상업적인 판매인으로부터 구입하거나 공개된 기법(예를 들어 미국특허 제7057026호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105(27): 9145-9150 (2008)]; 베너(Benner)의 미국특허 제7544794호 및 미국특허 제8212020호; 국제 특허 공보 WO2004/005667, WO91/06678; 문헌[Canard et al, Gene](본원에서 인용됨); 문헌[Metzker et al, Nucleic Acids Research, 22: 4259-4267 (1994)]; 문헌[Meng et al, J. Org. Chem., 14: 3248-3252 (3006)]; 미국 특허 공보 2005/037991)을 사용하여 합성할 수 있다. 염기 보호된 3'-O-차단된 dNTP를 하기에 기재된 바와 같이 합성할 수 있다.
염기-보호된 dNTP가 사용되는 경우, 상기 도 1의 방법은 염기 보호 모이어티를 제거하는 단계 (e)를 추가로 포함할 수 있으며, 아실 또는 아미딘 보호기의 경우에 (예를 들어) 농축된 암모니아로 처리함을 포함할 수 있다.
상기 방법은 또한 반응 또는 연장 단계 후뿐만 아니라 탈보호 단계 후에 캡핑 단계(들)뿐만 아니라 세척 단계를 포함할 수 있다. 상기에 언급한 바와 같이, 일부 실시태양에서 연장되지 않은 유리 3'-하이드록실을 캡핑 가닥의 임의의 추가적인 연장을 방지하는 화합물과 반응시키는 캡핑 단계를 포함할 수 있다. 일부 실시태양에서, 이와 같은 화합물은 다이데옥시뉴클레오사이드 트라이포스페이트일 수 있다. 다른 실시태양에서, 유리 3'-하이드록실을 갖는 연장되지 않은 가닥을, 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리하여 분해시킬 수 있다. 예를 들어 하이만의 미국특허 제5436143호를 참조하시오. 마찬가지로, 일부 실시태양에서 차단해제되지 못한 가닥을 처리하여 상기 가닥을 제거하거나 추가의 연장에 불활성이게 만들 수 있다.
일부 실시태양에서, 신장 단계(또한 때때로 연장 단계 또는 커플링 단계라 지칭된다)에 대한 반응 조건은 하기를 포함할 수 있으며: 2.0 μM 정제된 TdT; 125-600 μM 3'-O-차단된 dNTP(예를 들어 3'-O-NH2-차단된 dNTP); 약 10 내지 약 500 μM 칼륨 카코딜레이트 완충액(6.5 내지 7.5의 pH) 및 약 0.01 내지 약 10 μM의 2가 양이온(예를 들어 CoC12 또는 MnC12), 이때 상기 신장 반응을 RT 내지 45℃ 범위내의 온도에서 3분 동안 50 ㎕ 반응 부피로 수행할 수 있다. 실시태양에서, 3'-O-차단된 dNTP가 3'-O-NH2-차단된 dNTP인 경우, 차단해제 단계에 대한 반응 조건은 하기를 포함할 수 있으며: 700 mM NaNO2; 1 M 나트륨 아세테이트(아세트산으로 4.8 내지 6.5 범위의 pH로 조절된다), 이때 상기 차단해제 반응을 RT 내지 45℃ 범위내의 온도에서 3초 내지 수분 동안 50 ㎕ 부피로 수행할 수 있다. 세척을 커플링 반응 성분(예를 들어 효소, 단량체, 2가 양이온)이 없는 카코딜레이트 완충액으로 수행할 수 있다.
특정 용도에 따라, 차단해제 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건, 예를 들어 빛, 열, pH, 특정 시약, 예를 들어 명시된 화학 결합을 절단할 수 있는 효소를 포함할 수 있다. 3'-O-차단기 및 상응하는 차단-해제 조건을 선택하는 지침을 하기의 참고문헌(참고로 인용된다)에서 찾을 수 있다: 베너의 미국특허 제7544794호 및 미국특허 제8212020호; 미국특허 제5808045호; 미국특허 제8808988호; 국제 특허 공보 WO91/06678; 및 하기에 인용되는 참고문헌. 일부 실시태양에서, 절단제(또한 때때로 차단-해제 시약 또는 작용제로서 지칭된다)는 화학적 절단제, 예를 들어 다이티오쓰레이톨(DTT)이다. 대안의 실시태양에서, 절단제는 효소 절단제, 예를 들어 3'-포스페이트 차단기를 절단할 수 있는 포스파타제일 수 있다. 당업자는 차단해제제의 선택이, 사용되는 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다수의 차단기가 사용되는 지의 여부, 개시제가 살아있는 세포 또는 유기체 또는 고체 지지체에 부착되는 지의 여부 등(이들은 순한 처리를 필요로 한다)에 따라 변하는 것임을 알 것이다. 예를 들어, 포스핀, 예를 들어 트리스(2-카복시에틸)포스핀(TCEP)을 사용하여 3'O-아지도메틸기를 절단하거나, 팔라듐 복합체를 사용하여 3'O-알릴기를 절단하거나, 나트륨 나이트라이트를 사용하여 3'O-아미노기를 절단할 수 있다. 특정 실시태양에서, 절단 반응은 TCEP, 팔라듐 복합체 또는 나트륨 나이트라이트를 포함한다.
상기에 나타낸 바와 같이, 일부 실시태양에서 직각 차단-해제 조건을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직할 수 있다. 하기의 예시적인 차단기 쌍(표 4)을 나란한 합성 실시태양에 사용할 수 있다. 다른 차단기 쌍, 또는 2개를 초과하여 함유하는 기를 본 발명의 상기 실시태양에 사용하기 위해 입수할 수 있음이 이해된다.
예시적인 차단기 쌍
3'-O-NH2 3'-O-아지도메틸
3'-O-NH2 3'-O-알릴
3'-O-NH2 3'-O-포스페이트
3'-O-아지도메틸 3'-O-알릴
3'-O-아지도메틸 3'-O-포스페이트
3'-O-알릴 3'-O-포스페이트
살아있는 세포에서의 올리고뉴클레오타이드의 합성은 순한 차단해제 또는 탈보호 조건, 즉 세포막을 붕괴시키지 않거나, 단백질을 변성시키지 않거나, 핵심 세포 기능을 방해하지 않는 등의 조건을 요한다. 일부 실시태양에서, 탈보호 조건은 세포 생존과 양립성인 일련의 생리학적 조건내에 있다. 이와 같은 실시태양에서, 효소 탈보호가 바람직한 데, 그 이유는 상기 탈보호가 생리학적 조건 하에서 수행될 수 있기 때문이다. 일부 실시태양에서 특이적인 효소 제거가능한 차단기는 그의 제거에 특이적인 효소가 연관된다. 예를 들어, 에스테르- 또는 아실-계 차단기는 에스테라제, 예를 들어 아세틸에스테라제 등의 효소로 제거될 수 있고, 포스페이트 차단기는 3' 포스파타제, 예를 들어 T4 폴리뉴클레오타이드 키나제로 제거될 수 있다. 예로서, 3'-O-포스페이트를 100 mM 트리스-HCl(pH 6.5) 10 mM MgCl2, 5 mM 2-머캅토에탄올, 및 1 단위 T4 폴리뉴클레오타이드 키나제의 용액으로 처리하여 제거할 수 있다. 상기 반응은 37℃의 온도에서 1분간 진행된다.
"3'-포스페이트-차단된" 또는 "3'-포스페이트-보호된" 뉴클레오타이드는 3'-번 위치의 하이드록실기가 포스페이트 함유 모이어티의 존재에 의해 차단되는 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트-차단된 뉴클레오타이드의 예는 뉴클레오티딜-3'-포스페이트 모노에스테르/뉴클레오티딜-2',3'-사이클릭 포스페이트, 뉴클레오티딜-2'-포스페이트 모노에스테르 및 뉴클레오티딜-2' 또는 3'-알킬포스페이트 다이에스테르, 및 뉴클레오티딜-2' 또는 3'-피로포스페이트이다. 티오포스페이트 또는 이와 같은 화합물의 다른 유사체를 또한 사용할 수 있으나, 단 상기 치환은 포스파타제에 의해 유리 3'-OH를 생성시키는 탈인산화를 방지하지 않아야 한다.
3'-O-에스테르-보호된 dNTP 또는 3'-O-포스페이트-보호된 dNTP의 합성 및 효소 탈보호의 추가적인 예는 하기의 참고문헌에 기재되어 있다: Canard et al, Proc. Natl. Acad. Sci., 92:10859-10863 (1995); Canard et al, Gene, 148: 1-6 (1994); Cameron et al, Biochemistry, 16(23): 5120-5126 (1977); Rasolonjatovo et al, Nucleosides & Nucleotides, 18(4&5): 1021-1022 (1999); Ferrero et al, Monatshefte fur Chemie, 131: 585-616 (2000); Taunton-Rigby et al, J. Org. Chem., 38(5): 977-985 (1973); Uemura et al, Tetrahedron Lett., 30(29): 3819-3820 (1989); Becker et al, J. Biol. Chem., 242(5): 936-950 (1967); 첸(Tsien), 국제 특허 공보 WO1991/006678.
일부 실시태양에서, 변형된 뉴클레오타이드는 퓨린 또는 피리미딘 염기, 및 제거가능한 3'-OH 차단기가, 3' 탄소 원자가 하기 구조의 기에 부착되도록 공유적으로 부착된 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함한다:
-O-Z
이때 -Z는 -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" 및 -C(R')2-F 중 어느 하나이고, 이때 각각의 R"는 제거가능한 보호기이거나 그의 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도 기, 또는 연결기를 통해 부착된 검출가능한 표지이나; 단 일부 실시태양에서 이와 같은 치환체는 10개 이하의 탄소 원자 및/또는 5개 이하의 산소 또는 질소 헤테로원자를 갖거나; (R')2는 화학식 =C(R"')2의 기를 나타내고, 이때 각각의 R"'은 동일하거나 상이할 수 있으며 수소 및 할로겐 원자 및 알킬기를 포함하는 그룹 중에서 선택되나, 단 일부 실시태양에서 각각의 R"'의 알킬은 1 내지 3개의 탄소 원자를 갖고; 이때 상기 분자는 반응하여 중간체(이때 각각의 R"는 H로 교환되거나, Z가 -(R')2-F인 경우, F는 OH, SH 또는 NH2, 바람직하게는 OH로 교환된다)를 생성시키고, 상기 중간체는 수성 조건하에서 해리되어 유리 3'-OH를 갖는 분자를 제공하나; 단 Z가 -C(R')2-S-R"인 경우, 2개의 R' 기는 모두 H가 아니다. 특정한 실시태양에서, 상기 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이나, 단 이와 같은 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정한 실시태양에서, 상기 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')2-N3를 갖는다. 특정한 실시태양에서, Z는 아지도메틸 기이다.
일부 실시태양에서, Z는 200 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 일부 실시태양에서, Z는 200 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 200 이하의 분자량을 갖는 효소 절단가능한 에스테르기이다. 다른 실시태양에서, Z는 3'-포스포타제에 의해 절단가능한 포스페이트기이다. 일부 실시태양에서, 하기의 3'-포스파타제 중 하나 이상을 제조사의 권장 프로토콜과 함께 사용할 수 있다: T4 폴리뉴클레오타이드 키나제, 송아지 장 알칼리 포스파타제, 재조합 새우 알칼리 포스파타제(예를 들어 뉴잉글랜드 바이오랩스(미국 매사추세츠주 베벌리 소재)로부터 입수할 수 있다).
추가의 실시태양에서, 3'-차단된 뉴클레오타이드 트라이포스페이트는 3'-O-아지도메틸, 3'-OH-NH2 또는 3'-O-알릴기에 의해 차단된다. 다른 실시태양에서, 본 발명의 3'-O-차단기는 3'-O-메틸, 3'-O-(2-나이트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-3급-부톡시 에톡시, 3'-O-(2-시아노에틸), 3'-O-나이트로, 및 3'-O-프로파길을 포함한다. 다른 실시태양에서, 3'-차단된 뉴클레오타이드 트라이포스페이트는 3'-O-아지도메틸 또는 3'-O-NH2에 의해 차단된다. 이와 같은 3'-차단된 뉴클레오사이드 트라이포스페이트의 합성 및 용도는 하기 참고문헌에 개시되어 있다: 미국특허 제9410197호; 미국특허 제8808988호; 미국특허 제6664097호; 미국특허 제5744595호; 미국특허 제7544794호; 미국특허 제8034923호; 미국특허 제8212020호; 미국특허 제10472383호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105(27): 9145-9150 (2008)]; 및 유사 참고문헌.
일부 실시태양에서, 3'-O- 보호기는 전기화학적으로 불안정한 기이다. 즉, 보호기의 탈보호 또는 절단은 절단을 초래하는 보호기 부근의 전기화학적 조건을 변화시킴으로써 달성된다. 이러한 전기화학적 조건의 변화는 전압차 또는 빛과 같은 물리량을 변화시키거나 적용하여 보조 화학종을 활성화함으로써 야기될 수 있으며, 이는 차례로 pH의 증가 또는 감소와 같은, 보호기 부위에서의 전기화학적 조건의 변화를 야기한다. 일부 실시태양에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 소정의 값으로 변화될 때마다 절단되는 pH-민감성 보호기를 포함한다. 다른 실시태양에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변화될 때마다, 예를 들어 보호기의 부위에서 전압차를 증가 또는 감소시킴으로써 직접 절단되는 보호기를 포함한다.
변형 TdT의 생성
본 발명의 변이체는 공지된 참조 또는 야생형 TdT-암호화 폴리뉴클레오타이드를 돌연변이시킨 다음, 이를 통상적인 분자 생물학 기법을 사용하여 발현시킴으로써 생성될 수 있다. 예를 들어, 목적하는 유전자 또는 목적하는 서열의 폴리펩타이드를 암호화하는 DNA 단편을 통상적인 분자 생물학 기법을 사용하여, 예를 들어 문헌[Stemmer et al, Gene, 164: 49-53 (1995)]; 문헌[Kodumal et al, Proc. Natl. Acad. Sci., 101: 15573-15578 (2004)]; 등에 기재된 프로토콜을 사용하여 합성 단편으로부터 조립할 수 있거나, 이와 같은 유전자 또는 DNA 단편을 예를 들어 문헌[Boule et al, Mol. Biotechnology, 10: 199-208 (1998)], 또는 문헌[Bentolila et al, EMBO J., 14: 4221-4229 (1995)] 등에 기재된 통상적인 프로토콜을 사용하여 선택된 종의 세포로부터 직접 클로닝할 수 있다.
목적하는 TdT 변이체를 암호화하는 단리된 유전자를 pET32(노바겐(Novagen))와 같은 발현 벡터에 삽입하여 발현 벡터를 제공할 수 있으며, 이는 이후 통상적인 프로토콜을 사용하여 변형 TdT 단백질을 만들고 발현하는데 사용될 수 있다. 올바른 서열을 가진 벡터를 에스케리키아 콜라이 생산자 균주에서 형질전환시킬 수 있다.
형질전환된 균주를 통상적인 기법을 사용하여, TdT 단백질이 추출되는 펠렛으로 배양한다. 예를 들어, 미리 제조된 펠릿을 30 내지 37℃ 수욕에서 해동한다. 일단 완전히 해동되면, 펠릿을 50 mM 트리스-HCL(시그마) pH 7.5, 150 mM NaCl(시그마), 0.5 mM 머캅토에탄올(시그마), 5% 글리세롤(시그마), 20 mM 이미다졸(시그마) 및 프로테아제 칵테일 억제제(써모피셔(Thermofisher)) 100 ㎖ 1 탭으로 구성된 용해 완충액에 재현탁한다. 조기 용해 및 응집체의 잔류를 방지하기 위해 신중한 재현탁을 수행한다. 재현탁된 세포를 전체 색상 균일성이 획득될 때까지 여러 주기의 프렌치 프레스(French press)를 통해 용해시킨다. 사용되는 통상적인 압력은 14,000 psi이다. 이어서 용해물을 10,000 rpm에서 1시간 내지 1시간 30분 동안 원심분리한다. 원심분리물을 컬럼 정제 전에 임의의 찌꺼기를 제거하기 위해 0.2 ㎛ 필터에 통과시킨다.
TdT 단백질을 1-단계 친화성 과정으로 상기 원심분리물로부터 정제할 수 있다. 예를 들어, Ni-NTA 친화성 컬럼(GE 헬쓰케어(Healthcare))을 사용하여 TdT 폴리머라제를 결합시킬 수 있다. 초기에 컬럼을 세척하고 15 컬럼 부피의 50 mM 트리스-HCL(시그마) pH 7.5, 150 mM NaCl(시그마) 및 20 mM 이미다졸(시그마)로 평형화시킨다. TdT 폴리머라제를 평형화 후 컬럼에 결합시키고; 이어서, 예를 들어 50 mM 트리스-HCL(시그마) pH 7.5, 500 mM NaCl(시그마) 및 20 mM 이미다졸(시그마)로 구성된 세척 완충액을 15 컬럼 부피로 컬럼에 적용할 수 있다. 이러한 세척 후, TdT 폴리머라제를 50 mM 트리스-HCL(시그마) pH 7.5, 500 mM NaCl(시그마) 및 0.5 M 이미다졸(시그마)로 용출시킨다. 관심 TdT 폴리머라제의 최고 농도에 상응하는 분획을 수집하여 단일 샘플에 모았다. 상기 모은 분획을 투석 완충액(20 mM 트리스-HCl, pH 6.8, 200 mM NaCl, 50 mM MgOAc, 100 mM [NH4]2SO4)에 대해 투석시킨다. 후속적으로 투석물을 농축 필터(아미콘 울트라(Amicon Ultra)-30, 머크 밀리포어(Merk Millipore))를 사용하여 농축시킨다. 농축된 효소를 소량으로 나누고, 최종 50% 글리세롤을 첨가하고, 이어서 이들 분액을 -20℃에서 동결하여 장기간 보관한다. 5 ㎕의 다양한 정제된 효소 분획을 SDSPAGE 젤에서 분석한다.
일부 실시태양에서, TdT 변이체를, 공유 또는 비공유 결합; 아미노산 태그(예를 들어, 폴리-아미노산 태그, 폴리-His 태그, 6His-태그 등); 화합물(예를 들어, 폴리에틸렌 글리콜); 단백질-단백질 결합 쌍(예를 들어, 비오틴-아비딘); 친화성 커플링; 포획 탐침; 또는 이들의 임의의 조합을 포함하는 링커 모이어티에 작동가능하게 연결시킬 수 있다. 상기 링커 모이어티는 TdT 변이체와 분리되거나 TdT 변이체의 일부일 수 있다. 본 발명의 TdT 변이체와 함께 사용하기 위한 예시적인 His-태그는 MASSHHHHHHSSGSENLYFQTGSSG-(서열번호 54)이다. 상기 태그-링커 모이어티는 뉴클레오타이드 결합 활성, 또는 TdT 변이체의 촉매 활성을 방해하지 않는다.
상기 공정, 또는 균등한 공정은, 활성 및/또는 보존에 필요하거나 유용한 각종 시약, 예를 들어 염, pH 완충액, 담체 화합물 등과 혼합될 수 있는 단리된 TdT 변이체를 생성시킨다.
본 발명의 방법을 실행하기 위한 키트
본 발명은 본 발명의 방법을 실행하기 위한 다양한 키트를 포함한다. 하나의 태양에서, 본 발명의 키트는 본원에 기재된 바와 같은 무-주형 효소 폴리뉴클레오타이드 합성을 수행하기에 적합한 제형 중에 본 발명의 TdT 변이체를 포함한다. 이러한 키트는 또한 성장하는 가닥에 대한 3'-O-보호된 dNTP의 무-주형 첨가 또는 통합을 최적화하기 위한 반응 조건을 제공하는 합성 완충액을 포함할 수 있다. 일부 실시태양에서, 본 발명의 키트는 3'-O-가역적으로 보호된 dNTP를 추가로 포함한다. 이러한 실시태양에서, 3'-O-가역적으로 보호된 dNTP는 3'-O-아미노-dNTP 또는 3'-O-아지도메틸-dNTP를 포함할 수 있다. 추가 실시태양에서, 키트는 하기의 항목 중 하나 이상을 별도로 또는 함께 포함할 수 있다: (i) 본원에 기재된 바와 같은 탈보호 단계를 수행하기 위한 탈보호 시약, (ii) 개시제가 부착된 고체 지지체, (iii) 고체 지지체로부터 완료된 폴리뉴클레오타이드를 방출하기 위한 절단 시약, (iv) 효소 첨가 또는 커플링 단계의 끝에서 반응하지 않은 3'-O-보호된 dNTP를 제거하기 위한 세척 시약 또는 완충액, 및 (v) 합성-후 처리 시약, 예를 들어 정제 컬럼, 탈염 시약, 용출 시약 등. 일부 실시태양에서, 본 발명의 키트는 단일 작업으로 다중 합성 반응을 수행하기 위한 반응 웰의 배열을 포함할 수 있다. 일부 실시태양에서, 이러한 배열은 24-, 48-, 96-, 384- 또는 1536-웰을 포함하는 통상적인 필터 플레이트일 수 있다.
상기 (ii) 및 (iii) 항목과 관련하여, 특정 개시제 및 절단 시약은 함께 사용된다. 예를 들어, 이노신 절단가능한 뉴클레오타이드를 포함하는 개시제는 엔도뉴클레아제 V 절단 시약과 함께 제공될 수 있으며; 나이트로벤질 광절단성 링커를 포함하는 개시제는 광절단성 링커를 절단하기에 적합한 광원과 함께 제공될 수 있고; 우라실을 포함하는 개시제는 우라실 DNA 글리코실라제 절단 시약과 함께 제공될 수 있는 등이다.
실시예 1
TdT 변이체의 통합 활성 시험
표 5에 나열된 TdT 변이체는 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트 단량체를 사용하여 상술한 바와 같이 2개의 별도의 헤어핀 분석에서 정제 및 시험된 통상적인 기법을 사용하여 제조되었다. 분석에서 이들의 성능은 높은 통합률을 갖는 것으로 공지된 마우스-소 키메라 TdT(M57로 지정됨, 서열 번호 55)의 성능과 비교되었다.
명칭 서열번호 ㎎/㎖
발현
헤어핀 +G
(%M57)
헤어핀 +C
(%M57)
3'-OH
(부가 없음)
(%M57)
B10 4 2.3 34 36 25
B19 7 1.0 83 107 42
B57 10 0.8 34 91 62
B59 13 2.8 9 -73 -1
B63 16 2.8 21 162 41
F15 19 7.3 54 625 85
F24 22 5.0 25 324 85
F32 25 5.8 35 536 91
F57 28 0.4 15 172 24
N100 31 8.1 31 90 10
N100or 34 6.2 53 362 28
N14 37 2.8 69 510 96
N27 40 4.3 111 363 85
N35 43 2.8 70 480 101
N72 46 1.2 70 222 87
N93or 49 0.4 37 267 61
M57 55 8.9 100 100 100
데이터에서 볼 수 있는 바와 같이 TdT 변이체 중 다수는 표준 M57보다 훨씬 더 큰 결합 효율을 가지고 있다. 반응은 저 농도의 3' 말단 dNTP(20 μM) 존재 하에서 수행되었으며, 따라서 증가는 주로 특정 dNTP에 대한 보다 양호한 친화도에 기인한다. 발현 수준은 Ni-NTA(50 ㎖ 배양물에서 유래된, 총 300 ㎕)로부터 용출 후의 단백질 농도에 상응한다.
정의
아미노산은 하기의 명명법에 따라 1-문자 또는 3-문자 암호로 표시된다: A: 알라닌(Ala); C: 시스테인(Cys); D: 아스파트산(Asp); E: 글루탐산(Glu); F: 페닐알라닌(Phe); G: 글리신(Gly); H: 히스티딘(His); I: 이소류신(Ile); K: 리신(Lys); L: 류신(Leu); M: 메티오닌(Met); N: 아스파라진(Asn); P: 프롤린(Pro); Q: 글루타민(Gln); R: 아르기닌(Arg); S: 세린(Ser); T: 쓰레오닌(Thr); V: 발린(Val); W: 트립토판(Trp) 및 Y: 타이로신(Tyr).
치환된 잔기와 관련하여 "기능적으로 동등한"은 변형 TdT의 치환된 잔기가 서열번호 1과 상동성인 서열을 갖는 또 다른 TdT의 서열에서 잔기와 동일한 기능적 역할을 가짐을 의미한다. 기능적으로 동등한 잔기는 서열 정렬을 사용함으로써, 예를 들어 Mutalin 라인 정렬 소프트웨어(http://multalin.toulouse.inra.fr/multalin/multalin.html; 1988, Nucl. Acids Res., 16 (22), 25 10881-10890)를 사용함으로써 식별될 수 있다. 정렬 후에, 기능적으로 동등한 잔기는 고려되는 다른 서열상의 상동성 위치에 있다. 서열 정렬 및 기능적으로 동등한 잔기의 식별은 임의의 TdT와, 종-간을 포함한 그의 천연 변이체 사이에서 밝혀질 수 있다.
단백질과 관련하여 "단리된"은 자연 환경의 구성 요소 또는 이질적인 반응 혼합물에서 확인 및 단리 및/또는 회수된 화합물을 의미한다. 자연 환경 또는 반응 혼합물의 오염 성분은 단백질의 기능을 방해할 수 있는 물질이며, 효소, 호르몬, 및 다른 단백질성 또는 비단백질성 용질을 포함할 수 있다. 일부 실시태양에서, 본 발명의 단백질을 (1) 로우리법에 의해 측정된 바와 같이 95 중량% 초과의 단백질로, (2) 회전 컵 서열분석기의 사용에 의한 N-말단 또는 내부 아미노산 서열 중 적어도 15개의 잔기를 획득하기에 충분한 정도로, 또는 (3) 쿠마씨 블루 또는 바람직하게는 은 염료를 사용하여 환원 또는 비환원 조건하에서 SDS-PAGE에 의해 균일성으로 정제한다. 재조합 방법에 의해 제조시, 본 발명의 단리된 단백질은 상기 단백질의 자연 환경의 적어도 하나의 성분이 존재하지 않을 것이므로, 재조합 세포내 제자리에 본 발명의 단백질을 포함할 수 있다. 통상적으로, 본 발명의 단리된 단백질을 적어도 하나의 정제 단계에 의해 제조한다.
"키트"는 본 발명의 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 임의의 전달 시스템을 지칭한다. 반응 분석의 맥락에서, 이러한 전달 시스템은 반응 시약(예를 들어, 적합한 용기 중의 하나 이상의 TdT 변이체, 반응 완충액, 3'-O-보호된-dNTP, 탈보호 시약, 개시제가 부착된 고체 지지체 등) 및/또는 지지 물질(예를 들어, 완충액, 분석 수행을 위한 서면 지침 등)의 보관, 수송, 또는 하나의 위치에서 또 다른 위치로의 전달을 허용하는 시스템 및/또는 화합물을 포함한다. 예를 들어, 키트는 관련된 반응 시약 및/또는 지지 물질을 함유하는 하나 이상의 인클로저(예를 들어 상자)를 포함한다. 이와 같은 내용물을 의도된 수령인에게 함께 또는 별도로 전달할 수 있다. 예를 들어, 제1 용기는 합성 방법에 사용하기 위한 하나 이상의 TdT 변이체를 함유할 수 있는 반면, 제2 또는 추가의 용기는 탈보호제, 개시제, 3'-O-보호된 dNTP를 갖는 고체 지지체 등을 함유할 수 있다.
호환가능하게 사용되는 "돌연변이체" 또는 "변이체"는 본원에 기재된 천연 또는 참조 TdT 폴리펩타이드로부터 유래되고 하나 이상의 위치에 변형 또는 변경, 즉 치환, 삽입, 및/또는 결실을 포함하는 폴리펩타이드를 지칭한다. 변이체는 당해 분야에 주지된 다양한 기법에 의해 수득될 수 있다. 특히, 야생형 단백질을 암호화하는 DNA 서열의 변경 기법의 예는 비제한적으로, 부위-지향된 돌연변이유발, 랜덤 돌연변이유발, 서열 셔플링 및 합성 올리고뉴클레오타이드 구성을 포함한다. 돌연변이유발 활성은 단백질 또는 본 발명의 경우에 폴리머라제의 서열 중 하나 또는 다수 아미노산의 결실, 삽입 또는 치환이다. 치환을 표시하는 데 하기의 용어가 사용된다: L238A는 참조 또는 야생형 서열의 238번 위치의 아미노산 잔기(류신, L)가 알라닌(A)으로 변화된 것을 나타낸다. 132V/I/M은 모 서열의 132번 위치의 아미노산 잔기(알라닌, A)가 하기의 아미노산 중 하나로 치환된 것을 나타낸다: 발린(V), 이소류신(I), 또는 메티오닌(M). 치환은 보존적이거나 비-보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산(아르기닌, 리신 및 히스티딘), 산성 아미노산(글루탐산 및 아스파트산), 극성 아미노산(글루타민, 아스파라진 및 쓰레오닌), 소수성 아미노산(메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산(페닐알라닌, 트립토판 및 타이로신), 및 작은 아미노산(글리신, 알라닌 및 세린)의 그룹 내에 있다.
"서열 일치성"은 2개 서열, 예를 들어 2개 폴리펩타이드 서열 또는 2개 폴리뉴클레오타이드 서열간의 합치(예를 들어 일치하는 아미노산 잔기)의 수(또는 대개는 백분율로서 표현되는 분율)를 지칭한다. 서열 일치성은 서열 갭을 최소화하면서 중첩 및 일치성을 최대화하도록 정렬될 때 서열을 비교함으로써 결정된다. 특히, 서열 일치성은 2개의 서열의 길이에 따라 다수의 수학적 전역 또는 국소 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열은 바람직하게는, 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘(예를 들어, Needleman 및 Wunsch 알고리즘; 문헌[Needleman 및 Wunsch, 1970])을 사용하여 정렬되는 반면, 실질적으로 다른 길이의 서열은 바람직하게는 국소 정렬 알고리즘(예를 들어 Smith 및 Waterman 알고리즘(문헌[Smith and Waterman, 1981]) 또는 Altschul 알고리즘(문헌[Altschul et al., 1997]; 문헌[Altschul et al., 2005]))을 사용하여 정렬된다. 아미노산 서열 일치성 퍼센트를 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/과 같은 인터넷 웹 사이트에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에서 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본원의 목적을 위해, 아미노산 서열 일치성% 값은, 모든 검색 매개변수가 기본값으로 설정되어 있는 Needleman-Wunsch 알고리즘, 즉 채점 행렬 = BLOSUM62, 갭 개방 = 10, 갭 확장 = 0.5, 단부 갭 벌점 = 거짓, 단부 갭 개방 = 10 및 단부 갭 확장 = 0.5를 사용하여 두 서열의 최적 전역 정렬을 생성시키는 쌍별 서열 정렬 프로그램 EMBOSS Needle을 사용하여 생성시킨 값을 의미한다.
"폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"는 호환가능하게 사용되며, 각각은 뉴클레오타이드 단량체 또는 이의 유사체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭(Watson-Crick) 유형의 염기 짝짓기, 염기 적층, 후그스틴(Hoogsteen) 또는 역 후그스틴 유형의 염기 짝짓기 등과 같은 단량체 대 단량체 상호작용의 규칙적인 패턴을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이들의 뉴클레오사이드간 연결은 자연 발생적일 수 있거나 이의 유사체, 예를 들어 자연 발생 또는 비-자연 발생 유사체일 수 있다. 비-자연 발생 유사체는 PNA, 포스포로티오에이트 뉴클레오사이드간 연결, 형광단 또는 합텐과 같은 표지의 부착을 허용하는 연결기를 함유하는 염기 등을 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 폴리머라제에 의한 연장, 리가제에 의한 결찰 등과 같은 효소적 처리를 필요로 할 때마다, 당업자는 이러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 뉴클레오사이드간 연결, 당 모이어티, 또는 임의의 또는 일부 위치의 염기의 특정 유사체를 함유하지 않음을 이해할 것이다. 폴리뉴클레오타이드는 전형적으로, 대개 "올리고뉴클레오타이드"라고 지칭하는 경우 몇 개의 단량체 단위, 예를 들어 5-40개에서 수천 개의 단량체 단위까지 크기가 다양하다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 일련의 문자(대문자 또는 소문자)로 표시될 때마다, 상기 뉴클레오타이드는 왼쪽에서 오른쪽으로 5'->3' 순서이고, "A"는 데옥시아데노신을 나타내고, "C"는 데옥시시티딘을 나타내고, "G"는 데옥시구아노신을 나타내고, "T"는 티미딘을 나타내고, "I"는 데옥시이노신을 나타내고, "U"는 문맥에서 달리 나타내거나 명백하지 않는 한 우리딘을 나타냄을 알 것이다. 달리 명시되지 않는 한, 용어 및 원자 번호 지정 규칙은 문헌[Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999)]에 개시된 바를 따를 것이다. 대개 폴리뉴클레오타이드는 포스포다이에스테르 결합에 의해 연결된 4개의 천연 뉴클레오사이드(예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘 또는 RNA의 경우 리보스 대응물)를 포함하나, 이들은 또한 예를 들어 변형된 염기, 당, 또는 뉴클레오사이드간 연결을 포함하는 비-천연 뉴클레오타이드 유사체를 포함할 수 있다. 효소가 활성을 위한 특정 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요건, 예를 들어 단일 가닥 DNA, RNA/DNA 듀플렉스 등을 갖는 경우, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질에 대한 적합한 조성의 선택은 특히 문헌[Sambrook et al, Molecular Cloning, Second Edition (Cold Spring Harbor Laboratory, New York, 1989)]과 같은 논문의 지침 및 유사한 참고문헌을 통해 통상의 기술을 가진 사람의 지식 내에서 잘 이루어진다는 것은 당업자에게 명백하다. 마찬가지로, 올리고뉴클레오타이드 및 폴리뉴클레오타이드는 단일 가닥 형태 또는 이중 가닥 형태(즉, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 및 이의 각각의 보체의 듀플렉스)를 지칭할 수 있다. 어느 형태인지 또는 두 형태 모두가 용어 사용의 맥락에서 의도되었는지 여부는 당업자에게 명백할 것이다.
"프라이머"는 폴리뉴클레오타이드 주형과 듀플렉스를 형성할 때, 핵산 합성의 개시점으로 작용할 수 있고 주형을 따라 3' 단부에서 연장되어 연장된 듀플렉스를 형성시킬 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 프라이머의 연장은 대개 DNA 또는 RNA 폴리머라제와 같은 핵산 폴리머라제로 수행된다. 연장 과정에서 추가되는 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 폴리머라제에 의해 연장된다. 프라이머는 대개 14개 내지 40개 뉴클레오타이드 범위, 또는 18개 내지 36개 뉴클레오타이드 범위의 길이를 갖는다. 프라이머는 다양한 핵산 증폭 반응, 예를 들어 단일 프라이머를 사용하는 선형 증폭 반응 또는 둘 이상의 프라이머를 사용하는 폴리머라제 연쇄 반응에 사용된다. 특정 적용을 위한 프라이머의 길이와 서열을 선택하기 위한 지침은 참고로 포함되는 하기의 참고문헌에 의해 입증된 바와 같이 당업자에게 주지되어 있다: Dieffenbach, editor, PCR Primer: A Laboratory Manual, 2nd Edition (Cold Spring Harbor Press, New York, 2003).
"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, "치환"이라는 용어는 아미노산 잔기가, 자연-발생 표준 20개 아미노산 잔기, 희귀 자연 발생 아미노산 잔기(예를 들어, 하이드록시프롤린, 하이드록시리신, 알로하이드록시리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라진, 알로-이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린), 및 비-자연 발생 아미노산 잔기(종종, 합성적으로 제조된다)(예를 들어, 사이클로헥실-알라닌) 중에서 선택된 또 다른 것에 의해 교체됨을 지칭한다. 바람직하게는, "치환"이라는 용어는 아미노산 잔기의, 천연-발생 표준 20개 아미노산 잔기 중에서 선택된 또 다른 아미노산 잔기에 의한 교체를 지칭한다. "+" 기호는 대체 조합을 나타낸다.
본 개시내용은 제시된 특정 형태의 범위로 제한되도록 의도되지 않고, 여기에 설명된 변형의 대안, 변형 및 균등물을 포함하도록 의도된다. 또한, 본 개시내용의 범위는 본 개시내용의 관점에서 당업자에게 명백해질 수 있는 다른 변화를 완전히 포함한다. 본 발명의 범위는 첨부된 청구범위에 의해서만 제한된다.
SEQUENCE LISTING <110> DNA SCRIPT <120> TERMINAL DEOXYNUCLEOTIDYL TRANSFERASE VARIANTS AND USES THEREOF <130> B3257PC00 <140> PCT/EP2021/059861 <141> 2021-04-16 <150> EP 20170405.3 <151> 2020-04-20 <160> 55 <170> PatentIn version 3.5 <210> 1 <211> 510 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Wild type mouse TdT <400> 1 Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro 1 5 10 15 Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe 20 25 30 Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg 35 40 45 Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu 50 55 60 Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser 65 70 75 80 Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser 85 90 95 Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly 100 105 110 Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn 115 120 125 Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala 130 135 140 Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 145 150 155 160 Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala 165 170 175 Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met 180 185 190 Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met 195 200 205 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile 210 215 220 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val 225 230 235 240 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 245 250 255 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 260 265 270 Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met 275 280 285 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 290 295 300 Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 305 310 315 320 Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 325 330 335 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 340 345 350 Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe 355 360 365 Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr 370 375 380 Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His 385 390 395 400 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His 405 410 415 Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg 420 425 430 Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu 435 440 445 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 450 455 460 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg 465 470 475 480 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 485 490 495 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 500 505 510 <210> 2 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B10: trunc wt serinus canaria TdT <400> 2 Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala 1 5 10 15 Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile 65 70 75 80 Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile 85 90 95 Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu 100 105 110 Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val 115 120 125 Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu 130 135 140 Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly 145 150 155 160 Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala 165 170 175 Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro 180 185 190 Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile 195 200 205 Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp 210 215 220 Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu 225 230 235 240 Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu 245 250 255 Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala 260 265 270 Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr 275 280 285 Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg 340 345 350 Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B10 trunc new <400> 3 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala 50 55 60 Ser Leu Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp Ile 65 70 75 80 Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Glu 130 135 140 Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Val Thr Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Ile Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu 210 215 220 Asp Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln 245 250 255 Leu Pro Ser Arg Lys Val Asp Ala Met Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Ser Asn 275 280 285 Thr Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 408 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B10 <400> 4 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Val Thr Lys Val Ser Gln Tyr Ser 35 40 45 Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp 50 55 60 Ala Phe Glu Val Met Ala Glu Asn Tyr Glu Phe Lys Glu Asn Glu Glu 65 70 75 80 Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Leu Leu Lys Ser Leu Pro 85 90 95 Phe Pro Val Thr Arg Met Lys Asp Ile Gln Gly Leu Pro Cys Met Gly 100 105 110 Asp Gln Val Arg Arg Ile Ile Glu Glu Ile Ile Glu Glu Gly Glu Ser 115 120 125 Ser Arg Val Lys Glu Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Gln Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Tyr Arg Met Gly Leu Arg Thr Val Glu Glu Val Lys Ala Asp Lys Thr 165 170 175 Leu Lys Leu Ser Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile 195 200 205 Val Lys Asn Thr Val Val Thr Phe Leu Pro Asp Ala Leu Val Thr Ile 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Ile Asp Phe 225 230 235 240 Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp Glu Glu Leu Leu His Lys 245 250 255 Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile 260 265 270 Ile Glu Ser Thr Phe Val Lys Glu Gln Leu Pro Ser Arg Lys Val Asp 275 280 285 Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln 290 295 300 Pro Arg Val Asp Asn Ser Thr Ser Asn Thr Ser Lys Lys Leu Glu Met 305 310 315 320 Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 325 330 335 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala 340 345 350 Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Ser His Glu Arg Lys Met 355 360 365 Ile Leu Asp Asn His Ala Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu 370 375 380 Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 385 390 395 400 Val Glu Pro Trp Glu Arg Asn Ala 405 <210> 5 <211> 370 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B19 trunc wt (Neopelma chrysocephalum)(saffron-crested neopelma) <400> 5 Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala 20 25 30 Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu 35 40 45 Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met 50 55 60 Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg 115 120 125 Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser 145 150 155 160 Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser 165 170 175 Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly 195 200 205 Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys 210 215 220 Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val 225 230 235 240 Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln 245 250 255 Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser 260 265 270 Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp 275 280 285 Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala 290 295 300 Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu 305 310 315 320 Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly 325 330 335 Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu 340 345 350 Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg 355 360 365 Asn Ala 370 <210> 6 <211> 370 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B19 trunc new <400> 6 Ser Ser Val Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala 20 25 30 Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Phe Leu Pro Phe Pro Val Thr Arg Met 50 55 60 Lys Asp Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg 115 120 125 Thr Leu Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Ser 145 150 155 160 Lys Ala Glu Ala Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Val 165 170 175 Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Leu 180 185 190 Gly Lys Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly 195 200 205 Pro Arg Glu Asp Glu Glu Leu Leu His Lys Val Val Asp Leu Trp Lys 210 215 220 Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val 225 230 235 240 Lys Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln 245 250 255 Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser 260 265 270 Ser Tyr Asn Thr Ser Lys Lys Phe Asp Met Ala Glu Val Lys Asp Trp 275 280 285 Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala 290 295 300 Tyr Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu 305 310 315 320 Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn His Ala 325 330 335 Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu 340 345 350 Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Arg Glu Arg 355 360 365 Asn Ala 370 <210> 7 <211> 395 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B19 <400> 7 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Ser Val Ser Lys Val Ser 20 25 30 Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn Lys Lys 35 40 45 Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn Tyr Glu Phe Lys Glu 50 55 60 Asn Glu Ile Phe Cys Leu Glu Phe Arg Arg Ala Ala Ser Val Leu Lys 65 70 75 80 Phe Leu Pro Phe Pro Val Thr Arg Met Lys Asp Ile Gln Gly Leu Pro 85 90 95 Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu Glu Ile Ile Glu Glu 100 105 110 Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu Arg Tyr Lys 115 120 125 Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser 130 135 140 Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala 145 150 155 160 Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly Phe Leu Tyr 165 170 175 Tyr Glu Asp Leu Ala Glu Arg Val Ser Lys Ala Glu Ala Asp Ala Val 180 185 190 Ser Leu Ile Val Lys Asn Thr Val Val Thr Phe Leu Pro Asp Ala Leu 195 200 205 Val Thr Ile Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp 210 215 220 Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp Glu Glu Leu 225 230 235 240 Leu His Lys Val Val Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr 245 250 255 Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu Pro Ser Arg 260 265 270 Lys Val Asp Ala Met Asp Asn Phe Gln Lys Cys Phe Ala Ile Leu Lys 275 280 285 Leu Tyr Gln Pro Arg Val Asp Asn Ser Ser Tyr Asn Thr Ser Lys Lys 290 295 300 Phe Asp Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 305 310 315 320 Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr 325 330 335 Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 340 345 350 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Arg Arg Lys Arg 355 360 365 Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly 370 375 380 Leu Asp Tyr Val Glu Pro Arg Glu Arg Asn Ala 385 390 395 <210> 8 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B57 trunc wt (Alligator sinensis) <400> 8 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile 65 70 75 80 Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala 145 150 155 160 Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu 210 215 220 Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys 245 250 255 Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn 275 280 285 Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 9 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B57 trunc new <400> 9 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Met Asn Asp Ile 65 70 75 80 Gln Gly Leu Pro Trp Met Gly Asp Gln Val Lys Arg Val Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Glu Val Leu Asn Asp 100 105 110 Glu Lys Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Thr Lys Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Thr Pro Gly Pro Glu Glu 210 215 220 Glu Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Ile Ile Glu Ser Thr Phe Glu Lys Thr Lys 245 250 255 Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu His Lys Gln Arg Val Asp Asn Gly Asn Ser Asn 275 280 285 Gln Ser Lys Glu Phe Asp Lys Glu Glu Thr Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Arg Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 408 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B57 <400> 10 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Val Asp Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp 50 55 60 Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly 65 70 75 80 Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro 85 90 95 Phe Thr Ile Val Arg Met Asn Asp Ile Gln Gly Leu Pro Trp Met Gly 100 105 110 Asp Gln Val Lys Arg Val Ile Glu Glu Ile Leu Glu Glu Gly Glu Ser 115 120 125 Ser Lys Val Lys Glu Val Leu Asn Asp Glu Lys Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Thr 165 170 175 Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile 195 200 205 Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asp Ala Leu Val Thr Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Thr Pro Gly Pro Glu Glu Glu Glu Glu Leu Leu His Lys 245 250 255 Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp Ile 260 265 270 Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val Asp 275 280 285 Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Lys 290 295 300 Gln Arg Val Asp Asn Gly Asn Ser Asn Gln Ser Lys Glu Phe Asp Lys 305 310 315 320 Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 325 330 335 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala 340 345 350 Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met 355 360 365 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu 370 375 380 Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 385 390 395 400 Leu Glu Pro Trp Glu Arg Asn Ala 405 <210> 11 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B59 trunc wt (Xenopus laevis) <400> 11 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu 1 5 10 15 Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp 20 25 30 Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe 35 40 45 Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser 50 55 60 Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu 65 70 75 80 Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys 145 150 155 160 Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu 165 170 175 Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val 180 185 190 Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys 210 215 220 Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly 225 230 235 240 Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys 245 250 255 Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile 275 280 285 Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp 290 295 300 Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys 340 345 350 Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu 355 360 365 Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 12 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B59 trunc new <400> 12 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu 1 5 10 15 Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Gln Asp 20 25 30 Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Gly Pro Cys Val Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Val Ala Met Lys Asp Leu 65 70 75 80 Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Arg Ile Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Lys Ser Ser Lys Val Val Glu Val Met Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Ile Lys Ser Asp Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Ala 145 150 155 160 Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Ala Val Ser Lys Ala Glu 165 170 175 Ala Glu Ala Val Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val 180 185 190 Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Ile Leu Ile Thr Thr Pro Arg Lys Gly Glu 210 215 220 Lys Glu Glu Ile Leu His Lys Thr Ile Asn Val Leu Lys Lys Arg Gly 225 230 235 240 Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys 245 250 255 Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Thr Ile Leu Lys Leu Gln Lys Gln Gln Leu Asp Asn Gly Asn Ser Asn 275 280 285 Glu Pro Phe Glu Thr Glu Lys Lys Asn Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Ile Thr Pro Tyr Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Lys Arg Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Asn Ile Phe Leu Lys Ala Asn Ser Glu Glu Asp Ile Phe Thr His Leu 355 360 365 Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 13 <211> 405 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B59 <400> 13 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Glu Val Lys Val Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Gln Asp Thr Asn Arg Ile Phe Thr Asp 50 55 60 Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly 65 70 75 80 Pro Cys Val Ala Phe Arg Arg Ala Ser Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Pro Ile Val Ala Met Lys Asp Leu Glu Gly Leu Pro Trp Leu Gly 100 105 110 Asp Gln Met Lys Arg Ile Ile Glu Glu Ile Leu Glu Glu Gly Lys Ser 115 120 125 Ser Lys Val Val Glu Val Met Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Glu Ile Lys Ser Asp Lys Glu 165 170 175 Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Leu Leu Tyr Tyr Glu Asp 180 185 190 Ile Thr Ser Ala Val Ser Lys Ala Glu Ala Glu Ala Val Glu Gln Leu 195 200 205 Ile Lys Ser Ile Val Trp Lys Phe Val Pro Asp Ala Ile Val Thr Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Ile 225 230 235 240 Leu Ile Thr Thr Pro Arg Lys Gly Glu Lys Glu Glu Ile Leu His Lys 245 250 255 Thr Ile Asn Val Leu Lys Lys Arg Gly Leu Leu Leu Phe Tyr Asn Ile 260 265 270 Ile Glu Ser Thr Phe Asp Glu Thr Lys Leu Pro Ser Arg His Val Asp 275 280 285 Ala Leu Asp His Phe Gln Lys Cys Phe Thr Ile Leu Lys Leu Gln Lys 290 295 300 Gln Gln Leu Asp Asn Gly Asn Ser Asn Glu Pro Phe Glu Thr Glu Lys 305 310 315 320 Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Tyr Glu 325 330 335 Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn 340 345 350 Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Arg Met Met Leu Asp 355 360 365 Asn His Ala Leu Tyr Asp Lys Thr Lys Asn Ile Phe Leu Lys Ala Asn 370 375 380 Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu Asp Tyr Leu Glu Pro 385 390 395 400 Trp Glu Arg Asn Ala 405 <210> 14 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B63 trunc wt (Notechis scutatus) <400> 14 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn 20 25 30 Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala 50 55 60 Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile 65 70 75 80 Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu 180 185 190 Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln 210 215 220 Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys 245 250 255 Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val 275 280 285 Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe 355 360 365 Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 15 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B63 trunc new <400> 15 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Ser Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Val Asn Asp Ile 65 70 75 80 Glu Gly Leu Pro Trp Met Gly Glu Gln Val Lys Arg Ile Ile Glu Asp 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asn 100 105 110 Glu Asn Tyr Arg Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Asp Lys Asn Leu Lys Leu Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu His Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Ala Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu 180 185 190 Pro Asn Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln 210 215 220 Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Leu Trp Lys Lys Gln 225 230 235 240 Gly Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Lys Thr 245 250 255 Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys 260 265 270 Phe Ala Ile Leu Lys Leu His Lys Glu Arg Val Asp Lys Gly Asn Ser 275 280 285 Ile Gln Ser Lys Ala Phe Ala Glu Glu Glu Thr Lys Asp Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Val Thr Pro Phe Glu Gln Tyr Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg 325 330 335 Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 16 <211> 409 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B63 <400> 16 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Val Asp Ser Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp 50 55 60 Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly 65 70 75 80 Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro 85 90 95 Phe Thr Ile Val Arg Val Asn Asp Ile Glu Gly Leu Pro Trp Met Gly 100 105 110 Glu Gln Val Lys Arg Ile Ile Glu Asp Ile Leu Glu Glu Gly Glu Ser 115 120 125 Ser Lys Val Lys Ala Val Leu Asn Asn Glu Asn Tyr Arg Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Asn 165 170 175 Leu Lys Leu Thr Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp 180 185 190 Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile 195 200 205 Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asn Ala Leu Val Thr Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Val Pro Gly Ser Arg Gln Glu Glu Glu Glu Leu Leu His 245 250 255 Thr Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp 260 265 270 Leu Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val 275 280 285 Asp Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His 290 295 300 Lys Glu Arg Val Asp Lys Gly Asn Ser Ile Gln Ser Lys Ala Phe Ala 305 310 315 320 Glu Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Val 325 330 335 Thr Pro Phe Glu Gln Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser 340 345 350 Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys 355 360 365 Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe 370 375 380 Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp 385 390 395 400 Tyr Leu Glu Pro Trp Glu Arg Asn Ala 405 <210> 17 <211> 367 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F15 trunc wt (Salmo truttal) <400> 17 Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr 1 5 10 15 Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala 20 25 30 Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu 50 55 60 Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val 65 70 75 80 Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val 85 90 95 Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg 115 120 125 Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met 130 135 140 Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser 145 150 155 160 Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His 165 170 175 Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu 195 200 205 Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg 210 215 220 Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp 225 230 235 240 Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu 245 250 255 Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp 260 265 270 Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val 275 280 285 Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu 290 295 300 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe 305 310 315 320 Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp 325 330 335 Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe 340 345 350 Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala 355 360 365 <210> 18 <211> 367 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F15 trunc new <400> 18 Ser Ser Val Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Met Glu Asn His Asn Lys Ile Phe Thr Asp Ala Phe Glu Val Leu Ala 20 25 30 Glu Asn Ser Glu Phe Asn Glu Ser Lys Glu Ser Arg Asp Ala Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val Arg Ser Leu 50 55 60 Gly Asp Thr Glu Gly Leu Pro Cys Leu Gly Glu His Thr Lys Arg Val 65 70 75 80 Ile Glu Glu Ile Leu Glu Tyr Gly Arg Ser Ser Lys Val Glu Asp Ile 85 90 95 Leu Ser Asp Glu Arg Tyr Gln Thr Met Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg 115 120 125 Ser Leu Glu Glu Val Arg Ala Glu Pro Ser Ile His Leu Asn Arg Met 130 135 140 Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Arg Val Ser 145 150 155 160 Lys Ala Glu Ala Lys Ala Leu Gly Asn Ile Ile Glu Glu Thr Val His 165 170 175 Ala Ile Ala Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Leu 180 185 190 Gly Lys Glu Phe Gly His Asp Val Asp Phe Ile Leu Thr Thr Pro Glu 195 200 205 Met Gly Lys Glu Glu Gly Leu Leu Pro Arg Val Ile Asp Arg Leu Arg 210 215 220 Asn Gln Gly Ile Leu Leu Tyr Cys Asp Tyr Gln Glu Ser Thr Phe Asp 225 230 235 240 Met Ser Lys Leu Pro Ser Arg Thr Phe Glu Ala Met Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Ile Lys Leu Lys Glu Gly Leu Val Glu Gly Glu 260 265 270 Gly Gly Leu Gln Ser Asp Pro Gly Asp Arg Arg Gly Trp Arg Ala Val 275 280 285 Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Ala Leu 290 295 300 Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Phe 305 310 315 320 Ala Arg Leu Glu Arg Arg Met Leu Leu Asp Asn His Ala Leu Tyr Asp 325 330 335 Lys Thr Lys Lys Ile Phe Leu Pro Ala Lys Thr Glu Glu Asp Ile Phe 340 345 350 Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 355 360 365 <210> 19 <211> 392 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F15 <400> 19 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Ser Val Ala Thr Val Ser 20 25 30 Gln Tyr Ala Cys Gln Arg Arg Thr Thr Met Glu Asn His Asn Lys Ile 35 40 45 Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Ser Glu Phe Asn Glu 50 55 60 Ser Lys Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys 65 70 75 80 Ser Leu Pro Ser Ala Val Arg Ser Leu Gly Asp Thr Glu Gly Leu Pro 85 90 95 Cys Leu Gly Glu His Thr Lys Arg Val Ile Glu Glu Ile Leu Glu Tyr 100 105 110 Gly Arg Ser Ser Lys Val Glu Asp Ile Leu Ser Asp Glu Arg Tyr Gln 115 120 125 Thr Met Lys Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala 130 135 140 Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Leu Glu Glu Val Arg Ala 145 150 155 160 Glu Pro Ser Ile His Leu Asn Arg Met Gln Arg Ala Gly Phe Leu Tyr 165 170 175 Tyr Arg Asp Ile Ser Lys Arg Val Ser Lys Ala Glu Ala Lys Ala Leu 180 185 190 Gly Asn Ile Ile Glu Glu Thr Val His Ala Ile Ala Pro Asp Ala Ile 195 200 205 Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp 210 215 220 Val Asp Phe Ile Leu Thr Thr Pro Glu Met Gly Lys Glu Glu Gly Leu 225 230 235 240 Leu Pro Arg Val Ile Asp Arg Leu Arg Asn Gln Gly Ile Leu Leu Tyr 245 250 255 Cys Asp Tyr Gln Glu Ser Thr Phe Asp Met Ser Lys Leu Pro Ser Arg 260 265 270 Thr Phe Glu Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Ile Lys 275 280 285 Leu Lys Glu Gly Leu Val Glu Gly Glu Gly Gly Leu Gln Ser Asp Pro 290 295 300 Gly Asp Arg Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val Ala Pro 305 310 315 320 Pro Val Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro 325 330 335 Gln Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg Met 340 345 350 Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu 355 360 365 Pro Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Glu Tyr 370 375 380 Ile Glu Pro Trp Gln Arg Asn Ala 385 390 <210> 20 <211> 377 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F24 trunc wt (Electrophorus electricus) <400> 20 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu 1 5 10 15 Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn 20 25 30 His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr 35 40 45 Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met 65 70 75 80 Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu 85 90 95 Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp 100 105 110 Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu 130 135 140 Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu 165 170 175 Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser 180 185 190 Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys 210 215 220 Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys 245 250 255 Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe 260 265 270 Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp 275 280 285 Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val 290 295 300 Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser 305 310 315 320 Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg 325 330 335 Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe 340 345 350 Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp 355 360 365 Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 21 <211> 377 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F24 trunc new <400> 21 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu 1 5 10 15 Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn 20 25 30 His Asn Lys Ile Phe Thr Asp Ala Leu Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Ser Asp Ser Lys Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Thr Pro Leu Arg Ser Leu Gln Asp Thr 65 70 75 80 Glu Gly Leu Pro Cys Leu Gly Glu Glu Thr Lys Arg Val Ile Glu Glu 85 90 95 Ile Phe Glu Glu Gly Ser Ser Ser Arg Val Glu Asp Ile Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Leu Glu 130 135 140 Gln Val Arg Ser Asp Pro Ser Ile His Leu Asn Arg Met Gln Thr Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Lys Ala Glu 165 170 175 Ala Lys Ala Leu Gly Asn Ile Ile Glu Glu Thr Ala Ser Ala Phe Ser 180 185 190 Pro Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Leu Leu Thr Val Pro Glu Pro Gly Lys 210 215 220 Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Ser Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Phe Gln Glu Ser Thr Phe Asp Leu Ser Lys 245 250 255 Leu Pro Ser Arg Arg Phe Glu Ala Met Asp His Phe Gln Lys Cys Phe 260 265 270 Leu Ile Val Lys Leu Lys Ala Gly Leu Val Glu Gly Glu Gly Ala Asp 275 280 285 Pro Gly Asp Arg Arg Asp Trp Arg Ala Val Arg Val Asp Leu Val Ala 290 295 300 Pro Pro Val Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser 305 310 315 320 Ala Phe Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Gly 325 330 335 Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe 340 345 350 Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp 355 360 365 Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 22 <211> 402 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F24 <400> 22 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Leu Pro Thr Val Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asp Asn His Asn Lys Ile Phe Thr Asp 50 55 60 Ala Leu Glu Val Leu Ala Glu Asn Tyr Glu Phe Ser Asp Ser Lys Glu 65 70 75 80 Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Thr Pro Leu Arg Ser Leu Gln Asp Thr Glu Gly Leu Pro Cys Leu Gly 100 105 110 Glu Glu Thr Lys Arg Val Ile Glu Glu Ile Phe Glu Glu Gly Ser Ser 115 120 125 Ser Arg Val Glu Asp Ile Leu Ser Asp Glu Arg Tyr Gln Thr Leu Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala Glu Lys Trp 145 150 155 160 Tyr Arg Arg Gly Leu Arg Ser Leu Glu Gln Val Arg Ser Asp Pro Ser 165 170 175 Ile His Leu Asn Arg Met Gln Thr Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Ile Ser Lys Pro Val Ser Lys Ala Glu Ala Lys Ala Leu Gly Asn Ile 195 200 205 Ile Glu Glu Thr Ala Ser Ala Phe Ser Pro Ser Val Thr Ile Thr Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp Val Asp Phe 225 230 235 240 Leu Leu Thr Val Pro Glu Pro Gly Lys Glu Asp Gly Leu Leu Pro Ala 245 250 255 Val Ile Asp Arg Leu Arg Ser Gln Gly Ile Leu Leu Tyr Ser Asp Phe 260 265 270 Gln Glu Ser Thr Phe Asp Leu Ser Lys Leu Pro Ser Arg Arg Phe Glu 275 280 285 Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Val Lys Leu Lys Ala 290 295 300 Gly Leu Val Glu Gly Glu Gly Ala Asp Pro Gly Asp Arg Arg Asp Trp 305 310 315 320 Arg Ala Val Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala 325 330 335 Phe Ala Leu Leu Gly Trp Ser Gly Ser Ala Phe Phe Asn Arg Asp Leu 340 345 350 Arg Arg Phe Ala Arg Leu Glu Arg Gly Met Leu Leu Asp Asn His Ala 355 360 365 Leu Tyr Asp Lys Thr Thr Asn Thr Phe Leu Gln Ala Lys Thr Glu Glu 370 375 380 Asp Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Gln Arg 385 390 395 400 Asn Ala <210> 23 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F32 trunc wt (Anabas testudineus) <400> 23 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn 20 25 30 Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr 35 40 45 Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr 65 70 75 80 Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu 85 90 95 Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr 180 185 190 Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys 210 215 220 Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser 275 280 285 Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln 325 330 335 His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 24 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F32 trunc new <400> 24 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn 20 25 30 Asn Asn Lys Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr 35 40 45 Glu Phe Asn Glu Met Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Ser Leu Gly Ala Thr 65 70 75 80 Gln Asp Leu Pro Cys Leu Gly Glu His Thr Lys Arg Val Met Glu Glu 85 90 95 Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Glu 130 135 140 Asp Ile Arg Ala Glu Pro Ser Ile His Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr 180 185 190 Pro Asp Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Leu Gly Lys 210 215 220 Glu Glu Ser Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Lys Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Tyr Gln Ala Ser Thr Phe Asp Met Ser Lys 245 250 255 Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Gln Val Glu Gly Gly Leu Asn Ser 275 280 285 Ala Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Met Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Met Glu Arg 325 330 335 Arg Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Ala Ala Thr Thr Glu Lys Asp Ile Phe Ala His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 25 <211> 403 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F32 <400> 25 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Val Ala Thr Val Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Thr Glu Asn Asn Asn Lys Ile Phe Thr Asp 50 55 60 Ala Phe Glu Val Leu Ala Glu Ser Tyr Glu Phe Asn Glu Met Glu Glu 65 70 75 80 Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Trp Ala Val Gln Ser Leu Gly Ala Thr Gln Asp Leu Pro Cys Leu Gly 100 105 110 Glu His Thr Lys Arg Val Met Glu Glu Ile Leu Gln Tyr Gly Arg Ser 115 120 125 Phe Glu Val Glu Lys Ile Leu Ser Asp Glu Arg Tyr Gln Thr Leu Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala Glu Lys Trp 145 150 155 160 Tyr Arg Arg Gly Leu Arg Ser Phe Glu Asp Ile Arg Ala Glu Pro Ser 165 170 175 Ile His Leu Asn Arg Met Gln Gln Ser Gly Phe Leu His Tyr Gly Asp 180 185 190 Ile Ser Arg Ala Val Ser Lys Ala Glu Ala Arg Ala Leu Gly Asn Ile 195 200 205 Ile Asp Glu Ala Val His Ala Ile Thr Pro Asp Ala Ile Leu Ala Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp Val Asp Phe 225 230 235 240 Ile Val Thr Thr Pro Glu Leu Gly Lys Glu Glu Ser Leu Leu Pro Asn 245 250 255 Ile Ile Asp Arg Leu Lys Lys Gln Gly Ile Leu Leu Tyr Ser Asp Tyr 260 265 270 Gln Ala Ser Thr Phe Asp Met Ser Lys Leu Pro Ser His Arg Phe Glu 275 280 285 Ala Met Asp His Phe Ala Lys Cys Phe Leu Ile Leu Arg Leu Glu Gly 290 295 300 Ser Gln Val Glu Gly Gly Leu Asn Ser Ala Glu Gly Asp Ser Arg Gly 305 310 315 320 Trp Arg Ala Val Arg Val Asp Leu Val Ser Pro Pro Met Asp Arg Tyr 325 330 335 Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp 340 345 350 Leu Arg Arg Phe Ala Arg Met Glu Arg Arg Met Leu Leu Asp Asn His 355 360 365 Ala Leu Tyr Asp Lys Thr Lys Lys Glu Phe Leu Ala Ala Thr Thr Glu 370 375 380 Lys Asp Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Trp Gln 385 390 395 400 Arg Asn Ala <210> 26 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F57 trunc wt <400> 26 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn 20 25 30 Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr 65 70 75 80 Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu 85 90 95 Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr 180 185 190 Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys 210 215 220 Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg 275 280 285 Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg 325 330 335 Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 27 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F57 trunc new (Poecilia reticulate) <400> 27 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Met Asn Asp Ile 65 70 75 80 Gln Gly Leu Pro Trp Met Gly Asp Gln Val Lys Arg Val Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Glu Val Leu Asn Asp 100 105 110 Glu Lys Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Thr Lys Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Thr Pro Gly Pro Glu Glu 210 215 220 Glu Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Ile Ile Glu Ser Thr Phe Glu Lys Thr Lys 245 250 255 Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu His Lys Gln Arg Val Asp Asn Gly Asn Ser Asn 275 280 285 Gln Ser Lys Glu Phe Asp Lys Glu Glu Thr Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Arg Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 28 <211> 408 <212> PRT <213> ARTIFICIAL SEQUNECE <220> <223> F57 <400> 28 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ser Val Asp Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp 50 55 60 Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly 65 70 75 80 Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro 85 90 95 Phe Thr Ile Val Arg Met Asn Asp Ile Gln Gly Leu Pro Trp Met Gly 100 105 110 Asp Gln Val Lys Arg Val Ile Glu Glu Ile Leu Glu Glu Gly Glu Ser 115 120 125 Ser Lys Val Lys Glu Val Leu Asn Asp Glu Lys Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Thr 165 170 175 Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile 195 200 205 Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asp Ala Leu Val Thr Leu 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Thr Pro Gly Pro Glu Glu Glu Glu Glu Leu Leu His Lys 245 250 255 Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp Ile 260 265 270 Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val Asp 275 280 285 Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Lys 290 295 300 Gln Arg Val Asp Asn Gly Asn Ser Asn Gln Ser Lys Glu Phe Asp Lys 305 310 315 320 Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 325 330 335 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala 340 345 350 Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met 355 360 365 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu 370 375 380 Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 385 390 395 400 Leu Glu Pro Trp Glu Arg Asn Ala 405 <210> 29 <211> 366 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100 trunc wt (short Rattus norvegicus) <400> 29 Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala 20 25 30 Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met 50 55 60 Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 165 170 175 Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 195 200 205 Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe 210 215 220 Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr 225 230 235 240 Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His 245 250 255 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg 260 265 270 Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg 275 280 285 Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu 290 295 300 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 305 310 315 320 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 325 330 335 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 340 345 350 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 30 <211> 366 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100 trunc new <400> 30 Ser Val Val Gln Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Leu Asn Asn His Asn Glu Val Phe Thr Arg Ala Phe Asp Ile Leu Ala 20 25 30 Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg 35 40 45 Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile Ser Met 50 55 60 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Thr Leu Glu Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr Gln Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Asn 145 150 155 160 Arg Ala Glu Ala Glu Ala Ile Glu Met Leu Val Lys Glu Ala Val Val 165 170 175 Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu 180 185 190 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 195 200 205 Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe 210 215 220 Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr 225 230 235 240 Phe Glu Lys Phe Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His 245 250 255 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gly Arg Val Val 260 265 270 Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg 275 280 285 Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu 290 295 300 Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala 305 310 315 320 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 325 330 335 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 340 345 350 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 31 <211> 391 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100 <400> 31 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Val Val Gln Lys Ile Ser 20 25 30 Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn His Asn Glu Val 35 40 45 Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu 50 55 60 Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser Ser Val Leu Lys 65 70 75 80 Ser Leu Pro Phe Pro Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro 85 90 95 Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp 100 105 110 Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys 115 120 125 Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala 130 135 140 Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Lys Ser 145 150 155 160 Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr 165 170 175 Tyr Glu Asp Leu Ala Glu Arg Val Asn Arg Ala Glu Ala Glu Ala Ile 180 185 190 Glu Met Leu Val Lys Glu Ala Val Val Ala Phe Leu Pro Asp Ala Leu 195 200 205 Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met Thr Gly His Asp 210 215 220 Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln 225 230 235 240 Gln Leu Leu His Lys Val Thr Asp Phe Trp Arg Gln Gln Gly Leu Leu 245 250 255 Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro 260 265 270 Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile 275 280 285 Leu Lys Leu His His Gly Arg Val Val Ser Glu Lys Ser Gly Gln Gln 290 295 300 Glu Gly Lys Gly Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro 305 310 315 320 Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Phe 325 330 335 Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met 340 345 350 Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu 355 360 365 Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile 370 375 380 Glu Pro Trp Glu Arg Asn Ala 385 390 <210> 32 <211> 379 <212> PRT <213> ARTIFICIAL SEQUNECE <220> <223> N100or trunk wt (long Rattus norvegicus) <400> 32 Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln 225 230 235 240 Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys 245 250 255 Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu 275 280 285 Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 33 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100or trunc new <400> 33 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val 1 5 10 15 Gln Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn Glu Leu Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Asn Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln 225 230 235 240 Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys 245 250 255 Phe Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu 275 280 285 Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 34 <211> 404 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100or <400> 34 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Val Val Gln Lys Ile Ser Glu Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn His Asn Glu Leu Phe Thr Arg 50 55 60 Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu 65 70 75 80 Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Ser 85 90 95 Phe Pro Ile Val Ser Met Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly 100 105 110 Asp Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser 165 170 175 Leu Arg Phe Thr His Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Arg Val Asn Arg Ala Glu Ala Glu Ala Val Ser Met Leu 195 200 205 Val Lys Glu Ala Val Val Ala Phe Leu Pro Asp Ala Leu Val Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Met Thr Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu 245 250 255 His Lys Val Thr Asn Phe Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys 260 265 270 Asp Ile Ile Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Thr 275 280 285 Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 290 295 300 His Arg Gly Leu Val Arg Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys 305 310 315 320 Asp Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 325 330 335 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg 340 345 350 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn 355 360 365 His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala Glu Ser 370 375 380 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 385 390 395 400 Glu Arg Asn Ala <210> 35 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N14 trunc wt (Piliocolobus tephrosceles) <400> 35 Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln 275 280 285 Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 36 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N14 trunc new <400> 36 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Ile Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Ser 35 40 45 Glu Phe Arg Glu Asn Glu Asp Ser Tyr Val Thr Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Arg Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Gly Ser Asp Gln 275 280 285 Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 37 <211> 404 <212> PRT <213> ARTIFICIAL SEQUNECE <220> <223> N14 <400> 37 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Val Val Gln Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg 50 55 60 Ala Phe Asp Ile Leu Ala Glu Asn Ser Glu Phe Arg Glu Asn Glu Asp 65 70 75 80 Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly 100 105 110 Ser Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Val Arg Ser Asp Glu Ser 165 170 175 Leu Lys Phe Thr Arg Met Gln Arg Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu 195 200 205 Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln Gln Leu Leu 245 250 255 Gln Lys Val Met Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr 260 265 270 Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Arg Leu Pro Ser Arg Thr 275 280 285 Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Phe Lys Leu 290 295 300 Pro Leu Gln Arg Val Gly Ser Asp Gln Ser Ser Trp Gln Glu Gly Lys 305 310 315 320 Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 325 330 335 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg 340 345 350 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn 355 360 365 His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser 370 375 380 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 385 390 395 400 Glu Arg Asn Ala <210> 38 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 trunc wt (Sus scrofa) <400> 38 Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg 225 230 235 240 Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys 245 250 255 Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met 275 280 285 Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 39 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 trunc new <400> 39 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Ile Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys 275 280 285 Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 40 <211> 404 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 <400> 40 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg 50 55 60 Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu 65 70 75 80 Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly 100 105 110 Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Thr 165 170 175 Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu 195 200 205 Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Pro Gly Ser Thr Glu Glu Glu Glu Gln Gln Leu Leu 245 250 255 His Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr 260 265 270 Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Thr 275 280 285 Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 290 295 300 His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys 305 310 315 320 Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 325 330 335 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg 340 345 350 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn 355 360 365 His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser 370 375 380 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 385 390 395 400 Glu Arg Asn Ala <210> 41 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N35 trunc wt (Panthera tigris altaica) <400> 41 Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val 1 5 10 15 Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg 225 230 235 240 Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys 275 280 285 Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 42 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N35 trunc new <400> 42 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Arg 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys 275 280 285 Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 43 <211> 410 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N35 <400> 43 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg 50 55 60 Ala Phe Glu Val Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu 65 70 75 80 Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly 100 105 110 Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Thr 165 170 175 Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Ala Glu Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu 195 200 205 Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Pro Gly Ser Thr Glu Glu Glu Glu Gln Gln Leu Leu 245 250 255 Pro Lys Val Ile Asn Leu Trp Glu Arg Lys Gly Leu Leu Leu Tyr Tyr 260 265 270 Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys 275 280 285 Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 290 295 300 His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys 305 310 315 320 Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 325 330 335 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg 340 345 350 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn 355 360 365 His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser 370 375 380 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 385 390 395 400 Glu Arg Asn Ala Ala Ala Ala Ile Gly Cys 405 410 <210> 44 <211> 365 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N72 trunc wt (Bubalus bubalis) <400> 44 Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 20 25 30 Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met 50 55 60 Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 165 170 175 Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly 195 200 205 Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 210 215 220 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 225 230 235 240 Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe 245 250 255 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser 260 265 270 Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 275 280 285 Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly 290 295 300 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr 305 310 315 320 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 325 330 335 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 340 345 350 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 45 <211> 366 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N72 trunc new <400> 45 Ser Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Ile Leu Ala 20 25 30 Glu Asn Tyr Glu Phe Lys Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met 50 55 60 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Ser Leu Glu Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 165 170 175 Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu 180 185 190 Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly 195 200 205 Ser Thr Glu Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Leu 210 215 220 Trp Glu Arg Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr 225 230 235 240 Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Ala Leu Asp His 245 250 255 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly 260 265 270 Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg 275 280 285 Val Asp Leu Val Met Cys Pro Tyr Glu Gln Arg Ala Phe Ala Leu Leu 290 295 300 Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala 305 310 315 320 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 325 330 335 Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala 340 345 350 His Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn Ala 355 360 365 <210> 46 <211> 391 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N72 <400> 46 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Val Val Lys Lys Ile Ser 20 25 30 Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile 35 40 45 Phe Thr Arg Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Lys Glu 50 55 60 Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys 65 70 75 80 Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro 85 90 95 Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp 100 105 110 Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln 115 120 125 Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser 130 135 140 Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Glu Lys Ile Arg Ser 145 150 155 160 Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr 165 170 175 Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val 180 185 190 Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe 195 200 205 Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp 210 215 220 Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln 225 230 235 240 Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Arg Lys Gly Leu Leu 245 250 255 Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro 260 265 270 Ser Arg Gln Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile 275 280 285 Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln 290 295 300 Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro 305 310 315 320 Tyr Glu Gln Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe 325 330 335 Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met 340 345 350 Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys 355 360 365 Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile 370 375 380 Glu Pro Arg Glu Arg Asn Ala 385 390 <210> 47 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or trunc wt (Marmota flaviventris) <400> 47 Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val 1 5 10 15 Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys 275 280 285 Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 48 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or trunc new <400> 48 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ala Val 1 5 10 15 Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Ser Val Val Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Asn 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys 275 280 285 Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn Ala 370 375 <210> 49 <211> 404 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or <400> 49 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Val Pro Ala Pro Ala Val Gln Thr Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Arg Val Phe Thr Asp 50 55 60 Ala Phe Asp Val Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu 65 70 75 80 Ser Ser Val Val Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Thr Ile Ile Ser Met Arg Asp Leu Glu Gly Ile Pro Cys Leu Glu 100 105 110 Gly Lys Ala Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser 165 170 175 Leu Lys Phe Thr His Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu 195 200 205 Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Ile Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Asn Ile Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Ala Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu 245 250 255 His Lys Val Thr Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Cys 260 265 270 Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Thr 275 280 285 Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 290 295 300 His His Gln Arg Val Asp Ser Asp Lys Ala Ser Gln Gln Gly Gly Lys 305 310 315 320 Asn Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 325 330 335 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg 340 345 350 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn 355 360 365 His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser 370 375 380 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Arg 385 390 395 400 Glu Arg Asn Ala <210> 50 <211> 18 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> PRIMER <400> 50 aaaaaaaaaa aaaagggg 18 <210> 51 <211> 12 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> PRIMER <400> 51 cagttaaaaa ct 12 <210> 52 <211> 11 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> PRIMER <400> 52 gagttaaaac t 11 <210> 53 <211> 10 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> PRIMER <400> 53 cagcaaggct 10 <210> 54 <211> 25 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> affinity tag for purifying TdT variants <400> 54 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly 20 25 <210> 55 <211> 403 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> M57 (with affinity tag) <400> 55 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly 20 25 30 Ser Gln Asn Ala Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala 35 40 45 Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Leu Phe Thr Arg 50 55 60 Ala Leu Asp Ile Leu Ala Glu Asn Asp Glu Phe Arg Glu Asn Glu Glu 65 70 75 80 Ser Arg Asp Ala Phe Arg Arg Ala Ser Ser Val Leu Lys Ser Leu Pro 85 90 95 Phe Pro Ile Thr Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly 100 105 110 Asp Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser 115 120 125 Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys 130 135 140 Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala Glu Lys Trp 145 150 155 160 Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser 165 170 175 Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp 180 185 190 Leu Val Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu 195 200 205 Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met 210 215 220 Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe 225 230 235 240 Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro 245 250 255 Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp 260 265 270 Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val 275 280 285 Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His 290 295 300 His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr 305 310 315 320 Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg 325 330 335 Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp 340 345 350 Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His 355 360 365 Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu 370 375 380 Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu 385 390 395 400 Arg Asn Ala

Claims (12)

  1. 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체로서,
    서열번호 2에 관하여, 61번 위치의 류신이 치환되고, 170번 위치의 시스테인이 치환되고, 204번 위치의 아르기닌이 치환되고, 326번 위치의 아르기닌이 치환되고, 329번 위치의 글리신이 치환되고;
    서열번호 5에 관하여, 48번 위치의 류신이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 314번 위치의 아르기닌이 치환되고, 317번 위치의 글리신이 치환되고;
    서열번호 8에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 329번 위치의 글루탐산이 치환되고;
    서열번호 11에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 324번 위치의 아르기닌이 치환되고, 327번 위치의 글루탐산이 치환되고;
    서열번호 14에 관하여, 61번 위치의 글리신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 330번 위치의 글루탐산이 치환되고;
    서열번호 17에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 158번 위치의 알라닌이 치환되고, 192번 위치의 아르기닌이 치환되고, 311번 위치의 아르기닌이 치환되고, 314번 위치의 글루탐산이 치환되고;
    서열번호 20에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 프롤린이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 321번 위치의 쓰레오닌이 치환되고, 324번 위치의 글루탐산이 치환되고;
    서열번호 23에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 325번 위치의 글루탐산이 치환되고;
    서열번호 26에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 아르기닌이 치환되고, 325번 위치의 글루탐산이 치환되고;
    서열번호 29에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 310번 위치의 아르기닌이 치환되고, 313번 위치의 글루탐산이 치환되고;
    서열번호 32에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
    서열번호 35에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
    서열번호 38에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
    서열번호 41에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
    서열번호 44에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 309번 위치의 아르기닌이 치환되고, 312번 위치의 글루탐산이 치환되고;
    서열번호 47에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
    이때 상기 TdT 변이체가 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, TdT 변이체.
  2. 제1항에 있어서,
    서열번호 2, 8 또는 11의 61번 위치 또는 서열번호 5의 48번 위치에서 류신에 대한 치환이 R 및 Q로 이루어지는 그룹 중에서 선택되고,
    서열번호 2의 170번 위치 또는 서열번호 5, 29 또는 44의 158번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 171번 위치에서 시스테인에 대한 치환이 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 시스테인에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
    서열번호 8 또는 11의 171번 위치에서 타이로신에 대한 치환이 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
    서열번호 17의 158번 위치 또는 서열번호 23 또는 26의 171번 위치에서 알라닌에 대한 치환이 G, R, P, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 알라닌에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
    서열번호 20의 171번 위치에서 프롤린에 대한 치환이 G, R, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
    서열번호 2의 204번 위치 또는 서열번호 5, 17, 29 또는 44의 192번 위치 또는 서열번호 8, 11, 14, 20, 23, 26, 32, 35, 38, 41 또는 47의 205번 위치에서 아르기닌에 대한 치환이 L 및 N으로 이루어지는 그룹 중에서 선택되고;
    서열번호 2의 326번 위치 또는 서열번호 5의 314번 위치 또는 서열번호 8 또는 14의 327번 위치 또는 서열번호 11의 324번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 321번 위치 또는 서열번호 23 또는 26의 322번 위치 또는 서열번호 29의 310번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 323번 위치 또는 서열번호 44의 309번 위치에서 아르기닌에 대한 치환이 P, N 및 A로 이루어지는 그룹 중에서 선택되고;
    서열번호 20의 321번 위치에서 쓰레오닌에 대한 치환이 P, N 및 A로 이루어지는 그룹 중에서 선택되고;
    서열번호 2 또는 5의 329번 위치에서 글리신에 대한 치환이 N, L, T 및 S로 이루어지는 그룹 중에서 선택되고;
    서열번호 8 또는 14의 330번 위치 또는 서열번호 11의 327번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 324번 위치 또는 서열번호 23 또는 26의 325번 위치 또는 서열번호 29의 313번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 326번 위치 또는 서열번호 44의 312번 위치에서 글루탐산에 대한 치환이 N, L, T 및 S로 이루어지는 그룹 중에서 선택되는,
    TdT 변이체.
  3. 제1항 또는 제2항에 있어서,
    서열번호 2에 관하여, 327번 위치의 글루타민이 치환되고;
    서열번호 5에 관하여, 315번 위치의 글루탐산이 치환되고;
    서열번호 8에 관하여, 328번 위치의 글루타민이 치환되고;
    서열번호 11에 관하여, 325번 위치의 글루타민이 치환되고;
    서열번호 14에 관하여, 328번 위치의 글루타민이 치환되고;
    서열번호 17에 관하여, 312번 위치의 글루타민이 치환되고;
    서열번호 20에 관하여, 322번 위치의 글루타민이 치환되고;
    서열번호 23에 관하여, 323번 위치의 글루타민이 치환되고;
    서열번호 26에 관하여, 323번 위치의 메티오닌이 치환되고;
    서열번호 29에 관하여, 311번 위치의 글루타민이 치환되고;
    서열번호 32에 관하여, 324번 위치의 글루타민이 치환되고;
    서열번호 35에 관하여, 324번 위치의 글루타민이 치환되고;
    서열번호 38에 관하여, 324번 위치의 글루타민이 치환되고;
    서열번호 41에 관하여, 324번 위치의 글루타민이 치환되고;
    서열번호 44에 관하여, 310번 위치의 글루타민이 치환되고;
    서열번호 47에 관하여, 324번 위치의 글루타민이 치환되는,
    TdT 변이체.
  4. 제3항에 있어서,
    글루타민이 T, F, L, M, I, V 및 Y로 이루어지는 그룹 중에서 선택된 아미노산으로 치환되는, TdT 변이체.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    3'-O-변형된 뉴클레오타이드가 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-2'-데옥시뉴클레오사이드 트라이포스페이트 및 3'-O-알릴-2'-데옥시뉴클레오사이드 트라이포스페이트로 이루어지는 그룹 중에서 선택되는, TdT 변이체.
  6. 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체로서,
    서열번호 3에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
    서열번호 6에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 314가 P이고, 아미노산 위치 317이 N이고;
    서열번호 9에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
    서열번호 12에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 A이고, 아미노산 위치 205가 L이고, 아미노산 위치 324가 P이고, 아미노산 위치 327이 N이고;
    서열번호 15에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 328이 P이고, 아미노산 위치 331이 N이고;
    서열번호 18에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 311이 P이고, 아미노산 위치 314가 N이고;
    서열번호 21에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 P이고, 아미노산 위치 205가 L이고, 아미노산 위치 321이 A이고, 아미노산 위치 324가 N이고;
    서열번호 24에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 A이고, 아미노산 위치 205가 L이고, 아미노산 위치 322가 A이고, 아미노산 위치 325가 N이고;
    서열번호 27에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
    서열번호 30에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 310이 P이고, 아미노산 위치 313이 N이고;
    서열번호 33에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
    서열번호 36에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 A이고, 아미노산 위치 326이 N이고;
    서열번호 39에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
    서열번호 42에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 A이고, 아미노산 위치 326이 N이고;
    서열번호 45에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 310이 A이고, 아미노산 위치 313이 N이고;
    서열번호 48에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
    이때 상기 TdT 변이체가 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, TdT 변이체.
  7. 제6항에 있어서,
    서열번호 3에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 6에 관하여, 아미노산 위치 315가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 9에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 12에 관하여, 아미노산 위치 325가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 15에 관하여, 아미노산 위치 329가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 18에 관하여, 아미노산 위치 312가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 21에 관하여, 아미노산 위치 322가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 24에 관하여, 아미노산 위치 323이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 27에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 30에 관하여, 아미노산 위치 311이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 33에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 36에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 39에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 42에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 45에 관하여, 아미노산 위치 311이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
    서열번호 48에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되는,
    TdT 변이체.
  8. 제6항 또는 제7항에 있어서,
    3'-O-변형된 뉴클레오타이드가 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-2'-데옥시뉴클레오사이드 트라이포스페이트 및 3'-O-알릴-2'-데옥시뉴클레오사이드 트라이포스페이트로 이루어지는 그룹 중에서 선택되는, TdT 변이체.
  9. 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하고, (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 폴리뉴클레오타이드의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체.
  10. a) 유리 3'-하이드록실을 갖는 3'-말단 뉴클레오타이드를 갖는 개시제를 제공하는 단계; 및
    b) (i) 신장 조건하에서 유리 3'-O-하이드록실을 갖는 상기 개시제 또는 신장된 단편을, 3'-O-차단된 뉴클레오사이드 트라이포스페이트 및 제1항 내지 제9항 중 어느 한 항에 따른 TdT 변이체와 접촉시켜, 상기 개시제 또는 신장된 단편이 3'-O-차단된 뉴클레오사이드 트라이포스페이트의 통합에 의해 신장되어 3'-O-차단된 신장된 단편을 형성하고, (ii) 상기 신장된 단편을 차단해제(deblocking)하여 유리 3'-하이드록실을 갖는 신장된 단편을 형성하는 주기를, 상기 폴리뉴클레오타이드가 형성될 때까지 반복하는 단계
    를 포함하는, 소정의 서열을 갖는 폴리뉴클레오타이드의 합성 방법.
  11. 제10항에 있어서,
    3'-O-차단된 뉴클레오사이드 트라이포스페이트가 3'-O-NH2-뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트 또는 3'-O-알릴-뉴클레오사이드 트라이포스페이트인, 방법.
  12. a) 제1항 내지 제9항 중 어느 한 항에 따른 TdT 변이체;
    b) 하나 이상의 3'-O-보호된 뉴클레오사이드 트라이포스페이트; 및
    c) 임의로 하나 이상의 개시제
    를 포함하는, 뉴클레오타이드 통합 반응을 수행하기 위한 키트.
KR1020227040201A 2020-04-20 2021-04-16 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 KR20230002825A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20170405.3 2020-04-20
EP20170405 2020-04-20
PCT/EP2021/059861 WO2021213903A1 (en) 2020-04-20 2021-04-16 Terminal deoxynucleotidyl transferase variants and uses thereof

Publications (1)

Publication Number Publication Date
KR20230002825A true KR20230002825A (ko) 2023-01-05

Family

ID=70390759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227040201A KR20230002825A (ko) 2020-04-20 2021-04-16 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도

Country Status (9)

Country Link
US (1) US20230159903A1 (ko)
EP (1) EP4139446A1 (ko)
JP (1) JP2023522234A (ko)
KR (1) KR20230002825A (ko)
CN (1) CN115427559A (ko)
AU (1) AU2021260014A1 (ko)
CA (1) CA3175780A1 (ko)
IL (1) IL297425A (ko)
WO (1) WO2021213903A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230317208A1 (en) 2022-03-31 2023-10-05 Ribbon Biolabs Gmbh Biopolymer synthesis

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5436143A (en) 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
AU1436995A (en) 1993-12-30 1995-07-17 Chemgenes Corporation Synthesis of propargyl modified nucleosides and phosphoramidites and their incorporation into defined sequence oligonucleotides
AU689924B2 (en) 1994-06-23 1998-04-09 Affymax Technologies N.V. Photolabile compounds and methods for their use
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5830655A (en) 1995-05-22 1998-11-03 Sri International Oligonucleotide sizing using cleavable primers
US5700642A (en) 1995-05-22 1997-12-23 Sri International Oligonucleotide sizing using immobilized cleavable primers
EP1632496A1 (en) 1998-06-22 2006-03-08 Affymetrix, Inc. Reagents and methods for solid phase synthesis and display
JP2002538790A (ja) 1999-03-08 2002-11-19 プロトジーン・ラボラトリーズ・インコーポレーテッド 長いdna配列を経済的に合成し、そして組み立てるための方法および組成物
US6664097B2 (en) 2000-05-23 2003-12-16 North Carolina State University Polynucleotide encoding a Lactobacillus gasseri beta-glucuronidase polypeptide
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
CA2491925A1 (en) 2002-07-08 2004-01-15 Shell Canada Limited Choke for controlling the flow of drilling mud
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
US8212020B2 (en) 2005-03-11 2012-07-03 Steven Albert Benner Reagents for reversibly terminating primer extension
US7544794B1 (en) 2005-03-11 2009-06-09 Steven Albert Benner Method for sequencing DNA and RNA by synthesis
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
US8034923B1 (en) 2009-03-27 2011-10-11 Steven Albert Benner Reagents for reversibly terminating primer extension
EP2876166B1 (en) 2013-11-20 2016-12-14 Roche Diagnostics GmbH New compound for sequencing by synthesis
FR3020071B1 (fr) * 2014-04-17 2017-12-22 Dna Script Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede
FR3052462A1 (fr) 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
US10472383B2 (en) 2017-03-16 2019-11-12 Steven A Benner Nucleoside triphosphates with stable aminoxy groups
US20210164008A1 (en) * 2017-05-26 2021-06-03 Nuclera Nucleics Ltd. Use of Terminal Transferase Enzyme in Nucleic Acid Synthesis
WO2019051250A1 (en) 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION
US10435676B2 (en) * 2018-01-08 2019-10-08 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
WO2020099451A1 (en) * 2018-11-14 2020-05-22 Dna Script Terminal deoxynucleotidyl transferase variants and uses thereof
CA3122494A1 (en) * 2018-12-13 2020-06-18 Dna Script Direct oligonucleotide synthesis on cells and biomolecules

Also Published As

Publication number Publication date
US20230159903A1 (en) 2023-05-25
CA3175780A1 (en) 2021-10-28
AU2021260014A1 (en) 2022-11-17
EP4139446A1 (en) 2023-03-01
JP2023522234A (ja) 2023-05-29
CN115427559A (zh) 2022-12-02
IL297425A (en) 2022-12-01
WO2021213903A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
US11859217B2 (en) Terminal deoxynucleotidyl transferase variants and uses thereof
AU2019205606A1 (en) Variants of Terminal deoxynucleotidyl Transferase and uses thereof
US20230062303A1 (en) Chimeric Terminal Deoxynucleotidyl Transferases For Template-Free Enzymatic Synthesis Of Polynucleotides
KR20210125496A (ko) 폴리뉴클레오티드의 주형-유리 효소 합성에서 효율적 생성물 절단
JP2022543569A (ja) ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成
KR20230002825A (ko) 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도
CN115135770A (zh) 使用无歧化作用末端脱氧核苷酸转移酶变体的多核苷酸无模板酶学合成
JP2023501651A (ja) ポリヌクレオチドの高効率テンプレートなしの酵素的合成
US20240093256A1 (en) Stabilized N-Terminally Truncated Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof
JP2024511874A (ja) G4を形成しやすいポリヌクレオチドの酵素合成のための方法及びキット