KR20230002825A - 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 - Google Patents
말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 Download PDFInfo
- Publication number
- KR20230002825A KR20230002825A KR1020227040201A KR20227040201A KR20230002825A KR 20230002825 A KR20230002825 A KR 20230002825A KR 1020227040201 A KR1020227040201 A KR 1020227040201A KR 20227040201 A KR20227040201 A KR 20227040201A KR 20230002825 A KR20230002825 A KR 20230002825A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- glu
- lys
- ala
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1264—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07031—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Saccharide Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 폴리뉴클레오타이드에 통합시킴에 있어서 향상된 효율을 보이는 다양한 종으로부터의 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체, 및 임의의 소정의 서열의 폴리뉴클레오타이드를 합성함에 있어서 이와 같은 TdT의 용도에 관한 것이다.
Description
소정의 서열의 합성 폴리뉴클레오타이드는 분자 진단, 게놈 및 진단 서열분석, 핵산 증폭, 치료 항체 개발, 합성 생물학, 핵산-기반 요법, DNA 접기기술(origami), DNA-기반 데이터 저장 등을 포함하는 기술의 주최의 중심이다. 최근에는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)와 같은 무-주형 폴리머라제 효소의 입증된 효율 및 순한 무독성 반응 조건의 이득으로 인해, 화학-기반 합성 방법을 상기와 같은 효소를 사용하는 효소-기반 방법으로 보완하거나 대체하는 데 관심이 높아지고 있다. 예를 들어 이버트(Ybert) 등의 국제 특허 공보 WO2015/159023; 하이아트(Hiatt) 등의 미국특허 제5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)] 등. 효소-기반 합성의 대부분의 접근법은 폴리뉴클레오타이드 생성물에서 목적하는 서열을 얻기 위해 가역적으로 차단된 뉴클레오사이드 트라이포스페이트의 사용을 필요로 한다. 그러나 불행하게도, 천연 TdT는 상기와 같은 변형된 뉴클레오사이드 트라이포스페이트를, 변형되지 않은 뉴클레오사이드 트라이스포페이트에 비해 크게 감소된 효율로 통합시킨다.
이에 비추어, 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 더 큰 효율로 통합시킬 수 있는 변형 TdT와 같은 신규의 무-주형 폴리머라제를 이용할 수 있다면, 무-주형 효소-기반 폴리뉴클레오타이드의 합성 분야는 발전할 것이다.
본 발명은 가역적으로 차단된 뉴클레오사이드 트라이포스페이트를 폴리뉴클레오타이드에 통합시킴에 있어서 향상된 효율을 나타내는 다양한 종으로부터의 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체, 및 임의의 소정의 서열의 폴리뉴클레오타이드의 합성에서 그의 용도에 관한 것이다.
일부 실시태양에서, 본 발명은 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며, 이때
서열번호 2에 관하여, 61번 위치의 류신이 치환되고, 170번 위치의 시스테인이 치환되고, 204번 위치의 아르기닌이 치환되고, 326번 위치의 아르기닌이 치환되고, 329번 위치의 글리신이 치환되고;
서열번호 5에 관하여, 48번 위치의 류신이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 314번 위치의 아르기닌이 치환되고, 317번 위치의 글리신이 치환되고;
서열번호 8에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 329번 위치의 글루탐산이 치환되고;
서열번호 11에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 324번 위치의 아르기닌이 치환되고, 327번 위치의 글루탐산이 치환되고;
서열번호 14에 관하여, 61번 위치의 글리신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 330번 위치의 글루탐산이 치환되고;
서열번호 17에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 158번 위치의 알라닌이 치환되고, 192번 위치의 아르기닌이 치환되고, 311번 위치의 아르기닌이 치환되고, 314번 위치의 글루탐산이 치환되고;
서열번호 20에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 프롤린이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 321번 위치의 쓰레오닌이 치환되고, 324번 위치의 글루탐산이 치환되고;
서열번호 23에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 325번 위치의 글루탐산이 치환되고;
서열번호 26에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 아르기닌이 치환되고, 325번 위치의 글루탐산이 치환되고;
서열번호 29에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 310번 위치의 아르기닌이 치환되고, 313번 위치의 글루탐산이 치환되고;
서열번호 32에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 35에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 38에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 41에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 44에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 309번 위치의 아르기닌이 치환되고, 312번 위치의 글루탐산이 치환되고;
서열번호 47에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다.
일부 실시태양에서, 서열번호 2, 8 또는 11의 61번 위치 또는 서열번호 5의 48번 위치에서 류신에 대한 상기 치환은 R 및 Q로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 170번 위치 또는 서열번호 5, 29 또는 44의 158번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 171번 위치에서 시스테인에 대한 상기 치환은 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 시스테인에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 8 또는 11의 171번 위치에서 타이로신에 대한 상기 치환은 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 17의 158번 위치 또는 서열번호 23 또는 26의 171번 위치에서 알라닌에 대한 상기 치환은 G, R, P, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 알라닌에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 20의 171번 위치에서 프롤린에 대한 상기 치환은 G, R, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환은 G 및 R로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 204번 위치 또는 서열번호 5, 17, 29 또는 44의 192번 위치 또는 서열번호 8, 11, 14, 20, 23, 26, 32, 35, 38, 41 또는 47의 205번 위치에서 아르기닌에 대한 상기 치환은 L 및 N으로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2의 326번 위치 또는 서열번호 5의 314번 위치 또는 서열번호 8 또는 14의 327번 위치 또는 서열번호 11의 324번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 321번 위치 또는 서열번호 23 또는 26의 322번 위치 또는 서열번호 29의 310번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 323번 위치 또는 서열번호 44의 309번 위치에서 아르기닌에 대한 상기 치환은 P, N 및 A로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 20의 321번 위치에서 쓰레오닌에 대한 상기 치환은 P, N 및 A로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 2 또는 5의 329번 위치에서 글리신에 대한 상기 치환은 N, L, T 및 S로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 서열번호 8 또는 14의 330번 위치 또는 서열번호 11의 327번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 324번 위치 또는 서열번호 23 또는 26의 325번 위치 또는 서열번호 29의 313번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 326번 위치 또는 서열번호 44의 312번 위치에서 글루탐산에 대한 상기 치환은 N, L, T 및 S로 이루어지는 그룹 중에서 선택된다.
추가의 실시태양에서, 본 발명은 상술한 바와 같이 치환되고 하기와 같이 추가로 치환된, 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며:
서열번호 2에 관하여 327번 위치의 글루타민이 치환되고;
서열번호 5에 관하여 315번 위치의 글루탐산이 치환되고;
서열번호 8에 관하여 328번 위치의 글루타민이 치환되고;
서열번호 11에 관하여 325번 위치의 글루타민이 치환되고;
서열번호 14에 관하여 328번 위치의 글루타민이 치환되고;
서열번호 17에 관하여 312번 위치의 글루타민이 치환되고;
서열번호 20에 관하여 322번 위치의 글루타민이 치환되고;
서열번호 23에 관하여 323번 위치의 글루타민이 치환되고;
서열번호 26에 관하여 323번 위치의 메티오닌이 치환되고;
서열번호 29에 관하여 311번 위치의 글루타민이 치환되고;
서열번호 32에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 35에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 38에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 41에 관하여 324번 위치의 글루타민이 치환되고;
서열번호 44에 관하여 310번 위치의 글루타민이 치환되고;
서열번호 47에 관하여 324번 위치의 글루타민이 치환되고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다. 일부 실시태양에서, 글루타민 및 글루탐산의 상기 치환은 T, F, L 또는 M이다.
일부 실시태양에서, 본 발명은 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이며, 이때:
서열번호 3에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 6에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 314는 P이고, 아미노산 위치 317은 N이고;
서열번호 9에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 12에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 A이고, 아미노산 위치 205는 L이고, 아미노산 위치 324는 P이고, 아미노산 위치 327은 N이고;
서열번호 15에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 328은 P이고, 아미노산 위치 331은 N이고;
서열번호 18에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 311은 P이고, 아미노산 위치 314는 N이고;
서열번호 21에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 P이고, 아미노산 위치 205는 L이고, 아미노산 위치 321은 A이고, 아미노산 위치 324는 N이고;
서열번호 24에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 A이고, 아미노산 위치 205는 L이고, 아미노산 위치 322는 A이고, 아미노산 위치 325는 N이고;
서열번호 27에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 327은 A이고, 아미노산 위치 330은 N이고;
서열번호 30에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 310은 P이고, 아미노산 위치 313은 N이고;
서열번호 33에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326는 N이고;
서열번호 36에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 A이고, 아미노산 위치 326은 N이고;
서열번호 39에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326은 N이고;
서열번호 42에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 A이고, 아미노산 위치 326은 N이고;
서열번호 45에 관하여 아미노산 위치 48은 R이고, 아미노산 위치 158은 R이고, 아미노산 위치 192는 L이고, 아미노산 위치 310은 A이고, 아미노산 위치 313은 N이고;
서열번호 48에 관하여 아미노산 위치 61은 R이고, 아미노산 위치 171은 R이고, 아미노산 위치 205는 L이고, 아미노산 위치 323은 P이고, 아미노산 위치 326은 N이고;
이때 상기 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있다.
일부 실시태양에서, 상기 TdT 변이체에서, 서열번호 3에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 6에 관하여 아미노산 위치 315는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 9에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 12에 관하여 아미노산 위치 325는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 15에 관하여 아미노산 위치 329는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 18에 관하여 아미노산 위치 312는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 21에 관하여 아미노산 위치 322는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 24에 관하여 아미노산 위치 323은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 27에 관하여 아미노산 위치 328은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 30에 관하여 아미노산 위치 311은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 33에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 36에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 39에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 42에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 45에 관하여 아미노산 위치 311은 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 48에 관하여 아미노산 위치 324는 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택된다.
일부 실시태양에서, 본 발명은 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체에 관한 것이다.
일부 실시태양에서, 각각의 상기 TdT 변이체에 관하여 일치성 퍼센트 값은 표시된 서열번호와 적어도 80%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 표시된 서열번호와 적어도 90%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 표시된 서열번호와 적어도 95%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 97%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 98%의 일치성이고; 일부 실시태양에서, 상기 일치성 퍼센트 값은 적어도 99%의 일치성이다. 본원에 사용된 바와 같이, 참소 서열과 변이체 서열을 비교하는 데 사용된 일치성 퍼센트 값은 상기 변이체 서열의 치환을 함유하는 명확히 명시된 아미노산 위치를 포함하지 않는다; 즉, 일치성 퍼센트 관계는 참조 단백질의 서열과 변이체 중의 치환을 함유하는 명확히 명시된 위치 밖의 변이체 단백질의 서열간의 관계이다. 따라서, 예를 들어 참조 서열 및 변이체 서열이 각각 100개 아미노산을 포함하고 상기 변이체 서열이 25번 및 81번 위치에 돌연변이를 갖는 경우, 상동성 퍼센트는 서열 1-24, 26-80 및 82-100에 관하여 있을 수 있다. 상기 (ii)에 관하여, 일부 실시태양에서, 상기와 같은 3'-O-변형된 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트, 3'-O-알릴-뉴클레오사이드 트라이포스페이트, 3'-O-(2-나이트로벤질)-뉴클레오사이드 트라이포스페이트, 3'-O-나이트로-뉴클레오사이드 트라이포스페이트 또는 3'-O-프로파길-뉴클레오사이드 트라이포스페이트를 포함할 수 있다. 다른 실시태양에서, 상기와 같은 3'-O-변형된 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트라이포스페이트 또는 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트를 포함할 수 있다.
본 발명은 또한 핵산 단편에 하나 이상의 3'-O-변형된 뉴클레오타디의 연속 첨가에 의해 주형 없이 핵산 분자를 합성하기 위한 본 발명의 TdT 변이체의 용도에 관한 것이다. 일부 실시태양에서, 이와 같은 방법은 (a) 유리 3'-하이드록실을 갖는 올리고뉴클레오타이드를 포함하는 개시제를 제공하는 단계; (b) 효소 연장 조건하에서 본 발명의 TdT 변이체를 상기 개시제 또는 연장된 개시제와 3'-O-가역적으로 차단된 뉴클레오사이드 트라이포스페이트 존재하에서 반응시키는 단계를 포함한다. 일부 실시태양에서, 이와 같은 방법은 (c) 상기 연장된 개시제를 차단해제(deblocking)하여 유리 3'-하이드록실을 갖는 연장된 개시제를 형성하는 단계 및 (d) 소정의 서열의 핵산 분자가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 추가로 포함한다.
추가의 실시태양에서, 본 발명은 상술한 변형 TdT를 암호화하는 핵산 분자, 이와 같은 핵산 분자를 포함하는 발현 벡터, 및 상기 언급한 핵산 분자 또는 상기 언급한 발현 벡터를 포함하는 숙주 세포를 포함한다. 더욱 추가의 실시태양에서, 본 발명은 본 발명의 변형 TdT의 생성 공정을 포함하며, 이때 숙주 세포를, 상기 변형 TdT를 암호화하는 핵산의 발현을 허용하는 배양 조건하에서 배양하고, 임의로 상기 변형 TdT를 회수한다. 본 발명은 또한 임의의 소정의 서열의 무-주형 폴리뉴클레오타이드 신장을 수행하기 위한 키트를 포함하며, 이때 상기 키트는 본 발명의 TdT 변이체를 포함한다. 이와 같은 키트는 DNA 신장을 위해서 A, C, G 및 T에 대해 3'-O-차단된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP), 또는 RNA 신장을 위해서 rA, rC, rG 및 U에 대해 3'-O-차단된 리보뉴클레오사이드 트라이포스페이트(rNTP)를 추가로 포함할 수 있다.
본 발명은 유리하게는, 3'-O-변형된 뉴클레오타이드를 야생형 TdT 또는 이전의 입수가능한 TdT 변이체보다 더 큰 효율 또는 더 높은 비율로 통합시키는 능력을 갖는 새로운 TdT 변이체를 제공함으로써 3'-O-변형된 뉴클레오사이드 트라이포스페이트의 효율적인 통합과 관련된 무-주형 효소 핵산 합성 분야의 문제점을 극복한다. 일부 실시태양에서, 본 발명은 또한 유리하게는, 야생형 TdT와 비교하여 증가된 안정성을 갖는 새로운 TdT 변이체를 제공함으로써 상기 분야의 문제점을 극복한다.
도 1은 본 발명의 TdT 변이체를 사용하는 무-주형 효소 핵산 합성 방법의 단계를 도식적으로 예시한다.
본 발명을 다양한 변형 및 대안 형태로 수행할 수 있지만, 그의 특징은 도면에 예로서 도시되었으며 상세히 기재될 것이다. 본 발명을 기재된 특정 실시태양으로 제한하고자 하지 않음을 알아야 한다. 본 발명의 진의 및 범위내에 있는 모든 변형, 균등물 및 대안을 포함하고자 한다. 본 발명의 태양에 대한 지침은 당업자에게 주지된 다수의 입수 가능한 참고문헌 및 교시, 예를 들어 문헌[Sambrook et al. (1989), Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory] 등에서 발견된다.
본 발명은 주형 가닥의 사용 없이 소정의 서열의 폴리뉴클레오타이드, 예를 들어 DNA 또는 RNA를 합성하는 데 사용될 수 있는 TdT 폴리머라제의 변이체를 제공한다. 본 발명의 TdT 변이체는 변형된 뉴클레오타이드, 및 보다 특히 3'O-가역적으로 차단된 뉴클레오사이드 트라이포스페이트를, 폴리뉴클레오타이드의 효소-기반 합성 방법에 사용할 수 있게 한다. 본 발명의 변이체를 특정 잔기(그의 위치는 명시된 서열번호에 관하여 지정된다)에서의 그의 돌연변이 또는 치환에 따라 기재한다.
본 발명의 TdT 변이체는 그의 BRCT-유사 N-말단 아미노산 서열이 없는 천연 TdT로부터 유래한다. 이와 같은 절두된 서열을 본원에서 때때로 "절두된 야생형" TdT라 칭한다. 보다 특히, 본 발명의 TdT 변이체는 하기의 천연 TdT로부터 유래한다:
명칭 |
종 |
NCBI 수납 번호 |
서열번호 |
B10 절두된 야생형 | 세리누스 카나리아 (Serinus canaria) |
XP_030097130.1 | 2 |
B10 변이체 | 세리누스 카나리아 | XP_030097130.1 | 3 |
B10 태그된 변이체 | 세리누스 카나리아 | XP_030097130.1 | 4 |
B19 절두된 야생형 | 네오펠마 크리소세팔룸 (Neopelma chrysocephalum) |
XP_027527888.1 | 5 |
B19 변이체 | 네오펠마 크리소세팔룸 | XP_027527888.1 | 6 |
B19 태그된 변이체 | 네오펠마 크리소세팔룸 | XP_027527888.1 | 7 |
B57 절두된 야생형 | 알리가토르 시넨시스 (Alligator sinensis) |
XP_025069068.1 | 8 |
B57 변이체 | 알리가토르 시넨시스 | XP_025069068.1 | 9 |
B57 태그된 변이체 | 알리가토르 시넨시스 | XP_025069068.1 | 10 |
B59 절두된 야생형 | 제노푸스 라에비스 (Xenopus laevis) |
AAI29712.1 | 11 |
B59 변이체 | 제노푸스 라에비스 | AAI29712.1 | 12 |
B59 태그된 변이체 | 제노푸스 라에비스 | AAI29712.1 | 13 |
B63 절두된 야생형 | 노테키스 스쿠타투스 (Notechis scutatus) |
XP_026526500.1 | 14 |
B63 변이체 | 노테키스 스쿠타투스 | XP_026526500.1 | 15 |
B63 태그된 변이체 | 노테키스 스쿠타투스 | XP_026526500.1 | 16 |
F15 절두된 야생형 | 살모 트루탈 (Salmo truttal) |
XP_029608991.1 | 17 |
F15 변이체 | 살모 트루탈 | XP_029608991.1 | 18 |
F15 태그된 변이체 | 살모 트루탈 | XP_029608991.1 | 19 |
F24 절두된 야생형 | 엘렉트로포루스 엘렉트리쿠스(Electrophorus electricus) | XP_026869907.1 | 20 |
F24 변이체 | 엘렉트로포루스 엘렉트리쿠스 | XP_026869907.1 | 21 |
F24 태그된 변이체 | 엘렉트로포루스 엘렉트리쿠스 | XP_026869907.1 | 22 |
F32 절두된 야생형 | 아나바스 테스투디네우스 (Anabas testudineus) |
XP_026209749.1 | 23 |
F32 변이체 | 아나바스 테스투디네우스 | XP_026209749.1 | 24 |
F32 태그된 변이체 | 아나바스 테스투디네우스 | XP_026209749.1 | 25 |
F57 절두된 야생형 | 포에실리아 레티쿨라타 (Poecilia reticulata) |
XP_008428203.1 | 26 |
F57 변이체 | 포에실리아 레티쿨라타 | XP_008428203.1 | 27 |
F57 태그된 변이체 | 포에실리아 레티쿨라타 | XP_008428203.1 | 28 |
N100 절두된 야생형 | 라투스 노르베기쿠스 (Rattus norvegicus) |
XP_ 001012479.1 | 29 |
N100 변이체 | 라투스 노르베기쿠스 | XP_ 001012479.1 | 30 |
N100 태그된 변이체 | 라투스 노르베기쿠스 | XP_ 001012479.1 | 31 |
N100or 절두된 야생형 | 라투스 노르베기쿠스 |
XP_ 001012479.1 | 32 |
N100or 변이체 | 라투스 노르베기쿠스 |
XP_ 001012479.1 | 33 |
N100or 태그된 변이체 | 라투스 노르베기쿠스 |
XP_ 001012479.1 | 34 |
N14 절두된 야생형 | 필리오콜로부스 테프로스셀레스(Piliocolobus tephrosceles) | XP_023062037.1 | 35 |
N14 변이체 | 필리오콜로부스 테프로스셀레스 | XP_023062037.1 | 36 |
N14 태그된 변이체 | 필리오콜로부스 테프로스셀레스 | XP_023062037.1 | 37 |
N27 절두된 야생형 | 수스 스크로파 (Sus scrofa) |
XP_003133204.1 | 38 |
N27 변이체 | 수스 스크로파 | XP_003133204.1 | 39 |
N27 태그된 변이체 | 수스 스크로파 | XP_003133204.1 | 40 |
N35 절두된 야생형 | 판테라 티그리스 알타이카 (Panthera tigris altaica) |
XP_007080320.1 | 41 |
N35 변이체 | 판테라 티그리스 알타이카 | XP_007080320.1 | 42 |
N35 태그된 변이체 | 판테라 티그리스 알타이카 | XP_007080320.1 | 43 |
N72 절두된 야생형 | 부발루스 부발리스 (Bubalus bubalis) |
XP_006061247.1 | 44 |
N72 변이체 | 부발루스 부발리스 | XP_006061247.1 | 45 |
N72 태그된 변이체 | 부발루스 부발리스 | XP_006061247.1 | 46 |
N93or 절두된 야생형 | 마르모타 플라비벤트리스 (Marmota flaviventris) |
XP_027786017.1 | 47 |
N93or 변이체 | 마르모타 플라비벤트리스 | XP_027786017.1 | 48 |
N93or 태그된 변이체 | 마르모타 플라비벤트리스 | XP_027786017.1 | 49 |
일부 실시태양에서, TdT 변이체를 공유 또는 비-공유 결합; 아미노산 태그(예를 들어 폴리-아미노산 태그, 폴리-His 태그, 6His-태그); 화학적 화합물(예를 들어 폴리에틸렌 글리콜); 단백질-단백질 결합 쌍(예를 들어 비오틴-아비딘); 친화성 커플링; 포획 탐침; 또는 이들의 임의의 조합을 포함하는 링커 모이어티에 작동적으로 연결시킬 수 있다. 상기 링커 모이어티는 TdT 변이체와 별개이거나 그의 부분일 수 있다(예를 들어 재조합 His-태그된 폴리머라제, 예를 들어 하기 서열번호의 쌍에 의해 예시된다: (3,4), (6,7), (9,10), (12,13), (15,16), (18,19), (21,22), (24,25), (27,28), (30,31), (33,34), (36,37), (39,40), (42,43), (45,46) 및 (48,49)). 전형적으로, 상기 링커 모이어티는 뉴클레오타이드 결합 활성, 또는 TdT 변이체의 촉매 활성을 방해하지 않는다.
상술한 실시태양 중 일부에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 105%이고; 다른 실시태양에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 110%이고; 다른 실시태양에서, 3'O-변형된 뉴클레오사이드 트라이포스페이트의 통합에 있어서 변형 TdT의 효율은 이전의 입수가능한 TdT 야생형 또는 변이체의 경우의 적어도 150%이다.
상술한 바와 같은 본 발명의 TdT 변이체는 각각 지정된 치환의 존재에 따라, 명시된 서열번호와 서열 일치성 퍼센트를 갖는 아미노산 서열을 포함한다. 일부 실시태양에서, 이러한 방식으로 기재된 본 발명의 TdT 변이체와 명시된 서열번호간의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입에 기인할 수 있으며, 상기 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시태양에서, 이와 같은 결실, 치환 및/또는 삽입은 단지 자연적으로 발생하는 아미노산을 포함한다. 일부 실시태양에서, 치환은 문헌[Grantham, Science, 185: 862-864 (1974)]에 기재된 바와 같은 보존적, 또는 아주 밀접한, 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 아주 밀접한 아미노산 세트의 구성원에서만 발생할 수 있다. 일부 실시태양에서, 사용될 수 있는 아주 밀접한 아미노산 세트를 하기 표 2A에 제시한다.
[표 2A]
일부 실시태양에서, 사용될 수 있는 아주 밀접한 아미노산 세트를 하기 표 2B에 제시한다.
[표 2B]
뉴클레오타이드 통합 활성의 측정
본 발명의 변이체에 의한 뉴클레오타이드 통합의 효율을 예를 들어 문헌[Boule et al](하기에 인용됨); 문헌[Bentolila et al](하기에 인용됨); 및 하이아트 등의 미국특허 제5808045호(이 중 후자는 본원에 참고로 인용된다)에 기재된 바와 같은 연장 또는 신장에 의해 측정할 수 있다. 간단히, 이와 같은 분석의 한 형태에서, 유리 3'-하이드록실을 갖는 형광 표지된 올리고뉴클레오타이드를 TdT 연장 조건 하에서, 가역적으로 차단된 뉴클레오사이드 트라이포스페이트의 존재 하에 소정의 지속기간 동안 시험하고자 하는 변형 TdT와 반응시키고, 그 후에 상기 연장 반응을 정지시키고 연장 생성물 및 연장되지 않은 개시제 올리고뉴클레오타이드의 양을 젤 전기영동에 의한 분리 후에 정량화한다. 이와 같은 분석에 의해, 변형 TdT의 통합 효율을 다른 변이체의 효율 또는 야생형 또는 참조 TdT, 또는 다른 폴리머라제의 효율에 쉽게 비교할 수 있다. 일부 실시태양에서, 변형 TdT 효율의 척도는 균등한 분석에서 야생형 TdT를 사용하여 연장된 생성물의 양에 대한, 변형 TdT를 사용하여 연장된 생성물의 양의 비(백분율로서 주어진다)일 수 있다.
일부 실시태양에서, 하기의 특정한 연장 분석을 사용하여 TdT의 통합 효율을 측정할 수 있다: 사용된 프라이머는 하기와 같다:
5'-AAAAAAAAAAAAAAGGGG-3'(서열번호 50)
상기 프라이머는 또한 5' 극단상에 ATTO 형광 염료를 갖는다. 사용된 전형적인 변형된 뉴클레오타이드(표 3에서 dNTP로서 나타냄)는 3'-O-아미노-2',3'-다이데옥시뉴클레오타이드-5'-트라이포스페이트(ONH2, 화이어버드 바이오사이언시즈(Firebird Biosciences)), 예를 들어 3'-O-아미노-2',3'-다이데옥시아데노신-5'-트라이포스페이트를 포함한다. 시험된 각각의 상이한 변이체에 대해서, 하나의 튜브만이 반응에 사용된다. 시약을, 물에서 출발하여 하기 표 3의 순서로 상기 튜브에 첨가한다. 37℃에서 30분 후에, 포름아미드(시그마(Sigma))를 첨가하여 반응을 정지시킨다.
연장 활성 분석 시약 | ||
시약 | 농도 | 부피 |
H2O | - | 12 ㎕ |
활성 완충액 | 10x | 2 ㎕ |
dNTP | 250 μM | 2 ㎕ |
정제된 효소 | 20 μM | 2 ㎕ |
형광 프라이머 | 500 nM | 2 ㎕ |
상기 활성 완충액은 예를 들어 CoCl2가 보충된 TdT 반응 완충액(뉴잉글랜드 바이오랩스(New England Biolabs)로부터 입수할 수 있다)을 포함한다.
상기 분석의 생성물을 통상적인 폴리아크릴아미드 젤 전기영동에 의해 분석한다. 예를 들어, 상기 분석의 생성물을 16% 폴리아크릴아미드 변성 젤(바이오-래드(Bio-Rad))에서 분석할 수 있다. 젤을 유리 플레이트 내부에 폴리아크릴아미드를 부어 분석 직전에 제조하고 이를 중합되도록 둔다. 상기 유리 플레이트 내부의 젤을 전기영동 단계를 위해 TBE 완충액(시그마)이 채워진 개조 탱크상에 올려놓는다. 분석하고자 하는 샘플을 상기 젤의 상부에 로딩한다. 500 내지 2,000 V의 전압을 실온에서 3 내지 6시간 동안 상기 젤의 상부와 기부 사이에 인가한다. 분리 후에, 젤 형광을, 예를 들어 타이푼(Typhoon) 스캐너(GE 라이프 사이언시즈(GE Life Sciences))를 사용하여 스캐닝한다. 상기 젤 상을 ImageJ 소프트웨어(imagej.nih.gov/ij/), 또는 그의 균등물을 사용하여 분석하여, 변형된 뉴클레오타이드의 통합 백분율을 계산한다.
헤어핀 완료 분석. 하나의 태양에서, 본 발명은 폴리뉴클레오타이드(즉, "시험 폴리뉴클레오타이드")의 3' 단부에 dNTP를 통합시키는 TdT 변이체와 같은 폴리머라제의 능력을 측정하는 방법을 포함한다. 이러한 방법 중 하나는, 실질적으로 단일 가닥이지만 TdT 변이체와 같은 폴리머라제로 연장시, 단일 가닥 루프 및 이중 가닥 스템을 포함하는 안정한 헤어핀 구조를 형성하고, 이에 의해 상기 이중 가닥 폴리뉴클레오타이드의 존재에 의해 상기 3' 단부의 연장의 검출을 허용하는 반응 조건하에서 유리 3' 하이드록실을 갖는 시험 폴리뉴클레오타이드를 제공함을 포함한다. 상기 이중 가닥 구조는 다양한 방식, 예를 들어 비제한적으로 이중 가닥 구조에 삽입시 우선적으로 형광을 발하는 형광 염료, 연장된 폴리뉴클레오타이드상의 수용체(또는 공여체)와, 새로 형성된 헤어핀 스템과 트리플렉스를 형성하는 올리고뉴클레오타이드상의 공여체(또는 수용체)간의 형광 공명 에너지 전달(FRET), 시험 폴리뉴클레오타이드에 부착되고 헤어핀 형성시 FRET 근접하게 되는 FRET 수용체 및 공여체 등의 방식으로 검출될 수 있다. 일부 실시태양에서, 단일 뉴클레오타이드에 의한 연장 후 시험 폴리뉴클레오타이드의 스템 부분은 길이가 4 내지 6 염기쌍의 범위이고; 다른 실시태양에서, 이와 같은 스템 부분은 길이가 4 내지 5 염기쌍이며; 더욱 다른 실시태양에서, 이와 같은 스템 부분은 길이가 4 염기쌍이다. 일부 실시태양에서, 시험 폴리뉴클레오타이드는 길이가 10 내지 20 뉴클레오타이드의 범위이고; 다른 실시태양에서, 시험 폴리뉴클레오타이드는 12 내지 15 뉴클레오타이드 범위의 길이를 갖는다. 일부 실시태양에서, 시험 폴리뉴클레오타이드를, 연장이 없는 스템과 연장을 갖는 스템의 용융 온도간의 차이를 최대화하는 뉴클레오타이드로 연장시키는 것이 유리하거나 편리하며; 따라서, 일부 실시태양에서, 시험 폴리뉴클레오타이드를 dC 또는 dG로 연장시킨다(또, 상응하게, 스템 형성에 적합한 상보성 뉴클레오타이드를 갖는 시험 폴리뉴클레오타이드를 선택한다).
헤어핀 완료 분석을 위한 예시적인 시험 폴리뉴클레오타이드는 dGTP로 연장함으로써 완료되는 p875(5'-CAGTTAAAAACT)(서열번호 51); dCTP로 연장함으로써 완료되는 p876(5'-GAGTTAAAACT)(서열번호 52); 및 dGTP로 연장함으로써 완료되는 p877(5'-CAGCAAGGCT)(서열번호 53)를 포함한다. 이와 같은 시험 폴리뉴클레오타이드에 대한 예시적인 반응 조건은 2.5 내지 5 μM의 시험 폴리뉴클레오타이드, GelRed(등록상표)(바이오슘 인코포레이티드(Biotium, Inc., 미국 캘리포니아주 프레몬트 소재)로부터의 삽입 연료)의 1:4000 희석, 200 mM 카코딜레이트(Cacodylate) KOH pH 6.8, 1 mM CoCl2, 0-20%의 DMSO 및 목적하는 농도의 3' ONH2 dGTP 및 TdT를 포함할 수 있다. 상기 헤어핀의 완료를, 28-38℃의 반응 온도에서 360 ㎚로 설정된 여기 필터 및 635 ㎚로 설정된 방출 필터로, 통상적인 형광측정기, 예를 들어 TECAN 판독기를 사용하여 GelRed(등록상표) 염료의 형광의 증가에 의해 모니터링할 수 있다. 본 발명의 상기 태양의 일부 실시태양에서, TdT 변이체를 하기의 단계에 의해 뉴클레오사이드 트라이포스페이트의 무-주형 통합에 대한 그의 능력에 대해 시험할 수 있다: (a) 유리 3'-하이드록실을 갖는 시험 폴리뉴클레오타이드, TdT 변이체 및 뉴클레오사이드 트라이포스페이트를, 상기 시험 폴리뉴클레오타이드가 단일 가닥이지만 상기 뉴클레오사이드 트라이포스페이트의 통합시 이중 가닥 스템 영역을 갖는 헤어핀을 형성하는 조건하에서 결합시키는 단계, 및 (b) 상기 뉴클레오사이드 트라이포스페이트를 통합하는 상기 TdT 변이체의 능력의 척도로서, 상기 형성된 이중 가닥 스템 영역의 양을 검출하는 단계. 일부 실시태양에서, 상기 뉴클레오사이드 트라이포스페이트는 3'-O-차단된 뉴클레오사이드 트라이포스페이트이다.
올리고뉴클레오타이드의 무-주형 효소 합성
일반적으로, 무-주형(또는 균등하게, "주형-독립적인") 효소적 DNA 합성 방법은 도 1에 예시된 바와 같은 단계의 반복된 주기를 포함하며, 이때 소정의 뉴클레오타이드를 각 주기에서 개시제 또는 성장하는 쇄에 커플링시킨다. 무-주형 효소 합성의 일반적인 요소는 하기의 참고문헌에 기재되어 있다: 이버트 등의 국제 특허 공보 WO/2015/159023; 이버트 등의 국제 특허 공보 WO/2017/216472; 하이만(Hyman)의 미국특허 제5436143호; 하이아트 등의 미국특허 제5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)]; 문헌[Mathews et al, Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f (2016)]; 문헌[Schmitz et al, Organic Lett., 1(11): 1729-1731 (1999)].
예를 들어, 고체 지지체(102)(유리 3'-하이드록실기(103)를 갖는다)에 부착된 개시제 폴리뉴클레오타이드(100)를 제공한다. 상기 개시제 폴리뉴클레오타이드(100)(또는 후속 주기에서 신장된 개시제 폴리뉴클레오타이드)에, (104) 3'-O-보호된-dNTP 및 무-주형 폴리머라제, 예를 들어 TdT 또는 그의 변이체(예를 들어 이버트 등의 WO/2017/216472; 챔피온(Champion) 등의 WO2019/135007)를, 상기 개시제 폴리뉴클레오타이드(100)(또는 신장된 개시제 폴리뉴클레오타이드)의 3' 단부상에 상기 3'-O-보호된-dNTP의 효소적 통합에 유효한 조건 하에서 가한다. 이 반응은 3'-하이드록실이 보호된(106) 신장된 개시제 폴리뉴클레오타이드를 생성시킨다. 상기 신장된 서열이 완료되지 않은 경우, 또 다른 주기의 첨가를 실행한다(108). 상기 신장된 개시제 폴리뉴클레오타이드가 경쟁 서열을 함유하는 경우, 상기 3'-O-보호기를 제거하거나 탈보호할 수 있으며, 목적하는 서열을 원래의 개시제 폴리뉴클레오타이드(110)로부터 절단할 수 있다. 이와 같은 절단은 다양한 단일 가닥 절단 기법 중 어느 하나를 사용하여, 예를 들어 원래 개시제 폴리뉴클레오타이드 내의 소정의 위치에 절단가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단가능한 뉴클레오타이드는, 우라실 DNA 글리코실라제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 상기 신장된 개시제 폴리뉴클레오타이드가 완료된 서열을 함유하지 않는 경우, 3'-O-보호기를 제거하여 유리 3'-하이드록실(103)을 노출시키고 상기 신장된 개시제 폴리뉴클레오타이드에 또 다른 주기의 뉴클레오타이드 부가 및 탈보호를 가한다.
본원에 사용되는 바와 같이, 명시된 기, 예를 들어 뉴클레오타이드 또는 뉴클레오사이드의 3'-하이드록실과 관련하여 "보호된" 및 "차단된"이란 용어는 호환가능하게 사용되며, 화학 또는 효소 공정 동안 명시된 기에 대한 화학 변화를 방지하기 위해 상기 기에 모이어티를 공유적으로 부착시킴을 의미하고자 한다. 상기 명시된 기가 뉴클레오사이드 트라이포스페이트의 3'-하이드록실, 또는 3'-보호된(또는 차단된)-뉴클레오사이드 트라이포스페이트가 통합된 연장된 단편(또는 "연장 중간체")인 경우는 언제든, 상기 방지된 화학 변화는 효소 커플링 반응에 의한 상기 연장된 단편(또는 "연장 중간체")의 추가의 또는 후속적인 연장이다.
본원에 사용된 바와 같이, "개시제"(또는 균등한 용어, 예를 들어 "개시 단편", "개시제 핵산", "개시제 올리고뉴클레오타이드" 등)는 대개, 단부에 유리 3'-하이드록실을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭하며, 이는 무-주형 폴리머라제, 예를 들어 TdT에 의해 추가로 신장될 수 있다. 하나의 실시태양에서, 상기 개시 단편은 DNA 개시 단편이다. 대안의 실시태양에서, 상기 개시 단편은 RNA 개시 단편이다. 일부 실시태양에서, 개시 단편은 3 내지 100개 뉴클레오타이드, 특히 3 내지 20개 뉴클레오타이드를 갖는다. 일부 실시태양에서, 상기 개시 단편은 단일 가닥이다. 대안의 실시태양에서, 상기 개시 단편은 이중 가닥일 수 있다. 일부 실시태양에서, 개시제 올리고뉴클레오타이드를 그의 5' 단부에 의해 합성 지지체에 부착시킬 수 있고; 다른 실시태양에서, 개시제 올리고뉴클레오타이드를, 예를 들어 공유 결합을 통해 합성 지지체에 직접 부착되는 상보성 올리고뉴클레오타이드와 듀플렉스를 형성시킴으로써 상기 합성 지지체에 간접적으로 부착시킬 수도 있다. 일부 실시태양에서 합성 지지체는 고체 지지체이며, 이는 고형 평면 고체의 분리된 영역이거나, 비드일 수 있다.
일부 실시태양에서, 개시제는 TdT가 3'-O-보호된 dNTP에 커플링할 수 있는 유리 하이드록실을 갖는 비-핵산 화합물을 포함한다(예를 들어 바이가(Baiga)의 미국 특허 공보 US2019/0078065 및 US2019/0078126).
합성의 완료 후에, 목적하는 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드를 절단에 의해 개시제 및 고체 지지체로부터 방출시킬 수 있다. 광범위하게 다양한 절단가능한 연결 또는 절단가능한 뉴클레오타이드를 상기 목적을 위해 사용할 수 있다. 일부 실시태양에서, 목적하는 폴리뉴클레오타이드의 절단은 절단된 가닥상에 천연의 유리 5'-하이드록실을 남기지만; 대안의 실시태양에서, 절단 단계는 예를 들어 포스파타제 처리에 의해 후속 단계에서 제거될 수도 있는 모이어티, 예를 들어 5'-포스페이트를 남길 수 있다. 절단 단계를 화학적으로, 열적으로, 효소적으로, 또는 광화학적 방법에 의해 수행할 수 있다. 일부 실시태양에서, 절단가능한 뉴클레오타이드는 뉴클레오타이드 유사체, 예를 들어 데옥시유리딘 또는 8-옥소-데옥시구아노신일 수 있으며, 이들은 특이적인 글리코실라제(예를 들어 각각 우라실 데옥시글리코실라제에 이어서 엔도뉴클레아제 VIII, 및 8-옥소구아닌 DNA 글리코실라제)에 의해 인식된다. 일부 실시태양에서, 절단은 끝에서 두 번째 3' 뉴클레오타이드로서 데옥시이노신(이는 개시제의 3' 단부에서 엔도뉴클레아제 V에 의해 절단되어, 방출된 폴리뉴클레오타이드 상에 5'-포스페이트를 남길 수 있다)을 갖는 개시제를 제공함으로써 수행될 수 있다. 단일 가닥 폴리뉴클레오타이드를 절단하기 위한 추가의 방법은 참고로 인용된 하기의 참고문헌에 개시되어 있다: 미국특허 제5,739,386호, 미국특허 제5,700,642호 및 미국특허 제5,830,655호; 및 미국 특허 공보 2003/0186226 및 2004/0106728; 및 우르데아(Urdea)와 혼(Horn)의 미국특허 제5367066호.
일부 실시태양에서, 글리코실라제 및/또는 엔도뉴클레아제에 의한 절단은 이중 가닥 DNA 기질을 필요로 할 수 있다.
도 1을 참조하면, 일부 실시태양에서, 정렬된 순서의 뉴클레오타이드를 각각의 합성 단계에서 3'-O-보호된 dNTP의 존재 하에 무-주형 폴리머라제, 예를 들어 TdT를 사용하여 개시제 핵산에 커플링시킨다. 일부 실시태양에서, 올리고뉴클레오타이드의 합성 방법은 (a) 유리 3'-하이드록실(103)을 갖는 개시제(예를 들어 (100))를 제공하는 단계; (b) 연장 조건 하에서 유리 3'-하이드록실을 갖는 상기 개시제 또는 연장 중간체를, 3'-O-보호된 뉴클레오사이드 트라이포스페이트의 존재 하에 무-주형 폴리머라제와 반응시켜(104) 3'-O-보호된 연장 중간체(106)를 생성시키는 단계; (c) 상기 연장 중간체를 탈보호시켜 유리 3'-하이드록실을 갖는 연장 중간체를 생성시키는 단계; 및 (d) 폴리펩타이드가 합성될 때까지(110) 단계 (b) 및 (c)(108)를 반복하는 단계를 포함한다. (때때로 "연장 중간체" 및 "신장 단편"이란 용어는 호환가능하게 사용된다). 일부 실시태양에서, 개시제는, 예를 들어 5' 단부에 의해 고체 지지체에 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 반응 또는 연장 단계 후뿐만 아니라 탈-보호 단계 후에 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는 통합되지 않은 뉴클레오사이드 트라이포스페이트를, 예를 들어 세척에 의해, 소정의 배양 기간 또는 반응 시간 후에 제거하는 하위-단계를 포함할 수 있다. 이와 같은 소정의 배양 기간 또는 반응 시간은 수초, 예를 들어 30초 내지 수분, 예를 들어 30분일 수 있다.
합성 지지체상의 폴리뉴클레오타이드의 서열이 역 상보성 하위서열을 포함할 때, 상기 역 상보성 영역간에 수소 결합을 형성시켜 2차 분자-내 또는 분자-간 구조를 생성시킬 수 있다. 일부 실시태양에서, 환외(exocyclic) 아민에 대한 염기 보호 모이어티를, 상기 보호된 질소의 수소가 수소 결합에 참여할 수 없고, 이에 의해 상기와 같은 2차 구조의 형성이 방지되도록 선택한다. 즉, 염기 보호 모이어티를 사용하여, 예를 들어 뉴클레오사이드 A와 T 및 G와 C간의 통상적인 염기 짝짓기에서 형성되는 바와 같은 수소 결합의 형성을 방지할 수 있다. 합성의 끝에서, 상기 염기 보호 모이어티를 제거하고 폴리뉴클레오타이드 생성물을, 예를 들어 상기 생성물을 그의 개시제로부터 절단함으로써 고체 지지체로부터 절단할 수 있다.
염기 보호기를 갖는 3'-O-차단된 dNTP 단량체를 제공하는 것 외에, 신장 반응을 열 안정성 무-주형 폴리머라제를 사용하여 보다 높은 온도에서 수행할 수 있다. 예를 들어, 40℃ 초과에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용하거나; 일부 실시태양에서 40 내지 85℃ 범위에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용하거나; 일부 실시태양에서 40 내지 65℃ 범위에서 활성을 갖는 열 안정성 무-주형 폴리머라제를 사용할 수 있다.
일부 실시태양에서, 신장 조건은 수소 결합 또는 염기 적층을 억제하는 용매를 신장 반응 혼합물에 첨가함을 포함할 수 있다. 이와 같은 용매는 낮은 유전 상수를 갖는 수 혼화성 용매, 예를 들어 다이메틸 설폭사이드(DMSO), 메탄올 등을 포함한다. 마찬가지로, 일부 실시태양에서, 신장 조건은 수소결합 억제제(chaotropic agent)의 제공을 포함할 수 있으며, 상기 억제제는 비제한적으로 n-부탄올, 에탄올, 구아니디늄 클로라이드, 리튬 퍼클로레이트, 리튬 아세테이트, 염화 마그네슘, 페놀, 2-프로판올, 나트륨 도데실 설페이트, 티오우레아, 우레아 등을 포함한다. 일부 실시태양에서, 신장 조건은 2차-구조-억제량의 DMSO의 존재를 포함한다. 일부 실시태양에서, 신장 조건은 2차 구조의 형성을 억제하는 DNA 결합 단백질의 제공을 포함할 수 있으며, 이때 상기와 같은 단백질은 비제한적으로 단일-가닥 결합 단백질, 헬리카제, DNA 글리콜라제 등을 포함한다.
염기 보호 없는 3'-O-차단된 dNTP를 상업적인 판매인으로부터 구입하거나 공개된 기법(예를 들어 미국특허 제7057026호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105(27): 9145-9150 (2008)]; 베너(Benner)의 미국특허 제7544794호 및 미국특허 제8212020호; 국제 특허 공보 WO2004/005667, WO91/06678; 문헌[Canard et al, Gene](본원에서 인용됨); 문헌[Metzker et al, Nucleic Acids Research, 22: 4259-4267 (1994)]; 문헌[Meng et al, J. Org. Chem., 14: 3248-3252 (3006)]; 미국 특허 공보 2005/037991)을 사용하여 합성할 수 있다. 염기 보호된 3'-O-차단된 dNTP를 하기에 기재된 바와 같이 합성할 수 있다.
염기-보호된 dNTP가 사용되는 경우, 상기 도 1의 방법은 염기 보호 모이어티를 제거하는 단계 (e)를 추가로 포함할 수 있으며, 아실 또는 아미딘 보호기의 경우에 (예를 들어) 농축된 암모니아로 처리함을 포함할 수 있다.
상기 방법은 또한 반응 또는 연장 단계 후뿐만 아니라 탈보호 단계 후에 캡핑 단계(들)뿐만 아니라 세척 단계를 포함할 수 있다. 상기에 언급한 바와 같이, 일부 실시태양에서 연장되지 않은 유리 3'-하이드록실을 캡핑 가닥의 임의의 추가적인 연장을 방지하는 화합물과 반응시키는 캡핑 단계를 포함할 수 있다. 일부 실시태양에서, 이와 같은 화합물은 다이데옥시뉴클레오사이드 트라이포스페이트일 수 있다. 다른 실시태양에서, 유리 3'-하이드록실을 갖는 연장되지 않은 가닥을, 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리하여 분해시킬 수 있다. 예를 들어 하이만의 미국특허 제5436143호를 참조하시오. 마찬가지로, 일부 실시태양에서 차단해제되지 못한 가닥을 처리하여 상기 가닥을 제거하거나 추가의 연장에 불활성이게 만들 수 있다.
일부 실시태양에서, 신장 단계(또한 때때로 연장 단계 또는 커플링 단계라 지칭된다)에 대한 반응 조건은 하기를 포함할 수 있으며: 2.0 μM 정제된 TdT; 125-600 μM 3'-O-차단된 dNTP(예를 들어 3'-O-NH2-차단된 dNTP); 약 10 내지 약 500 μM 칼륨 카코딜레이트 완충액(6.5 내지 7.5의 pH) 및 약 0.01 내지 약 10 μM의 2가 양이온(예를 들어 CoC12 또는 MnC12), 이때 상기 신장 반응을 RT 내지 45℃ 범위내의 온도에서 3분 동안 50 ㎕ 반응 부피로 수행할 수 있다. 실시태양에서, 3'-O-차단된 dNTP가 3'-O-NH2-차단된 dNTP인 경우, 차단해제 단계에 대한 반응 조건은 하기를 포함할 수 있으며: 700 mM NaNO2; 1 M 나트륨 아세테이트(아세트산으로 4.8 내지 6.5 범위의 pH로 조절된다), 이때 상기 차단해제 반응을 RT 내지 45℃ 범위내의 온도에서 3초 내지 수분 동안 50 ㎕ 부피로 수행할 수 있다. 세척을 커플링 반응 성분(예를 들어 효소, 단량체, 2가 양이온)이 없는 카코딜레이트 완충액으로 수행할 수 있다.
특정 용도에 따라, 차단해제 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건, 예를 들어 빛, 열, pH, 특정 시약, 예를 들어 명시된 화학 결합을 절단할 수 있는 효소를 포함할 수 있다. 3'-O-차단기 및 상응하는 차단-해제 조건을 선택하는 지침을 하기의 참고문헌(참고로 인용된다)에서 찾을 수 있다: 베너의 미국특허 제7544794호 및 미국특허 제8212020호; 미국특허 제5808045호; 미국특허 제8808988호; 국제 특허 공보 WO91/06678; 및 하기에 인용되는 참고문헌. 일부 실시태양에서, 절단제(또한 때때로 차단-해제 시약 또는 작용제로서 지칭된다)는 화학적 절단제, 예를 들어 다이티오쓰레이톨(DTT)이다. 대안의 실시태양에서, 절단제는 효소 절단제, 예를 들어 3'-포스페이트 차단기를 절단할 수 있는 포스파타제일 수 있다. 당업자는 차단해제제의 선택이, 사용되는 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다수의 차단기가 사용되는 지의 여부, 개시제가 살아있는 세포 또는 유기체 또는 고체 지지체에 부착되는 지의 여부 등(이들은 순한 처리를 필요로 한다)에 따라 변하는 것임을 알 것이다. 예를 들어, 포스핀, 예를 들어 트리스(2-카복시에틸)포스핀(TCEP)을 사용하여 3'O-아지도메틸기를 절단하거나, 팔라듐 복합체를 사용하여 3'O-알릴기를 절단하거나, 나트륨 나이트라이트를 사용하여 3'O-아미노기를 절단할 수 있다. 특정 실시태양에서, 절단 반응은 TCEP, 팔라듐 복합체 또는 나트륨 나이트라이트를 포함한다.
상기에 나타낸 바와 같이, 일부 실시태양에서 직각 차단-해제 조건을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직할 수 있다. 하기의 예시적인 차단기 쌍(표 4)을 나란한 합성 실시태양에 사용할 수 있다. 다른 차단기 쌍, 또는 2개를 초과하여 함유하는 기를 본 발명의 상기 실시태양에 사용하기 위해 입수할 수 있음이 이해된다.
예시적인 차단기 쌍 | |
3'-O-NH2 | 3'-O-아지도메틸 |
3'-O-NH2 | 3'-O-알릴 |
3'-O-NH2 | 3'-O-포스페이트 |
3'-O-아지도메틸 | 3'-O-알릴 |
3'-O-아지도메틸 | 3'-O-포스페이트 |
3'-O-알릴 | 3'-O-포스페이트 |
살아있는 세포에서의 올리고뉴클레오타이드의 합성은 순한 차단해제 또는 탈보호 조건, 즉 세포막을 붕괴시키지 않거나, 단백질을 변성시키지 않거나, 핵심 세포 기능을 방해하지 않는 등의 조건을 요한다. 일부 실시태양에서, 탈보호 조건은 세포 생존과 양립성인 일련의 생리학적 조건내에 있다. 이와 같은 실시태양에서, 효소 탈보호가 바람직한 데, 그 이유는 상기 탈보호가 생리학적 조건 하에서 수행될 수 있기 때문이다. 일부 실시태양에서 특이적인 효소 제거가능한 차단기는 그의 제거에 특이적인 효소가 연관된다. 예를 들어, 에스테르- 또는 아실-계 차단기는 에스테라제, 예를 들어 아세틸에스테라제 등의 효소로 제거될 수 있고, 포스페이트 차단기는 3' 포스파타제, 예를 들어 T4 폴리뉴클레오타이드 키나제로 제거될 수 있다. 예로서, 3'-O-포스페이트를 100 mM 트리스-HCl(pH 6.5) 10 mM MgCl2, 5 mM 2-머캅토에탄올, 및 1 단위 T4 폴리뉴클레오타이드 키나제의 용액으로 처리하여 제거할 수 있다. 상기 반응은 37℃의 온도에서 1분간 진행된다.
"3'-포스페이트-차단된" 또는 "3'-포스페이트-보호된" 뉴클레오타이드는 3'-번 위치의 하이드록실기가 포스페이트 함유 모이어티의 존재에 의해 차단되는 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트-차단된 뉴클레오타이드의 예는 뉴클레오티딜-3'-포스페이트 모노에스테르/뉴클레오티딜-2',3'-사이클릭 포스페이트, 뉴클레오티딜-2'-포스페이트 모노에스테르 및 뉴클레오티딜-2' 또는 3'-알킬포스페이트 다이에스테르, 및 뉴클레오티딜-2' 또는 3'-피로포스페이트이다. 티오포스페이트 또는 이와 같은 화합물의 다른 유사체를 또한 사용할 수 있으나, 단 상기 치환은 포스파타제에 의해 유리 3'-OH를 생성시키는 탈인산화를 방지하지 않아야 한다.
3'-O-에스테르-보호된 dNTP 또는 3'-O-포스페이트-보호된 dNTP의 합성 및 효소 탈보호의 추가적인 예는 하기의 참고문헌에 기재되어 있다: Canard et al, Proc. Natl. Acad. Sci., 92:10859-10863 (1995); Canard et al, Gene, 148: 1-6 (1994); Cameron et al, Biochemistry, 16(23): 5120-5126 (1977); Rasolonjatovo et al, Nucleosides & Nucleotides, 18(4&5): 1021-1022 (1999); Ferrero et al, Monatshefte fur Chemie, 131: 585-616 (2000); Taunton-Rigby et al, J. Org. Chem., 38(5): 977-985 (1973); Uemura et al, Tetrahedron Lett., 30(29): 3819-3820 (1989); Becker et al, J. Biol. Chem., 242(5): 936-950 (1967); 첸(Tsien), 국제 특허 공보 WO1991/006678.
일부 실시태양에서, 변형된 뉴클레오타이드는 퓨린 또는 피리미딘 염기, 및 제거가능한 3'-OH 차단기가, 3' 탄소 원자가 하기 구조의 기에 부착되도록 공유적으로 부착된 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함한다:
-O-Z
이때 -Z는 -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" 및 -C(R')2-F 중 어느 하나이고, 이때 각각의 R"는 제거가능한 보호기이거나 그의 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도 기, 또는 연결기를 통해 부착된 검출가능한 표지이나; 단 일부 실시태양에서 이와 같은 치환체는 10개 이하의 탄소 원자 및/또는 5개 이하의 산소 또는 질소 헤테로원자를 갖거나; (R')2는 화학식 =C(R"')2의 기를 나타내고, 이때 각각의 R"'은 동일하거나 상이할 수 있으며 수소 및 할로겐 원자 및 알킬기를 포함하는 그룹 중에서 선택되나, 단 일부 실시태양에서 각각의 R"'의 알킬은 1 내지 3개의 탄소 원자를 갖고; 이때 상기 분자는 반응하여 중간체(이때 각각의 R"는 H로 교환되거나, Z가 -(R')2-F인 경우, F는 OH, SH 또는 NH2, 바람직하게는 OH로 교환된다)를 생성시키고, 상기 중간체는 수성 조건하에서 해리되어 유리 3'-OH를 갖는 분자를 제공하나; 단 Z가 -C(R')2-S-R"인 경우, 2개의 R' 기는 모두 H가 아니다. 특정한 실시태양에서, 상기 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이나, 단 이와 같은 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정한 실시태양에서, 상기 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')2-N3를 갖는다. 특정한 실시태양에서, Z는 아지도메틸 기이다.
일부 실시태양에서, Z는 200 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 절단가능한 유기 모이어티이다. 일부 실시태양에서, Z는 200 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는, 헤테로원자가 있거나 없는 효소 절단가능한 유기 모이어티이다. 다른 실시태양에서, Z는 200 이하의 분자량을 갖는 효소 절단가능한 에스테르기이다. 다른 실시태양에서, Z는 3'-포스포타제에 의해 절단가능한 포스페이트기이다. 일부 실시태양에서, 하기의 3'-포스파타제 중 하나 이상을 제조사의 권장 프로토콜과 함께 사용할 수 있다: T4 폴리뉴클레오타이드 키나제, 송아지 장 알칼리 포스파타제, 재조합 새우 알칼리 포스파타제(예를 들어 뉴잉글랜드 바이오랩스(미국 매사추세츠주 베벌리 소재)로부터 입수할 수 있다).
추가의 실시태양에서, 3'-차단된 뉴클레오타이드 트라이포스페이트는 3'-O-아지도메틸, 3'-OH-NH2 또는 3'-O-알릴기에 의해 차단된다. 다른 실시태양에서, 본 발명의 3'-O-차단기는 3'-O-메틸, 3'-O-(2-나이트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-3급-부톡시 에톡시, 3'-O-(2-시아노에틸), 3'-O-나이트로, 및 3'-O-프로파길을 포함한다. 다른 실시태양에서, 3'-차단된 뉴클레오타이드 트라이포스페이트는 3'-O-아지도메틸 또는 3'-O-NH2에 의해 차단된다. 이와 같은 3'-차단된 뉴클레오사이드 트라이포스페이트의 합성 및 용도는 하기 참고문헌에 개시되어 있다: 미국특허 제9410197호; 미국특허 제8808988호; 미국특허 제6664097호; 미국특허 제5744595호; 미국특허 제7544794호; 미국특허 제8034923호; 미국특허 제8212020호; 미국특허 제10472383호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105(27): 9145-9150 (2008)]; 및 유사 참고문헌.
일부 실시태양에서, 3'-O- 보호기는 전기화학적으로 불안정한 기이다. 즉, 보호기의 탈보호 또는 절단은 절단을 초래하는 보호기 부근의 전기화학적 조건을 변화시킴으로써 달성된다. 이러한 전기화학적 조건의 변화는 전압차 또는 빛과 같은 물리량을 변화시키거나 적용하여 보조 화학종을 활성화함으로써 야기될 수 있으며, 이는 차례로 pH의 증가 또는 감소와 같은, 보호기 부위에서의 전기화학적 조건의 변화를 야기한다. 일부 실시태양에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 소정의 값으로 변화될 때마다 절단되는 pH-민감성 보호기를 포함한다. 다른 실시태양에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변화될 때마다, 예를 들어 보호기의 부위에서 전압차를 증가 또는 감소시킴으로써 직접 절단되는 보호기를 포함한다.
변형 TdT의 생성
본 발명의 변이체는 공지된 참조 또는 야생형 TdT-암호화 폴리뉴클레오타이드를 돌연변이시킨 다음, 이를 통상적인 분자 생물학 기법을 사용하여 발현시킴으로써 생성될 수 있다. 예를 들어, 목적하는 유전자 또는 목적하는 서열의 폴리펩타이드를 암호화하는 DNA 단편을 통상적인 분자 생물학 기법을 사용하여, 예를 들어 문헌[Stemmer et al, Gene, 164: 49-53 (1995)]; 문헌[Kodumal et al, Proc. Natl. Acad. Sci., 101: 15573-15578 (2004)]; 등에 기재된 프로토콜을 사용하여 합성 단편으로부터 조립할 수 있거나, 이와 같은 유전자 또는 DNA 단편을 예를 들어 문헌[Boule et al, Mol. Biotechnology, 10: 199-208 (1998)], 또는 문헌[Bentolila et al, EMBO J., 14: 4221-4229 (1995)] 등에 기재된 통상적인 프로토콜을 사용하여 선택된 종의 세포로부터 직접 클로닝할 수 있다.
목적하는 TdT 변이체를 암호화하는 단리된 유전자를 pET32(노바겐(Novagen))와 같은 발현 벡터에 삽입하여 발현 벡터를 제공할 수 있으며, 이는 이후 통상적인 프로토콜을 사용하여 변형 TdT 단백질을 만들고 발현하는데 사용될 수 있다. 올바른 서열을 가진 벡터를 에스케리키아 콜라이 생산자 균주에서 형질전환시킬 수 있다.
형질전환된 균주를 통상적인 기법을 사용하여, TdT 단백질이 추출되는 펠렛으로 배양한다. 예를 들어, 미리 제조된 펠릿을 30 내지 37℃ 수욕에서 해동한다. 일단 완전히 해동되면, 펠릿을 50 mM 트리스-HCL(시그마) pH 7.5, 150 mM NaCl(시그마), 0.5 mM 머캅토에탄올(시그마), 5% 글리세롤(시그마), 20 mM 이미다졸(시그마) 및 프로테아제 칵테일 억제제(써모피셔(Thermofisher)) 100 ㎖ 1 탭으로 구성된 용해 완충액에 재현탁한다. 조기 용해 및 응집체의 잔류를 방지하기 위해 신중한 재현탁을 수행한다. 재현탁된 세포를 전체 색상 균일성이 획득될 때까지 여러 주기의 프렌치 프레스(French press)를 통해 용해시킨다. 사용되는 통상적인 압력은 14,000 psi이다. 이어서 용해물을 10,000 rpm에서 1시간 내지 1시간 30분 동안 원심분리한다. 원심분리물을 컬럼 정제 전에 임의의 찌꺼기를 제거하기 위해 0.2 ㎛ 필터에 통과시킨다.
TdT 단백질을 1-단계 친화성 과정으로 상기 원심분리물로부터 정제할 수 있다. 예를 들어, Ni-NTA 친화성 컬럼(GE 헬쓰케어(Healthcare))을 사용하여 TdT 폴리머라제를 결합시킬 수 있다. 초기에 컬럼을 세척하고 15 컬럼 부피의 50 mM 트리스-HCL(시그마) pH 7.5, 150 mM NaCl(시그마) 및 20 mM 이미다졸(시그마)로 평형화시킨다. TdT 폴리머라제를 평형화 후 컬럼에 결합시키고; 이어서, 예를 들어 50 mM 트리스-HCL(시그마) pH 7.5, 500 mM NaCl(시그마) 및 20 mM 이미다졸(시그마)로 구성된 세척 완충액을 15 컬럼 부피로 컬럼에 적용할 수 있다. 이러한 세척 후, TdT 폴리머라제를 50 mM 트리스-HCL(시그마) pH 7.5, 500 mM NaCl(시그마) 및 0.5 M 이미다졸(시그마)로 용출시킨다. 관심 TdT 폴리머라제의 최고 농도에 상응하는 분획을 수집하여 단일 샘플에 모았다. 상기 모은 분획을 투석 완충액(20 mM 트리스-HCl, pH 6.8, 200 mM NaCl, 50 mM MgOAc, 100 mM [NH4]2SO4)에 대해 투석시킨다. 후속적으로 투석물을 농축 필터(아미콘 울트라(Amicon Ultra)-30, 머크 밀리포어(Merk Millipore))를 사용하여 농축시킨다. 농축된 효소를 소량으로 나누고, 최종 50% 글리세롤을 첨가하고, 이어서 이들 분액을 -20℃에서 동결하여 장기간 보관한다. 5 ㎕의 다양한 정제된 효소 분획을 SDSPAGE 젤에서 분석한다.
일부 실시태양에서, TdT 변이체를, 공유 또는 비공유 결합; 아미노산 태그(예를 들어, 폴리-아미노산 태그, 폴리-His 태그, 6His-태그 등); 화합물(예를 들어, 폴리에틸렌 글리콜); 단백질-단백질 결합 쌍(예를 들어, 비오틴-아비딘); 친화성 커플링; 포획 탐침; 또는 이들의 임의의 조합을 포함하는 링커 모이어티에 작동가능하게 연결시킬 수 있다. 상기 링커 모이어티는 TdT 변이체와 분리되거나 TdT 변이체의 일부일 수 있다. 본 발명의 TdT 변이체와 함께 사용하기 위한 예시적인 His-태그는 MASSHHHHHHSSGSENLYFQTGSSG-(서열번호 54)이다. 상기 태그-링커 모이어티는 뉴클레오타이드 결합 활성, 또는 TdT 변이체의 촉매 활성을 방해하지 않는다.
상기 공정, 또는 균등한 공정은, 활성 및/또는 보존에 필요하거나 유용한 각종 시약, 예를 들어 염, pH 완충액, 담체 화합물 등과 혼합될 수 있는 단리된 TdT 변이체를 생성시킨다.
본 발명의 방법을 실행하기 위한 키트
본 발명은 본 발명의 방법을 실행하기 위한 다양한 키트를 포함한다. 하나의 태양에서, 본 발명의 키트는 본원에 기재된 바와 같은 무-주형 효소 폴리뉴클레오타이드 합성을 수행하기에 적합한 제형 중에 본 발명의 TdT 변이체를 포함한다. 이러한 키트는 또한 성장하는 가닥에 대한 3'-O-보호된 dNTP의 무-주형 첨가 또는 통합을 최적화하기 위한 반응 조건을 제공하는 합성 완충액을 포함할 수 있다. 일부 실시태양에서, 본 발명의 키트는 3'-O-가역적으로 보호된 dNTP를 추가로 포함한다. 이러한 실시태양에서, 3'-O-가역적으로 보호된 dNTP는 3'-O-아미노-dNTP 또는 3'-O-아지도메틸-dNTP를 포함할 수 있다. 추가 실시태양에서, 키트는 하기의 항목 중 하나 이상을 별도로 또는 함께 포함할 수 있다: (i) 본원에 기재된 바와 같은 탈보호 단계를 수행하기 위한 탈보호 시약, (ii) 개시제가 부착된 고체 지지체, (iii) 고체 지지체로부터 완료된 폴리뉴클레오타이드를 방출하기 위한 절단 시약, (iv) 효소 첨가 또는 커플링 단계의 끝에서 반응하지 않은 3'-O-보호된 dNTP를 제거하기 위한 세척 시약 또는 완충액, 및 (v) 합성-후 처리 시약, 예를 들어 정제 컬럼, 탈염 시약, 용출 시약 등. 일부 실시태양에서, 본 발명의 키트는 단일 작업으로 다중 합성 반응을 수행하기 위한 반응 웰의 배열을 포함할 수 있다. 일부 실시태양에서, 이러한 배열은 24-, 48-, 96-, 384- 또는 1536-웰을 포함하는 통상적인 필터 플레이트일 수 있다.
상기 (ii) 및 (iii) 항목과 관련하여, 특정 개시제 및 절단 시약은 함께 사용된다. 예를 들어, 이노신 절단가능한 뉴클레오타이드를 포함하는 개시제는 엔도뉴클레아제 V 절단 시약과 함께 제공될 수 있으며; 나이트로벤질 광절단성 링커를 포함하는 개시제는 광절단성 링커를 절단하기에 적합한 광원과 함께 제공될 수 있고; 우라실을 포함하는 개시제는 우라실 DNA 글리코실라제 절단 시약과 함께 제공될 수 있는 등이다.
실시예 1
TdT 변이체의 통합 활성 시험
표 5에 나열된 TdT 변이체는 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트 단량체를 사용하여 상술한 바와 같이 2개의 별도의 헤어핀 분석에서 정제 및 시험된 통상적인 기법을 사용하여 제조되었다. 분석에서 이들의 성능은 높은 통합률을 갖는 것으로 공지된 마우스-소 키메라 TdT(M57로 지정됨, 서열 번호 55)의 성능과 비교되었다.
명칭 | 서열번호 | ㎎/㎖ 발현 |
헤어핀 +G (%M57) |
헤어핀 +C (%M57) |
3'-OH (부가 없음) (%M57) |
B10 | 4 | 2.3 | 34 | 36 | 25 |
B19 | 7 | 1.0 | 83 | 107 | 42 |
B57 | 10 | 0.8 | 34 | 91 | 62 |
B59 | 13 | 2.8 | 9 | -73 | -1 |
B63 | 16 | 2.8 | 21 | 162 | 41 |
F15 | 19 | 7.3 | 54 | 625 | 85 |
F24 | 22 | 5.0 | 25 | 324 | 85 |
F32 | 25 | 5.8 | 35 | 536 | 91 |
F57 | 28 | 0.4 | 15 | 172 | 24 |
N100 | 31 | 8.1 | 31 | 90 | 10 |
N100or | 34 | 6.2 | 53 | 362 | 28 |
N14 | 37 | 2.8 | 69 | 510 | 96 |
N27 | 40 | 4.3 | 111 | 363 | 85 |
N35 | 43 | 2.8 | 70 | 480 | 101 |
N72 | 46 | 1.2 | 70 | 222 | 87 |
N93or | 49 | 0.4 | 37 | 267 | 61 |
M57 | 55 | 8.9 | 100 | 100 | 100 |
데이터에서 볼 수 있는 바와 같이 TdT 변이체 중 다수는 표준 M57보다 훨씬 더 큰 결합 효율을 가지고 있다. 반응은 저 농도의 3' 말단 dNTP(20 μM) 존재 하에서 수행되었으며, 따라서 증가는 주로 특정 dNTP에 대한 보다 양호한 친화도에 기인한다. 발현 수준은 Ni-NTA(50 ㎖ 배양물에서 유래된, 총 300 ㎕)로부터 용출 후의 단백질 농도에 상응한다.
정의
아미노산은 하기의 명명법에 따라 1-문자 또는 3-문자 암호로 표시된다: A: 알라닌(Ala); C: 시스테인(Cys); D: 아스파트산(Asp); E: 글루탐산(Glu); F: 페닐알라닌(Phe); G: 글리신(Gly); H: 히스티딘(His); I: 이소류신(Ile); K: 리신(Lys); L: 류신(Leu); M: 메티오닌(Met); N: 아스파라진(Asn); P: 프롤린(Pro); Q: 글루타민(Gln); R: 아르기닌(Arg); S: 세린(Ser); T: 쓰레오닌(Thr); V: 발린(Val); W: 트립토판(Trp) 및 Y: 타이로신(Tyr).
치환된 잔기와 관련하여 "기능적으로 동등한"은 변형 TdT의 치환된 잔기가 서열번호 1과 상동성인 서열을 갖는 또 다른 TdT의 서열에서 잔기와 동일한 기능적 역할을 가짐을 의미한다. 기능적으로 동등한 잔기는 서열 정렬을 사용함으로써, 예를 들어 Mutalin 라인 정렬 소프트웨어(http://multalin.toulouse.inra.fr/multalin/multalin.html; 1988, Nucl. Acids Res., 16 (22), 25 10881-10890)를 사용함으로써 식별될 수 있다. 정렬 후에, 기능적으로 동등한 잔기는 고려되는 다른 서열상의 상동성 위치에 있다. 서열 정렬 및 기능적으로 동등한 잔기의 식별은 임의의 TdT와, 종-간을 포함한 그의 천연 변이체 사이에서 밝혀질 수 있다.
단백질과 관련하여 "단리된"은 자연 환경의 구성 요소 또는 이질적인 반응 혼합물에서 확인 및 단리 및/또는 회수된 화합물을 의미한다. 자연 환경 또는 반응 혼합물의 오염 성분은 단백질의 기능을 방해할 수 있는 물질이며, 효소, 호르몬, 및 다른 단백질성 또는 비단백질성 용질을 포함할 수 있다. 일부 실시태양에서, 본 발명의 단백질을 (1) 로우리법에 의해 측정된 바와 같이 95 중량% 초과의 단백질로, (2) 회전 컵 서열분석기의 사용에 의한 N-말단 또는 내부 아미노산 서열 중 적어도 15개의 잔기를 획득하기에 충분한 정도로, 또는 (3) 쿠마씨 블루 또는 바람직하게는 은 염료를 사용하여 환원 또는 비환원 조건하에서 SDS-PAGE에 의해 균일성으로 정제한다. 재조합 방법에 의해 제조시, 본 발명의 단리된 단백질은 상기 단백질의 자연 환경의 적어도 하나의 성분이 존재하지 않을 것이므로, 재조합 세포내 제자리에 본 발명의 단백질을 포함할 수 있다. 통상적으로, 본 발명의 단리된 단백질을 적어도 하나의 정제 단계에 의해 제조한다.
"키트"는 본 발명의 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 임의의 전달 시스템을 지칭한다. 반응 분석의 맥락에서, 이러한 전달 시스템은 반응 시약(예를 들어, 적합한 용기 중의 하나 이상의 TdT 변이체, 반응 완충액, 3'-O-보호된-dNTP, 탈보호 시약, 개시제가 부착된 고체 지지체 등) 및/또는 지지 물질(예를 들어, 완충액, 분석 수행을 위한 서면 지침 등)의 보관, 수송, 또는 하나의 위치에서 또 다른 위치로의 전달을 허용하는 시스템 및/또는 화합물을 포함한다. 예를 들어, 키트는 관련된 반응 시약 및/또는 지지 물질을 함유하는 하나 이상의 인클로저(예를 들어 상자)를 포함한다. 이와 같은 내용물을 의도된 수령인에게 함께 또는 별도로 전달할 수 있다. 예를 들어, 제1 용기는 합성 방법에 사용하기 위한 하나 이상의 TdT 변이체를 함유할 수 있는 반면, 제2 또는 추가의 용기는 탈보호제, 개시제, 3'-O-보호된 dNTP를 갖는 고체 지지체 등을 함유할 수 있다.
호환가능하게 사용되는 "돌연변이체" 또는 "변이체"는 본원에 기재된 천연 또는 참조 TdT 폴리펩타이드로부터 유래되고 하나 이상의 위치에 변형 또는 변경, 즉 치환, 삽입, 및/또는 결실을 포함하는 폴리펩타이드를 지칭한다. 변이체는 당해 분야에 주지된 다양한 기법에 의해 수득될 수 있다. 특히, 야생형 단백질을 암호화하는 DNA 서열의 변경 기법의 예는 비제한적으로, 부위-지향된 돌연변이유발, 랜덤 돌연변이유발, 서열 셔플링 및 합성 올리고뉴클레오타이드 구성을 포함한다. 돌연변이유발 활성은 단백질 또는 본 발명의 경우에 폴리머라제의 서열 중 하나 또는 다수 아미노산의 결실, 삽입 또는 치환이다. 치환을 표시하는 데 하기의 용어가 사용된다: L238A는 참조 또는 야생형 서열의 238번 위치의 아미노산 잔기(류신, L)가 알라닌(A)으로 변화된 것을 나타낸다. 132V/I/M은 모 서열의 132번 위치의 아미노산 잔기(알라닌, A)가 하기의 아미노산 중 하나로 치환된 것을 나타낸다: 발린(V), 이소류신(I), 또는 메티오닌(M). 치환은 보존적이거나 비-보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산(아르기닌, 리신 및 히스티딘), 산성 아미노산(글루탐산 및 아스파트산), 극성 아미노산(글루타민, 아스파라진 및 쓰레오닌), 소수성 아미노산(메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산(페닐알라닌, 트립토판 및 타이로신), 및 작은 아미노산(글리신, 알라닌 및 세린)의 그룹 내에 있다.
"서열 일치성"은 2개 서열, 예를 들어 2개 폴리펩타이드 서열 또는 2개 폴리뉴클레오타이드 서열간의 합치(예를 들어 일치하는 아미노산 잔기)의 수(또는 대개는 백분율로서 표현되는 분율)를 지칭한다. 서열 일치성은 서열 갭을 최소화하면서 중첩 및 일치성을 최대화하도록 정렬될 때 서열을 비교함으로써 결정된다. 특히, 서열 일치성은 2개의 서열의 길이에 따라 다수의 수학적 전역 또는 국소 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열은 바람직하게는, 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘(예를 들어, Needleman 및 Wunsch 알고리즘; 문헌[Needleman 및 Wunsch, 1970])을 사용하여 정렬되는 반면, 실질적으로 다른 길이의 서열은 바람직하게는 국소 정렬 알고리즘(예를 들어 Smith 및 Waterman 알고리즘(문헌[Smith and Waterman, 1981]) 또는 Altschul 알고리즘(문헌[Altschul et al., 1997]; 문헌[Altschul et al., 2005]))을 사용하여 정렬된다. 아미노산 서열 일치성 퍼센트를 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/과 같은 인터넷 웹 사이트에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에서 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본원의 목적을 위해, 아미노산 서열 일치성% 값은, 모든 검색 매개변수가 기본값으로 설정되어 있는 Needleman-Wunsch 알고리즘, 즉 채점 행렬 = BLOSUM62, 갭 개방 = 10, 갭 확장 = 0.5, 단부 갭 벌점 = 거짓, 단부 갭 개방 = 10 및 단부 갭 확장 = 0.5를 사용하여 두 서열의 최적 전역 정렬을 생성시키는 쌍별 서열 정렬 프로그램 EMBOSS Needle을 사용하여 생성시킨 값을 의미한다.
"폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"는 호환가능하게 사용되며, 각각은 뉴클레오타이드 단량체 또는 이의 유사체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭(Watson-Crick) 유형의 염기 짝짓기, 염기 적층, 후그스틴(Hoogsteen) 또는 역 후그스틴 유형의 염기 짝짓기 등과 같은 단량체 대 단량체 상호작용의 규칙적인 패턴을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이들의 뉴클레오사이드간 연결은 자연 발생적일 수 있거나 이의 유사체, 예를 들어 자연 발생 또는 비-자연 발생 유사체일 수 있다. 비-자연 발생 유사체는 PNA, 포스포로티오에이트 뉴클레오사이드간 연결, 형광단 또는 합텐과 같은 표지의 부착을 허용하는 연결기를 함유하는 염기 등을 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 폴리머라제에 의한 연장, 리가제에 의한 결찰 등과 같은 효소적 처리를 필요로 할 때마다, 당업자는 이러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 뉴클레오사이드간 연결, 당 모이어티, 또는 임의의 또는 일부 위치의 염기의 특정 유사체를 함유하지 않음을 이해할 것이다. 폴리뉴클레오타이드는 전형적으로, 대개 "올리고뉴클레오타이드"라고 지칭하는 경우 몇 개의 단량체 단위, 예를 들어 5-40개에서 수천 개의 단량체 단위까지 크기가 다양하다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 일련의 문자(대문자 또는 소문자)로 표시될 때마다, 상기 뉴클레오타이드는 왼쪽에서 오른쪽으로 5'->3' 순서이고, "A"는 데옥시아데노신을 나타내고, "C"는 데옥시시티딘을 나타내고, "G"는 데옥시구아노신을 나타내고, "T"는 티미딘을 나타내고, "I"는 데옥시이노신을 나타내고, "U"는 문맥에서 달리 나타내거나 명백하지 않는 한 우리딘을 나타냄을 알 것이다. 달리 명시되지 않는 한, 용어 및 원자 번호 지정 규칙은 문헌[Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999)]에 개시된 바를 따를 것이다. 대개 폴리뉴클레오타이드는 포스포다이에스테르 결합에 의해 연결된 4개의 천연 뉴클레오사이드(예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘 또는 RNA의 경우 리보스 대응물)를 포함하나, 이들은 또한 예를 들어 변형된 염기, 당, 또는 뉴클레오사이드간 연결을 포함하는 비-천연 뉴클레오타이드 유사체를 포함할 수 있다. 효소가 활성을 위한 특정 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요건, 예를 들어 단일 가닥 DNA, RNA/DNA 듀플렉스 등을 갖는 경우, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질에 대한 적합한 조성의 선택은 특히 문헌[Sambrook et al, Molecular Cloning, Second Edition (Cold Spring Harbor Laboratory, New York, 1989)]과 같은 논문의 지침 및 유사한 참고문헌을 통해 통상의 기술을 가진 사람의 지식 내에서 잘 이루어진다는 것은 당업자에게 명백하다. 마찬가지로, 올리고뉴클레오타이드 및 폴리뉴클레오타이드는 단일 가닥 형태 또는 이중 가닥 형태(즉, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 및 이의 각각의 보체의 듀플렉스)를 지칭할 수 있다. 어느 형태인지 또는 두 형태 모두가 용어 사용의 맥락에서 의도되었는지 여부는 당업자에게 명백할 것이다.
"프라이머"는 폴리뉴클레오타이드 주형과 듀플렉스를 형성할 때, 핵산 합성의 개시점으로 작용할 수 있고 주형을 따라 3' 단부에서 연장되어 연장된 듀플렉스를 형성시킬 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 프라이머의 연장은 대개 DNA 또는 RNA 폴리머라제와 같은 핵산 폴리머라제로 수행된다. 연장 과정에서 추가되는 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 폴리머라제에 의해 연장된다. 프라이머는 대개 14개 내지 40개 뉴클레오타이드 범위, 또는 18개 내지 36개 뉴클레오타이드 범위의 길이를 갖는다. 프라이머는 다양한 핵산 증폭 반응, 예를 들어 단일 프라이머를 사용하는 선형 증폭 반응 또는 둘 이상의 프라이머를 사용하는 폴리머라제 연쇄 반응에 사용된다. 특정 적용을 위한 프라이머의 길이와 서열을 선택하기 위한 지침은 참고로 포함되는 하기의 참고문헌에 의해 입증된 바와 같이 당업자에게 주지되어 있다: Dieffenbach, editor, PCR Primer: A Laboratory Manual, 2nd Edition (Cold Spring Harbor Press, New York, 2003).
"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, "치환"이라는 용어는 아미노산 잔기가, 자연-발생 표준 20개 아미노산 잔기, 희귀 자연 발생 아미노산 잔기(예를 들어, 하이드록시프롤린, 하이드록시리신, 알로하이드록시리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라진, 알로-이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린), 및 비-자연 발생 아미노산 잔기(종종, 합성적으로 제조된다)(예를 들어, 사이클로헥실-알라닌) 중에서 선택된 또 다른 것에 의해 교체됨을 지칭한다. 바람직하게는, "치환"이라는 용어는 아미노산 잔기의, 천연-발생 표준 20개 아미노산 잔기 중에서 선택된 또 다른 아미노산 잔기에 의한 교체를 지칭한다. "+" 기호는 대체 조합을 나타낸다.
본 개시내용은 제시된 특정 형태의 범위로 제한되도록 의도되지 않고, 여기에 설명된 변형의 대안, 변형 및 균등물을 포함하도록 의도된다. 또한, 본 개시내용의 범위는 본 개시내용의 관점에서 당업자에게 명백해질 수 있는 다른 변화를 완전히 포함한다. 본 발명의 범위는 첨부된 청구범위에 의해서만 제한된다.
SEQUENCE LISTING
<110> DNA SCRIPT
<120> TERMINAL DEOXYNUCLEOTIDYL TRANSFERASE VARIANTS AND USES THEREOF
<130> B3257PC00
<140> PCT/EP2021/059861
<141> 2021-04-16
<150> EP 20170405.3
<151> 2020-04-20
<160> 55
<170> PatentIn version 3.5
<210> 1
<211> 510
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> Wild type mouse TdT
<400> 1
Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro
1 5 10 15
Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe
20 25 30
Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg
35 40 45
Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu
50 55 60
Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser
65 70 75 80
Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser
85 90 95
Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly
100 105 110
Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn
115 120 125
Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala
130 135 140
Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
145 150 155 160
Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala
165 170 175
Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met
180 185 190
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met
195 200 205
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile
210 215 220
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val
225 230 235 240
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
245 250 255
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
260 265 270
Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
275 280 285
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
290 295 300
Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
305 310 315 320
Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
325 330 335
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
340 345 350
Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
355 360 365
Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr
370 375 380
Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His
385 390 395 400
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His
405 410 415
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
420 425 430
Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
450 455 460
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg
465 470 475 480
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
500 505 510
<210> 2
<211> 382
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B10: trunc wt serinus canaria TdT
<400> 2
Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala
1 5 10 15
Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile
65 70 75 80
Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile
85 90 95
Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu
100 105 110
Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val
115 120 125
Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu
130 135 140
Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly
145 150 155 160
Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala
165 170 175
Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro
180 185 190
Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile
195 200 205
Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp
210 215 220
Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu
225 230 235 240
Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu
245 250 255
Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala
260 265 270
Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr
275 280 285
Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg
340 345 350
Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 3
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B10 trunc new
<400> 3
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala
50 55 60
Ser Leu Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp Ile
65 70 75 80
Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Arg Ile Ile Glu Glu
85 90 95
Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Glu
130 135 140
Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Val Thr Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Ile Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu
210 215 220
Asp Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln
245 250 255
Leu Pro Ser Arg Lys Val Asp Ala Met Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Ser Asn
275 280 285
Thr Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 4
<211> 408
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B10
<400> 4
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Val Thr Lys Val Ser Gln Tyr Ser
35 40 45
Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp
50 55 60
Ala Phe Glu Val Met Ala Glu Asn Tyr Glu Phe Lys Glu Asn Glu Glu
65 70 75 80
Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Leu Leu Lys Ser Leu Pro
85 90 95
Phe Pro Val Thr Arg Met Lys Asp Ile Gln Gly Leu Pro Cys Met Gly
100 105 110
Asp Gln Val Arg Arg Ile Ile Glu Glu Ile Ile Glu Glu Gly Glu Ser
115 120 125
Ser Arg Val Lys Glu Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Gln Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Tyr Arg Met Gly Leu Arg Thr Val Glu Glu Val Lys Ala Asp Lys Thr
165 170 175
Leu Lys Leu Ser Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile
195 200 205
Val Lys Asn Thr Val Val Thr Phe Leu Pro Asp Ala Leu Val Thr Ile
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Ile Asp Phe
225 230 235 240
Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp Glu Glu Leu Leu His Lys
245 250 255
Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile
260 265 270
Ile Glu Ser Thr Phe Val Lys Glu Gln Leu Pro Ser Arg Lys Val Asp
275 280 285
Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln
290 295 300
Pro Arg Val Asp Asn Ser Thr Ser Asn Thr Ser Lys Lys Leu Glu Met
305 310 315 320
Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
325 330 335
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala
340 345 350
Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Ser His Glu Arg Lys Met
355 360 365
Ile Leu Asp Asn His Ala Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu
370 375 380
Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
385 390 395 400
Val Glu Pro Trp Glu Arg Asn Ala
405
<210> 5
<211> 370
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B19 trunc wt (Neopelma chrysocephalum)(saffron-crested neopelma)
<400> 5
Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala
20 25 30
Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu
35 40 45
Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met
50 55 60
Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg
115 120 125
Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser
145 150 155 160
Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser
165 170 175
Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly
195 200 205
Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys
210 215 220
Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val
225 230 235 240
Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln
245 250 255
Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser
260 265 270
Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala
290 295 300
Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly
325 330 335
Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg
355 360 365
Asn Ala
370
<210> 6
<211> 370
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B19 trunc new
<400> 6
Ser Ser Val Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala
20 25 30
Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Phe Leu Pro Phe Pro Val Thr Arg Met
50 55 60
Lys Asp Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg
115 120 125
Thr Leu Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Ser
145 150 155 160
Lys Ala Glu Ala Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Val
165 170 175
Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Leu
180 185 190
Gly Lys Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly
195 200 205
Pro Arg Glu Asp Glu Glu Leu Leu His Lys Val Val Asp Leu Trp Lys
210 215 220
Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val
225 230 235 240
Lys Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln
245 250 255
Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser
260 265 270
Ser Tyr Asn Thr Ser Lys Lys Phe Asp Met Ala Glu Val Lys Asp Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala
290 295 300
Tyr Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn His Ala
325 330 335
Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Arg Glu Arg
355 360 365
Asn Ala
370
<210> 7
<211> 395
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B19
<400> 7
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Ser Val Ser Lys Val Ser
20 25 30
Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn Lys Lys
35 40 45
Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn Tyr Glu Phe Lys Glu
50 55 60
Asn Glu Ile Phe Cys Leu Glu Phe Arg Arg Ala Ala Ser Val Leu Lys
65 70 75 80
Phe Leu Pro Phe Pro Val Thr Arg Met Lys Asp Ile Gln Gly Leu Pro
85 90 95
Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu Glu Ile Ile Glu Glu
100 105 110
Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu Arg Tyr Lys
115 120 125
Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser
130 135 140
Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala
145 150 155 160
Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly Phe Leu Tyr
165 170 175
Tyr Glu Asp Leu Ala Glu Arg Val Ser Lys Ala Glu Ala Asp Ala Val
180 185 190
Ser Leu Ile Val Lys Asn Thr Val Val Thr Phe Leu Pro Asp Ala Leu
195 200 205
Val Thr Ile Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp
210 215 220
Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp Glu Glu Leu
225 230 235 240
Leu His Lys Val Val Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr
245 250 255
Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu Pro Ser Arg
260 265 270
Lys Val Asp Ala Met Asp Asn Phe Gln Lys Cys Phe Ala Ile Leu Lys
275 280 285
Leu Tyr Gln Pro Arg Val Asp Asn Ser Ser Tyr Asn Thr Ser Lys Lys
290 295 300
Phe Asp Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
305 310 315 320
Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr
325 330 335
Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
340 345 350
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Arg Arg Lys Arg
355 360 365
Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly
370 375 380
Leu Asp Tyr Val Glu Pro Arg Glu Arg Asn Ala
385 390 395
<210> 8
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B57 trunc wt (Alligator sinensis)
<400> 8
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile
65 70 75 80
Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala
145 150 155 160
Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu
210 215 220
Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys
245 250 255
Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn
275 280 285
Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 9
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B57 trunc new
<400> 9
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Met Asn Asp Ile
65 70 75 80
Gln Gly Leu Pro Trp Met Gly Asp Gln Val Lys Arg Val Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Glu Val Leu Asn Asp
100 105 110
Glu Lys Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Thr Lys Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Thr Pro Gly Pro Glu Glu
210 215 220
Glu Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Ile Ile Glu Ser Thr Phe Glu Lys Thr Lys
245 250 255
Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu His Lys Gln Arg Val Asp Asn Gly Asn Ser Asn
275 280 285
Gln Ser Lys Glu Phe Asp Lys Glu Glu Thr Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Arg Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 10
<211> 408
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B57
<400> 10
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Val Asp Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp
50 55 60
Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly
65 70 75 80
Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro
85 90 95
Phe Thr Ile Val Arg Met Asn Asp Ile Gln Gly Leu Pro Trp Met Gly
100 105 110
Asp Gln Val Lys Arg Val Ile Glu Glu Ile Leu Glu Glu Gly Glu Ser
115 120 125
Ser Lys Val Lys Glu Val Leu Asn Asp Glu Lys Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Thr
165 170 175
Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile
195 200 205
Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asp Ala Leu Val Thr Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Thr Pro Gly Pro Glu Glu Glu Glu Glu Leu Leu His Lys
245 250 255
Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp Ile
260 265 270
Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val Asp
275 280 285
Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Lys
290 295 300
Gln Arg Val Asp Asn Gly Asn Ser Asn Gln Ser Lys Glu Phe Asp Lys
305 310 315 320
Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
325 330 335
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala
340 345 350
Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met
355 360 365
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu
370 375 380
Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
385 390 395 400
Leu Glu Pro Trp Glu Arg Asn Ala
405
<210> 11
<211> 380
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B59 trunc wt (Xenopus laevis)
<400> 11
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu
1 5 10 15
Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp
20 25 30
Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe
35 40 45
Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser
50 55 60
Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu
65 70 75 80
Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys
145 150 155 160
Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu
165 170 175
Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val
180 185 190
Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys
210 215 220
Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly
225 230 235 240
Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys
245 250 255
Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile
275 280 285
Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp
290 295 300
Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys
340 345 350
Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu
355 360 365
Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 12
<211> 380
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B59 trunc new
<400> 12
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu
1 5 10 15
Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Gln Asp
20 25 30
Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Gly Pro Cys Val Ala Phe Arg Arg Ala Ser
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Val Ala Met Lys Asp Leu
65 70 75 80
Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Arg Ile Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Lys Ser Ser Lys Val Val Glu Val Met Asn Asp
100 105 110
Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Ile Lys Ser Asp Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Ala
145 150 155 160
Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Ala Val Ser Lys Ala Glu
165 170 175
Ala Glu Ala Val Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val
180 185 190
Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Ile Leu Ile Thr Thr Pro Arg Lys Gly Glu
210 215 220
Lys Glu Glu Ile Leu His Lys Thr Ile Asn Val Leu Lys Lys Arg Gly
225 230 235 240
Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys
245 250 255
Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Thr Ile Leu Lys Leu Gln Lys Gln Gln Leu Asp Asn Gly Asn Ser Asn
275 280 285
Glu Pro Phe Glu Thr Glu Lys Lys Asn Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Ile Thr Pro Tyr Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Lys Arg Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Asn Ile Phe Leu Lys Ala Asn Ser Glu Glu Asp Ile Phe Thr His Leu
355 360 365
Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 13
<211> 405
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B59
<400> 13
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Glu Val Lys Val Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Gln Asp Thr Asn Arg Ile Phe Thr Asp
50 55 60
Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly
65 70 75 80
Pro Cys Val Ala Phe Arg Arg Ala Ser Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Pro Ile Val Ala Met Lys Asp Leu Glu Gly Leu Pro Trp Leu Gly
100 105 110
Asp Gln Met Lys Arg Ile Ile Glu Glu Ile Leu Glu Glu Gly Lys Ser
115 120 125
Ser Lys Val Val Glu Val Met Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Glu Ile Lys Ser Asp Lys Glu
165 170 175
Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Leu Leu Tyr Tyr Glu Asp
180 185 190
Ile Thr Ser Ala Val Ser Lys Ala Glu Ala Glu Ala Val Glu Gln Leu
195 200 205
Ile Lys Ser Ile Val Trp Lys Phe Val Pro Asp Ala Ile Val Thr Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Ile
225 230 235 240
Leu Ile Thr Thr Pro Arg Lys Gly Glu Lys Glu Glu Ile Leu His Lys
245 250 255
Thr Ile Asn Val Leu Lys Lys Arg Gly Leu Leu Leu Phe Tyr Asn Ile
260 265 270
Ile Glu Ser Thr Phe Asp Glu Thr Lys Leu Pro Ser Arg His Val Asp
275 280 285
Ala Leu Asp His Phe Gln Lys Cys Phe Thr Ile Leu Lys Leu Gln Lys
290 295 300
Gln Gln Leu Asp Asn Gly Asn Ser Asn Glu Pro Phe Glu Thr Glu Lys
305 310 315 320
Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Tyr Glu
325 330 335
Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn
340 345 350
Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Arg Met Met Leu Asp
355 360 365
Asn His Ala Leu Tyr Asp Lys Thr Lys Asn Ile Phe Leu Lys Ala Asn
370 375 380
Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu Asp Tyr Leu Glu Pro
385 390 395 400
Trp Glu Arg Asn Ala
405
<210> 14
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B63 trunc wt (Notechis scutatus)
<400> 14
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn
20 25 30
Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala
50 55 60
Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile
65 70 75 80
Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu
180 185 190
Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln
210 215 220
Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys
245 250 255
Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val
275 280 285
Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe
355 360 365
Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 15
<211> 384
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B63 trunc new
<400> 15
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Ser Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Val Asn Asp Ile
65 70 75 80
Glu Gly Leu Pro Trp Met Gly Glu Gln Val Lys Arg Ile Ile Glu Asp
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asn
100 105 110
Glu Asn Tyr Arg Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Asp Lys Asn Leu Lys Leu Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu His Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Ala Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu
180 185 190
Pro Asn Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln
210 215 220
Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Leu Trp Lys Lys Gln
225 230 235 240
Gly Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Lys Thr
245 250 255
Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys
260 265 270
Phe Ala Ile Leu Lys Leu His Lys Glu Arg Val Asp Lys Gly Asn Ser
275 280 285
Ile Gln Ser Lys Ala Phe Ala Glu Glu Glu Thr Lys Asp Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Val Thr Pro Phe Glu Gln Tyr Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg
325 330 335
Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 16
<211> 409
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> B63
<400> 16
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Val Asp Ser Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp
50 55 60
Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly
65 70 75 80
Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro
85 90 95
Phe Thr Ile Val Arg Val Asn Asp Ile Glu Gly Leu Pro Trp Met Gly
100 105 110
Glu Gln Val Lys Arg Ile Ile Glu Asp Ile Leu Glu Glu Gly Glu Ser
115 120 125
Ser Lys Val Lys Ala Val Leu Asn Asn Glu Asn Tyr Arg Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Asn
165 170 175
Leu Lys Leu Thr Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp
180 185 190
Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile
195 200 205
Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asn Ala Leu Val Thr Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Val Pro Gly Ser Arg Gln Glu Glu Glu Glu Leu Leu His
245 250 255
Thr Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp
260 265 270
Leu Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val
275 280 285
Asp Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His
290 295 300
Lys Glu Arg Val Asp Lys Gly Asn Ser Ile Gln Ser Lys Ala Phe Ala
305 310 315 320
Glu Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Val
325 330 335
Thr Pro Phe Glu Gln Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser
340 345 350
Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys
355 360 365
Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe
370 375 380
Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp
385 390 395 400
Tyr Leu Glu Pro Trp Glu Arg Asn Ala
405
<210> 17
<211> 367
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F15 trunc wt (Salmo truttal)
<400> 17
Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr
1 5 10 15
Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala
20 25 30
Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu
50 55 60
Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val
65 70 75 80
Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val
85 90 95
Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg
115 120 125
Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met
130 135 140
Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser
145 150 155 160
Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His
165 170 175
Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu
195 200 205
Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg
210 215 220
Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp
225 230 235 240
Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu
245 250 255
Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp
260 265 270
Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val
275 280 285
Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu
290 295 300
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe
305 310 315 320
Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp
325 330 335
Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe
340 345 350
Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala
355 360 365
<210> 18
<211> 367
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F15 trunc new
<400> 18
Ser Ser Val Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Met Glu Asn His Asn Lys Ile Phe Thr Asp Ala Phe Glu Val Leu Ala
20 25 30
Glu Asn Ser Glu Phe Asn Glu Ser Lys Glu Ser Arg Asp Ala Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val Arg Ser Leu
50 55 60
Gly Asp Thr Glu Gly Leu Pro Cys Leu Gly Glu His Thr Lys Arg Val
65 70 75 80
Ile Glu Glu Ile Leu Glu Tyr Gly Arg Ser Ser Lys Val Glu Asp Ile
85 90 95
Leu Ser Asp Glu Arg Tyr Gln Thr Met Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg
115 120 125
Ser Leu Glu Glu Val Arg Ala Glu Pro Ser Ile His Leu Asn Arg Met
130 135 140
Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Arg Val Ser
145 150 155 160
Lys Ala Glu Ala Lys Ala Leu Gly Asn Ile Ile Glu Glu Thr Val His
165 170 175
Ala Ile Ala Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Leu
180 185 190
Gly Lys Glu Phe Gly His Asp Val Asp Phe Ile Leu Thr Thr Pro Glu
195 200 205
Met Gly Lys Glu Glu Gly Leu Leu Pro Arg Val Ile Asp Arg Leu Arg
210 215 220
Asn Gln Gly Ile Leu Leu Tyr Cys Asp Tyr Gln Glu Ser Thr Phe Asp
225 230 235 240
Met Ser Lys Leu Pro Ser Arg Thr Phe Glu Ala Met Asp His Phe Gln
245 250 255
Lys Cys Phe Leu Ile Ile Lys Leu Lys Glu Gly Leu Val Glu Gly Glu
260 265 270
Gly Gly Leu Gln Ser Asp Pro Gly Asp Arg Arg Gly Trp Arg Ala Val
275 280 285
Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Ala Leu
290 295 300
Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Phe
305 310 315 320
Ala Arg Leu Glu Arg Arg Met Leu Leu Asp Asn His Ala Leu Tyr Asp
325 330 335
Lys Thr Lys Lys Ile Phe Leu Pro Ala Lys Thr Glu Glu Asp Ile Phe
340 345 350
Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
355 360 365
<210> 19
<211> 392
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F15
<400> 19
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Ser Val Ala Thr Val Ser
20 25 30
Gln Tyr Ala Cys Gln Arg Arg Thr Thr Met Glu Asn His Asn Lys Ile
35 40 45
Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Ser Glu Phe Asn Glu
50 55 60
Ser Lys Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys
65 70 75 80
Ser Leu Pro Ser Ala Val Arg Ser Leu Gly Asp Thr Glu Gly Leu Pro
85 90 95
Cys Leu Gly Glu His Thr Lys Arg Val Ile Glu Glu Ile Leu Glu Tyr
100 105 110
Gly Arg Ser Ser Lys Val Glu Asp Ile Leu Ser Asp Glu Arg Tyr Gln
115 120 125
Thr Met Lys Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala
130 135 140
Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Leu Glu Glu Val Arg Ala
145 150 155 160
Glu Pro Ser Ile His Leu Asn Arg Met Gln Arg Ala Gly Phe Leu Tyr
165 170 175
Tyr Arg Asp Ile Ser Lys Arg Val Ser Lys Ala Glu Ala Lys Ala Leu
180 185 190
Gly Asn Ile Ile Glu Glu Thr Val His Ala Ile Ala Pro Asp Ala Ile
195 200 205
Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp
210 215 220
Val Asp Phe Ile Leu Thr Thr Pro Glu Met Gly Lys Glu Glu Gly Leu
225 230 235 240
Leu Pro Arg Val Ile Asp Arg Leu Arg Asn Gln Gly Ile Leu Leu Tyr
245 250 255
Cys Asp Tyr Gln Glu Ser Thr Phe Asp Met Ser Lys Leu Pro Ser Arg
260 265 270
Thr Phe Glu Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Ile Lys
275 280 285
Leu Lys Glu Gly Leu Val Glu Gly Glu Gly Gly Leu Gln Ser Asp Pro
290 295 300
Gly Asp Arg Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val Ala Pro
305 310 315 320
Pro Val Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro
325 330 335
Gln Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg Met
340 345 350
Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu
355 360 365
Pro Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Glu Tyr
370 375 380
Ile Glu Pro Trp Gln Arg Asn Ala
385 390
<210> 20
<211> 377
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F24 trunc wt (Electrophorus electricus)
<400> 20
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu
1 5 10 15
Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn
20 25 30
His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr
35 40 45
Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met
65 70 75 80
Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu
85 90 95
Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp
100 105 110
Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu
130 135 140
Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu
165 170 175
Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser
180 185 190
Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys
210 215 220
Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys
245 250 255
Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe
260 265 270
Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp
275 280 285
Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val
290 295 300
Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser
305 310 315 320
Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg
325 330 335
Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe
340 345 350
Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp
355 360 365
Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 21
<211> 377
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F24 trunc new
<400> 21
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu
1 5 10 15
Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn
20 25 30
His Asn Lys Ile Phe Thr Asp Ala Leu Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Ser Asp Ser Lys Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Thr Pro Leu Arg Ser Leu Gln Asp Thr
65 70 75 80
Glu Gly Leu Pro Cys Leu Gly Glu Glu Thr Lys Arg Val Ile Glu Glu
85 90 95
Ile Phe Glu Glu Gly Ser Ser Ser Arg Val Glu Asp Ile Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Leu Glu
130 135 140
Gln Val Arg Ser Asp Pro Ser Ile His Leu Asn Arg Met Gln Thr Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Lys Ala Glu
165 170 175
Ala Lys Ala Leu Gly Asn Ile Ile Glu Glu Thr Ala Ser Ala Phe Ser
180 185 190
Pro Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Leu Leu Thr Val Pro Glu Pro Gly Lys
210 215 220
Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Ser Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Phe Gln Glu Ser Thr Phe Asp Leu Ser Lys
245 250 255
Leu Pro Ser Arg Arg Phe Glu Ala Met Asp His Phe Gln Lys Cys Phe
260 265 270
Leu Ile Val Lys Leu Lys Ala Gly Leu Val Glu Gly Glu Gly Ala Asp
275 280 285
Pro Gly Asp Arg Arg Asp Trp Arg Ala Val Arg Val Asp Leu Val Ala
290 295 300
Pro Pro Val Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser
305 310 315 320
Ala Phe Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Gly
325 330 335
Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe
340 345 350
Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp
355 360 365
Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 22
<211> 402
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F24
<400> 22
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Leu Pro Thr Val Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asp Asn His Asn Lys Ile Phe Thr Asp
50 55 60
Ala Leu Glu Val Leu Ala Glu Asn Tyr Glu Phe Ser Asp Ser Lys Glu
65 70 75 80
Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Thr Pro Leu Arg Ser Leu Gln Asp Thr Glu Gly Leu Pro Cys Leu Gly
100 105 110
Glu Glu Thr Lys Arg Val Ile Glu Glu Ile Phe Glu Glu Gly Ser Ser
115 120 125
Ser Arg Val Glu Asp Ile Leu Ser Asp Glu Arg Tyr Gln Thr Leu Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala Glu Lys Trp
145 150 155 160
Tyr Arg Arg Gly Leu Arg Ser Leu Glu Gln Val Arg Ser Asp Pro Ser
165 170 175
Ile His Leu Asn Arg Met Gln Thr Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Ile Ser Lys Pro Val Ser Lys Ala Glu Ala Lys Ala Leu Gly Asn Ile
195 200 205
Ile Glu Glu Thr Ala Ser Ala Phe Ser Pro Ser Val Thr Ile Thr Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp Val Asp Phe
225 230 235 240
Leu Leu Thr Val Pro Glu Pro Gly Lys Glu Asp Gly Leu Leu Pro Ala
245 250 255
Val Ile Asp Arg Leu Arg Ser Gln Gly Ile Leu Leu Tyr Ser Asp Phe
260 265 270
Gln Glu Ser Thr Phe Asp Leu Ser Lys Leu Pro Ser Arg Arg Phe Glu
275 280 285
Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Val Lys Leu Lys Ala
290 295 300
Gly Leu Val Glu Gly Glu Gly Ala Asp Pro Gly Asp Arg Arg Asp Trp
305 310 315 320
Arg Ala Val Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala
325 330 335
Phe Ala Leu Leu Gly Trp Ser Gly Ser Ala Phe Phe Asn Arg Asp Leu
340 345 350
Arg Arg Phe Ala Arg Leu Glu Arg Gly Met Leu Leu Asp Asn His Ala
355 360 365
Leu Tyr Asp Lys Thr Thr Asn Thr Phe Leu Gln Ala Lys Thr Glu Glu
370 375 380
Asp Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Gln Arg
385 390 395 400
Asn Ala
<210> 23
<211> 378
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F32 trunc wt (Anabas testudineus)
<400> 23
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn
20 25 30
Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr
35 40 45
Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr
65 70 75 80
Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu
85 90 95
Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr
180 185 190
Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys
210 215 220
Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser
275 280 285
Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln
325 330 335
His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 24
<211> 378
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F32 trunc new
<400> 24
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn
20 25 30
Asn Asn Lys Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr
35 40 45
Glu Phe Asn Glu Met Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Ser Leu Gly Ala Thr
65 70 75 80
Gln Asp Leu Pro Cys Leu Gly Glu His Thr Lys Arg Val Met Glu Glu
85 90 95
Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Glu
130 135 140
Asp Ile Arg Ala Glu Pro Ser Ile His Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr
180 185 190
Pro Asp Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Leu Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Leu Gly Lys
210 215 220
Glu Glu Ser Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Lys Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Tyr Gln Ala Ser Thr Phe Asp Met Ser Lys
245 250 255
Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Gln Val Glu Gly Gly Leu Asn Ser
275 280 285
Ala Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Met Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly
305 310 315 320
Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Phe Ala Arg Met Glu Arg
325 330 335
Arg Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Ala Ala Thr Thr Glu Lys Asp Ile Phe Ala His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 25
<211> 403
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F32
<400> 25
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Val Ala Thr Val Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Thr Glu Asn Asn Asn Lys Ile Phe Thr Asp
50 55 60
Ala Phe Glu Val Leu Ala Glu Ser Tyr Glu Phe Asn Glu Met Glu Glu
65 70 75 80
Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Trp Ala Val Gln Ser Leu Gly Ala Thr Gln Asp Leu Pro Cys Leu Gly
100 105 110
Glu His Thr Lys Arg Val Met Glu Glu Ile Leu Gln Tyr Gly Arg Ser
115 120 125
Phe Glu Val Glu Lys Ile Leu Ser Asp Glu Arg Tyr Gln Thr Leu Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Pro Lys Thr Ala Glu Lys Trp
145 150 155 160
Tyr Arg Arg Gly Leu Arg Ser Phe Glu Asp Ile Arg Ala Glu Pro Ser
165 170 175
Ile His Leu Asn Arg Met Gln Gln Ser Gly Phe Leu His Tyr Gly Asp
180 185 190
Ile Ser Arg Ala Val Ser Lys Ala Glu Ala Arg Ala Leu Gly Asn Ile
195 200 205
Ile Asp Glu Ala Val His Ala Ile Thr Pro Asp Ala Ile Leu Ala Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Glu Phe Gly His Asp Val Asp Phe
225 230 235 240
Ile Val Thr Thr Pro Glu Leu Gly Lys Glu Glu Ser Leu Leu Pro Asn
245 250 255
Ile Ile Asp Arg Leu Lys Lys Gln Gly Ile Leu Leu Tyr Ser Asp Tyr
260 265 270
Gln Ala Ser Thr Phe Asp Met Ser Lys Leu Pro Ser His Arg Phe Glu
275 280 285
Ala Met Asp His Phe Ala Lys Cys Phe Leu Ile Leu Arg Leu Glu Gly
290 295 300
Ser Gln Val Glu Gly Gly Leu Asn Ser Ala Glu Gly Asp Ser Arg Gly
305 310 315 320
Trp Arg Ala Val Arg Val Asp Leu Val Ser Pro Pro Met Asp Arg Tyr
325 330 335
Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp
340 345 350
Leu Arg Arg Phe Ala Arg Met Glu Arg Arg Met Leu Leu Asp Asn His
355 360 365
Ala Leu Tyr Asp Lys Thr Lys Lys Glu Phe Leu Ala Ala Thr Thr Glu
370 375 380
Lys Asp Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Trp Gln
385 390 395 400
Arg Asn Ala
<210> 26
<211> 378
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F57 trunc wt
<400> 26
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn
20 25 30
Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr
65 70 75 80
Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu
85 90 95
Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr
180 185 190
Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys
210 215 220
Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg
275 280 285
Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg
325 330 335
Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 27
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> F57 trunc new (Poecilia reticulate)
<400> 27
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Gly Phe Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Thr Ile Val Arg Met Asn Asp Ile
65 70 75 80
Gln Gly Leu Pro Trp Met Gly Asp Gln Val Lys Arg Val Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Glu Val Leu Asn Asp
100 105 110
Glu Lys Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Thr Lys Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Ile Ser Arg Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Ile Val Lys Asp Thr Val Trp Lys Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Leu Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Thr Pro Gly Pro Glu Glu
210 215 220
Glu Glu Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Ile Ile Glu Ser Thr Phe Glu Lys Thr Lys
245 250 255
Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu His Lys Gln Arg Val Asp Asn Gly Asn Ser Asn
275 280 285
Gln Ser Lys Glu Phe Asp Lys Glu Glu Thr Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Arg Ile Phe Leu Lys Ala Ala Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 28
<211> 408
<212> PRT
<213> ARTIFICIAL SEQUNECE
<220>
<223> F57
<400> 28
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ser Val Asp Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp
50 55 60
Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly
65 70 75 80
Phe Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe Leu Pro
85 90 95
Phe Thr Ile Val Arg Met Asn Asp Ile Gln Gly Leu Pro Trp Met Gly
100 105 110
Asp Gln Val Lys Arg Val Ile Glu Glu Ile Leu Glu Glu Gly Glu Ser
115 120 125
Ser Lys Val Lys Glu Val Leu Asn Asp Glu Lys Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Tyr Arg Met Gly Leu Arg Thr Leu Glu Glu Val Lys Ala Asp Lys Thr
165 170 175
Leu Lys Leu Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Ile Ser Arg Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile
195 200 205
Val Lys Asp Thr Val Trp Lys Phe Leu Pro Asp Ala Leu Val Thr Leu
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Thr Pro Gly Pro Glu Glu Glu Glu Glu Leu Leu His Lys
245 250 255
Val Ile Asp Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr Asp Ile
260 265 270
Ile Glu Ser Thr Phe Glu Lys Thr Lys Leu Pro Ser Arg Thr Val Asp
275 280 285
Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Lys
290 295 300
Gln Arg Val Asp Asn Gly Asn Ser Asn Gln Ser Lys Glu Phe Asp Lys
305 310 315 320
Glu Glu Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
325 330 335
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Ala
340 345 350
Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met
355 360 365
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu
370 375 380
Lys Ala Ala Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
385 390 395 400
Leu Glu Pro Trp Glu Arg Asn Ala
405
<210> 29
<211> 366
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N100 trunc wt (short Rattus norvegicus)
<400> 29
Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala
20 25 30
Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met
50 55 60
Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
165 170 175
Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
195 200 205
Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe
210 215 220
Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr
225 230 235 240
Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His
245 250 255
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg
260 265 270
Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg
275 280 285
Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu
290 295 300
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
305 310 315 320
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
325 330 335
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
340 345 350
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 30
<211> 366
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N100 trunc new
<400> 30
Ser Val Val Gln Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Leu Asn Asn His Asn Glu Val Phe Thr Arg Ala Phe Asp Ile Leu Ala
20 25 30
Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg
35 40 45
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile Ser Met
50 55 60
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Thr Leu Glu Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Asn
145 150 155 160
Arg Ala Glu Ala Glu Ala Ile Glu Met Leu Val Lys Glu Ala Val Val
165 170 175
Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu
180 185 190
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
195 200 205
Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
210 215 220
Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr
225 230 235 240
Phe Glu Lys Phe Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His
245 250 255
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gly Arg Val Val
260 265 270
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
275 280 285
Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu
290 295 300
Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala
305 310 315 320
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
325 330 335
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
340 345 350
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 31
<211> 391
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N100
<400> 31
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Val Val Gln Lys Ile Ser
20 25 30
Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn His Asn Glu Val
35 40 45
Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu
50 55 60
Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser Ser Val Leu Lys
65 70 75 80
Ser Leu Pro Phe Pro Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro
85 90 95
Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp
100 105 110
Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys
115 120 125
Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala
130 135 140
Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Lys Ser
145 150 155 160
Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr
165 170 175
Tyr Glu Asp Leu Ala Glu Arg Val Asn Arg Ala Glu Ala Glu Ala Ile
180 185 190
Glu Met Leu Val Lys Glu Ala Val Val Ala Phe Leu Pro Asp Ala Leu
195 200 205
Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met Thr Gly His Asp
210 215 220
Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln
225 230 235 240
Gln Leu Leu His Lys Val Thr Asp Phe Trp Arg Gln Gln Gly Leu Leu
245 250 255
Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro
260 265 270
Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile
275 280 285
Leu Lys Leu His His Gly Arg Val Val Ser Glu Lys Ser Gly Gln Gln
290 295 300
Glu Gly Lys Gly Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro
305 310 315 320
Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Phe
325 330 335
Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met
340 345 350
Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu
355 360 365
Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile
370 375 380
Glu Pro Trp Glu Arg Asn Ala
385 390
<210> 32
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUNECE
<220>
<223> N100or trunk wt (long Rattus norvegicus)
<400> 32
Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln
225 230 235 240
Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys
245 250 255
Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu
275 280 285
Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 33
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N100or trunc new
<400> 33
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val
1 5 10 15
Gln Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn Glu Leu Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Asn Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln
225 230 235 240
Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys
245 250 255
Phe Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu
275 280 285
Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Pro Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 34
<211> 404
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N100or
<400> 34
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Val Val Gln Lys Ile Ser Glu Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn His Asn Glu Leu Phe Thr Arg
50 55 60
Ala Phe Asp Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu
65 70 75 80
Ser Arg Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Ser
85 90 95
Phe Pro Ile Val Ser Met Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly
100 105 110
Asp Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser
165 170 175
Leu Arg Phe Thr His Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Arg Val Asn Arg Ala Glu Ala Glu Ala Val Ser Met Leu
195 200 205
Val Lys Glu Ala Val Val Ala Phe Leu Pro Asp Ala Leu Val Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Met Thr Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu
245 250 255
His Lys Val Thr Asn Phe Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys
260 265 270
Asp Ile Ile Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Thr
275 280 285
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
290 295 300
His Arg Gly Leu Val Arg Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys
305 310 315 320
Asp Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg
325 330 335
Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg
340 345 350
Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn
355 360 365
His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala Glu Ser
370 375 380
Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp
385 390 395 400
Glu Arg Asn Ala
<210> 35
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N14 trunc wt (Piliocolobus tephrosceles)
<400> 35
Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln
275 280 285
Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 36
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N14 trunc new
<400> 36
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Glu Ile Phe Thr Arg Ala Phe Asp Ile Leu Ala Glu Asn Ser
35 40 45
Glu Phe Arg Glu Asn Glu Asp Ser Tyr Val Thr Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Arg Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Arg Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Gly Ser Asp Gln
275 280 285
Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 37
<211> 404
<212> PRT
<213> ARTIFICIAL SEQUNECE
<220>
<223> N14
<400> 37
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Val Val Gln Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg
50 55 60
Ala Phe Asp Ile Leu Ala Glu Asn Ser Glu Phe Arg Glu Asn Glu Asp
65 70 75 80
Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly
100 105 110
Ser Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Val Arg Ser Asp Glu Ser
165 170 175
Leu Lys Phe Thr Arg Met Gln Arg Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu
195 200 205
Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Met Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln Gln Leu Leu
245 250 255
Gln Lys Val Met Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr
260 265 270
Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Arg Leu Pro Ser Arg Thr
275 280 285
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Phe Lys Leu
290 295 300
Pro Leu Gln Arg Val Gly Ser Asp Gln Ser Ser Trp Gln Glu Gly Lys
305 310 315 320
Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg
325 330 335
Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg
340 345 350
Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn
355 360 365
His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser
370 375 380
Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp
385 390 395 400
Glu Arg Asn Ala
<210> 38
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N27 trunc wt (Sus scrofa)
<400> 38
Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val
1 5 10 15
Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg
225 230 235 240
Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys
245 250 255
Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met
275 280 285
Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 39
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N27 trunc new
<400> 39
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val
1 5 10 15
Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Ile Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys
275 280 285
Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 40
<211> 404
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N27
<400> 40
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg
50 55 60
Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu
65 70 75 80
Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly
100 105 110
Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Thr
165 170 175
Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu
195 200 205
Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Pro Gly Ser Thr Glu Glu Glu Glu Gln Gln Leu Leu
245 250 255
His Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr
260 265 270
Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Thr
275 280 285
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
290 295 300
His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys
305 310 315 320
Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg
325 330 335
Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg
340 345 350
Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn
355 360 365
His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser
370 375 380
Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp
385 390 395 400
Glu Arg Asn Ala
<210> 41
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N35 trunc wt (Panthera tigris altaica)
<400> 41
Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val
1 5 10 15
Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg
225 230 235 240
Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys
275 280 285
Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 42
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N35 trunc new
<400> 42
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val
1 5 10 15
Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Arg
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys
275 280 285
Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 43
<211> 410
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N35
<400> 43
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg
50 55 60
Ala Phe Glu Val Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu
65 70 75 80
Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly
100 105 110
Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Thr
165 170 175
Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Ala Glu Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu
195 200 205
Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Pro Gly Ser Thr Glu Glu Glu Glu Gln Gln Leu Leu
245 250 255
Pro Lys Val Ile Asn Leu Trp Glu Arg Lys Gly Leu Leu Leu Tyr Tyr
260 265 270
Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys
275 280 285
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
290 295 300
His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys
305 310 315 320
Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg
325 330 335
Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg
340 345 350
Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn
355 360 365
His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser
370 375 380
Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp
385 390 395 400
Glu Arg Asn Ala Ala Ala Ala Ile Gly Cys
405 410
<210> 44
<211> 365
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N72 trunc wt (Bubalus bubalis)
<400> 44
Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
20 25 30
Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met
50 55 60
Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
165 170 175
Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly
195 200 205
Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
210 215 220
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
225 230 235 240
Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe
245 250 255
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser
260 265 270
Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
275 280 285
Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly
290 295 300
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr
305 310 315 320
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
325 330 335
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
340 345 350
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 45
<211> 366
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N72 trunc new
<400> 45
Ser Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg Ala Phe Glu Ile Leu Ala
20 25 30
Glu Asn Tyr Glu Phe Lys Glu Asn Glu Glu Ser Tyr Val Thr Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met
50 55 60
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Ser Leu Glu Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
165 170 175
Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu
180 185 190
Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly
195 200 205
Ser Thr Glu Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Leu
210 215 220
Trp Glu Arg Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr
225 230 235 240
Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Ala Leu Asp His
245 250 255
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Gly
260 265 270
Ser Gly Lys Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg
275 280 285
Val Asp Leu Val Met Cys Pro Tyr Glu Gln Arg Ala Phe Ala Leu Leu
290 295 300
Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala
305 310 315 320
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
325 330 335
Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala
340 345 350
His Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn Ala
355 360 365
<210> 46
<211> 391
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N72
<400> 46
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Val Val Lys Lys Ile Ser
20 25 30
Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Ile
35 40 45
Phe Thr Arg Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Phe Lys Glu
50 55 60
Asn Glu Glu Ser Tyr Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys
65 70 75 80
Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro
85 90 95
Cys Leu Gly Asp Lys Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp
100 105 110
Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln
115 120 125
Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser
130 135 140
Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Glu Lys Ile Arg Ser
145 150 155 160
Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala Gly Phe Leu Tyr
165 170 175
Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val
180 185 190
Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe
195 200 205
Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp
210 215 220
Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln
225 230 235 240
Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Arg Lys Gly Leu Leu
245 250 255
Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro
260 265 270
Ser Arg Gln Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile
275 280 285
Leu Lys Leu His His Gln Arg Val Gly Ser Gly Lys Ser Ser Gln Gln
290 295 300
Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro
305 310 315 320
Tyr Glu Gln Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe
325 330 335
Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met
340 345 350
Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys
355 360 365
Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile
370 375 380
Glu Pro Arg Glu Arg Asn Ala
385 390
<210> 47
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N93or trunc wt (Marmota flaviventris)
<400> 47
Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val
1 5 10 15
Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys
275 280 285
Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 48
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N93or trunc new
<400> 48
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ala Val
1 5 10 15
Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Glu Ser Ser Val Val Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Arg Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Arg Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Arg Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Asn
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys
275 280 285
Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn Ala
370 375
<210> 49
<211> 404
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N93or
<400> 49
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Val Pro Ala Pro Ala Val Gln Thr Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Arg Val Phe Thr Asp
50 55 60
Ala Phe Asp Val Leu Ala Glu Asn Tyr Glu Phe Arg Glu Asn Glu Glu
65 70 75 80
Ser Ser Val Val Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Thr Ile Ile Ser Met Arg Asp Leu Glu Gly Ile Pro Cys Leu Glu
100 105 110
Gly Lys Ala Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser
165 170 175
Leu Lys Phe Thr His Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Arg Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu
195 200 205
Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Ile Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Asn Ile Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Ala Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu
245 250 255
His Lys Val Thr Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Cys
260 265 270
Asp Leu Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Thr
275 280 285
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
290 295 300
His His Gln Arg Val Asp Ser Asp Lys Ala Ser Gln Gln Gly Gly Lys
305 310 315 320
Asn Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg
325 330 335
Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg
340 345 350
Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn
355 360 365
His Ala Leu Tyr Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser
370 375 380
Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Arg
385 390 395 400
Glu Arg Asn Ala
<210> 50
<211> 18
<212> DNA
<213> ARTIFICIAL SEQUENCE
<220>
<223> PRIMER
<400> 50
aaaaaaaaaa aaaagggg 18
<210> 51
<211> 12
<212> DNA
<213> ARTIFICIAL SEQUENCE
<220>
<223> PRIMER
<400> 51
cagttaaaaa ct 12
<210> 52
<211> 11
<212> DNA
<213> ARTIFICIAL SEQUENCE
<220>
<223> PRIMER
<400> 52
gagttaaaac t 11
<210> 53
<211> 10
<212> DNA
<213> ARTIFICIAL SEQUENCE
<220>
<223> PRIMER
<400> 53
cagcaaggct 10
<210> 54
<211> 25
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> affinity tag for purifying TdT variants
<400> 54
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly
20 25
<210> 55
<211> 403
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> M57 (with affinity tag)
<400> 55
Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn
1 5 10 15
Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro Val Pro Gly
20 25 30
Ser Gln Asn Ala Pro Ala Pro Val Val Lys Lys Ile Ser Gln Tyr Ala
35 40 45
Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Glu Leu Phe Thr Arg
50 55 60
Ala Leu Asp Ile Leu Ala Glu Asn Asp Glu Phe Arg Glu Asn Glu Glu
65 70 75 80
Ser Arg Asp Ala Phe Arg Arg Ala Ser Ser Val Leu Lys Ser Leu Pro
85 90 95
Phe Pro Ile Thr Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly
100 105 110
Asp Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser
115 120 125
Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys
130 135 140
Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala Glu Lys Trp
145 150 155 160
Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser Asp Lys Ser
165 170 175
Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp
180 185 190
Leu Val Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu
195 200 205
Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met
210 215 220
Thr Gly Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe
225 230 235 240
Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro
245 250 255
Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp
260 265 270
Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val
275 280 285
Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His
290 295 300
His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr
305 310 315 320
Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg
325 330 335
Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp
340 345 350
Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His
355 360 365
Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu
370 375 380
Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu
385 390 395 400
Arg Asn Ala
Claims (12)
- 서열번호 2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44 또는 47 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체로서,
서열번호 2에 관하여, 61번 위치의 류신이 치환되고, 170번 위치의 시스테인이 치환되고, 204번 위치의 아르기닌이 치환되고, 326번 위치의 아르기닌이 치환되고, 329번 위치의 글리신이 치환되고;
서열번호 5에 관하여, 48번 위치의 류신이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 314번 위치의 아르기닌이 치환되고, 317번 위치의 글리신이 치환되고;
서열번호 8에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 329번 위치의 글루탐산이 치환되고;
서열번호 11에 관하여, 61번 위치의 류신이 치환되고, 171번 위치의 타이로신이 치환되고, 205번 위치의 아르기닌이 치환되고, 324번 위치의 아르기닌이 치환되고, 327번 위치의 글루탐산이 치환되고;
서열번호 14에 관하여, 61번 위치의 글리신이 치환되고, 205번 위치의 아르기닌이 치환되고, 327번 위치의 아르기닌이 치환되고, 330번 위치의 글루탐산이 치환되고;
서열번호 17에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 158번 위치의 알라닌이 치환되고, 192번 위치의 아르기닌이 치환되고, 311번 위치의 아르기닌이 치환되고, 314번 위치의 글루탐산이 치환되고;
서열번호 20에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 프롤린이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 321번 위치의 쓰레오닌이 치환되고, 324번 위치의 글루탐산이 치환되고;
서열번호 23에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 325번 위치의 글루탐산이 치환되고;
서열번호 26에 관하여, 61번 위치의 아르기닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 171번 위치의 알라닌이 치환될 수도 있거나 치환되지 않을 수도 있고, 205번 위치의 아르기닌이 치환되고, 322번 위치의 아르기닌이 치환되고, 325번 위치의 글루탐산이 치환되고;
서열번호 29에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 310번 위치의 아르기닌이 치환되고, 313번 위치의 글루탐산이 치환되고;
서열번호 32에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 35에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 38에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 41에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
서열번호 44에 관하여, 48번 위치의 메티오닌이 치환되고, 158번 위치의 시스테인이 치환되고, 192번 위치의 아르기닌이 치환되고, 309번 위치의 아르기닌이 치환되고, 312번 위치의 글루탐산이 치환되고;
서열번호 47에 관하여, 61번 위치의 메티오닌이 치환되고, 171번 위치의 시스테인이 치환되고, 205번 위치의 아르기닌이 치환되고, 323번 위치의 아르기닌이 치환되고, 326번 위치의 글루탐산이 치환되고;
이때 상기 TdT 변이체가 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, TdT 변이체. - 제1항에 있어서,
서열번호 2, 8 또는 11의 61번 위치 또는 서열번호 5의 48번 위치에서 류신에 대한 치환이 R 및 Q로 이루어지는 그룹 중에서 선택되고,
서열번호 2의 170번 위치 또는 서열번호 5, 29 또는 44의 158번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 171번 위치에서 시스테인에 대한 치환이 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 시스테인에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
서열번호 8 또는 11의 171번 위치에서 타이로신에 대한 치환이 G, R, P, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
서열번호 17의 158번 위치 또는 서열번호 23 또는 26의 171번 위치에서 알라닌에 대한 치환이 G, R, P, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 알라닌에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
서열번호 20의 171번 위치에서 프롤린에 대한 치환이 G, R, A, V, S, N, Q 및 D로 이루어지는 그룹 중에서 선택되고; 다른 실시태양에서, 상기 위치에서 타이로신에 대한 치환이 G 및 R로 이루어지는 그룹 중에서 선택되고;
서열번호 2의 204번 위치 또는 서열번호 5, 17, 29 또는 44의 192번 위치 또는 서열번호 8, 11, 14, 20, 23, 26, 32, 35, 38, 41 또는 47의 205번 위치에서 아르기닌에 대한 치환이 L 및 N으로 이루어지는 그룹 중에서 선택되고;
서열번호 2의 326번 위치 또는 서열번호 5의 314번 위치 또는 서열번호 8 또는 14의 327번 위치 또는 서열번호 11의 324번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 321번 위치 또는 서열번호 23 또는 26의 322번 위치 또는 서열번호 29의 310번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 323번 위치 또는 서열번호 44의 309번 위치에서 아르기닌에 대한 치환이 P, N 및 A로 이루어지는 그룹 중에서 선택되고;
서열번호 20의 321번 위치에서 쓰레오닌에 대한 치환이 P, N 및 A로 이루어지는 그룹 중에서 선택되고;
서열번호 2 또는 5의 329번 위치에서 글리신에 대한 치환이 N, L, T 및 S로 이루어지는 그룹 중에서 선택되고;
서열번호 8 또는 14의 330번 위치 또는 서열번호 11의 327번 위치 또는 서열번호 17의 311번 위치 또는 서열번호 20의 324번 위치 또는 서열번호 23 또는 26의 325번 위치 또는 서열번호 29의 313번 위치 또는 서열번호 32, 35, 38, 41 또는 47의 326번 위치 또는 서열번호 44의 312번 위치에서 글루탐산에 대한 치환이 N, L, T 및 S로 이루어지는 그룹 중에서 선택되는,
TdT 변이체. - 제1항 또는 제2항에 있어서,
서열번호 2에 관하여, 327번 위치의 글루타민이 치환되고;
서열번호 5에 관하여, 315번 위치의 글루탐산이 치환되고;
서열번호 8에 관하여, 328번 위치의 글루타민이 치환되고;
서열번호 11에 관하여, 325번 위치의 글루타민이 치환되고;
서열번호 14에 관하여, 328번 위치의 글루타민이 치환되고;
서열번호 17에 관하여, 312번 위치의 글루타민이 치환되고;
서열번호 20에 관하여, 322번 위치의 글루타민이 치환되고;
서열번호 23에 관하여, 323번 위치의 글루타민이 치환되고;
서열번호 26에 관하여, 323번 위치의 메티오닌이 치환되고;
서열번호 29에 관하여, 311번 위치의 글루타민이 치환되고;
서열번호 32에 관하여, 324번 위치의 글루타민이 치환되고;
서열번호 35에 관하여, 324번 위치의 글루타민이 치환되고;
서열번호 38에 관하여, 324번 위치의 글루타민이 치환되고;
서열번호 41에 관하여, 324번 위치의 글루타민이 치환되고;
서열번호 44에 관하여, 310번 위치의 글루타민이 치환되고;
서열번호 47에 관하여, 324번 위치의 글루타민이 치환되는,
TdT 변이체. - 제3항에 있어서,
글루타민이 T, F, L, M, I, V 및 Y로 이루어지는 그룹 중에서 선택된 아미노산으로 치환되는, TdT 변이체. - 제1항 내지 제4항 중 어느 한 항에 있어서,
3'-O-변형된 뉴클레오타이드가 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-2'-데옥시뉴클레오사이드 트라이포스페이트 및 3'-O-알릴-2'-데옥시뉴클레오사이드 트라이포스페이트로 이루어지는 그룹 중에서 선택되는, TdT 변이체. - 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체로서,
서열번호 3에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
서열번호 6에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 314가 P이고, 아미노산 위치 317이 N이고;
서열번호 9에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
서열번호 12에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 A이고, 아미노산 위치 205가 L이고, 아미노산 위치 324가 P이고, 아미노산 위치 327이 N이고;
서열번호 15에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 328이 P이고, 아미노산 위치 331이 N이고;
서열번호 18에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 311이 P이고, 아미노산 위치 314가 N이고;
서열번호 21에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 P이고, 아미노산 위치 205가 L이고, 아미노산 위치 321이 A이고, 아미노산 위치 324가 N이고;
서열번호 24에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 A이고, 아미노산 위치 205가 L이고, 아미노산 위치 322가 A이고, 아미노산 위치 325가 N이고;
서열번호 27에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 327이 A이고, 아미노산 위치 330이 N이고;
서열번호 30에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 310이 P이고, 아미노산 위치 313이 N이고;
서열번호 33에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
서열번호 36에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 A이고, 아미노산 위치 326이 N이고;
서열번호 39에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
서열번호 42에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 A이고, 아미노산 위치 326이 N이고;
서열번호 45에 관하여, 아미노산 위치 48이 R이고, 아미노산 위치 158이 R이고, 아미노산 위치 192가 L이고, 아미노산 위치 310이 A이고, 아미노산 위치 313이 N이고;
서열번호 48에 관하여, 아미노산 위치 61이 R이고, 아미노산 위치 171이 R이고, 아미노산 위치 205가 L이고, 아미노산 위치 323이 P이고, 아미노산 위치 326이 N이고;
이때 상기 TdT 변이체가 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 핵산 단편의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, TdT 변이체. - 제6항에 있어서,
서열번호 3에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 6에 관하여, 아미노산 위치 315가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 9에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 12에 관하여, 아미노산 위치 325가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 15에 관하여, 아미노산 위치 329가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 18에 관하여, 아미노산 위치 312가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 21에 관하여, 아미노산 위치 322가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 24에 관하여, 아미노산 위치 323이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 27에 관하여, 아미노산 위치 328이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 30에 관하여, 아미노산 위치 311이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 33에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 36에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 39에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 42에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 45에 관하여, 아미노산 위치 311이 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되고;
서열번호 48에 관하여, 아미노산 위치 324가 Q이거나 T, F, L 및 M으로 이루어지는 그룹 중에서 선택되는,
TdT 변이체. - 제6항 또는 제7항에 있어서,
3'-O-변형된 뉴클레오타이드가 3'-O-아미노-2'-데옥시뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-2'-데옥시뉴클레오사이드 트라이포스페이트 및 3'-O-알릴-2'-데옥시뉴클레오사이드 트라이포스페이트로 이루어지는 그룹 중에서 선택되는, TdT 변이체. - 서열번호 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 및 48 중에서 선택된 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하고, (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 폴리뉴클레오타이드의 유리 3'-하이드록실상에 3'-O-변형된 뉴클레오타이드를 통합시킬 수 있는, 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT) 변이체.
- a) 유리 3'-하이드록실을 갖는 3'-말단 뉴클레오타이드를 갖는 개시제를 제공하는 단계; 및
b) (i) 신장 조건하에서 유리 3'-O-하이드록실을 갖는 상기 개시제 또는 신장된 단편을, 3'-O-차단된 뉴클레오사이드 트라이포스페이트 및 제1항 내지 제9항 중 어느 한 항에 따른 TdT 변이체와 접촉시켜, 상기 개시제 또는 신장된 단편이 3'-O-차단된 뉴클레오사이드 트라이포스페이트의 통합에 의해 신장되어 3'-O-차단된 신장된 단편을 형성하고, (ii) 상기 신장된 단편을 차단해제(deblocking)하여 유리 3'-하이드록실을 갖는 신장된 단편을 형성하는 주기를, 상기 폴리뉴클레오타이드가 형성될 때까지 반복하는 단계
를 포함하는, 소정의 서열을 갖는 폴리뉴클레오타이드의 합성 방법. - 제10항에 있어서,
3'-O-차단된 뉴클레오사이드 트라이포스페이트가 3'-O-NH2-뉴클레오사이드 트라이포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트라이포스페이트 또는 3'-O-알릴-뉴클레오사이드 트라이포스페이트인, 방법. - a) 제1항 내지 제9항 중 어느 한 항에 따른 TdT 변이체;
b) 하나 이상의 3'-O-보호된 뉴클레오사이드 트라이포스페이트; 및
c) 임의로 하나 이상의 개시제
를 포함하는, 뉴클레오타이드 통합 반응을 수행하기 위한 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20170405.3 | 2020-04-20 | ||
EP20170405 | 2020-04-20 | ||
PCT/EP2021/059861 WO2021213903A1 (en) | 2020-04-20 | 2021-04-16 | Terminal deoxynucleotidyl transferase variants and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002825A true KR20230002825A (ko) | 2023-01-05 |
Family
ID=70390759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227040201A KR20230002825A (ko) | 2020-04-20 | 2021-04-16 | 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230159903A1 (ko) |
EP (1) | EP4139446A1 (ko) |
JP (1) | JP2023522234A (ko) |
KR (1) | KR20230002825A (ko) |
CN (1) | CN115427559A (ko) |
AU (1) | AU2021260014A1 (ko) |
CA (1) | CA3175780A1 (ko) |
IL (1) | IL297425A (ko) |
WO (1) | WO2021213903A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230317208A1 (en) | 2022-03-31 | 2023-10-05 | Ribbon Biolabs Gmbh | Biopolymer synthesis |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5367066A (en) | 1984-10-16 | 1994-11-22 | Chiron Corporation | Oligonucleotides with selectably cleavable and/or abasic sites |
EP0450060A1 (en) | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
US5436143A (en) | 1992-12-23 | 1995-07-25 | Hyman; Edward D. | Method for enzymatic synthesis of oligonucleotides |
AU1436995A (en) | 1993-12-30 | 1995-07-17 | Chemgenes Corporation | Synthesis of propargyl modified nucleosides and phosphoramidites and their incorporation into defined sequence oligonucleotides |
AU689924B2 (en) | 1994-06-23 | 1998-04-09 | Affymax Technologies N.V. | Photolabile compounds and methods for their use |
US5808045A (en) | 1994-09-02 | 1998-09-15 | Andrew C. Hiatt | Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides |
US5763594A (en) | 1994-09-02 | 1998-06-09 | Andrew C. Hiatt | 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds |
US5830655A (en) | 1995-05-22 | 1998-11-03 | Sri International | Oligonucleotide sizing using cleavable primers |
US5700642A (en) | 1995-05-22 | 1997-12-23 | Sri International | Oligonucleotide sizing using immobilized cleavable primers |
EP1632496A1 (en) | 1998-06-22 | 2006-03-08 | Affymetrix, Inc. | Reagents and methods for solid phase synthesis and display |
JP2002538790A (ja) | 1999-03-08 | 2002-11-19 | プロトジーン・ラボラトリーズ・インコーポレーテッド | 長いdna配列を経済的に合成し、そして組み立てるための方法および組成物 |
US6664097B2 (en) | 2000-05-23 | 2003-12-16 | North Carolina State University | Polynucleotide encoding a Lactobacillus gasseri beta-glucuronidase polypeptide |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
CA2491925A1 (en) | 2002-07-08 | 2004-01-15 | Shell Canada Limited | Choke for controlling the flow of drilling mud |
US7947817B2 (en) | 2003-06-30 | 2011-05-24 | Roche Molecular Systems, Inc. | Synthesis and compositions of 2'-terminator nucleotides |
US8212020B2 (en) | 2005-03-11 | 2012-07-03 | Steven Albert Benner | Reagents for reversibly terminating primer extension |
US7544794B1 (en) | 2005-03-11 | 2009-06-09 | Steven Albert Benner | Method for sequencing DNA and RNA by synthesis |
WO2008042067A2 (en) | 2006-09-28 | 2008-04-10 | Illumina, Inc. | Compositions and methods for nucleotide sequencing |
US8034923B1 (en) | 2009-03-27 | 2011-10-11 | Steven Albert Benner | Reagents for reversibly terminating primer extension |
EP2876166B1 (en) | 2013-11-20 | 2016-12-14 | Roche Diagnostics GmbH | New compound for sequencing by synthesis |
FR3020071B1 (fr) * | 2014-04-17 | 2017-12-22 | Dna Script | Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede |
FR3052462A1 (fr) | 2016-06-14 | 2017-12-15 | Dna Script | Variants d'une adn polymerase de la famille polx |
US10472383B2 (en) | 2017-03-16 | 2019-11-12 | Steven A Benner | Nucleoside triphosphates with stable aminoxy groups |
US20210164008A1 (en) * | 2017-05-26 | 2021-06-03 | Nuclera Nucleics Ltd. | Use of Terminal Transferase Enzyme in Nucleic Acid Synthesis |
WO2019051250A1 (en) | 2017-09-08 | 2019-03-14 | Sigma-Aldrich Co. Llc | SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION |
US10435676B2 (en) * | 2018-01-08 | 2019-10-08 | Dna Script | Variants of terminal deoxynucleotidyl transferase and uses thereof |
WO2020099451A1 (en) * | 2018-11-14 | 2020-05-22 | Dna Script | Terminal deoxynucleotidyl transferase variants and uses thereof |
CA3122494A1 (en) * | 2018-12-13 | 2020-06-18 | Dna Script | Direct oligonucleotide synthesis on cells and biomolecules |
-
2021
- 2021-04-16 CN CN202180029834.3A patent/CN115427559A/zh active Pending
- 2021-04-16 KR KR1020227040201A patent/KR20230002825A/ko unknown
- 2021-04-16 WO PCT/EP2021/059861 patent/WO2021213903A1/en unknown
- 2021-04-16 CA CA3175780A patent/CA3175780A1/en active Pending
- 2021-04-16 JP JP2022563942A patent/JP2023522234A/ja active Pending
- 2021-04-16 EP EP21717925.8A patent/EP4139446A1/en active Pending
- 2021-04-16 AU AU2021260014A patent/AU2021260014A1/en active Pending
- 2021-04-16 US US17/919,649 patent/US20230159903A1/en active Pending
-
2022
- 2022-10-19 IL IL297425A patent/IL297425A/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20230159903A1 (en) | 2023-05-25 |
CA3175780A1 (en) | 2021-10-28 |
AU2021260014A1 (en) | 2022-11-17 |
EP4139446A1 (en) | 2023-03-01 |
JP2023522234A (ja) | 2023-05-29 |
CN115427559A (zh) | 2022-12-02 |
IL297425A (en) | 2022-12-01 |
WO2021213903A1 (en) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11859217B2 (en) | Terminal deoxynucleotidyl transferase variants and uses thereof | |
AU2019205606A1 (en) | Variants of Terminal deoxynucleotidyl Transferase and uses thereof | |
US20230062303A1 (en) | Chimeric Terminal Deoxynucleotidyl Transferases For Template-Free Enzymatic Synthesis Of Polynucleotides | |
KR20210125496A (ko) | 폴리뉴클레오티드의 주형-유리 효소 합성에서 효율적 생성물 절단 | |
JP2022543569A (ja) | ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成 | |
KR20230002825A (ko) | 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 | |
CN115135770A (zh) | 使用无歧化作用末端脱氧核苷酸转移酶变体的多核苷酸无模板酶学合成 | |
JP2023501651A (ja) | ポリヌクレオチドの高効率テンプレートなしの酵素的合成 | |
US20240093256A1 (en) | Stabilized N-Terminally Truncated Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof | |
JP2024511874A (ja) | G4を形成しやすいポリヌクレオチドの酵素合成のための方法及びキット |