KR20220114026A - 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소 - Google Patents

폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소 Download PDF

Info

Publication number
KR20220114026A
KR20220114026A KR1020227023746A KR20227023746A KR20220114026A KR 20220114026 A KR20220114026 A KR 20220114026A KR 1020227023746 A KR1020227023746 A KR 1020227023746A KR 20227023746 A KR20227023746 A KR 20227023746A KR 20220114026 A KR20220114026 A KR 20220114026A
Authority
KR
South Korea
Prior art keywords
leu
glu
lys
ala
val
Prior art date
Application number
KR1020227023746A
Other languages
English (en)
Inventor
엘리스 챔피온
미카엘 소스킨
파텐 자지리
다니엘 음샬레
Original Assignee
디엔에이 스크립트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디엔에이 스크립트 filed Critical 디엔에이 스크립트
Publication of KR20220114026A publication Critical patent/KR20220114026A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 상이한 종들의 변이체로부터 유래된 키메라인 말단 데옥시뉴클레오타이드 전달효소를 사용하는 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 조성물 및 방법에 관한 것이다.

Description

폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소
광범위한 길이의 미리 결정된 서열의 고도로 정제된 저렴한 폴리뉴클레오타이드의 사용은 게놈 및 진단 서열분석, 다중 핵산 증폭, 치료 항체 개발, 합성 생물학, 핵산 기반 치료제, DNA 오리가미(origami), DNA 기반 데이터 저장 등을 비롯한 다수의 기술의 중심이 되어 왔다. 최근에는 화학적 기반 합성 방법을 말단 데옥시뉴클레오타이드 전달효소(TdT: chimeric terminal deoxynucleotidyl transferase)와 같은 주형-부재의 중합효소를 사용하는 효소 기반 방법으로 보완하거나 대체하는 데 관심이 높아지고 있는데, 이는 이러한 효소의 입증된 효율 및 온화한 무독성 반응 조건의 이점 때문이고, 예를 들면 이버트(Ybert) 등의 국제 특허출원 공개공보 제WO2015/159023호; 히아트(Hiatt) 등의 미국 특허 제5,763,594호; 젠센(Jensen) 등의 문헌[Biochemistry, 57: 1821-1832(2018)] 등을 참조한다. 효소 기반 합성의 대부분의 접근법은 폴리뉴클레오타이드 생성물에서 원하는 서열을 얻기 위해 가역적으로 차단된 뉴클레오사이드 삼인산염의 사용을 필요로 한다. 불행하게도, 천연 TdT는 변형되지 않은 뉴클레오사이드 삼인산염과 비교하여 감소된 효율로 변형된 뉴클레오사이드 삼인산염을 혼입한다. 따라서, 변형된 뉴클레오사이드 삼인산염에 대한 더 나은 혼입 효율뿐만 아니라, 성장하는 쇄의 상이한 3'-서열 사이의 감소된 혼입 변동성, 개선된 제조 가능성 등과 같은 다른 성능 특성을 가진 새로운 TdT 변이체를 개발하기 위해 많은 연구가 진행되었고, 예를 들면 챔피언(Champion) 등의 미국 특허출원 공개공보 제US2019/0211315호; 이버트(Ybert) 등의 국제 특허출원 공개공보 제WO2017/216472호 등을 참조한다.
상기의 관점에서, 새로운 TdT 변이체와 같은 새로운 주형-부재의 중합효소 및 사용 방법이 가역적으로 차단된 뉴클레오사이드 삼인산염의 개선된 안전성 및 혼입을 위해 이용 가능하다면 주형-부재의 효소 기반 폴리뉴클레오타이드 합성 분야는 발전될 것이다.
본 발명은 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 방법 및 조성물에 관한 것이다. 본 발명은 상이한 종들로부터 유래된 아미노산 서열을 포함하고 가역적으로 차단된 뉴클레오사이드 삼인산염을 폴리뉴클레오타이드에 혼입하는데 있어서의 개선된 효율, 개선된 안정성, 개선된 제조 가능성, 또는 서열 특이적 혼입 비율의 감소된 변화를 포함하는 하나 이상의 개선을 나타내는 TdT 변이체의 키메라인, 데옥시뉴클레오타이드 전달효소(TdT) 변이체, 및 그의 조성물을 포함한다. 본 발명은 또한 미리 결정된 서열의 폴리뉴클레오타이드를 합성하기 위해 이러한 키메라 TdT 변이체를 사용하는 방법 및 키트를 포함한다.
보다 구체적으로, 본 발명은 하기 화학식으로 정의된 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체에 관한 것이다:
B1-B2-B3
상기 식에서,
B1은 N-말단으로부터 VSC 모티프와 KMT 모티프를 포함하여 그 사이의 아미노산 위치까지 연장되는 BRCT-유사 영역이 없는 제1 종의 TdT의 아미노산 분절이며, 이때 B1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, B1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
B2는 B1의 C-말단으로부터 제2 종의 TdT의 C-말단으로, 또는 B3이 하나 이상의 아미노산을 포함할 때마다 B3의 N-말단까지 연장되는 제2 종의 TdT의 아미노산 분절이며, 이때 B2는 B2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환, B2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, B2가 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B2가 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
B3은 0 내지 70개의 아미노산을 포함하고 제3 종의 TdT의 C-말단으로부터 B2의 C-말단 아미노산까지 연장되는 제3 종의 TdT의 아미노산 분절이며, 이때 B3은 B3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있고;
B1, B2 및 B3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
본 발명은 또한 하기 화학식으로 정의되는 아미노산 서열과 80% 이상 동일한 아미노산 서열을 포함하는 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체에 관한 것이다:
J1-J2-J3
상기 식에서,
J1은 N-말단으로부터 VSC 모티프와 KMT 모티프를 포함하여 그 사이의 아미노산 위치까지 연장되는 BRCT 유사 영역이 없는 마우스 TdT의 아미노산 분절이며, 이때 J1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, J1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
J2는 VSC 모티프와 KMT 모티프 사이에 위치한 아미노산 위치로부터 TGSR 모티프의 아미노산 위치까지 연장되는 비-마우스 TdT의 아미노산 분절이며, 이때 아미노산 분절은 J2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동일한 잔기의 하나 이상의 치환을 포함하고;
J3은 TGSR 모티프의 아미노산 위치로부터 C-말단 아미노산까지 연장되는 마우스 TdT의 아미노산 분절이며, 이때 J3은 J3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있고;
J1, J2, 및 J3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
일부 실시태양에서, 본 발명의 키메라 TdT 변이체는 3개의 인접 분절, 즉 BRCT-유사 단편이 없는 N-말단 분절, 내부 분절 및 C-말단 분절을 포함하고, 이때 N-말단 분절 및 C-말단 분절은 각각 제1 종의 TdT로부터 유래하고 내부 분절은 제2 종의 TdT로부터 유래한다. 일부 실시태양에서, N-말단 분절과 내부 분절 사이의 경계는 VSC 모티프에 있고 내부 분절과 C-말단 분절 사이의 경계는 TGSR 모티프에 있다. 다른 실시태양에서, N-말단 분절과 내부 분절 사이의 경계는 KMT 모티프에 있고 내부 분절과 C-말단 분절 사이의 경계는 TGSR 모티프에 있다. 다른 실시태양에서, N-말단 분절과 내부 분절 사이의 경계는 VSC 모티프에 있고 내부 분절과 C-말단 분절 사이의 경계는 KMT 모티프에 있다. 본원에 사용된 경우, 지시된 모티프에서 분절 사이의 경계의 발생은 경계가 모티프에 위치할 수 있거나, 또는 모티프의 N-말단 아미노산으로부터 N-말단 방향으로 1 내지 15개의 아미노산에 또는 모티프의 C-말단 아미노산으로부터 C-말단 방향으로 1 내지 15개의 아미노산일 수 있음을 의미한다. 일부 실시태양에서, 이러한 경계 위치는 모티프의 N-말단 아미노산으로부터 N-말단 방향으로 1 내지 10개의 아미노산 또는 모티프의 C-말단 아미노산으로부터 C-말단 방향으로 1 내지 10개의 아미노산일 수 있다. 일부 실시태양에서, 이러한 경계 위치는 모티프의 N-말단 아미노산으로부터 N-말단 방향으로 1 내지 5개의 아미노산 또는 모티프의 C-말단으로부터 C-말단 방향으로 1 내지 5개의 아미노산일 수 있다. 일부 실시태양에서, 상기 키메라 TdT 변이체의 N-말단 분절 및 C-말단 분절은 각각 마우스 TdT 변이체로부터이다. 일부 실시태양에서, 이러한 마우스 분절은 표 2에 기재된 바와 같이 하나 이상의 돌연변이, 또는 복수의 돌연변이를 겪는다.
일부 실시태양에서, 본 발명은 하기에 기재된 단리된 키메라 TdT 변이체를 포함한다.
한 양태에서, 본 발명은 (a) 유리 3'-하이드록실을 갖는 개시제를 제공하는 단계; 및 (b) (i) 연장 조건 하에 개시제 또는 유리 3'-O-하이드록실을 갖는 연장된 단편을 3'-O-차단된 뉴클레오사이드 삼인산염 및 키메라 TdT 변이체와 접촉시켜 개시제 또는 연장된 단편이 3'-O-차단된 (및 임의적으로 염기 보호된) 뉴클레오사이드 삼인산염의 혼입에 의해 연장되어 3'-O-차단된 연장된 단편을 형성하고, (ii) 연장된 단편을 차단제거하여 유리 3'-하이드록실을 갖는 연장된 단편을 형성하는 주기를 폴리뉴클레오타이드가 합성될 때까지 반복하는 단계를 포함하는, 폴리뉴클레오타이드를 합성하기 위해 본 발명의 키메라 TdT 변이체를 사용하는 방법에 관한 것이다.
본 발명은 추가로 a) 제1항 내지 제20항 중 어느 한 항에 따른 키메라 TdT 변이체, b) 하나 이상의 뉴클레오타이드, 바람직하게는 하나 이상의 3'-O-차단된 뉴클레오사이드 삼인산염, 및 c) 임의적으로 적어도 하나의 핵산 프라이머를 포함하는, 뉴클레오타이드 혼입 반응을 수행하기 위한 키트에 관한 것이다.
도 1은 본 발명의 TdT 변이체를 사용하는 주형-부재의 효소적 핵산 합성 방법의 단계를 도식적으로 예시한다.
도 2는 본 발명의 키메라 TdT 변이체의 구조를 도식적으로 예시한다.
도 3a 및 3b는 TdT 변이체 M27, M57 및 M59에 의한 합성 동안 상이한 3량체 서열(또는 "코돈")에서 발생하는 결실의 백분율을 나타내는 데이터를 예시한다.
본 발명은 다양한 수정 및 대안의 형태가 가능하지만, 그 세부사항은 도면에 예로서 제시되었고 상세하게 기재될 것이다. 기재된 특정 실시태양으로 본 발명을 제한하려는 의도가 아님을 이해해야 한다. 본 발명의 취지 및 범주에 속하는 모든 수정, 동등물 및 대안을 포괄하고자 한다. 본 발명의 양태에 대한 지침은 당업자에게 공지된 많은 이용 가능한 참고문헌 및 논문에서 발견된다.
본 발명은 키메라 TdT 변이체, 및 3'-O-가역적으로 차단된 뉴클레오사이드 삼인산염을 사용하여 주어진(또는 동등하게, 미리 결정된, 또는 사용자-결정된) 서열의 폴리뉴클레오타이드의 주형-부재의 또는 주형-독립적 합성에서의 그의 용도에 관한 것이다. 본 발명의 TdT 변이체는 이들이 둘 이상의 상이한 생물학적 종, 일반적으로 상이한 포유동물 종으로부터의 복수의 아미노산 분절을 포함한다는 의미에서 "키메라"이다. 일부 실시태양에서, 복수의 아미노산 분절은 2 또는 3개이고, 일부 실시태양에서 이러한 분절은 2가지 상이한 종 및 다른 실시태양에서 3가지 상이한 종으로부터 선택될 수 있다. 즉, 일부 실시태양에서 2가지 상이한 종으로부터 2개 또는 3개의 분절이 취해진다. 3개의 분절이 2가지 상이한 종에서 유래할 때마다, 제1 종의 2개의 분절은 생성된 키메라 TdT 변이체의 N-말단 및 C-말단에 있고 제2 종의 TdT 분절은 그 사이에 끼워져 있다. 각 경우에, 선택된 분절은 3'-O-가역적으로 차단된 뉴클레오사이드 삼인산염에 대한 키메라 TdT 변이체의 혼입 활성을 향상시키는, 아래에 지시된 위치에서의 아미노산 치환을 갖는 TdT 변이체에서 유래된다. 일부 실시태양에서, 상이한 종으로부터의 분절 사이의 경계 위치 및 본 발명의 키메라 TdT 변이체에서의 아미노산 치환 위치는 모든 TdT 단백질, 특히 포유동물 TdT 단백질의 아미노산 서열에서 발생하고 과학 문헌에 잘 알려져 있거나 본원에 정의된 다중 서열 모티프와 관련하여 정의된다. 본 발명의 키메라 TdT 변이체에서 아미노산 분절의 순서는 천연 TdT에서 발견되는 서열 모티프의 순서 및 수를 보존한다. 즉, 각 천연 TdT는 서열 모티브의 순서 및 수를 갖는다(예: N-말단으로부터 C-말단까지: FMR, VSC, GGFRR, KMT, TGSR, FER 등). 본 발명의 각각의 키메라 TdT 변이체는 그러한 서열 모티프의 동일한 순서 및 수를 갖는다.
3가지 상이한 종으로부터의 3개의 분절을 포함하는 본 발명의 키메라 TdT 변이체의 일부 실시태양은 도 2에 예시된 바와 같다: 제1 종의 TdT 변이체로부터의 B1(200), 제2 종의 TdT 변이체로부터의 B2(202), 및 제3 종의 TdT 변이체로부터의 B3(204). 본 발명의 키메라 TdT는 일반적으로 야생형 또는 천연 발생 TdT에서 약 130개의 아미노산을 포함하는 N-말단 BRCT-유사 분절을 포함하지 않는다[예를 들어, 델라루에(Delarue) 등의 문헌 "EMBO J., 21(3): 427-439(2002)"]. 즉, 본 발명의 모든 키메라 TdT 변이체는 BRCT-유사 분절에 의해 N-말단이 절단된다. 일부 실시태양에서, B1 분절의 N-말단 아미노산은 통상적인 서열 정렬 도구, 예를 들어, 물탈린(Multalin)을 사용하여 그의 서열을 서열 번호 2의 절단된 마우스 TdT 또는 유사 서열과 정렬함으로써 전장 TdT로부터 용이하게 결정된다[미첼(Mitchell)의 문헌 "Bioinformatics, 9(5): 614-615(1993)"]. 화살표(206a, 206b, 208a 및 208b)로 표시된 바와 같이, 분절 B1과 B2 사이 및 분절 B2와 B3 사이의 경계는 지시된 서열 모티프의 위치에 의해 정의된 표시된 영역 내에서 상이한 키메라 TdT 변이체에 대하여 다를 수 있다(화살표로 제시됨): B1-B2 경계는 VSC 모티프와 KMT 모티프 사이의 임의의 아미노산 위치에 위치할 수 있고, B2-B3 경계는 DRR 모티프(또는 동등하게 아미노산 C-말단으로부터 약 70개 아미노산의 아미노산 위치)와 키메라 TdT 변이체의 C-말단 사이의 임의의 아미노산 위치에 위치할 수 있다. 즉, 일부 실시태양에서, 분절 B3은 0개의 아미노산을 함유할 수 있거나, 달리 말하면, 실시태양이 2가지 상이한 종으로부터의 2개의 분절로만 구성되도록 존재하지 않을 수 있다.
본원에 사용된 잘 알려진 TdT 서열 모티프는 330 내지 340의 아미노산 분절 내에 또는 그 근처에 위치하는(전장 마우스 TdT, 예를 들어 서열 번호 1을 참조하여 측정됨) GGFRR(또는 TGGFRRG) 모티프 및 450 내지 460의 아미노산 분절 내에 또는 그 근처에 위치하는(다시, 전장 마우스 TdT, 예를 들어 서열 번호 1을 참조하여 측정됨) TSGR 모티프를 포함한다. 이들 및 부가적인 서열 모티프 FRM(서열 번호 1에 대하여 185 내지 195의 아미노산 분절 근처에 위치), VSC(서열 번호 1에 대하여 295 내지 305의 아미노산 분절 근처에 위치), KMT(서열 번호 1에 대하여 335 내지 345의 아미노산 분절 근처에 위치) 및 FER(서열 번호 1에 대하여 450 내지 465의 아미노산 분절 근처에 위치)은 본 발명의 일부 실시태양을 정의하는 데 사용된다. 다르게는, KMT 모티프에서의 아미노산 치환은 GGFRR 모티프와 GHD 모티프 사이의 분절(이는 서열 번호 1에 대하여 아미노산 분절 34 내지 345 또는 그 근처에 위치)에서의 아미노산 치환으로서 동등하게 정의될 수 있다. 일부 실시태양에서, KMT 모티프는 다르게는 TGGFRRG 모티프와 GHD 모티프(비-포함) 사이의 아미노산 분절로서 정의될 수 있다[델라루에(Delarue) 등의 상기 인용된 문헌]. 다른 실시태양에서, KMT 모티프는 TGGFRRG 모티프와 KMT, KKI, KKM, KEF, KKV, KKL 및 KKT로 구성된 군에서 선택된 GHD 모티프 사이의 3-아미노산 분절이다. 일부 실시태양에서, FMR 모티프는 FMR, FLR 및 YMR로 구성된 군에서 선택되는 185 내지 200의 아미노산 분절(다시 서열 번호 1 참조) 내에 또는 그 근처에 위치하는 3-아미노산 분절이다. 일부 실시태양에서, VSC 모티프는 VSC, IDC, ISS, TSY, SKA, SKP, SRA 및 ASC로 구성된 군에서 선택된 아미노산 분절 295 내지 305(다시 서열 번호 1 참조) 내에 또는 그 근처에 위치한 3-아미노산 분절이다. 일부 실시태양에서, TGSR 모티프는 TGSR, TGSP 및 SGSR로 구성된 군에서 선택된 아미노산 분절 445 내지 460(다시 서열 번호 1 참조) 내에 또는 그 근처에 위치한 4-아미노산 분절이다. 일부 실시태양에서, FER 모티프는 FER 및 FGR로 구성된 군에서 선택된 아미노산 분절 454 내지 460(다시 서열 번호 1 참조) 내에 또는 그 근처에 위치한 3-아미노산 분절이다. 서열 모티프와 관련하여 사용될 경우, 일부 실시태양에서, 용어 "근처" 또는 "에서"는 지시된 범위 또는 모티프의 15개 아미노산 이내, 또는 지시된 범위 또는 모티프의 10개 아미노산 이내를 의미한다. 다양한 모티프의 위치는 TdT의 종마다 다를 수 있지만, TdT 아미노산 서열을 따라 모티프의 순서는 모든 종에서 동일하고 서열 모티프 쌍 사이의 상대적인 간격(아미노산)은 선택된 모티프에 대하여 하기 표 1에 제시된 바와 같이 매우 보존적이다. 따라서, 모티프는 본 발명의 키메라 TdT를 구성하는 아미노산 단편을 정의하기 위한 유용한 이정표이다.
[표 1]
Figure pct00001
일부 실시태양에서, 본 발명의 키메라 TdT 변이체는 하기 화학식에 의해 정의된 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 갖는다:
B1-B2-B3
상기 식에서,
B1은 N-말단으로부터 VSC 모티프와 KMT 모티프 사이의 아미노산 위치까지 연장되는 BRCT-유사 영역이 없는 제1 종의 TdT의 아미노산 분절이며, 이때 B1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, B1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌(N-말단으로부터 C-말단까지) 또는 작용적으로 동등한 잔기의 치환, 및 B1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
B2는 B1의 C-말단으로부터 제2 종의 TdT의 C-말단으로, 또는 B3이 하나 이상의 아미노산을 포함할 때마다 B3의 N-말단까지 연장되는 제2 종의 TdT의 아미노산 분절이며, 이때 B2는 B2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환, B2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, B2가 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B2가 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
B3은 0 내지 70개의 아미노산을 포함하고 제3 종의 TdT의 C-말단으로부터 B2의 C-말단 아미노산까지 연장되는 제3 종의 TdT의 아미노산 분절이며, 이때 B3은 B3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있고;
B1, B2 및 B3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
일부 실시태양에서, 상기 기재된 키메라 TdT 변이체는 서열 번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 27, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40 및 41로 구성된 군의 아미노산 서열로부터 선택된 B1, B2 및 B3 분절을 갖고, 이때: 각각의 B1 분절은 (i) 서열 번호 2, 3, 4, 6, 7, 8, 11, 12 및 13에 대하여 위치 63에서; 서열 번호 5에 대하여 위치 62에서; 서열 번호 9에 대하여 위치 64에서; 서열 번호 10, 26, 28, 29, 30, 32, 33, 34, 36, 37, 38 및 39에 대하여 위치 61에서; 서열 번호 14에 대하여 위치 66에서; 서열 번호 15에 대하여 위치 47에서; 및 서열 번호 27, 31, 35 및 40에 대하여 위치 48에서 FMR 모티프에서의 메티오닌 또는 그의 작용적으로 동등한 잔기의 치환; (ii) 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 171에서; 서열 번호 5, 32, 33, 34, 36, 37, 38, 39 및 41에 대하여 위치 170에서; 서열 번호 9에 대하여 위치 172에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 36, 37, 38, 38 및 41에 대하여 위치 169에서; 서열 번호 13에 대하여 위치 180에서; 서열 번호 14에 대하여 위치 174에서; 서열 번호 15에 대하여 위치 154에서; 서열 번호 26에 대하여 위치 168에서; 서열 번호 27, 35 및 40에 대하여 위치 156에서; 및 서열 번호 31에 대하여 위치 157에서 VSC 모티프에서의 발린 또는 작용적으로 동등한 잔기의 치환; (iii) 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 172에서; 서열 번호 5에 대하여 위치 171에서; 서열 번호 9에 대하여 위치 173에서; 서열 번호 10, 28, 29 및 30에 대하여 위치 170에서; 서열 번호 13에 대하여 위치 181에서; 서열 번호 14에 대하여 위치 175에서; 서열 번호 15에 대하여 위치 155에서; 서열 번호 26에 대하여 위치 169에서; 및 서열 번호 27, 31, 35 및 40에 대하여 위치 157에서 상기 VSC 모티프에서의 세린 또는 그의 작용적으로 동등한 잔기의 치환; (iv) 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 173에서; 서열 번호 5에 대하여 위치 172에서; 서열 번호 9에 대하여 위치 174에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 37, 38, 39 및 41에 대하여 위치 171에서; 서열 번호 13에 대하여 위치 182에서; 서열 번호 14에 대하여 위치 176에서; 서열 번호 26에 대하여 위치 170에서; 서열 번호 27, 31, 35, 36 및 40에 대하여 위치 158에서; 및 서열 번호 15에 대하여 위치 156에서 상기 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 치환을 갖고; 각각의 B2 분절은 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 207에서; 서열 번호 5에 대하여 위치 206에서; 서열 번호 9에 대하여 위치 208에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 36, 37, 38, 39 및 41에 대하여 위치 205에서; 서열 번호 26에 대하여 위치 204에서; 서열 번호 27, 31, 35 및 40에 대하여 위치 192에서; 서열 번호 13에 대하여 위치 216에서; 서열 번호 14에 대하여 위치 210에서; 및 서열 번호 15에 대하여 위치 190에서 상기 GGFRR 모티프에서의 두 번째 아르기닌 또는 그의 작용적으로 동등한 잔기의 치환을 갖고; 각각의 B3 분절(또는 일부 실시태양에서 B2 분절)은 (i) 서열 번호 2, 7, 8, 12 및 33에 대하여 위치 325에서; 서열 번호 3, 4, 29 및 32에 대하여 위치 324에서; 서열 번호 5에 대하여 위치 320에서; 서열 번호 6에 대하여 위치 331에서; 서열 번호 9 및 26에 대하여 위치 326에서; 서열 번호 28 및 30에 대하여 위치 327에서; 서열 번호 10에 대하여 위치 323에서; 서열 번호 11 및 14에 대하여 위치 328에서; 서열 번호 13에 대하여 위치 338에서; 서열 번호 27 및 31에 대하여 위치 314에서; 서열 번호 35에 대하여 위치 310에서; 서열 번호 31에 대하여 위치 311에서; 서열 번호 32에 대하여 위치 321에서; 서열 번호 33 및 34에 대하여 위치 322에서; 서열 번호 36, 37, 38, 39 및 41에 대하여 위치 323에서; 서열 번호 40에 대하여 위치 309에서; 및 서열 번호 15에 대하여 위치 308에서 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환; 및 (ii) 서열 번호 2, 7, 8 및 12에 대하여 위치 328에서; 서열 번호 3, 4 및 29에 대하여 위치 327에서; 서열 번호 5에 대하여 위치 323에서; 서열 번호 6에 대하여 위치 334에서; 서열 번호 9 및 26에 대하여 위치 329에서; 서열 번호 10, 36, 37, 38, 39 및 41에 대하여 위치 326에서; 서열 번호 11 및 14에 대하여 위치 331에서; 서열 번호 13에 대하여 위치 341에서; 서열 번호 27에 대하여 위치 317에서; 서열 번호 28 및 30에 대하여 위치 330에서; 서열 번호 40에 대하여 위치 312에서; 서열 번호 35에 대하여 위치 313에서; 서열 번호 31에 대하여 위치 314에서; 서열 번호 32에 대하여 위치 324에서; 서열 번호 33 및 34에 대하여 위치 325에서; 및 서열 번호 15에 대하여 위치 311에서 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 갖는다.
일부 실시태양에서, 본 발명의 키메라 TdT 변이체는 (i) R 또는 Q인 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환; (ii) L 또는 N인 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환; 및 (iii) G, R, P, A, V, S, N, Q 또는 D, 또는 일부 실시태양에서는 G 또는 R인 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 치환; (iv) P, N 또는 A인 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환; 및 (v) N, L, T 또는 S인 상기 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함한다.
일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 B1-B2-B3 아미노산 서열과 적어도 80 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 B1-B2-B3 아미노산 서열과 적어도 90 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 B1-B2-B3 아미노산 서열과 적어도 95 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 97 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 98 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 99 퍼센트 동일성이다.
일부 실시태양에서, 키메라 TdT 변이체는 마우스 및 소 TdT 변이체의 키메라를 포함하며, 이때 B1 및 B3은 상기 기재된 바와 같은 마우스 TdT 변이체로부터 유래되고 B2는 상기 기재된 바와 같은 소 TdT 변이체로부터 유래된다. 특히, 본 발명의 키메라 TdT 변이체는 마우스 TdT 변이체 M53(서열 번호 21) 및 소 TdT 변이체 M54(서열 번호 22)로부터 얻은 B1, B2 및 B3 분절을 포함할 수 있다. 일부 이러한 키메라 TdT 변이체에서, B1 및 B3은 M53으로부터 유래되고 B2는 M54로부터 유래된다.
일부 실시태양에서, 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체는 아미노산의 3개의 분절을 포함한다: (a) N-말단으로부터 VSC 모티프의 위치까지 연장되는 마우스 TdT의 N-말단 분절(BRCT 유사 단편 없음), (b) VSC 모티프의 위치로부터 TGSR 모티프의 N-말단 방향으로 약 5 내지 15개의 아미노산으로(또는 TGSR 모티프의 위치까지) 연장되는 비-마우스 TdT로부터의 중앙 또는 내부 분절, 및 (c) TGSR 모티프로부터 N-말단 방향으로 위치 5 내지 15개의 아미노산으로부터 마우스 TdT 분절의 C-말단까지 연장되는 마우스 TdT의 C-말단 분절.
일부 실시태양에서, 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체는 하기 화학식으로 정의된 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함한다:
J1-J2-J3
상기 식에서,
J1은 N-말단으로부터 VSC 모티프와 KMT 모티프를 포함하여 그 사이의 아미노산 위치까지 연장되는 BRCT 유사 영역이 없는 마우스 TdT의 아미노산 분절이며, 이때 J1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, J1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
J2는 VSC 모티프와 KMT 모티프 사이에 위치한 아미노산 위치로부터 TGSR 모티프의 아미노산 위치까지 연장되는 비-마우스 TdT의 아미노산 분절이며, 이때 아미노산 분절은 J2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동일한 잔기의 하나 이상의 치환을 포함하고;
J3은 TGSR 모티프의 아미노산 위치로부터 C-말단 아미노산까지 연장되는 마우스 TdT의 아미노산 분절이며, 이때 J3은 J3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있다. 상기와 같이, J1, J2, 및 J3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
일부 실시태양에서, 이러한 키메라 TdT 변이체는 하기 화학식으로 정의된 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함한다:
J1-J2-J3
상기 식에서,
J1은 서열 번호 42, 71, 73 또는 82로부터 선택된 아미노산 서열을 갖는 아미노산 분절이고;
J2는 서열 번호 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 구성된 군에서 선택된 아미노산 서열을 갖는 아미노산 분절이고, 이들 각각은 위치 35에서 아르기닌 치환을 갖고;
J3은 서열 번호 43에 대하여 위치 12에서 아르기닌으로 치환되고 위치 15에서 글루탐산으로 치환된 서열 번호 43의 아미노산 서열, 또는 서열 번호 72의 아미노산 서열을 갖는 아미노산 분절이고; 이때 키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있다.
일부 실시태양에서, J1은 서열 번호 82의 아미노산 서열을 갖는 아미노산 분절이고; J2는 서열 번호 52, 53, 54, 55, 56, 57, 58, 59, 62 및 63으로 구성된 군에서 선택된 아미노산 서열을 갖는 아미노산 단편이고; J3은 서열 번호 43에 대하여 위치 12에서 아르기닌으로 치환되고 위치 15에서 글루탐산으로 치환된 서열 번호 43의 아미노산 서열, 또는 서열 번호 72의 아미노산 서열을 갖는 아미노산 분절이다.
일부 실시태양에서, 서열 번호 42의 아미노산 서열은 위치 63에서 메티오닌의 치환을 추가로 갖고; 서열 번호 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 및 70의 아미노산 서열은 각각 위치 1에서 시스테인의 치환을 추가로 갖고; 서열 번호 43의 아미노산 서열은 위치 38에서 아르기닌의 치환을 추가로 갖는다.
추가의 실시태양에서, 위치 63에서의 메티오닌 치환은 R 또는 Q이고, 위치 35에서의 아르기닌 치환은 L 또는 N이고, 위치 1에서의 시스테인 치환은 G 또는 R이다.
일부 실시태양에서, J2는 포유동물 TdT로부터 선택된 아미노산 서열, 예컨대 서열 번호 52, 53, 54, 55, 56, 57, 58, 59, 62, 63, 64, 65, 66, 67, 69 또는 70을 갖는 아미노산 분절이다. 일부 실시태양에서, J2는 서열 번호 58과 같은 소 TdT로부터 선택된 아미노산 분절이다.
추가의 실시태양에서, 서열 번호 42의 아미노산 서열은 위치 17에서의 알라닌, 위치 52에서의 류신, 위치 57에서의 글리신, 위치 63에서의 메티오닌 및 위치 108에서의 알라닌의 치환을 추가로 갖는다.
일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 J1-J2-J3 아미노산 서열과 적어도 80 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 J1-J2-J3 아미노산 서열과 적어도 90 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 J1-J2-J3 아미노산 서열과 적어도 95 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 97 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 98 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 99 퍼센트 동일성이다.
상기 실시태양의 발명은, 아래에 기재된 바와 같이 통상적인 열 이동 검정을 기반으로, 상기 키메라 TdT 변이체, J1-J2-J3이 M57(서열 번호 23)과 같은 이전의 TdT 변이체보다 더 높은 열 안정성을 갖는다는 출원인의 발견에 부분적으로 근거한다. 일부 실시태양에서, 열 안정성의 이러한 증가는 1 내지 2℃의 범위이다.
추가의 실시태양에서, 키메라 TdT 변이체는 하기 화학식으로 정의된 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함한다:
R1-R2-R3
상기 식에서,
R1은 N-말단으로부터 VSC 모티프의 위치까지 연장되는 BRCT-유사 단편이 없는 마우스 TdT의 아미노산 분절이고;
R2는 VSC 모티프의 위치로부터 TGSR 모티프의 위치까지 연장되는 비-마우스 TdT의 아미노산 분절이며, 이때 R2의 GGFRR 모티프의 두 번째 아르기닌은 치환되고;
R3은 TGSR 모티프의 위치로부터 C-말단까지 연장되는 마우스 TdT의 아미노산 분절이며, 이때 TGSR 모티프의 아르기닌은 치환되고, R3의 FER 모티프의 글루탐산은 치환되고; 이때 키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있다.
일부 실시태양에서, R1의 C-말단 아미노산은 VSC 모티프의 두 번째 아미노산이고; R2의 N-말단 아미노산은 VSC 모티프의 세 번째 아미노산이고; R2의 C-말단 아미노산은 TGSR 모티프로부터 N-말단 방향으로 5 내지 10개의 아미노산 영역에 있다.
일부 실시태양에서, 상기 퍼센트 동일성 값은 지시된 R1-R2-R3 아미노산 서열과 적어도 95 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 97 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 98 퍼센트 동일성이고; 일부 실시태양에서, 상기 퍼센트 동일성 값은 적어도 99 퍼센트 동일성이다.
일부 실시태양에서, 키메라 TdT 변이체는 뮤린 TdT로부터의 적어도 하나의 아미노산 분절 및 소 TdT로부터의 적어도 하나의 아미노산 서열을 포함한다. 이러한 키메라 TdT 변이체에는 아미노산 서열, 서열 번호 74(His 태그가 없는 M57-N27-8-13c7), 서열 번호 75(His 태그가 없는 46-557), 서열 번호 76(His 태그가 없는 46-342), 서열 번호 77(His 태그 없는 46-571), 서열 번호 78(His 태그 없는 M92), 서열 번호 79(His 태그 없는 M93), 서열 번호 80(His 태그가 없는 M94) 및 서열 번호 81(His 태그가 없는 M88)을 포함하는 TdT를 포함한다. 출원인은 하기에 기재된 바와 같이 통상적인 열 이동 검정에 기반하여, 상기 키메라 TdT 변이체가 이전의 TdT 변이체, 예를 들어 M57(서열 번호 23)보다 더 높은 열 안정성을 갖는다는 것을 발견하였다. 일부 실시태양에서, 열 안정성의 이러한 증가는 1 내지 2℃ 범위이다.
본 발명의 키메라 TdT 변이체는 선택된 아미노산의 돌연변이가 추가로 적용된 복수의 상이한 종들로부터의 아미노산 분절을 포함할 수 있다. 예를 들어, 하기 종의 TdT로부터 작성된 키메라 TdT 변이체는 하기 표에 기재된 바와 같이 하나 이상 또는 복수의 돌연변이를 겪을 수 있다:
[표 2]
키메라 TdT 변이체의 예
Figure pct00002
본 발명의 키메라 TdT 변이체는 지시된 치환의 존재를 조건으로 특정 서열 번호에서 주어진 분절의 퍼센트 서열 동일성을 갖는 아미노산 서열 분절을 포함할 수 있다. 일부 실시태양에서, 이러한 방식으로 기재된 본 발명의 키메라 TdT 변이체와 특정 서열 번호 사이의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입에 기인할 수 있고, 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시태양에서, 이러한 결실, 치환 및/또는 삽입은 천연 발생 아미노산만을 포함한다. 일부 실시태양에서, 치환은 그란탐(Grantham)의 문헌[Science, 185: 862-864 (1974)]에 기재된 바와 같이 보존적 또는 동의(synonymous) 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 그의 동의 아미노산 세트의 구성원 사이에서만 발생할 수 있다. 일부 실시태양에서, 사용될 수 있는 동의 아미노산 세트는 표 3a에 제시되어 있다.
[표 3a]
아미노산 I의 동의 세트
Figure pct00003
일부 실시태양에서, 사용될 수 있는 동의 아미노산 세트가 표 3b에 제시되어 있다.
[표 3b]
아미노산 II의 동의 세트
Figure pct00004
뉴클레오타이드 혼입 활성 측정
본 발명의 변이체에 의한 뉴클레오타이드 혼입의 효율은 예를 들어 불(Boule) 등의 문헌(아래 인용); 벤톨리라(Bentolila) 등의 문헌(아래 인용); 및 히아트(Hiatt) 등의 미국 특허 제5,808,045호(후자는 본 명세서에 참조로 포함됨)에 기재된 바와 같이, 연장, 또는 연신 분석에 의해 측정될 수 있다. 간략하게, 이러한 분석의 한 형태에서, 유리 3'-하이드록실을 갖는 형광 표지된 올리고뉴클레오타이드는 가역적으로 차단된 뉴클레오사이드 삼인산염의 존재 하에 미리 결정된 기간 동안 시험될 변이체 TdT와 TdT 연장 조건 하에 반응되고, 이후 연장 반응을 중지하고 겔 전기영동으로 분리한 후 연장 생성물과 연장되지 않은 개시제 올리고뉴클레오타이드의 양을 정량화한다. 이러한 분석에 의해, 변이체 TdT의 혼입 효율은 다른 변이체의 효율 또는 야생형 또는 기준 TdT, 또는 다른 중합효소의 효율과 쉽게 비교될 수 있다. 일부 실시태양에서, 변이체 TdT 효율의 척도는 동등한 분석에서 야생형 TdT를 사용한 연장된 생성물의 양에 대한 변이체 TdT를 사용한 연장된 생성물의 양의 비율(백분율로 제공됨)일 수 있다.
일부 실시태양에서, 다음과 같은 특정 연장 분석을 사용하여 TdT의 혼입 효율을 측정할 수 있다. 사용된 프라이머는 다음과 같다:
5' - AAAAAAAAAAAAAAGGGG-3'(서열 번호 20)
프라이머는 또한 5' 말단에 ATTO 형광 염료를 갖고 있다. 사용된 대표적인 변형 뉴클레오타이드(표 4에서 dNTP로 표시됨)로는 3'-O-아미노-2',3'-디데옥시아데노신-5'-삼인산염과 같은 3'-O-아미노-2',3'-디데옥시뉴클레오타이드-5'-삼인산염[ONH2, 파이어버드 바이오사이언시즈(Firebird Biosciences)]가 포함된다. 시험된 각각의 다른 변이체에 대해, 하나의 튜브가 반응에 사용된다. 시약을 물에서 시작하여 이후 표 4의 순서로 튜브에 첨가한다. 37℃에서 30분 후, 포름아미드[시그마(Sigma)]를 첨가하여 반응을 중지한다.
[표 4]
연장 활성 분석 시약
Figure pct00005
활성 완충액은 예를 들어 CoCl2가 보충된 TdT 반응 완충액[뉴잉글랜드 바이오랩스(New England Biolabs)로부터 입수 가능함]을 포함한다.
분석 생성물은 통상적인 폴리아크릴아미드 겔 전기영동에 의해 분석된다. 예를 들어, 상기 분석 생성물은 16% 폴리아크릴아미드 변성 겔[바이오-래드(Bio-Rad)]에서 분석될 수 있다. 분석 직전 유리판 내부에 폴리아크릴아미드를 붓고 이를 중합하여 겔을 만든다. 유리판 내부의 겔은 전기영동 단계를 위해 TBE 완충액(시그마)이 채워진 개조된 탱크 위에 장착된다. 분석할 샘플을 겔 상부에 적재한다. 500 내지 2,000V의 전압을 겔의 상부와 하부 사이에 실온에서 3 내지 6시간 동안 적용한다. 분리 후, 겔 형광을 예를 들어 타이푼(Typhoon) 스캐너[지이 라이프 사이언시즈(GE Life Sciences)]를 사용하여 스캔한다. 변형된 뉴클레오타이드의 혼입 백분율을 계산하기 위해 이미지J(ImageJ) 소프트웨어(imagej.nih.gov/ij/) 또는 그의 동등물을 사용하여 겔 이미지를 분석한다.
헤어핀 완성 분석. 한 양태에서, 본 발명은 폴리뉴클레오타이드(즉, "시험 폴리뉴클레오타이드")의 3' 말단에 dNTP를 혼입하는 TdT 변이체와 같은 중합효소의 능력을 측정하는 방법을 포함한다. 이러한 하나의 방법은 실질적으로 단일 가닥이지만 TdT 변이체와 같은 중합효소로 연장할 때 단일 가닥 루프 및 이중 가닥 스템(stem)을 포함하는 안정한 헤어핀 구조를 형성하는 반응 조건 하에 유리 3' 하이드록실을 갖는 시험 폴리뉴클레오타이드를 제공함을 포함하고, 이에 의해 이중 가닥 폴리뉴클레오타이드의 존재에 의해 3' 말단의 연장을 검출할 수 있다. 이중 가닥 구조는 이중 가닥 구조로 삽입될 때 우선적으로 형광을 발하는 형광 염료, 연장된 폴리뉴클레오타이드 상의 수용체(또는 공여체) 및 새로 형성된 헤어핀 스템과 함께 삼중체를 형성하는 올리고뉴클레오타이드 상의 공여체(또는 수용체) 간의 형광 공명 에너지 전달(FRET: fluorescent resonance energy transfer), 시험 폴리뉴클레오타이드에 모두 부착되고 헤어핀 형성 시 FRET에 근접하게 되는 FRET 수용체 및 공여체 등을 포함하지만 이에 제한되지 않는 다양한 방식으로 검출될 수 있다. 일부 실시태양에서, 단일 뉴클레오타이드에 의한 연장 후 시험 폴리뉴클레오타이드의 스템 부분은 길이가 4 내지 6개의 염기쌍 범위이고; 다른 실시태양에서, 이러한 스템 부분은 길이가 4 내지 5개의 염기쌍이고; 또 다른 실시태양에서, 이러한 스템 부분은 길이가 4개의 염기쌍이다. 일부 실시태양에서, 시험 폴리뉴클레오타이드는 10 내지 20개의 뉴클레오타이드 범위의 길이를 가지며; 다른 실시태양에서, 시험 폴리뉴클레오타이드는 12 내지 15개의 뉴클레오타이드 범위의 길이를 갖는다. 일부 실시태양에서, 연장되지 않은 스템과 연장된 스템의 용융 온도 사이의 차이를 최대화하는 뉴클레오타이드로 시험 폴리뉴클레오타이드를 연장하는 것이 유리하거나 편리하며; 이에 따라, 일부 실시태양에서, 시험 폴리뉴클레오타이드는 dC 또는 dG로 연장된다(따라서 시험 폴리뉴클레오타이드는 스템 형성을 위한 적절한 상보성 뉴클레오타이드를 갖도록 선택된다).
헤어핀 완성 분석을 위한 예시적인 시험 폴리뉴클레오타이드는 dGTP로 연장함으로써 완성되는 p875(5'-CAGTTAAAAACT)(서열 번호 16); dCTP로 연장함으로써 완성되는 p876(5'-GAGTTAAAACT)(서열 번호 17); 및 dGTP로 연장함으로써 완성되는 p877(5'-CAGCAAGGCT)(서열 번호 18)을 포함한다. 이러한 시험 폴리뉴클레오타이드에 대한 예시적인 반응 조건은 다음을 포함할 수 있다: 2.5 내지 5μM의 시험 폴리뉴클레오타이드, 겔레드(GelRed: 등록상표)[바이오튬 인코포레이티드(Biotium, Inc.), 캐나다 프레몬트 소재]의 1:4000 희석물, 200mM 카코딜산염(Cacodylate) KOH pH 6.8, 1mM CoCl2, 0 내지 20%의 DMSO 및 원하는 농도의 3' ONH2 dGTP 및 TdT. 헤어핀의 완성은 360 nm로 설정된 여기 필터와 635 nm로 설정된 방출 필터를 사용하여 28 내지 38℃의 반응 온도에서 TECAN 판독기와 같은 통상적인 형광 측정기를 사용하여 겔레드(등록상표) 염료의 형광 증가에 의해 모니터링될 수 있다.
본 발명의 이러한 양태의 일부 실시태양에서, TdT 변이체는 하기 단계에 의해 뉴클레오사이드 삼인산염의 주형-부재의 혼입에 대한 이들 능력에 대하여 시험될 수 있다: (a) 유리 3'-하이드록실을 갖는 시험 폴리뉴클레오타이드, TdT 변이체 및 뉴클레오사이드 삼인산염을, 시험 폴리뉴클레오타이드가 단일 가닥이지만 뉴클레오사이드 삼인산염의 혼입 시 이중 가닥 스템 영역을 갖는 헤어핀을 형성하는 조건 하에 배합하는 단계, 및 (b) 뉴클레오사이드 삼인산염을 혼입하는 TdT 변이체의 능력의 척도로서 형성된 이중 가닥 스템 영역의 양을 검출하는 단계. 일부 실시태양에서, 뉴클레오사이드 삼인산염은 3'-O-차단된 뉴클레오사이드 삼인산염이다.
TdT 변이체 안정성 측정
단백질의 안정성 증가는 다양한 방식으로 측정될 수 있다. 형광-기반 열 이동 검정은 단순성과 저렴한 비용으로 인해 이러한 측정에 특히 유용하다. 열 이동 검정 및 단백질 안정성 측정에 대한 적용을 기재하는 예시적인 참고문헌은 다음과 같다: 판톨리아노(Pantoliano) 등의 문헌[J. Biomolecular Screening, 6(6): 429-440(2001)]; 형(Huynh) 등의 문헌[Curr. Protocol. Protein Science, 79: 28.9.1-28.9.14]; 에릭슨(Ericsson) 등의 문헌[Anal. Biochem., 357: 289-298(2006)]; 니센(Niesen) 등의 문헌[Nature Protocols, 2(9): 2212-2221(2007)]; 및 판톨리아노 등의 미국 특허 제6,020,141호에 기재되어 있으며, 후자는 본원에 참조로 포함된다. 이러한 검정에 대한 개념적 기초는 접힌 단백질과 풀린 단백질이 소수성 형광 프로브로의 노출을 통해 구별될 수 있다는 것이다. 이러한 프로브는 수용액에서 급랭되지만, 풀린 단백질의 노출된 소수성 내부에 우선적으로 결합하여 급랭의 급격한 감소를 유도함으로써 쉽게 검출되는 형광 방출이 온도의 함수로 연구될 수 있다. 열에 의해 유도된 풀림은 접힌 상태와 풀린 상태 사이에 급격한 전이가 있는 전형적인 2-상태 모델을 따르는 비가역적 풀림 과정이며, 이때 용융 온도(Tm)는 단백질 풀림 전이의 온도의 중간점으로 정의된다. 소위 "써모플루오르(thermofluor)" 방법으로 수득된 용융 온도는 원형 이색성(CD: circular dichroism), 혼탁도 측정 및 시차 주사 열량계와 같은 단백질 안정성을 측정하는 데 사용되는 다른 생물물리학적 방법에 의해 결정된 값과 여러 단백질에 대하여 잘 상관관계가 있는 것으로 나타났다.
실온에서 낮은 형광성은 잘 접힌 단백질을 나타낸다. 형광 방출은 온도가 증가함에 따라 증가하여, 단백질의 협력적 풀림을 나타내는 S자 곡선을 생성한다. 생성된 S자형 곡선은 풀림 전이의 중간점에서 발생하는 용융 온도를 식별하기 위해 볼츠만(Boltzmann) 방정식에 정합될 수 있고; 다르게는 Tm은 온도의 함수(-dF/dT)로서 형광 방출의 1차 도함수를 플롯팅하여 쉽게 식별할 수 있으며, 이때 Tm은 형(Huynh) 등의 상기 인용된 문헌에서와 같이 곡선의 최소값에 상응한다.
다양한 형광 염료가 사용될 수 있으며, 직접적으로 또는 검정 키트의 일부로서 상업적으로 입수 가능하다. 예시적인 형광 염료는 사이프로 오렌지(SYPRO Orange)이다. 온도 조절 및 형광 검출을 위해 통상적인 실시간 PCR 기기를 사용할 수 있다. 일반적으로 완충액, 염 농도 및 조성, 기타 첨가제, 예를 들어 DMSO의 선택은 TdT 변이체를 이용한 DNA 합성 반응의 혼입 또는 커플링 조건에 상응하도록 만들어진다. 예시적인 커플링 조건은 아래에 주어진다.
상기 언급된 바와 같이, 일부 실시태양에서, N-절단된 TdT 변이체의 특정 위치에서의 안정화 아미노산 치환(또는 동등하게, 안정화 아미노산)은 안정화 아미노산 치환을 제외하고는 동일한 아미노산 서열의 TdT의 용융 온도에 비하여 상기 TdT 변이체의 용융 온도를 적어도 1℃만큼 증가시키는 아미노산 치환이고, 이때 용융 온도는 형광-기반 열 이동 검정에 의해 결정된다. 일부 실시태양에서, 이러한 검정은 사이프로 오렌지 염료를 사용한다. 또 다른 실시태양에서, 이러한 검정의 반응 조건은 커플링 반응 조건을 포함한다. 추가의 실시태양에서, 이러한 안정화 아미노산 치환은 TdT 변이체의 용융 온도를 1.5℃만큼 증가시킨다.
일부 실시태양에서, 용융 온도는 하기 용액에서 열 이동 검정으로 측정된다: 사이프로 오렌지 염료가 포함된 0.5 카코딜레이트 KOH 완충액 pH 7.4. 검정을 위해 염료 및 단백질 농도의 일부 일상적인 최적화가 이루어질 수 있고, 예를 들면 이러한 최적화에 대한 지침은 상기 인용된 참고문헌, 특히 형(Huynh) 등의 상기 인용된 문헌에서 제공된다.
주형-부재 효소 합성
폴리뉴클레오타이드의 주형-부재 효소 합성은 3'-O-차단된 데옥시뉴클레오사이드 삼인산염(3'-O-차단된 dNTP)의 혼입에 있어서 더 큰 온도 안정성 또는 더 큰 효율과 같은 향상된 특징을 갖도록 조작된 말단 데옥시뉴클레오티딜 전이효소(TdT)(변이체 포함)와 같은 주형-부재의 중합효소를 사용하는 다양한 공지된 프로토콜에 의해 수행될 수 있고, 예를 들면 이버트(Ybert) 등의 국제 특허출원 공개공보 제WO/2015/159023호; 이버트(Ybert) 등의 국제 특허출원 공개공보 제WO/2017/216472호; 히만(Hyman)의 미국 특허 제5,436,143호; 히아트(Hiatt) 등의 미국 특허 제5,763,594호; 젠센(Jensen) 등의 문헌[Biochemistry, 57: 1821-1832(2018)]; 매튜스(Mathews) 등의 문헌[Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f(2016)]; 슈미츠(Schmitz) 등의 문헌[Organic Lett., 1(11): 1729-1731(1999)]을 참조한다.
일부 실시태양에서, 효소적 DNA 합성 방법은 도 1에 예시된 것과 같은 단계의 반복된 주기를 포함하며, 이때 미리 결정된 뉴클레오타이드를 각 주기에 첨가한다. 개시제 폴리뉴클레오타이드(100)는 예를 들어 유리 3'-하이드록실기(103)를 갖는 고체 지지체(102)에 부착되어 제공된다. 개시제 폴리뉴클레오타이드(100)(또는 후속 주기에서 연장된 개시제 폴리뉴클레오타이드)에, 개시제 폴리뉴클레오타이드(100)(또는 연장된 개시제 폴리뉴클레오타이드)의 3' 말단 상으로의 3'-O-보호된-dNTP의 효소적 혼입에 효과적인 조건(104) 하에, 3'-O-보호된-dNTP 및 TdT 변이체를 첨가한다. 이 반응은 3'-하이드록실이 보호되는 연장된 개시제 폴리뉴클레오타이드를 생성한다(106). 연장된 개시제 폴리뉴클레오타이드가 경쟁 서열을 포함하는 경우, 3'-O-보호기가 제거되거나 보호제거되고, 원하는 서열은 본래의 개시제 폴리뉴클레오타이드로부터 절단된다. 이러한 절단은 다양한 단일 가닥 절단 기술 중 임의의 것을 사용하여, 예를 들어 본래의 개시제 폴리뉴클레오타이드 내의 미리 결정된 위치에 절단 가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단 가능한 뉴클레오타이드는 우라실 DNA 글리코실라아제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 연장된 개시제 폴리뉴클레오타이드가 완성된 서열을 포함하지 않는 경우, 3'-O-보호기가 제거되어 유리 3'-하이드록실(103)이 노출되고 연신된 개시제 폴리뉴클레오타이드는 뉴클레오타이드 첨가 및 보호제거의 또 다른 주기를 거치게 된다.
본원에 사용된 용어 "보호된" 및 "차단된"은 뉴클레오타이드 또는 뉴클레오사이드의 3'-하이드록실과 같은 특정 기와 관련하여 상호교환적으로 사용되며, 특정 기에 공유적으로 부착되어 화학적 또는 효소적 과정 동안 그러한 기에 대한 화학적 변화를 방지하는 모이어티(moiety)를 의미하고자 한다. 특정 기가 뉴클레오사이드 삼인산염의 3'-하이드록실이거나 3'-보호된(또는 차단된)-뉴클레오사이드 삼인산염이 혼입된 연장된 단편(또는 "연장 중간체")일 때마다, 방지된 화학적 변화는 효소적 커플링 반응에 의한 연장된 단편(또는 "연장 중간체")의 추가적 또는 후속적 연장이다.
일부 실시태양에서, 뉴클레오타이드의 정렬된 서열은 각 합성 단계에서 3'-O-가역적으로 차단된 dNTP의 존재 하에 TdT를 사용하여 개시제 핵산에 커플링된다. 일부 실시태양에서, 올리고뉴클레오타이드를 합성하는 방법은 (a) 유리 3'-하이드록실을 갖는 개시제를 제공하는 단계; (b) 3'-O-차단된 뉴클레오사이드 삼인산염의 존재 하에 개시제 또는 유리 3'-하이드록실을 갖는 연장 중간체를 TdT와 연장 조건 하에 반응시켜 3'-O-차단된 연장 중간체를 생성하는 단계; (c) 연장 중간체를 차단제거하여 유리 3'-하이드록실을 갖는 연장 중간체를 생성하는 단계; 및 (d) 폴리뉴클레오타이드가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 포함한다(때때로 "연장 중간체"는 "연신 단편"으로도 지칭된다). 일부 실시태양에서, 개시제는 고체 지지체에, 예를 들어, 5' 말단에 의해 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 반응, 또는 연장 단계 이후뿐만 아니라, 차단제거 단계 이후에 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는 혼입되지 않은 뉴클레오사이드 삼인산염을, 예를 들어, 미리 정해진 항온처리 기간 또는 반응 시간 후 세척에 의해 제거하는 하위-단계를 포함할 수 있다. 이러한 미리 결정된 항온처리 기간 또는 반응 시간은 수 초, 예를 들어 30초에서 수 분, 예를 들어 30분일 수 있다.
상기 방법은 또한 캡핑(capping) 단계(들)뿐만 아니라, 반응 또는 연장 단계 이후 및 차단제거 단계 이후에 세척 단계를 포함할 수 있다. 위에서 언급한 바와 같이, 일부 실시태양에서, 비-연장 유리 3'-하이드록실이 캡핑된 가닥의 추가의 연장을 방지하는 화합물과 반응하는 캡핑 단계가 포함될 수 있다. 일부 실시태양에서, 이러한 화합물은 디데옥시뉴클레오사이드 삼인산염일 수 있다. 다른 실시태양에서, 유리 3'-하이드록실을 갖는 비-연장 가닥은 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리함으로써 분해될 수 있다. 예를 들어, 히만(Hyman)의 미국 특허 제5,436,143호를 참조한다. 유사하게, 일부 실시태양에서, 차단제거에 실패한 가닥은 가닥을 제거하거나 추가의 연장에 대하여 불활성이 되도록 처리될 수 있다.
올리고뉴클레오타이드의 일련의 합성을 포함하는 일부 실시태양에서, 캡핑 단계는 동일 몰량의 복수의 올리고뉴클레오타이드의 생성을 방지할 수 있으므로 캡핑 단계는 바람직하지 않을 수 있다. 캡핑 부재하에, 서열은 균일한 분포의 결실 오류를 가질 것이지만, 복수의 올리고뉴클레오타이드 각각은 동일한 몰량으로 존재할 것이다. 비-연장 단편이 캡핑된 경우에는 그렇지 않을 것이다.
일부 실시태양에서, 연장 또는 연신 단계를 위한 반응 조건은 2.0μM 정제된 TdT; 125 내지 600μM 3'-O-차단된 dNTP(예를 들어, 3'-O-NH2-차단된 dNTP); 약 10 내지 약 500mM 카코딜산 칼륨 완충액(pH 6.5 내지 7.5) 및 약 0.01 내지 약 10mM 2가 양이온(예를 들어, CoCl2 또는 MnCl2)을 포함할 수 있고, 이때 연신 반응은 50 ㎕의 반응 부피에서, RT 내지 45℃ 범위의 온도에서 3분 동안 수행될 수 있다. 3'-O-차단된 dNTP가 3'-O-NH2-차단된 dNTP인 실시태양에서, 차단제거 단계를 위한 반응 조건은 700mM NaNO2; 1M 아세트산 나트륨(4.8 내지 6.5 범위의 pH로 아세트산으로 조정됨)을 포함할 수 있고, 이때 차단제거 반응은 RT 내지 45℃ 범위 내의 온도에서 30초 내지 수 분 동안 50 ㎕ 부피에서 수행될 수 있다.
특정 적용에 따라, 차단제거 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건, 예를 들어, 빛, 열, pH, 특정 화학 결합을 절단할 수 있는 효소와 같은 특정 시약의 존재를 포함한다. 3'-O-차단기 및 상응하는 차단제거 조건을 선택하는 지침은 참조로 포함된 다음의 참고문헌에서 찾을 수 있다: 미국 특허 제5,808,045호; 미국 특허 제8,808,988호; 국제 특허출원 공개공보 제W091/06678호; 및 아래에 인용된 참고문헌. 일부 실시태양에서, 절단제(때때로 차단제거 시약 또는 차단제거제)는 예를 들어 디티오트레이톨(DTT)과 같은 화학적 절단제이다. 다른 실시태양에서, 절단제는 3'-포스페이트 차단기를 절단할 수 있는, 예를 들어 포스파타아제와 같은 효소적 절단제일 수 있다. 당업자라면 차단제거제의 선택은 사용된 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다수의 차단기가 사용되는지의 여부, 개시제가 생세포 또는 유기체 또는 고체 지지체에 부착되는지 여부 등에 따라 좌우될 것이고, 온화한 처리가 필요함을 이해할 것이다. 예를 들어, 트리스(2-카르복시에틸)포스핀(TCEP)과 같은 포스핀을 사용하여 3'O-아지도메틸기를 절단할 수 있거나, 팔라듐 착체를 사용하여 3'O-알릴기를 절단할 수 있거나, 아질산나트륨을 사용하여 3'0-아미노 기를 절단할 수 있다. 특정 실시태양에서, 절단 반응은 TCEP, 팔라듐 착체 또는 아질산나트륨을 포함한다.
상기 주지된 바와 같이, 일부 실시태양에서, 직교 차단제거 조건을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직하다. 차단기의 하기 예시적인 쌍(표 5)은 상기 기재된 바와 같은 병렬 합성 실시태양에서 사용될 수 있다. 다른 차단기 쌍, 또는 둘 이상을 함유하는 기가 본 발명의 이러한 실시태양에서 사용하기 위해 이용 가능할 수 있는 것으로 이해된다.
[표 5]
차단기의 예시적인 쌍
Figure pct00006
생세포에서 올리고뉴클레오타이드를 합성하려면 온화한 차단제거 또는 보호제거 조건, 즉 세포막을 파괴하지 않고 단백질을 변성시키거나 주요 세포 작용을 방해하지 않는 조건 등이 필요하다. 일부 실시태양에서, 보호제거 조건은 세포 생존과 양립할 수 있는 생리학적 조건의 범위 내에 있다. 이러한 실시태양에서, 효소적 보호제거는 생리학적 조건 하에서 수행될 수 있기 때문에 바람직하다. 일부 실시태양에서 효소적으로 제거 가능한 특정 차단기는 그의 제거를 위한 특정 효소와 회합된다. 예를 들어, 에스테르 또는 아실 기반 차단기는 아세틸에스테라아제와 같은 에스테라아제 또는 유사 효소로 제거될 수 있고, 포스페이트 차단기는 T4 폴리뉴클레오타이드 키나아제와 같은 3' 포스파타아제로 제거될 수 있다. 예를 들어, 3'-O-인산염은 100mM 트리스-HCl(pH 6.5), 10mM MgCl2, 5mM 2-머캅토에탄올 및 1 유닛의 T4 폴리뉴클레오타이드 키나아제의 용액으로 처리함으로써 제거될 수 있다. 반응은 37℃의 온도에서 1분간 진행된다.
"3'-포스페이트-차단된" 또는 "3'-포스페이트-보호된" 뉴클레오타이드는 3'-위치의 하이드록실기가 포스페이트 함유 모이어티의 존재에 의해 차단된 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트-차단된 뉴클레오타이드의 예는 뉴클레오티딜-3'-포스페이트 모노에스테르/뉴클레오티딜-2',3'-사이클릭 포스페이트, 뉴클레오티딜-2'-포스페이트 모노에스테르 및 뉴클레오티딜-2' 또는 3'-알킬포스페이트 디에스테르, 및 뉴클레오티딜-2' 또는 3'-피로포스페이트이다. 티오포스페이트 또는 이러한 화합물의 다른 유사체도 사용될 수 있으나, 단, 치환이 탈인산화를 방지하지 않아 포스파타아제에 의해 유리 3'-OH가 생성되어야 한다.
3'-O-에스테르-보호된 dNTP 또는 3'-O-포스페이트-보호된 dNTP의 합성 및 효소적 보호제거의 추가의 예는 하기 참고문헌에 기재되어 있다: 캐나드(Canard) 등의 문헌[Proc. Natl. Acad. Sci., 92:10859-10863(1995)]; 캐나드(Canard) 등의 문헌[Gene, 148: 1-6(1994)]; 카메론(Cameron) 등의 문헌[Biochemistry, 16(23): 5120-5126(1977)]; 라소론자토보(Rasolonjatovo) 등의 문헌[Nucleosides & Nucleotides, 18(4&5): 1021-1022(1999)]; 페레로(Ferrero) 등의 문헌[Monatshefte fur Chemie, 131: 585-616(2000)]; 타운톤-릭비(Taunton-Rigby) 등의 문헌[J. Org. Chem., 38(5): 977-985(1973)]; 우에무라(Uemura) 등의 문헌[Tetrahedron Lett., 30(29): 3819-3820(1989)]; 베커(Becker) 등의 문헌[J. Biol. Chem., 242(5): 936-950(1967)]; 씨엔(Tsien)의 국제 특허출원 공개공보 제WO1991/006678호.
본원에 사용된 "개시제"(또는 "개시 단편", "개시제 핵산", "개시제 올리고뉴클레오타이드" 등과 같은 동등한 용어)는 TdT와 같은 주형-부재의 중합효소에 의해 추가로 연장될 수 있는 유리 3'-말단을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭한다. 한 실시태양에서, 개시 단편은 DNA 개시 단편이다. 다른 실시태양에서, 개시 단편은 RNA 개시 단편이다. 한 실시태양에서, 개시 단편은 3 내지 100개의 뉴클레오타이드, 특히 3 내지 20개의 뉴클레오타이드를 보유한다. 한 실시태양에서, 개시 단편은 단일 가닥이다. 다른 실시태양에서, 개시 단편은 이중 가닥이다. 특정 실시태양에서, 5'-1차 아민으로 합성된 개시제 올리고뉴클레오타이드는 제조업체의 프로토콜을 사용하여 자기 비드에 공유적으로 연결될 수 있다. 마찬가지로, 3'-1차 아민으로 합성된 개시제 올리고뉴클레오타이드는 제조업체의 프로토콜을 사용하여 자기 비드에 공유적으로 연결될 수 있다. 본 발명의 실시태양과 함께 사용할 수 있는 다양한 다른 부착 화학물질은 당업계, 예를 들어, 혼입 DNA 기술 브로셔["고체 지지체에 올리고뉴클레오타이드를 부착하기 위한 전략(Strategies for Attaching Oligonucleotides to Solid Supports)", v.6(2014); Hermanson, Bioconjugate Techniques, Second Edition(Academic Press, 2008)]; 및 유사 참고문헌에 잘 알려져 있다.
본 발명에 사용된 많은 3'-O-차단된 dNTP는 판매 회사로부터 구입되거나, 예를 들어 미국 특허 제7,057,026호; 국제 특허출원 공개공보 제W02004/005667호, 제WO91/06678호; 캐나드(Canard) 등의 문헌[Gene(상기 인용)]; 메츠커(Metzker) 등의 문헌[Nucleic Acids Research, 22: 4259-4267(1994)]; 멩(Meng) 등의 문헌[J. Orgarnic Chem., 14: 3248-3252(3006)]; 미국 특허출원 공개공보 제2005/037991호에 공개된 기법을 사용하여 합성될 수 있다. 일부 실시태양에서, 변형된 뉴클레오타이드는 퓨린 또는 피리미딘 염기, 및 3' 탄소 원자가 하기 구조의 기에 부착되도록, 공유 부착된 제거 가능한 3'-OH 차단기를 갖는 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함한다:
-O-Z
이때, -Z는 -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" 및 -C(R')2-F이고, 이때 각각의 R"은 제거 가능한 보호기이거나 그 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도 기, 또는 연결기를 통해 부착된 검출 가능한 표지이고; 단, 일부 실시태양에서 이러한 치환기는 10개 이하의 탄소 원자 및/또는 5개 이하의 산소 또는 질소 헤테로원자를 갖거나; 또는 (R')2는 화학식 =C(R"')2의 기를 나타내고, 이때 각각의 R"'는 동일하거나 상이할 수 있고 수소 및 할로겐 원자 및 알킬 기를 포함하는 군에서 선택되며, 단 일부 실시태양에서 각각의 R"'의 알킬은 1 내지 3개의 탄소 원자를 갖고; 이때 분자는 반응하여 각각의 R"이 H로 교환되거나, Z가 -(R')2-F인 경우, F가 OH, SH 또는 NH2, 바람직하게는 OH로 교환되는 중간체를 생성할 수 있으며, 이러한 중간체는 수성 조건 하에 해리되어 유리 3'-OH를 갖는 분자를 제공하고; 단, Z가 -C(R')2-S-R"인 경우, R' 기는 둘 다 H가 아니다. 특정 실시태양에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이며, 단, 이러한 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정 실시태양에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')2-N3이다. 특정 실시태양에서, Z는 아지도메틸 기이다.
일부 실시태양에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 일부 실시태양에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시태양에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시태양에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시태양에서, Z는 200 이하의 분자량을 갖는 효소적으로 절단 가능한 에스테르 기이다. 다른 실시태양에서, Z는 3'-포스파타아제에 의해 제거 가능한 포스페이트 기이다. 일부 실시태양에서, 다음의 3'-포스파타아제 중 하나 이상이 제조업체의 권장 프로토콜에 따라 사용될 수 있다: T4 폴리뉴클레오타이드 키나아제, 송아지 장 알칼리 포스파타아제, 재조합 새우 알칼리 포스파타아제[예를 들어, 뉴잉글랜드 바이오랩스(매사추세츠 비벌리 소재)에서 입수 가능함].
추가의 특정 실시태양에서, 3'-차단된 뉴클레오타이드 삼인산염은 3'-O-아지도메틸, 3'-O-NH2또는 3'-O-알릴 기에 의해 차단된다.
또 다른 실시태양에서, 본 발명의 3'-O-차단기는 3'-O-메틸, 3'-O-(2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-3급-부톡시 에톡시, 3'-O-(2-시아노에틸), 및 3'-O-프로파길을 포함한다.
일부 실시태양에서, 3'-O-보호기는 전기화학적으로 불안정한 기이다. 즉, 보호기의 보호제거 또는 절단은 절단을 초래하는 보호기 근처의 전기화학적 조건을 변경함으로써 달성된다. 전기화학적 조건의 이러한 변화는 전압차 또는 빛과 같은 물리량을 변경하거나 적용하여 보조 화학종을 활성화함으로써 야기될 수 있으며, 이는 차례로 보호기 자리에서 전기화학적 조건의 변화, 예컨대 pH의 증가 또는 감소를 야기한다. 일부 실시태양에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 미리 결정된 값으로 변경될 때마다 절단되는 pH-민감성 보호기를 포함한다. 다른 실시태양에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변경될 때마다, 예를 들어 보호기 자리에서 전압차를 증가 또는 감소시킴으로써 직접 절단되는 보호기를 포함한다.
폴리뉴클레오타이드 쇄 연장 과정에서 2차 구조의 형성을 감소 또는 제거하기 위해 다양한 보호기(또는 동등하게 "염기 보호 모이어티")가 사용될 수 있다. 일반적으로 염기 보호기를 제거하는 조건은 3'-O-차단기를 제거하는 조건과 직교한다. 특히, 제거 또는 차단제거의 경우, 3'-O-차단기에 대한 조건이 산성인 경우, 염기 보호기는 염기 불안정성이 되도록 선택될 수 있다. 이러한 상황에서 산 불안정한 5'-O-트리틸 보호된 단량체의 사용으로 인해 포스포르아미다이트 합성 화학에서 많은 염기 불안정 보호기가 개발되었다[보케이지(Beaucage) 및 이예르(Iyer)의 문헌 "Tetrahedron Letters, 48(12): 2223-2311(1992)"]. 특히, 포스포르아미다이트 화학을 위한 아실 및 아미딘 보호기는 본 발명의 실시태양에서 적용가능하다[예를 들어, 상기 인용된 보케이지(Beaucage) 및 이예르(Iyer)의 문헌의 표 2 및 표 3의 보호기]. 일부 실시태양에서, 염기 보호기는 보케이지(Beaucage) 및 이예르(Iyer)의 문헌의 표 2(상기 인용)에 기재된 바와 같은 아미딘이다. 일반적으로, 염기 보호된 3'-O-차단된 뉴클레오사이드 삼인산염 단량체는 하기 실시예에 기재된 바와 같이 문헌에 기재된 방법의 일상적인 변형에 의해 합성될 수 있다.
일부 실시태양에서, 염기 보호기는 데옥시아데노신 삼인산염의 6-질소, 데옥시구아노신 삼인산염의 2-질소, 및/또는 데옥시시티딘 삼인산염의 4-질소에 부착된다. 일부 실시태양에서, 염기 보호기는 지시된 질소 모두에 부착된다. 일부 실시태양에서, 데옥시아데노신 삼인산염의 6-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 페녹시아세틸 및 메톡시 아세틸로 구성된 군에서 선택되고; 데옥시구아노신 삼인산염의 2-질소에 부착된 염기 보호기는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-페녹시아세틸, 페녹시아세틸 및 메톡시아세틸로 구성된 군에서 선택되고; 상기 데옥시시티딘 삼인산염의 4-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 아세틸 및 이소부티릴로 구성된 군에서 선택된다.
일부 실시태양에서, 데옥시아데노신 삼인산염의 6-질소에 부착된 보호기는 벤조일이고; 데옥시구아노신 삼인산염의 2-질소에 부착된 염기 보호기는 이소부트릴 또는 디메틸포름아미딘이고; 디옥시시티딘 삼인산염의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시태양에서, 데옥시아데노신 삼인산염의 6-질소에 부착된 염기 보호기는 페녹시아세틸이고; 데옥시구아노신 삼인산염의 2-질소에 부착된 염기 보호기는 4-이소프로필-페녹시아세틸 또는 디메틸포름아미딘이고; 디옥시시티딘 삼인산염의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시태양에서, 염기 보호 모이어티는 제거되고(즉, 생성물이 보호제거됨) 생성물이 동일한 반응에서 고체 지지체로부터 절단된다. 예를 들어, 개시제는 염기-불안정한 염기 보호 모이어티를 동시에 제거하는 1M KOH 또는 유사 시약(암모니아, 수산화암모늄, NaOH 등)으로 처리하여 폴리뉴클레오타이드 생성물을 방출하도록 절단될 수 있는 리보-우리딘을 포함할 수 있다.
염기-보호된 dNTP가 사용되는 경우, 상기 방법은 염기 보호 모이어티를 제거하는 단계를 추가로 포함할 수 있으며, 이는 아실 또는 아미딘 보호기의 경우에 (예를 들어) 농축된 암모니아로 처리하는 것을 포함할 수 있다.
변이체 TdT의 생성
본 발명의 변이체는 공지된 기준 또는 야생형 TdT-코딩 폴리뉴클레오타이드를 돌연변이시킨 다음, 이를 통상적인 분자 생물학 기술을 사용하여 작용성 단백질로서 발현시킴으로써 생성될 수 있다. 예를 들어, 절단된 마우스 TdT 효소를 코딩하는 마우스 TdT 유전자(서열 번호 2)는 예를 들어, 스템머(Stemmer) 등의 문헌[Gene, 164: 49-53(1995)]; 코두말(Kodumal) 등의 문헌[Proc. Natl. Acad. Sci., 101: 15573-15578(2004)] 등에 기재된 프로토콜을 사용하여 통상적인 분자 생물학 기술을 사용하여 합성 단편으로부터 조립될 수 있거나, 또는 불(Boule) 등의 문헌[Mol. Biotechnology, 10: 199-208(1998)], 또는 벤톨리라(Bentolila) 등의 문헌[EMBO J., 14: 4221-4229(1995)] 등에 기재된 프로토콜을 사용하여 마우스 세포로부터 직접 클로닝될 수 있다.
예를 들어, 단리된 TdT 유전자는 pET32[노바겐(Novagen)]와 같은 발현 벡터에 삽입되어 벡터 pCTdT를 제공할 수 있으며, 이는 이후 통상적인 프로토콜을 사용하여 변이체 TdT 단백질을 만들고 발현하는데 사용될 수 있다. 올바른 서열을 가진 벡터는 이. 콜라이(E. coli) 생산자 균주에서 형질전환될 수 있다.
형질전환된 균주는 통상적인 기술을 사용하여 TdT 단백질이 추출되는 펠릿으로 배양된다. 예를 들어, 미리 준비된 펠릿을 30 내지 37℃ 수조에서 해동한다. 완전히 해동되면 펠릿을 50mM 트리스-HCL(시그마) pH 7.5, 150mM NaCl(시그마), 0.5mM 머캅토에탄올(시그마), 5% 글리세롤(시그마), 20mM 이미다졸(시그마) 및 100 ㎖의 프로테아제 칵테일 억제제[써모피셔(Thermofisher)]를 위한 1 탭(tab)으로 구성된 용해 완충액에 재현탁한다. 조기 용해 및 응집체의 잔류를 방지하기 위해 신중한 재현탁을 수행한다. 전체 색상 균질성이 얻어질 때까지 여러 주기의 프렌치 프레스(French press)를 통해 재현탁된 세포를 용해시킨다. 사용되는 일반적인 압력은 14,000 psi이다. 그런 다음 용해물을 10,000 rpm에서 1시간 내지 1시간 30분 동안 원심분리한다. 원심분리물을 칼럼 정제 전에 잔해를 제거하기 위해 0.2 ㎛ 필터에 통과시킨다.
TdT 단백질은 1단계 친화성 절차로 원심분리물로부터 정제될 수 있다. 예를 들어, Ni-NTA 친화성 칼럼[GE 헬쓰케어(GE Healthcare)]은 중합효소를 결합하기 위해 사용된다. 초기에 칼럼을 세척하고 15 칼럼 부피의 50mM 트리스-HCL(시그마) pH 7.5, 150mM NaCl(시그마) 및 20mM 이미다졸(시그마)로 평형화시킨다. 평형화 후 중합효소를 칼럼에 결합시킨다. 이후, 50mM 트리스-HCL(시그마) pH 7.5, 500mM NaCl(시그마) 및 20mM 이미다졸(시그마)로 구성된 세척 완충액을 15 칼럼 부피로 칼럼에 적용한다. 세척 후 중합효소를 50mM 트리스-HCL(시그마) pH 7.5, 500mM NaCl(시그마) 및 0.5M 이미다졸(시그마)로 용리한다. 관심 있는 중합효소의 최고 농도에 해당하는 분별물을 수집하여 단일 샘플로 모은다. 모아진 분별물을 투석 완충액(20mM 트리스-HCl, pH 6.8, 200mM NaCl, 50mM MgOAc, 100mM [NH4]2SO4)에 대하여 투석한다. 후속적으로 투석물을 농축 필터[아미콘 울트라(Amicon Ultra)-30, 메르크 밀리포어(Merk Millipore)]를 사용하여 농축한다. 농축된 효소를 소량으로 나누고 최종 50% 글리세롤을 첨가한 후 분취물을 -20℃에서 동결하여 장기간 보관한다. 다양한 정제된 효소 분별물 5 ㎕를 SDS PAGE 겔에서 분석한다.
일부 실시태양에서, TdT 변이체는 공유 또는 비공유 결합을 포함하는 연결기 모이어티; 아미노산 태그(예를 들어, 폴리-아미노산 태그, 폴리-His 태그, 6His-태그 등); 화합물(예를 들어, 폴리에틸렌 글리콜); 단백질-단백질 결합 쌍(예를 들어, 비오틴-아비딘); 친화성 커플링; 포획 프로브; 또는 이들의 임의의 조합에 작동가능하게 연결될 수 있다. 연결기 모이어티는 TdT 변이체와 분리되거나 TdT 변이체의 일부일 수 있다. 본 발명의 TdT 변이체와 함께 사용하기 위한 예시적인 His-태그는 MASSHHHHHHSSGSENLYFQTGSSG-(서열 번호 19)이다. 태그-연결기 모이어티는 뉴클레오타이드 결합 활성 또는 TdT 변이체의 촉매 활성을 방해하지 않는다.
상기 공정 또는 동등한 공정은 활성 및/또는 보존에 필요하거나 유용한 염, pH 완충제, 담체 화합물 등과 같은 다양한 시약과 혼합될 수 있는 단리된 TdT 변이체를 생성한다.
본 발명의 방법을 실행하기 위한 키트
본 발명은 본 발명의 방법을 실행하기 위한 다양한 키트를 포함한다. 한 양태에서, 본 발명의 키트는 본원에 기재된 바와 같은 주형-부재의 효소적 폴리뉴클레오타이드 합성을 수행하기에 적합한 제제 또는 별도로 제공되는 경우 제제들 내에 본 발명의 하나 이상의 키메라 TdT 변이체를 포함한다. 이러한 키트는 또한 성장하는 가닥으로의 3'-0-보호된 dNTP의 주형-부재의 첨가 또는 혼입을 최적화하기 위한 반응 조건을 제공하는 각각의 TdT 변이체에 대한 합성 완충액을 포함할 수 있다. 일부 실시태양에서, TdT 변이체 각각은 동일하거나 상이한 제제로, 별도의 용기에 분리되어 제공될 수 있고, 다른 실시태양에서, TdT 변이체의 일부 또는 전부는 공통의 제제에서 이들의 혼합물로 제공될 수 있다. 일부 실시태양에서, 본 발명의 키트는 3'-O-가역적으로 보호된 dNTP를 추가로 포함한다. 이러한 실시태양에서, 3'-O-가역적으로 보호된 dNTP는 3'-O-아미노-dNTP 또는 3'-O-아지도메틸-dNTP를 포함할 수 있다. 추가의 실시태양에서, 키트는 하기 항목 중 하나 이상을 별도로 또는 상기 언급된 항목과 함께 포함할 수 있다: (i) 본원에 기재된 바와 같은 보호제거 단계 또는 차단제거 단계를 수행하기 위한 보호제거 시약 또는 차단제거 시약, (ii) 개시제가 부착된 고체 지지체, (iii) 고체 지지체로부터 완성된 폴리뉴클레오타이드를 방출하기 위한 절단 시약, (iv) 효소 첨가 또는 커플링 단계의 종료시 미반응 3'-O-가역적으로 보호된 dNTP를 제거하기 위한 세척 시약 또는 완충액, 및 (v) 합성 후 처리 시약, 예컨대 정제 칼럼, 탈염 시약, 용리 시약 등.
상기 항목 (ii) 및 (iii)과 관련하여, 특정 개시제 및 절단 시약은 동반된다. 예를 들어, 이노신 절단 가능한 뉴클레오타이드를 포함하는 개시제는 엔도뉴클레아제 V 절단 시약과 함께 제공될 수 있고; 니트로벤질 광절단성 연결기를 포함하는 개시제는 광절단성 연결기를 절단하기 위해 적합한 광원과 함께 제공될 수 있고; 우라실을 포함하는 개시제는 우라실 DNA 글리코실라아제 절단 시약과 함께 제공될 수 있는 등이다.
실시예 1: 3'-O-보호된 데옥시뉴클레오사이드 삼인산염의 혼입에 대한 활성이 향상된 키메라 마우스-소 TdT 변이체
본 실시예에서, 마우스 TdT 변이체 M53(서열 번호 21) 및 소 TdT 변이체 M54(서열 번호 54)로부터 작성된 마우스-소 키메라 TdT 변이체 M57(서열 번호 23) 및 M59(서열 번호 24)를 마우스 TdT 변이체 M27(서열 번호 25)과 비교하여 dNTP 혼입에서의 서열 특이적 가변성에 대하여 시험하였다. 즉, 성장하는 가닥의 3개의 3'-말단 뉴클레오타이드의 작용으로서 3'-O-차단된 dNTP를 혼입하는 효율성에 대하여 M57 및 M59를 시험하였다. 시험을 위해, 대조군으로서 마우스 TdT 변이체 M27과 함께 각각의 키메라 TdT 변이체(M57 및 M59)에 의해 24개의 52량체 무작위 서열 폴리뉴클레오타이드를 합성하였다. 합성을 이중으로 수행하였다. 각 가능한 4량체가 전체적으로(24 x 52 유효 서열) 대략 그의 예상 빈도로, 즉 1/256로 또는 약 4 또는 5회 발생으로 표시되도록 24개의 52량체를 선택하였다.
합성 조건. 2배 농축된 dNTP-ONH2(1mM), DMSO(20%) 및 보조인자(4mM CoCl2) 및 2배 농축된 돌연변이체(32mM)를 함유하는 예비혼합물을 TY 1x 완충액 0.01% 트윈(Tween)20에서 별도로 제조하였다. M59 대 M27 반응의 경우, 트윈20을 뉴클레오티드 예비혼합물에 2x 추가하였다. M27 및 M59 또는 M57을 사용하여 37℃에서 이중으로 24개의 서열(52량체)을 합성하였다. 연장 시간은 4분으로 설정하였다. 500 pmole의 dI 수지(R133)와 wwPTFE 멤브레인이 있는 필터 플레이트[팔 래보레이토리(Pall Laboratory), 뉴욕]를 사용하여 합성을 수행하였다. TY 1x 완충액은 카코딜산 칼륨 200mM pH 6.8, MgCl2 5mM이 포함되어 있다. dI 수지 R133은 아미노 작용을 통해 1OT-dI-T 초기 DNA(개시자 DNA)와 결합된 CNBr 세파로스 수지[지이 헬쓰케어(GE Healthcare)]이고 연결기는 Cl2이다. 따라서 수지에 부착된 완전한 서열은 5 AmMC 12/TTTTTTTTTT/dI/T(서열 번호 83)이다.
합성 후 처리. 합성 후, 첫 번째 세척을 수행하였다(1x 100 ㎕/웰 H20, 3x 100 ㎕/웰 SDS/DTT, 3x 100 ㎕/웰 H20). M57 대 M27 플레이트의 경우 SDS/DTT 세척을 수행하지 않았다. 그런 다음, 플레이트를 진공처리하고 2000 g에서 2분 동안 원심분리함으로써 나머지 액체를 제거한 직후 M59 대 M27 플레이트에 대하여 TH1 완충액 1x 또는 M57 대 M27 플레이트에 대하여 WLE1 완충액 1x로 3x 50 ㎕ 세척을 수행하였다. 수지로부터 합성된 가닥을 제거하기 위한 절단을 직후에 수행하였다. dI 절단을 위해, 수지를 50 ㎕의 반응 부피[M59 대 M27 플레이트의 경우 173mM NaCl 및 50mM MgCl2를 포함하는 10mM 트리스 pH 7.9 또는 M57 대 M27 플레이트의 경우 50mM KCl 및 15mM MgC12을 포함하는 10mM 트리스 pH 7.9]에서 1μM 내부용(in-house) EndoV와 함께 30분 동안 42℃에서 1250 rpm으로 항온처리한 다음, 2000 g에서 2분 동안 원심분리하였다. 수지를 M59 대 M27 플레이트의 경우 25 ㎕의 TH1 완충액으로 1회 세척하거나 M57 대 M27 플레이트의 경우 WLE1 완충액으로 1회 세척하고, 42℃, 1250 rpm에서 2분 더 항온처리하고 2000 g에서 2분 동안 다시 원심분리하였다. 회수된 여액을 96웰 PCR 플레이트로 옮기고 필요한 경우 -20℃에서 보관하였다. 결국, 각 웰로부터 75 ㎕ 미만이 수집되었다. TH1 완충액은 10mM 트리스, 170mM NaCl, 50 MgCl2 pH 8을 포함한다. WLE1 완충액은 10mM 트리스 pH 7.9, 50mM KC1 및 15mM MgC12을 포함한다.
DNA 침전. 0.5 ㎕의 글리코겐 및 NaAc(3M) pH 5.2(7.5 ㎕)를 웰당 첨가하고 짧게 진탕시켰다. 75 ㎕의 이소프로판올을 웰당 첨가하고 4℃에서 1시간 15분 동안 3428 g에서 원심분리하였다. 상청액을 흡인하고 각 웰에 20 ㎕만 남겼다. 180 ㎕의 새로 제조된 에탄올 80%를 웰당 첨가하고 4℃에서 30분 동안 3428 g에서 원심분리하였다. 상청액 제거 및 세척을 다시 반복하였다. 원심분리 후, 웰당 10 ㎕만 남겨서 스피드백(Speedvac)에서 35℃에서 30분 동안 건조시켰다. 건조된 DNA를 15 ㎕의 물 MB 등급에 재현탁한 후 농도를 측정하였다.
라이브러리 제조: 일루미나(Illumina) 1 96 rxns(ozyme SW10096)용 Accel-NGS IS Plus DNA 라이브러리 키트를 사용하여 라이브러리를 제조하였다. 일루미나(ozyme SW16024)용 IS Plus 인덱싱(indexing) 키트를 사용하여 라이브러리를 인덱싱하였다.
도 3a 및 3b는 서열분석 데이터로부터 도출된 결과를 나타낸다. 도 3a에서, 상이한 3량체 서열 뒤에 발생하는 결실의 빈도(백분율)를 마우스 TdT 변이체 M27(서열 번호 25) 및 마우스-소 키메라 TdT 변이체 M57(서열 번호 23)에 대하여 비교한다. 도 3b에서, 상이한 3량체 서열 뒤에 발생하는 결실의 빈도를 마우스 TdT 변이체 M27(서열 번호 25) 및 마우스-소 키메라 TdT 변이체 M59(서열 번호 24)에 대하여 비교한다. 가독성을 위해 처음 4개의 3량체를 제외하고 다른 모든 데이터 막대 쌍에만 그의 상응하는 3량체로 표지화함을 주지한다. 이전 TdT 변이체(M27로 예시됨)와 키메라 TdT 변이체(M57 및 M59로 예시됨) 간의 중요한 차이점은 합성되는 폴리뉴클레오타이드에서 특히 삼중체, CCA 및 CTA(각각 도 3a 및 3b의 300 및 302)의 발생에 대하여 키메라 TdT 변이체 M57 및 M59에 의한 결실의 서열 특이적 삽입의 최소화이다. 이러한 삼중체 모두의 경우, M57 또는 M59에 대한 삼중체 이후의 결실 비율은 M27의 비율에 비해 약 25% 이하이다.
정의
아미노산은 다음 명명법에 따라 1문자 또는 3문자 코드로 표시된다. A: 알라닌(Ala); C: 시스테인(Cys); D: 아스파르트산(Asp); E: 글루탐산(Glu); F: 페닐알라닌(Phe); G: 글리신(Gly); H: 히스티딘(His); I: 이소류신(Ile); K: 리신(Lys); L: 류신(Leu); M: 메티오닌(Met); N: 아스파라긴(Asn); P: 프롤린(Pro); Q: 글루타민(Gln); R: 아르기닌(Arg); S: 세린(Ser); T: 트레오닌(Thr); V: 발린(Val); W: 트립토판(Trp) 및 Y: 티로신(Tyr).
2개 이상의 상이한 TdT의 아미노산 위치와 관련하여 "작용적으로 동등한"은 (i) 각 위치의 아미노산이 TdT의 활성에서 동일한 작용적 역할을 하고, (ii) 아미노산이 각각의 TdT의 아미노산 서열에서 상동 아미노산 위치에서 발생함을 의미한다. 서열 정렬 및/또는 분자 모델링을 기반으로 2개 이상의 상이한 TdT의 아미노산 서열에서 위치적으로 동등하거나 상동인 아미노산 잔기를 확인하는 것이 가능하다. 일부 실시태양에서, 작용적으로 동등한 아미노산 위치는 진화적으로 관련된 종, 예를 들어 속, 과 등으로 관련된 TdT의 아미노산 서열 중에서 보존되는 서열 모티프(motif)에 속한다. 이러한 보존된 서열 모티프의 예는 모테아(Motea) 등의 문헌[Biochim. Biophys. Acta. 1804(5): 1151-1166(2010)]; 델라루에(Delarue) 등의 문헌[EMBO J., 21: 427-439(2002)]; 및 유사한 참고문헌에 기재되어 있다.
단백질과 관련하여 "단리된"은 그의 자연 환경의 성분으로부터 또는 이종성 반응 혼합물로부터 식별 및 분리 및/또는 회수된 화합물을 의미한다. 자연 환경 또는 반응 혼합물의 오염 성분은 단백질의 작용을 방해하고 효소, 호르몬 및 기타 단백질성 또는 비단백질성 용질을 포함할 수 있는 물질이다. 일부 실시태양에서, 본 발명의 단백질은 (1) 로우리(Lowry) 방법에 의해 측정될 경우 단백질의 95 중량%를 초과, 가장 바람직하게는 99 중량%를 초과하도록, (2) 스피닝 컵 서열 결정장치를 사용하여 N-말단 또는 내부 아미노산 서열의 적어도 15개의 잔기를 수득하기에 충분한 정도로, 또는 (3) 쿠마시 블루, 또는 바람직하게는 은 오염(silver stain)을 사용하여 환원성 또는 비환원성 조건 하에 SDS-PAGE에 의해 균질하도록 정제된다. 재조합 방법에 의해 제조되는 경우, 본 발명의 단리된 단백질은 재조합 세포 내에서 제자리에서 본 발명의 단백질을 포함할 수 있고, 이는 단백질의 자연 환경의 적어도 하나의 성분이 존재하지 않을 것이기 때문이다. 일반적으로, 본 발명의 단리된 단백질은 적어도 하나의 정제 단계에 의해 제조된다.
"키트"는 본 발명의 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 임의의 전달 시스템을 지칭한다. 반응 분석과 관련하여, 이러한 전달 시스템은 반응 시약(예를 들어, 적절한 용기중의 하나 이상의 TdT 변이체, 반응 완충액, 3'-O-보호된-dNTP, 보호제거 시약, 개시제가 부착된 고체 지지체 등) 및/또는 지지 물질(예를 들어, 완충액, 분석을 수행하기 위한 서면 지침 등)을 한 장소에서 또 다른 장소로 운송하거나 전달하거나 저장할 수 있도록 허용하는 시스템 및/또는 화합물(예컨대 희석제, 계면활성제, 담체 등)을 포함한다. 예를 들어, 키트는 관련 반응 시약 및/또는 지지 물질이 들어 있는 하나 이상의 동봉물(예를 들어, 상자)을 포함한다. 이러한 내용물은 의도된 수신자에게 함께 또는 개별적으로 전달될 수 있다. 예를 들어, 제1 용기는 합성 방법에 사용하기 위한 하나 이상의 TdT 변이체를 포함할 수 있는 반면, 제2 또는 추가의 용기는 보호제거제, 개시제를 갖는 고체 지지체, 3'-O-보호된 dNTP 등을 포함할 수 있다.
상호교환적으로 사용되는 "돌연변이체" 또는 "변이체"는 서열 번호 2와 같은 특정(보통 야생형 또는 천연) 아미노산 서열로부터 유래된 폴리펩타이드를 지칭하고, 이는 하나 이상의 위치에서 특정 서열에 대하여 변형 또는 변경, 즉 치환, 삽입 및/또는 결실을 포함한다. 이러한 돌연변이체 또는 변이체는 일반적으로 주형-부재의 중합효소 활성 및 하나 이상의 가역적으로 차단된 뉴클레오사이드 삼인산염 전구체를 혼입하는 능력 둘 다를 가지고 있다. 변이체는 당업계에 잘 알려진 다양한 기술에 의해 얻어질 수 있다. 특히, 야생형 단백질을 코딩하는 DNA 서열을 변경하기 위한 기술의 예는, 부위 지향 돌연변이유발, 무작위 돌연변이유발 및 합성 올리고뉴클레오타이드 작성 등을 포함하지만 이에 제한되지는 않는다. 돌연변이유발 활성은 단백질의 서열에서 또는 중합효소의 발명의 경우에 하나 또는 여러 개의 아미노산을 결실, 삽입 또는 치환하는 것으로 구성된다.
"서열 동일성"은 2개의 폴리펩타이드 서열 또는 2개의 폴리뉴클레오타이드 서열과 같은 2개의 서열 사이의 일치(예를 들어, 동일한 아미노산 잔기)의 수(또는 분율, 일반적으로 백분율로 표시됨)를 지칭한다. 서열 동일성은 서열 갭을 최소화하면서 중첩 및 동일성을 최대화하도록 정렬될 경우 서열을 비교함으로써 결정된다. 특히, 서열 동일성은 2개의 서열의 길이에 따라 다수의 수학적인 전체적 또는 국소적 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열은 바람직하게 전장에 걸쳐 서열을 최적으로 정렬하는 전체적 정렬 알고리즘[예를 들어, 니들만(Needleman) 및 운쉬(Wunsch) 알고리즘; 니들만 및 운쉬의 1970년 문헌]을 사용하여 정렬되는 반면, 실질적으로 다른 길이의 서열은 바람직하게는 국소적 정렬 알고리즘[예를 들어, 스미쓰(Smith) 및 워터만(Waterman) 알고리즘(스미쓰 앤 워터만의 1981년 문헌) 또는 알트슐(Altschul) 알고리즘(알트슐 등의 1997년 문헌; 알트슐 등의 2005년 문헌)]을 사용하여 정렬된다. 퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/와 같은 인터넷 웹 사이트 상에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 달성하기 위해 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본원의 목적을 위해, % 아미노산 서열 동일성 값은 니들만-운쉬 알고리즘을 사용하여 두 서열의 최적의 전체적 정렬을 생성하는 쌍별 서열 정렬 프로그램 엠보스 니들(EMBOSS Needle)을 사용하여 생성된 값을 지칭하고, 이때 모든 검색 매개변수는 기본값(default value)으로 설정되고, 즉, 스코어링 매트릭스 = BLOSUM62, 갭 개방 = 10, 갭 연장 = 0.5, 말단 갭 페널티(penalty) = 거짓, 말단 갭 개방 = 10 및 말단 갭 연장 = 0.5이다.
"폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"는 상호교환적으로 사용되며, 각각은 뉴클레오타이드 단량체 또는 그의 유사체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭(Watson-Crick) 유형의 염기 짝형성, 염기 스태킹(stacking), 후그스틴(Hoogsteen) 또는 역 후그스틴 유형의 염기 짝형성 등과 같은 단량체 대 단량체 상호작용의 규칙적인 패턴을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이들의 뉴클레오사이드간 결합은 천연적으로 발생하거나, 또는 그의 유사체, 예를 들어 천연 발생 또는 비-천연 발생 유사체일 수 있다. 비-천연 발생 유사체는 PNA, 포스포로티오에이트 뉴클레오사이드간 결합, 형광단 또는 합텐(hapten)과 같은 표지의 부착을 허용하는 연결기 함유 염기 등을 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 중합효소에 의한 연장, 리가아제에 의한 결찰 등과 같은 효소적 처리를 필요로 할 때마다, 당업자는 그러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 뉴클레오사이드간 결합의 특정 유사체, 당 모이어티, 또는 염기를 임의의 위치 또는 일부 위치에서 함유하지 않을 것임을 이해할 것이다. 폴리뉴클레오타이드는 크기면에서, 일반적으로 이들이 "올리고뉴클레오타이드"라고 지칭되는 경우, 전형적으로 수 개의 단량체 단위(예를 들면 5 내지 40)로부터 수천 개의 단량체 단위까지의 범위이다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 문자(대문자 또는 소문자)의 서열로 표시될 때마다, 달리 언급되지 않거나 또는 문맥상 명백한 경우, 뉴클레오타이드는 왼쪽에서 오른쪽으로 5' → 3' 순서이고, "A"는 데옥시아데노신을 나타내고, "C"는 데옥시시티딘을 나타내고, "G"는 데옥시구아노신을 나타내고, "T"는 티미딘을 나타내고, "I"는 데옥시이노신을 나타내고, "U"는 우리딘을 나타내는 것으로 이해될 것이다. 달리 주지되지 않는 한, 용어 및 원자 번호 지정 규칙은 스트라찬(Strachan) 및 리드(Read)의 문헌[Human Molecular Genetics 2(Wiley-Liss, New York, 1999)]에 개시된 바를 따를 것이다. 일반적으로 폴리뉴클레오타이드는 포스포디에스테르 결합에 의해 연결된 4개의 천연 뉴클레오사이드(예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘, 또는 RNA의 경우 이들의 리보스 대응물)를 포함하지만, 이들은 또한 변형된 염기, 당 또는 뉴클레오사이드간 결합을 포함하는 비-천연 뉴클레오타이드 유사체를 포함할 수 있다. 효소가 활성을 위해 특정 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요구사항을 갖는 경우(예를 들어, 단일 가닥 DNA, RNA/DNA 이중체 등), 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질에 대한 적절한 조성의 선택은 특히 샘브룩(Sambrook) 등의 문헌[Molecular Cloning, Second Edition(Cold Spring Harbour Laboratory, New York, 1989] 및 유사한 참고문헌과 같은 논문으로부터의 지침에 의해 당업자의 지식에 속함은 당업자에게 명백하다. 유사하게, 올리고뉴클레오타이드 및 폴리뉴클레오타이드는 단일 가닥 형태 또는 이중 가닥 형태(즉, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 및 그의 각각의 상보체의 이중체)를 지칭할 수 있다. 어떤 형태인지 또는 두 형태 모두가 용어 사용과 관련하여 의도되었는지 여부는 당업자에게 명백할 것이다.
"프라이머"는 폴리뉴클레오타이드 주형으로 이중체를 형성할 때 핵산 합성의 개시점으로 작용하고 주형을 따라 그의 3' 말단에서 연장되어 연장된 이중체를 형성할 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 프라이머의 연장은 일반적으로 DNA 또는 RNA 중합효소와 같은 핵산 중합효소로 수행된다. 연장 과정에서 첨가되는 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 연장된다. 프라이머는 일반적으로 14개 내지 40개의 뉴클레오타이드 범위, 또는 18개 내지 36개의 뉴클레오타이드 범위의 길이를 갖는다. 프라이머는 다양한 핵산 증폭 반응, 예를 들어 단일 프라이머를 사용하는 선형 증폭 반응 또는 둘 이상의 프라이머를 사용하는 중합효소 연쇄 반응에 사용된다. 특정 적용을 위한 프라이머의 길이와 서열을 선택하기 위한 지침은 참조로 포함된 다음 참고문헌에 의해 입증된 바와 같이 당업자에게 잘 알려져 있다: 디펜바흐(Dieffenbach)(편집자)의 문헌[PCR Primer: A Laboratory Manual, 2nd Edition(Cold Spring Harbor Press, New York, 2003)].
"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, 용어 "치환"은 아미노산 잔기가 천연 발생 표준 20개 아미노산 잔기, 희귀 천연 발생 아미노산 잔기(예를 들어, 하이드록시프롤린, 하이드록시리신, 알로하이드록시리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라긴, 알로-이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린) 및 비-천연 발생 아미노산 잔기(종종 합성적으로 만들어짐)(예를 들어, 시클로헥실-알라닌)로부터 선택된 또 다른 아미노산 잔기로 대체됨을 지칭한다. 바람직하게는, 용어 "치환"은 아미노산 잔기가 천연 발생 표준 20개 아미노산 잔기로부터 선택된 또 다른 아미노산 잔기로 대체됨을 지칭한다. "+" 기호는 치환의 조합을 나타낸다.
아미노산은 본원에서 다음 명명법에 따라 1문자 또는 3문자 코드로 표시된다: A: 알라닌(Ala); C: 시스테인(Cys); D: 아스파르트산(Asp); E: 글루탐산(Glu); F: 페닐알라닌(Phe); G: 글리신(Gly); H: 히스티딘(His); I: 이소류신(Ile); K: 라이신(Lys); L: 류신(Leu); M: 메티오닌(Met); N: 아스파라긴(Asn); P: 프롤린(Pro); Q: 글루타민(Gln); R: 아르기닌(Arg); S: 세린(Ser); T: 트레오닌(Thr); V: 발린(Val); W: 트립토판(Trp) 및 Y: 티로신(Tyr).
본 문서에서, 다음 용어는 치환을 지정하기 위해 사용된다: L238A는 모 서열의 위치 238에 있는 아미노산 잔기(류신, L)가 알라닌(A)으로 변경됨을 나타낸다. A 132V/I/M은 모 서열의 위치 132에 있는 아미노산 잔기(알라닌, A)가 발린(V), 이소류신(I) 또는 메티오닌(M) 아미노산 중 하나로 치환됨을 나타낸다. 치환은 보존적 또는 비-보존적 치환일 수 있다. 보존적 치환의 예는: 염기성 아미노산(아르기닌, 리신 및 히스티딘), 산성 아미노산(글루탐산 및 아스파르트산), 극성 아미노산(글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산(메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산(페닐알라닌, 트립토판 및 티로신) 및 작은 아미노산(글리신, 알라닌 및 세린)의 그룹에 속한다.
단백질의 아미노산 서열과 관련하여 "야생형"은 천연에서 발견되는 아미노산 서열을 의미한다.
TdT 변이체의 아미노산 서열과 관련하여 본원에 사용된 "모티프"는 상이한 종의, 특히 진화적으로 관련된 종의 TdT의 아미노산 서열 중에서 보존된(그러나 동일하지 않을 수 있는) 특정 위치에 있는 TdT 아미노산 서열의 하위 서열 또는 분절을 의미한다. 이러한 보존된 서열 모티프의 예는 모테아(Motea) 등의 문헌[Biochim. Biophys. Acta. 1804(5): 1151-1166(2010)]; 델라루에(Delarue) 등의 문헌[EMBO J., 21: 427-439(2002)]; 등의 참고문헌에 기재되어 있다. 예시적인 TdT 모티프는 FMR, VSC, GGFRR, KMT, GHD, TGSR, FER 등을 포함한다(N-말단으로부터 C-말단으로 정렬됨). 본원에 언급된 바와 같이, 서열 모티프는 가장 흔한 서열 발생 또는 컨센서스 서열, 예를 들어, "TGSR"에 의해 식별되지만, 이러한 지정은 물탈린과 같은 통상적인 정렬 도구를 사용하여 TGSR과 정렬되는 다른 하위 서열을 배제하려는 것은 아니다[미첼(Mitchell)의 문헌 "Bioinformatics, 9(5): 614-615 (1993)"]. 예를 들어, "TGSR 모티프"에 대한 언급은 마우스의 분절 "TGSR"과 정렬되는 주머니쥐 TdT의 분절 "SGSR"을 포함한다. 일부 실시태양에서, 서열 모티프는 서열의 발현 세트로 정의된다. 예를 들어, 일부 실시태양에서, FMR 모티프는 FMR, FLR 및 YMR로 구성된 군의 서열로 구성된다.
본 개시내용은 제시된 특정 형태의 범주로 제한하려는 것은 아니고, 본원에 기재된 변형의 대안, 수정 및 동등물을 포함하고자 한다. 또한, 본 개시내용의 범주는 본 개시내용의 관점에서 당업자에게 명백해질 수 있는 다른 변형을 완전히 포괄한다. 본 발명의 범주는 첨부된 청구범위에 의해서만 제한된다.
SEQUENCE LISTING <110> DNA SCRIPT <120> CHIMERIC TERMINAL DEOXYNUCLEOTIDYL TRANSFERASES FOR TEMPLATE-FREE ENZYMATIC SYNTHESIS OF POLYNUCLEOTIDES <130> B3161PC00 <140> PCT/EP2020/085475 <141> 2020-12-14 <150> EP 19215628.9 <151> 2019-12-12 <160> 83 <170> PatentIn version 3.5 <210> 1 <211> 510 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Full length wild type mouse TdT <400> 1 Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro 1 5 10 15 Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe 20 25 30 Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg 35 40 45 Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu 50 55 60 Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser 65 70 75 80 Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser 85 90 95 Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly 100 105 110 Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn 115 120 125 Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala 130 135 140 Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 145 150 155 160 Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala 165 170 175 Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met 180 185 190 Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met 195 200 205 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile 210 215 220 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val 225 230 235 240 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 245 250 255 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 260 265 270 Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met 275 280 285 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 290 295 300 Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 305 310 315 320 Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 325 330 335 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 340 345 350 Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe 355 360 365 Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr 370 375 380 Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His 385 390 395 400 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His 405 410 415 Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg 420 425 430 Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu 435 440 445 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 450 455 460 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg 465 470 475 480 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 485 490 495 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 500 505 510 <210> 2 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated wild type mouse TdT <400> 2 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile 85 90 95 Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg 165 170 175 Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp 225 230 235 240 Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe 245 250 255 Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser 275 280 285 Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr 340 345 350 Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Bovine truncated <400> 3 Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu 20 25 30 Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser 130 135 140 Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 275 280 285 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Human truncated <400> 4 Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp 275 280 285 Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 5 <211> 376 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Chicken truncated <400> 5 Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr 1 5 10 15 Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn 20 25 30 Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn 35 40 45 Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala 50 55 60 Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp 65 70 75 80 Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu 85 90 95 Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn 100 105 110 Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val 115 120 125 Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val 130 135 140 Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg 145 150 155 160 Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala 165 170 175 Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe 180 185 190 Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys 195 200 205 Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg 210 215 220 Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile 225 230 235 240 Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp 245 250 255 Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln 260 265 270 Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met 275 280 285 Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 290 295 300 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg 305 310 315 320 Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met 325 330 335 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu 340 345 350 Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 355 360 365 Val Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 6 <211> 387 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Possum truncated <400> 6 Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro 1 5 10 15 Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile 20 25 30 Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys 65 70 75 80 Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp 225 230 235 240 Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe 245 250 255 Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys 275 280 285 Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser 290 295 300 Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr 305 310 315 320 Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp 325 330 335 Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His 340 345 350 Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu 355 360 365 Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu 370 375 380 Arg Asn Ala 385 <210> 7 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> New truncated shrew <400> 7 Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr 130 135 140 Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp 225 230 235 240 Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp 275 280 285 Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 8 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated dog <400> 8 Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser 325 330 335 His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 9 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC MOLE <400> 9 Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser 1 5 10 15 Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 20 25 30 Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 35 40 45 Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met 50 55 60 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met 65 70 75 80 Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val 85 90 95 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 100 105 110 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 115 120 125 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg 130 135 140 Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met 145 150 155 160 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 165 170 175 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 180 185 190 Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg 195 200 205 Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 210 215 220 Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe 225 230 235 240 Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr 245 250 255 Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp 275 280 285 Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Pika truncated <400> 10 Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val 1 5 10 15 Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu 85 90 95 Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu 210 215 220 Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg 275 280 285 Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 11 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC HEDGEHOG <400> 11 Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu 1 5 10 15 Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu 20 25 30 Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly 275 280 285 Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala 370 375 380 <210> 12 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated tree shrew <400> 12 Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg 50 55 60 Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg 65 70 75 80 Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln 145 150 155 160 Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp 225 230 235 240 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 13 <211> 394 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED PLATYPUS <400> 13 Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu 1 5 10 15 Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys 65 70 75 80 Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu 115 120 125 Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln 130 135 140 Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr 145 150 155 160 Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr 165 170 175 Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr 180 185 190 Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val 195 200 205 Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val 210 215 220 Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu 225 230 235 240 Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr 245 250 255 Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys 260 265 270 Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 275 280 285 His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser 290 295 300 Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val 305 310 315 320 Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 325 330 335 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys 340 345 350 Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile 355 360 365 Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu 370 375 380 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 385 390 <210> 14 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED JERBOA <400> 14 Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met 1 5 10 15 Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys 20 25 30 Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile 35 40 45 Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu 50 55 60 Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile 65 70 75 80 Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys 85 90 95 Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys 100 105 110 Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser 115 120 125 Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly 130 135 140 Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr 145 150 155 160 Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys 165 170 175 Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala 180 185 190 Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe 195 200 205 Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser 210 215 220 Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr 225 230 235 240 Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu 245 250 255 Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu 260 265 270 Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg 275 280 285 Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala 370 375 380 <210> 15 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Puma wildtype <400> 15 Val Val Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Phe Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu 20 25 30 Asn Tyr Glu Phe Lys Glu Asn Glu Ile Ser Ser Ala Thr Phe Met Arg 35 40 45 Ala Ala Ser Val Leu Lys Leu Pro Phe Thr Ile Ile Ser Met Lys Asp 50 55 60 Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu 65 70 75 80 Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn 85 90 95 Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val 100 105 110 Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu 115 120 125 Ser Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys 130 135 140 Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala 145 150 155 160 Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe 165 170 175 Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys 180 185 190 Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ile Pro Gly Ser Thr 195 200 205 Asp Glu Glu Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Gln 210 215 220 Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 225 230 235 240 Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly 260 265 270 Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 16 <211> 12 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Test Polynucleotide p875 <400> 16 cagttaaaaa ct 12 <210> 17 <211> 11 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Test Polynucleotide p876 <400> 17 gagttaaaac t 11 <210> 18 <211> 10 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Test Polynucleotide p877 <400> 18 cagcaaggct 10 <210> 19 <211> 25 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> HIS-TAG <400> 19 Met Ala Ser Ser His His His His His His Ser Ser Gly Ser Glu Asn 1 5 10 15 Leu Tyr Phe Gln Thr Gly Ser Ser Gly 20 25 <210> 20 <211> 18 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> PRIMER <400> 20 aaaaaaaaaa aaaagggg 18 <210> 21 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Truncated mouse TdT M53 <400> 21 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro 1 5 10 15 Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Asn Arg 165 170 175 Pro Glu Ala Glu Ala Ile Arg Met Leu Val Lys Glu Ala Val Val Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly 195 200 205 Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp 225 230 235 240 Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe 245 250 255 Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser 275 280 285 Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 22 <211> 369 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED BOVINE <400> 22 Lys Thr Pro Pro Leu Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln 1 5 10 15 Arg Lys Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg Ala Phe 20 25 30 Glu Ile Leu Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Glu Ser Tyr 35 40 45 Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr 50 55 60 Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys 65 70 75 80 Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu 85 90 95 Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe 100 105 110 Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Phe Arg 115 120 125 Met Gly Phe Arg Ser Leu Glu Lys Ile Arg Ser Asp Lys Thr Leu Lys 130 135 140 Phe Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val 145 150 155 160 Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys 165 170 175 Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly 180 185 190 Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile 195 200 205 Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val 210 215 220 Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val 225 230 235 240 Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr 245 250 255 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 260 265 270 Arg Val Asp Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys 275 280 285 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe 290 295 300 Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Ile Arg 305 310 315 320 Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu 325 330 335 Tyr Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu 340 345 350 Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn 355 360 365 Ala <210> 23 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> M57 without His tag & linker <400> 23 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu 210 215 220 Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys 225 230 235 240 Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe 245 250 255 Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys 260 265 270 Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser 275 280 285 Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val 290 295 300 Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg 325 330 335 Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val 340 345 350 Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu 355 360 365 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 24 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> M59 without His Tag and linker <400> 24 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu Arg Val Asn Arg Pro Glu 165 170 175 Ala Glu Ala Ile Arg Met Leu Val Lys Glu Ala Val Val Thr Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu 210 215 220 Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys 225 230 235 240 Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe 245 250 255 Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys 260 265 270 Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser 275 280 285 Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val 290 295 300 Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg 325 330 335 Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val 340 345 350 Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu 355 360 365 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 25 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> M27 <400> 25 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro 1 5 10 15 Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Cys Leu Ala Phe Arg Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile 85 90 95 Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg 165 170 175 Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly 195 200 205 Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp 225 230 235 240 Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe 245 250 255 Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser 275 280 285 Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 26 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B10 trunc wt (Serinus canaria)(canary) <400> 26 Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala 1 5 10 15 Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile 65 70 75 80 Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile 85 90 95 Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu 100 105 110 Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val 115 120 125 Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu 130 135 140 Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly 145 150 155 160 Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala 165 170 175 Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro 180 185 190 Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile 195 200 205 Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp 210 215 220 Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu 225 230 235 240 Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu 245 250 255 Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala 260 265 270 Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr 275 280 285 Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg 340 345 350 Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 27 <211> 370 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B19 trunc wt (Neopelma chrysocephalum)(saffron-crested neopelma) <400> 27 Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala 20 25 30 Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu 35 40 45 Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met 50 55 60 Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg 115 120 125 Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser 145 150 155 160 Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser 165 170 175 Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly 195 200 205 Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys 210 215 220 Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val 225 230 235 240 Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln 245 250 255 Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser 260 265 270 Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp 275 280 285 Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala 290 295 300 Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu 305 310 315 320 Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly 325 330 335 Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu 340 345 350 Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg 355 360 365 Asn Ala 370 <210> 28 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Alligator sinensis) <400> 28 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile 65 70 75 80 Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala 145 150 155 160 Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu 210 215 220 Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys 245 250 255 Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn 275 280 285 Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 29 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B59 trunc wt (Xenopus laevis) <400> 29 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu 1 5 10 15 Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp 20 25 30 Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe 35 40 45 Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser 50 55 60 Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu 65 70 75 80 Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys 145 150 155 160 Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu 165 170 175 Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val 180 185 190 Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys 210 215 220 Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly 225 230 235 240 Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys 245 250 255 Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile 275 280 285 Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp 290 295 300 Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys 340 345 350 Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu 355 360 365 Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 30 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B63 trunc wt (Notechis scutatus) tiger snake <400> 30 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn 20 25 30 Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala 50 55 60 Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile 65 70 75 80 Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu 180 185 190 Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln 210 215 220 Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys 245 250 255 Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val 275 280 285 Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe 355 360 365 Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 31 <211> 367 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F15 trunc wt (Salmo trutta) brown trout <400> 31 Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr 1 5 10 15 Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala 20 25 30 Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu 50 55 60 Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val 65 70 75 80 Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val 85 90 95 Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg 115 120 125 Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met 130 135 140 Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser 145 150 155 160 Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His 165 170 175 Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu 195 200 205 Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg 210 215 220 Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp 225 230 235 240 Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu 245 250 255 Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp 260 265 270 Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val 275 280 285 Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu 290 295 300 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe 305 310 315 320 Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp 325 330 335 Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe 340 345 350 Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala 355 360 365 <210> 32 <211> 377 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F24 trunc wt (Electrophorus electricus) electric eel <400> 32 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu 1 5 10 15 Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn 20 25 30 His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr 35 40 45 Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met 65 70 75 80 Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu 85 90 95 Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp 100 105 110 Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu 130 135 140 Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu 165 170 175 Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser 180 185 190 Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys 210 215 220 Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys 245 250 255 Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe 260 265 270 Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp 275 280 285 Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val 290 295 300 Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser 305 310 315 320 Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg 325 330 335 Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe 340 345 350 Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp 355 360 365 Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 33 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F32 trunc wt (Anabas testudineus) walking fish <400> 33 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn 20 25 30 Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr 35 40 45 Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr 65 70 75 80 Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu 85 90 95 Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr 180 185 190 Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys 210 215 220 Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser 275 280 285 Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln 325 330 335 His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 34 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F57 trunc wt (Poecilia reticulate) guppy <400> 34 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn 20 25 30 Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr 65 70 75 80 Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu 85 90 95 Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr 180 185 190 Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys 210 215 220 Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg 275 280 285 Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg 325 330 335 Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 35 <211> 366 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100 trunc wt (short Rattus norvegicus) <400> 35 Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala 20 25 30 Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met 50 55 60 Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 165 170 175 Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 195 200 205 Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe 210 215 220 Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr 225 230 235 240 Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His 245 250 255 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg 260 265 270 Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg 275 280 285 Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu 290 295 300 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 305 310 315 320 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 325 330 335 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 340 345 350 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 36 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100or trunk wt (long Rattus norvegicus) <400> 36 Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln 225 230 235 240 Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys 245 250 255 Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu 275 280 285 Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 37 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N14 trunc wt (Piliocolobus tephrosceles) monkey <400> 37 Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln 275 280 285 Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 38 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 trunc wt (Sus scrofa) pig <400> 38 Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg 225 230 235 240 Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys 245 250 255 Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met 275 280 285 Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 39 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N35 trunc wt (Panthera tigris altaica) Siberian tiger <400> 39 Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val 1 5 10 15 Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg 225 230 235 240 Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys 275 280 285 Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 40 <211> 365 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N72 trunc wt (Bubalus bubalis) water buffalo <400> 40 Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 20 25 30 Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met 50 55 60 Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 165 170 175 Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly 195 200 205 Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 210 215 220 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 225 230 235 240 Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe 245 250 255 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser 260 265 270 Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 275 280 285 Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly 290 295 300 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr 305 310 315 320 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 325 330 335 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 340 345 350 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 41 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or trunc wt (Marmota flaviventris) marmot <400> 41 Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val 1 5 10 15 Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys 275 280 285 Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 42 <211> 172 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N-terminal truncated WT mouse segment (B1) <400> 42 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile 85 90 95 Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser 165 170 <210> 43 <211> 68 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> C-terminal truncated WT mouse segment (B3) <400> 43 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg 1 5 10 15 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn 20 25 30 His Ala Leu Tyr Asp Arg Thr Lys Arg Val Phe Leu Glu Ala Glu Ser 35 40 45 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 50 55 60 Glu Arg Asn Ala 65 <210> 44 <211> 145 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B10 center segment wt (Serinus canaria)(canary) <400> 44 Cys Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Ile Val Lys Asn 1 5 10 15 Thr Val Cys Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Asn Ile Gly His Asp Ile Asp Phe Leu Ile Thr 35 40 45 Asn Pro Gly Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Ile Asp 50 55 60 Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser 65 70 75 80 Thr Phe Val Lys Glu Gln Leu Pro Ser Arg Lys Ile Asp Ala Met Asp 85 90 95 His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln Pro Arg Val 100 105 110 Asp Asn Ser Thr Cys Asn Thr Ser Lys Lys Leu Glu Met Ala Glu Val 115 120 125 Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu 130 135 140 Gln 145 <210> 45 <211> 145 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B19center segment wt (Neopelma chrysocephalum)(saffron-crested neopelma) <400> 45 Cys Val Ser Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn 1 5 10 15 Thr Val Ser Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr 35 40 45 Asn Pro Gly Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp 50 55 60 Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser 65 70 75 80 Thr Phe Val Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp 85 90 95 Asn Phe Gln Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val 100 105 110 Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val 115 120 125 Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu 130 135 140 Gln 145 <210> 46 <211> 145 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B57 center segment wt (Alligator sinensis) <400> 46 Tyr Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Leu Ile Lys Asp 1 5 10 15 Thr Val Cys Met Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Asn Pro Gly Pro Glu Glu Glu Lys Glu Leu Leu His Lys Val Val Asp 50 55 60 Leu Trp Glu Lys Gln Gly Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser 65 70 75 80 Thr Phe Glu Lys Glu Lys Arg Pro Ser Arg Lys Val Asp Ala Leu Asp 85 90 95 His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Gln Gln Arg Arg 100 105 110 Gly Asn Ser Asn Ser Asn Ile Ser Lys Glu Ser Asp Lys Ala Glu Val 115 120 125 Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Ser Pro Phe Glu 130 135 140 Gln 145 <210> 47 <211> 145 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> B63 center segment wt (Notechis scutatus) tiger snake <400> 47 Ser Val Ser Lys Ala Glu Ala Asp Ala Ala Thr Gln Ile Val Gln Asp 1 5 10 15 Thr Val Trp Lys Ile Leu Pro Asn Ala Val Val Thr Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Val Pro Gly Ser Arg Gln Glu Glu Glu Leu Leu His Pro Val Ile Asp 50 55 60 Ile Trp Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser 65 70 75 80 Thr Phe Glu Asn Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp 85 90 95 His Phe Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Val 100 105 110 Asn Lys Gly Ser Ala Val Gln Ser Asn Val Phe Ala Glu Glu Gly Thr 115 120 125 Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Val Thr Pro Phe Gln 130 135 140 His 145 <210> 48 <211> 142 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F15 center segment wt (Salmo trutta) brown trout <400> 48 Ala Val Ser Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu 1 5 10 15 Thr Ala His Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr 35 40 45 Met Pro Glu Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp 50 55 60 Arg Leu Arg Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser 65 70 75 80 Thr Phe Asp Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp 85 90 95 His Phe Glu Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val 100 105 110 Glu Gly Asp Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp 115 120 125 Arg Ala Val Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg 130 135 140 <210> 49 <211> 139 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F24center segment wt (Electrophorus electricus) electric eel <400> 49 Pro Val Ser Arg Ala Glu Ala Lys Ala Val Gly Cys Ile Ile Glu Glu 1 5 10 15 Val Ala Ser Cys Phe Ser Ser Ser Val Thr Ile Thr Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Glu Phe Gly His Asp Val Asp Phe Leu Leu Ser 35 40 45 Ile Pro Glu Pro Gly Lys Glu Asp Gly Leu Leu Pro Ala Val Ile Asp 50 55 60 Arg Leu Arg Lys Gln Gly Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser 65 70 75 80 Thr Leu Gln Gln Trp Lys Arg Pro Ser Arg Cys Phe Asp Ser Met Asp 85 90 95 His Phe Gln Lys Cys Phe Leu Ile Val Lys Leu Trp Thr Arg Leu Val 100 105 110 Glu Gly His Arg Glu Asp Pro Ser Ser Gln Arg Asp Trp Lys Ala Val 115 120 125 Arg Val Asp Leu Val Val Pro Pro Val Asp Cys 130 135 <210> 50 <211> 140 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F32 center segment wt (Anabas testudineus) walking fish <400> 50 Ala Val Ser Lys Ala Glu Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu 1 5 10 15 Ala Val His Ala Ile Thr Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Glu Phe Gly His Asp Val Asp Phe Ile Val Thr 35 40 45 Thr Pro Glu Gln Gly Lys Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp 50 55 60 Arg Leu Lys Glu Gln Gly Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser 65 70 75 80 Thr Phe Asp Ile Ser Lys Leu Pro Ser His Lys Phe Glu Ala Met Asp 85 90 95 His Phe Ala Lys Cys Phe Leu Ile Leu Arg Leu Glu Gly Ser Leu Val 100 105 110 Asp Arg Gly Leu Asn Ser Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala 115 120 125 Val Arg Val Asp Leu Val Ser Pro Pro Met Glu Arg 130 135 140 <210> 51 <211> 140 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> F57 center segment wt (Poecilia reticulate) guppy <400> 51 Ala Val Ser Lys Ala Glu Ala Arg Ala Val Gly Asn Ile Ile Asp Glu 1 5 10 15 Ala Val His Val Ile Thr Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Asp Phe Gly His Asp Val Asp Phe Ile Val Thr 35 40 45 Thr Thr Glu Leu Gly Lys Glu Lys Asn Leu Leu Ile Ser Val Ile Glu 50 55 60 Ser Leu Lys Lys Gln Gly Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser 65 70 75 80 Thr Phe Asp Ile Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp 85 90 95 His Phe Ala Lys Cys Phe Leu Ile Leu Arg Leu Glu Gly Ser Arg Val 100 105 110 Glu Gly Gly Leu Gln Arg Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala 115 120 125 Val Arg Val Asp Leu Val Ser Pro Pro Ala Asp Arg 130 135 140 <210> 52 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N100 center segment wt (short Rattus norvegicus) <400> 52 Cys Val Asn Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu 1 5 10 15 Ala Val Val Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val 50 55 60 Thr Asn Phe Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile 65 70 75 80 Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly 100 105 110 Leu Val Arg Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 53 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N14 center segment wt (Piliocolobus tephrosceles) monkey <400> 53 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Ser Ala Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln Gln Leu Leu Gln Lys Val 50 55 60 Met Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln 100 105 110 Arg Val Asp Ser Asp Gln Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 54 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 center segment wt (Sus scrofa) pig <400> 54 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Gln Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Asp Asp Glu Glu Gln Gln Leu Leu Pro Lys Val 50 55 60 Val Asn Leu Trp Glu Arg Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val 65 70 75 80 Glu Ser Thr Leu Glu Lys Ser Lys Leu Pro Ser Arg Asn Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Ser Gly Met Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Leu 130 135 140 <210> 55 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N35 center segment wt (Panthera tigris altaica) Siberian tiger <400> 55 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Asp Glu Glu Glu Glu Glu Leu Leu Pro Lys Val 50 55 60 Ile Asn Leu Trp Gln Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Ser Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 56 <211> 140 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N72 center segment wt (Bubalus bubalis) water buffalo <400> 56 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile 50 55 60 Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu 65 70 75 80 Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu 85 90 95 Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg 100 105 110 Val Asp Ser Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala 115 120 125 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn 130 135 140 <210> 57 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or center segment wt (Marmota flaviventris) marmot <400> 57 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Asn Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Ala Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val 50 55 60 Thr Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Ser Asp Lys Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 58 <211> 140 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Bovine center segment <400> 58 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile 50 55 60 Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu 65 70 75 80 Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu 85 90 95 Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg 100 105 110 Val Asp Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala 115 120 125 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn 130 135 140 <210> 59 <211> 140 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Human center segment <400> 59 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met 50 55 60 Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu 65 70 75 80 Ser Thr Phe Glu Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu 85 90 95 Asp His Phe Gln Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg 100 105 110 Val Asp Ser Asp Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala 115 120 125 Ile Arg Val Asp Leu Val Leu Cys Pro Tyr Glu Arg 130 135 140 <210> 60 <211> 137 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Chicken center segment <400> 60 Cys Val Ser Lys Ala Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn 1 5 10 15 Thr Val Cys Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Gln Arg Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu 50 55 60 Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro 65 70 75 80 Ser Arg His Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile 85 90 95 Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser 100 105 110 Lys Lys Cys Asp Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val 115 120 125 Asp Leu Val Ile Thr Pro Phe Glu Gln 130 135 <210> 61 <211> 147 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Possum center segment <400> 61 Cys Val Ser Lys Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp 1 5 10 15 Ala Val Trp Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ala Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val 50 55 60 Thr Asn Leu Trp Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile 65 70 75 80 Glu Ser Thr Phe Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His 100 105 110 Lys Glu Asp Lys Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser 115 120 125 Glu Ala Lys Ser Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro 130 135 140 Tyr Asp Arg 145 <210> 62 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> New center segment shrew <400> 62 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Glu Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val 50 55 60 Ile Thr Phe Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu 100 105 110 Cys Val Asp Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Glu Cys 130 135 140 <210> 63 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment dog <400> 63 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Gly Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val 50 55 60 Ile Asn Leu Trp Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Gly Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 64 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment MOLE <400> 64 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Glu Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val 50 55 60 Ile Thr Phe Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu 100 105 110 Cys Val Asp Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Glu Cys 130 135 140 <210> 65 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Pika center segment <400> 65 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Asp Val Leu Val Asn Glu 1 5 10 15 Ala Val Arg Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Glu Leu Thr Glu Glu Asp Glu Gln Gln Leu Leu His Lys Val 50 55 60 Met Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr His Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Gln Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Phe Lys Leu Tyr His Glu 100 105 110 Arg Val Gly Gly Asp Arg Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys 130 135 140 <210> 66 <211> 144 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment HEDGEHOG <400> 66 Cys Val Ala Lys Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val 50 55 60 Ile Asn Phe Trp Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln 100 105 110 His Val Asn Gly Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys 115 120 125 Asn Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 67 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment tree shrew <400> 67 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Gly Ala Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Gly Ser Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val 50 55 60 Leu Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Gly Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 68 <211> 145 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment PLATYPUS <400> 68 Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr Leu Ile Val Lys Glu 1 5 10 15 Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val Thr Leu Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Ser 35 40 45 Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu Pro Asn Ile Ile Lys 50 55 60 Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser 65 70 75 80 Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys Val Asp Ala Met Asp 85 90 95 His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Lys Val 100 105 110 Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser Lys Asn His Glu Ala 115 120 125 Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Phe Glu 130 135 140 Gln 145 <210> 69 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment JERBOA <400> 69 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln 1 5 10 15 Ala Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ser Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val 50 55 60 Thr Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu 100 105 110 Arg Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys 130 135 140 <210> 70 <211> 141 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> center segment(Puma wildtype) <400> 70 Cys Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu 1 5 10 15 Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly 20 25 30 Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr 35 40 45 Ile Pro Gly Ser Thr Asp Glu Glu Glu Glu Gln Leu Leu Pro Lys Val 50 55 60 Ile Asn Leu Trp Gln Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val 65 70 75 80 Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala 85 90 95 Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln 100 105 110 Arg Val Asp Ser Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys 115 120 125 Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg 130 135 140 <210> 71 <211> 170 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N-terminal segment of M57 (N-terminus to VSC motif) <400> 71 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser 165 170 <210> 72 <211> 68 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> C-terminal segment of M57 <400> 72 Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe Asn Arg 1 5 10 15 Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn 20 25 30 His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala Glu Ser 35 40 45 Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp 50 55 60 Glu Arg Asn Ala 65 <210> 73 <211> 170 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N-terminal segment of M59 <400> 73 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Glu 165 170 <210> 74 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine-pig chimera M57-N27-8-13C7 without His tag <400> 74 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Ala Pro Ala Pro Val Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 35 40 45 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Thr Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Gly Phe Gly Val Gly 115 120 125 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Arg Val Asn Arg Ala Glu 165 170 175 Ala Glu Ala Ile Arg Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Lys 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Asp Glu Glu Gln Leu Leu His Lys Val Ile Asn Leu Trp Glu Lys Lys 225 230 235 240 Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe 245 250 255 Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys 260 265 270 Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser 275 280 285 Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val 290 295 300 Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg 325 330 335 Lys Gln Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val 340 345 350 Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Arg His Leu Gly Leu 355 360 365 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 75 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera 46-557 without His tag <400> 75 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Arg Glu Ser Thr Phe Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 76 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera 46-342 without His tag <400> 76 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Lys Leu Val Glu Ser Thr Phe Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 77 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera 46-571 without His tag <400> 77 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Gln Glu Ser Thr Phe Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 78 <211> 390 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera M92 without His tag <400> 78 Ser Glu Asn Leu Tyr Phe Gln Thr Gly Ser Ser Gly Ser Pro Ser Pro 1 5 10 15 Val Pro Gly Ser Gln Asn Val Pro Ala Pro Val Val Lys Lys Ile Ser 20 25 30 Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Gln Leu 35 40 45 Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu Asn Asp Glu Phe Arg Glu 50 55 60 Asn Glu Asp Ser Arg Asp Ala Phe Arg Arg Ala Ser Ser Val Leu Lys 65 70 75 80 Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr Glu Gly Ile Pro 85 90 95 Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp 100 105 110 Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys 115 120 125 Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala 130 135 140 Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu Lys Ile Arg Ser 145 150 155 160 Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr 165 170 175 Tyr Glu Asp Leu Ala Glu Arg Val Asn Arg Pro Glu Ala Glu Ala Ile 180 185 190 Arg Met Leu Val Lys Glu Ala Val Val Thr Phe Leu Pro Asp Ala Leu 195 200 205 Val Thr Met Thr Gly Gly Phe Arg Leu Gly Lys Met Thr Gly His Asp 210 215 220 Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln 225 230 235 240 Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu 245 250 255 Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser 260 265 270 Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu 275 280 285 Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln Gln Glu 290 295 300 Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr 305 310 315 320 Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Gln Phe 325 330 335 Asn Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu 340 345 350 Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Glu Ala 355 360 365 Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Trp 370 375 380 Pro Trp Glu Arg Asn Ala 385 390 <210> 79 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera M93 without His tag <400> 79 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Pro Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 80 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera M94 without His tag <400> 80 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Glu Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 <210> 81 <211> 364 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> mouse-bovine chimera M88 without His tag <400> 81 Ser Glu Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu 1 5 10 15 Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu 20 25 30 Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg 35 40 45 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 50 55 60 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile 65 70 75 80 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 85 90 95 Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly 100 105 110 Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 115 120 125 Leu Glu Glu Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 130 135 140 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Thr Arg 145 150 155 160 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 165 170 175 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Leu Gly 180 185 190 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 195 200 205 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 210 215 220 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Leu Glu 225 230 235 240 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Arg Leu Asp His Phe Gln 245 250 255 Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gln Arg Val Asp Ser Ser 260 265 270 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 275 280 285 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 290 295 300 Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr His 305 310 315 320 Glu Arg Asn Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 325 330 335 Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 340 345 350 Gly Leu Asp Tyr Ile Trp Pro Trp Glu Arg Asn Ala 355 360 <210> 82 <211> 154 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N-terminal segment of M77 to VSC motif <400> 82 Lys Lys Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 1 5 10 15 Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu Asn Asp 20 25 30 Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg Ala Ser 35 40 45 Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr 50 55 60 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile Glu Glu 65 70 75 80 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 85 90 95 Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 100 105 110 Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 115 120 125 Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala 130 135 140 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser 145 150 <210> 83 <211> 12 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> DNA INITIATOR <220> <221> misc_feature <222> (11)..(11) <223> "n" is deoxyinosine <400> 83 tttttttttt nt 12

Claims (22)

  1. 하기 화학식으로 정의된 아미노산 서열과 80% 이상 동일한 아미노산 서열을 포함하는 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT: chimeric terminal deoxynucleotidyl transferase) 변이체:
    B1-B2-B3
    상기 식에서,
    B1은 N-말단으로부터 VSC 모티프와 KMT 모티프를 포함하여 그 사이의 아미노산 위치까지 연장되는 BRCT-유사 영역이 없는 제1 종의 TdT의 아미노산 분절이고, 이때 B1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, B1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
    B2는 B1의 C-말단으로부터 제2 종의 TdT의 C-말단으로, 또는 B3이 하나 이상의 아미노산을 포함할 때마다 B3의 N-말단까지 연장되는 제2 종의 TdT의 아미노산 분절이고, 이때 B2는 B2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환, B2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, B2가 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B2가 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
    B3은 0 내지 70개의 아미노산을 포함하고 제3 종의 TdT의 C-말단으로부터 B2의 C-말단 아미노산까지 연장되는 제3 종의 TdT의 아미노산 분절이고, 이때 B3은 B3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 B3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
    키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있고;
    B1, B2 및 B3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
  2. 제1항에 있어서,
    (i) B1의 상기 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 상기 치환이 R 또는 Q이고; B1이 GGFRR 모티프를 포함할 때마다 B1의 상기 GGFRR 모티프에서의 상기 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 L 또는 N이고; B1이 VSC 모티프를 포함할 때마다 B1의 상기 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 상기 치환이 G 또는 R이고;
    (ii) B2가 VSC 모티프를 포함할 때마다 B2의 상기 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 상기 치환이 R 또는 Q이고; B2가 GGFRR 모티프를 포함할 때마다 B2의 상기 GGFRR 모티프에서의 상기 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 L 또는 N이고; B2가 TGSR 모티프를 포함할 때마다 B2의 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 P, N 또는 A이고; B2가 FER 모티프를 포함할 때마다 B2의 상기 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 상기 치환이 N, L, T 또는 S이고;
    (iii) B3이 TGSR 모티프를 포함할 때마다 B3의 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 P, N 또는 A이고; B3이 FER 모티프를 포함할 때마다 B3의 상기 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 상기 치환이 N, L, T 또는 S인,
    키메라 TdT 변이체.
  3. 제1항 또는 제2항에 있어서,
    상기 제1 종의 TdT 및 상기 제3 종의 TdT가 동일한 것인, 키메라 TdT 변이체.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 아미노산 분절 B1, B2 및 B3이 각각 서열 번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40 및 41로 구성된 군에서 선택된 서열의 아미노산 분절과 90% 이상 동일한 아미노산 서열을 갖고: 이때
    상기 FMR 모티프에서의 상기 메티오닌 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 3, 4, 6, 7, 8, 11, 12 및 13에 대하여 위치 63에서; 서열 번호 5에 대하여 위치 62에서; 서열 번호 9에 대하여 위치 64에서; 서열 번호 10, 26, 28, 29, 30, 32, 33, 34, 36, 37, 38 및 39에 대하여 위치 61에서; 서열 번호 14에 대하여 위치 66에서; 서열 번호 15에 대하여 위치 47에서; 및 서열 번호 27, 31, 35 및 40에 대하여 위치 48에서 존재하고;
    상기 VSC 모티프에서의 상기 발린 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 171에서; 서열 번호 5, 32, 33, 34, 36, 37, 38, 39 및 41에 대하여 위치 170에서; 서열 번호 9에 대하여 위치 172에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 36, 37, 38 및 41에 대하여 위치 169에서; 서열 번호 13에 대하여 위치 180에서; 서열 번호 14에 대하여 위치 174에서; 서열 번호 15에 대하여 위치 154에서; 서열 번호 26에 대하여 위치 168에서; 서열 번호 27, 35 및 40에 대하여 위치 156에서; 및 서열 번호 31에 대하여 위치 157에서 존재하고;
    상기 VSC 모티프에서의 상기 세린 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 172에서; 서열 번호 5에 대하여 위치 171에서; 서열 번호 9에 대하여 위치 173에서; 서열 번호 10, 28, 29 및 30에 대하여 위치 170에서; 서열 번호 13에 대하여 위치 181에서; 서열 번호 14에 대하여 위치 175에서; 서열 번호 15에 대하여 위치 155에서; 서열 번호 26에 대하여 위치 169에서; 및 서열 번호 27, 31, 35 및 40에 대하여 위치 157에서 존재하고;
    상기 VSC 모티프에서의 상기 시스테인 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 173에서; 서열 번호 5에 대하여 위치 172에서; 서열 번호 9에 대하여 위치 174에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 37, 38, 39 및 41에 대하여 위치 171에서; 서열 번호 13에 대하여 위치 182에서; 서열 번호 14에 대하여 위치 176에서; 서열 번호 26에 대하여 위치 170에서; 서열 번호 27, 31, 35, 36 및 40에 대하여 위치 158에서; 및 서열 번호 15에 대하여 위치 156에서 존재하고;
    상기 GGFRR 모티프에서의 상기 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 3, 4, 6, 7, 8, 11 및 12에 대하여 위치 207에서; 서열 번호 5에 대하여 위치 206에서; 서열 번호 9에 대하여 위치 208에서; 서열 번호 10, 28, 29, 30, 32, 33, 34, 36, 37, 38, 39 및 41에 대하여 위치 205에서; 서열 번호 26에 대하여 위치 204에서; 서열 번호 27, 31, 35 및 40에 대하여 위치 192에서; 서열 번호 13에 대하여 위치 216에서; 서열 번호 14에 대하여 위치 210에서; 및 서열 번호 15에 대하여 위치 190에서 존재하고;
    상기 TGSR 모티프에서의 상기 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 7, 8, 12 및 33에 대하여 위치 325에서; 서열 번호 3, 4, 29 및 32에 대하여 위치 324에서; 서열 번호 5에 대하여 위치 320에서; 서열 번호 6에 대하여 위치 331에서; 서열 번호 9 및 26에 대하여 위치 326에서; 서열 번호 28 및 30에 대하여 위치 327에서; 서열 번호 10에 대하여 위치 323에서; 서열 번호 11 및 14에 대하여 위치 328에서; 서열 번호 13에 대하여 위치 338에서; 서열 번호 27 및 31에 대하여 위치 314에서; 서열 번호 35에 대하여 위치 310에서; 서열 번호 31에 대하여 위치 311에서; 서열 번호 32에 대하여 위치 321에서; 서열 번호 33 및 34에 대하여 위치 322에서; 서열 번호 36, 37, 38, 39 및 41에 대하여 위치 323에서; 서열 번호 40에 대하여 위치 309에서; 및 서열 번호 15에 대하여 위치 308에서 존재하고;
    상기 FER 모티프에서의 상기 글루탐산 또는 작용적으로 동등한 잔기의 상기 치환이 서열 번호 2, 7, 8 및 12에 대하여 위치 328에서; 서열 번호 3, 4 및 29에 대하여 위치 327에서; 서열 번호 5에 대하여 위치 323에서; 서열 번호 6에 대하여 위치 334에서; 서열 번호 9 및 26에 대하여 위치 329에서; 서열 번호 10, 36, 37, 38, 39 및 41에 대하여 위치 326에서; 서열 번호 11 및 14에 대하여 위치 331에서; 서열 번호 13에 대하여 위치 341에서; 서열 번호 27에 대하여 위치 317에서; 서열 번호 28 및 30에 대하여 위치 330에서; 서열 번호 40에 대하여 위치 312에서; 서열 번호 35에 대하여 위치 313에서; 서열 번호 31에 대하여 위치 314에서; 서열 번호 32에 대하여 위치 324에서; 서열 번호 33 및 34에 대하여 위치 325에서; 및 서열 번호 15에 대하여 위치 311에서 존재하는,
    키메라 TdT 변이체.
  5. 제4항에 있어서,
    (i) B1의 상기 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 상기 치환이 R 또는 Q이고; B1이 GGFRR 모티프를 포함할 때마다 B1의 상기 GGFRR 모티프에서의 상기 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 L 또는 N이고; B1이 VSC 모티프를 포함할 때마다 B1의 상기 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 상기 치환이 G 또는 R이고;
    (ii) B2가 VSC 모티프를 포함할 때마다 B2의 상기 VSC 모티프에서의 시스테인 또는 작용적으로 동등한 잔기의 상기 치환이 R 또는 Q이고; B2가 GGFRR 모티프를 포함할 때마다 B2의 상기 GGFRR 모티프에서의 상기 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 L 또는 N이고; B2가 TGSR 모티프를 포함할 때마다 B2의 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 P, N 또는 A이고; B2가 FER 모티프를 포함할 때마다 B2의 상기 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 상기 치환이 N, L, T 또는 S이고;
    (iii) B3이 TGSR 모티프를 포함할 때마다 B3의 상기 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 상기 치환이 P, N 또는 A이고; B3이 FER 모티프를 포함할 때마다 B3의 상기 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 상기 치환이 N, L, T 또는 S인,
    키메라 TdT 변이체.
  6. 제4항에 있어서,
    상기 FMR 모티프의 상기 메티오닌의 상기 치환이 R 또는 Q이고; 상기 VSC 모티프의 상기 발린의 상기 치환이 A이고; 상기 VSC 모티프의 상기 세린의 상기 치환이 E이고; 상기 VSC 모티프의 상기 시스테인의 상기 치환이 G 또는 R이고; 상기 GGFRR 모티프의 상기 두 번째 아르기닌의 상기 치환이 L 또는 N이고; 상기 TGSR 모티프의 상기 아르기닌의 상기 치환이 P, N 또는 A이고; 상기 FER 모티프의 상기 글루탐산의 상기 치환이 N, L, T 또는 S인, 키메라 TdT 변이체.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제1 종 및 제2 종의 TdT가 각각 포유동물 TdT인, 키메라 TdT 변이체.
  8. 제7항에 있어서,
    상기 제1 종의 TdT 및 상기 제2 종의 TdT가 각각 마우스, 소, 인간, 주머니쥐, 코키리 땃쥐, 개, 두더지, 새앙토끼, 고슴도치, 나무두더지, 오리너구리, 날쥐 및 퓨마로 구성된 군에서 선택된 종의 TdT인, 키메라 TdT 변이체.
  9. 제8항에 있어서,
    상기 제1 종의 TdT가 마우스이고, 상기 제2 종의 TdT가 소인, 키메라 TdT 변이체.
  10. 제9항에 있어서,
    상기 제1 종의 TdT가 서열 번호 21의 아미노산 서열을 갖고, 상기 제2 종의 TdT가 서열 번호 22의 아미노산 서열을 갖는, 키메라 TdT 변이체.
  11. 제10항에 있어서,
    서열 번호 23의 아미노산 서열을 갖는 키메라 TdT 변이체.
  12. 제10항에 있어서,
    서열 번호 24의 아미노산 서열을 갖는 키메라 TdT 변이체.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    상기 3'-O-변형된 뉴클레오사이드 삼인산염이 3'-O-NH2-뉴클레오사이드 삼인산염, 3'-O-아지도메틸-뉴클레오사이드 삼인산염, 3'-O-알릴-뉴클레오사이드 삼인산염 또는 3'-O-(2-니트로벤질)-뉴클레오사이드 삼인산염인, 키메라 TdT 변이체.
  14. 하기 화학식으로 정의된 아미노산 서열과 80% 이상 동일한 아미노산 서열을 포함하는 키메라 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체:
    J1-J2-J3
    상기 식에서,
    J1은 N-말단으로부터 VSC 모티프와 KMT 모티프를 포함하여 그 사이의 아미노산 위치까지 연장되는 BRCT 유사 영역이 없는 마우스 TdT의 아미노산 분절이고, 이때 J1은 FMR 모티프에서의 메티오닌 또는 작용적으로 동등한 잔기의 치환, J1이 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J1이 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동등한 잔기의 하나 이상의 치환을 포함하고;
    J2는 VSC 모티프와 KMT 모티프 사이에 위치한 아미노산 위치로부터 TGSR 모티프의 아미노산 위치까지 연장되는 비-마우스 TdT의 아미노산 분절이고, 이때 아미노산 분절은 J2가 GGFRR 모티프를 포함할 때마다 GGFRR 모티프에서의 두 번째 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J2가 VSC 모티프를 포함할 때마다 VSC 모티프에서의 발린, 세린 또는 시스테인, 또는 각각 작용적으로 동일한 잔기의 하나 이상의 치환을 포함하고;
    J3은 TGSR 모티프의 아미노산 위치로부터 C-말단 아미노산까지 연장되는 마우스 TdT의 아미노산 분절이고, 이때 J3은 J3이 TGSR 모티프를 포함할 때마다 TGSR 모티프에서의 아르기닌 또는 작용적으로 동등한 잔기의 치환, 및 J3이 FER 모티프를 포함할 때마다 FER 모티프에서의 글루탐산 또는 작용적으로 동등한 잔기의 치환을 포함하고;
    키메라 TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고, (ii) 3'-O-차단된 뉴클레오사이드 삼인산염을 핵산 단편 상으로 혼입할 수 있고;
    J1, J2 및 J3은 키메라 TdT 변이체가 350 내지 410개의 아미노산을 갖도록 선택된다.
  15. 제14항에 있어서,
    (i) 상기 아미노산 분절 J1이 서열 번호 42, 71, 73 및 82로 구성된 군에서 선택된 아미노산 서열을 포함하고; 서열 번호 42의 아미노산 서열이 위치 63에서 메티오닌의 치환을 갖고, (ii) 상기 아미노산 분절 J2가 서열 번호 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 및 70으로 구성된 군에서 선택된 아미노산 서열을 포함하고, 각각 위치 35에서 아르기닌의 치환을 갖고, 각각 위치 1에서 시스테인의 치환을 갖고, (iii) 상기 아미노산 분절 J3이 위치 12에서의 아르기닌의 치환, 위치 15에서의 글루탐산의 치환, 및 위치 38에서의 아르기닌의 치환을 갖는 서열 번호 43의 아미노산 서열; 또는 서열 번호 72의 아미노산 서열을 포함하는, 키메라 TdT 변이체.
  16. 제15항에 있어서,
    위치 63에서의 메티오닌의 상기 치환이 R 또는 Q이고, 위치 35에서의 아르기닌의 상기 치환이 L 또는 N이고, 위치 1에서의 시스테인의 상기 치환이 G 또는 R인, 키메라 TdT 변이체.
  17. 제15항 또는 제16항에 있어서,
    서열 번호 42의 상기 아미노산 서열이 위치 17에서의 알라닌의 치환, 위치 52에서의 류신의 치환, 위치 57에서의 글리신의 치환, 위치 63에서의 메티오닌의 치환 및 위치 108에서의 알라닌의 치환을 추가로 갖는, 키메라 TdT 변이체.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서,
    상기 비-마우스 TdT가 소 TdT인, 키메라 TdT 변이체.
  19. 제18항에 있어서,
    상기 키메라 TdT 변이체가 서열 번호 74, 75, 76, 77, 78, 79, 80 및 81로 구성된 군에서 선택된 아미노산 서열을 갖는, 키메라 TdT 변이체.
  20. 제14항 내지 제19항 중 어느 한 항에 있어서,
    상기 3'-O-변형된 뉴클레오사이드 삼인산염이 3'-O-NH2-뉴클레오사이드 삼인산염, 3'-O-아지도메틸-뉴클레오사이드 삼인산염, 3'-O-알릴-뉴클레오사이드 삼인산염 또는 3'-O-(2-니트로벤질)-뉴클레오사이드 삼인산염인, 키메라 TdT 변이체.
  21. a) 유리 3'-하이드록실을 갖는 개시제를 제공하는 단계; 및
    b) (i) 연장 조건 하에 상기 개시제 또는 유리 3'-O-하이드록실을 갖는 연장된 단편을 3'-O-차단된 뉴클레오사이드 삼인산염 및 말단 데옥시뉴클레오타이드 전달효소(TdT) 변이체와 접촉시켜 상기 개시제 또는 연장된 단편이 3'-O-차단된 뉴클레오사이드 삼인산염의 혼입에 의해 연장되어 3'-O-차단된 연장된 단편을 형성하고, (ii) 상기 연장된 단편을 차단제거하여 유리 3'-하이드록실을 갖는 연장된 단편을 형성하는 주기를 폴리뉴클레오타이드가 합성될 때까지 반복하는 단계
    를 포함하고, 이때 상기 TdT 변이체가 제1항 내지 제20항 중 어느 한 항에 따른 키메라 TdT 변이체인, 미리 결정된 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법.
  22. a) 제1항 내지 제20항 중 어느 한 항에 따른 키메라 TdT 변이체;
    b) 하나 이상의 뉴클레오타이드, 바람직하게는 하나 이상의 3'-O-차단된 뉴클레오사이드 삼인산염; 및
    c) 임의적으로 하나 이상의 핵산 프라이머
    를 포함하는, 뉴클레오타이드 혼입 반응을 수행하기 위한 키트.
KR1020227023746A 2019-12-12 2020-12-14 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소 KR20220114026A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19215628.9 2019-12-12
EP19215628 2019-12-12
PCT/EP2020/085475 WO2021116270A1 (en) 2019-12-12 2020-12-14 Chimeric terminal deoxynucleotidyl transferases for template-free enzymatic synthesis of polynucleotides

Publications (1)

Publication Number Publication Date
KR20220114026A true KR20220114026A (ko) 2022-08-17

Family

ID=68887331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227023746A KR20220114026A (ko) 2019-12-12 2020-12-14 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소

Country Status (9)

Country Link
US (1) US20230062303A1 (ko)
EP (1) EP4073240A1 (ko)
JP (1) JP2023506760A (ko)
KR (1) KR20220114026A (ko)
CN (1) CN114787346A (ko)
AU (1) AU2020401269A1 (ko)
CA (1) CA3161087A1 (ko)
IL (1) IL293820A (ko)
WO (1) WO2021116270A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023526061A (ja) * 2020-05-12 2023-06-20 イルミナ インコーポレイテッド 熱安定性末端デオキシヌクレオチジルトランスフェラーゼ
WO2023083997A2 (en) 2021-11-10 2023-05-19 Dna Script Novel terminal deoxynucleotidyl
WO2023083999A2 (en) 2021-11-10 2023-05-19 Dna Script Novel terminal deoxynucleotidyl transferase (tdt) variants
CN114410602B (zh) * 2022-01-28 2024-01-19 赛纳生物科技(北京)有限公司 一种末端脱氧核苷酸转移酶的突变体及其应用
US20230317208A1 (en) 2022-03-31 2023-10-05 Ribbon Biolabs Gmbh Biopolymer synthesis

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5436143A (en) 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6020141A (en) 1996-05-09 2000-02-01 3-Dimensional Pharmaceuticals, Inc. Microplate thermal shift assay for ligand development and multi-variable protein chemistry optimization
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
DE10215035A1 (de) * 2002-04-05 2003-10-23 Roche Diagnostics Gmbh Rekombinante terminale Deoxynukleotidyltransferase mit verbesserter Funktionalität
CA2491925A1 (en) 2002-07-08 2004-01-15 Shell Canada Limited Choke for controlling the flow of drilling mud
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
FR3020071B1 (fr) 2014-04-17 2017-12-22 Dna Script Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede
CA2958581C (en) * 2014-08-18 2023-04-04 Molecular Assemblies, Inc. Methods and apparatus for synthesizing nucleic acids
JP7053499B2 (ja) * 2016-06-03 2022-04-12 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 外因性ターミナルデオキシヌクレオチジルトランスフェラーゼを発現する非ヒト動物
FR3052462A1 (fr) 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
WO2019051250A1 (en) * 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION
US10435676B2 (en) 2018-01-08 2019-10-08 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
JP7430701B2 (ja) * 2018-07-23 2024-02-13 ディーエヌエー スクリプト 核酸鎖の大規模並列酵素合成
WO2020099451A1 (en) * 2018-11-14 2020-05-22 Dna Script Terminal deoxynucleotidyl transferase variants and uses thereof
CA3140498A1 (en) * 2019-05-28 2020-12-03 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
CN110331136B (zh) * 2019-09-05 2019-12-24 中国科学院天津工业生物技术研究所 一种末端脱氧核糖核苷转移酶变体及其应用

Also Published As

Publication number Publication date
WO2021116270A1 (en) 2021-06-17
AU2020401269A1 (en) 2022-06-02
EP4073240A1 (en) 2022-10-19
US20230062303A1 (en) 2023-03-02
CN114787346A (zh) 2022-07-22
CA3161087A1 (en) 2021-06-17
JP2023506760A (ja) 2023-02-20
IL293820A (en) 2022-08-01

Similar Documents

Publication Publication Date Title
US11859217B2 (en) Terminal deoxynucleotidyl transferase variants and uses thereof
US10435676B2 (en) Variants of terminal deoxynucleotidyl transferase and uses thereof
KR20220114026A (ko) 폴리뉴클레오타이드의 주형-부재 효소 합성을 위한 키메라 말단 데옥시뉴클레오타이드 전달효소
JP2022543569A (ja) ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成
US20230203553A1 (en) Template-Free Enzymatic Polynucleotide Synthesis Using Dismutationless Terminal Deoxynucleotidyl Transferase Variants
US20230159903A1 (en) Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof
US20220411840A1 (en) High Efficiency Template-Free Enzymatic Synthesis of Polynucleotides
US20240093256A1 (en) Stabilized N-Terminally Truncated Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof

Legal Events

Date Code Title Description
A201 Request for examination