KR20220052938A - 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 - Google Patents

폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 Download PDF

Info

Publication number
KR20220052938A
KR20220052938A KR1020227006178A KR20227006178A KR20220052938A KR 20220052938 A KR20220052938 A KR 20220052938A KR 1020227006178 A KR1020227006178 A KR 1020227006178A KR 20227006178 A KR20227006178 A KR 20227006178A KR 20220052938 A KR20220052938 A KR 20220052938A
Authority
KR
South Korea
Prior art keywords
leu
glu
lys
ala
ser
Prior art date
Application number
KR1020227006178A
Other languages
English (en)
Inventor
아드리안 호간
이보 사락
수파포른 니욤숀
자비에 고드론
Original Assignee
디엔에이 스크립트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디엔에이 스크립트 filed Critical 디엔에이 스크립트
Publication of KR20220052938A publication Critical patent/KR20220052938A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase

Abstract

본 발명은 다음에 제한되는 것은 아니나, 가닥내 및 가닥간 이중체, G-사중체 등을 포함하는 DNA 2차 구조의 형성을 억제하는 사슬 연장 조건을 사용하여 폴리뉴클레오타이드의 주형 부재 효소적 합성을 위한 방법 및 키트에 관한 것이다. 일부 실시양태에서, 이러한 사슬 연장 조건은 합성되는 폴리뉴클레오타이드에서 수소 결합의 형성을 억제하는 보호기 또는 염기 유사체를 기본으로 하는 3'-O-차단 dNTP 단량체를 사용하는 것을 포함한다.

Description

폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가
최근 합성생물학, CRISPR-Cas9 적용, 고처리량 시퀀싱과 같은 많은 분야에서 합성 폴리뉴클레오타이드에 대한 수요 증가뿐만 아니라, 유기 용매의 사용 및 필요한 폐기 및 산물 길이에 대한 상한과 같은 폴리뉴클레오타이드 합성에 대한 접근법의 한계로 인해 폴리뉴클레오타이드 합성에 대한 효소적 접근에 대한 관심이 증가하고 있다 (문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)]). 효소적 합성은 특이성과 효율성, 온건한 수성 반응 조건이 필요하기 때문에 매력적이다.
현재, 대부분의 효소적 접근법은 적절한 서열의 폴리뉴클레오타이드가 획득될 때까지 지지체에 부착된 단일 가닥 개시인자(initiator) 또는 연장 가닥에 3'-O-차단 뉴클레오사이드 트리포스페이트를 반복적으로 첨가한 후 탈차단(deblocking)하기 위해 주형 부재 중합효소를 사용한다. 이러한 방법의 목적은 구조가 천연 대응물과 구별할 수 없는 긴 합성 핵산을 제공하는 것이다. 그러나, 폴리뉴클레오타이드 길이가 증가함에 따라, 예를 들어, 가닥내 또는 가닥간 이중체와 같은 2차 구조 형성 가능성이 증가하고, 그 결과 합성 시약이 반응 부위에 대한 접근을 상실하고 산물 수율이 저하된다.
상기 관점에서, 적절한 폴리뉴클레오타이드 산물의 수율을 감소시키는 2차 구조의 형성을 감소시키는 방법이 이용 가능하다면 폴리뉴클레오타이드의 주형 부재 효소적 합성이 진보될 것이다.
본 발명은 합성 동안 2차 구조의 형성을 감소시킬 목적으로 염기 유사체 및 염기 보호 모이어티(moiety)를 사용하는 폴리뉴클레오타이드의 주형 부재 효소적 합성 방법에 관한 것이다. 일 양상에서, 이러한 방법은 아데닌, 시토신 및 구아닌의 고리외 아민에 부착된 염기 보호 모이어티를 사용한다. 다른 양상에서, 이러한 염기 보호 모이어티는 또한 포획(capture) 모이어티, 뉴클레아제 차단제, 리포터 등과 같은 추가 기능을 제공하는 모이어티를 포함할 수 있다. 예를 들어, 비오틴과 같은 포획 모이어티는 탈보호 전에 합성 후 폴리뉴클레오타이드를 포획하는데 사용될 수 있다.
일부 실시양태에서, 본 발명은 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, a) 유리(free) 3'-하이드록실을 갖는 개시인자를 제공하는 단계; b) 폴리뉴클레오타이드가 완료될 때까지, (i) 연장 조건(elongation condition) 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편(elongated fragment)을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적(template-independent) DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층(base stacking)을 방지하는 것으로 선택되는 단계를 포함하는 방법에 관한 것이다. 일부 실시양태에서, 분자내 또는 분자간 수소 결합을 방지하기 위해 선택되는 조건은 보호기가 수소 결합에 관여하지 못하도록 하는 염기 보호 모이어티를 갖는 3'-O-차단 뉴클레오사이드 트리포스페이트 단량체를 제공하는 것을 포함한다. 특히, 상기 연장 조건은 적어도 하나의 3'-O-차단 뉴클레오사이드 트리포스페이트가 수소 결합을 방지하기 위해 그의 염기, 바람직하게는 이의 염기의 질소 또는 산소, 더욱 바람직하게는 질소에 부착된 염기 보호 모이어티를 갖는 것을 제공할 수 있다. 상기 3'-O-차단 뉴클레오사이드 트리포스페이트의 상기 염기의 상기 질소는 고리외 질소(exocyclic nitrogen)일 수 있다. 일부 특정 실시양태에서, 상기 염기 보호 모이어티는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 또는 데옥시시티딘 트리포스페이트의 4-질소에 부착될 수 있다. 상기 염기 보호 모이어티는 아실 보호기일 수 있다. 특히, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택될 수 있고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택될 수 있고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 아세틸, 및 이소부티릴로 이루어진 군으로부터 선택될 수 있다. 대안적으로, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일 또는 디메틸포름아미딘, 바람직하게는 디메틸포름아미딘일 수 있고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 아세틸 또는 디메틸포름아미딘, 바람직하게는 디메틸포름아미딘일 수 있고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸일 수 있다. 일부 실시양태에서, 염기 보호 모이어티는 염기 불안정성(base labile)일 수 있고, 특히, 아미딘일 수 있다. 본 방법은 폴리뉴클레오타이드의 뉴클레오타이드로부터 상기 염기 보호 모이어티를 제거하는 단계를 포함할 수 있다. 개시인자는 고체 지지체에 부착될 수 있다. 일부 특정 실시양태에서, 상기 개시인자는 염기 절단 가능한 뉴클레오사이드를 포함하고, 상기 염기 보호 모이어티는 염기 불안정성 및 상기 제거 단계는 상기 폴리뉴클레오타이드를 염기로 처리하여, 염기 보호 모이어티 및 염기 절단 가능한 뉴클레오사이드가 동일한 반응에서 절단되도록 하는 단계를 포함한다. 일부 실시양태에서, 분자내 또는 분자간 수소 결합을 방지하기 위해 선택되는 조건은 바람직하게는 물 및 카오트로픽제 (chaotropic agent) 이하의 유전 상수를 갖는 수혼화성 용매로 이루어진 군으로부터 선택되고, 더욱 특히, 포름아미드, 구아니딘, 살리실산나트륨, 디메틸 술폭사이드 (DMSO), 프로필렌 글리콜, 및 요소로부터 선택되는 변성제(denaturation agent)의 존재를 포함할 수 있다. 바람직하게는, 상기 3'-O-보호기는 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길로 이루어진 군으로부터 선택될 수 있다. 더욱 바람직하게는, 상기 3'-O-보호기는 아지도메틸 또는 아민이다. 염기 보호 모이어티가 사용되는 경우, 합성이 완료된 후, 본 발명의 방법은 최종 산물의 뉴클레오타이드로부터 염기 보호 모이어티를 제거하는 추가 단계를 포함할 수 있다.
일부 실시양태에서, 본 발명은 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층을 방지하는 것으로 선택되고; 최종 사이클은 단지 단계 (i)만을 포함하고, 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트는 포획 모이어티를 포함하는 염기 보호 모이어티를 포함하는 단계; c) 포획 모이어티의 보체(complement)로 폴리뉴클레오타이드를 포획하는 단계를 포함하는 방법에 관한 것이다. 상기 방법은 상기 포획된 폴리뉴클레오타이드를 탈차단하는 단계를 추가로 포함할 수 있다.
도 1a는 폴리뉴클레오타이드의 주형 부재 효소적 합성 방법을 도식적으로 도시한다.
도 1b는 합성 시약이 성장하는 사슬에 접근하는 것을 억제하는 형성될 수 있는 2차 구조의 유형을 도식적으로 도시한다.
도 2는 염기 보호된 3'-O-아미노-2'-데옥시뉴클레오사이드 트리포스페이트의 부류를 합성하기 위한 도식을 나타낸다.
도 3은 3'-O-NH2-N2-아세실-2'-데옥시구아노신 트리포스페이트를 포함하는 단량체를 사용하여 합성할 때 (dG)10의 증가된 수율을 나타내는 데이터를 나타낸다.
도 4a 및 도 4b는 모이어티를 포획하는 것과 같은 추가 기능을 갖는 모이어티를 포함하는 예시적인 염기 보호 모이어티를 도시한다.
본 발명의 일반 원리는 특히 도면에 도시되고 상세하게 설명된 것과 같은 예를 통해 본 명세서에서 더욱 상세하게 개시된다. 그러나, 기재된 특정 실시양태로 본 발명을 제한하려는 의도가 아님을 이해해야 한다. 본 발명은 다양한 변형 및 대안적인 형태를 수용할 수 있으며, 그 세부사항은 다수의 실시양태에 대해 제시되어 있다. 본 발명의 원리 및 범위에 속하는 모든 변형, 균등물 및 대안을 포괄하는 것으로 의되된다.
본 발명의 실시는 달리 지시되지 않는 한, 당해 분야의 기술 내에 있는 유기 화학, 분자 생물학 (재조합 기술 포함), 세포 생물학 및 생화학에 대한 통상적인 기술 및 설명을 사용할 수 있다. 이러한 통상적인 기술은 다음에 제한되는 것은 아니나, 합성 펩타이드, 합성 폴리뉴클레오타이드, 단일 클론 항체의 제조 및 사용, 핵산 클로닝, 증폭, 시퀀싱 및 분석, 및 관련 기술을 포함할 수 있다. 이러한 통상의 기술에 대한 프로토콜은 제조업체의 산물 문헌 및 문헌[Genome Analysis: A Laboratory Manual Series (Vols. I-IV); PCR Primer: A Laboratory Manual; and Molecular Cloning: A Laboratory Manual (all from Cold Spring Harbor Laboratory Press); Lutz and Bornscheuer, Editors, Protein Engineering Handbook (Wiley-VCH, 2009); Hermanson, Bioconjugate Techniques, Second Edition (Academic Press, 2008)] 등과 같은 표준 실험실 매뉴얼에서 찾을 수 있다.
본 발명은 예를 들어 수소 결합, 염기 적층 등에 의해 야기되는 성장 사슬에서 2차 구조의 형성을 억제하는 합성 조건을 제공함으로써 긴 폴리뉴클레오타이드의 더 높은 수율을 가능하게 하는 폴리뉴클레오타이드, 특히 DNA의 주형 부재 효소적 합성에 대한 개선에 관한 것이다. 특정 이론이나 가설에 결부시키고자 하는 것은 아니나, 이러한 2차 구조의 형성은 주형 부재 중합효소와 같은 합성 시약에 대한 접근을 제한하여 사슬 연장을 억제하고 산물 길이의 가변성을 증가시키는 것으로 고려된다. 부분적으로, 본 발명은 산물 수율에 대한 이러한 2차 구조의 부정적인 영향이 예를 들어, 더 높은 반응 온도를 포함하는 연장 조건을 선택함으로써, 예를 들어, 열에 안정한 주형 부재 중합효소의 사용; 변성제의 존재 하; 및 수소 결합을 방지하기 위해 고리외 아민과 같은 기에 부착된 염기 유사체 또는 염기 보호 모이어티를 갖는 단량체의 사용에 의해 완화되거나 억제될 수 있다는 인식 및 이해에 기반한다.
일부 실시양태에서, 본 발명은 예를 들어, 수소 결합을 방지함으로써 2차 구조의 형성을 방지할 뿐만 아니라, 엑소뉴클레아제 활성을 차단하거나 리포터 기로서 작용하거나, 포획 모이어티로 작용하는 등의 모이어티와 같은 추가의 기능을 제공하는 염기 보호 모이어티의 사용을 포함한다. 예를 들어, 염기 보호 모이어티는 폴리뉴클레오타이드 산물의 간단한 단리를 가능하게 하는 분자 포획 모이어티를 포함할 수 있으며, 이는 결과적으로 산물에 비천연 부가물 또는 "잔류물"을 남기지 않고 탈보호에 의해 방출될 수 있다.
주형-부재 효소적 합성
일반적으로, 주형 부재 (또는 균등하게, "주형 독립적") 효소적 DNA 합성 방법은 도 1a에 예시된 것과 같은 단계의 반복 사이클를 포함하며, 소정의 뉴클레오타이드는 각 사이클에 개시인자 또는 성장 사슬에 연결된다. 주형 부재 효소적 합성의 일반적인 요소는 다음 참조문헌에 기재되어 있다: Ybert 등의 국제 특허 공개 WO/2015/159023; Ybert 등의 국제 특허 공개 WO/2017/216472; Hyman, 미국 특허 제 5436143호; Hiatt 등의 미국 특허 제 5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018); Mathews et al, Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f (2016); Schmitz et al, Organic Lett., 1 (11): 1729-1731 (1999)].
개시인자 폴리뉴클레오타이드 (100)는, 예를 들어 유리 3'-하이드록실기 (103)를 갖는 고체 지지체 (102)에 부착되어 제공된다. 개시인자 폴리뉴클레오타이드 (100) (또는 연장 개시인자 폴리뉴클레오타이드)의 3' 말단에 3'-O-보호-dNTP의 효소적 혼입에 효과적인 조건 (104) 하에 개시인자 폴리뉴클레오타이드 (100) (또는 후속 사이클의 연장 개시인자 폴리뉴클레오타이드)에 3'-O-보호-dNTP 및 TdT 또는 이의 변이체와 같은 주형 부재 중합효소가 첨가된다 (예를 들어, Ybert 등의 WO/2017 /216472; Champion 등의 WO2019/135007). (뉴클레오타이드 단량체의 기와 관련하여 "보호된" 및 "차단된"이라는 용어와 그 균등예는 상호 혼용 가능하고 동의어로 사용됨). 이 반응은 3'-하이드록실이 보호되는 연장 개시인자 폴리뉴클레오타이드를 생성한다 (106). 연장 개시인자 폴리뉴클레오타이드가 보체 서열을 포함하는 경우, 3'-O-보호기가 제거되거나 탈보호될 수 있고, 적절한 서열이 원래 개시인자 폴리뉴클레오타이드로부터 절단될 수 있다. 이러한 절단은 다양한 단일 가닥 절단 기술 중 임의의 것을 사용하여, 예를 들어 원래 개시인자 폴리뉴클레오타이드 내의 소정의 위치에 절단 가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단 가능한 뉴클레오타이드는 우라실 DNA 글리코실라제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 연장 개시인자 폴리뉴클레오타이드가 보체 서열을 포함하지 않는 경우, 3'-O-보호기가 제거되어 유리 3'-하이드록실 (103)이 노출되고 연장 개시인자 폴리뉴클레오타이드가 뉴클레오타이드 첨가 및 탈보호의 또 다른 사이클에 적용된다.
본 명세서에 사용되는 바와 같이, "개시인자" (또는 "개시 단편", "개시인자 핵산", "개시인자 올리고뉴클레오타이드" 등과 같은 균등 용어)는 일반적으로 TdT와 같은 주형 부재 중합효소에 의해 더 연장될 수 있는 유리 3' 말단을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭한다. 일 실시양태에서, 개시 단편은 DNA 개시 단편이다. 대안적인 실시양태에서, 개시 단편은 RNA 개시 단편이다. 일부 실시양태에서, 개시 단편은 3 내지 100개의 뉴클레오타이드, 특히 3 내지 20개의 뉴클레오타이드를 보유한다. 일부 실시양태에서, 개시 단편은 단일 가닥이다. 대안적인 실시양태에서, 개시 단편은 이중 가닥이다. 일부 실시양태에서, 개시인자는 TdT가 3'-O-보호 dNTP를 연결할 수 있는 유리 하이드록실을 갖는 비핵산 화합물을 포함할 수 있다 (예를 들어, Baiga, 미국 특허 공개 US2019/0078065 및 US2019/0078126).
합성이 완료된 후, 적절한 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드는 절단에 의해 개시인자 및 고체 지지체로부터 방출될 수 있다. 다양한 절단 가능한 연결 또는 절단 가능한 뉴클레오타이드가 이러한 목적을 위해 사용될 수 있다. 일부 실시양태에서, 적절한 폴리뉴클레오타이드를 절단하면 절단된 가닥에 천연 유리 5'-하이드록실이 유지되고; 그러나 대안적인 실시양태에서, 절단 단계는 모이어티 예를 들어, 5'-포스페이트를 유지시킬 수 있으며, 이는 후속 단계에서 포스파타제 처리로 제거될 수 있다. 절단 단계는 화학적, 열적, 효소적 또는 광화학적 방법에 의해 수행될 수 있다. 일부 실시양태에서, 절단 가능한 뉴클레오타이드는 특정 글리코실라제 (예를 들어, 각각 우라실 데옥시글리코실라제, 다음 엔도뉴클레아제 VIII, 및 8-옥소구아닌 DNA 글리코실라제)에 의해 인식되는 뉴클레오타이드 유사체, 예컨대 데옥시우리딘 또는 8-옥소-데옥시구아노신일 수 있다. 일부 실시양태에서, 절단은 개시인자에 데옥시이노신을 말단에서 두 번째 3' 뉴클레오타이드로 제공함으로써 달성될 수 있으며, 이는 개시인자의 3' 말단에서 엔도뉴클레아제 V에 의해 절단되어 방출된 폴리뉴클레오타이드 상에 5'-포스페이트를 유지시킬 수 있다. 단일 가닥 폴리뉴클레오타이드를 절단하는 추가 방법은 참조로 포함되는 하기 참조문헌에 개시되어 있다: 미국 특허 제 5,739,386호, 제 5,700,642호 및 제 5,830,655호; 및 미국 특허 공개 제 2003/0186226호 및 제 2004/0106728호; 및 Urdea 및 Horn, 미국 특허 제 5367066호.
일부 실시양태에서, 글리코실라제 및/또는 엔도뉴클레아제에 의한 절단은 이중 가닥 DNA 기질이 필요할 수 있다.
도 1a로 돌아가서, 일부 실시양태에서, 뉴클레오타이드의 정렬된 서열은 각 합성 단계에서 3'-O-보호 dNTP의 존재 하에 TdT와 같은 주형 부재 중합효소를 사용하여 개시인자 핵산에 연결된다. 일부 실시양태에서, 올리고뉴클레오타이드 합성 방법은 (a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; (b) 연장 조건 하에 유리 3'-하이드록실을 갖는 개시인자 또는 연장 중간체를 3'-O-보호 뉴클레오사이드 트리포스페이트의 존재 하에 주형 부재 중합효소와 반응시켜 3'-O-보호 연장 중간체를 생성하는 단계; (c) 연장 중간체를 탈보호하여 유리 3'-하이드록실을 갖는 연장 중간체를 생성하는 단계; 및 (d) 폴리뉴클레오타이드가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 포함한다. (때때로 "연장 중간체"와 "연장 단편"이라는 용어는 상호 혼용되고 동의어로 사용됨). 일부 실시양태에서, 개시인자는 예를 들어 그의 5' 말단에 의해 고형 지지체에 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 탈보호 단계 후뿐만 아니라, 반응 또는 연장 단계 후 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는 예를 들어 소정의 인큐베이션 기간 또는 반응 시간 후 세척에 의해 혼입되지 않은 뉴클레오사이드 트리포스페이트를 제거하는 하위 단계를 포함할 수 있다. 이러한 소정의 인큐베이션 기간 또는 반응 시간은 수 초, 예를 들어 30초 내지 수 분, 예를 들어 30분일 수 있다.
도 1b에 도시된 바와 같이, 합성 지지체 (122) 상의 폴리뉴클레오타이드 서열이 역보체 하위서열, 예를 들어, (124) 및 (126)을 포함하는 경우, 2차 분자내 (128) 또는 분자간 (130) 구조는 역보체 영역 사이의 수소 결합 형성에 의해 생성될 수 있다. 본 발명의 일 양상에서, 고리외 아민에 대한 염기 보호 모이어티는 보호된 질소의 수소가 수소 결합에 관여할 수 없도록 선택되어 도 1b에 도시된 것과 같은 2차 구조의 형성을 방지한다. 즉, 본 발명의 일 양상에서, 염기 보호 모이어티는 예를 들어 뉴클레오사이드 A와 T 사이 및 G와 C 사이에서 정상적인 염기 쌍으로 형성되는 것과 같은 수소 결합의 형성을 방지하는 것으로 선택된다. 합성의 경우, 염기 보호 모이어티가 제거될 수 있고 폴리뉴클레오타이드 산물은 예를 들어 개시인자로부터 절단함으로써 고체 지지체로부터 절단될 수 있다.
염기가 보호되지 않은 3'-O-차단 dNTP는 상업적 공급업체로부터 구입하거나 공개된 기술을 사용하여 합성될 수 있다 (예를 들어 미국 특허 제 7057026호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105 (27): 9145-9150 (2008)]; Benner, 미국 특허 제 7544794호 및 제 8212020호; 국제 특허 공개 WO2004/005667, WO91/06678; 문헌[Canard et al, Gene (본 명세서에 인용됨); Metzker et al, Nucleic Acids Research, 22: 4259-4267 (1994); Meng et al, J. Org. Chem., 14: 3248-3252 (3006)]; 미국 특허 공개 제 2005/037991호. 염기가 보호된 3'-O-차단 dNTP는 아래 기재된 대로 합성될 수 있다.
염기-보호 dNTP가 사용되는 경우, 도 1a의 상기 방법은 (e) 염기 보호 모이어티를 제거하는 단계를 추가로 포함할 수 있으며, 이는 아실 또는 아미딘 보호기의 경우에 (예를 들어) 농축된 암모니아로 처리하는 단계를 포함할 수 있다.
상기 방법은 또한 캡핑 단계 (들)뿐만 아니라, 반응 또는 연장 단계 후 및 탈보호 단계 후에 세척 단계를 포함할 수 있다. 상기 언급된 바와 같이, 일부 실시양태에서, 비연장 유리 3'-하이드록실이 캡핑된 가닥의 임의의 추가 연장을 방지하는 화합물과 반응하는 캡핑 단계가 포함될 수 있다. 일부 실시양태에서, 이러한 화합물은 디데옥시뉴클레오사이드 트리포스페이트일 수 있다. 다른 실시양태에서, 유리 3'-하이드록실을 갖는 비연장 가닥은 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리함으로써 분해될 수 있다. 예를 들어, Hyman, 미국 특허 제 5436143호를 참조한다. 유사하게, 일부 실시양태에서, 탈차단되지 않은 가닥은 가닥을 제거하거나 추가 연장에 대해 불활성이 되도록 처리될 수 있다.
일부 실시양태에서, 연장 또는 연장 단계를 위한 반응 조건은 다음을 포함할 수 있다: 2.0 μM 정제 TdT; 125 내지 600 μM 3'-O-차단 dNTP (예를 들어, 3'-O-NH2-차단 dNTP); 약 10 내지 약 500 mM 칼륨 카코딜레이트 완충액 (pH 6.5 내지 7.5) 및 약 0.01 내지 약 10 mM의 2가 양이온 (예를 들어, CoC12 또는 MnC12), 연장 반응은 실온 내지 45℃ 내의 온도에서 3분 동안 50 μL 반응 부피에서 수행될 수 있다. 3'-O-차단 dNTP가 3'-O-NH2-차단 dNTP인 실시양태에서, 탈차단 단계를 위한 반응 조건은 다음을 포함할 수 있다: 700 mM NaNO2; 1 M 아세트산나트륨 (아세트산으로 pH 4.8 내지 6.5 범위로 조정), 탈차단 반응은 실온 내지 45℃ 내의 온도에서 30초 내지 수 분 동안 50 μL 부피에서 수행될 수 있다.
특정 적용에 따라, 탈차단 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건, 예를 들어, 빛, 열, pH, 특정 화학 결합을 절단할 수 있는 효소와 같은 특정 시약의 존재를 포함할 수 있다. 3'-O-차단기 및 해당하는 탈차단 조건 선택에 대한 지침은 참조로 포함되는 Benner, 미국 특허 7544794 및 8212020; 미국 특허 5808045; 미국 특허 8808988; 국제 특허 공개 WO91/06678 및 하기에 언급된 참조문헌과 같은 참조문헌에서 찾을 수 있다. 일부 실시양태에서, 절단제 (때때로 탈차단 시약 또는 제제로도 지칭됨)는 예를 들어 디티오트레이톨 (DTT)과 같은 화학적 절단제이다. 대안적인 실시양태에서, 절단제는 3'-포스페이트 차단기를 절단할 수 있는 예를 들어 포스파타제와 같은 효소적 절단제일 수 있다. 탈차단제의 선택은 사용된 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다중 차단기가 사용되는지, 개시인자가 생존 세포 또는 유기체 또는 간단한 처리가 필요한 고체 지지체에 부착되는지 등에 좌우됨을 당업자는 이해할 것이다. 예를 들어, 트리스(2-카복시에틸)포스핀 (TCEP)과 같은 포스핀을 사용하여 3'O-아지도메틸기를 절단할 수 있고, 팔라듐 착물을 사용하여 3'O-알릴기를 절단할 수 있으며, 아질산나트륨을 사용하여 3'O-아미노기를 절단할 수 있다. 특정 실시양태에서, 절단 반응은 TCEP, 팔라듐 착물 또는 아질산나트륨을 포함한다.
위에서 언급한 바와 같이, 일부 실시양태에서, 직교 탈차단 조건을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직하다. 하기 예시적인 차단기 쌍은 병렬 합성 실시양태에서 사용될 수 있다. 다른 차단기 쌍, 또는 둘 이상을 포함하는 기가 본 발명의 이러한 실시양태에서 사용하기 위해 이용가능할 수 있음이 이해된다.
Figure pct00001
생존 세포에서 올리고뉴클레오타이드를 합성하려면 약한 탈차단 또는 탈보호 조건, 즉 세포막을 파괴하지 않거나, 단백질을 변성시키거나 주요 세포 기능을 방해하지 않는 등의 조건이 필요하다. 일부 실시양태에서, 탈보호 조건은 세포 생존에 적합할 수 있는 생리학적 조건의 범위 내이다. 이러한 실시양태에서, 효소적 탈보호는 생리학적 조건 하에서 수행될 수 있기 때문에 바람직하다. 일부 실시양태에서 특정 효소적으로 제거 가능한 차단기는 이의 제거를 위한 특정 효소와 결합된다. 예를 들어, 에스테르 또는 아실 기반 차단기는 아세틸에스테라아제와 같은 에스테라아제 또는 유사 효소로 제거할 수 있고, 포스페이트 차단기는 T4 폴리뉴클레오타이드 키나아제와 같은 3' 포스파타아제로 제거할 수 있다. 예를 들어, 3'-O-포스페이트는 100 mM Tris-HCl (pH 6.5) 10 mM MgCl2, 5 mM 2-머캅토에탄올, 및 하나의 단위 T4 폴리뉴클레오타이드 키나제의 용액으로 처리하여 제거할 수 있다. 반응은 37℃의 온도에서 1분간 진행된다.
"3'-포스페이트-차단" 또는 "3'-포스페이트-보호" 뉴클레오타이드는 3'-위치의 하이드록실기가 모이어티를 포함하는 포스페이트의 존재에 의해 차단된 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트 차단 뉴클레오타이드의 예는 뉴클레오타이드-3'-포스페이트 모노에스테르/뉴클레오타이드-2',3'-사이클릭 포스페이트, 뉴클레오타이드-2'-포스페이트 모노에스테르 및 뉴클레오타이드-2' 또는 3'-알킬포스페이트 디에스테르 및 뉴클레오타이드-2' 또는 3'-피로포스페이트이다. 티오포스페이트 또는 이러한 화합물의 다른 유사체가 또한 사용될 수 있으며, 단, 치환이 포스파타제에 의한 유리 3'-OH를 생성하는 탈인산화를 방지하지 않아야 한다.
3'-O-에스테르-보호 dNTP 또는 3'-O-포스페이트-보호 dNTP의 합성 및 효소적 탈보호의 추가 예는 하기 참조문헌에 기재되어 있다: 문헌[Canard et al, Proc. Natl. Acad. Sci., 92:10859-10863 (1995); Canard et al, Gene, 148: 1-6 (1994); Cameron et al, Biochemistry, 16(23): 5120-5126 (1977); Rasolonjatovo et al, Nucleosides & Nucleotides, 18(4&5): 1021-1022 (1999); Ferrero et al, Monatshefte fur Chemie, 131: 585-616 (2000); Taunton-Rigby et al, J. Org. Chem., 38(5): 977-985 (1973); Uemura et al, Tetrahedron Lett., 30(29): 3819-3820 (1989); Becker et al, J. Biol. Chem., 242(5): 936-950 (1967)]; Tsien, 국제 특허 공개 WO1991/006678.
일부 실시양태에서, 변형된 뉴클레오타이드는 퓨린 또는 피리미딘 염기 및 이에 공유결합에 의해 부착된 제거 가능한 3'-OH 차단기를 갖는 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함하여, 3' 탄소 원자는 다음 구조의 기를 연결하였다:
-O-Z
상기 식에서, -Z는 -C (R')2-O-R", -C (R')2-N (R")2, -C (R')2-N (H)R", -C (R')2-S-R" 및 -C (R')2-F 중 임의의 것이고, 각각의 R"는 제거 가능한 보호기이거나 그 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도기, 또는 연결기를 통해 부착된 검출 가능한 표지이고; 단, 일부 실시양태에서 이러한 치환기는 10개 이하의 탄소 원자 및/또는 5개 이하의 산소 또는 질소 헤테로원자를 가지거나; 또는 (R')2는 화학식 =C(R"')2의 기를 나타내고, 각각의 R"'는 동일하거나 상이할 수 있고 수소 및 할로겐 원자 및 알킬 기를 포함하는 군으로부터 선택되고, 단 일부 실시양태에서 각각의 R'''의 알킬은 1 내지 3개의 탄소 원자를 갖고; 분자는 반응하여 각 R"이 H로 교체되거나, Z가 - (R')2-F인 경우 F가 OH, SH 또는 NH2, 바람직하게는 OH로 교체된 중간체를 생성할 수 있고, 중간체는 수성 조건 하에 해리되어 유리 3'-OH를 갖는 분자를 제공하고; 단, Z가 -C(R')2-S-R"인 경우, 두 R' 기 모두 H가 아니다. 특정 실시양태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이며, 단, 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정 실시양태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')2-N3이다. 특정 실시양태에서, Z는 아지도메틸기이다.
일부 실시양태에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 일부 실시양태에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 200 이하의 분자량을 갖는 효소적으로 절단 가능한 에스테르 기이다. 다른 실시양태에서, Z는 3'-포스파타제에 의해 제거 가능한 포스페이트 기이다. 일부 실시양태에서, 다음 3'-포스파타제 중 하나 이상이 제조업체의 권장 프로토콜에 의해 사용될 수 있다: T4 폴리뉴클레오타이드 키나제, 송아지 장 알칼리 포스파타제, 재조합 새우 알칼리 포스파타제 (예를 들어, New England Biolabs, Beverly, MA).
추가 실시양태에서, 3'-차단 뉴클레오타이드 트리포스페이트는 3'-O-아지도메틸, 3'-O-NH2 또는 3'-O-알릴기에 의해 차단된다.
또 다른 실시양태에서, 본 발명의 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길을 포함한다.
일부 실시양태에서, 3'-O-보호기는 전기화학적으로 불안정한 기이다. 즉, 보호기의 탈보호 또는 절단은 절단을 초래하는 보호기 부근의 전기화학적 조건을 변화시킴으로써 달성된다. 전기화학적 조건의 이러한 변화는 전압차 또는 빛과 같은 물리량을 변화시키거나 적용하여 결과적으로 보호기 부위에서 전기화학적 조건의 변화, 예컨대 pH의 증가 또는 감소를 야기하여 보조 종을 활성화함으로써 야기될 수 있다. 일부 실시양태에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 소정의 값으로 변화될 때마다 절단되는 pH-감응성 보호기를 포함한다. 다른 실시양태에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변화될 때마다, 예를 들어 보호기 부위에서 전압차를 증가 또는 감소시킴으로써 직접 절단되는 보호기를 포함한다.
염기 보호기
폴리뉴클레오타이드 사슬 연장 과정에서 2차 구조의 형성을 감소 또는 제거하기 위해 다양한 보호기 (또는 균등하게 "염기 보호 모이어티")가 사용될 수 있다. 일반적으로 염기 보호기를 제거하는 조건은 3'-O-차단기를 제거하는 조건과 상반한다. 특히, 3'-O-차단기에 대한 제거 또는 탈차단 조건이 산성인 경우 염기 보호기는 염기 불안정성이 되도록 선택될 수 있다. 이러한 상황에서 산 불안정성 5'-O-트리틸 보호 단량체의 사용으로 인해 포스포라미다이트 합성 화학에서 많은 염기 불안정성 보호기가 개발되었다 (예를 들어, 문헌[Beaucage 및 Iyer, Tetrahedron Letters, 48 (12): 2223-2311 (1992)]). 특히, 포스포라미다이트 화학을 위한 아실 및 아미딘 보호기는 본 발명의 실시양태에서 적용 가능하다 (예를 들어, Beaucage 및 Iyer (상기 인용)의 표 2 및 표 3의 보호기). 일부 실시양태에서, 염기 보호기는 Beaucage 및 Iyer (상기 인용)의 표 2에 기재된 바와 같이 아미딘이다. 일반적으로, 염기 보호 3'-O-차단 뉴클레오사이드 트리포스페이트 단량체는 하기 실시예에 기재된 것과 같이 문헌에 기재된 방법의 통상적인 변형에 의해 합성될 수 있다.
일부 실시양태에서, 염기 보호기는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 및/또는 데옥시시티딘 트리포스페이트의 4-질소에 부착된다. 일부 실시양태에서, 염기 보호기는 표시된 질소 모두에 부착된다. 일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 펜옥시아세틸 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 아세틸 및 이소부티릴로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 보호기는 벤조일이고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 이소부트릴 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 염기 보호기는 펜옥시아세틸이고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 4-이소프로필-펜옥시아세틸 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시양태에서, 염기 보호 모이어티는 제거되고 (즉, 산물이 탈보호됨) 산물이 동일한 반응에서 고체 지지체로부터 절단된다. 예를 들어, 개시인자는 염기-불안정성 염기 보호 모이어티를 동시에 제거하는 1 M KOH 또는 유사 시약 (암모니아, 수산화암모늄, NaOH 등)으로 처리하여 절단되어 폴리뉴클레오타이드 산물을 방출할 수 있는 리보-우리딘을 포함할 수 있다.
연장 조건의 추가 변형
염기 보호기를 갖는 3'-O-차단 dNTP 단량체를 제공하는 것 외에도, 열적으로 안정한 주형 부재 중합효소를 사용하여 더 높은 온도에서 연장 반응을 수행할 수 있다. 예를 들어, 40℃ 이상에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소를 사용할 수 있거나, 일부 실시양태에서, 40 내지 85℃ 범위에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소가 사용될 수 있거나; 일부 실시양태에서, 40 내지 65℃ 범위에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소가 사용될 수 있다.
일부 실시양태에서, 연장 조건은 수소 결합 또는 염기 적층을 억제하는 연장 반응 혼합물에 용매를 첨가하는 것을 포함할 수 있다. 이러한 용매는 디메틸 술폭사이드 (DMSO), 메탄올 등과 같은 낮은 유전 상수를 갖는 수혼화성 용매를 포함한다. 마찬가지로, 일부 실시양태에서, 연장 조건은 다음에 제한되는 것은 아니나, n-부탄올, 에탄올, 염화구아니디늄, 과염소산리튬, 아세트산리튬, 염화마그네슘, 페놀, 2-프로판올, 나트륨 도데실 술페이트, 티오우레아, 우레아 등을 포함하는 카오트로픽제의 제공을 포함할 수 있다. 일부 실시양태에서, 연장 조건은 2차 구조 억제량의 DMSO의 존재를 포함한다. 일부 실시양태에서, 연장 조건은 2차 구조의 형성을 억제하는 DNA 결합 단백질의 제공을 포함할 수 있으며, 이러한 단백질은 다음에 제한되는 것은 아니나, 단일 가닥 결합 단백질, 헬리카제, DNA 글리콜라제 등을 포함한다.
염기 유사체
일부 실시양태에서, 예를 들어, G-사중체와 같이 염기 유사체를 포함하는 3'-O-보호-뉴클레오사이드 트리포스페이트 단량체가 특정 2차 구조를 파괴하여 실패 서열 생성 가능성을 증가시키기 위해 사용될 수 있다. 많은 경우에 염기 유사체의 존재는 합성 산물에 적용 가능하며; 즉, 프라이머의 뉴클레오타이드에 염기 유사체의 존재는 중합효소 연쇄 반응 (PCR) 분석에 적용 가능할 수 있다. 일부 실시양태에서, G-사중체 구조를 형성할 수 있는 합성될 폴리뉴클레오타이드 내의 구아노신 (G)의 관의 존재 하에, 관 내의 G 중 하나 이상이 데옥시이노신 및/또는 7-데아자-2'-데옥시구아노신으로 치환되어 합성 동안 G-사중체의 형성을 방지할 수 있다. 일부 실시양태에서, 폴리뉴클레오타이드 내의 G 관의 G는 단지 7-데아자-2'-데옥시구아노신으로 치환된다. 일부 실시양태에서, 7-데아자-2'-데옥시구아노신으로 치환된 G의 수가 폴리뉴클레오타이드 산물의 용융 온도를 적용 가능할 수 없는 정도로 낮추는 경우, 치환에 사용된 유사체의 비율은 8-아자-7-데아자구아노신을 포함할 수 있다. G-사중체 구조는 사용 가능한 알고리즘을 사용하여 예측할 수 있다 (문헌[Lombardi et al, Nucleic Acids Research, 48 (1): 1-15 (2020)] 및 유사 참조문헌). 3'-O-보호 뉴클레오사이드 유사체의 트리포스페이트 단량체는 문헌, 예를 들어, 상기 언급된 문헌 및 Seela, 미국 특허 제 5990303호의 기술에 따라 합성할 수 있다. 일부 실시양태에서, G 관은 25% 초과의 G, 또는 30% 초과 G, 또는 40% 초과 G를 포함하는 폴리뉴클레오타이드에서 4개 초과 뉴클레오타이드의 서열 절편이다. 다른 실시양태에서, G 관은 모티프 G3+N1-7G3+N1-7G3+N1-7G3+에 해당하는 서열 절편이고, "N"은 임의의 뉴클레오타이드이고 "3+"는 연속된 3개 이상의 G를 의미한다. 일부 실시양태에서, 7-데아자-구아노신으로 대체된 G의 수는 관내 G의 1 내지 100%, 또는 관내 G의 1 내지 50%, 또는 관내 G의 1 내지 25% 또는 관내 G의 1 내지 10%일 수 있다. 일부 실시양태에서, 이러한 치환 백분율은 치환을 위해 G 관 내의 특정 G를 선택함으로써 달성될 수 있거나, 이러한 치환 백분율은 합성되는 폴리뉴클레오타이드의 G관 내의 하나 이상의 G의 첨가 단계에서 G 및 7-데아자-G의 혼합물을 사용함으로써 통계적으로 달성될 수 있다.
일부 실시양태에서, G 관을 갖는 폴리뉴클레오타이드를 합성하기 위한 상기 방법은 하기 단계에 의해 실행될 수 있다: a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; 및 b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계, 폴리뉴클레오타이드의 G 관 내의 적어도 하나의 G는 이노신 또는 7-데아자구아노신으로 치환된다. 폴리뉴클레오타이드가 폴리데옥시뉴클레오타이드일 경우 언제나 G 관의 적어도 하나의 G는 데옥시이노신 또는 7-데아자-2'-데옥시구아노신으로 치환된다. 일부 실시양태에서, 폴리뉴클레오타이드가 DNA일 경우 언제나 G 관의 적어도 하나의 G는 7-데아자-2'-데옥시구아노신으로 치환된다.
추가 기능을 갖는 염기 보호 모이어티
일부 실시양태에서, 모이어티 포획, 리포터 기, 엑소뉴클레아제 차단기 등과 같은 추가 기능을 포함하는 염기 보호 모이어티가 선택될 수 있다. 리포터 기는 형광 염료, 질량 표지, 전기화학적 표지 등을 포함할 수 있다. 일부 실시양태에서, 염기 보호 모이어티는 실패 서열로부터 전장 폴리뉴클레오타이드를 분리하거나 농축시키는데 사용될 수 있는 포획 모이어티를 포함할 수 있다. 예를 들어, 일부 실시양태에서, 이러한 염기 보호 모이어티는 dNTP 첨가의 최종 사이클에 사용될 수 있고, 그 다음 합성 지지체로부터 산물의 방출 또는 절단 후, 산물은 포획 조건 하에 포획 모이어티의 보체를 포함하는 지지체에 노출되어 (즉, 포획 단계가 실행됨), 따라서 포획 모이어티를 갖는 폴리뉴클레오타이드가 이를 갖지 않는 것과 분리될 수 있고, 이로써 전장의 폴리뉴클레오타이드 산물의 농축 집합을 생성할 수 있다. 선택적인 세척 단계를 수행할 수 있으며, 그 후 절단 또는 탈보호 단계를 수행하여 전장 폴리뉴클레오타이드가 농축된 산물을 방출할 수 있다. 상기와 같이, 포획 모이어티로 보호 모이어티를 탈보호하거나 제거하면 천연 폴리뉴클레오타이드 산물, 즉 임의의 비천연 부가물이 없는 고리외 아민을 갖는 폴리뉴클레오타이드 산물, 또는 보호 모이어티의 잔류물이 생성된다.
일부 실시양태에서, 모이어티를 보호하는 이러한 염기는 도 4a에서 "Q"로 지정된 추가 기능을 갖는 모이어티에 연결된 아실 보호기이다. Q는 비오틴, 리포터 기, 뉴클레아제 차단기 등과 같은 포획 모이어티를 나타낼 수 있다. 일부 실시양태에서, Q는 캡처 모이어티를 나타낸다. 포획 모이어티에는 알돌 반응, 딜스-알더 (Diels-Alder) 반응, 프리델-크래프트 (Friedel-Crafts) 반응, 알킨 복분해, 고리화첨가, 붕소산 축합 등과 같은 포획 단계에서 공유 결합을 형성하는 기가 포함될 수 있고 (예를 들어, 문헌[Jin et al, Chem. Soc. Rev., 42: 6634 (2013)]에서 검토됨), 포획 단계에서 항체에 의해 포획된 비공유 결합을 형성하는 기, 예를 들어 스트렙타비딘, 플루오레세인, 디니트로페놀, 디곡시게닌 등에 의해 포획된 비오틴이 포함될 수 있다. 도 4a는 포획 모이어티를 포함하는 예시적인 염기 보호 모이어티를 제공하고 하기 표 1은 본 발명에 의한 이의 사용에 대한 정보를 제공한다.
도 4a의 화학식 탈보호
조건

참조문헌
1 DTT 또는 TCEP Aissi et al, European Journal of Medicinal Chemistry, 120: 304-312 (2016)
2 TCEP
3 >pH 8 Cowell et al, ChemBioChem Comm., 18: 1688-1691 (2017)
4 아릴 포스핀 Lukasak et al, Scientific Reports, 9: 1470 (2019)
5 리파제 Sauerbrei et al, Angew. Chem. Int., 37 (8): 1143-1146 (1998)
6 테트라진 Neumann et al, ChemBioChem, 18: 91-95 (2017)
7 Liang et al, Org. Lett., 18 (5): 1174-1177 (2018)
8 NH3, NaOH Beaucage et al, Tetrahedron, 48 (12): 2223-2311 (1992)
페니실린-G-아미다제 Amir et al, Chem. Comm., 14: 1614-1615 (2004)
- Gisbert-Garzaran et al, Chem. Eng. J., 340: 24-31 (2018)
도 4b는 본 발명의 방법에 의해 사용하기 위한 예시적인 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트를 도시한다. 도 4b의 화학식에서, "링커"는 1 내지 4개의 탄소 알킬 등과 같은 중합효소 혼입에 적합한 임의의 적합한 링커일 수 있고; Q는 비오틴, 데스비오틴 및 비오틴 모방체일 수 있고 (예를 들어, 문헌[Liu et al, Chem. Soc. Rev., 46 (9): 2391-2403 (2017)]); "염기"는 일반적으로 아데닌, 구아닌 또는 시토신이고 (이러한 염기는 dNTP의 일부임); "차단"은 상기 기재된 바와 같을 수 있지만, 특히, 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티일 수 있거나, 메틸, 2-니트로벤질, 알릴, 아민, 아지도메틸, tert-부톡시 에톡시, 2-시아노에틸 및 프로파길로부터 선택될 수 있다.
주형-부재 중합효소
다양한 상이한 주형 부재 중합효소가 본 발명의 방법에 사용 가능하다. 주형 부재 중합효소에는 다음에 제한되는 것은 아니나, polX 계열 중합효소 (DNA 중합효소 β, λ 및 μ 포함), 폴리 (A) 중합효소 (PAP), 폴리 (U) 중합효소 (PUP), DNA 중합효소 θ 등을 포함하며, 이는 예를 들어 하기 참조문헌에 기재된 바와 같다: Ybert 등의 국제 특허 공개 WO2017/216472; Champion 등의 미국 특허 제 10435676호; Champion 등의 국제 특허 공개 WO2020/099451; 문헌[Yang et al, J. Biol. Chem., 269 (16): 11859-11868 (1994); Motea et al, Biochim. Biophys. Acta, 1804 (5): 1151-1166 (2010)]. 특히, 말단 데옥시뉴클레오티딜전이효소 (TdT) 및 그 변이체는 주형 부재 DNA 합성에 유용하다.
일부 실시양태에서, 효소적 합성 방법은 3'-O-변형 뉴클레오사이드 트리포스페이트에 대해 증가된 혼입 활성을 나타내는 TdT 변이체를 사용한다. 예를 들어, 이러한 TdT 변이체는 본 명세서에 참조로 포함된 Champion 등의 미국 특허 제 10435676호에 기재된 기술을 사용하여 생성될 수 있다. 일부 실시양태에서, 서열번호 2 내지 31 중 임의의 것의 아미노산 서열 및 표 1에 열거된 하나 이상의 치환을 갖는 TdT에 적어도 60 퍼센트 동일한 아미노산 서열을 갖는 TdT 변이체가 사용되며, TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고 (ii) 핵산 단편의 유리 3'-하이드록실에 3'-O-변형 뉴클레오타이드를 혼입할 수 있다. 일부 실시양태에서, 상기 TdT 변이체는 표 1에 열거된 모든 위치에서 치환을 포함한다. 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 80퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 90 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 95 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 97 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 98 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 99 퍼센트 동일하다. 본 명세서에 사용된 바와 같이, 참조 서열을 변이체 서열과 비교하는데 사용되는 동일성 퍼센트 값은 변이체 서열의 치환을 포함하는 명시적으로 지정된 아미노산 위치를 포함하지 않으며; 즉, 동일성 퍼센트 관계는 참조 단백질의 서열과 변이체의 치환을 포함하는 명시적으로 지정된 위치 외부의 변이체 단백질 서열 사이에 있다. 따라서, 예를 들어 참조 서열 및 변이체 서열이 각각 100개의 아미노산을 포함하고 변이체 서열이 위치 25 및 81에서 돌연변이를 갖는 경우, 상동성 퍼센트는 서열번호 1 내지 24, 26 내지 80 및 82 내지 100과 관련된다.
(ii)와 관련하여, 이러한 3'-O-변형 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트리포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트리포스페이트, 3'-O-알릴-뉴클레오사이드 트리포스페이트, 3'O― (2-니트로벤질)-뉴클레오사이드 트리포스페이트, 또는 3'-O-프로파길-뉴클레오사이드 트리포스페이트를 포함할 수 있다.
서열번호
동물
치환
1 마우스 M192R/Q C302G/R R336L/N R454P/N/A/V E457N/L/T/S/K
2 마우스 M63R/Q C173G/R R207L/N R325P/N/A/V E328N/L/T/S/K
3 M63R/Q C173G/R R207L/N R324P/N/A/V E327N/L/T/S/K
4 인간 M63R/Q C173G/R R207L/N R324P/N/A/V E327N/L/T/S/K
5 --- C172G/R R206L/N R320P/N/A/V ---
6 포섬 M63R/Q C173G/R R207L/N R331P/N/A/V E334N/L/T/S/K
7 뒤쥐 M63R/Q C173G/R R207L/N --- E328N/L/T/S/K
8 구렁이 --- C174G/R R208L/N R331P/N/A/V E334N/L/T/S/K
9 M73R/Q C173G/R R207L/N R325P/N/A/V E328N/L/T/S/K
10 두더지 M64R/Q C174G/R R208L/N --- E329N/L/T/S/K
11 토끼 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
12 고슴도치 M63R/Q C173G/R R207L/N R328P/N/A/V E331N/L/T/S/K
13 나무 두더지 --- C173G/R R207L/N R325P/N/A/V E328N/L/T/S/K
14 오리 너구리 M63R/Q C182G/R R216L/N R338P/N/A/V E341N/L/T/S/K
15 날쥐 M66R/Q C176G/R R210L/N R328P/N/A/V E331N/L/T/S/K
16 카나리아 --- C170G/R R204L/N R326P/N/A/V E329N/L/T/S/K
17 줄무늬 마나킨 --- C158G/R R192L/N R314P/N/A/V E317N/L/T/S/K
18 악어 --- --- R205L/N R327P/N/A/V E330N/L/T/S/K
19 개구리 --- --- R205L/N R324P/N/A/V E327N/L/T/S/K
20 코브라 --- --- R205L/N R327P/N/A/V E330N/L/T/S/K
21 송어 --- --- R192L/N R311P/N/A/V E314N/L/T/S/K
22 전기뱀장어 --- --- R205L/N R321P/N/A/V E325N/L/T/S/K
23 망둥어 --- --- R205L/N R322P/N/A/V E325N/L/T/S/K
24 구피 --- --- R205L/N R322P/N/A/V E325N/L/T/S/K
25 랫트 M48R/Q C158G/R R192L/N R310P/N/A/V E313N/L/T/S/K
26 랫트 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
27 콜롬부스 원숭이 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
28 돼지 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
29 호랑이 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
30 물소 M48R/Q C158G/R R192L/N R310P/N/A/V E313N/L/T/S/K
31 마멋 M61R/Q C171G/R R205L/N R323P/N/A/V E326N/L/T/S/K
일부 실시양태에서, 본 발명의 방법에 의해 사용하기 위한 추가 TdT 변이체는 표 2에 나타낸 바와 같이 메티오닌, 시스테인, 아르기닌 (제1 위치), 아르기닌 (제2 위치) 또는 글루탐산의 치환 중 하나 이상을 포함한다.
상기 기재된 바와 같은 본 발명의 TdT 변이체는 각각 표시된 치환의 존재에 따라 특정 서열번호와 서열 동일성 퍼센트를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 이러한 방식으로 기재된 본 발명의 TdT 변이체와 특정 서열번호 사이의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입으로 인한 것일 수 있고, 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시양태에서, 이러한 결실, 치환 및/또는 삽입은 천연 아미노산만을 포함한다. 일부 실시양태에서, 치환은 문헌[Grantham, Science, 185: 862-864 (1974)]에 기재된 바와 같이 보존적 또는 밀접한 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 밀접한 아미노산 세트의 구성원 사이에서만 발생할 수 있다. 일부 실시양태에서, 사용될 수 있는 밀접한 아미노산 세트가 표 3a에 제시되어 있다.
[표 3a]
밀접한 아미노산 세트 I
Figure pct00002
일부 실시양태에서, 사용될 수 있는 밀접한 아미노산 세트가 표 3b에 제시되어 있다.
[표 3b]
밀접한 아미노산 세트 II
Figure pct00003
키트
본 발명의 방법을 수행하기 위한 키트는 아미딘- 또는 아실-보호 고리외 아민 또는 염기 유사체 (이는 또한 아미딘 또는 아실-보호 고리외 아민을 가질 수 있음)를 갖는 염기를 포함하는 3'-O-보호-뉴클레오사이드 트리포스페이트 단량체를 포함할 수 있다. 일부 실시양태에서, 키트의 염기 유사체를 갖는 3'-O-보호 dNTP 단량체는 3'-O-보호-2'-데옥시-7-데아자구아노신 트리포스페이트를 포함한다.
실시예 1
3'-O-아미노-보호-2'-데옥시뉴클레오사이드 트리포스페이트의 고리외 아민의 아미딘 및 아실 보호
아미딘 및 아실 보호기를 도 2의 도식을 사용하여 3'-O-아미노-보호-2'-데옥시뉴클레오사이드 트리포스페이트에 부착할 수 있다. 3'-O-옥심 모이어티를 갖는 화합물 (200)을 본 명세서에 참조로 포함되는 Benner, 미국 특허 제 8212020호에 기재되어 있는 바와 같이 획득한다 (예를 들어, 문헌[Benner]의 화합물 3e 참조). 여기서 "B"는 아데닌, 구아닌 또는 시토신을 나타낸다. 화합물 (200)의 5'-하이드록실을 통상적인 절차를 사용하여 트리메틸실릴기에 의해 보호하여 (문헌[Ti et al, J. Amer. Chem. Soc., 104: 1316-1319 (1982); Kierzek, Nucleosides and Nucleotides, 4: 641-649 (1985)]), 화합물 (204)을 제공한다. B가 구아닌 또는 아데닌일 경우 언제나 화합물 (204)을 문헌[Vu et al, Tetrahedron Letters, 31 (50): 7269-7272 (1990)]에 의해 교시된 바와 같이 메탄올에서 N,N-디메틸포름아미드 디메틸 아세탈과 조합 (208)하여 5'-TMS-O-3'-O- (N-아세톤-옥심)-dGdmf 및 5'-TMS-O-3'-O- (N-아세톤-옥심)-dAdmf에 의해 화합물 (209)을 생성한다. B가 시토신일 경우 언제나 화합물 (204)을 문헌[Vu et al] (상기 인용)에 의해 교시된 바와 같이 이소부티르산 무수물과 조합하여 5'-TMS-O-3'-O-(N-아세톤-옥심)-dCibu를 제공한다. TMS 보호기 (210)를 제거한 후 (예를 들어, 테트라부틸암모늄 플루오라이드로 처리), 생성된 화합물을 트리포스페이트화하고 3'-O-N-아세톤-옥심기를 Benner에 의해 교시된 바와 같이 아민으로 전환시킬 수 있다.
실시예 2
3'-O-아미노-보호-N2-아세틸-2'-데옥시구아노신 트리포스페이트를 사용한 (dG) 10 의 수율 증가
이 실시예에서, (dG)10의 수율을 보호되지 않은 염기를 갖는 dGTP 단량체 및 아세틸화된 N2 질소를 갖는 dGTP 단량체를 사용하여 주형 부재 효소적 합성 후에 비교하였다. 그외에 (dG)10 올리고뉴클레오타이드를 상기 기재된 바와 같이 합성하였다. 결과를 도 3의 전기영동도에 나타내었다. 전기영동도 전개도 (300)는 비-염기 보호 3'-O-NH2-2'-데옥시구아노신 트리포스페이트를 사용한 합성 후 분리된 산물을 나타내고 전기영동도 전개도 (302)는 3'-O-NH2-N2-아세틸-2'-데옥시구아노신 트리포스페이트를 사용한 합성 후 분리된 산물을 나타낸다. 전개도 (302)에서 고분자량 산물의 지배적인 밴드 (304)는 염기 보호 단량체를 사용하여 보다 완전한 길이의 산물이 생성되었음을 보여준다.
정의
본 명세서에서 달리 구체적으로 규정되지 않는 한, 본 명세서에서 사용된 핵산 화학, 생화학, 유전학 및 분자 생물학의 용어 및 기호는 해당 분야의 표준 논문 및 텍스트를 따른다 (예를 들어, 문헌[Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992); Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975); Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999)]).
2개 이상의 상이한 TdT의 아미노산 위치와 관련하여 "기능적으로 균등한"은 (i) 각 위치의 아미노산이 TdT의 활성에서 동일한 기능적 역할을 하고, (ii) 아미노산이 각각의 TdT의 아미노산 서열에서 상동 아미노산 위치에 존재함을 의미한다. 서열 정렬 및/또는 분자 모델링을 기반으로 2개 이상의 상이한 TdT의 아미노산 서열에서 위치적으로 균등하거나 상동인 아미노산 잔기를 확인하는 것이 가능하다. 일부 실시양태에서, 기능적으로 균등인 아미노산 위치는 진화적으로 관련된 종, 예를 들어, 속, 과 등의 TdT의 아미노산 서열 중에서 보존되는 비효율 모티프에 속한다. 이러한 보존된 비효율 모티프의 예는 문헌[Motea et al, Biochim. Biophys. Acta. 1804(5): 1151-1166 (2010); Delarue et al, EMBO J., 21: 427-439 (2002)] 및 유사 참조문헌에 기재되어 있다.
"키트"는 본 발명의 시스템 또는 장치에 의해 실행되는 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 패키지와 같은 임의의 전달 시스템을 지칭한다. 일부 실시양태에서, 소모성 물질 또는 시약은 본 명세서에서 "키트"로 지칭되는 패키지로 본 발명의 시스템 또는 장치의 사용자에게 전달된다. 본 발명의 시스템 및 장치와 관련하여, 이러한 전달 시스템은 일반적으로 3'-O-보호-dNTP와 같은 물질의 저장, 수송 또는 전달을 가능하게 하는 패키징 방법 및 물질을 포함한다. 예를 들어, 키트에는 3'-O-보호-dNTP 및/또는 지원 물질을 포함하는 하나 이상의 용기 (예를 들어, 상자)가 포함될 수 있다. 이러한 내용물은 의도된 수신자에게 함께 또는 개별적으로 전달될 수 있다. 예를 들어, 제1 용기에는 보호기를 갖는 고리 외 질소가 있는 3'-O-보호-dNTP가 포함될 수 있고, 제2 용기에는 주형 부재 중합효소인 3'-O-보호-데옥시구아노신 트리포스페이트, 예를 들어, 특정 TdT 및 적절한 완충액가 포함된다.
상호 혼용되는 "돌연변이체" 또는 "변이체"는 본 명세서에 기재된 천연 또는 참조 TdT 폴리펩타이드로부터 유래되고 하나 이상의 위치에서 변형 또는 변이, 즉, 치환, 삽입 및/또는 결실을 포함하는 폴리펩타이드를 지칭한다. 변이체는 당업계에 잘 알려진 다양한 기술에 의해 획득될 수 있다. 특히, 야생형 단백질을 인코딩하는 DNA 서열을 변이시키기 위한 기술의 예는 다음에 제한되는 것은 아니나, 부위 지정 돌연변이유발, 무작위 돌연변이유발, 서열 이동 및 합성 올리고뉴클레오타이드 작제를 포함한다. 돌연변이 유발 활성은 중합효소의 발명의 경우 또는 단백질 서열의 하나 이상의 아미노산의 결실, 삽입 또는 치환으로 구성된다. 다음 용어는 치환을 지정하는데 사용된다: L238A는 참조 또는 야생형 서열의 위치 238에 있는 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경된 것을 나타낸다. A132V/I/M은 모 서열의 위치 132에 있는 아미노산 잔기 (알라닌, A)가 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 아미노산 중 하나로 치환된 것을 나타낸다. 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파라긴산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신), 소형 아미노산 (글리신, 알라닌 및 세린)의 그룹 내에서 이루어진다.
"폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"는 상호 혼용되며, 각각은 뉴클레오타이드 단량체 또는 이의 유사체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭 (Watson-Crick) 유형의 염기 쌍, 염기 적층, 후그스틴 (Hoogsteen) 또는 역 후그스틴 유형의 염기 쌍 등과 같은 일반 패턴의 단량체-단량체 상호작용을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이의 뉴클레오사이드간 연결은 자연적으로 발생하거나 이의 유사체, 예를 들어 천연 또는 비천연 유사체일 수 있다. 비-천연 유사체는 PNA, 포스포로티오에이트 뉴클레오사이드간 연결, 형광단 또는 합텐 등과 같은 표지의 부착을 가능하게 하는 연결기를 포함하는 염기를 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 중합효소에 의한 연장, 리가제에 의한 결찰 등과 같은 효소적 처리를 필요로 할 때마다, 당업자는 이러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 특정 위치 또는 일부 위치의 뉴클레오사이드간 연결, 당 모이어티 또는 염기의 특정 유사체를 포함하지 않을 것임을 이해할 것이다. 폴리뉴클레오타이드는 일반적으로 소수의 단량체 단위, 예를 들어 5 내지 40개, 일반적으로 "올리고뉴클레오타이드"로 지칭되는 경우 수천 개의 단량체 단위에서 크기가 다양하다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 일련의 문자 (대문자 또는 소문자)로 표시될 때마다 달리 지시되거나 문맥상 명백하지 않는 한 뉴클레오타이드가 왼쪽에서 오른쪽으로 5'→3' 순서이고 "A"는 데옥시아데노신을 지정하고, "C"는 데옥시시티딘을 지정하고, "G"는 데옥시구아노신을 지정하고, "T"는 티미딘을 지정하고, "I"는 데옥시이노신을 지정하고, "U"는 우리딘을 지정함이 이해될 것이다. 달리 명시되지 않는 한, 용어 및 원자 번호 지정 규칙은 문헌[Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999)]에 개시된 것을 따를 것이다. 일반적으로 폴리뉴클레오타이드는 포스포디에스테르 연결에 의해 연결된 4개의 천연 뉴클레오사이드 (예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘 또는 RNA의 경우 리보스 대응물)를 포함하지만; 이는 또한 변형된 염기, 당 또는 뉴클레오사이드간 연결을 포함하여 비천연 뉴클레오타이드 유사체를 포함할 수 있다. 효소가 활성에 대한 특정 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요구사항, 예를 들어 단일 가닥 DNA, RNA/DNA 이중체 등을 갖는 경우, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질에 대한 적절한 조성의 선택은 특히 문헌[Sambrook et al, Molecular Cloning, Second Edition (Cold Spring Harbour Laboratory, New York, 1989)] 및 유사한 참조문헌과 같은 논문 내에 기재되어 있음이 당업자에게 명백하다. 유사하게, 올리고뉴클레오타이드 및 폴리뉴클레오타이드는 단일 가닥 형태 또는 이중 가닥 형태 (즉, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 및 이의 각각의 보체의 이중체)를 지칭할 수 있다. 어떤 형태인지 또는 두 형태 모두가 용어 사용의 맥락에서 의도되었는지는 당업자에게 명백할 것이다.
"프라이머"는 폴리뉴클레오타이드 주형으로 이중체를 형성할 때 핵산 합성의 개시점으로 작용하고 주형을 따라 이의 3' 말단으로부터 연장되어 연장 이중체가 형성될 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 프라이머의 연장은 일반적으로 DNA 또는 RNA 중합효소와 같은 핵산 중합효소로 수행된다. 연장 과정에서 첨가되는 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 연장된다. 프라이머는 일반적으로 14개 내지 40개 뉴클레오타이드 범위, 또는 18개 내지 36개 뉴클레오타이드 범위의 길이를 갖는다. 프라이머는 다양한 핵산 증폭 반응, 예를 들어 단일 프라이머를 사용하는 선형 증폭 반응 또는 둘 이상의 프라이머를 사용하는 중합효소 연쇄 반응에 사용된다. 특정 적용을 위한 프라이머의 길이와 서열을 선택하기 위한 지침은 참조로 포함된 다음 참조문헌에 의해 입증된 바와 같이 당업자에게 잘 알려져 있다: 문헌[Dieffenbach, editor, PCR Primer: A Laboratory Manual, Second Edition (Cold Spring Harbor Press, New York, 2003)]).
"서열 동일성"은 2개의 폴리펩타이드 서열 또는 2개의 폴리뉴클레오타이드 서열과 같은 2개의 서열 간의 일치 (예를 들어, 동일한 아미노산 잔기)의 수 (또는 분율, 일반적으로 백분율로 표시됨)를 지칭한다. 서열 동일성은 서열 갭을 최소화하면서 중첩 및 동일성이 최대화되도록 정렬될 때 서열을 비교함으로써 결정된다. 특히, 서열 동일성은 2개의 서열의 길이에 따라 다수의 수학적 전역 또는 국부 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열을 바람직하게 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘 (예를 들어, Needleman 및 Wunsch 알고리즘, 문헌[Needleman 및 Wunsch, 1970])을 사용하여 정렬하며, 실질적으로 다른 길이의 서열을 바람직하게는 국부 정렬 알고리즘 (예를 들어 Smith와 Waterman 알고리즘 (문헌[Smith and Waterman, 1981]) 또는 Altschul 알고리즘 (문헌[Altschul et al., 1997; Altschul et al., 2005])을 사용하여 정렬한다. 아미노산 서열 동일성 퍼센트를 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/과 같은 인터넷 웹 사이트에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본 명세서의 목적을 위해, 아미노산 서열 동일성 % 값은 Needleman-Wunsch 알고리즘을 사용하여 두 서열의 최적 전역 정렬을 생성하는 이원 서열 정렬 프로그램 EMBOSS Needle을 사용하여 생성된 값을 지칭하고, 모든 검색 매개변수는 기본값으로 설정되어 있으며, 즉, 스코어링 매트릭스 = BLOSUM62, 갭 개방 = 10, 갭 연장 = 0.5, 엔드 갭 페널티 = 거짓, 엔드 갭 개방 = 10 및 엔드 갭 연장 = 0.5이다.
"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, 용어 "치환"은 천연 표준 20개 아미노산 잔기, 희귀 천연 아미노산 잔기 (예를 들어, 하이드록시프롤린, 하이드록실리신, 알로하이드록실리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라긴, 알로이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린) 및 종종 합성 제조된 비천연 아미노산 잔기 (예를 들어 사이클로헥실-알라닌))로부터 선택되는 또 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. 바람직하게는, 용어 "치환"은 천연 발생 표준 20개 아미노산 잔기로부터 선택되는 또 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. "+" 기호는 대체 조합을 나타낸다. 아미노산은 본 명세서에서 하기 명명법에 따른 1문자 또는 3문자 코드로 표시된다: A: 알라닌 (Ala); C: 시스테인 (Cys); D: 아스파르트산 (Asp); E: 글루탐산 (Glu); F: 페닐알라닌 (Phe); G: 글리신 (Gly); H: 히스티딘 (His); I: 이소류신 (Ile); K: 리신 (Lys); L: 류신 (Leu); M: 메티오닌 (Met); N: 아스파라긴 (Asn); P: 프롤린 (Pro); Q: 글루타민 (Gln); R: 아르기닌 (Arg); S: 세린 (Ser); T: 트레오닌 (Thr); V: 발린 (Val); W: 트립토판 (Trp) 및 Y: 티로신 (Tyr). 본 명세서에서는 치환을 나타내기 위해 다음의 용어를 사용한다: L238A는 모서열의 위치 238에 있는 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경된 것을 나타낸다. A132V/I/M은 모 서열의 위치 132에 있는 아미노산 잔기 (알라닌, A)가 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 아미노산 중 하나로 치환된 것을 나타낸다. 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파라긴산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신), 소형 아미노산 (글리신, 알라닌 및 세린)의 그룹 내에서 이루어진다.
본 개시내용은 제시된 특정 형태의 범위로 제한되도록 의도되지 않고, 본 명세서에 기재된 변형의 대안, 수정 및 균등물을 포함하는 것으로 의도된다. 또한, 본 개시내용의 범위는 본 개시내용과 관련하여 당업자에게 명백해질 수 있는 다른 변형을 전체적으로 포함한다. 본 발명의 범위는 첨부된 청구범위에 의해서만 제한된다.
SEQUENCE LISTING <110> DNA SCRIPT <120> INCREASING LONG-SEQUENCE YIELDS IN TEMPLATE-FREE ENZYMATIC SYNTHESIS OF POLYNUCLEOTIDES <130> B3068PC00 <160> 31 <170> PatentIn version 3.5 <210> 1 <211> 510 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TdT full length mouse <400> 1 Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro 1 5 10 15 Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe 20 25 30 Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg 35 40 45 Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu 50 55 60 Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser 65 70 75 80 Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser 85 90 95 Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly 100 105 110 Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn 115 120 125 Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala 130 135 140 Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 145 150 155 160 Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala 165 170 175 Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met 180 185 190 Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met 195 200 205 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile 210 215 220 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val 225 230 235 240 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 245 250 255 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 260 265 270 Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met 275 280 285 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 290 295 300 Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 305 310 315 320 Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 325 330 335 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 340 345 350 Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe 355 360 365 Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr 370 375 380 Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His 385 390 395 400 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His 405 410 415 Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg 420 425 430 Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu 435 440 445 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 450 455 460 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg 465 470 475 480 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 485 490 495 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 500 505 510 <210> 2 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TdT truncated mouse sequence <400> 2 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile 85 90 95 Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg 165 170 175 Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp 225 230 235 240 Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe 245 250 255 Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser 275 280 285 Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr 340 345 350 Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Bovine truncated (catalytic domain): <400> 3 Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu 20 25 30 Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser 130 135 140 Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 275 280 285 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TdT Human truncated <400> 4 Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp 275 280 285 Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 5 <211> 376 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TdT Chicken 1 truncated <400> 5 Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr 1 5 10 15 Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn 20 25 30 Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn 35 40 45 Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala 50 55 60 Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp 65 70 75 80 Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu 85 90 95 Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn 100 105 110 Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val 115 120 125 Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val 130 135 140 Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg 145 150 155 160 Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala 165 170 175 Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe 180 185 190 Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys 195 200 205 Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg 210 215 220 Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile 225 230 235 240 Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp 245 250 255 Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln 260 265 270 Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met 275 280 285 Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 290 295 300 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg 305 310 315 320 Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met 325 330 335 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu 340 345 350 Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 355 360 365 Val Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 6 <211> 387 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Possum truncated <400> 6 Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro 1 5 10 15 Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile 20 25 30 Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys 65 70 75 80 Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp 225 230 235 240 Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe 245 250 255 Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys 275 280 285 Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser 290 295 300 Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr 305 310 315 320 Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp 325 330 335 Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His 340 345 350 Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu 355 360 365 Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu 370 375 380 Arg Asn Ala 385 <210> 7 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated shrew <400> 7 Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr 130 135 140 Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp 225 230 235 240 Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp 275 280 285 Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 8 <211> 387 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Python truncated <400> 8 Glu Lys Tyr Gln Leu Pro Glu Asp Glu Asp Arg Ser Val Thr Ser Asp 1 5 10 15 Leu Asp Arg Asp Ser Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr 20 25 30 Leu Lys Asn Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala 35 40 45 Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly Phe Cys Thr Ala Phe Arg 50 55 60 Arg Ala Ala Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Gln Val 65 70 75 80 His Asp Ile Glu Gly Val Pro Trp Met Gly Lys Gln Val Lys Gly Ile 85 90 95 Ile Glu Asp Ile Ile Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val 100 105 110 Leu Asp Asn Glu Asn Tyr Arg Ser Val Lys Leu Phe Thr Ser Val Phe 115 120 125 Gly Val Gly Leu Lys Thr Ser Asp Lys Trp Tyr Arg Met Gly Leu Arg 130 135 140 Thr Leu Glu Glu Val Lys Arg Asp Lys Asn Leu Lys Leu Thr Arg Met 145 150 155 160 Gln Lys Ala Gly Phe Leu His Tyr Asp Asp Leu Thr Ser Cys Val Ser 165 170 175 Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile Val Gln Asp Val Val Trp 180 185 190 Lys Ile Val Pro Asn Ala Ile Val Thr Ile Ala Gly Gly Phe Arg Arg 195 200 205 Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly 210 215 220 Ser Lys Gln Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Ile Trp 225 230 235 240 Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe 245 250 255 Glu Asp Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Glu Asp Lys 275 280 285 Gly Asn Ser Ile Arg Ser Lys Ala Phe Ser Glu Glu Glu Ile Lys Asp 290 295 300 Trp Lys Ala Ile Arg Val Asp Leu Val Val Val Pro Phe Glu Gln Tyr 305 310 315 320 Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Thr Gln Phe Glu Arg Asp 325 330 335 Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His 340 345 350 Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Asn Ala Ala Ser Glu 355 360 365 Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu 370 375 380 Arg Asn Ala 385 <210> 9 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated dog <400> 9 Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser 325 330 335 His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC MOLE <400> 10 Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser 1 5 10 15 Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 20 25 30 Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 35 40 45 Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met 50 55 60 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met 65 70 75 80 Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val 85 90 95 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 100 105 110 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 115 120 125 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg 130 135 140 Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met 145 150 155 160 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 165 170 175 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 180 185 190 Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg 195 200 205 Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 210 215 220 Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe 225 230 235 240 Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr 245 250 255 Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp 275 280 285 Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 11 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Pika trunk <400> 11 Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val 1 5 10 15 Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu 85 90 95 Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu 210 215 220 Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg 275 280 285 Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 12 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC HEDGEHOG <400> 12 Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu 1 5 10 15 Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu 20 25 30 Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly 275 280 285 Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala 370 375 380 <210> 13 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated tree shrew <400> 13 Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg 50 55 60 Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg 65 70 75 80 Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln 145 150 155 160 Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp 225 230 235 240 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 14 <211> 394 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED PLATYPUS <400> 14 Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu 1 5 10 15 Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys 65 70 75 80 Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu 115 120 125 Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln 130 135 140 Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr 145 150 155 160 Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr 165 170 175 Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr 180 185 190 Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val 195 200 205 Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val 210 215 220 Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu 225 230 235 240 Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr 245 250 255 Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys 260 265 270 Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 275 280 285 His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser 290 295 300 Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val 305 310 315 320 Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 325 330 335 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys 340 345 350 Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile 355 360 365 Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu 370 375 380 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 385 390 <210> 15 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED JERBOA <400> 15 Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met 1 5 10 15 Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys 20 25 30 Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile 35 40 45 Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu 50 55 60 Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile 65 70 75 80 Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys 85 90 95 Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys 100 105 110 Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser 115 120 125 Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly 130 135 140 Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr 145 150 155 160 Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys 165 170 175 Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala 180 185 190 Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe 195 200 205 Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser 210 215 220 Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr 225 230 235 240 Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu 245 250 255 Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu 260 265 270 Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg 275 280 285 Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala 370 375 380 <210> 16 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt Serinus canaria (canary) <400> 16 Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala 1 5 10 15 Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile 65 70 75 80 Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile 85 90 95 Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu 100 105 110 Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val 115 120 125 Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu 130 135 140 Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly 145 150 155 160 Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala 165 170 175 Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro 180 185 190 Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile 195 200 205 Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp 210 215 220 Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu 225 230 235 240 Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu 245 250 255 Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala 260 265 270 Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr 275 280 285 Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg 340 345 350 Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 17 <211> 370 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt Neopelma chrysocephalum (saffron-crested neopelma) <400> 17 Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala 20 25 30 Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu 35 40 45 Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met 50 55 60 Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg 115 120 125 Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser 145 150 155 160 Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser 165 170 175 Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly 195 200 205 Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys 210 215 220 Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val 225 230 235 240 Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln 245 250 255 Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser 260 265 270 Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp 275 280 285 Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala 290 295 300 Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu 305 310 315 320 Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly 325 330 335 Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu 340 345 350 Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg 355 360 365 Asn Ala 370 <210> 18 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt Alligator sinensis <400> 18 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala 50 55 60 Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile 65 70 75 80 Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala 145 150 155 160 Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu 210 215 220 Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys 245 250 255 Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn 275 280 285 Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe 355 360 365 Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 19 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt Xenopus laevis <400> 19 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu 1 5 10 15 Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp 20 25 30 Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe 35 40 45 Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser 50 55 60 Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu 65 70 75 80 Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu 85 90 95 Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu 130 135 140 Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys 145 150 155 160 Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu 165 170 175 Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val 180 185 190 Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys 210 215 220 Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly 225 230 235 240 Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys 245 250 255 Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile 275 280 285 Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp 290 295 300 Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys 340 345 350 Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu 355 360 365 Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 20 <211> 383 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Notechis scutatus) tiger snake <400> 20 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn 20 25 30 Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala 50 55 60 Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile 65 70 75 80 Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp 85 90 95 Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu 130 135 140 Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu 165 170 175 Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu 180 185 190 Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln 210 215 220 Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu 225 230 235 240 Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys 245 250 255 Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe 260 265 270 Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val 275 280 285 Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile 290 295 300 Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu 305 310 315 320 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr 325 330 335 Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp 340 345 350 Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe 355 360 365 Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 21 <211> 367 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Salmo trutta) brown trout <400> 21 Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr 1 5 10 15 Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala 20 25 30 Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu 50 55 60 Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val 65 70 75 80 Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val 85 90 95 Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg 115 120 125 Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met 130 135 140 Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser 145 150 155 160 Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His 165 170 175 Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu 195 200 205 Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg 210 215 220 Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp 225 230 235 240 Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu 245 250 255 Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp 260 265 270 Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val 275 280 285 Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu 290 295 300 Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe 305 310 315 320 Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp 325 330 335 Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe 340 345 350 Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala 355 360 365 <210> 22 <211> 377 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Electrophorus electricus) electric eel <400> 22 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu 1 5 10 15 Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn 20 25 30 His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr 35 40 45 Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met 65 70 75 80 Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu 85 90 95 Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp 100 105 110 Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu 130 135 140 Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu 165 170 175 Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser 180 185 190 Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys 210 215 220 Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys 245 250 255 Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe 260 265 270 Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp 275 280 285 Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val 290 295 300 Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser 305 310 315 320 Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg 325 330 335 Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe 340 345 350 Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp 355 360 365 Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 23 <211> 378 <212> PRT <213> trunc wt (Anabas testudineus) walking fish <400> 23 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn 20 25 30 Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr 35 40 45 Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr 65 70 75 80 Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu 85 90 95 Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr 180 185 190 Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys 210 215 220 Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly 225 230 235 240 Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser 275 280 285 Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln 325 330 335 His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 24 <211> 378 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Poecilia reticulate) guppy <400> 24 Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val 1 5 10 15 Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn 20 25 30 Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr 65 70 75 80 Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu 85 90 95 Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp 100 105 110 Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser 130 135 140 Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser 145 150 155 160 Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu 165 170 175 Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr 180 185 190 Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp 195 200 205 Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys 210 215 220 Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly 225 230 235 240 Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys 245 250 255 Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe 260 265 270 Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg 275 280 285 Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val 290 295 300 Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly 305 310 315 320 Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg 325 330 335 Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu 340 345 350 Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu 355 360 365 Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala 370 375 <210> 25 <211> 366 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt short Rattus norvegicus <400> 25 Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 1 5 10 15 Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala 20 25 30 Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met 50 55 60 Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 165 170 175 Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 195 200 205 Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe 210 215 220 Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr 225 230 235 240 Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His 245 250 255 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg 260 265 270 Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg 275 280 285 Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu 290 295 300 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 305 310 315 320 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 325 330 335 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 340 345 350 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 26 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunk wt Long Rattus norvegicus <400> 26 Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu 180 185 190 Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met 195 200 205 Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln 225 230 235 240 Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys 245 250 255 Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu 275 280 285 Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 27 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Piliocolobus tephrosceles) monkey <400> 27 Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile 1 5 10 15 Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys 35 40 45 Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu 210 215 220 Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln 275 280 285 Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 28 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N27 trunc wt (Sus scrofa) pig <400> 28 Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val 1 5 10 15 Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg 225 230 235 240 Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys 245 250 255 Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met 275 280 285 Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 29 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Panthera tigris altaica) Siberian tiger <400> 29 Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val 1 5 10 15 Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp 210 215 220 Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg 225 230 235 240 Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys 275 280 285 Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 30 <211> 365 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> trunc wt (Bubalus bubalis) water buffalo <400> 30 Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr 1 5 10 15 Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 20 25 30 Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met 35 40 45 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met 50 55 60 Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val 65 70 75 80 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 85 90 95 Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe 100 105 110 Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg 115 120 125 Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met 130 135 140 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 145 150 155 160 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 165 170 175 Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg 180 185 190 Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly 195 200 205 Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 210 215 220 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 225 230 235 240 Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe 245 250 255 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser 260 265 270 Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 275 280 285 Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly 290 295 300 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr 305 310 315 320 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 325 330 335 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 340 345 350 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 355 360 365 <210> 31 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> N93or trunc wt (Marmota flaviventris) marmot <400> 31 Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val 1 5 10 15 Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu 85 90 95 Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp 100 105 110 Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser 130 135 140 Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala 145 150 155 160 Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu 210 215 220 Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys 275 280 285 Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375

Claims (23)

  1. 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, 상기 방법은
    a) 유리(free) 3'-하이드록실을 갖는 개시인자(initiator)를 제공하는 단계; 및
    b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건(elongation condition) 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편(elongated fragment)을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적(template-independent) DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단(deblocking)하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층(base stacking)을 방지하는 것으로 선택되는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 연장 조건은 적어도 하나의 3'-O-차단 뉴클레오사이드 트리포스페이트가 수소 결합을 방지하기 위해 그의 염기에 부착된 염기 보호 모이어티(moiety)를 갖는다는 것을 제공하는, 방법.
  3. 제2항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트는 이의 염기의 질소 또는 산소에 부착된 염기 보호 모이어티를 갖는, 방법.
  4. 제3항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트는 질소에 부착된 상기 염기 보호 모이어티를 갖는, 방법.
  5. 제4항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트의 상기 염기의 상기 질소는 고리외 질소(exocyclic nitrogen)인, 방법.
  6. 제5항에 있어서, 상기 염기 보호 모이어티는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 또는 데옥시시티딘 트리포스페이트의 4-질소에 부착되는, 방법.
  7. 제6항에 있어서, 상기 염기 보호 모이어티는 아실 보호기인, 방법.
  8. 제6항 또는 제7항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 아세틸, 및 이소부티릴로 이루어진 군으로부터 선택되는, 방법.
  9. 제6항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일 또는 디메틸포름아미딘이고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 아세틸 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸인, 방법.
  10. 제6항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 디메틸포름아미딘이고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸인, 방법.
  11. 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 염기 보호 모이어티는 염기 불안정성(base labile)인, 방법.
  12. 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 염기 보호 모이어티는 아미딘인, 방법.
  13. 제2항 내지 제12항 중 어느 한 항에 있어서, 상기 방법은 폴리뉴클레오타이드의 뉴클레오타이드로부터 상기 염기 보호 모이어티를 제거하는 단계를 포함하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 개시인자는 고체 지지체에 부착되는, 방법.
  15. 제2항 내지 제14항 중 어느 한 항에 있어서, 상기 개시인자는 염기 절단 가능한 뉴클레오사이드를 포함하고, 상기 염기 보호 모이어티는 염기 불안정성이고, 상기 제거 단계는 염기 보호 모이어티 및 염기 절단 가능한 뉴클레오사이드가 동일한 반응으로 절단되도록 염기를 갖는 상기 폴리뉴클레오타이드를 처리하는 단계를 포함하는, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 연장 조건은 변성제(denaturation agent)를 포함하는, 방법.
  17. 제16항에 있어서, 상기 변성제는 물의 유전 상수보다 더 작은 유전 상수를 갖는 수혼화성 용매 및 카오트로픽제 (chaotropic agent)로 이루어진 군으로부터 선택되는, 방법.
  18. 제16항 또는 제17항에 있어서, 상기 변성제는 포름아미드, 구아니딘, 살리실산나트륨, 디메틸 술폭사이드 (DMSO), 프로필렌 글리콜, 및 요소로 이루어진 군으로부터 선택되는, 방법.
  19. 제2항 내지 제18항 중 어느 한 항에 있어서, 상기 3'-O-보호기는 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길로 이루어진 군으로부터 선택되는, 방법.
  20. 제19항에 있어서, 상기 3'-O-보호기는 아지도메틸인, 방법.
  21. 제19항에 있어서, 상기 3'-O-보호기는 아민인, 방법.
  22. 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, 본 방법은
    a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계;
    b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층을 방지하는 것으로 선택되고; 최종 사이클은 단지 단계 (i)만을 포함하고, 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트는 포획(capture) 모이어티를 포함하는 염기 보호 모이어티를 포함하는 단계;
    c) 포획 모이어티의 보체(complement)로 폴리뉴클레오타이드를 포획하는 단계
    를 포함하는, 방법.
  23. 제22항에 있어서, 상기 포획된 폴리뉴클레오타이드를 탈차단하는 단계를 추가로 포함하는, 방법.
KR1020227006178A 2019-08-01 2020-07-28 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 KR20220052938A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19189639.8 2019-08-01
EP19189639 2019-08-01
EP19200740 2019-10-01
EP19200740.9 2019-10-01
PCT/EP2020/071316 WO2021018921A1 (en) 2019-08-01 2020-07-28 Increasing long-sequence yields in template-free enzymatic synthesis of polynucleotides.

Publications (1)

Publication Number Publication Date
KR20220052938A true KR20220052938A (ko) 2022-04-28

Family

ID=71741810

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227006178A KR20220052938A (ko) 2019-08-01 2020-07-28 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가

Country Status (9)

Country Link
US (1) US20220403435A1 (ko)
EP (1) EP4007816A1 (ko)
JP (1) JP2022543568A (ko)
KR (1) KR20220052938A (ko)
CN (1) CN114430778A (ko)
AU (1) AU2020319661A1 (ko)
CA (1) CA3145912A1 (ko)
IL (1) IL290199A (ko)
WO (1) WO2021018921A1 (ko)

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
DE3529478A1 (de) 1985-08-16 1987-02-19 Boehringer Mannheim Gmbh 7-desaza-2'desoxyguanosin-nukleotide, verfahren zu deren herstellung und deren verwendung zur nukleinsaeure-sequenzierung
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5436143A (en) 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
AU689924B2 (en) 1994-06-23 1998-04-09 Affymax Technologies N.V. Photolabile compounds and methods for their use
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5830655A (en) 1995-05-22 1998-11-03 Sri International Oligonucleotide sizing using cleavable primers
US5700642A (en) 1995-05-22 1997-12-23 Sri International Oligonucleotide sizing using immobilized cleavable primers
EP1632496A1 (en) 1998-06-22 2006-03-08 Affymetrix, Inc. Reagents and methods for solid phase synthesis and display
JP2002538790A (ja) 1999-03-08 2002-11-19 プロトジーン・ラボラトリーズ・インコーポレーテッド 長いdna配列を経済的に合成し、そして組み立てるための方法および組成物
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
CA2491925A1 (en) 2002-07-08 2004-01-15 Shell Canada Limited Choke for controlling the flow of drilling mud
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
US8212020B2 (en) 2005-03-11 2012-07-03 Steven Albert Benner Reagents for reversibly terminating primer extension
US7544794B1 (en) 2005-03-11 2009-06-09 Steven Albert Benner Method for sequencing DNA and RNA by synthesis
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
FR3020071B1 (fr) 2014-04-17 2017-12-22 Dna Script Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede
GB201502152D0 (en) * 2015-02-10 2015-03-25 Nuclera Nucleics Ltd Novel use
FR3052462A1 (fr) 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
WO2018175436A1 (en) * 2017-03-21 2018-09-27 Molecular Assemblies, Inc. Nucleic acid synthesis using dna polymerase theta
WO2019051250A1 (en) 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION
US10435676B2 (en) 2018-01-08 2019-10-08 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
WO2020099451A1 (en) 2018-11-14 2020-05-22 Dna Script Terminal deoxynucleotidyl transferase variants and uses thereof
CA3122494A1 (en) * 2018-12-13 2020-06-18 Dna Script Direct oligonucleotide synthesis on cells and biomolecules
EP3906317A1 (en) * 2019-01-03 2021-11-10 DNA Script One pot synthesis of sets of oligonucleotides

Also Published As

Publication number Publication date
CN114430778A (zh) 2022-05-03
US20220403435A1 (en) 2022-12-22
EP4007816A1 (en) 2022-06-08
AU2020319661A1 (en) 2022-02-24
CA3145912A1 (en) 2021-02-04
JP2022543568A (ja) 2022-10-13
IL290199A (en) 2022-03-01
WO2021018921A1 (en) 2021-02-04

Similar Documents

Publication Publication Date Title
CN113423840B (zh) 多核苷酸无模板酶促合成中有效的产物裂解
CN113302289A (zh) 末端脱氧核苷酸转移酶变体及其用途
CA3161087A1 (en) Chimeric terminal deoxynucleotidyl transferases for template-free enzymatic synthesis of polynucleotides
CN113272442A (zh) 寡核苷酸的集合的一锅合成
KR20220052938A (ko) 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가
US20240052391A1 (en) Enzymatic Synthesis of Polynucleotide Probes
KR20230002825A (ko) 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도
US20220411840A1 (en) High Efficiency Template-Free Enzymatic Synthesis of Polynucleotides
JP2024511874A (ja) G4を形成しやすいポリヌクレオチドの酵素合成のための方法及びキット

Legal Events

Date Code Title Description
A201 Request for examination