KR20220052938A - 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 - Google Patents
폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 Download PDFInfo
- Publication number
- KR20220052938A KR20220052938A KR1020227006178A KR20227006178A KR20220052938A KR 20220052938 A KR20220052938 A KR 20220052938A KR 1020227006178 A KR1020227006178 A KR 1020227006178A KR 20227006178 A KR20227006178 A KR 20227006178A KR 20220052938 A KR20220052938 A KR 20220052938A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- glu
- lys
- ala
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1264—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07031—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase
Abstract
본 발명은 다음에 제한되는 것은 아니나, 가닥내 및 가닥간 이중체, G-사중체 등을 포함하는 DNA 2차 구조의 형성을 억제하는 사슬 연장 조건을 사용하여 폴리뉴클레오타이드의 주형 부재 효소적 합성을 위한 방법 및 키트에 관한 것이다. 일부 실시양태에서, 이러한 사슬 연장 조건은 합성되는 폴리뉴클레오타이드에서 수소 결합의 형성을 억제하는 보호기 또는 염기 유사체를 기본으로 하는 3'-O-차단 dNTP 단량체를 사용하는 것을 포함한다.
Description
최근 합성생물학, CRISPR-Cas9 적용, 고처리량 시퀀싱과 같은 많은 분야에서 합성 폴리뉴클레오타이드에 대한 수요 증가뿐만 아니라, 유기 용매의 사용 및 필요한 폐기 및 산물 길이에 대한 상한과 같은 폴리뉴클레오타이드 합성에 대한 접근법의 한계로 인해 폴리뉴클레오타이드 합성에 대한 효소적 접근에 대한 관심이 증가하고 있다 (문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)]). 효소적 합성은 특이성과 효율성, 온건한 수성 반응 조건이 필요하기 때문에 매력적이다.
현재, 대부분의 효소적 접근법은 적절한 서열의 폴리뉴클레오타이드가 획득될 때까지 지지체에 부착된 단일 가닥 개시인자(initiator) 또는 연장 가닥에 3'-O-차단 뉴클레오사이드 트리포스페이트를 반복적으로 첨가한 후 탈차단(deblocking)하기 위해 주형 부재 중합효소를 사용한다. 이러한 방법의 목적은 구조가 천연 대응물과 구별할 수 없는 긴 합성 핵산을 제공하는 것이다. 그러나, 폴리뉴클레오타이드 길이가 증가함에 따라, 예를 들어, 가닥내 또는 가닥간 이중체와 같은 2차 구조 형성 가능성이 증가하고, 그 결과 합성 시약이 반응 부위에 대한 접근을 상실하고 산물 수율이 저하된다.
상기 관점에서, 적절한 폴리뉴클레오타이드 산물의 수율을 감소시키는 2차 구조의 형성을 감소시키는 방법이 이용 가능하다면 폴리뉴클레오타이드의 주형 부재 효소적 합성이 진보될 것이다.
본 발명은 합성 동안 2차 구조의 형성을 감소시킬 목적으로 염기 유사체 및 염기 보호 모이어티(moiety)를 사용하는 폴리뉴클레오타이드의 주형 부재 효소적 합성 방법에 관한 것이다. 일 양상에서, 이러한 방법은 아데닌, 시토신 및 구아닌의 고리외 아민에 부착된 염기 보호 모이어티를 사용한다. 다른 양상에서, 이러한 염기 보호 모이어티는 또한 포획(capture) 모이어티, 뉴클레아제 차단제, 리포터 등과 같은 추가 기능을 제공하는 모이어티를 포함할 수 있다. 예를 들어, 비오틴과 같은 포획 모이어티는 탈보호 전에 합성 후 폴리뉴클레오타이드를 포획하는데 사용될 수 있다.
일부 실시양태에서, 본 발명은 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, a) 유리(free) 3'-하이드록실을 갖는 개시인자를 제공하는 단계; b) 폴리뉴클레오타이드가 완료될 때까지, (i) 연장 조건(elongation condition) 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편(elongated fragment)을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적(template-independent) DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층(base stacking)을 방지하는 것으로 선택되는 단계를 포함하는 방법에 관한 것이다. 일부 실시양태에서, 분자내 또는 분자간 수소 결합을 방지하기 위해 선택되는 조건은 보호기가 수소 결합에 관여하지 못하도록 하는 염기 보호 모이어티를 갖는 3'-O-차단 뉴클레오사이드 트리포스페이트 단량체를 제공하는 것을 포함한다. 특히, 상기 연장 조건은 적어도 하나의 3'-O-차단 뉴클레오사이드 트리포스페이트가 수소 결합을 방지하기 위해 그의 염기, 바람직하게는 이의 염기의 질소 또는 산소, 더욱 바람직하게는 질소에 부착된 염기 보호 모이어티를 갖는 것을 제공할 수 있다. 상기 3'-O-차단 뉴클레오사이드 트리포스페이트의 상기 염기의 상기 질소는 고리외 질소(exocyclic nitrogen)일 수 있다. 일부 특정 실시양태에서, 상기 염기 보호 모이어티는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 또는 데옥시시티딘 트리포스페이트의 4-질소에 부착될 수 있다. 상기 염기 보호 모이어티는 아실 보호기일 수 있다. 특히, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택될 수 있고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택될 수 있고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 아세틸, 및 이소부티릴로 이루어진 군으로부터 선택될 수 있다. 대안적으로, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일 또는 디메틸포름아미딘, 바람직하게는 디메틸포름아미딘일 수 있고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 아세틸 또는 디메틸포름아미딘, 바람직하게는 디메틸포름아미딘일 수 있고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸일 수 있다. 일부 실시양태에서, 염기 보호 모이어티는 염기 불안정성(base labile)일 수 있고, 특히, 아미딘일 수 있다. 본 방법은 폴리뉴클레오타이드의 뉴클레오타이드로부터 상기 염기 보호 모이어티를 제거하는 단계를 포함할 수 있다. 개시인자는 고체 지지체에 부착될 수 있다. 일부 특정 실시양태에서, 상기 개시인자는 염기 절단 가능한 뉴클레오사이드를 포함하고, 상기 염기 보호 모이어티는 염기 불안정성 및 상기 제거 단계는 상기 폴리뉴클레오타이드를 염기로 처리하여, 염기 보호 모이어티 및 염기 절단 가능한 뉴클레오사이드가 동일한 반응에서 절단되도록 하는 단계를 포함한다. 일부 실시양태에서, 분자내 또는 분자간 수소 결합을 방지하기 위해 선택되는 조건은 바람직하게는 물 및 카오트로픽제 (chaotropic agent) 이하의 유전 상수를 갖는 수혼화성 용매로 이루어진 군으로부터 선택되고, 더욱 특히, 포름아미드, 구아니딘, 살리실산나트륨, 디메틸 술폭사이드 (DMSO), 프로필렌 글리콜, 및 요소로부터 선택되는 변성제(denaturation agent)의 존재를 포함할 수 있다. 바람직하게는, 상기 3'-O-보호기는 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길로 이루어진 군으로부터 선택될 수 있다. 더욱 바람직하게는, 상기 3'-O-보호기는 아지도메틸 또는 아민이다. 염기 보호 모이어티가 사용되는 경우, 합성이 완료된 후, 본 발명의 방법은 최종 산물의 뉴클레오타이드로부터 염기 보호 모이어티를 제거하는 추가 단계를 포함할 수 있다.
일부 실시양태에서, 본 발명은 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층을 방지하는 것으로 선택되고; 최종 사이클은 단지 단계 (i)만을 포함하고, 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트는 포획 모이어티를 포함하는 염기 보호 모이어티를 포함하는 단계; c) 포획 모이어티의 보체(complement)로 폴리뉴클레오타이드를 포획하는 단계를 포함하는 방법에 관한 것이다. 상기 방법은 상기 포획된 폴리뉴클레오타이드를 탈차단하는 단계를 추가로 포함할 수 있다.
도 1a는 폴리뉴클레오타이드의 주형 부재 효소적 합성 방법을 도식적으로 도시한다.
도 1b는 합성 시약이 성장하는 사슬에 접근하는 것을 억제하는 형성될 수 있는 2차 구조의 유형을 도식적으로 도시한다.
도 2는 염기 보호된 3'-O-아미노-2'-데옥시뉴클레오사이드 트리포스페이트의 부류를 합성하기 위한 도식을 나타낸다.
도 3은 3'-O-NH2-N2-아세실-2'-데옥시구아노신 트리포스페이트를 포함하는 단량체를 사용하여 합성할 때 (dG)10의 증가된 수율을 나타내는 데이터를 나타낸다.
도 4a 및 도 4b는 모이어티를 포획하는 것과 같은 추가 기능을 갖는 모이어티를 포함하는 예시적인 염기 보호 모이어티를 도시한다.
도 1b는 합성 시약이 성장하는 사슬에 접근하는 것을 억제하는 형성될 수 있는 2차 구조의 유형을 도식적으로 도시한다.
도 2는 염기 보호된 3'-O-아미노-2'-데옥시뉴클레오사이드 트리포스페이트의 부류를 합성하기 위한 도식을 나타낸다.
도 3은 3'-O-NH2-N2-아세실-2'-데옥시구아노신 트리포스페이트를 포함하는 단량체를 사용하여 합성할 때 (dG)10의 증가된 수율을 나타내는 데이터를 나타낸다.
도 4a 및 도 4b는 모이어티를 포획하는 것과 같은 추가 기능을 갖는 모이어티를 포함하는 예시적인 염기 보호 모이어티를 도시한다.
본 발명의 일반 원리는 특히 도면에 도시되고 상세하게 설명된 것과 같은 예를 통해 본 명세서에서 더욱 상세하게 개시된다. 그러나, 기재된 특정 실시양태로 본 발명을 제한하려는 의도가 아님을 이해해야 한다. 본 발명은 다양한 변형 및 대안적인 형태를 수용할 수 있으며, 그 세부사항은 다수의 실시양태에 대해 제시되어 있다. 본 발명의 원리 및 범위에 속하는 모든 변형, 균등물 및 대안을 포괄하는 것으로 의되된다.
본 발명의 실시는 달리 지시되지 않는 한, 당해 분야의 기술 내에 있는 유기 화학, 분자 생물학 (재조합 기술 포함), 세포 생물학 및 생화학에 대한 통상적인 기술 및 설명을 사용할 수 있다. 이러한 통상적인 기술은 다음에 제한되는 것은 아니나, 합성 펩타이드, 합성 폴리뉴클레오타이드, 단일 클론 항체의 제조 및 사용, 핵산 클로닝, 증폭, 시퀀싱 및 분석, 및 관련 기술을 포함할 수 있다. 이러한 통상의 기술에 대한 프로토콜은 제조업체의 산물 문헌 및 문헌[Genome Analysis: A Laboratory Manual Series (Vols. I-IV); PCR Primer: A Laboratory Manual; and Molecular Cloning: A Laboratory Manual (all from Cold Spring Harbor Laboratory Press); Lutz and Bornscheuer, Editors, Protein Engineering Handbook (Wiley-VCH, 2009); Hermanson, Bioconjugate Techniques, Second Edition (Academic Press, 2008)] 등과 같은 표준 실험실 매뉴얼에서 찾을 수 있다.
본 발명은 예를 들어 수소 결합, 염기 적층 등에 의해 야기되는 성장 사슬에서 2차 구조의 형성을 억제하는 합성 조건을 제공함으로써 긴 폴리뉴클레오타이드의 더 높은 수율을 가능하게 하는 폴리뉴클레오타이드, 특히 DNA의 주형 부재 효소적 합성에 대한 개선에 관한 것이다. 특정 이론이나 가설에 결부시키고자 하는 것은 아니나, 이러한 2차 구조의 형성은 주형 부재 중합효소와 같은 합성 시약에 대한 접근을 제한하여 사슬 연장을 억제하고 산물 길이의 가변성을 증가시키는 것으로 고려된다. 부분적으로, 본 발명은 산물 수율에 대한 이러한 2차 구조의 부정적인 영향이 예를 들어, 더 높은 반응 온도를 포함하는 연장 조건을 선택함으로써, 예를 들어, 열에 안정한 주형 부재 중합효소의 사용; 변성제의 존재 하; 및 수소 결합을 방지하기 위해 고리외 아민과 같은 기에 부착된 염기 유사체 또는 염기 보호 모이어티를 갖는 단량체의 사용에 의해 완화되거나 억제될 수 있다는 인식 및 이해에 기반한다.
일부 실시양태에서, 본 발명은 예를 들어, 수소 결합을 방지함으로써 2차 구조의 형성을 방지할 뿐만 아니라, 엑소뉴클레아제 활성을 차단하거나 리포터 기로서 작용하거나, 포획 모이어티로 작용하는 등의 모이어티와 같은 추가의 기능을 제공하는 염기 보호 모이어티의 사용을 포함한다. 예를 들어, 염기 보호 모이어티는 폴리뉴클레오타이드 산물의 간단한 단리를 가능하게 하는 분자 포획 모이어티를 포함할 수 있으며, 이는 결과적으로 산물에 비천연 부가물 또는 "잔류물"을 남기지 않고 탈보호에 의해 방출될 수 있다.
주형-부재 효소적 합성
일반적으로, 주형 부재 (또는 균등하게, "주형 독립적") 효소적 DNA 합성 방법은 도 1a에 예시된 것과 같은 단계의 반복 사이클를 포함하며, 소정의 뉴클레오타이드는 각 사이클에 개시인자 또는 성장 사슬에 연결된다. 주형 부재 효소적 합성의 일반적인 요소는 다음 참조문헌에 기재되어 있다: Ybert 등의 국제 특허 공개 WO/2015/159023; Ybert 등의 국제 특허 공개 WO/2017/216472; Hyman, 미국 특허 제 5436143호; Hiatt 등의 미국 특허 제 5763594호; 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018); Mathews et al, Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f (2016); Schmitz et al, Organic Lett., 1 (11): 1729-1731 (1999)].
개시인자 폴리뉴클레오타이드 (100)는, 예를 들어 유리 3'-하이드록실기 (103)를 갖는 고체 지지체 (102)에 부착되어 제공된다. 개시인자 폴리뉴클레오타이드 (100) (또는 연장 개시인자 폴리뉴클레오타이드)의 3' 말단에 3'-O-보호-dNTP의 효소적 혼입에 효과적인 조건 (104) 하에 개시인자 폴리뉴클레오타이드 (100) (또는 후속 사이클의 연장 개시인자 폴리뉴클레오타이드)에 3'-O-보호-dNTP 및 TdT 또는 이의 변이체와 같은 주형 부재 중합효소가 첨가된다 (예를 들어, Ybert 등의 WO/2017 /216472; Champion 등의 WO2019/135007). (뉴클레오타이드 단량체의 기와 관련하여 "보호된" 및 "차단된"이라는 용어와 그 균등예는 상호 혼용 가능하고 동의어로 사용됨). 이 반응은 3'-하이드록실이 보호되는 연장 개시인자 폴리뉴클레오타이드를 생성한다 (106). 연장 개시인자 폴리뉴클레오타이드가 보체 서열을 포함하는 경우, 3'-O-보호기가 제거되거나 탈보호될 수 있고, 적절한 서열이 원래 개시인자 폴리뉴클레오타이드로부터 절단될 수 있다. 이러한 절단은 다양한 단일 가닥 절단 기술 중 임의의 것을 사용하여, 예를 들어 원래 개시인자 폴리뉴클레오타이드 내의 소정의 위치에 절단 가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단 가능한 뉴클레오타이드는 우라실 DNA 글리코실라제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 연장 개시인자 폴리뉴클레오타이드가 보체 서열을 포함하지 않는 경우, 3'-O-보호기가 제거되어 유리 3'-하이드록실 (103)이 노출되고 연장 개시인자 폴리뉴클레오타이드가 뉴클레오타이드 첨가 및 탈보호의 또 다른 사이클에 적용된다.
본 명세서에 사용되는 바와 같이, "개시인자" (또는 "개시 단편", "개시인자 핵산", "개시인자 올리고뉴클레오타이드" 등과 같은 균등 용어)는 일반적으로 TdT와 같은 주형 부재 중합효소에 의해 더 연장될 수 있는 유리 3' 말단을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭한다. 일 실시양태에서, 개시 단편은 DNA 개시 단편이다. 대안적인 실시양태에서, 개시 단편은 RNA 개시 단편이다. 일부 실시양태에서, 개시 단편은 3 내지 100개의 뉴클레오타이드, 특히 3 내지 20개의 뉴클레오타이드를 보유한다. 일부 실시양태에서, 개시 단편은 단일 가닥이다. 대안적인 실시양태에서, 개시 단편은 이중 가닥이다. 일부 실시양태에서, 개시인자는 TdT가 3'-O-보호 dNTP를 연결할 수 있는 유리 하이드록실을 갖는 비핵산 화합물을 포함할 수 있다 (예를 들어, Baiga, 미국 특허 공개 US2019/0078065 및 US2019/0078126).
합성이 완료된 후, 적절한 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드는 절단에 의해 개시인자 및 고체 지지체로부터 방출될 수 있다. 다양한 절단 가능한 연결 또는 절단 가능한 뉴클레오타이드가 이러한 목적을 위해 사용될 수 있다. 일부 실시양태에서, 적절한 폴리뉴클레오타이드를 절단하면 절단된 가닥에 천연 유리 5'-하이드록실이 유지되고; 그러나 대안적인 실시양태에서, 절단 단계는 모이어티 예를 들어, 5'-포스페이트를 유지시킬 수 있으며, 이는 후속 단계에서 포스파타제 처리로 제거될 수 있다. 절단 단계는 화학적, 열적, 효소적 또는 광화학적 방법에 의해 수행될 수 있다. 일부 실시양태에서, 절단 가능한 뉴클레오타이드는 특정 글리코실라제 (예를 들어, 각각 우라실 데옥시글리코실라제, 다음 엔도뉴클레아제 VIII, 및 8-옥소구아닌 DNA 글리코실라제)에 의해 인식되는 뉴클레오타이드 유사체, 예컨대 데옥시우리딘 또는 8-옥소-데옥시구아노신일 수 있다. 일부 실시양태에서, 절단은 개시인자에 데옥시이노신을 말단에서 두 번째 3' 뉴클레오타이드로 제공함으로써 달성될 수 있으며, 이는 개시인자의 3' 말단에서 엔도뉴클레아제 V에 의해 절단되어 방출된 폴리뉴클레오타이드 상에 5'-포스페이트를 유지시킬 수 있다. 단일 가닥 폴리뉴클레오타이드를 절단하는 추가 방법은 참조로 포함되는 하기 참조문헌에 개시되어 있다: 미국 특허 제 5,739,386호, 제 5,700,642호 및 제 5,830,655호; 및 미국 특허 공개 제 2003/0186226호 및 제 2004/0106728호; 및 Urdea 및 Horn, 미국 특허 제 5367066호.
일부 실시양태에서, 글리코실라제 및/또는 엔도뉴클레아제에 의한 절단은 이중 가닥 DNA 기질이 필요할 수 있다.
도 1a로 돌아가서, 일부 실시양태에서, 뉴클레오타이드의 정렬된 서열은 각 합성 단계에서 3'-O-보호 dNTP의 존재 하에 TdT와 같은 주형 부재 중합효소를 사용하여 개시인자 핵산에 연결된다. 일부 실시양태에서, 올리고뉴클레오타이드 합성 방법은 (a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; (b) 연장 조건 하에 유리 3'-하이드록실을 갖는 개시인자 또는 연장 중간체를 3'-O-보호 뉴클레오사이드 트리포스페이트의 존재 하에 주형 부재 중합효소와 반응시켜 3'-O-보호 연장 중간체를 생성하는 단계; (c) 연장 중간체를 탈보호하여 유리 3'-하이드록실을 갖는 연장 중간체를 생성하는 단계; 및 (d) 폴리뉴클레오타이드가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 포함한다. (때때로 "연장 중간체"와 "연장 단편"이라는 용어는 상호 혼용되고 동의어로 사용됨). 일부 실시양태에서, 개시인자는 예를 들어 그의 5' 말단에 의해 고형 지지체에 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 탈보호 단계 후뿐만 아니라, 반응 또는 연장 단계 후 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는 예를 들어 소정의 인큐베이션 기간 또는 반응 시간 후 세척에 의해 혼입되지 않은 뉴클레오사이드 트리포스페이트를 제거하는 하위 단계를 포함할 수 있다. 이러한 소정의 인큐베이션 기간 또는 반응 시간은 수 초, 예를 들어 30초 내지 수 분, 예를 들어 30분일 수 있다.
도 1b에 도시된 바와 같이, 합성 지지체 (122) 상의 폴리뉴클레오타이드 서열이 역보체 하위서열, 예를 들어, (124) 및 (126)을 포함하는 경우, 2차 분자내 (128) 또는 분자간 (130) 구조는 역보체 영역 사이의 수소 결합 형성에 의해 생성될 수 있다. 본 발명의 일 양상에서, 고리외 아민에 대한 염기 보호 모이어티는 보호된 질소의 수소가 수소 결합에 관여할 수 없도록 선택되어 도 1b에 도시된 것과 같은 2차 구조의 형성을 방지한다. 즉, 본 발명의 일 양상에서, 염기 보호 모이어티는 예를 들어 뉴클레오사이드 A와 T 사이 및 G와 C 사이에서 정상적인 염기 쌍으로 형성되는 것과 같은 수소 결합의 형성을 방지하는 것으로 선택된다. 합성의 경우, 염기 보호 모이어티가 제거될 수 있고 폴리뉴클레오타이드 산물은 예를 들어 개시인자로부터 절단함으로써 고체 지지체로부터 절단될 수 있다.
염기가 보호되지 않은 3'-O-차단 dNTP는 상업적 공급업체로부터 구입하거나 공개된 기술을 사용하여 합성될 수 있다 (예를 들어 미국 특허 제 7057026호; 문헌[Guo et al, Proc. Natl. Acad. Sci., 105 (27): 9145-9150 (2008)]; Benner, 미국 특허 제 7544794호 및 제 8212020호; 국제 특허 공개 WO2004/005667, WO91/06678; 문헌[Canard et al, Gene (본 명세서에 인용됨); Metzker et al, Nucleic Acids Research, 22: 4259-4267 (1994); Meng et al, J. Org. Chem., 14: 3248-3252 (3006)]; 미국 특허 공개 제 2005/037991호. 염기가 보호된 3'-O-차단 dNTP는 아래 기재된 대로 합성될 수 있다.
염기-보호 dNTP가 사용되는 경우, 도 1a의 상기 방법은 (e) 염기 보호 모이어티를 제거하는 단계를 추가로 포함할 수 있으며, 이는 아실 또는 아미딘 보호기의 경우에 (예를 들어) 농축된 암모니아로 처리하는 단계를 포함할 수 있다.
상기 방법은 또한 캡핑 단계 (들)뿐만 아니라, 반응 또는 연장 단계 후 및 탈보호 단계 후에 세척 단계를 포함할 수 있다. 상기 언급된 바와 같이, 일부 실시양태에서, 비연장 유리 3'-하이드록실이 캡핑된 가닥의 임의의 추가 연장을 방지하는 화합물과 반응하는 캡핑 단계가 포함될 수 있다. 일부 실시양태에서, 이러한 화합물은 디데옥시뉴클레오사이드 트리포스페이트일 수 있다. 다른 실시양태에서, 유리 3'-하이드록실을 갖는 비연장 가닥은 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리함으로써 분해될 수 있다. 예를 들어, Hyman, 미국 특허 제 5436143호를 참조한다. 유사하게, 일부 실시양태에서, 탈차단되지 않은 가닥은 가닥을 제거하거나 추가 연장에 대해 불활성이 되도록 처리될 수 있다.
일부 실시양태에서, 연장 또는 연장 단계를 위한 반응 조건은 다음을 포함할 수 있다: 2.0 μM 정제 TdT; 125 내지 600 μM 3'-O-차단 dNTP (예를 들어, 3'-O-NH2-차단 dNTP); 약 10 내지 약 500 mM 칼륨 카코딜레이트 완충액 (pH 6.5 내지 7.5) 및 약 0.01 내지 약 10 mM의 2가 양이온 (예를 들어, CoC12 또는 MnC12), 연장 반응은 실온 내지 45℃ 내의 온도에서 3분 동안 50 μL 반응 부피에서 수행될 수 있다. 3'-O-차단 dNTP가 3'-O-NH2-차단 dNTP인 실시양태에서, 탈차단 단계를 위한 반응 조건은 다음을 포함할 수 있다: 700 mM NaNO2; 1 M 아세트산나트륨 (아세트산으로 pH 4.8 내지 6.5 범위로 조정), 탈차단 반응은 실온 내지 45℃ 내의 온도에서 30초 내지 수 분 동안 50 μL 부피에서 수행될 수 있다.
특정 적용에 따라, 탈차단 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건, 예를 들어, 빛, 열, pH, 특정 화학 결합을 절단할 수 있는 효소와 같은 특정 시약의 존재를 포함할 수 있다. 3'-O-차단기 및 해당하는 탈차단 조건 선택에 대한 지침은 참조로 포함되는 Benner, 미국 특허 7544794 및 8212020; 미국 특허 5808045; 미국 특허 8808988; 국제 특허 공개 WO91/06678 및 하기에 언급된 참조문헌과 같은 참조문헌에서 찾을 수 있다. 일부 실시양태에서, 절단제 (때때로 탈차단 시약 또는 제제로도 지칭됨)는 예를 들어 디티오트레이톨 (DTT)과 같은 화학적 절단제이다. 대안적인 실시양태에서, 절단제는 3'-포스페이트 차단기를 절단할 수 있는 예를 들어 포스파타제와 같은 효소적 절단제일 수 있다. 탈차단제의 선택은 사용된 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다중 차단기가 사용되는지, 개시인자가 생존 세포 또는 유기체 또는 간단한 처리가 필요한 고체 지지체에 부착되는지 등에 좌우됨을 당업자는 이해할 것이다. 예를 들어, 트리스(2-카복시에틸)포스핀 (TCEP)과 같은 포스핀을 사용하여 3'O-아지도메틸기를 절단할 수 있고, 팔라듐 착물을 사용하여 3'O-알릴기를 절단할 수 있으며, 아질산나트륨을 사용하여 3'O-아미노기를 절단할 수 있다. 특정 실시양태에서, 절단 반응은 TCEP, 팔라듐 착물 또는 아질산나트륨을 포함한다.
위에서 언급한 바와 같이, 일부 실시양태에서, 직교 탈차단 조건을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직하다. 하기 예시적인 차단기 쌍은 병렬 합성 실시양태에서 사용될 수 있다. 다른 차단기 쌍, 또는 둘 이상을 포함하는 기가 본 발명의 이러한 실시양태에서 사용하기 위해 이용가능할 수 있음이 이해된다.
생존 세포에서 올리고뉴클레오타이드를 합성하려면 약한 탈차단 또는 탈보호 조건, 즉 세포막을 파괴하지 않거나, 단백질을 변성시키거나 주요 세포 기능을 방해하지 않는 등의 조건이 필요하다. 일부 실시양태에서, 탈보호 조건은 세포 생존에 적합할 수 있는 생리학적 조건의 범위 내이다. 이러한 실시양태에서, 효소적 탈보호는 생리학적 조건 하에서 수행될 수 있기 때문에 바람직하다. 일부 실시양태에서 특정 효소적으로 제거 가능한 차단기는 이의 제거를 위한 특정 효소와 결합된다. 예를 들어, 에스테르 또는 아실 기반 차단기는 아세틸에스테라아제와 같은 에스테라아제 또는 유사 효소로 제거할 수 있고, 포스페이트 차단기는 T4 폴리뉴클레오타이드 키나아제와 같은 3' 포스파타아제로 제거할 수 있다. 예를 들어, 3'-O-포스페이트는 100 mM Tris-HCl (pH 6.5) 10 mM MgCl2, 5 mM 2-머캅토에탄올, 및 하나의 단위 T4 폴리뉴클레오타이드 키나제의 용액으로 처리하여 제거할 수 있다. 반응은 37℃의 온도에서 1분간 진행된다.
"3'-포스페이트-차단" 또는 "3'-포스페이트-보호" 뉴클레오타이드는 3'-위치의 하이드록실기가 모이어티를 포함하는 포스페이트의 존재에 의해 차단된 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트 차단 뉴클레오타이드의 예는 뉴클레오타이드-3'-포스페이트 모노에스테르/뉴클레오타이드-2',3'-사이클릭 포스페이트, 뉴클레오타이드-2'-포스페이트 모노에스테르 및 뉴클레오타이드-2' 또는 3'-알킬포스페이트 디에스테르 및 뉴클레오타이드-2' 또는 3'-피로포스페이트이다. 티오포스페이트 또는 이러한 화합물의 다른 유사체가 또한 사용될 수 있으며, 단, 치환이 포스파타제에 의한 유리 3'-OH를 생성하는 탈인산화를 방지하지 않아야 한다.
3'-O-에스테르-보호 dNTP 또는 3'-O-포스페이트-보호 dNTP의 합성 및 효소적 탈보호의 추가 예는 하기 참조문헌에 기재되어 있다: 문헌[Canard et al, Proc. Natl. Acad. Sci., 92:10859-10863 (1995); Canard et al, Gene, 148: 1-6 (1994); Cameron et al, Biochemistry, 16(23): 5120-5126 (1977); Rasolonjatovo et al, Nucleosides & Nucleotides, 18(4&5): 1021-1022 (1999); Ferrero et al, Monatshefte fur Chemie, 131: 585-616 (2000); Taunton-Rigby et al, J. Org. Chem., 38(5): 977-985 (1973); Uemura et al, Tetrahedron Lett., 30(29): 3819-3820 (1989); Becker et al, J. Biol. Chem., 242(5): 936-950 (1967)]; Tsien, 국제 특허 공개 WO1991/006678.
일부 실시양태에서, 변형된 뉴클레오타이드는 퓨린 또는 피리미딘 염기 및 이에 공유결합에 의해 부착된 제거 가능한 3'-OH 차단기를 갖는 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함하여, 3' 탄소 원자는 다음 구조의 기를 연결하였다:
-O-Z
상기 식에서, -Z는 -C (R')2-O-R", -C (R')2-N (R")2, -C (R')2-N (H)R", -C (R')2-S-R" 및 -C (R')2-F 중 임의의 것이고, 각각의 R"는 제거 가능한 보호기이거나 그 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도기, 또는 연결기를 통해 부착된 검출 가능한 표지이고; 단, 일부 실시양태에서 이러한 치환기는 10개 이하의 탄소 원자 및/또는 5개 이하의 산소 또는 질소 헤테로원자를 가지거나; 또는 (R')2는 화학식 =C(R"')2의 기를 나타내고, 각각의 R"'는 동일하거나 상이할 수 있고 수소 및 할로겐 원자 및 알킬 기를 포함하는 군으로부터 선택되고, 단 일부 실시양태에서 각각의 R'''의 알킬은 1 내지 3개의 탄소 원자를 갖고; 분자는 반응하여 각 R"이 H로 교체되거나, Z가 - (R')2-F인 경우 F가 OH, SH 또는 NH2, 바람직하게는 OH로 교체된 중간체를 생성할 수 있고, 중간체는 수성 조건 하에 해리되어 유리 3'-OH를 갖는 분자를 제공하고; 단, Z가 -C(R')2-S-R"인 경우, 두 R' 기 모두 H가 아니다. 특정 실시양태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이며, 단, 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정 실시양태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')2-N3이다. 특정 실시양태에서, Z는 아지도메틸기이다.
일부 실시양태에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티이다. 일부 실시양태에서, Z는 200 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 50 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시양태에서, Z는 200 이하의 분자량을 갖는 효소적으로 절단 가능한 에스테르 기이다. 다른 실시양태에서, Z는 3'-포스파타제에 의해 제거 가능한 포스페이트 기이다. 일부 실시양태에서, 다음 3'-포스파타제 중 하나 이상이 제조업체의 권장 프로토콜에 의해 사용될 수 있다: T4 폴리뉴클레오타이드 키나제, 송아지 장 알칼리 포스파타제, 재조합 새우 알칼리 포스파타제 (예를 들어, New England Biolabs, Beverly, MA).
추가 실시양태에서, 3'-차단 뉴클레오타이드 트리포스페이트는 3'-O-아지도메틸, 3'-O-NH2 또는 3'-O-알릴기에 의해 차단된다.
또 다른 실시양태에서, 본 발명의 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길을 포함한다.
일부 실시양태에서, 3'-O-보호기는 전기화학적으로 불안정한 기이다. 즉, 보호기의 탈보호 또는 절단은 절단을 초래하는 보호기 부근의 전기화학적 조건을 변화시킴으로써 달성된다. 전기화학적 조건의 이러한 변화는 전압차 또는 빛과 같은 물리량을 변화시키거나 적용하여 결과적으로 보호기 부위에서 전기화학적 조건의 변화, 예컨대 pH의 증가 또는 감소를 야기하여 보조 종을 활성화함으로써 야기될 수 있다. 일부 실시양태에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 소정의 값으로 변화될 때마다 절단되는 pH-감응성 보호기를 포함한다. 다른 실시양태에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변화될 때마다, 예를 들어 보호기 부위에서 전압차를 증가 또는 감소시킴으로써 직접 절단되는 보호기를 포함한다.
염기 보호기
폴리뉴클레오타이드 사슬 연장 과정에서 2차 구조의 형성을 감소 또는 제거하기 위해 다양한 보호기 (또는 균등하게 "염기 보호 모이어티")가 사용될 수 있다. 일반적으로 염기 보호기를 제거하는 조건은 3'-O-차단기를 제거하는 조건과 상반한다. 특히, 3'-O-차단기에 대한 제거 또는 탈차단 조건이 산성인 경우 염기 보호기는 염기 불안정성이 되도록 선택될 수 있다. 이러한 상황에서 산 불안정성 5'-O-트리틸 보호 단량체의 사용으로 인해 포스포라미다이트 합성 화학에서 많은 염기 불안정성 보호기가 개발되었다 (예를 들어, 문헌[Beaucage 및 Iyer, Tetrahedron Letters, 48 (12): 2223-2311 (1992)]). 특히, 포스포라미다이트 화학을 위한 아실 및 아미딘 보호기는 본 발명의 실시양태에서 적용 가능하다 (예를 들어, Beaucage 및 Iyer (상기 인용)의 표 2 및 표 3의 보호기). 일부 실시양태에서, 염기 보호기는 Beaucage 및 Iyer (상기 인용)의 표 2에 기재된 바와 같이 아미딘이다. 일반적으로, 염기 보호 3'-O-차단 뉴클레오사이드 트리포스페이트 단량체는 하기 실시예에 기재된 것과 같이 문헌에 기재된 방법의 통상적인 변형에 의해 합성될 수 있다.
일부 실시양태에서, 염기 보호기는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 및/또는 데옥시시티딘 트리포스페이트의 4-질소에 부착된다. 일부 실시양태에서, 염기 보호기는 표시된 질소 모두에 부착된다. 일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 펜옥시아세틸 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 벤조일, 프탈로일, 아세틸 및 이소부티릴로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 보호기는 벤조일이고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 이소부트릴 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시양태에서, 데옥시아데노신 트리포스페이트의 6-질소에 부착된 염기 보호기는 펜옥시아세틸이고; 데옥시구아노신 트리포스페이트의 2-질소에 부착된 염기 보호기는 4-이소프로필-펜옥시아세틸 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 4-질소에 부착된 염기 보호기는 아세틸이다.
일부 실시양태에서, 염기 보호 모이어티는 제거되고 (즉, 산물이 탈보호됨) 산물이 동일한 반응에서 고체 지지체로부터 절단된다. 예를 들어, 개시인자는 염기-불안정성 염기 보호 모이어티를 동시에 제거하는 1 M KOH 또는 유사 시약 (암모니아, 수산화암모늄, NaOH 등)으로 처리하여 절단되어 폴리뉴클레오타이드 산물을 방출할 수 있는 리보-우리딘을 포함할 수 있다.
연장 조건의 추가 변형
염기 보호기를 갖는 3'-O-차단 dNTP 단량체를 제공하는 것 외에도, 열적으로 안정한 주형 부재 중합효소를 사용하여 더 높은 온도에서 연장 반응을 수행할 수 있다. 예를 들어, 40℃ 이상에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소를 사용할 수 있거나, 일부 실시양태에서, 40 내지 85℃ 범위에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소가 사용될 수 있거나; 일부 실시양태에서, 40 내지 65℃ 범위에서 활성을 갖는 열적으로 안정한 주형 부재 중합효소가 사용될 수 있다.
일부 실시양태에서, 연장 조건은 수소 결합 또는 염기 적층을 억제하는 연장 반응 혼합물에 용매를 첨가하는 것을 포함할 수 있다. 이러한 용매는 디메틸 술폭사이드 (DMSO), 메탄올 등과 같은 낮은 유전 상수를 갖는 수혼화성 용매를 포함한다. 마찬가지로, 일부 실시양태에서, 연장 조건은 다음에 제한되는 것은 아니나, n-부탄올, 에탄올, 염화구아니디늄, 과염소산리튬, 아세트산리튬, 염화마그네슘, 페놀, 2-프로판올, 나트륨 도데실 술페이트, 티오우레아, 우레아 등을 포함하는 카오트로픽제의 제공을 포함할 수 있다. 일부 실시양태에서, 연장 조건은 2차 구조 억제량의 DMSO의 존재를 포함한다. 일부 실시양태에서, 연장 조건은 2차 구조의 형성을 억제하는 DNA 결합 단백질의 제공을 포함할 수 있으며, 이러한 단백질은 다음에 제한되는 것은 아니나, 단일 가닥 결합 단백질, 헬리카제, DNA 글리콜라제 등을 포함한다.
염기 유사체
일부 실시양태에서, 예를 들어, G-사중체와 같이 염기 유사체를 포함하는 3'-O-보호-뉴클레오사이드 트리포스페이트 단량체가 특정 2차 구조를 파괴하여 실패 서열 생성 가능성을 증가시키기 위해 사용될 수 있다. 많은 경우에 염기 유사체의 존재는 합성 산물에 적용 가능하며; 즉, 프라이머의 뉴클레오타이드에 염기 유사체의 존재는 중합효소 연쇄 반응 (PCR) 분석에 적용 가능할 수 있다. 일부 실시양태에서, G-사중체 구조를 형성할 수 있는 합성될 폴리뉴클레오타이드 내의 구아노신 (G)의 관의 존재 하에, 관 내의 G 중 하나 이상이 데옥시이노신 및/또는 7-데아자-2'-데옥시구아노신으로 치환되어 합성 동안 G-사중체의 형성을 방지할 수 있다. 일부 실시양태에서, 폴리뉴클레오타이드 내의 G 관의 G는 단지 7-데아자-2'-데옥시구아노신으로 치환된다. 일부 실시양태에서, 7-데아자-2'-데옥시구아노신으로 치환된 G의 수가 폴리뉴클레오타이드 산물의 용융 온도를 적용 가능할 수 없는 정도로 낮추는 경우, 치환에 사용된 유사체의 비율은 8-아자-7-데아자구아노신을 포함할 수 있다. G-사중체 구조는 사용 가능한 알고리즘을 사용하여 예측할 수 있다 (문헌[Lombardi et al, Nucleic Acids Research, 48 (1): 1-15 (2020)] 및 유사 참조문헌). 3'-O-보호 뉴클레오사이드 유사체의 트리포스페이트 단량체는 문헌, 예를 들어, 상기 언급된 문헌 및 Seela, 미국 특허 제 5990303호의 기술에 따라 합성할 수 있다. 일부 실시양태에서, G 관은 25% 초과의 G, 또는 30% 초과 G, 또는 40% 초과 G를 포함하는 폴리뉴클레오타이드에서 4개 초과 뉴클레오타이드의 서열 절편이다. 다른 실시양태에서, G 관은 모티프 G3+N1-7G3+N1-7G3+N1-7G3+에 해당하는 서열 절편이고, "N"은 임의의 뉴클레오타이드이고 "3+"는 연속된 3개 이상의 G를 의미한다. 일부 실시양태에서, 7-데아자-구아노신으로 대체된 G의 수는 관내 G의 1 내지 100%, 또는 관내 G의 1 내지 50%, 또는 관내 G의 1 내지 25% 또는 관내 G의 1 내지 10%일 수 있다. 일부 실시양태에서, 이러한 치환 백분율은 치환을 위해 G 관 내의 특정 G를 선택함으로써 달성될 수 있거나, 이러한 치환 백분율은 합성되는 폴리뉴클레오타이드의 G관 내의 하나 이상의 G의 첨가 단계에서 G 및 7-데아자-G의 혼합물을 사용함으로써 통계적으로 달성될 수 있다.
일부 실시양태에서, G 관을 갖는 폴리뉴클레오타이드를 합성하기 위한 상기 방법은 하기 단계에 의해 실행될 수 있다: a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계; 및 b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계, 폴리뉴클레오타이드의 G 관 내의 적어도 하나의 G는 이노신 또는 7-데아자구아노신으로 치환된다. 폴리뉴클레오타이드가 폴리데옥시뉴클레오타이드일 경우 언제나 G 관의 적어도 하나의 G는 데옥시이노신 또는 7-데아자-2'-데옥시구아노신으로 치환된다. 일부 실시양태에서, 폴리뉴클레오타이드가 DNA일 경우 언제나 G 관의 적어도 하나의 G는 7-데아자-2'-데옥시구아노신으로 치환된다.
추가 기능을 갖는 염기 보호 모이어티
일부 실시양태에서, 모이어티 포획, 리포터 기, 엑소뉴클레아제 차단기 등과 같은 추가 기능을 포함하는 염기 보호 모이어티가 선택될 수 있다. 리포터 기는 형광 염료, 질량 표지, 전기화학적 표지 등을 포함할 수 있다. 일부 실시양태에서, 염기 보호 모이어티는 실패 서열로부터 전장 폴리뉴클레오타이드를 분리하거나 농축시키는데 사용될 수 있는 포획 모이어티를 포함할 수 있다. 예를 들어, 일부 실시양태에서, 이러한 염기 보호 모이어티는 dNTP 첨가의 최종 사이클에 사용될 수 있고, 그 다음 합성 지지체로부터 산물의 방출 또는 절단 후, 산물은 포획 조건 하에 포획 모이어티의 보체를 포함하는 지지체에 노출되어 (즉, 포획 단계가 실행됨), 따라서 포획 모이어티를 갖는 폴리뉴클레오타이드가 이를 갖지 않는 것과 분리될 수 있고, 이로써 전장의 폴리뉴클레오타이드 산물의 농축 집합을 생성할 수 있다. 선택적인 세척 단계를 수행할 수 있으며, 그 후 절단 또는 탈보호 단계를 수행하여 전장 폴리뉴클레오타이드가 농축된 산물을 방출할 수 있다. 상기와 같이, 포획 모이어티로 보호 모이어티를 탈보호하거나 제거하면 천연 폴리뉴클레오타이드 산물, 즉 임의의 비천연 부가물이 없는 고리외 아민을 갖는 폴리뉴클레오타이드 산물, 또는 보호 모이어티의 잔류물이 생성된다.
일부 실시양태에서, 모이어티를 보호하는 이러한 염기는 도 4a에서 "Q"로 지정된 추가 기능을 갖는 모이어티에 연결된 아실 보호기이다. Q는 비오틴, 리포터 기, 뉴클레아제 차단기 등과 같은 포획 모이어티를 나타낼 수 있다. 일부 실시양태에서, Q는 캡처 모이어티를 나타낸다. 포획 모이어티에는 알돌 반응, 딜스-알더 (Diels-Alder) 반응, 프리델-크래프트 (Friedel-Crafts) 반응, 알킨 복분해, 고리화첨가, 붕소산 축합 등과 같은 포획 단계에서 공유 결합을 형성하는 기가 포함될 수 있고 (예를 들어, 문헌[Jin et al, Chem. Soc. Rev., 42: 6634 (2013)]에서 검토됨), 포획 단계에서 항체에 의해 포획된 비공유 결합을 형성하는 기, 예를 들어 스트렙타비딘, 플루오레세인, 디니트로페놀, 디곡시게닌 등에 의해 포획된 비오틴이 포함될 수 있다. 도 4a는 포획 모이어티를 포함하는 예시적인 염기 보호 모이어티를 제공하고 하기 표 1은 본 발명에 의한 이의 사용에 대한 정보를 제공한다.
도 4a의 화학식 | 탈보호 조건 |
참조문헌 |
1 | DTT 또는 TCEP | Aissi et al, European Journal of Medicinal Chemistry, 120: 304-312 (2016) |
2 | TCEP | |
3 | >pH 8 | Cowell et al, ChemBioChem Comm., 18: 1688-1691 (2017) |
4 | 아릴 포스핀 | Lukasak et al, Scientific Reports, 9: 1470 (2019) |
5 | 리파제 | Sauerbrei et al, Angew. Chem. Int., 37 (8): 1143-1146 (1998) |
6 | 테트라진 | Neumann et al, ChemBioChem, 18: 91-95 (2017) |
7 | 빛 | Liang et al, Org. Lett., 18 (5): 1174-1177 (2018) |
8 | NH3, NaOH | Beaucage et al, Tetrahedron, 48 (12): 2223-2311 (1992) |
페니실린-G-아미다제 | Amir et al, Chem. Comm., 14: 1614-1615 (2004) | |
- | 빛 | Gisbert-Garzaran et al, Chem. Eng. J., 340: 24-31 (2018) |
도 4b는 본 발명의 방법에 의해 사용하기 위한 예시적인 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트를 도시한다. 도 4b의 화학식에서, "링커"는 1 내지 4개의 탄소 알킬 등과 같은 중합효소 혼입에 적합한 임의의 적합한 링커일 수 있고; Q는 비오틴, 데스비오틴 및 비오틴 모방체일 수 있고 (예를 들어, 문헌[Liu et al, Chem. Soc. Rev., 46 (9): 2391-2403 (2017)]); "염기"는 일반적으로 아데닌, 구아닌 또는 시토신이고 (이러한 염기는 dNTP의 일부임); "차단"은 상기 기재된 바와 같을 수 있지만, 특히, 100 이하의 분자량을 갖는 헤테로원자를 포함하거나 포함하지 않는 절단 가능한 유기 모이어티일 수 있거나, 메틸, 2-니트로벤질, 알릴, 아민, 아지도메틸, tert-부톡시 에톡시, 2-시아노에틸 및 프로파길로부터 선택될 수 있다.
주형-부재 중합효소
다양한 상이한 주형 부재 중합효소가 본 발명의 방법에 사용 가능하다. 주형 부재 중합효소에는 다음에 제한되는 것은 아니나, polX 계열 중합효소 (DNA 중합효소 β, λ 및 μ 포함), 폴리 (A) 중합효소 (PAP), 폴리 (U) 중합효소 (PUP), DNA 중합효소 θ 등을 포함하며, 이는 예를 들어 하기 참조문헌에 기재된 바와 같다: Ybert 등의 국제 특허 공개 WO2017/216472; Champion 등의 미국 특허 제 10435676호; Champion 등의 국제 특허 공개 WO2020/099451; 문헌[Yang et al, J. Biol. Chem., 269 (16): 11859-11868 (1994); Motea et al, Biochim. Biophys. Acta, 1804 (5): 1151-1166 (2010)]. 특히, 말단 데옥시뉴클레오티딜전이효소 (TdT) 및 그 변이체는 주형 부재 DNA 합성에 유용하다.
일부 실시양태에서, 효소적 합성 방법은 3'-O-변형 뉴클레오사이드 트리포스페이트에 대해 증가된 혼입 활성을 나타내는 TdT 변이체를 사용한다. 예를 들어, 이러한 TdT 변이체는 본 명세서에 참조로 포함된 Champion 등의 미국 특허 제 10435676호에 기재된 기술을 사용하여 생성될 수 있다. 일부 실시양태에서, 서열번호 2 내지 31 중 임의의 것의 아미노산 서열 및 표 1에 열거된 하나 이상의 치환을 갖는 TdT에 적어도 60 퍼센트 동일한 아미노산 서열을 갖는 TdT 변이체가 사용되며, TdT 변이체는 (i) 주형 없이 핵산 단편을 합성할 수 있고 (ii) 핵산 단편의 유리 3'-하이드록실에 3'-O-변형 뉴클레오타이드를 혼입할 수 있다. 일부 실시양태에서, 상기 TdT 변이체는 표 1에 열거된 모든 위치에서 치환을 포함한다. 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 80퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 90 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 표시된 서열번호에 적어도 95 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 97 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 98 퍼센트 동일하고; 일부 실시양태에서, 상기 동일성 퍼센트 값은 적어도 99 퍼센트 동일하다. 본 명세서에 사용된 바와 같이, 참조 서열을 변이체 서열과 비교하는데 사용되는 동일성 퍼센트 값은 변이체 서열의 치환을 포함하는 명시적으로 지정된 아미노산 위치를 포함하지 않으며; 즉, 동일성 퍼센트 관계는 참조 단백질의 서열과 변이체의 치환을 포함하는 명시적으로 지정된 위치 외부의 변이체 단백질 서열 사이에 있다. 따라서, 예를 들어 참조 서열 및 변이체 서열이 각각 100개의 아미노산을 포함하고 변이체 서열이 위치 25 및 81에서 돌연변이를 갖는 경우, 상동성 퍼센트는 서열번호 1 내지 24, 26 내지 80 및 82 내지 100과 관련된다.
(ii)와 관련하여, 이러한 3'-O-변형 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트리포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트리포스페이트, 3'-O-알릴-뉴클레오사이드 트리포스페이트, 3'O― (2-니트로벤질)-뉴클레오사이드 트리포스페이트, 또는 3'-O-프로파길-뉴클레오사이드 트리포스페이트를 포함할 수 있다.
서열번호 | 동물 |
치환 | ||||
1 | 마우스 | M192R/Q | C302G/R | R336L/N | R454P/N/A/V | E457N/L/T/S/K |
2 | 마우스 | M63R/Q | C173G/R | R207L/N | R325P/N/A/V | E328N/L/T/S/K |
3 | 소 | M63R/Q | C173G/R | R207L/N | R324P/N/A/V | E327N/L/T/S/K |
4 | 인간 | M63R/Q | C173G/R | R207L/N | R324P/N/A/V | E327N/L/T/S/K |
5 | 닭 | --- | C172G/R | R206L/N | R320P/N/A/V | --- |
6 | 포섬 | M63R/Q | C173G/R | R207L/N | R331P/N/A/V | E334N/L/T/S/K |
7 | 뒤쥐 | M63R/Q | C173G/R | R207L/N | --- | E328N/L/T/S/K |
8 | 구렁이 | --- | C174G/R | R208L/N | R331P/N/A/V | E334N/L/T/S/K |
9 | 개 | M73R/Q | C173G/R | R207L/N | R325P/N/A/V | E328N/L/T/S/K |
10 | 두더지 | M64R/Q | C174G/R | R208L/N | --- | E329N/L/T/S/K |
11 | 토끼 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
12 | 고슴도치 | M63R/Q | C173G/R | R207L/N | R328P/N/A/V | E331N/L/T/S/K |
13 | 나무 두더지 | --- | C173G/R | R207L/N | R325P/N/A/V | E328N/L/T/S/K |
14 | 오리 너구리 | M63R/Q | C182G/R | R216L/N | R338P/N/A/V | E341N/L/T/S/K |
15 | 날쥐 | M66R/Q | C176G/R | R210L/N | R328P/N/A/V | E331N/L/T/S/K |
16 | 카나리아 | --- | C170G/R | R204L/N | R326P/N/A/V | E329N/L/T/S/K |
17 | 줄무늬 마나킨 | --- | C158G/R | R192L/N | R314P/N/A/V | E317N/L/T/S/K |
18 | 악어 | --- | --- | R205L/N | R327P/N/A/V | E330N/L/T/S/K |
19 | 개구리 | --- | --- | R205L/N | R324P/N/A/V | E327N/L/T/S/K |
20 | 코브라 | --- | --- | R205L/N | R327P/N/A/V | E330N/L/T/S/K |
21 | 송어 | --- | --- | R192L/N | R311P/N/A/V | E314N/L/T/S/K |
22 | 전기뱀장어 | --- | --- | R205L/N | R321P/N/A/V | E325N/L/T/S/K |
23 | 망둥어 | --- | --- | R205L/N | R322P/N/A/V | E325N/L/T/S/K |
24 | 구피 | --- | --- | R205L/N | R322P/N/A/V | E325N/L/T/S/K |
25 | 랫트 | M48R/Q | C158G/R | R192L/N | R310P/N/A/V | E313N/L/T/S/K |
26 | 랫트 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
27 | 콜롬부스 원숭이 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
28 | 돼지 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
29 | 호랑이 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
30 | 물소 | M48R/Q | C158G/R | R192L/N | R310P/N/A/V | E313N/L/T/S/K |
31 | 마멋 | M61R/Q | C171G/R | R205L/N | R323P/N/A/V | E326N/L/T/S/K |
일부 실시양태에서, 본 발명의 방법에 의해 사용하기 위한 추가 TdT 변이체는 표 2에 나타낸 바와 같이 메티오닌, 시스테인, 아르기닌 (제1 위치), 아르기닌 (제2 위치) 또는 글루탐산의 치환 중 하나 이상을 포함한다.
상기 기재된 바와 같은 본 발명의 TdT 변이체는 각각 표시된 치환의 존재에 따라 특정 서열번호와 서열 동일성 퍼센트를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 이러한 방식으로 기재된 본 발명의 TdT 변이체와 특정 서열번호 사이의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입으로 인한 것일 수 있고, 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시양태에서, 이러한 결실, 치환 및/또는 삽입은 천연 아미노산만을 포함한다. 일부 실시양태에서, 치환은 문헌[Grantham, Science, 185: 862-864 (1974)]에 기재된 바와 같이 보존적 또는 밀접한 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 밀접한 아미노산 세트의 구성원 사이에서만 발생할 수 있다. 일부 실시양태에서, 사용될 수 있는 밀접한 아미노산 세트가 표 3a에 제시되어 있다.
[표 3a]
밀접한 아미노산 세트 I
일부 실시양태에서, 사용될 수 있는 밀접한 아미노산 세트가 표 3b에 제시되어 있다.
[표 3b]
밀접한 아미노산 세트 II
키트
본 발명의 방법을 수행하기 위한 키트는 아미딘- 또는 아실-보호 고리외 아민 또는 염기 유사체 (이는 또한 아미딘 또는 아실-보호 고리외 아민을 가질 수 있음)를 갖는 염기를 포함하는 3'-O-보호-뉴클레오사이드 트리포스페이트 단량체를 포함할 수 있다. 일부 실시양태에서, 키트의 염기 유사체를 갖는 3'-O-보호 dNTP 단량체는 3'-O-보호-2'-데옥시-7-데아자구아노신 트리포스페이트를 포함한다.
실시예 1
3'-O-아미노-보호-2'-데옥시뉴클레오사이드 트리포스페이트의 고리외 아민의 아미딘 및 아실 보호
아미딘 및 아실 보호기를 도 2의 도식을 사용하여 3'-O-아미노-보호-2'-데옥시뉴클레오사이드 트리포스페이트에 부착할 수 있다. 3'-O-옥심 모이어티를 갖는 화합물 (200)을 본 명세서에 참조로 포함되는 Benner, 미국 특허 제 8212020호에 기재되어 있는 바와 같이 획득한다 (예를 들어, 문헌[Benner]의 화합물 3e 참조). 여기서 "B"는 아데닌, 구아닌 또는 시토신을 나타낸다. 화합물 (200)의 5'-하이드록실을 통상적인 절차를 사용하여 트리메틸실릴기에 의해 보호하여 (문헌[Ti et al, J. Amer. Chem. Soc., 104: 1316-1319 (1982); Kierzek, Nucleosides and Nucleotides, 4: 641-649 (1985)]), 화합물 (204)을 제공한다. B가 구아닌 또는 아데닌일 경우 언제나 화합물 (204)을 문헌[Vu et al, Tetrahedron Letters, 31 (50): 7269-7272 (1990)]에 의해 교시된 바와 같이 메탄올에서 N,N-디메틸포름아미드 디메틸 아세탈과 조합 (208)하여 5'-TMS-O-3'-O- (N-아세톤-옥심)-dGdmf 및 5'-TMS-O-3'-O- (N-아세톤-옥심)-dAdmf에 의해 화합물 (209)을 생성한다. B가 시토신일 경우 언제나 화합물 (204)을 문헌[Vu et al] (상기 인용)에 의해 교시된 바와 같이 이소부티르산 무수물과 조합하여 5'-TMS-O-3'-O-(N-아세톤-옥심)-dCibu를 제공한다. TMS 보호기 (210)를 제거한 후 (예를 들어, 테트라부틸암모늄 플루오라이드로 처리), 생성된 화합물을 트리포스페이트화하고 3'-O-N-아세톤-옥심기를 Benner에 의해 교시된 바와 같이 아민으로 전환시킬 수 있다.
실시예 2
3'-O-아미노-보호-N2-아세틸-2'-데옥시구아노신 트리포스페이트를 사용한 (dG)
10
의 수율 증가
이 실시예에서, (dG)10의 수율을 보호되지 않은 염기를 갖는 dGTP 단량체 및 아세틸화된 N2 질소를 갖는 dGTP 단량체를 사용하여 주형 부재 효소적 합성 후에 비교하였다. 그외에 (dG)10 올리고뉴클레오타이드를 상기 기재된 바와 같이 합성하였다. 결과를 도 3의 전기영동도에 나타내었다. 전기영동도 전개도 (300)는 비-염기 보호 3'-O-NH2-2'-데옥시구아노신 트리포스페이트를 사용한 합성 후 분리된 산물을 나타내고 전기영동도 전개도 (302)는 3'-O-NH2-N2-아세틸-2'-데옥시구아노신 트리포스페이트를 사용한 합성 후 분리된 산물을 나타낸다. 전개도 (302)에서 고분자량 산물의 지배적인 밴드 (304)는 염기 보호 단량체를 사용하여 보다 완전한 길이의 산물이 생성되었음을 보여준다.
정의
본 명세서에서 달리 구체적으로 규정되지 않는 한, 본 명세서에서 사용된 핵산 화학, 생화학, 유전학 및 분자 생물학의 용어 및 기호는 해당 분야의 표준 논문 및 텍스트를 따른다 (예를 들어, 문헌[Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992); Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975); Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999)]).
2개 이상의 상이한 TdT의 아미노산 위치와 관련하여 "기능적으로 균등한"은 (i) 각 위치의 아미노산이 TdT의 활성에서 동일한 기능적 역할을 하고, (ii) 아미노산이 각각의 TdT의 아미노산 서열에서 상동 아미노산 위치에 존재함을 의미한다. 서열 정렬 및/또는 분자 모델링을 기반으로 2개 이상의 상이한 TdT의 아미노산 서열에서 위치적으로 균등하거나 상동인 아미노산 잔기를 확인하는 것이 가능하다. 일부 실시양태에서, 기능적으로 균등인 아미노산 위치는 진화적으로 관련된 종, 예를 들어, 속, 과 등의 TdT의 아미노산 서열 중에서 보존되는 비효율 모티프에 속한다. 이러한 보존된 비효율 모티프의 예는 문헌[Motea et al, Biochim. Biophys. Acta. 1804(5): 1151-1166 (2010); Delarue et al, EMBO J., 21: 427-439 (2002)] 및 유사 참조문헌에 기재되어 있다.
"키트"는 본 발명의 시스템 또는 장치에 의해 실행되는 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 패키지와 같은 임의의 전달 시스템을 지칭한다. 일부 실시양태에서, 소모성 물질 또는 시약은 본 명세서에서 "키트"로 지칭되는 패키지로 본 발명의 시스템 또는 장치의 사용자에게 전달된다. 본 발명의 시스템 및 장치와 관련하여, 이러한 전달 시스템은 일반적으로 3'-O-보호-dNTP와 같은 물질의 저장, 수송 또는 전달을 가능하게 하는 패키징 방법 및 물질을 포함한다. 예를 들어, 키트에는 3'-O-보호-dNTP 및/또는 지원 물질을 포함하는 하나 이상의 용기 (예를 들어, 상자)가 포함될 수 있다. 이러한 내용물은 의도된 수신자에게 함께 또는 개별적으로 전달될 수 있다. 예를 들어, 제1 용기에는 보호기를 갖는 고리 외 질소가 있는 3'-O-보호-dNTP가 포함될 수 있고, 제2 용기에는 주형 부재 중합효소인 3'-O-보호-데옥시구아노신 트리포스페이트, 예를 들어, 특정 TdT 및 적절한 완충액가 포함된다.
상호 혼용되는 "돌연변이체" 또는 "변이체"는 본 명세서에 기재된 천연 또는 참조 TdT 폴리펩타이드로부터 유래되고 하나 이상의 위치에서 변형 또는 변이, 즉, 치환, 삽입 및/또는 결실을 포함하는 폴리펩타이드를 지칭한다. 변이체는 당업계에 잘 알려진 다양한 기술에 의해 획득될 수 있다. 특히, 야생형 단백질을 인코딩하는 DNA 서열을 변이시키기 위한 기술의 예는 다음에 제한되는 것은 아니나, 부위 지정 돌연변이유발, 무작위 돌연변이유발, 서열 이동 및 합성 올리고뉴클레오타이드 작제를 포함한다. 돌연변이 유발 활성은 중합효소의 발명의 경우 또는 단백질 서열의 하나 이상의 아미노산의 결실, 삽입 또는 치환으로 구성된다. 다음 용어는 치환을 지정하는데 사용된다: L238A는 참조 또는 야생형 서열의 위치 238에 있는 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경된 것을 나타낸다. A132V/I/M은 모 서열의 위치 132에 있는 아미노산 잔기 (알라닌, A)가 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 아미노산 중 하나로 치환된 것을 나타낸다. 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파라긴산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신), 소형 아미노산 (글리신, 알라닌 및 세린)의 그룹 내에서 이루어진다.
"폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"는 상호 혼용되며, 각각은 뉴클레오타이드 단량체 또는 이의 유사체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭 (Watson-Crick) 유형의 염기 쌍, 염기 적층, 후그스틴 (Hoogsteen) 또는 역 후그스틴 유형의 염기 쌍 등과 같은 일반 패턴의 단량체-단량체 상호작용을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이의 뉴클레오사이드간 연결은 자연적으로 발생하거나 이의 유사체, 예를 들어 천연 또는 비천연 유사체일 수 있다. 비-천연 유사체는 PNA, 포스포로티오에이트 뉴클레오사이드간 연결, 형광단 또는 합텐 등과 같은 표지의 부착을 가능하게 하는 연결기를 포함하는 염기를 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 중합효소에 의한 연장, 리가제에 의한 결찰 등과 같은 효소적 처리를 필요로 할 때마다, 당업자는 이러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 특정 위치 또는 일부 위치의 뉴클레오사이드간 연결, 당 모이어티 또는 염기의 특정 유사체를 포함하지 않을 것임을 이해할 것이다. 폴리뉴클레오타이드는 일반적으로 소수의 단량체 단위, 예를 들어 5 내지 40개, 일반적으로 "올리고뉴클레오타이드"로 지칭되는 경우 수천 개의 단량체 단위에서 크기가 다양하다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 일련의 문자 (대문자 또는 소문자)로 표시될 때마다 달리 지시되거나 문맥상 명백하지 않는 한 뉴클레오타이드가 왼쪽에서 오른쪽으로 5'→3' 순서이고 "A"는 데옥시아데노신을 지정하고, "C"는 데옥시시티딘을 지정하고, "G"는 데옥시구아노신을 지정하고, "T"는 티미딘을 지정하고, "I"는 데옥시이노신을 지정하고, "U"는 우리딘을 지정함이 이해될 것이다. 달리 명시되지 않는 한, 용어 및 원자 번호 지정 규칙은 문헌[Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999)]에 개시된 것을 따를 것이다. 일반적으로 폴리뉴클레오타이드는 포스포디에스테르 연결에 의해 연결된 4개의 천연 뉴클레오사이드 (예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘 또는 RNA의 경우 리보스 대응물)를 포함하지만; 이는 또한 변형된 염기, 당 또는 뉴클레오사이드간 연결을 포함하여 비천연 뉴클레오타이드 유사체를 포함할 수 있다. 효소가 활성에 대한 특정 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요구사항, 예를 들어 단일 가닥 DNA, RNA/DNA 이중체 등을 갖는 경우, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질에 대한 적절한 조성의 선택은 특히 문헌[Sambrook et al, Molecular Cloning, Second Edition (Cold Spring Harbour Laboratory, New York, 1989)] 및 유사한 참조문헌과 같은 논문 내에 기재되어 있음이 당업자에게 명백하다. 유사하게, 올리고뉴클레오타이드 및 폴리뉴클레오타이드는 단일 가닥 형태 또는 이중 가닥 형태 (즉, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 및 이의 각각의 보체의 이중체)를 지칭할 수 있다. 어떤 형태인지 또는 두 형태 모두가 용어 사용의 맥락에서 의도되었는지는 당업자에게 명백할 것이다.
"프라이머"는 폴리뉴클레오타이드 주형으로 이중체를 형성할 때 핵산 합성의 개시점으로 작용하고 주형을 따라 이의 3' 말단으로부터 연장되어 연장 이중체가 형성될 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 프라이머의 연장은 일반적으로 DNA 또는 RNA 중합효소와 같은 핵산 중합효소로 수행된다. 연장 과정에서 첨가되는 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 연장된다. 프라이머는 일반적으로 14개 내지 40개 뉴클레오타이드 범위, 또는 18개 내지 36개 뉴클레오타이드 범위의 길이를 갖는다. 프라이머는 다양한 핵산 증폭 반응, 예를 들어 단일 프라이머를 사용하는 선형 증폭 반응 또는 둘 이상의 프라이머를 사용하는 중합효소 연쇄 반응에 사용된다. 특정 적용을 위한 프라이머의 길이와 서열을 선택하기 위한 지침은 참조로 포함된 다음 참조문헌에 의해 입증된 바와 같이 당업자에게 잘 알려져 있다: 문헌[Dieffenbach, editor, PCR Primer: A Laboratory Manual, Second Edition (Cold Spring Harbor Press, New York, 2003)]).
"서열 동일성"은 2개의 폴리펩타이드 서열 또는 2개의 폴리뉴클레오타이드 서열과 같은 2개의 서열 간의 일치 (예를 들어, 동일한 아미노산 잔기)의 수 (또는 분율, 일반적으로 백분율로 표시됨)를 지칭한다. 서열 동일성은 서열 갭을 최소화하면서 중첩 및 동일성이 최대화되도록 정렬될 때 서열을 비교함으로써 결정된다. 특히, 서열 동일성은 2개의 서열의 길이에 따라 다수의 수학적 전역 또는 국부 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열을 바람직하게 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘 (예를 들어, Needleman 및 Wunsch 알고리즘, 문헌[Needleman 및 Wunsch, 1970])을 사용하여 정렬하며, 실질적으로 다른 길이의 서열을 바람직하게는 국부 정렬 알고리즘 (예를 들어 Smith와 Waterman 알고리즘 (문헌[Smith and Waterman, 1981]) 또는 Altschul 알고리즘 (문헌[Altschul et al., 1997; Altschul et al., 2005])을 사용하여 정렬한다. 아미노산 서열 동일성 퍼센트를 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/과 같은 인터넷 웹 사이트에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본 명세서의 목적을 위해, 아미노산 서열 동일성 % 값은 Needleman-Wunsch 알고리즘을 사용하여 두 서열의 최적 전역 정렬을 생성하는 이원 서열 정렬 프로그램 EMBOSS Needle을 사용하여 생성된 값을 지칭하고, 모든 검색 매개변수는 기본값으로 설정되어 있으며, 즉, 스코어링 매트릭스 = BLOSUM62, 갭 개방 = 10, 갭 연장 = 0.5, 엔드 갭 페널티 = 거짓, 엔드 갭 개방 = 10 및 엔드 갭 연장 = 0.5이다.
"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, 용어 "치환"은 천연 표준 20개 아미노산 잔기, 희귀 천연 아미노산 잔기 (예를 들어, 하이드록시프롤린, 하이드록실리신, 알로하이드록실리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라긴, 알로이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린) 및 종종 합성 제조된 비천연 아미노산 잔기 (예를 들어 사이클로헥실-알라닌))로부터 선택되는 또 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. 바람직하게는, 용어 "치환"은 천연 발생 표준 20개 아미노산 잔기로부터 선택되는 또 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. "+" 기호는 대체 조합을 나타낸다. 아미노산은 본 명세서에서 하기 명명법에 따른 1문자 또는 3문자 코드로 표시된다: A: 알라닌 (Ala); C: 시스테인 (Cys); D: 아스파르트산 (Asp); E: 글루탐산 (Glu); F: 페닐알라닌 (Phe); G: 글리신 (Gly); H: 히스티딘 (His); I: 이소류신 (Ile); K: 리신 (Lys); L: 류신 (Leu); M: 메티오닌 (Met); N: 아스파라긴 (Asn); P: 프롤린 (Pro); Q: 글루타민 (Gln); R: 아르기닌 (Arg); S: 세린 (Ser); T: 트레오닌 (Thr); V: 발린 (Val); W: 트립토판 (Trp) 및 Y: 티로신 (Tyr). 본 명세서에서는 치환을 나타내기 위해 다음의 용어를 사용한다: L238A는 모서열의 위치 238에 있는 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경된 것을 나타낸다. A132V/I/M은 모 서열의 위치 132에 있는 아미노산 잔기 (알라닌, A)가 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 아미노산 중 하나로 치환된 것을 나타낸다. 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파라긴산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신), 소형 아미노산 (글리신, 알라닌 및 세린)의 그룹 내에서 이루어진다.
본 개시내용은 제시된 특정 형태의 범위로 제한되도록 의도되지 않고, 본 명세서에 기재된 변형의 대안, 수정 및 균등물을 포함하는 것으로 의도된다. 또한, 본 개시내용의 범위는 본 개시내용과 관련하여 당업자에게 명백해질 수 있는 다른 변형을 전체적으로 포함한다. 본 발명의 범위는 첨부된 청구범위에 의해서만 제한된다.
SEQUENCE LISTING
<110> DNA SCRIPT
<120> INCREASING LONG-SEQUENCE YIELDS IN TEMPLATE-FREE ENZYMATIC SYNTHESIS OF POLYNUCLEOTIDES
<130> B3068PC00
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 510
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TdT full length mouse
<400> 1
Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro
1 5 10 15
Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe
20 25 30
Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg
35 40 45
Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu
50 55 60
Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser
65 70 75 80
Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser
85 90 95
Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly
100 105 110
Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn
115 120 125
Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala
130 135 140
Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
145 150 155 160
Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala
165 170 175
Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met
180 185 190
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met
195 200 205
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile
210 215 220
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val
225 230 235 240
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
245 250 255
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
260 265 270
Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
275 280 285
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
290 295 300
Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
305 310 315 320
Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
325 330 335
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
340 345 350
Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
355 360 365
Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr
370 375 380
Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His
385 390 395 400
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His
405 410 415
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
420 425 430
Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
450 455 460
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg
465 470 475 480
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
500 505 510
<210> 2
<211> 381
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TdT truncated mouse sequence
<400> 2
Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile
85 90 95
Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser
275 280 285
Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 3
<211> 380
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> Bovine truncated (catalytic domain):
<400> 3
Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu
20 25 30
Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser
130 135 140
Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser
275 280 285
Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 4
<211> 380
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TdT Human truncated
<400> 4
Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp
275 280 285
Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 5
<211> 376
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TdT Chicken 1 truncated
<400> 5
Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr
1 5 10 15
Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn
20 25 30
Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn
35 40 45
Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala
50 55 60
Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp
65 70 75 80
Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu
85 90 95
Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn
100 105 110
Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val
115 120 125
Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val
130 135 140
Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg
145 150 155 160
Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala
165 170 175
Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe
180 185 190
Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys
195 200 205
Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg
210 215 220
Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile
225 230 235 240
Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp
245 250 255
Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln
260 265 270
Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met
275 280 285
Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
290 295 300
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg
305 310 315 320
Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met
325 330 335
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu
340 345 350
Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
355 360 365
Val Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 6
<211> 387
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> Possum truncated
<400> 6
Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro
1 5 10 15
Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile
20 25 30
Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys
65 70 75 80
Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp
225 230 235 240
Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys
275 280 285
Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu
370 375 380
Arg Asn Ala
385
<210> 7
<211> 381
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> truncated shrew
<400> 7
Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr
130 135 140
Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp
225 230 235 240
Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp
275 280 285
Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 8
<211> 387
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> Python truncated
<400> 8
Glu Lys Tyr Gln Leu Pro Glu Asp Glu Asp Arg Ser Val Thr Ser Asp
1 5 10 15
Leu Asp Arg Asp Ser Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Lys Asn Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly Phe Cys Thr Ala Phe Arg
50 55 60
Arg Ala Ala Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Gln Val
65 70 75 80
His Asp Ile Glu Gly Val Pro Trp Met Gly Lys Gln Val Lys Gly Ile
85 90 95
Ile Glu Asp Ile Ile Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val
100 105 110
Leu Asp Asn Glu Asn Tyr Arg Ser Val Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ser Asp Lys Trp Tyr Arg Met Gly Leu Arg
130 135 140
Thr Leu Glu Glu Val Lys Arg Asp Lys Asn Leu Lys Leu Thr Arg Met
145 150 155 160
Gln Lys Ala Gly Phe Leu His Tyr Asp Asp Leu Thr Ser Cys Val Ser
165 170 175
Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile Val Gln Asp Val Val Trp
180 185 190
Lys Ile Val Pro Asn Ala Ile Val Thr Ile Ala Gly Gly Phe Arg Arg
195 200 205
Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly
210 215 220
Ser Lys Gln Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Ile Trp
225 230 235 240
Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Glu Asp Lys
275 280 285
Gly Asn Ser Ile Arg Ser Lys Ala Phe Ser Glu Glu Glu Ile Lys Asp
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Val Pro Phe Glu Gln Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Thr Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Asn Ala Ala Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu
370 375 380
Arg Asn Ala
385
<210> 9
<211> 381
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> truncated dog
<400> 9
Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser
325 330 335
His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 10
<211> 382
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TRUNC MOLE
<400> 10
Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser
1 5 10 15
Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met
50 55 60
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met
65 70 75 80
Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val
85 90 95
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
100 105 110
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg
130 135 140
Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met
145 150 155 160
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
165 170 175
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
180 185 190
Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg
195 200 205
Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
210 215 220
Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe
225 230 235 240
Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr
245 250 255
Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His
260 265 270
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp
275 280 285
Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
340 345 350
Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 11
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> Pika trunk
<400> 11
Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val
1 5 10 15
Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu
85 90 95
Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu
210 215 220
Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg
275 280 285
Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 12
<211> 384
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TRUNC HEDGEHOG
<400> 12
Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu
1 5 10 15
Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu
20 25 30
Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly
275 280 285
Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala
370 375 380
<210> 13
<211> 381
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> truncated tree shrew
<400> 13
Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg
50 55 60
Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg
65 70 75 80
Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln
145 150 155 160
Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp
225 230 235 240
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 14
<211> 394
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TRUNCATED PLATYPUS
<400> 14
Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu
1 5 10 15
Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys
65 70 75 80
Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu
115 120 125
Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln
130 135 140
Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr
145 150 155 160
Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr
165 170 175
Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr
180 185 190
Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val
195 200 205
Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val
210 215 220
Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu
225 230 235 240
Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr
245 250 255
Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys
260 265 270
Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
275 280 285
His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser
290 295 300
Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val
305 310 315 320
Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
325 330 335
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys
340 345 350
Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile
355 360 365
Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu
370 375 380
Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
385 390
<210> 15
<211> 384
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> TRUNCATED JERBOA
<400> 15
Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met
1 5 10 15
Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys
20 25 30
Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile
35 40 45
Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu
50 55 60
Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile
65 70 75 80
Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys
85 90 95
Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys
100 105 110
Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser
115 120 125
Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly
130 135 140
Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr
145 150 155 160
Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys
165 170 175
Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala
180 185 190
Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe
195 200 205
Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser
210 215 220
Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr
225 230 235 240
Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu
245 250 255
Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu
260 265 270
Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg
275 280 285
Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala
370 375 380
<210> 16
<211> 382
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt Serinus canaria (canary)
<400> 16
Ser Pro Pro Leu Asn Thr Pro Glu Leu Glu Met Pro Ser Phe Ile Ala
1 5 10 15
Thr Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Val Met Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Leu Leu Lys Ser Leu Pro Phe Ser Val Thr Arg Met Lys Asp Ile
65 70 75 80
Gln Gly Leu Pro Cys Met Gly Asp Gln Val Arg Asp Val Ile Glu Ile
85 90 95
Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val Leu Asn Asp Glu
100 105 110
Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly Val
115 120 125
Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Val Gly Glu
130 135 140
Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Lys Ala Gly
145 150 155 160
Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala Glu Ala
165 170 175
Asp Ala Val Ser Leu Ile Val Lys Asn Thr Val Cys Thr Phe Leu Pro
180 185 190
Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Asn Ile
195 200 205
Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly Pro Arg Glu Asp
210 215 220
Asp Glu Leu Leu His Lys Val Ile Asp Leu Trp Lys Lys Gln Gly Leu
225 230 235 240
Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val Lys Glu Gln Leu
245 250 255
Pro Ser Arg Lys Ile Asp Ala Met Asp His Phe Gln Lys Cys Phe Ala
260 265 270
Ile Leu Lys Leu Tyr Gln Pro Arg Val Asp Asn Ser Thr Cys Asn Thr
275 280 285
Ser Lys Lys Leu Glu Met Ala Glu Val Lys Asp Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ser Tyr Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Arg Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Ala His Glu Arg Arg Met Ile Leu Asp Asn His Gly Leu Tyr Asp Arg
340 345 350
Thr Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 17
<211> 370
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt Neopelma chrysocephalum (saffron-crested neopelma)
<400> 17
Phe Ile Ala Arg Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala
20 25 30
Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu
35 40 45
Arg Ala Ala Ser Leu Leu Lys Tyr Leu Pro Phe Pro Val Thr Arg Met
50 55 60
Lys Asp Ile Gln Gly Leu Pro Cys Ile Gly Asp Gln Val Arg Asp Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Glu Gly Glu Ser Ser Arg Val Lys Glu Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Gln Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Val Lys Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg
115 120 125
Thr Val Glu Glu Leu Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser
145 150 155 160
Lys Ala Glu Ala Asp Ala Val Thr Leu Ile Val Lys Asn Thr Val Ser
165 170 175
Thr Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Met Gly His Asp Ile Asp Phe Leu Ile Thr Asn Pro Gly
195 200 205
Pro Arg Glu Asp Asp Glu Leu Leu His Lys Val Val Asp Leu Trp Lys
210 215 220
Lys Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Val
225 230 235 240
Glu Glu Gln Leu Pro Ser Arg Lys Val Asp Ala Met Asp Asn Phe Gln
245 250 255
Lys Cys Phe Thr Ile Leu Lys Leu Tyr Gln Pro Gly Val Asp Asn Ser
260 265 270
Ser Tyr Asn Met Ser Lys Lys Ser Asp Met Ala Glu Val Lys Asp Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe Glu Gln Tyr Ala
290 295 300
Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg Glu Phe Gly Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Ser His Glu Arg Lys Met Ile Leu Asp Asn His Gly
325 330 335
Leu Tyr Asp Arg Arg Lys Arg Ile Phe Leu Lys Ala Gly Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Val Glu Pro Trp Glu Arg
355 360 365
Asn Ala
370
<210> 18
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt Alligator sinensis
<400> 18
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Tyr Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Arg Leu Gly Cys Leu Glu Phe Leu Arg Ala Ala
50 55 60
Ser Val Leu Lys Phe Leu Pro Phe Pro Ile Val Lys Met Lys Asn Ile
65 70 75 80
Glu Gly Leu Pro Cys Met Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Glu Ser Cys Gln Ala Lys Glu Ile Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Thr Glu Lys Trp Tyr Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Val Lys Ala Glu Lys Thr Leu Lys Leu Ser Arg Met Gln Ile Ala
145 150 155 160
Gly Phe Leu His Tyr Glu Asp Ile Ile Ser Tyr Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Val Ser Leu Leu Ile Lys Asp Thr Val Cys Met Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Asn Pro Gly Pro Glu Glu
210 215 220
Glu Lys Glu Leu Leu His Lys Val Val Asp Leu Trp Glu Lys Gln Gly
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Val Ile Glu Ser Thr Phe Glu Lys Glu Lys
245 250 255
Arg Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Leu His Gln Gln Arg Arg Gly Asn Ser Asn Ser Asn
275 280 285
Ile Ser Lys Glu Ser Asp Lys Ala Glu Val Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Ile Ser Pro Phe Glu Gln Tyr Ala Tyr Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Ser Arg Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Arg Thr Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe
355 360 365
Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 19
<211> 380
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt Xenopus laevis
<400> 19
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Glu
1 5 10 15
Val Lys Val Ser Gln Tyr Ala Cys Gln Arg Cys Thr Thr Leu Gln Asp
20 25 30
Thr Asn Arg Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu His Phe
35 40 45
Glu Phe Cys Glu Asn Lys Gly Arg Thr Val Ala Phe Leu Arg Ala Ser
50 55 60
Ser Leu Ile Lys Ser Leu Pro Phe Pro Ile Thr Ala Met Lys Glu Leu
65 70 75 80
Glu Gly Leu Pro Trp Leu Gly Asp Gln Met Lys Gly Ile Ile Glu Glu
85 90 95
Ile Leu Glu Glu Gly Lys Ser Tyr Lys Val Leu Glu Val Met Asn Glu
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Gln Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Asp Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Glu
130 135 140
Glu Ile Lys Asn Glu Lys Glu Leu Lys Leu Thr Lys Met Gln Lys Cys
145 150 155 160
Gly Leu Leu Tyr Tyr Glu Asp Ile Thr Ser Tyr Val Ser Arg Ala Glu
165 170 175
Ala Glu Thr Thr Glu Gln Leu Ile Lys Ser Ile Val Trp Lys Phe Val
180 185 190
Pro Asp Ala Ile Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Lys Gly His Asp Val Asp Ile Leu Ile Thr Cys Ala Arg Lys Gly Lys
210 215 220
Glu Lys Asn Ile Leu His Asn Thr Met Ser Val Leu Lys Asn Arg Gly
225 230 235 240
Leu Leu Leu Phe Tyr Asn Ile Ile Glu Ser Thr Phe Asp Glu Thr Lys
245 250 255
Leu Pro Ser Arg His Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Thr Ile Leu Lys Leu Pro Lys Arg Gln Met Asp Ile Gly Asn Ile Ile
275 280 285
Asp Pro His Glu Cys Glu Arg Lys Asn Trp Lys Ala Val Arg Leu Asp
290 295 300
Leu Val Ile Thr Pro Tyr Glu Gln Tyr Pro Tyr Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Lys Arg Met Met Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys
340 345 350
Asn Asn Phe Leu Lys Ala Asn Asn Glu Glu Asp Ile Phe Lys Gln Leu
355 360 365
Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 20
<211> 383
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Notechis scutatus) tiger snake
<400> 20
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Ser Ile Ser Pro Tyr Ala Cys Gln Arg Arg Thr Thr Leu Lys Asn
20 25 30
Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Val Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Asn Lys Glu Phe Cys Leu Ala Phe Gly Arg Ala Ala
50 55 60
Ser Leu Leu Lys Cys Leu Pro Phe Thr Val Val Arg Val Asn Asp Ile
65 70 75 80
Glu Gly Leu Pro Trp Met Gly Lys Gln Val Arg Glu Ile Ile Glu Asp
85 90 95
Ile Leu Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Asn Tyr Arg Ser Ile Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Arg Thr Ser Glu Lys Trp Tyr Arg Met Gly Leu Arg Thr Leu Glu
130 135 140
Glu Val Lys Cys Asn Lys Asn Leu Thr Leu Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Phe Tyr Tyr Asp Asp Leu Ile Ser Ser Val Ser Lys Ala Glu
165 170 175
Ala Asp Ala Ala Thr Gln Ile Val Gln Asp Thr Val Trp Lys Ile Leu
180 185 190
Pro Asn Ala Val Val Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Gln
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Gln
210 215 220
Glu Glu Glu Leu Leu His Pro Val Ile Asp Ile Trp Lys Lys Gln Glu
225 230 235 240
Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe Glu Asn Thr Lys
245 250 255
Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe
260 265 270
Ala Ile Leu Lys Val His Lys Glu Arg Val Asn Lys Gly Ser Ala Val
275 280 285
Gln Ser Asn Val Phe Ala Glu Glu Gly Thr Lys Asp Trp Lys Ala Ile
290 295 300
Arg Val Asp Leu Val Val Thr Pro Phe Gln His Tyr Ala Phe Ala Leu
305 310 315 320
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr
325 330 335
Ala Thr Gln Glu Lys Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp
340 345 350
Lys Thr Lys Lys Ile Phe Leu Ser Ala Ala Asn Glu Glu Glu Ile Phe
355 360 365
Ser His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 21
<211> 367
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Salmo trutta) brown trout
<400> 21
Thr Ala Ala Ala Asn Val Ser Gln Tyr Ala Cys Leu Arg Arg Thr Thr
1 5 10 15
Thr Glu Asn His Asn Lys Ile Phe Thr Asp Val Leu Glu Glu Leu Ala
20 25 30
Glu Asn Ser Glu Phe Asn Glu Ser Lys Gly Pro Cys Leu Ala Phe Arg
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Ser Ala Val His Cys Leu
50 55 60
Gly Ala Ile Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Val
65 70 75 80
Met Glu Glu Ile Leu Ile Phe Gly Arg Ser Phe Lys Val Glu Glu Val
85 90 95
Gln Ser Asp Glu Arg Tyr Gln Ala Leu Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg
115 120 125
Ser Leu Lys Glu Ile Leu Ala Glu Pro Asn Ile Gln Leu Asn Arg Met
130 135 140
Gln Arg Ala Gly Phe Leu Tyr Tyr Arg Asp Ile Ser Lys Ala Val Ser
145 150 155 160
Lys Ala Glu Ala Lys Ala Leu Ser Ser Ile Ile Glu Glu Thr Ala His
165 170 175
Trp Ile Ala Pro Asp Ser Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Glu Tyr Gly His Asp Val Asp Phe Leu Leu Thr Met Pro Glu
195 200 205
Met Gly Lys Glu Glu Gly Leu Leu Leu Arg Val Ile Asp Arg Leu Arg
210 215 220
Asp Gln Gly Ile Leu Leu Tyr Cys Glu His Gln Asp Ser Thr Phe Asp
225 230 235 240
Met Ser Lys Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Glu
245 250 255
Lys Cys Phe Leu Ile Leu Arg Leu Glu Glu Gly Gln Val Glu Gly Asp
260 265 270
Gly Gly Leu Gln Lys Asp Pro Gly Glu Ser Arg Gly Trp Arg Ala Val
275 280 285
Arg Val Asp Leu Val Ala Pro Pro Val Asp Arg Tyr Ala Phe Val Leu
290 295 300
Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe
305 310 315 320
Ala Ser Lys Glu Arg Gly Met Cys Leu Asp Asn His Ala Leu Tyr Asp
325 330 335
Lys Thr Lys Lys Leu Phe Leu Pro Ala Thr Ser Glu Glu Asp Ile Phe
340 345 350
Ala His Leu Gly Leu Glu Tyr Val Glu Pro Trp Gln Arg Asn Ala
355 360 365
<210> 22
<211> 377
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Electrophorus electricus) electric eel
<400> 22
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Leu
1 5 10 15
Pro Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asp Asn
20 25 30
His Asn Lys Val Phe Thr Asp Ala Leu Glu Val Leu Ile Glu Asn Tyr
35 40 45
Glu Phe Ser Asp Asn Lys Gly Ala Cys Val Gly Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Lys Pro Leu Arg Cys Leu Lys Asp Met
65 70 75 80
Glu Gly Leu Pro Cys Leu Gly Asp Asp Thr Lys Ala Ile Ile Glu Glu
85 90 95
Ile Tyr Glu Cys Gly Ser Ser Ser Arg Val Glu Asn Ile Leu Ser Asp
100 105 110
Glu Lys Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Gly Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ala Leu Glu
130 135 140
Gln Val His Ser Glu Pro Ser Ile Gln Leu Asn Lys Met Gln Ala Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Ile Ser Lys Pro Val Ser Arg Ala Glu
165 170 175
Ala Lys Ala Val Gly Cys Ile Ile Glu Glu Val Ala Ser Cys Phe Ser
180 185 190
Ser Ser Val Thr Ile Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Leu Leu Ser Ile Pro Glu Pro Gly Lys
210 215 220
Glu Asp Gly Leu Leu Pro Ala Val Ile Asp Arg Leu Arg Lys Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Leu Gln Glu Ser Thr Leu Gln Gln Trp Lys
245 250 255
Arg Pro Ser Arg Cys Phe Asp Ser Met Asp His Phe Gln Lys Cys Phe
260 265 270
Leu Ile Val Lys Leu Trp Thr Arg Leu Val Glu Gly His Arg Glu Asp
275 280 285
Pro Ser Ser Gln Arg Asp Trp Lys Ala Val Arg Val Asp Leu Val Val
290 295 300
Pro Pro Val Asp Cys Tyr Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser
305 310 315 320
Thr Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg Arg
325 330 335
Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Thr Asn Thr Phe
340 345 350
Leu Gln Ala Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp
355 360 365
Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 23
<211> 378
<212> PRT
<213> trunc wt (Anabas testudineus) walking fish
<400> 23
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Ala Thr Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Glu Asn
20 25 30
Asn Asn Lys Ile Leu Thr Asp Ala Phe Glu Val Leu Ala Glu Ser Tyr
35 40 45
Glu Leu Asn Gln Leu Glu Gly Pro Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Gln Cys Leu Gly Ala Thr
65 70 75 80
Gln Gly Leu Pro Cys Leu Gly Glu His Thr Lys Ala Leu Ile Glu Glu
85 90 95
Ile Leu Gln Tyr Gly His Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Ile Leu Ala Glu Pro Ser Ile Gln Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Leu Gly Asn Ile Ile Asp Glu Ala Val His Ala Ile Thr
180 185 190
Pro Asp Gly Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Pro Glu Gln Gly Lys
210 215 220
Glu Glu Thr Leu Leu Pro Asn Ile Ile Asp Arg Leu Lys Glu Gln Gly
225 230 235 240
Ile Leu Leu Tyr Ser Asp Tyr Gln Thr Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Lys Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Leu Val Asp Arg Gly Leu Asn Ser
275 280 285
Thr Glu Gly Asp Ser Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Met Glu Arg Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Gln
325 330 335
His Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Ala Ala Thr Thr Glu Arg Asp Ile Phe Ala His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 24
<211> 378
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Poecilia reticulate) guppy
<400> 24
Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro Ser Val
1 5 10 15
Asp Lys Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Val Glu Asn
20 25 30
Asn Asn Arg Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Asn Glu Ile Glu Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Trp Ala Val Arg Ser Val Gly Ala Thr
65 70 75 80
Leu Asp Leu Pro Cys Leu Gly Glu His Thr Thr Ala Val Met Lys Glu
85 90 95
Ile Leu Gln Tyr Gly Arg Ser Phe Glu Val Glu Lys Ile Leu Ser Asp
100 105 110
Glu Arg Cys Gln Thr Leu Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Arg Gly Leu Arg Ser Phe Ser
130 135 140
Asp Val Leu Ala Gln Pro Gly Ile His Leu Asn Arg Met Gln Gln Ser
145 150 155 160
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
165 170 175
Ala Arg Ala Val Gly Asn Ile Ile Asp Glu Ala Val His Val Ile Thr
180 185 190
Pro Asn Ala Ile Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Asp
195 200 205
Phe Gly His Asp Val Asp Phe Ile Val Thr Thr Thr Glu Leu Gly Lys
210 215 220
Glu Lys Asn Leu Leu Ile Ser Val Ile Glu Ser Leu Lys Lys Gln Gly
225 230 235 240
Leu Leu Leu Phe Ser Asp Tyr Gln Ala Ser Thr Phe Asp Ile Ser Lys
245 250 255
Leu Pro Ser His Arg Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
260 265 270
Leu Ile Leu Arg Leu Glu Gly Ser Arg Val Glu Gly Gly Leu Gln Arg
275 280 285
Ala Gln Ala Asp Gly Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
290 295 300
Ser Pro Pro Ala Asp Arg Phe Ala Phe Thr Met Leu Gly Trp Thr Gly
305 310 315 320
Ser Arg Met Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Leu Glu Arg
325 330 335
Gln Met Leu Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Glu
340 345 350
Phe Leu Thr Ala Ala Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu
355 360 365
Glu Tyr Ile Glu Pro Trp Gln Arg Asn Ala
370 375
<210> 25
<211> 366
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt short Rattus norvegicus
<400> 25
Pro Leu Met Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
1 5 10 15
Leu Asn Asn His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala
20 25 30
Glu Asn Tyr Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met
50 55 60
Lys Asp Ile Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Thr Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
165 170 175
Ala Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
195 200 205
Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe
210 215 220
Trp Arg Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr
225 230 235 240
Phe Glu Lys Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His
245 250 255
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg
260 265 270
Ser Glu Glu Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg
275 280 285
Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu
290 295 300
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
305 310 315 320
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
325 330 335
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
340 345 350
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 26
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunk wt Long Rattus norvegicus
<400> 26
Ser Leu Ser Pro Val Pro Gly Ser Gln Thr Val Pro Pro Pro Leu Met
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn Gln Leu Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Val Ser Cys Leu Pro Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Ser Phe Pro Ile Val Ser Met Lys Asp Ile
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Gly
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Ser Leu Arg Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Ala Phe Leu
180 185 190
Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met
195 200 205
Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Phe Trp Arg Gln
225 230 235 240
Gln Gly Leu Leu Leu Tyr Cys Asp Ile Ile Glu Ser Thr Phe Glu Lys
245 250 255
Phe Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His Arg Gly Leu Val Arg Ser Glu Glu
275 280 285
Ser Gly Gln Gln Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 27
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Piliocolobus tephrosceles) monkey
<400> 27
Ser Asp Ser Thr Asn Pro Gly Leu Pro Lys Thr Pro Pro Thr Ala Ile
1 5 10 15
Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu Asn Cys
35 40 45
Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Cys Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Val Arg Ser Asp Glu Ser Leu Lys Phe Thr Arg Met Gln Arg Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Ala Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Glu
210 215 220
Asp Glu Glu Gln Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Pro Leu Gln Arg Val Asp Ser Asp Gln
275 280 285
Ser Ser Trp Gln Gly Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 28
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N27 trunc wt (Sus scrofa) pig
<400> 28
Ser Ala Ser Pro Ser Pro Gly Ser Gln Asn Thr Leu Pro Pro Ala Val
1 5 10 15
Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Thr Phe Cys Leu Ala Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Arg Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Thr Leu Lys Phe Thr Arg Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gln Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Asp Glu Glu Gln Gln Leu Leu Pro Lys Val Val Asn Leu Trp Glu Arg
225 230 235 240
Glu Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Leu Glu Lys
245 250 255
Ser Lys Leu Pro Ser Arg Asn Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Met
275 280 285
Ser Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Leu Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 29
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Panthera tigris altaica) Siberian tiger
<400> 29
Tyr Ser Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Pro Pro Leu Val
1 5 10 15
Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Phe Asn His Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Val Ser Ser Ala Thr Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Thr Asp
210 215 220
Glu Glu Glu Glu Glu Leu Leu Pro Lys Val Ile Asn Leu Trp Gln Arg
225 230 235 240
Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly Lys
275 280 285
Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 30
<211> 365
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> trunc wt (Bubalus bubalis) water buffalo
<400> 30
Leu Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr
1 5 10 15
Leu Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
20 25 30
Glu Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met
35 40 45
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met
50 55 60
Lys Asp Thr Gln Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val
65 70 75 80
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
85 90 95
Leu Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe
100 105 110
Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg
115 120 125
Ser Leu Ser Lys Ile Thr Ser Asp Lys Thr Leu Lys Phe Thr Lys Met
130 135 140
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
145 150 155 160
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
165 170 175
Ala Phe Leu Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg
180 185 190
Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly
195 200 205
Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
210 215 220
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
225 230 235 240
Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe
245 250 255
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser
260 265 270
Gly Arg Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
275 280 285
Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly
290 295 300
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr
305 310 315 320
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
325 330 335
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
340 345 350
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360 365
<210> 31
<211> 379
<212> PRT
<213> ARTIFICIAL SEQUENCE
<220>
<223> N93or trunc wt (Marmota flaviventris) marmot
<400> 31
Pro Asp His Ser Asn Ser Asp Pro Gln Arg Ile Pro Pro Pro Ala Val
1 5 10 15
Gln Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
Cys Asn Arg Val Phe Thr Asp Ala Phe Asp Val Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Arg Glu Asn Glu Ser Cys Ser Val Val Phe Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Arg Asp Leu
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Gly Lys Ala Lys Ser Ile Ile Glu Glu
85 90 95
Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp
100 105 110
Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser
130 135 140
Lys Ile Arg Ser Asp Lys Ser Leu Lys Phe Thr His Met Gln Lys Ala
145 150 155 160
Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Asn
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Ala Glu Ala Thr Glu
210 215 220
Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Asp Lys
275 280 285
Ala Ser Gln Gln Gly Gly Lys Asn Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
Claims (23)
- 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, 상기 방법은
a) 유리(free) 3'-하이드록실을 갖는 개시인자(initiator)를 제공하는 단계; 및
b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건(elongation condition) 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편(elongated fragment)을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적(template-independent) DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단(deblocking)하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층(base stacking)을 방지하는 것으로 선택되는 단계를 포함하는, 방법. - 제1항에 있어서, 상기 연장 조건은 적어도 하나의 3'-O-차단 뉴클레오사이드 트리포스페이트가 수소 결합을 방지하기 위해 그의 염기에 부착된 염기 보호 모이어티(moiety)를 갖는다는 것을 제공하는, 방법.
- 제2항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트는 이의 염기의 질소 또는 산소에 부착된 염기 보호 모이어티를 갖는, 방법.
- 제3항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트는 질소에 부착된 상기 염기 보호 모이어티를 갖는, 방법.
- 제4항에 있어서, 상기 3'-O-차단 뉴클레오사이드 트리포스페이트의 상기 염기의 상기 질소는 고리외 질소(exocyclic nitrogen)인, 방법.
- 제5항에 있어서, 상기 염기 보호 모이어티는 데옥시아데노신 트리포스페이트의 6-질소, 데옥시구아노신 트리포스페이트의 2-질소, 또는 데옥시시티딘 트리포스페이트의 4-질소에 부착되는, 방법.
- 제6항에 있어서, 상기 염기 보호 모이어티는 아실 보호기인, 방법.
- 제6항 또는 제7항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 이소부티릴, 이소부티릴옥시에틸렌, 아세틸, 4-이소프로필-펜옥시아세틸, 펜옥시아세틸, 및 메톡시아세틸로 이루어진 군으로부터 선택되고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 벤조일, 프탈로일, 아세틸, 및 이소부티릴로 이루어진 군으로부터 선택되는, 방법.
- 제6항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 벤조일 또는 디메틸포름아미딘이고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 아세틸 또는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸인, 방법.
- 제6항에 있어서, 데옥시아데노신 트리포스페이트의 상기 6-질소에 부착된 상기 염기 보호 모이어티는 디메틸포름아미딘이고; 데옥시구아노신 트리포스페이트의 상기 2-질소에 부착된 상기 염기 보호 모이어티는 디메틸포름아미딘이고; 데옥시시티딘 트리포스페이트의 상기 4-질소에 부착된 상기 염기 보호 모이어티는 아세틸인, 방법.
- 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 염기 보호 모이어티는 염기 불안정성(base labile)인, 방법.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 염기 보호 모이어티는 아미딘인, 방법.
- 제2항 내지 제12항 중 어느 한 항에 있어서, 상기 방법은 폴리뉴클레오타이드의 뉴클레오타이드로부터 상기 염기 보호 모이어티를 제거하는 단계를 포함하는, 방법.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 개시인자는 고체 지지체에 부착되는, 방법.
- 제2항 내지 제14항 중 어느 한 항에 있어서, 상기 개시인자는 염기 절단 가능한 뉴클레오사이드를 포함하고, 상기 염기 보호 모이어티는 염기 불안정성이고, 상기 제거 단계는 염기 보호 모이어티 및 염기 절단 가능한 뉴클레오사이드가 동일한 반응으로 절단되도록 염기를 갖는 상기 폴리뉴클레오타이드를 처리하는 단계를 포함하는, 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 연장 조건은 변성제(denaturation agent)를 포함하는, 방법.
- 제16항에 있어서, 상기 변성제는 물의 유전 상수보다 더 작은 유전 상수를 갖는 수혼화성 용매 및 카오트로픽제 (chaotropic agent)로 이루어진 군으로부터 선택되는, 방법.
- 제16항 또는 제17항에 있어서, 상기 변성제는 포름아미드, 구아니딘, 살리실산나트륨, 디메틸 술폭사이드 (DMSO), 프로필렌 글리콜, 및 요소로 이루어진 군으로부터 선택되는, 방법.
- 제2항 내지 제18항 중 어느 한 항에 있어서, 상기 3'-O-보호기는 3'-O-메틸, 3'-O- (2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O- (2-시아노에틸), 및 3'-O-프로파길로 이루어진 군으로부터 선택되는, 방법.
- 제19항에 있어서, 상기 3'-O-보호기는 아지도메틸인, 방법.
- 제19항에 있어서, 상기 3'-O-보호기는 아민인, 방법.
- 소정의 서열을 갖는 폴리뉴클레오타이드를 합성하는 방법으로서, 본 방법은
a) 유리 3'-하이드록실을 갖는 개시인자를 제공하는 단계;
b) 폴리뉴클레오타이드가 합성될 때까지, (i) 연장 조건 하에 유리 3'-O-하이드록실을 갖는 개시인자 또는 연장 단편을 3'-O-차단 뉴클레오사이드 트리포스페이트 및 주형-독립적 DNA 중합효소와 접촉시켜, 개시인자 또는 연장 단편을 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트의 혼입에 의해 연장하여 3'-O-차단 연장 단편을 형성하는 단계, 및 (ii) 폴리뉴클레오타이드가 형성될 때까지, 연장 단편을 탈차단하여 유리 3'-하이드록실을 갖는 연장 단편을 형성하는 단계를 반복하는 단계로서, 연장 조건은 수소결합 또는 염기 적층을 방지하는 것으로 선택되고; 최종 사이클은 단지 단계 (i)만을 포함하고, 3'-O-차단되고 염기 보호된 뉴클레오사이드 트리포스페이트는 포획(capture) 모이어티를 포함하는 염기 보호 모이어티를 포함하는 단계;
c) 포획 모이어티의 보체(complement)로 폴리뉴클레오타이드를 포획하는 단계
를 포함하는, 방법. - 제22항에 있어서, 상기 포획된 폴리뉴클레오타이드를 탈차단하는 단계를 추가로 포함하는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19189639.8 | 2019-08-01 | ||
EP19189639 | 2019-08-01 | ||
EP19200740 | 2019-10-01 | ||
EP19200740.9 | 2019-10-01 | ||
PCT/EP2020/071316 WO2021018921A1 (en) | 2019-08-01 | 2020-07-28 | Increasing long-sequence yields in template-free enzymatic synthesis of polynucleotides. |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220052938A true KR20220052938A (ko) | 2022-04-28 |
Family
ID=71741810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227006178A KR20220052938A (ko) | 2019-08-01 | 2020-07-28 | 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220403435A1 (ko) |
EP (1) | EP4007816A1 (ko) |
JP (1) | JP2022543568A (ko) |
KR (1) | KR20220052938A (ko) |
CN (1) | CN114430778A (ko) |
AU (1) | AU2020319661A1 (ko) |
CA (1) | CA3145912A1 (ko) |
IL (1) | IL290199A (ko) |
WO (1) | WO2021018921A1 (ko) |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5367066A (en) | 1984-10-16 | 1994-11-22 | Chiron Corporation | Oligonucleotides with selectably cleavable and/or abasic sites |
DE3529478A1 (de) | 1985-08-16 | 1987-02-19 | Boehringer Mannheim Gmbh | 7-desaza-2'desoxyguanosin-nukleotide, verfahren zu deren herstellung und deren verwendung zur nukleinsaeure-sequenzierung |
EP0450060A1 (en) | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
US5436143A (en) | 1992-12-23 | 1995-07-25 | Hyman; Edward D. | Method for enzymatic synthesis of oligonucleotides |
AU689924B2 (en) | 1994-06-23 | 1998-04-09 | Affymax Technologies N.V. | Photolabile compounds and methods for their use |
US5808045A (en) | 1994-09-02 | 1998-09-15 | Andrew C. Hiatt | Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides |
US5763594A (en) | 1994-09-02 | 1998-06-09 | Andrew C. Hiatt | 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds |
US5830655A (en) | 1995-05-22 | 1998-11-03 | Sri International | Oligonucleotide sizing using cleavable primers |
US5700642A (en) | 1995-05-22 | 1997-12-23 | Sri International | Oligonucleotide sizing using immobilized cleavable primers |
EP1632496A1 (en) | 1998-06-22 | 2006-03-08 | Affymetrix, Inc. | Reagents and methods for solid phase synthesis and display |
JP2002538790A (ja) | 1999-03-08 | 2002-11-19 | プロトジーン・ラボラトリーズ・インコーポレーテッド | 長いdna配列を経済的に合成し、そして組み立てるための方法および組成物 |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
CA2491925A1 (en) | 2002-07-08 | 2004-01-15 | Shell Canada Limited | Choke for controlling the flow of drilling mud |
US7947817B2 (en) | 2003-06-30 | 2011-05-24 | Roche Molecular Systems, Inc. | Synthesis and compositions of 2'-terminator nucleotides |
US8212020B2 (en) | 2005-03-11 | 2012-07-03 | Steven Albert Benner | Reagents for reversibly terminating primer extension |
US7544794B1 (en) | 2005-03-11 | 2009-06-09 | Steven Albert Benner | Method for sequencing DNA and RNA by synthesis |
WO2008042067A2 (en) | 2006-09-28 | 2008-04-10 | Illumina, Inc. | Compositions and methods for nucleotide sequencing |
FR3020071B1 (fr) | 2014-04-17 | 2017-12-22 | Dna Script | Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede |
GB201502152D0 (en) * | 2015-02-10 | 2015-03-25 | Nuclera Nucleics Ltd | Novel use |
FR3052462A1 (fr) | 2016-06-14 | 2017-12-15 | Dna Script | Variants d'une adn polymerase de la famille polx |
WO2018175436A1 (en) * | 2017-03-21 | 2018-09-27 | Molecular Assemblies, Inc. | Nucleic acid synthesis using dna polymerase theta |
WO2019051250A1 (en) | 2017-09-08 | 2019-03-14 | Sigma-Aldrich Co. Llc | SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION |
US10435676B2 (en) | 2018-01-08 | 2019-10-08 | Dna Script | Variants of terminal deoxynucleotidyl transferase and uses thereof |
WO2020099451A1 (en) | 2018-11-14 | 2020-05-22 | Dna Script | Terminal deoxynucleotidyl transferase variants and uses thereof |
CA3122494A1 (en) * | 2018-12-13 | 2020-06-18 | Dna Script | Direct oligonucleotide synthesis on cells and biomolecules |
EP3906317A1 (en) * | 2019-01-03 | 2021-11-10 | DNA Script | One pot synthesis of sets of oligonucleotides |
-
2020
- 2020-07-28 WO PCT/EP2020/071316 patent/WO2021018921A1/en active Application Filing
- 2020-07-28 US US17/629,322 patent/US20220403435A1/en active Pending
- 2020-07-28 KR KR1020227006178A patent/KR20220052938A/ko active Search and Examination
- 2020-07-28 EP EP20744062.9A patent/EP4007816A1/en active Pending
- 2020-07-28 JP JP2022506128A patent/JP2022543568A/ja active Pending
- 2020-07-28 AU AU2020319661A patent/AU2020319661A1/en active Pending
- 2020-07-28 CN CN202080055865.1A patent/CN114430778A/zh active Pending
- 2020-07-28 CA CA3145912A patent/CA3145912A1/en active Pending
-
2022
- 2022-01-27 IL IL290199A patent/IL290199A/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN114430778A (zh) | 2022-05-03 |
US20220403435A1 (en) | 2022-12-22 |
EP4007816A1 (en) | 2022-06-08 |
AU2020319661A1 (en) | 2022-02-24 |
CA3145912A1 (en) | 2021-02-04 |
JP2022543568A (ja) | 2022-10-13 |
IL290199A (en) | 2022-03-01 |
WO2021018921A1 (en) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113423840B (zh) | 多核苷酸无模板酶促合成中有效的产物裂解 | |
CN113302289A (zh) | 末端脱氧核苷酸转移酶变体及其用途 | |
CA3161087A1 (en) | Chimeric terminal deoxynucleotidyl transferases for template-free enzymatic synthesis of polynucleotides | |
CN113272442A (zh) | 寡核苷酸的集合的一锅合成 | |
KR20220052938A (ko) | 폴리뉴클레오타이드의 주형-부재 효소적 합성에서의 긴 서열 수율 증가 | |
US20240052391A1 (en) | Enzymatic Synthesis of Polynucleotide Probes | |
KR20230002825A (ko) | 말단 데옥시뉴클레오티딜 트랜스퍼라제 변이체 및 그의 용도 | |
US20220411840A1 (en) | High Efficiency Template-Free Enzymatic Synthesis of Polynucleotides | |
JP2024511874A (ja) | G4を形成しやすいポリヌクレオチドの酵素合成のための方法及びキット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |