KR20120093882A - 융합 폴리펩티드 및 이들의 용도 - Google Patents

융합 폴리펩티드 및 이들의 용도 Download PDF

Info

Publication number
KR20120093882A
KR20120093882A KR1020127009669A KR20127009669A KR20120093882A KR 20120093882 A KR20120093882 A KR 20120093882A KR 1020127009669 A KR1020127009669 A KR 1020127009669A KR 20127009669 A KR20127009669 A KR 20127009669A KR 20120093882 A KR20120093882 A KR 20120093882A
Authority
KR
South Korea
Prior art keywords
polypeptide
dna
leu
lys
ligase
Prior art date
Application number
KR1020127009669A
Other languages
English (en)
Inventor
웨인 미첼 패트릭
로버트 핸리 윌슨
Original Assignee
마쎄이 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마쎄이 유니버시티 filed Critical 마쎄이 유니버시티
Publication of KR20120093882A publication Critical patent/KR20120093882A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 DNA-결합 도메인과 같은 폴리뉴클레오티드-결합 도메인, DNA 리가아제 도메인과 같은 리가아제 도메인을 포함하는 융합폴리펩티드, 이러한 융합폴리펩티드의 생산방법, 및 용도에 관한 것으로, 예를 들어, 분자 생물학적 기술 분야 뿐만 아니라 진단, 단백질 생산, 기능 식품 및 의약 분야에서 적용된다.

Description

융합 폴리펩티드 및 이들의 용도{Fusion Polypeptides and Uses Thereof}
본 발명은 분자 생물학 분야에 관한 것으로, 특히 융합 폴리펩티드 및 이들의 용도에 관한 것이다. 특히, 본 발명은 폴리뉴클레오티드에 결합하는 도메인을 포함하고 있는 융합 폴리펩티드 및 DNA 리가아제(리가아제) 도메인과 같은 폴리뉴클레오티드 리가아제 도메인에 관한 것이다. 이러한 융합 폴리펩티드의 제조방법 및 용도도 분자 생물학적 기술 범위 내에서 제공된다.
DNA 리가아제와 같은 폴리뉴클레오티드 리가아제는 가장 널리 사용되는 분자 생물학적 효소이다. 광범위한 다양한 분자 생물학적 방법은 DNA 리가아제의 활성 효율과 상관성이 있다.
다양한 출처의 리가아제들이 분자 생물학에 적용하고자 탐구되어져 왔으며, 분자 생물학적 기법이 필요한 의약, 약학 및 식품산업과 같은 산업분야에서도 점점 사용이 증가되고 있다. 그럼에도 불구하고, DNA 리가아제와 같은 리가아제의 활성을 변경하는 방법에 관해서는 거의 알려진 바가 없다.
본 발명의 목적은 융합 폴리펩티드를 사용하는 방법을 제공하거나 또는 적어도 공중에게 유용한 선택을 제공하기 위하여 DNA 리가아제 활성과 같은 폴리뉴클레오티드 리가아제 활성을 포함하고 있는 융합 폴리펩티드를 제공하는 것이다.
요약
따라서, 본 발명의 제1 구체예는 융합 폴리펩티드를 생산하는 방법으로, 이는
적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 숙주 세포를 제공하는 단계;
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주세포를 유지하는 단계; 및
상기 숙주세포 유래의 융합 폴리펩티드를 분리하는 단계;
로 이루어지고,
상기 발현 구조물이 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열로 이루어지는 것을 특징으로 한다.
본 발명의 한 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 리가아제 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 RNA 리가아제 폴리펩티드이다.
본 발명의 한 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 DNA-결합 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 RNA-결합 폴리펩티드이다. 예를 들어, 상기 폴리뉴클레오티드-리가아제는 RNA 리가아제 폴리펩티드인 일부 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 용이하게 RNA-결합 폴리펩티드 일 수 있다.
따라서, 본 발명의 한 구체예로, 융합 폴리펩티드를 생산하는 방법으로,
DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 성열; 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 숙주 세포를 제공하는 단계;
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주 세포를 유지하는 단계; 및
숙주 세포로부터 상기 융합 폴리펩티드를 선별하는 단계;
를 포함하는 것을 특징으로 한다.
한 구체예에서, 상기 발현 구조물은 높은 증폭 수(copy number)의 벡터이다.
한 구체예에서, DNA 리가아제 폴리펩티드를 인코딩(encoding)하는 적어도 하나의 핵산 서열을 강력한 프로모터에 작동가능하게 연결한다.
한 구체예에서, DNA-결합 폴리펩티드를 인코딩하는 상기 적어도 하나의 핵산 서열은 강력한 프로모터에 작동가능하게 연결한다.
한 구체예에서, 상기 강력한 프로모터는 바이러스 프로모터 또는 파지 프로모터이다.
한 구체예에서, 상기 프로모터는 파지 프로모터로, 예를 들어, T5 파지 프로모터, 또는 T7 파지 프로모터이다.
다른 구체예에서, 본 발명은 융합 폴리펩티드를 생산하는 방법을 제공하는 것으로,
폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열; 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 체외 발현 시스템을 제공하는 단계; 및
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 발현 시스템을 유지하는 단계;
를 포함하는 것을 특징으로 한다.
일부 구체예에서, 상기 방법은 발현 시스템에서 상기 융합 폴리펩티드를 분리하는 단계를 더 포함한다.
다른 일부 구체예에서, 본 발명은 발현 구조물에 관한 것으로, 상기 발현 구조물은, 폴리뉴클레오티드-리가아제 폴리펩트드를 인코딩하는 적어도 하나의 핵산 서열; 및 폴리튜클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 리가아제 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 RNA 리가아제 폴리펩티드이다.
하나의 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 DNA-결합 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클에오티드-결합 폴리펩티드는 RNA-결합 폴리펩티드이다.
따라서, 하나의 구체예에서, 상기 발현 구조물은, RNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열; 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 발현 구조물은 상기 DNA 리가아제 폴리펩티드 및 상기 DNA-결합 폴리펩티드를 포함하는 것을 특징으로 하는 융합 폴리펩티드를 인코딩한다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열은 하나의 전사 해석틀(open reading frame)에 존재한다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 강력한 프로모터와 같은 프로모터에 작동가능하게 연결한다.
하나의 구체예에서, 상기 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 강력한 프로모터와 같은 프로모터에 작동가능하게 연결한다.
본 발명의 다른 측면은 본 발명의 발현 구조물을 포함하는 것을 특징으로 하는 벡터에 관한 것이다.
하나의 구체예에서, 상기 벡터는 높은 증폭수의 벡터이다.
하나의 구체예에서, 상기 벡터는 낮은 증폭수의 벡터이다.
하나의 구체예에서, 상기 벡터는 숙주 세포의 게놈(genome)으로의 안전한 병합(integration)에 적절한다.
본 발명의 다른 측면은 상기에서 정의된 발현 벡터 또는 벡터를 포함하는 것을 특징으로 하는 숙주세포에 관한 것이다.
본 발명의 다른 측면은 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클에오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나의 융합 폴리펩티드에 관한 것이다.
하나의 구체예에서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함한다.
본 발명의 다른 측면은 상기에서 정의된 방법에 의해 생산되는 융합 폴리펩티드에 관한 것이다.
본 발명의 다른 측면은 융합 폴리펩티드를 포함하는 것을 특징으로 하는 조성물에 관한 것으로, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함한다.
하나의 구체예에서, 상기 조성물은 융합 폴리펩티드를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함한다.
본 발명의 다른 구체예는 융합 폴리펩티드를 포함하는 것을 특징으로 하는 조성물에 관한 것으로, 상기 융합 폴리펩티드는 상기에서 정의된 방법에 의해 생산된다.
본 발명의 다른 측면은 상기에서 정의된 발현 구조물, 벡터, 또는 숙주세포를 포함하는 것을 특징으로 하는 조성물에 관한 것이다.
본 발명의 다른 측면은 상기에서 정의된 조성물을 포함하는 것을 특징으로 하는 시약(reagent)에 관한 것이다.
하나의 구체예에서, 상기 시약은 진단 시약이다. 다른 구체예에서, 상기 시약은 실험실용 시약이다.
본 발명의 다른 측면은 상기에서 정의된 조성물을 포함하는 것을 특징으로 하는 키트에 관한 것이다.
하나의 구체예에서, 상기 키트는 진단 키트이다. 다른 구체예에서, 상기 키트는 실험실용 키트이다. 다양한 구체예에서, 상기 키트는 하나 이상의 다른 시약, 사용자 설명서 등을 선택적으로 포함한다.
하나의 구체예에서, 상기 조성물은 균일한(homogenous) 융합 폴리펩티드 파풀레이션(population)을 포함한다.
하나의 구체예에서, 상기 조성물은 혼합된 융합 폴리펩티드 파풀레이션을 포함한다.
하나의 구체예에서, 상기 조성물은 하나 이상의 DNA-결합 폴리펩티드와 같은 하나 이상의 폴리뉴틀레오티드-결합 폴리펩티드, 하나 이상의 DNA 리가아제 폴리펩티드와 같은 하나 이상의 폴리뉴클레오티드-리가아제 폴리펩티드, 하나 이상의 공동인자(cofactor), 또는 하나 이상의 조효소(coenzyme)를 하나 이상 포함하는 것을 특징으로 한다.
본 발명의 다른 구체예는 하나 이상의 핵산 분자를 연결하는 방법에 관한 것으로, 상기 방법은 하나 이상의 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 것을 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산 분자를 연결(ligate)하는 방법은 하나 이상의 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 DNA 분자이다. 다른 구체예에서, 상기 하나 이상의 핵산 분자는 적어도 두 개의 DNA 분자이다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 하나 이상의 DNA 이중구조(duplex)이다.
하나의 구체예에서, 상기 하나 이상의 DNA 이중구조는 5` or 3` 오버행(overhang)을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 DNA 이중구조는 5' 또는 3‘ 오버행을 포함하지 않는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산을 연결하는 방법은 하나 이상의 융합 폴리펩티트와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 RNA 분자이다. 다른 구체예에서, 상기 하나 이상의 핵산 분자는 적어도 두 개의 RNA 분자이다. 하나의 구체예에서, 하나 이상의 핵산 분자는 적어도 하나의 DNA 분자 및 적어도 하나의 RNA 분자이다.
다양한 구체예에서, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하거나, 또는 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 하나 이상의 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 RNA-리가아제 폴리펩티드를 포함하는 것을 특징으로 하거나, 또는 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 DNA-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
본 발명의 다른 측면은 인산디에스테르 결합의 형성을 촉매하는 방법에 관한 것으로, 상기 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클에오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클로티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 인산디에스테르 결합의 형성을 촉매하는 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 DNA-리가아제 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 인산디에스테르 결합의 형성을 촉매하는 상기 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 이상의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 인산디에스테르 결합은 세포내의 결합이다. 다른 구체예에서, 상기 인산디에스테르 결합은 세포간의 결합이다.
하나의 구체예에서, 상기 방법은 5‘ 또는 3’ 오버행을 포함하는 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 한다. 특히, 호환되는(compatible) 오버행 말단을 가진 하나 이상의 DNA 이중구조를 연결을 포함하는 것을 특징으로 하는 방법이 고려된다.
하나의 구체예에서, 상기 방법은 5‘ 또는 3’ 오버행을 포함하지 않는(즉, 소위 “두 가닥 말단(blunt-ended) 연결”) 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 한다.
호환되는 오버행 말단을 가지고 있는 하나 이상의 DNA 이중구조의 연결을 포함하는 구체예에서, 바람직한 융합 폴리펩티드는 p50-리가아제, 리가아제-p50, NFAT-리가아제, 리가아제-cTF, PprA-리가아제, 리가아제-PprA, p50-LigA, 및 LigA-p50를 포함하는 군으로부터 선택할 수 있고, 더 바람직하게는 p50-리가아제, 리가아제-cTF, 리가아제-PprA, p50-LigA, 및LigA-p50를 함께 포함하는 군으로부터 선택한다.
5‘ 또는 3’ 오버행을 가지고 있지 않거나 또는 호환되는 말단을 가지고 있는 않는 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 하는 구체예에서, 바람직한 융합 폴리펩티드는 p50-리가아제, 리가아제-cTF, 리가아제-p50, NFAT-리가아제, 리가아제-PprA, 및 LigA-p50을 포함하는 군으로부터 선택할 수 있으며, 더 바람직하게는 p50-리가아제, 리가아제-cTF, 및 리가아제-PprA를 함께 포함하는 군으로부터 선택하는 것이다.
본 발명의 다른 구체예는 하나 이상의 핵산 분자를 연결하는 융합 폴리펩티드에 관한 것으로, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드로 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산을 연결하기 위한 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 융합 폴리펩티드는 Sso7d-리가아제, p50-리가아제, 리가아제-p50, NFAT-리가아제, 리가아제-NFAT, cTF-리가아제, 리가아제-cTF, PprA-리가아제, 리가아제-PprA, p50-LigA 및 LigA-p50을 포함하는 군으로부터 선택되며, 이들의 대표적인 예는 실시예에서 설명된다.
하나의 구체예에서, 하나 이상의 핵산 분자를 연결하기 위한 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나 이상의 핵산 분자를 연결하거나 또는 인산디에스테르 결합의 형성을 촉매하기 위한 조성물의 준비에서 상기에서 설명된 융합 폴리펩티드의 용도가 특별히 심사숙고된다.
하기의 구체예는 상기의 모든 내용들과 연관될 수 있다.
다양한 구체예에서, 상기 DNA 리가아제 폴리펩티드는 원핵생물의 DNA 리가아제, 원핵생물의 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편이다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드는 박테리아 DNA 리가아제, 박테이라 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편이다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드는 바이러스 DNA 리가아제, 바이러스 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편으로 예를 들어, 박테리오파지 DNA 리가아제, 변형물, 또는 이들의 기능이 있는 단편을 포함한다.
특히, E.coli DNA 리가아제 폴리펩티드(예를 들어, GenBank 접근 번호 M24278), 변형물 또는 이들의 기능이 있는 단편, 또는 박테리오파지 T4 DNA 리가아제 폴리펩티드(예를 들어, GenBank 접근번호. X00039), 변형물 또는 이들의 기능이 있는 단편이 심사숙고된다.
다양한 구체예에서, 상기 DNA 리가아제 폴리펩티드는 진핵생물의 DNA 리가아제, 또는 이들의 기능이 있는 단편으로 곰팡이 DNA 리가아제, 또는 포유동물의 DNA 리가아제, 또는 이들의 변형물 또는 기능이 있는 단편을 포함한다. 일부 구체예에서, 상기 DNA 리가아제 폴리펩티드는 포유동물의 DNA 리가아제 I, DNA 리가아제 II, DNA 수선 단백질 XRCC 1와 함께 DNA 리가아제 III를 포함하고 있는 DNA 리가아제 III, 또는 이들의 변형물 또는 기능이 있는 단편을 포함하고 있는 군으로부터 선택된다.
다양한 구체예에서, 상기 RNA 리가아제 폴리펩티드는 T4 RNA 리가아제 I 또는 T4 RNA 리가아제 II와 같은 T4 RNA 리가아제이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 서열에 비-특이적인 DNA-결합 폴리펩티드이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 염색체의 단백질, HMf와 유사한 단백질, 및 고세균(archeal)의 작고 기본적인 DNA-결합 단백질을 포함하는 군으로부터 선택된다.
특정 구체예에서, 상기 DNA-결합 폴리펩티드는,
다이노코쿠스 라디오듀런스(Deinococcus radiodurans)의 Ppr 단백질(GenBank 접근 번호 BAA21374); 인간(Homo sapiens (GenBank 접근번호 NP 003989)) 유래의 NF-kappaB 단백질, 또는 NF-kappaB p65 단백질, the NF-kappaB p50 단백질 또는 인간 NF-kappaB 단백질 아미노산 40-366을 포함하고 있는 단편; 결핵균(Mycobacterium tuberculosis) 유래의 Ku 단백질(GenBank 접근번호 NP_215452);
술포로부스 솔파타리쿠스(Sulfolobus solfataricus(GenBank 접근번호 NP_343889)) 유래의 Sso7 단백질;
술포로부스 아키도칼다리우스(Sulfolobus acidocaldarius(GenBank 접근번호 P13123)) 유래의 Sac7d 단백질;
다이노코커스 라디오듀런스(Deinococcus radiodurans (미국특허 제550564호))에서 설명되어져 있고, 상기 미국특허의 전체 내용이 본 발명에서 참조로 사용되었다)의 DdrA 단백질;
생쥐(Mus musculus) 유래의 NFATc 1 단백질과 같은 포유동물의 NFATc 단백질, 또는 생쥐(Mus musculus) 유래의 NFATc 1 단백질의 아미노산 403-703을 포함하고 있는 단편과 같은 이들의 하나 이상의 기능이 있는 단편, 또는 이들의 하나 이상의 기능이 있는 변형물; 또는
인간 NF-kappaB 유래의 아미노산 249-366에 알라닌(alanine) 잔기로 융합된 생쥐(Mus musculus) 유래의 NFATc 아미노산 403-579를 포함하고 있는 NFAT-Ala-p50 하이브리드 DNA-결합 단백질과 같은 이들의 두 개 이상의 모든 조합(본 발명에서 cTF로 언급됨; Lumley 등 (2004), J. Mol. Biol. 339, 1059- 1075 참조-본 발명에서 전체적인 내용이 참조로 사용됨);
을 포함하고 있는 군으로부터 선택된다.
하나의 구체예에서, 상기 DNA-결합 폴리펩티드는 서열에 특이적인 DNA-결합 폴리펩티드, 또는 이들의 기능이 있는 단편 또는 변형물이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 아연집게(zinc finger) 폴리펩티드, 나선 대 나선 연결구조(helix-turn-helix) 폴리펩티드, 나선 고리 나선 구조(helix-loop-helix) 폴리펩티드, 류신지퍼(leucine zipper) 폴리펩티드, 및 Rel 패밀리 전사요소(family transcription factors)를 포함하는 전사요소를 포함하는 군으로부터 선택되는 폴리펩티드이다.
다양한 구체예에서, 융합 폴리펩티드를 코드하는 상기 핵산 서열은,
DNA 연결 폴리펩티드를 코드하는 핵산 서열의 5‘ 또는 3’ 말단과 인접한 DNA-결합 폴리펩티드을 코드하는 핵산 서열, 또는 원하는 길이의 폴리뉴틀레오티드 링커(linker) 또는 스페이서(spacer) 서열에 의해 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 5‘ 또는 3’ 말단에 간접적으로 융합된 DNA-결합 폴리펩티드를 코드하는 핵산 서열;
DNA 리가아제 폴리펩티드를 코드하는 핵산 서열로 삽입되는, 선택된 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열에 의해, DNA-결합 폴리펩티드를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열로, 선택적으로 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열에 의해, 삽입되는 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 사이에 존재하는 프로테아제에 의해 잘리는 사이트를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 사이에 존재하는 자가 스프라이싱(self-splicing) 요소를 코드하는 핵산 서열; 또는
이들의 두 개 이상의 모든 조합;
을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 적어도 하나의 융합 폴리펩티드는,
DNA-결합 폴리펩티드를 포함하거나 또는 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N- 또는 C- 말단 끝과 인접한 DNA-결합 폴리펩티드 결합 도메인을 포함하는 아미노산 서열;
원하는 길이의 펩티드 링커 또는 스페이서 서열에 의해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N- 또는 C- 말단과 간접적으로 융합된 DNA-결합 폴리펩티드를 포함하는 아미노산 서열;
펩티드 링커 또는 원하는 길이의 스페이서 서열에 의해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열로 삽입되는 DNA-결합 폴리펩티드를 포함하는 아미노산 서열;
DNA-결합 폴리펩티드를 포함하는 아미노산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 아미노산 서열 사이에 배치된 프로테아제에 의해 잘려지는 위치를 포함하는 아미노산 서열;
DNA-결합 폴리펩티드를 포함하는 아미노산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 아미노산 서열 사이에 배치된 자가 스프라이싱 요소를 포함하는 아미노산 서열; 또는
이들의 두 개 이상의 모든 조합;
을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 적어도 하나의 융합 폴리펩티드는 실온에서 개선된 안정성, 또는 20℃, 19℃, 18℃, 17℃, 16℃, 15℃, 14℃, 13℃, 12℃, 11 ℃, 10℃, 9℃, 8℃, 7℃, 6℃, 5℃, 4℃, 3℃, 20℃, 2℃, 1℃, 또는 0℃ 에서 개선된 안정성과 같은 개선된 안정성을 가진다. 예를 들어, 실온, 또는 20℃, 19℃, 18℃, 17℃, 16℃, 15℃, 14℃, 13℃, 12℃, 11℃, 10℃, 9℃, 8℃, 7℃, 6℃, 5℃, 4℃, 3℃, 2℃, 1 ℃, 또는 0℃에서 보관될 때, 상기 융합 폴리펩티드는 실온에서 보관될 때, 적어도 약 24시간 동안, 20시간, 16시간, 12시간, 11시간, 약 10, 9, 8, 7, 6, 5, 4, 3, 또는 약 2시간, 또는 약 1시간 동안은 활성을 유지한다.
다양한 구체예에서, 상기 발현 구조물은 항상 발현하는(constitutive) 또는 조절 가능한 프로모터 시스템을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 조절 가능한 프로모터 시스템은 유도하거나 또는 억제할 수 있는 프로모터 시스템이다.
다양한 구체예에서, 상기 조절 가능한 프로모터 시스템은 Lacl, Trp, 파지 λ, 파지 RNA 폴리머레이즈(polymerase), 및 E. coli RNA 폴리머레이즈 프로모터 시스템에서 선택한다.
하나의 구체예에서, 상기 프로모터는 당업자에게 알려진 모든 강력한 프로모터일 수 있다. 적절한 강력한 프로모터는 아데노바이러스의 주요한 후반부(adenoviral major late) 프로모터와 같은 아데노바이러스 프로모터; 또는 거대세포바이러스(cytomegalovirus, CMV) 프로모터; 호흡기 세포 융합 바이러스(respiratory syncytial virus, RSV) 프로모터; MMT 프로모터, 메탈로티오네인(metallothionein) 프로모터; 열 충격(heat shock) 프로모터; 알부민 프로모터; ApoAI 프로모터; 인간 글로빈(globin) 프로모터; 헤르페스 심플렉스 티미민 키나아제(Herpes simplex thymidine kinase) 프로모터와 같은 바이러스 티미딘 키나아제 프로모터; 레트로바이러스(retroviral) LTRs; 베타-엑틴(b-actin) 프로모터; 인간 성장 호르몬 프로모토; T5, T7, SP6 및 T3 RNA 폴리메라제 프로모터와 같은 파지 프로모터 및 꽃양배추의 모자이크(mosaic) 35S(CaMV) 프로모터를 포함한다.
다양한 구체예에서, 상기 프로모터는 서열번호 5의 뉴클레오티드 1-95에서 나타내는 서열을 가진 프로모터이다.
다양한 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중에서 하나의 10개 이상의 인접한 아미노산을 포함한다. 바람직하게는, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중에서 하나에서 적어도 15, 적어도 20, 더 바람직하게는 적어도 30, 더 바람직하게는 적어도 40, 더 바람직하게는 적어도 50, 더 바람직하게는 적어도 60, 더 바람직하게는 적어도 70, 더 바람직하게는 적어도 80, 더 바람직하게는 적어도 90, 더 바람직하게는 100, 더 바람직하게는 적어도 150, 또는 더 바람직하게는 적어도 200개의 인접한 아미노산을 포함한다.
하나의 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중 하나의 서열을 포함하는 폴리펩티드의 기능이 있는 변형물 또는 기능을 있는 단편이다.
다양한 대표적인 구체예에서, 상기 융합 폴리펩티드는,
서열번호 6의 아미노산 18 내지 344;
서열번호 8의 아미노산 18 내지 300;
서열번호 10의 아미노산 18 내지 79; 또는
서열번호 16의 아미노산 514 내지 842;
를 포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 아미노산을 포함하고; 그리고
서열번호 6의 아미노산 358 내지 843;
서열번호 8의 아미노산 311 내지 796;
서열번호 10의 아미노산 90 내지 575; 또는
서열번호 16의 아미노산 18 내지 503;
을 포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 아미노산을 포함하는 것을 특징으로 한다.
다양한 대표적인 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중 하나의 서열을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 본 발명은 서열번호 5, 7, 9, 또는 15 중 하나에서 적어도 10개의 인접한 뉴클레오티드를 포함하는 선별, 정제, 또는 재조합된 폴리뉴클레오티드를 제공한다.
다양한 대표적인 구체예에서, 상기 폴리뉴클레오티드는,
서열번호 5의 뉴클레오티드 166 내지 1146;
서열번호 5의 뉴클레오티드 166 내지 1185;
서열번호 7의 뉴클레오티드 166 내지 1014;
서열번호 7의 뉴클레오티드 166 내지 1044;
서열번호 9의 뉴클레오티드 166 내지 351;
서열번호 9의 뉴클레오티드 166 내지 381;
서열번호 15의 뉴클레오티드 1624 내지 2640; 또는
서열번호 15의 뉴클레오티드 1654 내지 2640;
포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 뉴틀레오티드; 및
서열번호 5의 뉴클레오티드 1147 내지 2643;
서열번호 5의 뉴클레오티드 1186 내지 2643;
서열번호 7의 뉴클레오티드 1015 내지 2502; .
서열번호 7의 뉴클레오티드 1045 내지 2502;
서열번호 9의 뉴클레오티드 352 내지 1839;
서열번호 9 뉴클레오티드 382 내지 1839;
서열번호 15의 뉴클레오티드 166 내지 1623; 또는
서열번호 15의 뉴클레오티드 166 내지 1653;
를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 뉴클레오티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 166-1146를 포함하거나, 또는 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 116 내지 1185를 포함하는 것을 특징으로 한다. 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 1147 내지 2643을 포함하는 것을 특징으로 한다.
또 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 166 내지 2643을 포함한다. 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 서열을 포함한다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오다이드 166 내지 1014를 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 166-1044를 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 1015 내지 2502를 포함한다.
대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 166 내지 2502를 포함한다. 또 다른 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 서열을 포함한다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 351을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 381을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 352 내지 1839를 포함한다.
하나의 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 1839를 포함한다. 또 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 서열을 포함한다.
다양한 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 166 내지 1623을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 166 내지 1653을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 1624 내지 2640을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 1654 내지 2640을 포함한다.
대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 뉴틀레오티드 166 내지 2640을 포함한다. 또 다른 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 서열을 포함한다.
다양한 구체예에서, 상기 세포는 각각 다른 융합 폴리펩티드를 인코드 하는 두 개 이상의 다른 발현 구조물을 포함한다.
본 발명에서 기재된 숫자 범위에 대한 참조는 그 범위 내의(예를 들어, 1, 1.1, 2, 3, 3.9, 4, 5, 6, 6.5, 7, 8, 9 및 10) 합리적인 모든 수 및 그 범위 내의(예를 들어, 2 내지 8, 1.5 내지 5.5, 및 3.1 내지 4.7) 합리적인 수의 모든 범위에 대하여 참조로 사용되도록 의도되었으며, 따라서, 본 발명에서 기재된 모든 범위의 모든 하위 범위는 이런 식으로 기재하여 표현하였다. 이들은 단지 특정하게 의도된 예이며, 열거된 최저값 및 최고값 사이의 모든 가능한 수치의 조합이 유사한 방법으로 이러한 적용방식으로 표현된다.
본 명세서에서 참조로 만들어진 특허 명세서, 기타 외부의 문헌, 또는 기타 정보 공급은 일반적으로 본 발명의 특징을 논하기 위해서이다. 특별히 반대로 언급되어져 있지 않다면, 이러한 외부 문헌에 대한 참조는 이러한 문헌, 또는 이러한 정보가 종래의 기술이거나 또는 당분야의 일반적인 상식적의 부분인 것을 나타내고자 참조한 것은 아니다.
도면의 설명
본 발명의 다른 측면은 단지 예시로 주어진 도면을 참고함으로써, 하기의 도면에 의해 명백해질 것이다.
도 1a는 T4 리가아제 융합 단백질과 외가닥말단(cohesive-end) 연결에 대한 겔(gel) 상에서의 체외 연결 활성 분석의 대표적인 도면이다. 시료는 다음과 같이 적용되었다: 문자 마커(1 및 2번째 줄), Sso7d-리가아제(2번째 줄), cTF-리가아제(3번째 줄), 리가아제-cTF(4번째 줄), p50-리가아제(5번째 줄), 리가아제-p50(6번째 줄), NFAT-리가아제(7번째 줄), 리가아제-NFAT(8번째 줄), PprA-리가아제(10번째 줄), 리가아제-PprA(11번째 줄), Ku-리가아제(12번째 줄), 리가아제-Ku(13번째 줄), T4 DNA 리가아제(14번째 줄), 음성 대조군(15번째 줄).
도 1b는 T4 DNA 리가아제 융합 단백질과 두가닥 말단(blunt-end) 연결에 대한 겔상에서의 체외 연결의 대표적인 도면을 보여준다.
도 2b는 대장균 LigA 리가아제 융합 단백질과 외가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석에 대한 대표적인 도면을 보여준다.
도 2b는 대장균 LigA 리가아제 융합 단백질와 두가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석의 대표적인 도면을 보여준다.
도 3 및 4는 실시예 5에서 설명된 양적인(quantitative) PCR을 기반으로 한 연결 활성 분석의 결과를 보여주는 그래프이다.
도5는 두가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석의 대표적인 도면은 보여준다. 시료는 다음과 같이 적용된다: Sso7d-리가아제(1번째 줄), p50-리가아제(2번째 줄), 리가아제-PprA(3번째 줄), 리가아제-cTF(4번째 줄), T4 DNA 리가아제(5번째 줄), 음성 대조군(6번째 줄), 양성 대조군(7번째 줄), 분자 마커(8번째 줄).
발명의 상세한 설명
본 발명은 융합 폴리펩티드 및 이들의 용도에 관한 것이다. 특히, 본 발명은 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 단백질과 융합된 DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 융합 폴리펩티드 및 다양한 분자 생물학적 방법에서의 이들의 용도에 관한 것이다.
1. 용어 정의
“고세균의 작은 기본적인 DNA-결합 단백질” 구문은 설펄로버스 설파타리쿠스(Sulfolobus sulfataricus)유래의 Sso-7d와 같은 천연상의 고세균의 작은 기본 DNA-결합 단백질에 대한 거의 대략 50 % 동일성을 가지는 50 내지 75 개의 아미노산에 관한 것으로, 천연 고세균의 작은 기본 DNA-결합 단백질에 대하여 특이적인 항체에 결합한다.
단어 “코딩 지역(coding region)" 또는 ”전사 해석들(open reading frame, ORF)“은 적절한 조절 서열에 의해서 전사 산물(transcription product) 및/또는 폴리펩티드를 생산할 수 있는 게놈 DNA 서열 또는 cDNA 서열의 센스가닥(sense standard)에 관한 것이다.
코딩서열은 5‘ 번역 시작 코돈(translation start codon) 및 3' 번역 종결 코돈(translation stop codon)의 존재에 의해 확인된다. 유전자의 구조물 상으로 삽입된 때, “코딩 서열”은 작동하는 프로모터 및 종결(terminator) 서열에 연결될 때 발현될 수 있다.
본 명세서에서 사용되는 단어 "포함하는"은 "적어도 부분으로 이루어지는"것을 의미한다. 본 명세서에서 "포함하는" 단어를 가지고 있는 각각의 문장을 해석할 때는, 그 단어에 의해 발달된 특징 이상이 존재할 수도 있다. 단어 "~을 포함하는" 및 "~것들을 포함하는" 것처럼 관련된 단어들은 같은 방식으로 해석되어야 한다.
당업자들은 몇몇 폴리뉴클레오티드-결합 폴리펩티드는 DNA 및 RNA(및 실제 기타 폴리펩티드의 유사물)에 대하여 활성을 가진다는 것을 인지하고 있을 것이다.
따라서, 단어 ‘폴리뉴클레오티드-결합 폴리펩티드’는 DNA, RNA, 또는 이들의 유사물과 같은 하나 이상의 폴리뉴클레오티드와 결합할 수 있는 폴리펩티드를 말한다.
본 발명에서 사용된 단어 ‘DNA-결합 폴리펩티드는 DNA에 결합할 수 있는 폴리펩티드’에 관한 것으로, 외가닥 DNA, 두가닥 DNA, 및 다른 형태의 DNA에 결합하는 폴리펩티드를 포함한다.
본 발명에서 설명된 것처럼, 상기 DNA-결합 폴리펩티드는 DNA-결합 폴리펩티드 또는 리가아제를 비활성하는 않으면서, DNA 리가아제 폴리펩티드, 예를 들어, DNA 리가아제의 N-말단(terminus) 또는 C-말단(terminus)에 결합할 수 있다.
DNA-결합 폴리펩티드는 DNA 외에 예를 들어, RNA, 또는 알려진 천연 뉴클레오티드의 유사물과 같은 폴리뉴클레오티드에도 결합 할 수 있다.
당업자들은 일부 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 및 RNA(및 실질적인 다른 폴리뉴클레오티드 유사물)에 대한 활성을 가진다는 것을 인지하고 있을 것이다.
단어 ‘DNA 리가아제 폴리펩티드’는 본 발명에서 DNA 폴리펩티드 상에서 우선적인 활성을 보여주는 폴리펩티드에 대하여 우선적으로 사용될 수 있으며, 본 발명에서 사용되는 상기 단어는 일반적으로 인산디에스테르 결합의 형성을 촉매할 수 있는 폴리펩티드를 의미한다.
단어 "도메인(domain)"은 단백질의 한 단위 또는 단백질 복합체를 의미하는 것으로, 폴리펩티드 서열, 완벽한(complete) 폴리펩티드 서열, 또는 복수의 폴리펩티드 서열을 포함하며, 상기 단위는 이미 증명된 기능을 가진다. 상기 기능은 광범위하게 정의 될 수 있는 것으로 이해되어져야 하며, 리간드(ligand) 결합 또는 촉매 활성이거나, 또는 단백질 구조를 안정화하는 효과를 가질 수 있다.
단어 "발현 구조물"은 삽입된 폴리뉴클레오티드 분자를 전사하도록 하는데 필수적인 요소를 포함하는 유전적인 구조물에 관한 것으로, 선택적으로 상기 전사물을 폴리펩트티를 번역하도록 하는 필수적인 요소를 포함한다. 발현 구조물은 전형적으로 5'에서 3‘ 방향으로 하기를 포함한다:
(1) 상기 구조물이 도입된 숙주세포에서 기능을 하는 프로모터,
(2) 발현되는 폴리뉴클레오티드, 및
(3) 구조물이 도입된 숙주세포에서 기능을 하는 종결자(terminator).
본 발명의 발현 구조물은 클로닝 또는 발현을 위해 복제 가능한 벡터로 삽입되거나, 또는 숙주의 게놈으로 병합될 수 있다.
폴리펩티드의 "단편(fragment)" 는 효소의 또는 결합 활성을 위해 필요하고/또는 폴리펩티드이 3차원적 구조를 형성하는데 기능을 하는 폴리펩티드 서열이다.
본 발명에서 사용되는 단어 ‘융합 폴리펩티드’는 두 개 이상의 아미노산의 부분서열(subsequence)을 포함하는 폴리펩티드를 말하는 것으로, 예를 들어, 하나의 연속하는 폴리펩티드를 형성하도록 융합된(예를 들어, 펩티드 연결에 의한 각각의 아미노산 및 카르복실 잔기에 의해서) 두 개 이상의 폴리펩티드를 의미한다.
두 개 이상의 아미노산 서열은 링커 또는 스페이서(spacer) 또는 부가적인 폴리펩티드에 의해서 이들의 각각의 아미노 및 카르복실 말단에 의해 직접적 또는 간접적으로 융합될 수 있음을 이해해야 한다.
하나의 구체예에서, 융합 폴리펩티드를 포함하고 있는 상기 아미노산 서열 중 하나는 DNA 리가아제 폴리펩티드를 포함한다.
하나의 구체예에서, 상기 융합 폴리펩티드를 포함하는 상기 아미노산 서열 중의 하나는 DNA-결합 폴리펩티드를 포함한다.
DNA 리가아제 폴리펩티드 및 DNA-결합 폴리펩티드를 포함하는 대표적인 융합 폴리펩티드는 본 발명의 실시예 및 서열 ID 리스트에서 제시되며, 본 발명에서 특별히 심사숙고하였다.
하나의 구체예에서, 상기 융합 폴리펩티드의 아미노산 부분서열은 DNA 리가아제-링커-DNA-결합 폴리펩티드 또는 DNA-결합 폴리펩티드-링커-DNA 리가아제, 또는 예를 들어, DNA-리가아제-링커-DNA-결합 폴리펩티드 결합 도메인 또는 DNA-결합 폴리펩티드 결합 도메인-링커-DNA 리가아제 순서로 배열된 상기 융합 폴리펩티드의 아미노산 서열인 링커 또는 스페이서에 의해서 간접적으로 융합된다.
다른 구체예에서, 상기 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제-부가적인 폴리펩티드-DNA-결합 폴리펩티드 또는 DNA-리가아제-부가적인 폴리펩티드-DNA-결합 폴리펩티드 결합 도메인, 또는 DNA 리가아제-링커-DNA-결합 폴리펩티드-부가적인 폴리펩티드 또는 DNA 리가아제-링커-DNA-결합 폴리펩티드 결합 도메인-부가적인 폴리펩티드의 순서로 배열된 부가적인 폴리펩티드를 포함하거나 간접적으로 융합한다. 또한, DNA 리가아제와 같은 폴리뉴클레오티드-리가아제 폴리펩티드의 N-말단 확장 및 C-말단 확장 모두는 본 발명에서 특별히 심사숙고되었다.
본 발명에 따른 융합 폴리펩티드는 다른 폴리펩티드의 서열 내에 삽입되는 하나 이상의 폴리펩티드 서열도 포함할 수 있다. 예를 들어, 프로테아제 인식 서열과 같은 폴리펩티드 서열은 DNA-결합 도메인을 포함하고 있는 단백질의 다양한 지역으로 삽입될 수 있다.
용이하게, 본 발명의 융합 폴리펩티드는 하나의 핵산 서열에 의해 코드될 수 있으며, 상기 핵산 서열은 폴리펩티드 또는 폴리펩티드 도메인 각각을 인코드 하는 적어도 두 개의 부분 서열을 포함한다.
일부 구체예에서, 상기 적어도 두 개의 부분 서열은 하나의 전사핵석틀을 포함하며, 본 발명에서 심사숙고된 것처럼 융합 폴리펩티드를 인코드하도록 인프레임(in frame)으로 존재한다.
다른 구체예에서, 상기 적어도 두 개의 부분 서열은 "아웃 어브 프레임(out of frame)"으로 존재할 수 있으며, 번역시에 융합 폴리펩티드가 형성되도록 해독틀(reading frame)에서 변환(shift)을 촉진하는 리보좀 프레임-변환 위치 또는 기타 서열에 의해서 분리될 수 있다.
다른 구체예에서, 상기에서 논의된 적어도 두 개의 폴리펩티드 또는 폴리펩티드 도메인이 부가된 폴리펩티드에 의해 간접적으로 융합되는 것처럼, 적어도 두 개의 부분 서열은 인접하고 있지 않다.
단어 “유전자 구조물”은 폴리뉴클레오티드를 말하는 것으로, cDNA 분자 또는 PCR 산물과 같은(그러나 이로 한정되지 않음) 다른 폴리뉴클레오티드 분자(삽입되는 폴리뉴클레오티드 분자)로 삽입될 수 있는 이중 가닥 DNA를 의미한다.
유전자 구조물은 삽입된 폴리뉴클레오티드의 전사를 허락하는, 선택적으로 전사체가 폴리펩티드로 번역되는 것을 허락하는, 필요한 요소들을 포함할 수 있다.
상기 삽입되는 폴리뉴클레오티드 분자는 숙주 세포로부터 유래되거나 다른 세포 또는 개체로부터 유래될 수 있으며/또는 재조합 폴리뉴클레오티드일 수 있다.
숙주 세포 내에 있게 되면, 상기 유전자 구조물은 숙주 세포의 염색체 DNA로 통합될 수 있다. 상기 유전자 구조물은 벡터에 연결될 수 있다.
단어 “숙주 세포”는 박테리아 세포, 곰팡이 세포, 효모 세포, 식물 세포, 곤충 세포 또는 발현 구조물의 발현을 지지할 수 있는 포유동물의 숙주 세포와 같은 동물 세포를 의미한다.
본 발명에서 사용된 단어 “링커(linker)” 또는 “스페이서(spacer)”는 아미노산 또는 뉴클레오티드 서열에 관한 것으로, 간접적으로 두 개 이상의 폴리펩티드 또는 두 개 이상의 폴리펩티드를 인코드하는 두 개 이상의 핵산 서열에 융합한다.
일부 구체예에서, 상기 링커 또는 스페이서는 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 약 100개의 아미노산 또는 뉴클레오티드 길이이다. 다른 구체예에서, 상기 링커 또는 스페이서는 약 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 또는 약 1000개의 아미노산 또는 핵산 길이이다.
다른 구체예에서, 상기 링커 또는 스페이서는 약 1 내지 1000 개의 아미노산 또는 뉴클레오티드이며, 구체적으로 약 10 내지 약 1000, 약 50 내지 약 1000, 약 100 내지 약 1000, 약 200 내지 1000, 약 300 내지 약 1000, 약 400 내지 1000, 약 500 내지 1000, 약 600 내지 1000, 약 700 내지 1000, 약 800 내지 1000, 약 900 내지 1000 개의 아미노산 또는 뉴클레오티드이다.
하나의 구체예에서, 상기 링커 또는 스페이서는 제한 효소 인식 사이트를 포함할 수 있다. 다른 구체예에서, 상기 링커 또는 스페이서는 엔테로키나아제(enterokinase), 트롬빈(thrombin) 또는 요소 Xa(Factor Xa) 인식 서열과 같은 프로테아제가 인식해서 자르는 서열, 또는 인테인(intein)과 같은 자가 스프라이싱 요소(self-splicing element)를 포함한다. 다른 구체예에서, 상기 링커 또는 스페이서는 융합 폴리펩티드의 독립적인 폴딩(folding)을 촉진한다.
본 발명에서 사용된 단어 “혼합된 파풀레이션(population)”은 두 개 이상의 독립체 파풀레이션을 의미하는 것으로, 상기 혼합된 파풀레이션 내의 각각의 독립체 파풀레이션은 상기 혼합된 파풀레이션내의 다른 독립체 파풀레이션과는 몇 가지 면에서 다르다.
예를 들어, 발현 구조물의 혼합된 파풀레이션과 관련하여 사용될 때, 이것은 두 개 이상의 발현 구조물의 파풀레이션을 의미하는 것으로, 각각의 발현 구조물 파풀레이션은 그 파풀레이션 구성물에 의해 인코드되는 융합 폴리펩티드, 또는 그 구조물 내에 존재하는 프로모터의 종류와 같은 구조물의 몇몇 다른 점들에 의해서 다르다.
별도로, 융합 폴리펩티드의 혼합 파풀레이션과 관련하여 사용될 때, 이것은 두 개 이상의 융합 폴리펩티드 파풀레이션을 의미하는 것으로, 융합 폴리펩티드의 각각의 파풀레이션은 폴리뉴클레오티드-리가아제 폴리펩티드과 같은 폴리펩티드, 예를 들어 DNA 리가아제, 또는 상기 파풀레이션의 멤버가 포함하고 있는 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드와는 다르다.
본 발명에서 사용되는 단어 “핵산”는 디옥시리보뉴클레오티드(deoxyribonucleotide), 리보뉴클레오티드(ribonucleotide) 베이스(base) 또는 본래의 뉴클레오티드의 잘 알려진 유사물, 또는 이들의 혼합물의 외가닥 또는 이중가닥의 중합체(polymer)를 의미한다. 상기 단어는 반대로 언급되지 않았다면, 특정 서열 뿐만 아니라 이들에 상응하는(complementary) 서열을 포함한다. 본 발명에서 단어 “핵산” 및 “폴리뉴클레오티드”는 함께 사용된다.
“작동 가능하도록 연결된”은 발현되는 서열은 프로모커, 조직-특이적인 조절 요소, 일시적인 조절 요소, 증폭자(enhancer), 억제자(repressor) 및 종결자(terminator)를 포함하는 조절 요소하에 배치된다.
단어 "과발현(over-expression)"은 일반적으로 정상적인 또는 형질전환되지 않은(non-trans정방향med) 숙주 세포내의 생산보다 더 많은 생산을 하는 숙주세포내의 유전자의 발현 산물을 의미한다. mRNA의 양과 관련하여 사용되는 단어 "과발현(overexpression)"은 대조군 또는 형질전화되지 않은 세포인 숙주세포에서 일반적으로 관찰되는 것보다 적어도 3배 이상의 발현양을 의미하는 것이다. 바람직하게는, 발현양은 대조군 숙주 세포 또는 형질전환되지 않은 세포에서 관찰되는 것보다. 적어도 약 5배 이상, 약 10배 이상, 약 15배 이상, 약 20배 이상, 약 25배 이상, 약 30배 이상, 약 35배 이상, 약 40배 이상, 약 45배 이상, 약 50배 이상, 약 55배 이상, 약 60배 이상, 약 65배이상, 약 70배 이상, 약 75배 이상, 약 80배 이상, 약 85배 이상, 약 90배 이상, 약 95배 이상, 약 100 이상 또는 그 이상이다.
mRNA의 발현양은 당업자에게 알려져 있는 노던 블랏(Northern blot) 분석 및 양적인(quantitative) RT-PCR을 포함하는 RT-PCR과 같은 여러 가지 기술을 사용하면서 측정될 수 있다.
본 발명에서 사용된 단어 “폴리펩티드”는 모든 길이의 아미노산 체인(chain)을 포함하고, 바람직하게는 적어도 5개의 아미노산으로 전체길이(Full-length) 단백질을 포함하며, 아미노산 잔기는 공유결합의 펩티드 결합에 의해 연결된다.
본 발명의 폴리펩티드는 정제된 천연의 산물이거나, 또는 재조합 또는 합성 기술을 사용하면서 부분적으로 또는 전체적으로 생산될 수 있다. 상기 단어는 이합체(dimer) 또는 다른 다합체(mulimer), 융합 폴리펩티드, 폴리펩티드 변형물 또는 이들의 유도체와 같은 폴리펩티드 응집체인 폴리펩티드를 말한다.
단어 “프로모터”는 유전자의 전사를 조절하는 코딩 지역의 업스트림(upstream)에 있는 전사되지 않는 시스-조절 인자(cis-regulatory element)를 말한다. 프로모터는 전자 시작 사이트(transcription initiation site) 및 TATA(conserved box), 박스, 및 모티프(motif)와 같은 보전된 박스를 특정화하는 시스-조절 인자를 포함한다.
본 발명의 폴리펩티드와 관련하여 사용될 때, 구문 “활성을 유지하는” 및 문법적으로 상응하는 표현 및 이들의 유사한 표현은 폴리펩티드가 유용한 리가아제 활성, 유용한 폴리뉴클레오티드-결합 활성(DNA-결합 활성과 같은), 또는 유용한 리가아제 활성 및 유용한 폴리뉴클레오티드-결합 활성 모두를 여전히 가지고 있음을 나타내기 위함이다.
바람직하게는, 상기 유지된 활성은 적어도 약 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 99 또는 100 %의 기본적인 활성을 가지고, 유용한 범위는 이러한 값들 중에서(예를 들어, 약 35 내지 약 100 %, 약 50 내지 약 100 %, 약 60 내지 약 100%, 약 70 내지 약 100 %, 약 80 내지 약 100 %, 및 약 90 내지 약 100%) 선택될 수 있다. 예를 들어, 본 발명의 바람직한 폴리펩티드는 주어진 보관 기간 동안, 예를 들어, 4 도에서 약 1시간 후에 상기 폴리펩티드의 원래의 활성에서 적어도 약 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 99 또는 100 % 활성을 유지한다. 유사하게, 본 발명의 바람직한 조성물은 이들이 포함하는 폴리펩티드의 유용한 활성의 유지를 도울 수 있으며, 본 발명에서 심사숙고된 방법을 사용하면서 사용될 때까지 이상적으로 활성을 유지할 수 있다.
본 발명에서 사용된 단어 “개선된 안정성”이 본 발명의 폴리펩티드 또는 조성물과 관련하여서 사용될 때, 상기 단어는 주어진 기간, 또는 특별한 상황에서, 또는 두 가지의 조건에서, 예를 들어 4 도에서 1시간, 활성을 유지할 수 있는 폴리펩티드 또는 주어진 기간 동안 폴리펩티드의 활성을 도울 수 있는 조성물을 의미한다. 일부 구체예에서, 본 발명의 융합 폴리펩티드의 상기 유지된 리가아제 활성은 같은 기간 동안 같은 조건에서 유지될 때 천연의 리가아제 폴리펩티드에서 보이는 것보다 더 우수하다. 다른 구체예에서, 본 발명의 융합 폴리펩티드의 상기 유지된 폴리뉴클레오티드-결합 활성은 같은 기간 동안 같은 조건에서 유지될 때 천연의 폴리뉴클레오티드-결합 폴리펩티드에서보다 더 우수하다.
구문 “서열 특이성이 없는 DNA-결합 도메인”은 뉴클레오티드 서열에 독립적인 방법으로 DNA(및 다른 핵산을 선택할 수 있음)에 대한 분명한 친화력으로 결합하는 폴리펩티드 도메인을 의미한다. 예를 들어, 별개의 뉴클레오티드 서열이 아닌 동일한 뉴클레오티드 조성물을 가진 것으로 다른 핵산보다 10배 이상, 또는 20배 이상, 또는 50배 이상, 또는 100배 이상의 친화력을 가지고 폴리펩티드 도메인에 결합할 수 있는 것으로 알려진 핵산이 없다.
구문 “서열 특이적인 DNA-결합 도메인”은 핵산 서열에 의존적인(dependent) 방식으로 DNA(및 다른 핵산을 선택할 수 있음)에 대한 분명한 친화력을 가지고 결합하는 폴리펩티드를 말한다. 예를 들어, 별개의 뉴클레오티드 서열이 아닌 동일한 뉴클레오티드 조성물을 가진 다른 핵산보다 10배 이상, 20배 이상, 50배 이상, 또는 100이상의 친화력으로 폴리펩티드 도메인에 결합할 수 있는 알려진 핵산이 있다.
단어 “물질(substance)”는 의도된 융합 폴리펩티드와 결합하거나, 흡수되거나, 또는 병합되는 것과 관련하여 언급될 때, 중합체 융합 폴리펩티드내로 흡수되거나 병합될 수 있는 융합 파트너 또는 물질에 의해 결합되는 물질을 의미한다.
단어 "종결자(terminator)"는 번역되는 서열의 다운스트림(dowmsteam)에 있는 유전자의 3'의 번역되지 않는 끝 쪽(ntranslated end)에서 발견되는 전사를 종결하는 서열을 말한다. 종결자는 mRNA의 안정성을 결정에 영향을 주는 중요한 결정자로, 몇몇 경우에서 공간적인 조절 기능을 가지는 것으로 알려졌다.
본 발명에서 제공되는 폴리뉴클레오티드 서열의 "단편(fragment)"는 연속하는 뉴클레오티드 서열로, 바람직하게는 적어도 15개 이상의 뉴클레오티드이다. 본 발명의 단편은 바람직하게는 본 발명의 폴리뉴클레오티드 중에서 적어도 20개의 뉴클레오티드, 더 바람직하게는 적어도 30개의 뉴클레오티드, 더 바람직하게는 적어도 40개 이상의 뉴클레오티드, 더 바람직하게는 50개 이상의 뉴클레오티드 및 가장 바람직하게는 적어도 60개의 연속하는 뉴클레오티드이다.
프로모터 폴리뉴클레오티드 서열과 관련하여 단어 "단편(fragment)"는 시스-인자를 포함하는 서열 및 상기 단편이 작동가능하도록 연결된 폴리뉴클레오티드 서열의 발현을 조절할 수 있는 프로모터 폴리뉴클레오티드 서열 부분을 포함한다. 본 발명의 폴리뉴클레오티드 서열의 단편은 본 발명의 폴리뉴클레오티드 중에서 바람직하게는 적어도 20개, 더 바람직하게는 적어도 30개, 더 바람직하게는 적어도 40개, 더 바람직하게는 적어도 50개, 더 바람직하게는 적어도 100개, 더 바람직하게는 적어도 200개, 더 바람직하게는 적어도 300개, 더 바람직하게는 적어도 400개, 더 바람직하게는 적어도 500개, 더 바람직하게는 적어도 600개, 더 바람직하게는 적어도 700개, 더 바람직하게는 적어도 800개, 더 바람직하게는 적어도 900개 및 가장 바람직하게는 적어도 100개의 뉴클레오티드를 포함한다.
본 발명에서 사용된 단어 "기능을 가지는 변형물(functional variant)" 및 "기능을 가지는 단편(functional fragment)"은 예를 들어, DNA 리가아제(들) 또는 DNA-결합 폴리펩티드(들)과 관련하여, 하나 이상의 아미노산 잔기가 삭제, 치환, 또는 첨가된 특이적으로 확인된 서열(들)과는 다른 폴리펩티드 서열 또는 특이적으로 확인된 서열(들)의 단편을 포함하는 서열을 말한다. 기능을 가지는 변형물은 자연적으로 발생하는 대립형질의(allelic) 변형물, 또는 비-자연적으로 발생하는 변형물일 수 있다. 기능을 가지는 변형물은 동일한 또는 다른 종래이며, 호모로그(homologue), 패러로그(paralogue) 및 오쏘로그(orthologue)을 포함할 수 있다. 폴리펩티드의 기능을 가지는 변형물 또는 기능을 가지는 단편은 자연적인 폴리펩티드에 의해 알려진 하나 이상의 생물학적인 효과를 얻을 수 있는 것과 같은 자연적으로 특이성을 가지는 것으로 증명된 폴리펩티드의 생물학적 활성을 하나 이상 가진다. 예를 들어, DNA 리가아제의 기능이 있는 단편은 일반적으로 인산디에스테르 결합의 형성을 촉매할 수 있을 것이다.
기능이 있는 변형물 또는 기능이 단편은 본래의 폴리펩티드보다 더 크거나 적은 활성을 가질 수 있다. 하나의 예로, 기능이 있는 변형물 또는 기능이 있는 단편이 가지고 있는 특이적으로 확인된 폴리펩티드의 하나 이상의 생물학적 활성은 본래의 폴리펩티드에서 발견되것보다 기능이 있는 변형물 또는 기능이 있는 단편에서 더 크거나 낮은 정도에서 존재할 수 있다.
다른 예에서, 기능이 있는 변형물 또는 기능이 있는 단편이 가지고 있는 특이성이 있는 것으로 확인된 본래의 폴리펩티드의 각각의 생물학적 활성은 본래의 폴리펩티드에서 발견된 것보다 기능이 있는 변형물 또는 기능이 있는 단편에 더 크거나 낮은 정도로 존재한다. 다른 예에서, 하나 이상의 본래의 폴리펩티드의 생물학적 활성이 유지되거나 본래의 폴리펩티드에서 발견되는 것보다 더 큰 정도로 생물학적 활성이 존재하는 기능이 있는 변형물 또는 기능이 있는 단편을 제공하는 것이 바람직하지만, 본래의 폴리펩티드의 다른 하나 이상의 생물학적 활성은 존재하지 않거나 또는 본래의 폴리펩티드에서 발견되는 것보다 더 낮은 정도로 존재한다. 이러한 기능이 단편의 예는 본 발명에서 설명되는 NF-kappaB 및 NFAT DNA 결합 폴리펩티드 단편을 포함한다.
DNA 리가아제와 같은 폴리뉴클레오티드-리가아제, 또는 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드에 의해 알려지는 하나 이상의 생물학적 효과를 확인하는 방법 또는 분석은 당 분야에서 잘 알려져 있으며, 본 발명의 실시예에서 설명되고, 이러한 방법 및 분석은 하나 이상의 기능이 있는 변형물 또는 폴리뉴클레오티드 리가아제 또는 폴리뉴클레오티드-결합 폴리펩티드의 기능이 있는 단편을 증명하고 확인하기 위해 사용될 수 있다. 예를 들어, 실시예에서 설명된 것과 같은 하나의, 큰 단편을 형성하는 두 개의 선형 DNA 단편의 연결을 촉매하는 DNA 리가아제의 능력 분석은 DNA 리가아제의 하나 이상의 기능이 있는 변형물 또는 기능이 있는 단편을 확인하는 것으로 가능하다.
기능을 가지는 단편의 예는 촉매 활성에 큰 영향을 끼치는(예를 들어, 서열에 비특이적인 DNA 결합, 또는 인산디에스테르결합 형성) 아미노산 서열을 포함하는 폴리펩티드 단편을 포함한다.
본 발명의 폴리펩티드 서열의 바람직한 단편(첨부된 서열 확인 목록에서 확인되는 서열)은 본 발명의 폴리펩티드 중에서 적어도 10개, 적어도 15개, 적어도 20개, 더 바람직하게는 30개, 더 바람직하게는 40개, 더 바람직하게는 50개, 더 바람직하게는 60개, 더 바람직하게는 70개, 더 바람직하게는 80개, 더 바람직하게는 90개, 더 바람직하게는 100개, 더 바람직하게는 150개, 더 바람직하게는 200개, 더 바람직하게는 250개, 더 바람직하게는 300개, 더 바람직하게는 350개, 더 바람직하게는 400개, 가장 바람직하게는 450개의 연속하는 아미노산 서열을 포함한다.
단어 "프라이머(primer)"는 항상 유리의 3‘ OH기를 가지는 짧은 뉴클레오티드를 말하는 것으로, 주형에 혼성화(hybridize)되며 상보적인 폴리뉴클레오티드의 중합을 시작하기 위하여 사용된다.
이러한 프라이머는 바람직하게는 적어도 5개, 더 바람직하게는 적어도 6개, 더 바람직하게는 적어도 7개, 더 바람직하게는 적어도 8개, 더 바람직하게는 적어도 9개, 더 바람직하게는 적어도 10개, 더 바람직하게는 적어도 11개 , 더 바람직하게는 적어도 12개, 더 바람직하게는 적어도 13개, 더 바람직하게는 적어도 14개, 더 바람직하게는 적어도 15개, 더 바람직하게는 적어도 16개, 더 바람직하게는 적어도 17개, 더 바람직하게는 적어도 18개, 더 바람직하게는 적어도 19개, 더 바람직하게는 적어도 20개의 뉴클레오티드 길이이다.
단어 "프로브(probe)"는 짧은 폴리뉴클레오티드를 말하는 것으로 하이브리디제이션(hybridization)을 기본으로 한 분석에서 프로브에 상보적인 폴리뉴클레오티드 서열을 탐지하고자 사용된다.
상기 프로브는 본 발명에서 정의되는 폴리뉴클레오티드의 “단편”으로 이루어질 수 있다. 이러한 프로브는 바람직하게는 적어도 5개, 더 바람직하게는 적어도 10개, 더 바람직하게는 적어도 20개, 더 바람직하게는 적어도 30개, 더 바람직하게는 적어도 40개, 더 바람직하게는 적어도 50개, 더 바람직하게는 적어도 100개, 더 바람직하게는 적어도 200개, 더 바람직하게는 적어도 300개, 더 바람직하게는 적어도 400개 및 가장 바람직하게는 적어도 500개의 뉴클레오티드 길이다.
본 발명에서 사용된 단어 "변형물(variant)"은 특이적으로 확인된 서열과는 다른 폴리뉴클레오티드 또는 폴리펩티드 서열을 말하는 것으로, 하나 이상의 폴리뉴클레오티드 또는 아미노산 잔기는 삭제, 치환, 또는 첨가된다. 변형물은 자연적으로 발생하는 대립형질의(allelic)의 변형물, 또는 자연적으로 발생하지 않는 변형물일 수 있다. 변형물은 동일한 또는 다른 종 유래일 수 있으며, 호모로그(homologue), 패러로그(paralogue) 및 오쏘로그(orthologue)을 포함할 수 있다. 일부 구체예에서, 상기 폴리뉴클레오티드 및 폴리펩티드의 변형물은 야생형(wild type) 폴리뉴클레오티드 또는 폴리펩티드와 동일하거나 유사한 생물학적 활성을 가진다. 폴리뉴클레오티드 및 폴리펩티드과 관련하여 단어 "변형물(varient)"은 본 발명에서 정의된 모든 형태의 폴리뉴클레오티드 및 폴리펩티드를 포함한다.
폴리뉴클레오티드 및 폴리펩티드 변형물
본 발명에서 사용된 단어 "폴리뉴클레오티드(polynucleotide(s))"는 모든 길이의 외가닥 또는 이중 가닥 디옥시리보뉴클레오티드(deoxyribonucleotide) 또는 리보뉴클레오티드(ribonucleotide)를 의미하고 코딩 및 코딩되지 않는 유전자 서열, 센스(sense) 및 안티센트(antisense) 서열 상보물(complement), 엑손(exon), 인트론(intron), 게놈 DNA, cDNA, mRNA 전구체, mRNA, rRNA, siRNA, miRNA, tRNA, 리보자임(ribozyme), 재조합 폴리펩티드, 선별되고 정제된 자연적으로 발생하는 DNA 또는 RNA 서열, 합성 RNA 및 DNA 서열, 핵산 프로브, 프라이머 및 단편을 의미한다. 많은 수의 핵산 유사물이 당 분야에서 잘 알려져 있으며, 또한 심사숙고된다.
폴리 뉴클레오티드 변형물
폴리뉴클레오티드 유사물의 서열은 특정한 폴리뉴클레오티드 서열에 대하여 바람직하게는 적어도 50 %, 더 바람직하게는 적어도 51 %, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 적어도 60%, 적어도 61 %, 적어도 62%, 적어도 63%, 적어도 64%, 적어도 65%, 적어도 66%, 적어도 67%, 적어도 68%, 적어도 69%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 보인다. 동일성은 적어도 20개의 뉴클레오티드, 바람직하게는 적어도 20개의 뉴클레오티드, 적어도 100개의 뉴클레오티드 위치, 또는 특정된 폴리뉴클레오티드의 전체 길이에 걸쳐서 위치를 비교하는 방식으로 확인해야 한다.
폴리뉴클레오티드 서열의 동일성은 하기의 방법으로 결정될 수 있다. 목적하는 폴리뉴클레오티드 서열은 NCBI (ftp://ftp.ncbi.nih.gov/blast/)에 공개되어 사용 가능한 BLASTN(bl2seq내에 있는 BLAST 속편 프로그램, 버전 2.2.10(2004년 10월(Tatiana A. Tatusova, Thomas L. Madden (1999), "Blast 2 sequences - a new tool 정방향 comparing protein-and nucleotide sequences", FEMS Microbiol Lett. 174:247-250)) 사용하여서 후보의 폴리뉴클레오티드 서열에 비교된다. bl2seq의 초기값은 낮은 복잡성 부분(low complexity part)의 여과를 끄지 않고 사용된다.
폴리뉴클레오티드 서열은 동일성은 하기의 유닉스 명령 선 값(unix command line parameter)을 사용하면서 평가될 수 있다.
bl2seq -i nucleotideseql -j nucleotideseq2 -F F -p blastn
패러미터 -F F는 복잡성이 낮은 부분을 여과하는 것을 끈다. 상기 매개변수 -P는 서열 쌍에 대한 적절한 알고리즘을 선택한다. 상기 bl2seq 프로그램은 "Idnetidities =" 줄에서 동일한 뉴클레오티드 수와 퍼센트로 서열의 동일성을 나타낸다.
폴리뉴클레오티드 서열의 동일성은 세계적인 서열 정렬 프로그램(즉, Needleman, S. B. 및 Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453)을 사용하면서 후보자와 비교하는 폴리뉴클레오티드 서열 간의 겹치는 전체적인 길이에 걸쳐서 계산될 수도 있다. 세계적인 정렬 알고지금의 전체적인 실행은 EMBOSS 패키지 내의 니들(needle) 프로그램(Rice, P. Longden, I. and Bleasby, A. EMBOSS: The European Molecular Biology Open Software Suite, Trends in Genetics June 2000, vol 16, No 6. pp.276-277)에서 발견되며, http://www.hgmp.mrc.ac.uk/Software/EMBOSS/. Needleman-Wunsch에서 얻을 수 있다. 유럽 생물정보학 연구소(European Bioin정방향matics Institute) 서버도 http:/www.ebi.ac.uk/emboss/align/에서 두 서열간의 EMBOSS-니들 세계적인 정렬을 수행하는 기능을 제공한다.
별개로 상기 GAP 프로그램은 말단의 차이(terminal gap)에 패널티 없이 두 개의 서열에 대한 최적의 전체적인 정렬(alignment)을 계산하고자 사용될 수 있다. GAP은 다음의 논문에서 설명되어져 있다: Huang, X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235.
본 발명의 폴리뉴클에오티드 변형물은 이러한 서열의 기능적인 유사성을 가질 것으로 고려되는 하나 이상의 특이적인 것으로 확인된 서열에 대한 유사성을 보이며 우연에 의해 발생되지 않았을 것으로 합리적으로 판단되는 것들도 포함한다. 폴리펩티드와 관련하여 이러한 서열의 유사성은 BLAST 속편 프로그램(NCBI (ftp://ftp.ncbi.nih.gov/blast/)의 버전 2.2.10(2004년 10월)의 공개되어 사용가능한 bl2seq 프로그램을 사용하여서 판단될 수 있다.
폴리뉴클레오티드의 서열의 유사성은 다음의 유닉스 명령 선 값을 사용하면서 평가될 수 있다: bl2seq -i nucleotideseql -j nucleotideseq2 -F F -p tblastx
상기 값 -F F는 낮은 복잡성 부분의 여과를 끈다. 상기 값 -p 은 서열쌍에 대한 적절한 알고리즘을 선택한다. 상기 프로그램은 상기 서열간의 유사한 지역을 발견하고 각각의 지역에 대하여 무작위 서열을 포함하고 있는 고정된 크기의 참조의 데이터베이스내에서 우연하게 일치되어 발견될 수 있는 것으로 평가되는 횟수인 “E 값”을 제공한다. 이러한 데이터베이스의 크기는 bl2seq 프로그램내의 디폴트 초기값에 의해 설정된다. 1 보다 훨씬 작은 E 값은 이러한 무작위적인 맞춤의 대략적인 가능성이다.
변형물 폴리뉴클레오티드 서열이 특이적인 것으로 확인된 서열의 어떤 하나와 비교될 때, 바람직하게는 1 x 10-10 이하, 더 바람직하게는 1 x 10-20 이하, 1 x 10-30 이하, 1 x 10-40 이하, 1 x 10-50 이하, 1 x 10-60 이하, 1 x 10-70 이하, 1 x 10-80 이하, 1 x 10-90 이하, 1 x 10-100 이하, 1 x 10-110 이하, 1 x 10-120 이하, 또는 1 x 10-123 이하의 E 값을 보여준다.
별개로, 본 발명의 변형물 폴리뉴클레오티드는 엄격한 상태에서 특이적인 폴리뉴클레오티드 서열, 또는 이들의 상보물에 혼성화한다.
단어 “엄격한 상황에서 혼성화한다”, 및 이의 문법적으로 유사한 단어는 알려진 온도 및 염 농도에서 타겟 폴리뉴클레오티드 분자에(서던 블랏(Southern blot) 또는 노던 블랏(Northern blot)과 같은 DNA 또는 RNA 블랏위에 고정되는 타겟 폴리뉴클레오티드 분자와 같은) 혼성화하는 폴리뉴클레오티드 분자의 능력을 말한다. 엄격한 하이브리다이제이션 상태에서 혼성화하는 능력은 초기에 덜 엄격한 상태에서 혼성화 한 후, 원하는 엄격함으로 엄격성을 높임으로써 결정될 수 있다.
약 100 베이스보다 큰 폴리뉴클레오티드 분자와 관련하여, 일반적인 엄격한 하이브리다이제이션 조건은 천연의(native) 이중구조물의 녹는 온도(Tm) 이하인 25 ℃ 내지 30 ℃ 이하(예를 들어, 10 ℃) 이다(일반적인 참조, Sambrook 등, 1987 에디션, Molecular Cloning, A Laboratory Manual, 2nd Ed. Cold Spring Harbor 출판; Ausubel 등, 1987, Current Protocols in Molecular Biology, Greene 출판). 100 베이스보다 큰 폴리뉴클레오티드의 Tm은 공식: Tm = 81. 5 + 0. 41 % (G + C)-log (Na+)에 의해 계산될 수 있다(Sambrook 등, 1987 에디션, Molecular Cloning, 실험실 메뉴얼, 2번째 에디션, Cold Spring Harbor Press; Bolton 및 McCarthy, 1962, PNAS 84: 1390). 100 베이스보다 큰 길이의 폴리뉴클레오티드의 일반적인 엄격한 조건은 하룻밤동안 6X SSC, 0.2% SDS에서의 준비 세척; 65℃, 6X SSC, 0.2% SDS에서 하이브리다이제이션; 65 ℃, 1X SSC, 0.1% SDS에서 30분간 두 번 세척 및 65 ℃ 0.2 X SSC, 0.1% SDS에서 30분간 2번 세척과 같은 하이브리다이제이션 조건일 수 있다.
100 베이스보다 적은 길이의 폴리뉴클레오티드 분자와 관련하여, 대표적인 엄격한 하이브리다이제이션 조건은 5 내지 10 ℃ 이하의 Tm이다. 평균적으로, 100 bp 이하의 폴리뉴클레오티드 분자의 Tm은 대략 (500/올리고뉴클레오티드 길이)도로 감소된다.
DNA를 모방한 펩티드 핵산(PNAs)와 관련하여(Nielsen 등, Science. 1991년 12월 6;254(5037): 1497-500), Tm값은 DNA-DNA 또는 DNA-RNA에 대한 것보다 더 높고, Giesen 등, Nucleic Acids Res. 1998년 11월, l ;26(21):5004-6에서 설명된 공식에 의해서 계산될 수 있다. 100 베이드 미만의 길이인 DNA-RNA 하이브리드의 대표적인 엄격한 하이브리다이제이션 조건은 5 내지 10 ℃ 이상의 Tm이다.
본 발명의 변형물 폴리뉴클레오티드는 본 발명의 서열과는 다른 폴리뉴클레오티드도 포함하지만, 유전자 코드의 변경처럼, 본 발명의 변형물 폴리뉴클레오티드는폴리뉴클레오티드에 의해 인코드되는 폴리펩티드에 대하여 유사한 활성을 가지는 폴리펩티드를 인코드한다.
폴리펩티드의 아미노산 서열을 바꾸지 않는 서열 변경은 “조용한 변이(silent variation)”이다. ATG(메티오닌, methionine) 및 TGG(트립토판, tryptophan)를 제외하고, 동일한 아미노산의 다른 코돈은 당분야에서 알려진 기술에 의해서 특정 숙주 개체내의 코돈의 발현을 최적하고자 변경될 수 있다. 생물학적 활성을 바꾸지 않고 인코드된 폴리펩티드 서열내의 하나 이상의 아미노산의 보존되는 치환으로 결과되는 폴리뉴클레오티드 서열 변경도 본 발명에 포함된다. 당업자는 유전자형과 관련하여 조용한 아미노산 치환을 만드는 방법을 인지하고 있을 것이다(참조, Bowie 등, 1990, Science 247, 1306). 일부 구체예에서, 보존되지 않는 아미노산 치환으로 결과되는 폴리뉴클레오티드 서열 변경은 본 발명에서 심사숙고된 기능적인 변형물을 초래하며, 이러한 서열 변경도 본 발명에 포함된다.
인코드되는 폴리펩티드 서열내의 조용한 다양화 및 보전된 치환에 의한 다양한 폴리뉴클에오티드는 상기에서 설명된 것처럼, 공개되어 사용가능한 BLAST 속편 프로그램의 bl2seq 프로그램(버전 2.2.10, 2004년 10월), NCBI (ftp://ftp.ncbi.nih.gov/blast/)을 사용하면서 결정될 수 있다.
폴리펩티드 변형물
폴리펩티드와 관련하여 단어 “변형물”은 자연적으로 발생하고, 재조합되며, 합성에 의해 생산된 폴리뉴클레오티드를 포함한다. 폴리펩티드 변형물은 본 발명의 서열에 대하여 바람직하게는 적어도 50%, 더 바람직하게는 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 적어도 60%, 적어도 61%, 적어도 62%, 적어도 63%, 적어도 64%, 적어도 65%, 적어도 66%, 적어도 67%, 적어도 68%, 적어도 69%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 보인다.
동일성은 적어도 20개의 아미노산 위치, 바람직하게는 적어도 50개의 아미노산 위치, 적어도 100개의 아미노산 위치, 또는 본 발명의 폴리펩티드의 전체 길이를 비교하는 것으로 확인된다.
폴리펩티드 서열의 동일성은 다음의 방법으로 결정될 수 있다. 비교되는 폴리펩티드 서열은 NCBI(ftp://ftp.ncbi.nih.gov/blast/bl2seq)에서 공개되어 사용가능한 bl2seq 내의 BLASTP(BLAST의 속편 프로그램, 버전 2.2.10, 2004년 10월)를 사용하면서 후보 폴리펩티드 서열과 비교된다. bl2seq의 기초값은 낮은 복잡성을 갖는 지역의 여과를 끄지 않고 사용될 수 있다.
폴리펩티드 서열의 동일성은 세계적인 서열 정렬 프로그램을 사용하여서 후보 폴리뉴클레오티드 서열 및 비교되는 폴리뉴클레오티드 서열 사이의 겹치는 전체 길이에 걸쳐서 계산될 수도 있다. 상기에서 논의된 EMBOSS-니들(httpr/www.ebi. ac.uk/emboss/align/) 및 GAP (Huang, X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235)도 폴리펩티드 서열 동일성을 평가하는데 적절한 세계적인 서열 정렬 프로그램이다.
또한, 본 발명의 폴리펩티드 변형물은 이러한 서열의 기능적인 유사성을 보전하고 있음직한 특이적으로 확인된 하나 이상의 서열에 대하여 유사성을 보이는 것들 및 무작위적인 변경에 의해 발생했을 것으로 예상되지 않는 것들을 포함한다. 폴리펩티드와 관련하여 이러한 서열 유사성은 NCBI(ftp://ftp.ncbi.nih.gov/blast/)의 BLAST 속편 프로그램(버전 2.2.10, 2004년 10월)인 공개되어 사용가능한 bl2seq을 사용하면서 판단할 수 있다. 폴리펩티드 서열의 유사성은 다음의 유닉스 명령 선 값을 사용하면서 평가될 수 있다: bl2seq -i peptideseql -j peptideseq2 -F F -p blastp.
특이적으로 확인된 서열중의 하나와 비교될 때, 변형물 폴리펩티드 서열은 바람직하게는 1 x 10-10 미만, 더 바람직하게는 1 x 10-20 미만, 1 x 10-30 미만 1 x 10-40 미만, 1 x 10-50 미만, 1 x 10-60 미만, 1 x 10-70 미만 1 x 10-80 미만, 1 x 10-90 미만, 1 xlO-100 미만, 1 x 10-110 미만, 1 x 10-120 미만, 또는 1 x 10-123 미만의 E 값을 나타낸다.
값 -FF는 낮은 복잡성 부위를 여과하는 것을 끈다. 값 -p는 서열쌍에 대한 적절한 알고리즘을 선택한다. 이러한 프로그램은 서열간의 유사한 지역을 발견하고, 각각의 지역에 대하여, 무작위적인 서열을 포함하고 있는 고정된 크기의 참조인 데이터베이스내에서 우연하게 맞는 기대되는 값인 "E 값"을 보고한다. 1보다 훨씬 작은 E값은 이러한 무작위적인 맞춤의 대략적인 가능성이다.
생물학적 활성의 분명한 변경이 없는 것으로 설명되는 폴리펩티드 서열의 하나 이상의 아미노산의 보전된 치환도 본 발명에 포함된다. 당업자는 유전자형과 관련하여 조용한 아미노산 치환을 만드는 방법을 인지하고 있을 것이다(참조, Bowie 등, 1990, Science 247, 1306), 반면에, 보전되지 않은 치한을 포함하는 하나 이상의 아미노산 치환에 의한 기능적인 변형물이 본 발명에 포함된다.
또한, 본 발명의 폴리펩티드 변형물은 폴리펩티드를 인코드하는 핵산에 의해 생산되지만, 변경된 아미노산 서열을 갖도록 다르게 처리되어 야생형 폴리펩티드와는 다른 것을 포함한다. 예를 들어, 변형물은 야생형 폴리펩티드를 생산하는 초기의(primary) RNA 전사물의 별도의 스프라이싱 형태에 의해 생산될 수 있다.
단어 “벡터(vector)"는 폴리뉴클레오티드 분자를 말하는 것으로, 숙주세포내로 유전자 구조를 이송하는데 사용되는 이중 가닥 DNA이다. 상기 벡터는 대장균과 같은 적어도 하나의 부가적인 숙주 시스템에서 복제될 수 있다.
2. 폴리뉴클레오티드 리가아제
폴리뉴클레오티드 리가아제(또한 여기에서 폴리뉴클레오티드-리가아제 폴리펩티드로서 나타낸다)는 하나의 뉴클레오티드의 3’수산기 말단과 다른 뉴클레오티드의 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 할 수 있는 폴리펩티드이다. 예를 들면, DNA 리가아제(또한 여기에서는 DNA 리가아제 폴리펩티드로서 나타낸다)는 하나의 디옥시리보오스 뉴클레오티드의 3’수산기 말단과 다른 디옥시리보오스 뉴클레오티드의 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 할 수 있는 폴리펩티드이다. 일반적으로 Tomkinson 등, (2006), Chem. 역방향., 106, 687-699에서 검토된 DNA 리가아제는 본 발명에 포함된다. 또한, RNA 리가아제는 하나의 리보오스 뉴클레오티드 3’수산기 말단과 다른 리보오스 뉴클레오티드 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 한다.
2.1 바이러스 DNA 리가아제
가장 단순한 DNA 리가아제는 박테리오파지를 포함하는 바이러스로부터 유래된다. 바이러스 DNA 리가아제는 뉴클레오티드-결합 도메인 및 OB-폴드 도메인인 두 개의 도메인을 포함한다(Tomkinson 등, 2006). 바이러스 DNA 리가아제는 활성을 위하여 뉴클레오티드 보조인자 아데노신-5’-트리포스페이트(ATP)가 필요하다. 박테리오파지 T4 유래의 DNA 리가아제는 DNA, RNA 또는 DNA/RNA 하이브리드 이중구조 상에서 이중가닥 말단이고 그리고 외가닥 말단된 DNA 말단 뿐만 아니라 회복된 단일가닥과 연결되기 때문에 보통 체외 적용에서 사용된다. T4 DNA 리가아제를 포함하는 바이러스 리가아제는 본 발명에서 사용되기 위하여 처리할 수 있을 것이다.
2.2 원핵생물의 DNA 리가아제
박테리아는 활성을 위하여 ATP 대신 니코틴아미드 아데닌 디뉴클레오티드 (NAD+) 보조인자를 요구하는 DNA 리가아제를 포함한다. AND+-의존 DNA 리가아제는 뉴클레오티드-결합 및 OB-폴드 도메인, DNA-결합 및/또는 촉매작용을 돕는 하나 또는 하나 이상의 추가적인 도메인으로 이루어진 코어 모듈을 포함한다 Tomkinson 등, 2006). 대장균 유래의 NAD+-의존 리가아제는 이중가닥 말단 DNA 종점에 연결되지 않고, DNA는 RNA에 연결되지 않는다. 그러므로, NAD+-의존 리가아제는 선택적인 외가닥 말단의 연결이 필요하기 때문에 체외 적용에서 사용된다. 대장균 DNA 리가아제를 포함하는 NAD+-의존 박테리아 리가아제는 본 발명에서 사용되기 위하여 처리할 수 있을 것이다.
2.3 진핵 생물 및 고세균 DNA 리가아제
진핵 생물 및 고세균 유래의 DNA 리가아제는 ATP-의존적인 다양한-도메인 효소이다. 각각의 진핵 생물 게놈은 하나의 DNA 리가아제보다 더 인코드된다. 서로 다른 세포의 역할을 위한 서로 다른 리가아제의 보충은 추가적인 단백질 인자들과 특정한 상호작용에 의하여 영향을 받는다(Tomkinson 등, 2006). 대다수의 진핵 생물 DNA 리가아제는 특정되고, 본발명에서 사용하기 위하여 처리할 수 있을 것이다. 진핵 생물 DNA 리가아제는 일반적으로 포유류 DNA 리가아제 I, DAN 리가아제 II(DNA 리가아제 III로부터 선택적으로 스플리스됨), DNA 리가아제 III(DNA 회복 단백질 XRCC1의 조합상의 DNA 리가아제 III를 포함), 및 DNA 리가아제 IV(XRCC4의 조합상의 DNA 리가아제 IV를 포함)에 포함되는 것으로 여겨지는 포유류의 DNA 리가아제를 포함한다. 약간의 고세균 DNA 리가아제는 특정되고, 본 발명에서 사용되기 위하여 처리할 수 있을 것이다. 고세균 DNA 리가아제는 호열성 리가아제, 예를 들면 Nishida 등 (2006), J. Mol. Biol. 360, 956-967에 기재된 파이로코커스 퓨리오서스(Pyrococcus furiosus)로부터 유래되는 리가아제를 포함한다.
2.4 RNA 리가아제
RNA 리가아제는 본 발명이 속하는 기술에서 잘 알려져 있고, 본 발명에서 유용하다. 박테리오파지 T4 유래의 RNA 리가아제는 상당히 잘 특정되고, 상당히 넓은 기질 특성을 나타내기 때문에 RNA의 3’말단의 방사성 표지, 올리고디옥시리보뉴클레오티드 및 올리고리보뉴클레오티드의 원형화, 올리고머 및 닉의 연결, 혼성 및 융합 RNA/DNA 분자, 및 miRNA 복제와 같은 체외 적용을 위하여 제안된다. 예를 들면, T4 RNA 리가아제 I는 DNA 또는 RNA의 단일 가닥 5’-인산염 말단과 DNA 또는 RNA의 단일 가닥 3’-수산기 말단의 ATP-의존 공유결합에 촉매작용을 한다. T4 RNA 리가아제 II는 T4 RNA 리가아제 I과 비슷한 활성을 가지나, 이중 가닥 기질에 더 바람직하다. T4 RNA 리가아제 I 및 T4 RNA 리가아제 II, 이들의 기능이 있는 단편을 포함하는 바이러스 리가아제는 본 발명에서 사용하기 위하여 처리할 수 있을 것이다.
3. 폴리뉴클레오티드-결합 폴리펩티드
폴리튜클레오티드-결합 폴리펩티드는 서열에 특이적 또는 서열에 비특이적으로 폴리뉴클레오티드와 결합할 수 있는 폴리펩티드이다. 예를 들면, DNA-결합 폴리펩티드는 단일 가닥의 DNA, 이중 가닥의 DNA, 또는 다른 배열의 DNA와 결합하는 폴리펩티드를 포함하는 DNA와 결합할 수 있는 폴리펩티드이다. 당업자는 예상할 수 있기 때문에, 본 발명을 목적을 위하여 DNA-결합 폴리펩티드는 서열 비특이적 DNA-결합 폴리펩티드, 및 서열 특이적 DNA-결합 폴리펩티드 상에서 넓게 분리되어 있다.
3.1 서열 비-특이적 DNA-결합 폴리펩티드
폴리펩티드가 결합된 서열 비-특이적 핵산, 바람직하게는 서열 비-특이적 DNA-결합 폴리펩티드는 서열-독립적인 방법으로 핵산에 결합되는 폴리펩티드 또는 도메인과 같은 정의된 구역의 폴리펩티드이다. 즉, 폴리펩티드와 뉴클레오티드의 결합은 특정한 뉴클레오티드 서열을 위하여 두드러진 선호를 보이지 않는다.
특히 본 발명에 사용되기 적합한 서열 비-특이적 DNA-결합 폴리펩티드의 예는 디이노코커스 라디오두란스(Deinococcus radiodurans)의 PprA 단백질(접근 번호 BAA21374), 결핵균(Mycobacterium tuberculosis) 유래의 Ku 단백질(접근 번호 NP_343889), Sac7d 및 Sso7d를 포함하는 고세균의 작고 기본적인 DNA에 결합하는 단백질(각각의 접근 번호 PI 3123, 및 NP_343889), 디이노코커스 라디오두란스의 DdrA 단백질(미국등록특허 제7550564호에 개시되고, 그 전체가 본 발명에 포함됨), 고세균 HMf 유사 단백질(접근 번호 U08838 및 NP 633849를 포함하지만, 이에 한정되지 않음), 및 PCNA 상동체(접근 번호 NP 578712 및 NP 615084를 포함하지만, 이에 한정되지 않음)를 포함하지만, 이에 한정되지 않는다.
PprA는 DNA 손상을 수복하는 것으로 알려진 디이노코커스 라디오두란스로부터 유래된 대략 32 kDa 단백질이다. 체외에서, PprA는 우선적으로 DNA 분자의 말단에 결합되고(Murakami 등, (2006), Biochimica et Biophysica Acta - Proteins and Proteomics, 1764, 20-23), 체내에서 PprA는 DNA 손상지역에서 DNA 수복 단백질을 구성하기 위하여 중요하다(Narumi 등, (2004) Molecular Microbiology, 54, 278-285).
Sso7d 및 Sac7d는 대략 7 kDa이고, 각각 초고온성 아키아(archaea) 술포로버스 솔파타리쿠스균(Sulfolobus solfataricus) 및 술포로버스 아시도살다리우스균(S. acidocaldarius) 유래의 기본적인 염색체 단백질이다. 이러한 단백질들은 리신이 풍부하고, 높은 열, 산 및 화학적 안정성을 갖는다. 이러한 단백질들은 서열-독립적인 방법으로 DNA에 결합하고, 상승된 온도에서 게놈 DNA를 안정화 시키는 데에 연관되어 있는 것으로 알려져 있다.
HMf 유사 단백질은 아미노산 서열 및 진핵 생물 H4 히스톤의 구조에서 상동성을 공유하는 것으로 알려진 고세균 히스톤이다. 단백질의 HMf 패밀리는 용액에서 안정한 이량체를 형성하고, 몇몇의 HMf 상동체는 호열성 미생물로부터 확인되는 것으로 알려져 있다.
다수의 패밀리 B DNA 폴리머라아제는 예를 들면, 효율적인 DNA 합성을 달성하기 위하여 보조 단백질과 상호 작용을 하는 것으로 알려져 있다. 한 종류의 보조 단백질은 슬라이딩 클램프로서 나타난다. 다중결합의 클램프는 이중 가닥 DNA를 수용할 수 있는 토러스 유사 구조를 형성할 수 있다. 상기 슬라이딩 클램프는 특정 DNA 폴리머라아제의 C 말단과 상호 작용을 하고, 합성 시 이러한 폴리머라아제를 DNA 주형에 고정시키는 것을 도와주는 것으로 알려져 있다.
진핵 생물의 슬라이딩 클램프는 증식세포핵항원(proliferating cell nuclear antigen, PCNA)로 나타나고, 반면 다른 도메인 상의 유사한 단백질은 종종 PCNA 상동체로 나타난다. 이러한 상동체는 구조적 유사성이 표시되나, 서열 유사성이 제한된다. PCNA 상동체는 술포로버스 솔파타리쿠스균, 파이로코커스 퓨리오서스 등과 같은 호열성 아키아를 포함하는 비진핵 생물 유기체로부터 확인된다. PCNA 및 PCNA 상동체는 본 발명의 서열 비-특이적 DNA-결합 폴리펩티드로 유용하다.
본 발명에서의 사용에 적합한 서열 비-특이적 DNA-결합 도메인은 서열-독립적인 (바람직하게는 이중 가닥) 핵산에 결합한다. 다시 말하면, 본 발명의 도메인 결합은 핵산과 상당한 친화력을 가지고 결합하고, 뉴클레오티드 조성물과 동등하나 서열이 상이한 어떠한 알려진 핵산은 100배 내의 차이와 함께 도메인과 결합할 것이다. 비-특이적 결합은 본 발명의 기술분야에서 잘 알려진 방법론, 예를 들면 결합의 특징을 밝혀내기 위하여 동일한 뉴클레오티드 조성물이지만 상이한 핵산 서열의 경쟁 뉴클레오티드를 사용하여 수행될 수 있는 필터 바인딩 분석 또는 겔 이동 분석을 사용하여 분석될 수 있다.
서열 비-특이적 DNA-결합 폴리펩티드를 포함하는 서열 비-특이적 핵산 결합 폴리펩티드는 단일 가닥 또는 이중 가닥 핵산에 대한 선호를 보일 수 있다. 전형적으로, 가닥-특정 결합 폴리펩티드는 10-폴드 또는 단일 가닥 또는 이중 가닥 핵산에 대한 높은 친화력을 보일 수 있다. 당업자는 특정한 적용, 이중 가닥 특정, 서열 비-특이적 DNA-결합 폴리펩티드가 바람직할 것이라는 것을 인식할 것이다.
예를 들면, 이중 가닥 핵산에 대한 결합의 특징은 본 발명이 속하는 기술분야의 통상의 기술자에게 알려진 다양한 분석을 이용하여 시험될 수 있다. 이러한 분석은 필터 바인딩 분석 또는 겔 이동 분석을 포함한다. 예를 들면, 필터 바인딩 분석에서 이중 가닥 DNA에서 결합 활성을 위해 평가되는 폴리펩티드는 적절한 버퍼에서 방사성 표지된 단일 가닥 또는 이중 가닥 DNA와 함께 미리 섞여 진다. 상기 혼합물은 단백질 및 단백질-DNA 복합체를 거르는 막(즉, 니트로셀룰로스)을 통하여 여과된다. 필터 상에 걸러지는 DNA의 함량은 단백질과 결합된 양을 나타낸다. 결합은 표지된 DNA의 결합이 증가된 양의 표지되지 않은 DNA의 추가에 의해 경쟁하는 경쟁분석에 의해 수량화될 수 있다. 10배에서 이중 가닥 DNA와 결합하거나 또는 단일 가닥 DNA에 비해 친화력이 높은 폴리펩티드는 본 발명에서 이중 가닥 DNA결합 단백질로 정의된다. 그렇지 않으면, 결합 활성은 방사성 표지된 DNA가 시험 폴리펩티드와 함께 적용되는 겔 이동 분석에 의하여 평가될 수 있다. 단백질-DNA 복합체는 겔을 통하여 천천히 이동하여 이동된 밴드를 야기할 것이다. 결합의 양은 표지되지 않은 이중 가닥의 또는 표지되지 않은 DNA 단일 가닥의 증가된 양과 함께 적용된 샘플에 의하여 평가될 수 있고, 이동된 밴드에서 방사능의 양을 수량화할 수 있다.
3.2 서열 특정 DNA-결합 폴리펩티드
일반적으로, 본 발명의 융합 폴리펩티드 상에서 보통에서 높은 정도의 서열 특이도를 보이는 DNA-결합 폴리펩티드의 사용은 덜 바람직하다. 그러나, 당업자는 특정한 구체예에서 서열 특이도의 정도는 예를 들면, 우선적으로 DNA-결합 폴리펩티드에 의하여 결합된 특정한 서열 모티프를 포함하는 부분에서 결합의 효율을 향상시키는 데에 유용할 것이라고 인식할 것이다. 예를 들면, 높은 효율의 결합 벡터는 특정한 융합 펩티드와 함께 결합되는데 사용되기 위하여 디자인될 것이며, 결합 부분은 융합 폴리펩티드의 서열 특정 DNA-결합 폴리펩티드 도메인에 의해 결합된 인식 서열을 포함한다.
대부분의 서열 특정 DNA-결합 폴리펩티드는 예를 들면, 전사 인자, 제한 효소, 및 폴리머라아제를 포함하는 것으로 알려져 있다. 서열 특정 DNA-결합 폴리펩티드는 그들의 DNA-결합 도메인의 제2차 구조에 따라서 분류될 수 있다. 특징적인 DNA-결합의 예는 아연 짚게 모티프(zinc finger motifs), 헬릭스-턴-헬릭스 모티프(helix-turn-helix motifs), 루신 지퍼(leucine zippers), 및 헬릭스-루프-헬리스 모티프(helix-loop-helix motif)를 포함한다. 하나 또는 하나 이상의 이러한 도메인을 포함하는 서열 특정 DNA-결합 폴리펩티드는 본 발명의 사용에 있어 적합하다.
특별히 본 발명의 사용에 있어 적합한 서열 특정 DNA-결합 폴리펩티드의 예로는, 인간의 NF-kapaB p50 단백질(접근 번호 NP 003989), 및 가금류의 NF-kappaB p50 단백질(접근 번호 NP 032715)과 같은 포유류의 NF-kappaB p50 및 예를 들면, 하나 또는 하나 이상의 NFATc1, NFATc2, NFATc3, NFATc4, 또는 NFATc5와 같은 포유류의 NFAT 단백질과 같은 전사 인자를 포함하나, 이에 제한되지 않는다.
NF-kappaB(또한 B-세포 1에서 kappa 가벼운 폴리펩티드 유전자 인핸서의 핵인자로 알려져 있다)는 Rel 패밀리 유래의 서열 특정 DNA-결합 전사 인자이다. NF-kappaB p50은 8pM의 해리 상수(KQ)와 함께 특정한 컨센서스 서열(consensus sequence)에 결합하고, 비특정 DNA는 약 1000배 약하게 결합하는 것으로 알려져 있다(KD = 5.7 nM, de Lumley 등, 2004).
전사 인자의 NFAT 패밀리(또한 활성화된 T-세포의 핵인자로 알려져 있다) NFATcl, NFATc2, NFATc3, NFATc4, 및 NFAT5 5종류로 이루어져 있고, 본 발명의 DNA-결합 폴리펩티드로 사용되기에 적합하다.
또 다른 구체예에서, 서열 특정 DNA-결합 폴리펩티드의 기능이 있는 변형물은 활용될 것이다. 예를 들면, 서열 특정 DNA-결합에 의해 관찰되는 높은 친화력의 결합을 유지하나, 서열 특이도의 동일한 정도를 더 이상 보이지 않는 기능이 있는 변형물은 본 발명에서 사용되기 위하여 처리할 수 있다. 이러한 기능이 있는 변형물의 예는 본 발명이 속하는 기술분야에서 잘 알려져 있고, 본 발명은 cTF - de Lumley 등 (2004), J. Mol. Biol. 339, 1059-1075에 개시된 NFAT-Ala-p50 복합체 DNA-결합 단백질 전부를 포함한다. 이러한 복합체는 알라닌 잔기를 통하여 NF-kappaB의 아미노산 249-366에 융합된 NFATc1의 아미노산 403-579을 포함한다.
본 출원인은 이러한 복합체는 NF-kappaB의 특징이나, 서열 특이도를 잃어버린 DNA에 대하여 높은 친화력을 유지한다는 것을 알려준다. Lumley는 비특정 DNA 결합의 28 nM 및 40 nM에서 kappaB 컨센서스 서열의 KD를 측정하였다.
4. 발현 구조물
미생물, 식물 세포 또는 동물 세포 (세포 발현 시스템) 또는 무세포 발현 시스템에서 융합 폴리펩티드의 발현을 위한 발현 구조물을 생산 및 사용하기 위한 공정 및 본 발명에서 사용되기 위한 융합 폴리펩티드 형성에 유용한 발현 구조물을 포함하는 숙주 세포는 본 발명이 속하는 기술분야에서 잘 알려져 있다(즉, Sambrook 등, 1987; Ausubel 등, 1987).
본 발명의 방법에 사용되기 위한 발현 구조물은 복제 또는 발현을 위하여 반복 가능한 벡터에 삽입되거나 또는 숙주 게놈에 포함될 것이다. 다양한 벡터가 일반적으로 사용가능하다. 상기 벡터는, 예를 들면, 플라스미드, 코스미드, 바이러스 융합 폴리펩티드, 또는 파지의 형태일 것이다. 적절한 핵산 서열은 다양한 절차에 의하여 상기 벡터에 삽입될 것이다. 일반적으로, DNA는 본 발명이 속하는 기술분야에서 알려진 기술을 이용하여 적절한 제한 효소 자리에 삽입된다. 벡터 구성요소는 일반적으로 하나 또는 하나 이상의 신호 서열, 하나의 복제 개시점, 하나 또는 하나 이상의 선택 가능한 마커 유전자, 인핸서 요소, 프로모터, 및 전사 종료 서열을 포함하지만, 이에 제한되지 않는다. 하나 또는 하나 이상의 이러한 구성요소를 포함하는 적절한 벡터의 구조물은 본 발명이 속하는 기술분야에서 알려진 일반적인 결합 기술을 이용한다.
발현 및 복제 벡터 모두 하나 또는 하나 이상의 선택된 숙주 세포에서 벡터가 자기복제를 가능하게 하는 핵산 서열을 포함한다. 이러한 서열은 다양한 박테리아, 효모, 및 바이러스로 잘 알려져 있다.
하나의 구체예에서, 상기 발현 구조물은 높은 복제수의 벡터를 나타낸다.
하나의 구체예에서, 상기 높은 복제수 벡터는 숙주 세포 마다 20 내지 3000 복제를 나타내는 것으로부터 선택될 수 있다.
하나의 구체예에서, 상기 높은 복제수 벡터는 ColE1 또는 복제 개시점으로부터 유도된 ColE1과 같은 높은 복제수 복제 개시점(ori) 포함한다. 예를 들면, 복제 개시점으로부터 유도된 ColE-1은 pUC19 복제 개시점을 포함할 수 있다.
본 발명의 벡터로 사용하기에 적절한 수많은 높은 복제수 복제 개시점은 당업자에게 알려져 있다. 이러한 높은 복제수 복제 개시점은 pBR322로부터 유도된 복제 개시점인 ColE1 및 이들의 유도체뿐만 아니라, Ml3 FR ori 또는 pl-ori와 같은 다른 높은 복제수 복제 개시점을 포함한다. 2μ 플라스미드 개시점은 효모에 적합하하고, 다양한 바이러스 개시점(SV40, 폴리오마(polyoma), 아데노바이러스(adenovirus), VSV or BPV)은 포유류 세포에서 복제 벡터로 유용하다.
바람직하게는, 상기 높은 복제수 복제 개시점은 pUC19 복제 개시점으로부터 유도된 ColE1를 포함한다.
발현 및 복제 벡터는 전형적으로 또한 형질전환된 숙주 세포 내에서 벡터의 존재를 발견하기 위한 선택 가능한 마커로 일컬어질 수 있는 선택 유전자를 포함할 수 있다. 전형적인 선택 유전자는 (a) 항생제(antibiotics) 또는 다른 톡신(toxins)즉, 앰피실린(ampicillin), 네오마이신(neomycin), 메토트렉세이트(methotrexate), 또는 테트라사이클린(tetracycline)에 대한 저항성을 부여하고, (b) 영양 요구성 결핍을 보완하고, (c) 복합 배지로부터 사용가능 하지 않는 즉, 균을 위하여 D-알라닌 라세메이즈(racemase)를 인코딩한 유전자와 같은 복합체 임계 영양소를 제공하는 단백질을 인코드한다.
일반적으로 식물 형질전화에 사용되는 선택 가능한 마커는 가나마이신(kanamycin) 저항성을 부여하는 네오마이신 인산전이효소 II(neomycin phophotransferase II) 유전자 (NPT II), 스펙티노마이신(spectinomycin) 및 스트렙토마이신(streptomycin) 저항성을 부여하는 aadA 유전자, Ignite (Ag역방향o) 및 Basta (Hoechst) 저항성을 위한 포스피노트리신 아세틸 트랜스퍼라제(phosphinothricin acetyl transferase, 저항성 유전자), 및 하이그로마이신 저항성을 위한 하이그로마이신 포스포트랜스퍼라제(hygromycin phosphotransferase) 유전자(hpt)를 포함한다.
포유류 세포에 적합한 선택 가능한 마커의 예는 발현 구조물을 차지하기 위해서 세포 구성요소의 확인을 가능하게 하는 DHFR 또는 티미딘 키나제(thymidine kinase)와 같은 것들이다. 야생형 DHFR이 이용될 때, 적절한 숙주 세포는 DHFR 활성에 결함이 있고, Urlaub 등, 1980에 의해 개시된 것으로 제조되고 번식되는 CHO 세포주이다. 효모에 사용하기 위한 적절한 선택 유전자는 YRp7 효모 플라스미드에 나타난 trpl 유전자이다(Stinchcomb 등, 1979; Kingsman 등, 1979; Tschemper 등, 1980). 상기 trpl 유전자는 예를 들면, ATCC No. 44076 또는 PEP4- 1[Jones, Genetics, 85: 12 (1977)]과 같은 트립토판(tryptophan)에서의 생장 능력이 부족한 효모의 변이주를 위한 선택 마커를 제공한다.
융합 폴리펩티드를 형성하는데 유용한 발현 구조물은 바람직하게 DNA 리가아제, DNA-결합 폴리펩티드 또는 융합 폴리펩티드를 인코딩하는 적어도 하나의 핵산의 발현을 조절하는 프로모터를 포함한다.
다양한 잠재적인 숙주 세포에 의해 인식되는 프로모터는 잘 알려져 있다. 원핵 생물 숙주와 함께 이용하는데 적합한 프로모터는 β-락타마제(β-lactamase) 및 락토스 프로모터 시스템[Chang 등, 1978; Goeddel 등, 1979], 염기성 포스파타아제(alkaline phosphatase), 트립토판(tryptophan (trp)) 프로모터 시스템(Goeddel, Nucleic Acids Res., 8:4057 (1980); EP 36,776], 및 택 프로모터(tac promoter)와 같은 복합체 프로모터(deBoer 등, 1983)를 포함한다. 박테리아 시스템에서 사용되기 위한 프로모터는 사용가능하게 DNA 리가아제, DNA 리가아제 폴리펩티드, 또는 융합 폴리펩티드를 인코딩한 핵산에 연결된 샤인-달가르노(Shine-Dalgarno, S.D.) 서열을 포함할 것이다.
효모 숙주와 함께 사용하기 위한 프로모터 서열로 적합한 예는 에놀레이즈(enolase), 글리세르알데히드-3-포스페이트 디하이드로지나제(glyceraldehyde-3 -phosphate dehydrogenase), 헥소키나제(hexokinase), 파이루베이트 디카르복실라제(pyruvate decarboxylase), 포스포프럭토키나제(phosphofructokinase), 글루코스-6-포스페이트(glucose-6-phosphate), 아이소머라제(isomerase), 3-포스로글라이세레이트 뮤타제(3-phosphoglycerate mutase), 피루베이트 키나제(pyruvate kinase), 트리오세포스페이트 아이소머라제(triosephosphate isomerase), 포스포글루코스 아이소머라제(phosphoglucose isomerase), 및 글루코키나제(glucokinase)와 같은 3-포스포글리세레이트 키나제(3-phosphoglycerate kinase) [Hitzeman 등, 1980] 또는 다른 해당작용 효소(glycolytic enzymes) [Hess 등, 1968; Holland, 1978]를 위한 프로모터를 포함한다.
생장 조건에 의해 조절되는 추가적인 전사의 장점을 가지고 있는 유도성 프로모터인 다른 효모 프로모터는 알콜 디하이드로게나제 2(alcohol dehydrogenase 2), 아이소시토크롬 C(isocytochrome C), 탈인산화효소(acid phosphatase), 질소 대사와 관련된 분해 효소, 메탈로티오네인(metallothionein), 글리세르알데히드-3-포스페이트 디하이드로지나제(glyceraldehyde-3 -phosphate dehydrogenase), 및 말토오스 및 갈락토오스 이용의 원인이 되는 효소의 프로모터 지역이다.
단자엽 또는 다자엽 식물의 조직 또는 기관을 포함하는 식물 숙주 세포에 사용하기 적합한 프로모터의 예는 세포-특이적인 프로모터, 조직-특이적인 프로모터, 기관-특이적인 프로모터, 세포 주기 특이적인 프로모터, 시간 프로모터, 유도성 프로모터, 식물 조직에서 활성화된 발현 프로모터, 및 재조합 프로모터를 포함한다. 프로모터의 선택은 복제된 폴리뉴클레오티드의 시간적 및 공간적 발현에 달려있을 것이다. 프로모터는 숙주 세포로부터 유도되는 것들, 또는 다른 식물, 바이러스, 및 식물병원균 및 식물병원진균의 유전자들로부터 유도되는 프로모터일 것이다. 당업자는 과도한 실험 없이 본 발명의 폴리뉴클레오티드 서열을 포함하는 유전자 구조물을 사용한 발현 구조물의 변경 및 변조에 적합한 프로모터를 선택할 수 있다. 구성적 실물 프로모터의 예는 CaMV 35S 프로모터, 노팔린 합성효소(nopaline synthase) 프로모터 및 옥토파인 합성효소(octopine synthase) 프로모터, 및 옥수수로부터 유래된 Ubi 1 프로모터를 포함한다. 내부 발달 신호 또는 외부 생물적 또는 비생물적 스트레스에 응답하여 특정 조직에서 활성되는 식물 프로모터는 과학 문헌에 개시되어 있다. 예시적인 프로모터는 본 발명에서 참조로 사용되는 국제특허 제WO 02/00894호에 개시되어 있다.
곤충 숙주 세포에 사용되기 적합한 프로모터의 예는 베큘로바이러스(Baculovirus)와 같은 바이러스의 게놈으로부터 유도된 것들을 포함한다. 일반적으로 사용가능한 베큘로바이러스 발현 시스템은 flashBAC(Ox정방향d Expression Technologies) 및 Bac-to-Bac 베큘로바이러스 발현 시스템(Invitrogen)을 포함한다.
포유류 숙주 세포에 사용되기 적합한 프로모터의 예는 폴리오마(polyoma) 바이러스, 계두(fowlpox) 바이러스, (아데노바이러스 2와 같은) 아데노바이러스(adenovirus), 소 유두종(bovine papilloma) 바이러스, 조류 육종(avian sarcoma) 바이러스, 거대세포바이러스(cytomegalovirus), 레트로바이러스(retrovirus), B형 간염(hepatitis-B) 바이러스 및 원숭이(Simian) 바이러스 40 (SV40)과 같은 바이러스의 게놈으로부터 유도되어 얻어진 것들, 즉, 액틴(actin) 프로모터 또는 이뮤노글로불린(immunoglobulin) 프로모터와 같은 이종의 포유류 프로모터로부터 유도되어 얻어진 것들, 및 숙주 세포 시스템과 호환가능하게 제공된 열충격 프로모터로부터 유도되어 얻어진 것들을 포함한다.
높은 진핵 생물에 의한 발현 구조물의 전사는 벡터 내에 인핸서 서열을 삽입함으로써 증가할 것이다. 인핸서는 일반적으로 전사를 증가시키기 위하여 프로모터 상에서 활동하는 약 10 내지 300 bp인 DNA의 시스로 작동하는 요소이다. 포유류 유전자로부터 많은 인핸서 서열(글로빈(globin), 엘라타제(elastase), 알부민(albumin), α-페토프로테인(α-fetoprotein), 및 인슐린(insulin))이 지금 알려져 있다. 그러나 전형적으로, 진핵 생물 세포 바이러스로부터 하나의 인핸서가 사용될 것이다. 예는 복제 개시점의 마지막 측면 상에서 SV40 인핸서(bp 100-270), 시토메갈로바이러스의 초기 프로모터 인핸서, 복제 개시점의 마지막 측면 상에서 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다. 상기 인핸서는 벡터의 5’ 또는 3’ 위치에서 서열을 코딩한 DNA 리가아제, DNA 리가아제 폴리펩티드 또는 융합 폴리펩티드로 스플라이스될 것이며, 바람직하게는 프로모터로부터 5’ 사이트에 위치할 것이다.
진핵 생물 숙주 세포(효모, 진균, 곤충, 식물, 동물, 인간 또는 다세포 미생물로부터 유래된 다른 유핵 세포)에서 사용되는 발현 벡터는 또한 전사 종결에 필요하고, mRNA 안정화에 필요한 서열을 포함할 것이다. 이러한 서열은 일반적으로 5'로부터 이용가능하고, 때때로 진핵 생물 또는 바이러스 DNA 또는 cDNA의 전사되지 않은 지역인 3’으로부터 이용가능하다. 이러한 지역은 DNA 리가아제, DNA 리가아제 폴리펩티드 또는 융합 폴리펩티드를 인코딩한 mRNA의 전사되지 않은 부분에서 폴리아데닐레이트 단편으로 전사된 뉴클로오티드 마디를 포함한다.
하나의 구체예에서, 상기 발현 구조물은 아라비노스(arabinose)에 의해 유도되는 BAD 프로모터와 같은 상류 유도성 프로모터를 포함한다.
하나의 구체예에서, 상기 발현 구조물은 발현 또는 조절 프로모터 시스템을 포함한다.
하나의 구체예에서, 상기 조절 프로모터 시스템은 유도성 또는 억제성 프로모터 시스템이다.
재조합 단백질의 생산에 있어서 강력한 프로모터의 사용이 흔히 요구되지만, 이러한 프로모터들의 조절은 보통 이종 발현 과잉생산, 생장 속도에서 단백질의 감소를 야기시키고, 플라스미드 안정성 및 배양 생존능 때문에 필수적이다.
다수의 프로모터들은 억제 단백질과 다른 오퍼레이터와의 상호 작용에 의해 조절된다(프로모터로부터 다운스트림 지역). 가장 잘 알려진 오퍼레이터들은 락 오페론(lac operon) 및 박테리오파지 람다(bacteriophage lambda)로부터 유래된다. 대장균에서 조절된 프로모터의 개요는 Friehs & Reardon, 1991의 표 1에서 제공된다.
기준 박테리아 배양과 재조합 대장균이 관련된 것들의 주요한 차이점은 생장의 분리 및 생산기 또는 유도기이다. 재조합 단백질 생산물은 종종 생장기에서 높은 세포 밀도를 성취하고(프로모터가 작동이 안되고 숙주 세포 상에서 대사 부담이 적은 경우) 유도기에서 높은 이종 단백질 생산 속도를 성취하기(프로모터를 작동시키기 위한 유도) 위한 조절된 프로모터의 장점을 가지고 있다.
하나의 구체예에서, 조절 가능한 프로모터 시스템은 Lacl, Tip, 파지 람다(phage lambda) 및 파지 RNA 폴리머라아제(phage RNA polymerase)로부터 선택된다.
하나의 구체예에서, 상기 프로모터 시스템은 lac 또는 Ptac 포로모터 및 lacl 억제자, 또는 trp 프로모터 및 TrpR 억제자로부터 선택된다.
하나의 구체예에서, 상기 LacI 억제자는 활성 억제자에 결합하여 발현을 허락하는 오퍼레이터로부터의 분리를 야기시키는 이소프로필-β-D-티오갈락토피라노시드(isopropyl-β-D-thiogalactopyranoside, IPTG)의 추가에 의해 불활성화된다.
하나의 구체예에서, 상기 trp 프로모터 시스템은 정해진 트립토판 농도와 함께 합성 배지를 사용하고, 농도가 임계 수준 아래로 떨어지면 시스템은 스스로 유도된다. 하나의 구체예에서, 3-β-인돌-아크릴산은 TrpR 억제자를 불활성시키기 위하여 추가될 것이다.
하나의 구체예에서, 상기 프로모터 시스템은 박테리오파지 람다 억제자 cI의 사용을 만들 것이다. 이러한 억제자는 OL 및 OR이라고 불리는 두 개의 오퍼레이터들과 상호작용함으로써 람다 파지 및 모든 용균(lytic) 유전자의 발현 방지의 사용을 만든다. 이러한 오퍼레이터들은 각각 두 개의 강력한 프로모터 PL 및 PR과 겹친다. cI 억제자 존재하에서, RNA 폴리머라아제의 결합은 유지된다. 상기 cI 억제자는 자외선 조사 또는 마이토마이신(mitomycin C)의 세포 처리에 의하여 불활성화될 수 있다. 재조합 폴리펩티드 발현을 허용하는 더 간편한 방법은 cI 억제자의 온도-민감성 버전인 cI857의 적용이다. 람다계 발현 시스템을 수반하는 숙주 세포는 낮은 온도에서 중간 증식기로 생장될 수 있고, 재조합 폴리펩티드의 발현을 유도하기 위하여 높은 온도로 이동될 수 있다.
광범위하게 사용되는 발현 시스템은 T7 DNA 상에서 발견된 프로모터들로부터 인식되고, 숙주 세포 염색체 상에 존재하지 않는 파지 T7 RNA 폴리머라아제의 사용을 만들 수 있다. 그러므로, 상기 발현 구조물은 재조합 유전자가 융합되게 하기 위해 하나의 상기 T7 프로모터들(일반적으로 상기 프로모터는 유전자 10의 앞에 존재한다)을 포함할 것이다. T7 RNA 폴리머라아제의 유전자 코딩은 발현 구조물 상, 제2 경쟁 발현 구조물 상에서 나타나거나 또는 숙주 세포 염색체에서 통합된다. 이러한 모든 경우에서, 상기 유전자는 발현기 동안에 전사 및 번역을 허용하는 유도 프로모터에 융합된다.
대장균 가닥 BL21 (DE3) 및 BL21 (DE3) pLysS (Invitrogen, CA)는 T7 RNA 폴리머라아제 유전자를 수반하는 숙주 세포의 예시이다. 게놈에 통합된 T7 RNA 폴라머라제 유전자를 제공하는 슈도모나스 애루지노사 ADD 1976T7(Pseudomonas aeruginosa ADD 1976T7)과 같은 RNA 폴라머라제 유전자를 수반하는 다른 세포 가닥은 본 발명이 속하는 기술분야에서 잘 알려져 있다(Brunschwig & Darzins, 1992).
본 발명에 사용되기 적합한 다른 프로모터 시스템은 여기에서 전형적인 예가되는 T5 프로모터 시스템이다. 유용하게, 이러한 프로모터는 숙주 대장균 RNA 폴리머라아제에 의해 인식된다. 적합한 대장균 숙주 가닥은 실시예에 나타나 있다.
하나의 구체예에서, 상기 프로모터 시스템은 유도 사이클을 개시하기 위하여 30-37℃에서 42℃로 온도를 증가시키는 온도 이동에 의하여 유도되거나 또는 유도 사이클을 개시하기 위하여 스위치가 켜진 API 또는 APR과 같은 프로모터의 사용을 만든다.
바람직한 융합 폴리펩티드는 적어도 하나의 DNA 리가아제 및 적어도 하나의 DNA-결합 폴리펩티드를 포함한다.
여기에서 사용하기 위한 융합 폴리펩티드를 인코딩한 핵산 서열은 DNA 리가아제와 같은 폴리뉴클레오티드-라가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 및 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산을 포함한다. 일단 발현되면, 융합 폴리펩티드는 인산디에스테르 결합 형성을 형성하거나 또는 가능하게 할 수 있다.
하나의 구체예에서, 적어도 DNA 리가아제를 인코딩한 핵산 서열은 간접적으로 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열을 통하여 DNA-결합 폴리펩티드를 인코딩한 핵산 서열과 융합된다. 하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N-말단과 인접하다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제를 포함하는 아미노산 서열의 C-말단과 인접하다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 단백질의 아미노산 서열은 간접적으로 원하는 길이의 펩티드 링커 또는 스페이서, 예를 들면 융합 폴리펩티드를 포함하는 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서를 통해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N-말단과 융합된다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 단백질의 아미노산 서열은 간접적으로 원하는 길이의 펩티드 링커 또는 스페이서, 예를 들면 융합 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서를 통해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 C-말단과 융합된다.
본 발명의 바람직한 융합 폴리펩티드의 하나의 장점은 융합 폴리펩티드를 포함하는 폴리펩티드의 변경이 그들의 기능에 영향을 주지 않는다는 점이다. 예를 들면, 재조합 폴리펩티드가 그들의 N-말단 또는 C-말단에 융합되더라도 여기에서 예시로든 DNA 리가아제의 기능은 유지된다.
융합 폴리펩티드 상에서 단백질의 배열은 플라스미드에 포함된 핵산에서 유전자 서열의 순서에 의존적이다. 예를 들면, 융합 폴리펩티드의 생산이 요구될 것이며, DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드는 간접적으로 폴리뉴클레오티드 리가아제에 융합된다. 간접적으로 융합된다”라는 용어는 융합 폴리펩티드상에서 발현되기를 원하는 어떠한 추가적인 단백질에 의해 분리되는 폴리뉴클레오티드 리가아제 폴리펩티드 및 폴리뉴클레오티드-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 나타낸다. 하나의 구체예에서, 상기 추가적인 단백질은 상기에서 언급된 바와 같이 DNA 리가아제 폴리펩티드, DNA-결합 폴리펩티드, 보조인자 또는 보조효소, 또는 융합 폴리펩티드, 또는 융합 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서로부터 선택된다. 이러한 구체예에서, 발현 구조물 상에서 융합 폴리펩티드의 원하는 배열을 반영하기 위하여 유전자 서열을 정리하는 것이 필요하다.
하나의 구체예에서, DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드는 직접적으로 DNA 리가아제와 같은 폴리뉴클레오티드-리가아제 폴리펩티드에 융합될 것이다. “직접적으로 융합된다”라는 용어는 두 개 또는 더 이상의 폴리펩티드가 펩티드 결합을 통하여 연결되는 위치를 나타내기 위하여 여기에서 사용된다.
적어도 두 개의 별개의 융합 폴리펩티드를 포함하는 조성물이 형성되는 것 또한 가능할 것이다. 예를 들면, 제1 융합 폴리펩티드는 DNA-리가아제에 융합된 단일 가닥 DNA-결합 폴리펩티드를 포함하는 반면, 제2 융합 폴리펩티드는 DNA-리가아제에 융합된 이중 가닥 DNA-결합 폴리펩티드를 포함할 것이다. 여기에서 개시된 융합 폴리펩티드의 어떠한 조합도 가능하고, 특정한 적용을 목표로 하기위하여 생산될 것이다. 게다가, 하나 또는 하나 이상의 융합 폴리펩티드는 이중가닥 말단된 DNA 말단 또는 외가닥 말단된 DNA 말단과 함께 이중가닥 말단된 DNA 말단 또는 외가닥 말단된 DNA 말단 DNA 단편에 대하여 향상된 결합 활성을 보일 것이다. 유사하게, 하나 또는 하나 이상의 융합 폴리펩티드는 RNA 단편 또는 RNA-DNA 복합체에 대하여 향상된 결합 활성을 보일 것이다. 이러한 융합 폴리펩티드는 특정한 적용을 목표로 하기 위하여 분리 또는 결합에 사용될 것이다.
하나의 구체예에서, 상기 발현 구조물은 체내에서 발현된다. 바람직하게 상기 발현 구조물은 미생물, 바람직하게는 대장균에서 발현되는 플라스미드다.
하나의 구체예에서, 상기 발현 구조물은 체외에서 발현된다. 바람직하게 상기 발현 구조물은 무세포 발현 시스템을 사용한 체외에서 발현된다.
하나의 구체예에서, 하나 또는 하나 이상의 유전자는 하나의 발현 구조물에 삽입될 수 있고, 하나 또는 하나 이상의 유전자는 숙주 세포 게놈에 통합될 수 있다. 모든 경우에 있어서, 발현은 상기에서 언급한 바와 같이 프로모터를 통해 조절될 수 있다.
하나의 구체예에서, 상기 발현 구조물은 상기에서 언급한 바와 같이 적어도 하나의 추가적인 폴리펩티드, 선택적으로 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드 및 DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 융합 폴리펩티드를 더 인코드할 수 있다.
다양한 구체예에서, 상기 발현 구조물은 본 발명의 발현된 폴리펩티드의 정제를 가능하게 하기 위하여 하나 또는 하나 이상의 폴리펩티드 태그를 포함할 수 있다. 이러한 태그의 예는 본 발명이 속하는 기술분야에서 잘 알려져 있으며, 폴리히스티딘 택(polyhistidine Tags), FLAG 에피토프(FLAG epitopes), c-myc 에피토프c-myc epitopes) 등을 포함한다. 이러한 정제산을 수반하는 폴리펩티드를 정제하는 방법은 본 발명이 속하는 기술분야에서 잘 알려져 있고, 크로마토그래피, 예를 들면 니켈 또는 코발트 결합에 의존하는 금속 친화력 크로마토그래피에 고정화된 폴리히스티딘 태그를 포함한다.
발현된 단백질로부터 이러한 정제 산을 제거하는 방법은 본 발명이 속하는 기술분야에서 잘 알려져 있다. 예를 들면, 태그 또는 에피토프는 목적하는 폴리펩티드로부터 엔도펩티다제 인지 서열(endopeptidase recognition sequence), 인테인 스플라이스 자리, 또는 엔도펩티다제를 사용한 폴리히스티딘-태그의 제거를 가능하게 하는 다른 어떠한 아미노산 서열에 의해 분리될 것이다. 예를 들면, TAGZyme (Qiagen)과 같은 엑소펩티다제(exopeptidases)는 발현 폴리펩티드로부터 N-말단 폴리히스티딘 태그의 제거를 위하여 사용될 것이다.
5. 숙주 세포
본 발명의 융합 폴리펩티드는 상기에서 언급된 하나 또는 하나 이상의 발현 구조물을 사용하여 알맞게 숙주 세포상에서 제조된다. 본 발명의 융합 폴리펩티드는 발현 구조물을 발현하기 위한 숙주 세포를 가능하게 하여 제조될 수 있다. 융합 폴리펩티드는 먼저 발현 구조물을 숙주 세포 또는 숙주 세포의 전구체에 도입함으로써, 예를 들면 발현 구조물과 함께 숙주 세포 또는 숙주 세포의 전구체를 형질전환 또는 전달, 또는 그렇지 않으면 숙주 세포 상에 존재하는 발현 구조물을 보존하는 것에 의해 이뤄낼 수 있다.
형질전환 후에, 형질전환된 숙주 세포는 발현 구조물로부터 유래된 융합 폴리펩티드의 발현 및 융합 폴리펩티드의 형성에 적합한 상태 하에서 유지된다. 이러한 상태는 본 발명이 속하는 기술분야에서 잘 알려진 적합한 유기체 상에서의 플라스미드와 같이 선택된 발현 구조물의 발현에 적합한 것들을 포함한다. 예를 들면, 특별히 높은 수율 또는 과잉발현을 원하는 경우, 적합한 배지의 공급은 융합 폴리펩티드의 합성을 허용한다.
따라서, 본 발명은 융합 폴리펩티드 제조 방법으로,
DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 숙주 세포를 제공하는 단계;
상기 발현 구조물의 발현이 적합한 상태에서 상기 숙주 세포를 유지하는 단계; 및
숙주로부터 융합 폴리펩티드를 분리하는 단계;
를 포함한다.
바람직하게 상기 숙주 세포는 박테리아 세포, 진균 세포, 효모 세포, 식물 세포, 곤충 세포 또는 동물 세포이고, 바람직하게 고립되거나 또는 비인간 숙주 세포이다. 본 발명이 속하는 기술분야에서 재결합 융합 폴리펩티드를 제조하기 위한 유용한 방법으로 잘 알려진 숙주 세포(즉, Sambrook 등, 1987 ; Ausubel 등, 1987)는 여기에서 언급된 고려사항을 유념하여 본 발명의 방법에 사용되는데 적합하다.
적합한 원핵 생물 숙주 세포는 예를 들면, 대장균 바이러스 대장균주(E. coli. Various E. coli strains)과 같은 엔테로박테리아세애(Enterobacteriaceae)가 일반적으로 사용가능한 그람(Gram)-음성 또는 그람-양성 유기체와 같은 진정세균(eubacteria)을 포함한다. 예를 들면, 대장균 K12 가닥 MM294 (ATCC 31,446); 대장균 XI 776 (ATCC 31,537); 대장균 가닥 W31 10 (ATCC 27,325) 및 K5 772 (ATCC 53,635), 및 DH5a-E (Invitrogen)과 같은 대장균 바이러스 대장균 가닥(E. coli. Various E. coli strains)과 같은 엔테로박테리아세애(Enterobacteriaceae)는 일반적으로 사용가능하다. 다른 적합한 원핵 생물 숙주 세포는 에스케리치아 종(Escherichia spp.), 엔테로박터(Enterobacter), 병원균(Erwinia), 클레브시엘라(Klebsiella), 프로테우스(Proteus), 살모넬라(Salmonella), 즉, 살모넬라 티피무리움(Salmonella typhimurium), 세라티아(Serratia), 즉, 세라티아 적벽세균(Serratia marcescans), 및 시겔라(Shigella)뿐만 아니라, 청국균(B. subtilis) 및 바실러스 리케니포르미스(B. licheni정방향mis)와 같은 균(Bacilli), 슈도모나스 애루기노사(P. aeruginosa)와 같은 슈도모나스(Pseudomonas), 및 스트렙토마이시스(Streptomyces), 로도코코스(Rhodococcus), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobaterium)과 같은 방선균(Actinomycetes)과 같은 다른 엔테로박테리아세를 포함한다.
어떤 구체예에서, 대장균 가닥 W31 10은 재조합 DNA 제품에 대한 일반적인 숙주 가닥이기 때문에 사용될 것이다. 바람직하게 숙주 세포는 최소 양의 단백질 가수분해 효소(proteolytic enzymes)를 분비한다. 예를 들면, 가닥 W31 10은 단백질 내인성을 숙주에 인코딩한 유전자 상에서 유전자 변이에 영향을 주기위하여 수정될 것이다. 이러한 숙주는 완벽한 유전자형 tonA를 가진 대장균 W31 10 가닥 1A2, 완벽한 유전자형 tonA ptr3을 가진 대장균 W31 10 가닥 9E4, 완벽한 유전자형 tonA ptr3 phoA E15 (argF-lac)169 degP ompT kanr을 가진 대장균 W31 10 가닥 27C7 (ATCC 55,244), 완벽한 유전자형 genotype tonA ptr3 phoA El 5 (argF-lac)169 degP ompT rbs7 ilvG kanr을 가진 대장균 W31 10 가닥 37D6, 비가나마이신 저항 degP 삭제 돌연변이와 함께 가닥 37D6인 대장균 W31 10 가닥 40B4를 포함한다.
일부 구체예에서, 제조하지 않거나 또는 낮은 수준의 리포폴리사카리드 엔도톡신(lipopolysaccharide endotoxins)을 제조하는 박테리아 숙주는 바람직하게 사용될 것이다. 예를 들면, 락토코커스 락티스 가닥 MG1363(Lactococcus lactis strain MG1363) 및 락토코커스 락티스 아종 크레모리스 NZ9000(Lactococcus lactis subspecies cremoris NZ9000)을 포함하는 락토코커스 락틱스 가닥(Lactococcus lactis strains)이 사용될 것이다.
원핵 생물에 더하여, 사상 진균(filamentous fungi) 또는 효모와 같은 진핵 미생물은 본 발명의 방법에 사용되기 위한 적합한 복제 또는 발현 숙주이다. 사카로마이세스 세레비시애(Saccharomyces ce역방향isiae)는 일반적으로 사용되는 진핵 숙주 미생물이다. 다른 것들은 시조사카로미세스 폼베(Schizosaccharomyces pombe) (Beach and Nurse, 1981 ; 유럽등록특허 제139,383호), 즉, 클루이베로미시스 락티스(K. lactis) (MW98-8C, CBS683, CBS4574; Louvencourt 등, 1983), 클루이베로미시스 플라길리스(K. fragilis) (ATCC 12,424), 클루이베로미시스 불가리쿠스(K. bulgaricus) (ATCC 16,045), 클루이베로미시스 위커라미(K. wickeramii) (ATCC 24,178), 클루이베로미시스 왈티(K. waltii) (ATCC 56,500), 클루이베로미시스 드로소피라룸(K. drosophilarum) (ATCC 36,906; Van den Berg et al, 1990), 클루이베로미시스 터모톨레란스(K. thermotolerans), 및 클루이베로미시스 말시아누스(K. marxianus)와 같은 클루이베로미시스 숙주(미국등록특허 제4,943,529호; Fleer 등, 1991), 야로위아(yarrowia) (유럽등록특허 제402,226호), 피키아 파스토리스(Pichia pastoris) (유럽등록특허 제183,070호; Sreekrishna 등, 1988), 칸디다(Candida), Trichoderma reesia (EP 244,234), 뉴로스포라 크라사(Neurospora crassa) (Case 등, 1979), 쉬반니오마이세스 오시덴탈리스(Schwanniomyces occidentalis) (1990년 10월 31일 공개된 유럽등록특허 394,538)와 같은 쉬반니오마이세스(Schwanniomyces), 및 즉, 뉴로스포라(Neurospora), 페니실리움(Penicillium), 톨리포클라디움(Tolypocladium) (1991년 1월 10일 공개된 WO 제91/00357호)와 같은 사상 진균(filamentous fungi) 및 아스퍼질러스 니둘란스(A. nidulans) (Ballance 등, 1983; Tilburn 등, 1983; Yelton 등, 1984) 및 아스퍼질러스 니거(A. niger) (Kelly and Hynes, 1985)와 같은 아스퍼질러스 숙주(Aspergillus hosts)를 포함한다. 메티로트로픽 효모(Methylotropic yeasts)는 여기에서 적합하고, 한세눌라(Hansenula), 칸디다(Candida), 클로엑케라(Kloeckera), 피치아(Pichia), 사카로마이세스(Saccharomyces), 토룰롭시스(Torulopsis), 및 로두투룰라(Rhodotorula)로 이루어지는 속으로부터 선택되는 메탄올의 생장을 가능하게 하는 효모를 포함한다. 예시로든 이러한 효모의 종류인 특정한 종의 리스트는 Anthony, 1982에서 발견 될 것이다.
무척추(invertebrate) 숙주 세포의 예는 초파리 S2(Drosophila S2) 및 스포돕테라 Sf9(Spodoptera Sf9)와 같은 곤충 세포뿐만 아니라, 면, 옥수수, 감자, 콩, 페튜니아, 토마토 및 담배 배지와 같은 식물 세포를 포함한다. 수많은 베큘로바이러스 가닥 및 변형물 및 베큘로바이러스와 같은 숙주로부터 유래된 대응하는 허용 곤충 숙주 세포는 구별된다. 형질감염을 위한 다양한 바이러스 가닥, 즉, 오토그라파 캘리포니카 NPV(Autographa cali정방향nica NPV)의 L-I 변형물 및 봄빅스 모리 NPV(Bombyx mori NPV)의 Bm-5 가닥은 일반적으로 이용가능하고, 이러한 바이러스들은 본 발명에 따른 바이러스, 특히 스포돕테라 프루지페르다 세포(Spodoptera frugiperda cell)의 형질감염으로 사용될 것이다.
유용한 포유류 숙주 세포주의 예는 SV40 (COS-7, ATCC CRL 1651)에 의해 변이된 원숭이 신장 CV1주, 인간 배아 신장주(293 or 293 cells subcloned 정방향 growth in suspension culture, Graham 등, J. Gen Virol. 36:59 (1977)), 새끼 햄스터 신장 세포(BHK, ATCC CCL 10), 중국 햄스터 난소 세포/-DHFR(CHO, Urlaub 등, 1980), 쥐 세르톨리 세포(TM4, Mather, 1980), 원숭이 신장 세포(CV1 ATCC CCL 70), 아프리카 녹색 원숭이 신장 세포(VERO-76, ATCC CRL-1587), 인간 자궁경부 암종 세포(HELA, ATCC CCL 2), 개 신장 세포(MDCK, ATCC CCL 34), 버팔로쥐 간 세포(BRL 3 A, ATCC CRL 1442), 인간 폐 세포(W138, ATCC CCL 75), 인간 간 세포(Hep G2, HB 8065), 쥐 유방암세포(MMT 060562, ATCC CCL51), TRI 세포(Mather 등, 1982),MRC 5 세포, FS4 세포, 및 인간 간암 세포주(Hep G2)이다.
진핵 생물 세포주, 특별히 포유류 세포주는 예를 들면, DNA-결합 폴리펩티드 또는 DNA 리가아제 폴리펩티드가 하나 또는 하나 이상의 번역 후 변형, 예를 들면 당화현상을 요구하는 경우 선호될 것이다. 예를 들면, 하나 또는 하나 이상의 DNA-결합 폴리펩티드는 최상의 활성을 갖기 위하여 번역 후 변형을 요구하고, 번역 후 변형이 가능한 발현 숙주에서 유용하게 발현될 것이다.
하나의 구체예에서, 상기 숙주 세포는 산화 세포질(oxidising cytosol), 예를 들면 대장균 올리가미 가닥(E. coli Origami strain (Novagen))을 포함하는 세포이다.
다른 구체예에서, 상기 숙주 세포는 환원 세포질(reducing cytosol), 바람직하게 대장균을 포함하는 세포이다.
융합 폴리펩티드는 또한 체외에서 형성될 수 있다. 바람직하게는 무세포 발현 시스템이 사용된다. 많은 무세포 번역 시스템은 일반적으로 이용가능하고, 여기에서 언급된 고려사항을 염려하여 본 발명의 융합 폴리펩티드의 생산에 있어서 사용에 적합하다.
융합 폴리펩티드는 적절한 경우에 원심분리기, 여과 또는 고정된 금속 친화력 정제를 포함하는 친화력 크로파토그래피를 이용하여 용해된 세포로부터 정제될 수 있다.
융합 폴리펩티드의 발현 특성은 융합 폴리펩티드가 제조되는 상태 조절을 통해 영향을 받거나 또는 조절을 받을 것이다. 예를 들면, 숙주 세포가 유지되는 상태, 예를 들면, 온도, 기질의 존재 등을 포함한다.
본 발명의 일부 구체예에서, 숙주 세포에서의 발현 구조물의 과잉발현을 달성하는 것이 바람직하다. 특정한 발현 구조물의 과잉발현에 대한 매커니즘은 본 발명이 속하는 기술분야에서 잘 알려져 있고, 구조물 자체, 발현되는 숙주 및 바람직하거나 또는 요구되는 과잉 발현 정도를 포함하는 다른 요인에 의존할 것이다. 예를 들면, 과잉발현은 i) 예를 들면, 원핵 생물 숙주에서의 T5 프로모터 시스템 또는 T7 RNA 폴리머라아제 프로모터 시스템과 같은 강력한 프로모터 시스템의 이용, ii) 예를 들면, colEl 복제 개시점을 포함하는 플라스미드와 같은 높은 복제수 플라스미드의 이용, iii) 예를 들면, 융합 서열을 통한 메신저 RNA의 안정화, 또는 iv) 예를 들면, 코돈 사용의 최적화, 리보솜의 결합 자리, 또는 말단 자리 등과 같은 번역의 최적화에 의해 달성될 수 있다. 과잉발현의 이점은 융합 폴리펩티드의 높은 수율의 제조를 허용한다.
6. 본 발명의 융합 폴리펩티드의 용도
본 발명은 하나 또는 하나 이상의 향상된 활성을 보이고, 핵산 결합 또는 인산디에스테르 결합 형성의 촉매작용에 있어서 향상된 효율을 포함하고, 또는 향상된 안정화, 변성, 열화 또는 불활성에 대한 향상된 저항성과 같은 향상된 하나 또는 하나 이상의 향상된 특성을 보이며, 또는 향상된 활성 및 향상된 특성을 모두 보이는 융합 폴리펩티드를 제공한다. 결과로서, 본 발명의 폴리펩티드는 바람직하거나 또는 요구되는 인산디에스테르 결합이 형성되는 경우 어떠한 적용에 있어서도 유용함을 가지고 있다. 예를 들면, 본 발명의 융합 폴리펩티드의 사용은 제한 없이 다음을 포함한다.
복제
복제는 복제 및/또는 재조합 핵산 서열, 예를 들면 재조합 단백질의 제조를 도울 수 있는 발현 벡터를 생성하기 위하여 또는 DNA 서열 등을 가능하게 하기 위해서 분자 생물학에서 이용 가능한 기술을 위해서 관련기술에서 인식된 용어이다. 복제는 유전자 확인, 단백질 특성화, 유전자 지문에서부터 큰 규모 단백질 제조에까지 넓은 적용분야에서 사용된다. 목적하는 핵산 단편이 복제되는 매우 다양한 특성화된 벡터는 단백질 발현, 태깅(택ging), 단일 가닥 RNA 및 DNA 제품 및 다른 조작 숙주로 존재한다. 어떠한 DNA단편의 복제는 필수적으로 다음의 4 단계를 포함한다: 1) 단편화 - DNA 가닥 또는 이중의 분리, 2) 결합 - DNA 조각들의 부착, 3) 형질감염 또는 형질전환 - 새로 형성된 DNA 조각들을 숙주 세포로의 삽입, 4) 스크리닝 또는 선별 - 새로 형성된 DNA 조각가 함께 성공적으로 형질 전환된 세포의 선별.
이러한 단계들이 복제 단계에서 변함없다고 하더라도 다수의 대안 가능한 경로들이 선택될 수 있고, 이는 ‘복제 전략’으로서 요약되어 있다.
연결 비트 분석
연결 비트 분석은 단일 뉴클레오티드 다형성과 같은 특정한 다형성 자리에서 뉴클레오티드의 존재를 알아내기 위하여 사용된다. 이러한 분석은 프라이머 사이에서 하나의 뉴클레오티드 갭과 함께 타겟이 되기 위하여 혼성화하는 두 개의 프라이머를 요구한다. 각각의 네 개의 뉴클레오티드는 DNA 폴리머라아제, 리가아제, 타겟 DNA및 프라이머를 포함하는 분리된 반응 혼합물에 첨가된다. 폴리머라아제는 SNP와 상호보완적인 제1 프라이머의 3’ 말단에 뉴클레오티드를 첨가하고, 리가아제는 두 개의 인접한 프라이머를 서로 결합한다. 샘플을 가열하는 동안에 연결이 발생하면, 이제 더 큰 프라이머가 혼성화될 것이고, 신호, 예를 들면 형광성이 탐지될 것이다. 이러한 방법에 대한 더 자세한 논의는 미국등록특허 제5,919,626호, 제5,945,283호, 제5,242,794호, 및 제5,952,174호에 나타나 있다.
mRNA 디스플레이
mRNA 디스플레이에 있어서, mRNA 변형물의 대형 라이브러리는 체외에서 전사되고 번역된다. 각각의 유전자 변형물은 3’ 말단에 부착된 퓨로마이신 모이에티 공유결합(puromycin moiety covalently)을 가지고 있다. 번역 리보솜이 mRNA 주형의 3’ 말단에 닿는 경우, 퓨로마이신 모이에티(puromycin moiety)는 리보솜의 A 지역으로 들어가고, 제조된 폴리펩티드 내로 포함된다. 이러한 결과는 다운스트림 스크리닝 및 선별 실험에서 사용될 수 있는 mRNA-폴리펩티드 융합이다. mRNA 디스플레이 라이브러리을 제조하는 중요한 단계는 3’-퓨로마이신 올리고뉴클레오티드 스페이서에 mRNA 주형의 결합이다. 이러한 경우, DNA 리가아제는 단일 가닥 RNA 분자를 단일 가닥 DNA 스페이서에 결합하기 위해 사용되고, 일반적으로 결합 합류점을 걸친 단일 가닥 DNA "스프린트(splint)"의 도움과 함께 사용된다. 이러한 방법에 대한 더 자세한 논의는 미국등록특허 제6,214,553호 및 제6,207,446호 에 나타나 있다. 본 발명은 또한 본 발명에 따른 사용을 위한 키트의 제조를 고려한다. 튜브, 유리병, 및 수축포장 및 블로우 성형 포장재를 포함하는 적합한 용기 및 포장재에서 적합한 키트는 본 발명에 따를 사용을 위하여 다양한 시약을 포함한다.
본 발명에 따른 적절한 키트에서 포함되기 적합한 물질은 본 발명의 하나 또는 하나 이상의 융합 폴리펩티드, 예를 들면, 본 발명의 융합 폴리펩티드의 효과적인 활성을 위해 요구되는 하나 또는 하나 이상의 양성 조절(여기에서 언급된 예시들), 버퍼, 보조인자, 및 다른 시약을 포함한다.
명확하게, 하나 또는 하나 이상의 폴리펩티드 또는 마이크로플루이딕스 장치(microfluidics device), 마이크로큐벳(microcuvette), 마이크로어레이(microarray), 중합체 비드(polymer bead), 자성입자를 포함하는 나노 또는 마이크로 입자 등과 같은 하나 또는 하나 이상의 고체 기질에 결합되는 본 발명의 조성물을 포함하는 키트는 고려된다. 키트는 또한 시험 샘플이 포함하는 것과 분석하고 비교할 수 있는 조절 샘플 또는 조절 샘플들의 시리즈를 포함할 수 있다. 키트 각각의 구성요소는 독립적인 용기에 둘러싸질 수 있고, 모든 다양한 용기는 키트를 이용하여 수행된 분석 또는 반응의 결과를 해석할 수 있는 설명서와 함께 하나의 포장재 내에 있을 수 있다.
본 발명은 상기에서 논의된 것으로 이루어져 있고, 또한 아래 기재된 실시예의 설명에 의해 예상한다.
실시예
실시예 1- 플라스미드의 구조물 및 융합 폴리펩티드의 제조
실시예는 아래 표 1과 같이, T4 DNA리가아제(리가아제) 또는 다양한 DNA-결합 폴리펩티드에 융합된 대장균 리가아제(LigA)를 포함하는 융합 폴리펩티드의 대장균 상에서 제조에 대한 플라스미드의 구조물을 기재한다. 서로 상대적인 리가아제 활성 및 DNA-결합 활성을 포함하는 폴리펩티드의 방향은 폴리펩티드가 융합 폴리펩티드의 이름 상에서 나열되는 순서에 의해 나타난다. - 예를 들면, p50-리가아제는 T4 DNA 리가아제 폴리펩티드의 N-말단에 융합된 p50 DNA-결합 폴리펩티드(선택적으로 연결 폴리펩티드를 통하여)를 포함하는 융합 폴리펩티드를 나타내는 반면, 리가아제-p50은 p50 DNA-결합 폴리펩티드의 N-말단에 융합된 T4 DNA 리가아제 폴리펩티드(다시, 선택적으로 연결 폴리펩티드를 통해)를 포함하는 융합 폴리펩티드로 나타낸다.
리가아제-DNA 결합 융합 폴리펩티드
T4 DNA 리가아제 융합 폴리펩티드 대장균 DNA 리가아제 융합 폴리펩티드
T4 DNA 리가아제 (조절)
Sso7d-리가아제(Sso7d-리가아제)
P50-리가아제(P50-리가아제)
리가아제-p50(리가아제-p50)
NFAT-리가아제(NFAT-리가아제)
리가아제-NFAT(리가아제-NFAT)
cTF-리가아제(cTF-리가아제)
리가아제-cTF(리가아제-cTF)
PprA-리가아제(PprA-리가아제)
리가아제-PprA(리가아제-PprA)
Ku-리가아제(Ku-리가아제)
리가아제-Ku(리가아제-Ku)
LigA (조절)
P50-ligA
LigA-p50
재료 및 방법
1. 대장균 가닥 DH5a-E의 생장
대장균 가닥 DH5a-E(Invitrogen)는 모든 실험에서 사용된다. 세포는 아래의 사항을 제외하고 표준 상태(LB medium, 37도 incubation)에서 생장한다.
2. 플라스미드 구조물
여기에서 사용된 대표적인 플라스미드 및 올리고뉴클레오티드는 표 2에 나타나 있다.
인간 NF-kappaB(즉, p50) 아미노산 40-366(즉, p50)을 인코딩한 DNA 단편은 폴리머라아제 연쇄 반응(PCR)에서 올리고뉴클레오티드 프라이머 50_Sfi.정방향(서열 번호 1) 및 p50-리가아제.역방향(서열 번호 2)와 함께 플라스미드 pRES112로부터 증폭된다. T4 DNA 리가아제를 인코딩한 DNA 단편은 PCR에서 올리고모뉴클레오티드 프라이머 p50-리가아제.정방향(서열 번호 3) 및 리가아제_Sfi.역방향(서열 번호 4)와 함께 플라스미드 pET14b-리가아제로부터 증폭된다. p50_Sfi.정방향(서열 번호 1) 및 리가아제 Sfi.역방향 (서열 번호 4)을 사용한 겹쳐진 조립 PCR(참조: Horton 등 (1989) Gene, 77, 61-68)은 p50-리가아제 융합 폴리펩티드가 코딩된 유전자를 야기시키는 p50 유전자 및 리가아제 유전자를 함께 스프라이싱하기 위하여 사용된다. 조립된 p50-리가아제 유전자는 제한 효소 SfiI과 함께 분해되고, pCA24N-p50-리가아제를 얻기 위해 발현 벡터 pCA24N(동일한 제한 효소로 처리됨)에 결합된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)를 포함하는 완벽한 발현 구조물은 서열 번호 5로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 6로 표시된다.
디이노코커스 라디외두란스(Deinococcus radiodurans)로부터 유래된 pprA 유전자는 유전자 디자이너 소프트웨어 패키지(Gene Designer software package, (Villalobos 등 (2006), BMC Bioin정방향matics, 7, 285))를 이용하여 대장균에서 발현을 강화시키기 위해 최적화된다. 이는 발현된 단백질의 아미노산 서열(GenBank 접근 번호 BAA21374)을 변경하지 않는 반면, pprA 유전자의 서열상에서 164 동의적 돌연변이를 도입한다. 연결된 제한 자리(flanking restriction sites, BamHI 및 Spel)와 함께 최적화된 유전자는 DNA 2.0(Menlo Park, CA)에 의해 합성되고, 그들의 복제 벡터 pJ204로 공급된다. 코돈-최적화 pprA 유전자는 제한 효소 BamHI 및 Spel와 함께 분해에 의해 pJ204-pprA로부터 제거된다. p50 모이에티는 동일한 제한 효소(참조 서열 번호 5)의 분해에 의해 pCA24N-p50-리가아제로부터 제거된다. 분해된 pprA의 결합은 pCA24N-pprA-리가아제가 생산된 리가아제-함유 pCA24N 백본(backbone)에 삽입된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)을 포함하는 완벽한 발현 구조물은 서열 번호 7로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 8로 표시된다.
술포로버스 솔파타리쿠스(Sulfolobus solfataricus)로부터 유래된 sso7d 유전자는 유전자 디자이너 소프트웨어 패키지(Gene Designer software package,(Villalobos 등 (2006), BMC Bioin정방향matics, 7, 285))를 이용하여 대장균에서 발현을 강화시키기 위해 최적화된다. 이는 발현된 단백질의 아미노산 서열(GenBank 접근 번호 NP 343889)을 변경하지 않는 반면, pprA 유전자의 서열상에서 47 동의적 돌연변이를 도입한다. 네 개의 코돈은 sso7d 유전자의 5’말단으로부터 제거된다. 연결된 제한 자리(flanking restriction sites, BamHI 및 Spel)와 함께 최적화된 유전자는 통합적인 DNA 기술(Coralville, IA)에 의해 합성되고, 그들의 복제 벡터 pIDTSmart로 공급된다. 코돈-최적화 sso7d 유전자는 제한 효소 BamHI 및 Spel와 함께 분해에 의해 pIDTSmart-sso7d로부터 제거된다. p50 모이에티는 동일한 제한 효소(참조 서열 번호 5)의 분해에 의해 pCA24N-p50-리가아제로부터 제거된다. 분해된 sso7d의 결합은 pCA24N-sso7d-리가아제가 생산된 리가아제-함유 pCA24N 백본(backbone)에 삽입된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)을 포함하는 완벽한 발현 구조물은 서열 번호 9로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 10으로 표시된다.
인간 NF-kappaB(즉, p50)의 아미노산 40-366을 인코딩한 DNA단편은 폴리머라아제 연쇄 반응(PCR)에서 올리고뉴클레오티드 프라이머 리가아제-p50.정방향(표 2, 서열 번호 11) 및 p50_Sfi.역방향(표 2, 서열 번호 12)와 함께 플라스미드 pRES112로부터 증폭된다. T4 DNA 리가아제를 인코딩한 DNA 단편은 PCR에서 올리고머뉴클레오티드 프라이머 리가아제 Sfi.정방향(표 2, 서열 번호 13) 및 리가아제-p50.역방향(표 2, 서열 번호 14)와 함께 플라스미드 pET14b-리가아제로부터 증폭된다. 프라이머 리가아제 Sfi.정방향(서열 번호 13) 및 p50_Sfi.역방향(서열 번호 12)을 사용한 겹쳐진 조립 PCR(참조: Horton 등 (1989) Gene, 77, 61-68)은 리가아제-p50 융합 폴리펩티드가 코딩된 유전자를 야기시키는 p50 유전자 및 리가아제 유전자를 함께 스프라이싱하기 위하여 사용된다. 조립된 리가아제-p50 유전자는 제한 효소 SfiI과 함께 분해되고, pCA24N-리가아제-p50을 얻기 위해 발현 벡터 pCA24N(동일한 제한 효소로 처리됨)에 결합된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)를 포함하는 완벽한 발현 구조물은 서열 번호 15로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 16으로 표시된다.
플라스미드 및 올리고뉴클레오티드
올리고뉴클레오티드 5’ → 3’
p50_Sfi.정방향 GATCCGGCCCTGAGGGCCGCAGATGGCCCATACCTTCAAATAT택 [서열 번호 1]
p50-리가아제.역방향 CCGCCGGAGCCTCCGCCAC택TGCCCGAGCTCCCCTTCTGACGTTTCCTCTG [서열 번호 2]
p50-리가아제.정방향 GCAC택TGGCGGAGGCTCCGGCGGTGGCATTCTTAAAATTCTGAACGAAA택CATC [서열 번호 3]
리가아제_Sfi.역방향 ATGCGGCCGCA택GCCTTA택ACCAGTTACCTCATGAAAATC [서열 번호 4]
리가아제-p50.정방향 GCAC택TGGCGGAGGCTCCGGCGGTGGCGCAGATGGCCCATACCTTCAAATAT택 [서열 번호 11]
p50_Sfi.역방향 ATGCGGCCGCA택GCCT택CTCCCCTTCTGACGTTTCCTCTGC AC [서열 번호 12]
리가아제_Sfi.정방향 GATCCGGCCCTGAGGGCCATTCTTAAAATTCTGAACGAAA택C [서열 번호 13]
igase-p50.역방향 CCGCCGGAGCCTCCGCCAC택TGCC택ACCAGTTACCTCATGAAAATC [서열 번호 14]
3. 융합 폴리펩티드의 제조 및 분리
플라스미드 pCA24N-p50-리가아제, pCA24N-pprA-리가아제, pCA24N-sso7d-리가아제 및 pCA24N-리가아제-p50는 대장균 DH5a-E 세포 내로 도입되고, 형질전환은 융합 폴리펩티드 제조에 적합한 상태(28℃, IPTG가 0.4 mM의 농도로 추가됨)에서 배양된다. 세포들은 펠렛되고, 칼럼 버퍼(CB: 40 mM Tris-HCl, pH 8.0; 300 mM 염화나트륨; 10 mM 이미다졸; 10% 글리세롤; 및 1 mM 베타-메르캅토데탄올)에서 떠 있는 상태가 되고, 초음파에 의해 분리된다. 투명한 용해물은 코발트계 금속 친화력 수지(Talon, Clontech)에 적용된다. 비-(His)6-태그된 세포 단백질을 제거하기 위하여 세척한 후, 150 mM 이미다졸을 포함하는 컬럼 버퍼와 함께 (His)6-태그된 융합 폴리펩티드가 분리된다. 분리된 부분은 모여지고, 저장 버퍼(50 mM 인산칼륨 버퍼, pH 7.8; 200 mM 염화나트륨; 10% 글리세롤)에 대해서 광범위하게 투석된다.
4. 리가아제 활성
융합 폴리펩티드의 리가아제 활성은 아가로스 겔-기반 분석(실시예 2 및 3), 세포 형질변환 분석(실시예 4) 및 정량적 PCR 분석(실시예 5), 세 가지 분석을 사용하여 결정된다.
실시예 2- T4 DNA 리가아제 융합 단백질의 결합 활성의 분석
겔-기반 활성 분석
외가닥 말단 결합에 대해서, 1,277 bp PCR 제품은 pCA24N.정방향역방향'-GATAAC AATTTC AC AC AGA ATTC ATTAA AGAG-3‘[서열 번호 19]) 및 pCA24N.역방향 (5 '-CCCATTAACATC ACCATCTAATTC AAC-3 ' [서열 번호 20]) 프라이머와 함께 플라스미드 pCA24N-ompC의 증폭에 의해 발생된다. 상기 PCR 제품은 매우 유사한 크기(638bp 및 639bp)의 두 개의 선형 단편을 생산하는 제한 효소 SpeI와 함께 절단된다. 절단 반응의 상기 두 제품은 함께 정제되고, 바이러스 리가아제 단백질 존재 및 부재하에서 인큐베이트 된다. 150 ng의 기질 DNA는 16℃에서 10 분 동안 20 pmol 효소와 함께 인큐베이트된다. 반응은 추가적인 15 분 동안 65℃로 가열함에 따라 정지된다. 리가아제 활성은 Qiagen MinElute 컬럼을 사용한 샘플의 정제 및 아갈로스 겔 상에서 이들의 작동에 의해 결정된다. 활성은 1,277 pb 결합된 제품의 출연 및 638/639 bp 기질 밴드의 소멸로서 측정된다.
이중가닥 말단 결합에 대해서, 프라스미드 pCA24N-tig는 세 개의 선형 단편(5,232 bp, 717 bp 및 589 bp)을 생산하는 제한 효소 Sfil 및 Smal와 함께 절단된다. 상기 717 bp 단편은 정제되고 150 ng DNA가 16℃에서 20 분 동안 20 pmol 리가아제 효소와 함께 인큐베이트되어 결합 분석에 사용된다. 반응은 추가적인 15분 동안 65℃로 가열함에 따라 정지된다. 리가아제 활성은 Qiagen MinElute 컬럼을 사용한 샘플들의 정제 및 아갈로스 겔 상에서 이들의 작동에 의해 결정된다. 활성은 1,434 pb 결합된 제품의 출연 및 717 bp 기질 밴드의 소멸로서 측정된다.
결과
바이러스 융합 폴리펩티드의 외가닥 말단 및 이중가닥 말단 결합 활성은 각각 도 1a 및 1b에 나타나 있다. 도 1a의 2, 4, 5, 및 11번째 줄에 그려진 시그널 밴드(1,277 bp)는 매우 효율적인 Sso7d-리가아제, 리가아제-cTF, p50-리가아제, 및 리가아제-PprA 융합 단백질과 외가닥 말단 결합 활성을 나타낸다. 상기 1,277 bp 밴드는 또한 3, 6-8, 및 10번째 줄에 있어서 이러한 융합 폴리펩티드가 또한 견고한 외가닥 말단 리가아제 활성을 갖는다는 것을 나타내는 분명한 증거가 된다. 비록, 상기에서 언급한 다수의 융합 폴리펩티드가 관찰되는 것보다는 적을 지라도, 결합 활성은 T4 DNA 리가아제 조절(도 1a, 14번째 줄)와 함께 관찰된다.
도 1b에서, 매우 효율적인 리가아제-cTF 및 p50-리가아제 융합 단백질과 이중가닥-말단 결합 활성을 나타내는 단일 밴드(1,434 bp)는 3번째 줄 및 4번째 줄에 나타나 있다. 상기 1,434 bp 밴드는 또한 1, 5, 6, 10, 및 11번째 줄에 있어서 이러한 융합 폴리펩티드가 또한 견고한 이중가닥 말단 리가아제 활성을 갖는다는 것을 나타내는 분명한 증거가 된다. 상기에서 언급한 다수의 융합 폴리펩티드가 관찰되는 것보다는 현저하게 적은 최소의 이중가닥 말단 결합 활성은 T4 DNA 리가아제 조절(도 1b, 14번째 줄)과 함께 관찰된다.
논의
상기 겔-기반 분석의 결과는 융합 파트너 및 융합의 특성이 DNA 리가아제의 활성을 조절할 것이라는 것을 보여준다.
특별히, 외가닥 말단 결합에 있어서, T4 DNA 리가아제와 Sso7d, cTF, p50 및 PprA DNA-결합 단백질과의 융합은 DNA-결합 단백질 융합이 부족한 T4 DNA 리가아제와 비교하여 현저하게 향상된 결합 활성을 보여준다. 이중가닥 말단 결합 활성은 리가아제가 cTF 및 p50 단백질에 융합하는 경우 특히 향상된다.
실시예 3- 대장균 LigA 융합 단백질 결합 활성의 분석
겔-기반 활성 분석
외가닥 말단 결합과 관련하여, 170 ng의 Spel로 잘려진 ompC 기질(실시예 2에 언급된 것으로서)은 16℃에서 17 시간동안 각각 LigA 효소 20 pmol과 함께 인큐베이트된다. 상기 반응은 가열-정지(65℃, 15 분)되고, 아갈로스 겔 상에서 작동된다. 게다가, LigA-p50 및 p50-LigA 융합 폴리펩티드, 네이티브 LigA 리가아제 및 세 개의 조절 샘플들이 분석되었다.
- 양성 조절-상업적으로 이용가능한 T4 DNA 리가아제 (Fermentas)
- 음성 조절-리가아제를 첨가하지 않음
- 상업적 조절-대장균 LigA 1 ul
이중가닥 말단 결합에 대하여, 120 ng의 Sfil/Smal-digested tig 기질(실시예 2에 언급된 것으로서)은 16℃에서 17 시간동안 각각 효소 20 pmol과 함께 인큐베이트된다. 상기 반응은 가열-정지(65℃, 15 분)되고, 아갈로스 겔 상에서 작동된다.
결과
LigA 융합 단백질의 외가닥 말단 및 이중가닥 말단 결합 활성은 각각 도 2a 및 2b에 나타나 있다. 네이티브 LigA는 외가닥 말단 결합(도 2a, 2 및 8번째 줄)에 대하여 상기 상업적으로 이용 가능한 LigA 효소와 비교할 만한 활성을 보여준다. p50 DNA-결합 단백질의 융합(도 2a, 3 및 4번째 줄)은 융합되지 않은 LigA와 비교하여 결합 활성의 향상을 보여준다.
예상된 바와 같이, 상기 상업적으로 이용 가능한 LigA 효소는 이중가닥 말단 분석(도 2b, 8번째 줄)에서 무시해도 될 정도의 활성을 보여준다. 상기 네이티브 LigA는 추적 활성(도 2b, 2번째 줄)을 보여준다. 이중가닥 말단 분석에 있어서 견고한 결합 활성은 p50-LigA 융합이 아닌 LigA-p50 융합 구조물과 함께 나타난다.
외가닥 말단 및 이중가닥 말단 분석에 있어서, 상기 T4 DNA 리가아제 양성 조절은 우수한 활성을 보여준다. 음성 조절 샘플에서는 활성이 관찰되지 않았다.
논의
본 발명이 속하는 기술분야에서 인식된 것과 같이, 대장균 LigA는 T4 DNA 리가아제와 비교하여 감소된 결합 활성을 보여준다. 그러나, LigA에 DNA-결합 폴리펩티드의 융합은 결합 활성이 향상되고, 확실히 LigA의 C-말단에 p50-DNA-결합 폴리펩티드의 융합은 LigA 이중가닥 말단 결합 활성을 부여하고, 본래의(native) 효소 상에서는 이중가닥 말단 결합 활성이 관찰되지 않는다.
실시예 4-형질전환 분석
형질전환 분석
상호 보완적인 외가닥 말단과 함께 5,032 bp 벡터 백본 및 1,311 bp 삽입 단편을 제조하기 위해 플라즈마 pCA24N-ompC는 Hindlll 및 Spel 제한 효소와 함께 선으로 만들어 진다.선으로 만들어진 플라스미드(탈인산화된 벡터(dephosphorylated vector) 100 ng 및 삽입 단편 78 ng)는 상기에서 목적한대로 제조된 p50-리가아제, 리가아제-PprA, Sso7d-리가아제, 또는 T4 DNA 리가아제의 존재 또는 부제 조건에서 인큐베이트된다. 16 ℃에서 60 분 동안 인큐베이트된 후, 각각의 샘플은 QiaQuick PCR 정제
키트(Qiagen)를 사용하여 정제되고, 부분 표본들은 대장균 DH5a-E 세포 의 형질전환에 사용된다. 형질전환된 세포는 클로람페니콜(chloramphenicol)을 포함하는 LB 배지에 놓여지고, 37℃에서 밤새 인큐베이트된다. 각각의 플레이트에서 복제된 수는 측정되고, 즉시 다시 원형으로 만들어진 플라스미드 분자, 및 그러므로 리가아제 융합 단백질의 활성과 비례한다.
결과
형질전환 분석의 결과는 아래 표 3에 나타나있다. T4 DNA 리가아제 및 리가아제-PprA 융합 단백질은 더 나은 결과를 낸 Sso7d-리가아제 및 p50-리가아제 융합 단백질에 보여진다. 음성 조절에서 대수롭지 않은 복제된 수가 관찰된다.
형질전환 분석
리가아제 융합 단백질 복제된 수
T4 DNA 리가아제 47
음성 조절(리가아제 없음) 4
Sso7d-리가아제 18
p50-리가아제 17
리가아네-PprA 53
실시예 5-정량적 PCR(qPCR)을 이용한 결합 활성의 분석
실시예 5는 다양한 융합 폴리펩티드의 리가아제 활성을 수량화하기 위하여 qPCR의 사용을 서술한다.
재료 및 방법
외가닥 말단 결합에 대하여, 상기 실시예 2에서 서술된 절단된 PCR 제품(Spel-digested ompC)은 다양한 리가아제 융합 단백질 존재하에 인큐베이트된다. 첫 번째 실험에서, 40 ng의 기질이 20 pmol의 p50-리가아제, 리가아제-p50, PprA-리가아제, Sso7d-리가아제나 또는 T4 DNA 리가아제 중 어느 하나와 함께 인큐베이트된다. 두 번째 실험에서, 420 ng의 기질이 1 pmol 의 리가아제-cTF, 리가아제-PprA, p50-리가아제나 또는 Sso7d-리가아제 중 어느 하나와 함께 인큐베이트된다. 16 ℃에서 10 분 동안 인큐베이트된 후, 각각의 샘플은 QiaQuick PCR 정제 키트(Qiagen)를 이용하여 탈염화된다. 양성 조절 반응은 PCR 제품 및 T4 DNA 리가아제로 이루어지고, 16 ℃에서 16 시간 동안 인큐베이트된다(결합 반응을 완성하기 위함). 음성 조절 반응은 어떠한 리가아제 단백질도 부족하다. 각각의 반응에서 결합된 제품(및 그러므로 각각의 리가아제의 활성)의 양은 결합 자리에 걸쳐진 165 bp 단편이 증폭된 프라이머를 이용하는 qPCR에 의해 측정된다. 각각의 qPCR에서 제품의 발견은 SYBR Green (Bio-Rad). qPCR 프라이머: ompC. 정방향 5'-GGCTTCGCGACCTACCGTAAC ACTG AC-3' [서열 번호 17]; ompC. 역방향, 5'-GCCGACGCCGTCGCCGTTTTGAC-3' [서열 번호 18]의 결합에 의한다.
이중가닥 말단 결합에 대하여, Sfil/Smal로 잘려진 티그(tig) 기질(실시예 2에 기재된)은 동일한 리가아제 융합 효소(리가아제-cTF, 리가아제-PprA, p50-리가아제, 또는 Sso7d-리가아제)와 함께 인큐베이트된다. 각각의 반응에 대하여, 16 ℃에서 5 시간 동안 100 ng의 기질이 1 pmol의 효소와 함께 인큐베이트된다. 상기 반응은 가열-정지(65 ℃, 15 분)되고, 단편은 정제되며, 아갈로스 겔 상에서 작동된다.
결과
qPCR 실험의 결과는 도 3 및 4에 나타나 있다. 상기 데이터는 각각 세 개 중의 하나에서 분석된 샘플로 이루어진 세 개의 독립적인 실험의 평균(+/- SEM)을 나타낸다. 각각의 실험에 대하여, 모든 활성은 양성 조절 반응의 활성(즉, 10 분 대신 16 시간 동안의 결합 반응)을 정상화된다. 실험 1에서 가장 활성이 있는 융합 단백질은 기질의 약 60%가 결합할 수 있는 p50-리가아제 및 PprA-리가아제이다(도 3). 실험 2에서 가장 활성이 있는 융합 단백질은 DNA 분자 기질의 약 62% 내지 69%가 결합할 수 있는 T4 DNA 리가아제, 리가아제-cTF 및 리가아제-PprA이다(도 4). 반대로, Sso7d-리가아제는 기질의 약 30%가 결합할 수 있다.
이중가닥 말단 결합에 대한 겔-기반 분석의 결과는 도 5에 나타나 있다. 무시해도 될 정도의 결합이 Sso7d-리가아제(1번째 줄) 및 T4 DNA 리가아제(5번째 줄)에 대하여 관찰되었다. 결합 활성의 추적 양은 리가아제-PprA(3번째 줄)에 대하여 관찰된 반면, p50-리가아제(2번째 줄) 및 리가아제-cTF(4번째 줄)를 가장 높은 활성을 보여준다.
논의
상기에 기재된 qPCR 분석은 DNA 리가아제의 결합 활성이 DNA-결합 폴리펩티드에의 융합에 의해 향상될 수 있다는 추가적인 확인을 제공한다. 두 개의-폴드 향상은 리가아제 단독에 비교하여 p50-리가아제, 리가아제-cTF 및 리가아제-PprA 융합 폴리펩티드에 대하여 관찰된다. 게다가, 융합 폴리펩티드의 특성 - 리가아제 폴리펩티드와 상대적인 DNA-결합 폴리펩티드의 정체 및 DNA-결합 폴리펩티드의 방향 - 은 융합 폴리펩티드의 결합 활성에 영향을 받는다.
산업상 이용가능성
본 발명의 융합 폴리펩티드 및 제조방법은 분자생물 기술뿐만 아니라, 진단, 단백질 제조, 약학, 영양학 및 의학 분야의 넓은 범위에서 유용하다.
SEQUENCE LISTING <110> Massey University Patrick, Wayne M Wilson, Robert H <120> FUSION POLYPEPTIDES AND USES THEREOF <130> 626257 JBM <150> 61/242865 <151> 2009-09-16 <150> 61/329604 <151> 2010-04-30 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 46 <212> DNA <213> Artificial <220> <223> Synthetic - made in laboratory <400> 1 gatccggccc tgagggccgc agatggccca taccttcaaa tattag 46 <210> 2 <211> 53 <212> DNA <213> Artificial <220> <223> Synthetic <400> 2 ccgccggagc ctccgccact agtgcccgag ctccccttct gacgtttcct ctg 53 <210> 3 <211> 58 <212> DNA <213> Artificial <220> <223> Synthetic <400> 3 gcactagtgg cggaggctcc ggcggtggca ttcttaaaat tctgaacgaa atagcatc 58 <210> 4 <211> 44 <212> DNA <213> Artificial <220> <223> Synthetic <400> 4 atgcggccgc ataggcctta tagaccagtt acctcatgaa aatc 44 <210> 5 <211> 2646 <212> DNA <213> Artificial <220> <223> Synthetic <220> <221> promoter <222> (1)..(93) <223> T5-lac promoter <220> <221> CDS <222> (115)..(165) <223> 6xHis tag and linker <220> <221> misc_feature <222> (147)..(152) <223> BamHI restriction site <220> <221> CDS <222> (166)..(1146) <223> p50 CDS (Homo sapiens) <220> <221> CDS <222> (1147)..(1185) <223> linker <220> <221> misc_feature <222> (1159)..(1164) <223> SpeI restriction site <220> <221> CDS <222> (1186)..(2643) <223> T4 ligase CDS <400> 5 ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60 attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117 Met 1 aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165 Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala 5 10 15 gca gat ggc cca tac ctt caa ata tta gag caa cct aaa cag aga gga 213 Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg Gly 20 25 30 ttt cgt ttc cgt tat gta tgt gaa ggc cca tcc cat ggt gga tta cct 261 Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu Pro 35 40 45 ggt gcc tct agt gaa aag aac aag aag tct tac cct cag gtc aaa atc 309 Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys Ile 50 55 60 65 tgc aac tat gtg gga cca gca aag gtt att gtt cag ttg gtc aca aat 357 Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr Asn 70 75 80 gga aaa aat atc cac ctg cat gcc cac agc ctg gtg gga aaa cac tgt 405 Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His Cys 85 90 95 gag gat ggg atc tgc act gta act gct gga ccc aag gac atg gtg gtc 453 Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val Val 100 105 110 ggc ttc gca aac ctg ggt ata ctt cat gtg aca aag aaa aaa gta ttt 501 Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val Phe 115 120 125 gaa aca ctg gaa gca cga atg aca gag gcg tgt ata agg ggc tat aat 549 Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr Asn 130 135 140 145 cct gga ctc ttg gtg cac cct gac ctt gcc tat ttg caa gca gaa ggt 597 Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu Gly 150 155 160 gga ggg gac cgg cag ctg gga gat cgg gaa aaa gag cta atc cgc caa 645 Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg Gln 165 170 175 gca gct ctg cag cag acc aag gag atg gac ctc agc gtg gtg cgg ctc 693 Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg Leu 180 185 190 atg ttt aca gct ttt ctt ccg gat agc act ggc agc ttc aca agg cgc 741 Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg Arg 195 200 205 ctg gaa ccc gtg gta tca gac gcc atc tat gac agt aaa gcc ccc aat 789 Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro Asn 210 215 220 225 gca tcc aac ttg aaa att gta aga atg gac agg aca gct gga tgt gtg 837 Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys Val 230 235 240 act gga ggg gag gaa att tat ctt ctt tgt gac aaa gtt cag aaa gat 885 Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys Asp 245 250 255 gac atc cag att cga ttt tat gaa gag gaa gaa aat ggt gga gtc tgg 933 Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val Trp 260 265 270 gaa gga ttt gga gat ttt tcc ccc aca gat gtt cat aga caa ttt gcc 981 Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe Ala 275 280 285 att gtc ttc aaa act cca aag tat aaa gat att aat att aca aaa cca 1029 Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys Pro 290 295 300 305 gcc tct gtg ttt gtc cag ctt cgg agg aaa tct gac ttg gaa acc agt 1077 Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr Ser 310 315 320 gaa cca aaa cct ttc ctc tac tat cct gaa atc aaa gat aaa gaa gaa 1125 Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu Glu 325 330 335 gtg cag agg aaa cgt cag aag ggg agc tcg ggc act agt ggc gga ggc 1173 Val Gln Arg Lys Arg Gln Lys Gly Ser Ser Gly Thr Ser Gly Gly Gly 340 345 350 tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata gca tct att ggt 1221 Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly 355 360 365 tca act aaa cag aag caa gca att ctt gaa aag aat aaa gat aat gaa 1269 Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu 370 375 380 385 ttg ctt aaa cga gta tat cgt ctg act tat tct cgt ggg tta cag tat 1317 Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr 390 395 400 tat atc aag aaa tgg cct aaa cct ggt att gct acc cag agt ttt gga 1365 Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly 405 410 415 atg ttg act ctt acc gat atg ctt gac ttc att gaa ttc aca tta gct 1413 Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala 420 425 430 act cgg aaa ttg act gga aat gca gca att gag gaa tta act gga tat 1461 Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr 435 440 445 atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg atg 1509 Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met 450 455 460 465 atg cga gac ctt gaa tgt ggt gct tca gta tct att gca aac aaa gtt 1557 Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val 470 475 480 tgg cca ggt tta att cct gaa caa cct caa atg ctc gca agt tct tat 1605 Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr 485 490 495 gat gaa aaa ggc att aat aag aat atc aaa ttt cca gcc ttt gct cag 1653 Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln 500 505 510 tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt aga ggt gat gaa 1701 Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu 515 520 525 tta gat gat gtt cgt ctt tta tca cga gct ggt aat gaa tat cta gga 1749 Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly 530 535 540 545 tta gat ctt ctt aag gaa gag tta att aaa atg acc gct gaa gcc cgc 1797 Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg 550 555 560 cag att cat cca gaa ggt gtg ttg att gat ggc gaa ttg gta tac cat 1845 Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His 565 570 575 gag caa gtt aaa aag gag cca gaa ggc cta gat ttt ctt ttt gat gct 1893 Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala 580 585 590 tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa tca 1941 Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser 595 600 605 cgt act gct tct aat gga atc gcc aat aaa tct tta aag gga acc att 1989 Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile 610 615 620 625 tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc tgg gat tat gtc 2037 Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val 630 635 640 ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt ttg aaa tat gat 2085 Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp 645 650 655 gta cgt ttt tct aaa cta gaa caa atg aca tct gga tat gat aaa gta 2133 Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val 660 665 670 att tta att gaa aac cag gta gta aat aac cta gat gaa gct aag gta 2181 Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val 675 680 685 att tat aaa aag tat att gac caa ggt ctt gaa ggt att att ctc aaa 2229 Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys 690 695 700 705 aat atc gat gga tta tgg gaa aat gct cgt tca aaa aat ctt tat aaa 2277 Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys 710 715 720 ttt aaa gaa gta att gat gtt gat tta aaa att gta gga att tat cct 2325 Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro 725 730 735 cac cgt aaa gac cct act aaa gcg ggt gga ttt att ctt gag tca gag 2373 His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu 740 745 750 tgt gga aaa att aag gta aat gct ggt tca ggc tta aaa gat aaa gcc 2421 Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala 755 760 765 ggt gta aaa tcg cat gaa ctt gac cgt act cgc att atg gaa aac caa 2469 Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln 770 775 780 785 aat tat tat att gga aaa att cta gag tgc gaa tgc aac ggt tgg tta 2517 Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu 790 795 800 aaa tct gat ggc cgc act gat tac gtt aaa tta ttt ctt ccg att gcg 2565 Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala 805 810 815 att cgt tta cgt gaa gat aaa act aaa gct aat aca ttc gaa gat gta 2613 Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val 820 825 830 ttt ggt gat ttt cat gag gta act ggt cta taa 2646 Phe Gly Asp Phe His Glu Val Thr Gly Leu 835 840 <210> 6 <211> 843 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 6 Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg 1 5 10 15 Ala Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg 20 25 30 Gly Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu 35 40 45 Pro Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys 50 55 60 Ile Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr 65 70 75 80 Asn Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His 85 90 95 Cys Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val 100 105 110 Val Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val 115 120 125 Phe Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr 130 135 140 Asn Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu 145 150 155 160 Gly Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg 165 170 175 Gln Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg 180 185 190 Leu Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg 195 200 205 Arg Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro 210 215 220 Asn Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys 225 230 235 240 Val Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys 245 250 255 Asp Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val 260 265 270 Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe 275 280 285 Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys 290 295 300 Pro Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr 305 310 315 320 Ser Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu 325 330 335 Glu Val Gln Arg Lys Arg Gln Lys Gly Ser Ser Gly Thr Ser Gly Gly 340 345 350 Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile 355 360 365 Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn 370 375 380 Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln 385 390 395 400 Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe 405 410 415 Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu 420 425 430 Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly 435 440 445 Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val 450 455 460 Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys 465 470 475 480 Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser 485 490 495 Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala 500 505 510 Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp 515 520 525 Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu 530 535 540 Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala 545 550 555 560 Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr 565 570 575 His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp 580 585 590 Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu 595 600 605 Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr 610 615 620 Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr 625 630 635 640 Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr 645 650 655 Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys 660 665 670 Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys 675 680 685 Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu 690 695 700 Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr 705 710 715 720 Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr 725 730 735 Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser 740 745 750 Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys 755 760 765 Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn 770 775 780 Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp 785 790 795 800 Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile 805 810 815 Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp 820 825 830 Val Phe Gly Asp Phe His Glu Val Thr Gly Leu 835 840 <210> 7 <211> 2505 <212> DNA <213> Artificial <220> <223> Synthetic <220> <221> promoter <222> (1)..(93) <223> T5-lac promoter <220> <221> CDS <222> (115)..(165) <223> 6xHis tag and linker <220> <221> CDS <222> (166)..(1014) <223> pprA CDS (Deinococcus radiodurans) <220> <221> CDS <222> (1015)..(1044) <223> Linker <220> <221> CDS <222> (1045)..(2502) <223> T4 ligase CDS <400> 7 ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60 attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117 Met 1 aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165 Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala 5 10 15 gcc cgt gcc aag gct aaa gat cag acg gac ggt atc tac gca gcg ttc 213 Ala Arg Ala Lys Ala Lys Asp Gln Thr Asp Gly Ile Tyr Ala Ala Phe 20 25 30 gac acc ctg atg agc acg gcg ggt gtt gac tct cag att gcg gca ctg 261 Asp Thr Leu Met Ser Thr Ala Gly Val Asp Ser Gln Ile Ala Ala Leu 35 40 45 gct gcg agc gaa gcc gac gcc ggc acc ctg gat gcg gcg ttg acg caa 309 Ala Ala Ser Glu Ala Asp Ala Gly Thr Leu Asp Ala Ala Leu Thr Gln 50 55 60 65 tcg ctg caa gag gcg cag ggc cgc tgg ggt ctg ggc ctg cac cac ttg 357 Ser Leu Gln Glu Ala Gln Gly Arg Trp Gly Leu Gly Leu His His Leu 70 75 80 cgc cat gag gcg cgt ttg acc gat gat ggt gac att gag atc ctg acc 405 Arg His Glu Ala Arg Leu Thr Asp Asp Gly Asp Ile Glu Ile Leu Thr 85 90 95 gac ggt cgc cct agc gca cgc gtt agc gag ggt ttt ggt gcc ctg gcg 453 Asp Gly Arg Pro Ser Ala Arg Val Ser Glu Gly Phe Gly Ala Leu Ala 100 105 110 caa gcc tac gca ccg atg caa gcg ctg gat gaa cgt ggc ctg tcc caa 501 Gln Ala Tyr Ala Pro Met Gln Ala Leu Asp Glu Arg Gly Leu Ser Gln 115 120 125 tgg gct gcg ctg ggc gag ggt tat cgc gca ccg ggc gat ctg ccg ctg 549 Trp Ala Ala Leu Gly Glu Gly Tyr Arg Ala Pro Gly Asp Leu Pro Leu 130 135 140 145 gct cag ctg aag gtt ctg atc gaa cat gcc cgc gat ttc gaa act gat 597 Ala Gln Leu Lys Val Leu Ile Glu His Ala Arg Asp Phe Glu Thr Asp 150 155 160 tgg agc gcg ggt cgt ggc gaa acg ttc caa cgc gtc tgg cgt aaa ggt 645 Trp Ser Ala Gly Arg Gly Glu Thr Phe Gln Arg Val Trp Arg Lys Gly 165 170 175 gac acc ctg ttt gtc gag gtg gcg cgt ccg gca tcc gcc gaa gcg gcg 693 Asp Thr Leu Phe Val Glu Val Ala Arg Pro Ala Ser Ala Glu Ala Ala 180 185 190 ctg agc gac gcg gcg tgg gat gtg att gcc agc atc aag gac cgt gcg 741 Leu Ser Asp Ala Ala Trp Asp Val Ile Ala Ser Ile Lys Asp Arg Ala 195 200 205 ttc cag cgt gag ctg atg cgt cgt tct gag aaa gac ggc atg ctg ggt 789 Phe Gln Arg Glu Leu Met Arg Arg Ser Glu Lys Asp Gly Met Leu Gly 210 215 220 225 gcg ctg ttg ggt gct cgc cat gct ggc gcc aag gca aac ttg gca cag 837 Ala Leu Leu Gly Ala Arg His Ala Gly Ala Lys Ala Asn Leu Ala Gln 230 235 240 ctg cca gag gcc cac ttt acc gtg cag gca ttt gtt cag act ctg agc 885 Leu Pro Glu Ala His Phe Thr Val Gln Ala Phe Val Gln Thr Leu Ser 245 250 255 ggt gcg gca gca cgt aat gcg gaa gaa tat cgc gca gcg ctg aaa acg 933 Gly Ala Ala Ala Arg Asn Ala Glu Glu Tyr Arg Ala Ala Leu Lys Thr 260 265 270 gcg gca gcc gct ctg gaa gag tac cag ggc gtg acc acc cgc cag ctg 981 Ala Ala Ala Ala Leu Glu Glu Tyr Gln Gly Val Thr Thr Arg Gln Leu 275 280 285 agc gaa gtc ctg cgt cac ggt ctg cgt gag agc ggc act agt ggc gga 1029 Ser Glu Val Leu Arg His Gly Leu Arg Glu Ser Gly Thr Ser Gly Gly 290 295 300 305 ggc tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata gca tct att 1077 Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile 310 315 320 ggt tca act aaa cag aag caa gca att ctt gaa aag aat aaa gat aat 1125 Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn 325 330 335 gaa ttg ctt aaa cga gta tat cgt ctg act tat tct cgt ggg tta cag 1173 Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln 340 345 350 tat tat atc aag aaa tgg cct aaa cct ggt att gct acc cag agt ttt 1221 Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe 355 360 365 gga atg ttg act ctt acc gat atg ctt gac ttc att gaa ttc aca tta 1269 Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu 370 375 380 385 gct act cgg aaa ttg act gga aat gca gca att gag gaa tta act gga 1317 Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly 390 395 400 tat atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg 1365 Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val 405 410 415 atg atg cga gac ctt gaa tgt ggt gct tca gta tct att gca aac aaa 1413 Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys 420 425 430 gtt tgg cca ggt tta att cct gaa caa cct caa atg ctc gca agt tct 1461 Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser 435 440 445 tat gat gaa aaa ggc att aat aag aat atc aaa ttt cca gcc ttt gct 1509 Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala 450 455 460 465 cag tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt aga ggt gat 1557 Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp 470 475 480 gaa tta gat gat gtt cgt ctt tta tca cga gct ggt aat gaa tat cta 1605 Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu 485 490 495 gga tta gat ctt ctt aag gaa gag tta att aaa atg acc gct gaa gcc 1653 Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala 500 505 510 cgc cag att cat cca gaa ggt gtg ttg att gat ggc gaa ttg gta tac 1701 Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr 515 520 525 cat gag caa gtt aaa aag gag cca gaa ggc cta gat ttt ctt ttt gat 1749 His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp 530 535 540 545 gct tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa 1797 Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu 550 555 560 tca cgt act gct tct aat gga atc gcc aat aaa tct tta aag gga acc 1845 Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr 565 570 575 att tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc tgg gat tat 1893 Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr 580 585 590 gtc ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt ttg aaa tat 1941 Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr 595 600 605 gat gta cgt ttt tct aaa cta gaa caa atg aca tct gga tat gat aaa 1989 Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys 610 615 620 625 gta att tta att gaa aac cag gta gta aat aac cta gat gaa gct aag 2037 Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys 630 635 640 gta att tat aaa aag tat att gac caa ggt ctt gaa ggt att att ctc 2085 Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu 645 650 655 aaa aat atc gat gga tta tgg gaa aat gct cgt tca aaa aat ctt tat 2133 Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr 660 665 670 aaa ttt aaa gaa gta att gat gtt gat tta aaa att gta gga att tat 2181 Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr 675 680 685 cct cac cgt aaa gac cct act aaa gcg ggt gga ttt att ctt gag tca 2229 Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser 690 695 700 705 gag tgt gga aaa att aag gta aat gct ggt tca ggc tta aaa gat aaa 2277 Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys 710 715 720 gcc ggt gta aaa tcg cat gaa ctt gac cgt act cgc att atg gaa aac 2325 Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn 725 730 735 caa aat tat tat att gga aaa att cta gag tgc gaa tgc aac ggt tgg 2373 Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp 740 745 750 tta aaa tct gat ggc cgc act gat tac gtt aaa tta ttt ctt ccg att 2421 Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile 755 760 765 gcg att cgt tta cgt gaa gat aaa act aaa gct aat aca ttc gaa gat 2469 Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp 770 775 780 785 gta ttt ggt gat ttt cat gag gta act ggt cta taa 2505 Val Phe Gly Asp Phe His Glu Val Thr Gly Leu 790 795 <210> 8 <211> 796 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 8 Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg 1 5 10 15 Ala Ala Arg Ala Lys Ala Lys Asp Gln Thr Asp Gly Ile Tyr Ala Ala 20 25 30 Phe Asp Thr Leu Met Ser Thr Ala Gly Val Asp Ser Gln Ile Ala Ala 35 40 45 Leu Ala Ala Ser Glu Ala Asp Ala Gly Thr Leu Asp Ala Ala Leu Thr 50 55 60 Gln Ser Leu Gln Glu Ala Gln Gly Arg Trp Gly Leu Gly Leu His His 65 70 75 80 Leu Arg His Glu Ala Arg Leu Thr Asp Asp Gly Asp Ile Glu Ile Leu 85 90 95 Thr Asp Gly Arg Pro Ser Ala Arg Val Ser Glu Gly Phe Gly Ala Leu 100 105 110 Ala Gln Ala Tyr Ala Pro Met Gln Ala Leu Asp Glu Arg Gly Leu Ser 115 120 125 Gln Trp Ala Ala Leu Gly Glu Gly Tyr Arg Ala Pro Gly Asp Leu Pro 130 135 140 Leu Ala Gln Leu Lys Val Leu Ile Glu His Ala Arg Asp Phe Glu Thr 145 150 155 160 Asp Trp Ser Ala Gly Arg Gly Glu Thr Phe Gln Arg Val Trp Arg Lys 165 170 175 Gly Asp Thr Leu Phe Val Glu Val Ala Arg Pro Ala Ser Ala Glu Ala 180 185 190 Ala Leu Ser Asp Ala Ala Trp Asp Val Ile Ala Ser Ile Lys Asp Arg 195 200 205 Ala Phe Gln Arg Glu Leu Met Arg Arg Ser Glu Lys Asp Gly Met Leu 210 215 220 Gly Ala Leu Leu Gly Ala Arg His Ala Gly Ala Lys Ala Asn Leu Ala 225 230 235 240 Gln Leu Pro Glu Ala His Phe Thr Val Gln Ala Phe Val Gln Thr Leu 245 250 255 Ser Gly Ala Ala Ala Arg Asn Ala Glu Glu Tyr Arg Ala Ala Leu Lys 260 265 270 Thr Ala Ala Ala Ala Leu Glu Glu Tyr Gln Gly Val Thr Thr Arg Gln 275 280 285 Leu Ser Glu Val Leu Arg His Gly Leu Arg Glu Ser Gly Thr Ser Gly 290 295 300 Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser 305 310 315 320 Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp 325 330 335 Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu 340 345 350 Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser 355 360 365 Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr 370 375 380 Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr 385 390 395 400 Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg 405 410 415 Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn 420 425 430 Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser 435 440 445 Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe 450 455 460 Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly 465 470 475 480 Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr 485 490 495 Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu 500 505 510 Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val 515 520 525 Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe 530 535 540 Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala 545 550 555 560 Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly 565 570 575 Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp 580 585 590 Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys 595 600 605 Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp 610 615 620 Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala 625 630 635 640 Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile 645 650 655 Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu 660 665 670 Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile 675 680 685 Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu 690 695 700 Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp 705 710 715 720 Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu 725 730 735 Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly 740 745 750 Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro 755 760 765 Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu 770 775 780 Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu 785 790 795 <210> 9 <211> 1842 <212> DNA <213> Artificial <220> <223> Synthetic <220> <221> promoter <222> (1)..(93) <223> T5-lac promoter <220> <221> CDS <222> (115)..(165) <223> 6xHis tag and linker <220> <221> CDS <222> (166)..(351) <223> sso7d CDS (Sulfolobus solfataricus) <220> <221> CDS <222> (352)..(381) <223> Linker <220> <221> CDS <222> (382)..(1839) <223> T4 ligase CDS <400> 9 ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60 attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117 Met 1 aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcg 165 Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala 5 10 15 act gtt aaa ttc aaa tac aaa ggt gag gag aaa gaa gtt gac att tcc 213 Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile Ser 20 25 30 aag atc aaa aag gta tgg cgc gtg ggc aaa atg atc tct ttc act tac 261 Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr Tyr 35 40 45 gac gaa ggc ggc ggt aaa acc ggt cgt ggc gcg gtg agc gaa aag gac 309 Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys Asp 50 55 60 65 gcg cca aaa gaa ctg ctg cag atg ctg gaa aaa cag aag aaa ggc act 357 Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys Gly Thr 70 75 80 agt ggc gga ggc tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata 405 Ser Gly Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile 85 90 95 gca tct att ggt tca act aaa cag aag caa gca att ctt gaa aag aat 453 Ala Ser Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn 100 105 110 aaa gat aat gaa ttg ctt aaa cga gta tat cgt ctg act tat tct cgt 501 Lys Asp Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg 115 120 125 ggg tta cag tat tat atc aag aaa tgg cct aaa cct ggt att gct acc 549 Gly Leu Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr 130 135 140 145 cag agt ttt gga atg ttg act ctt acc gat atg ctt gac ttc att gaa 597 Gln Ser Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu 150 155 160 ttc aca tta gct act cgg aaa ttg act gga aat gca gca att gag gaa 645 Phe Thr Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu 165 170 175 tta act gga tat atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg 693 Leu Thr Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu 180 185 190 cgt cga gtg atg atg cga gac ctt gaa tgt ggt gct tca gta tct att 741 Arg Arg Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile 195 200 205 gca aac aaa gtt tgg cca ggt tta att cct gaa caa cct caa atg ctc 789 Ala Asn Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu 210 215 220 225 gca agt tct tat gat gaa aaa ggc att aat aag aat atc aaa ttt cca 837 Ala Ser Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro 230 235 240 gcc ttt gct cag tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt 885 Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val 245 250 255 aga ggt gat gaa tta gat gat gtt cgt ctt tta tca cga gct ggt aat 933 Arg Gly Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn 260 265 270 gaa tat cta gga tta gat ctt ctt aag gaa gag tta att aaa atg acc 981 Glu Tyr Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr 275 280 285 gct gaa gcc cgc cag att cat cca gaa ggt gtg ttg att gat ggc gaa 1029 Ala Glu Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu 290 295 300 305 ttg gta tac cat gag caa gtt aaa aag gag cca gaa ggc cta gat ttt 1077 Leu Val Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe 310 315 320 ctt ttt gat gct tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa 1125 Leu Phe Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu 325 330 335 gtt gct gaa tca cgt act gct tct aat gga atc gcc aat aaa tct tta 1173 Val Ala Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu 340 345 350 aag gga acc att tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc 1221 Lys Gly Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val 355 360 365 tgg gat tat gtc ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt 1269 Trp Asp Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg 370 375 380 385 ttg aaa tat gat gta cgt ttt tct aaa cta gaa caa atg aca tct gga 1317 Leu Lys Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly 390 395 400 tat gat aaa gta att tta att gaa aac cag gta gta aat aac cta gat 1365 Tyr Asp Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp 405 410 415 gaa gct aag gta att tat aaa aag tat att gac caa ggt ctt gaa ggt 1413 Glu Ala Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly 420 425 430 att att ctc aaa aat atc gat gga tta tgg gaa aat gct cgt tca aaa 1461 Ile Ile Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys 435 440 445 aat ctt tat aaa ttt aaa gaa gta att gat gtt gat tta aaa att gta 1509 Asn Leu Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val 450 455 460 465 gga att tat cct cac cgt aaa gac cct act aaa gcg ggt gga ttt att 1557 Gly Ile Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile 470 475 480 ctt gag tca gag tgt gga aaa att aag gta aat gct ggt tca ggc tta 1605 Leu Glu Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu 485 490 495 aaa gat aaa gcc ggt gta aaa tcg cat gaa ctt gac cgt act cgc att 1653 Lys Asp Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile 500 505 510 atg gaa aac caa aat tat tat att gga aaa att cta gag tgc gaa tgc 1701 Met Glu Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys 515 520 525 aac ggt tgg tta aaa tct gat ggc cgc act gat tac gtt aaa tta ttt 1749 Asn Gly Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe 530 535 540 545 ctt ccg att gcg att cgt tta cgt gaa gat aaa act aaa gct aat aca 1797 Leu Pro Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr 550 555 560 ttc gaa gat gta ttt ggt gat ttt cat gag gta act ggt cta taa 1842 Phe Glu Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu 565 570 575 <210> 10 <211> 575 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 10 Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg 1 5 10 15 Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile 20 25 30 Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr 35 40 45 Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys 50 55 60 Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys Gly 65 70 75 80 Thr Ser Gly Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu 85 90 95 Ile Ala Ser Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys 100 105 110 Asn Lys Asp Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser 115 120 125 Arg Gly Leu Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala 130 135 140 Thr Gln Ser Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile 145 150 155 160 Glu Phe Thr Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu 165 170 175 Glu Leu Thr Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val 180 185 190 Leu Arg Arg Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser 195 200 205 Ile Ala Asn Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met 210 215 220 Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe 225 230 235 240 Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu 245 250 255 Val Arg Gly Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly 260 265 270 Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met 275 280 285 Thr Ala Glu Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly 290 295 300 Glu Leu Val Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp 305 310 315 320 Phe Leu Phe Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala 325 330 335 Glu Val Ala Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser 340 345 350 Leu Lys Gly Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln 355 360 365 Val Trp Asp Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe 370 375 380 Arg Leu Lys Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser 385 390 395 400 Gly Tyr Asp Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu 405 410 415 Asp Glu Ala Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu 420 425 430 Gly Ile Ile Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser 435 440 445 Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile 450 455 460 Val Gly Ile Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe 465 470 475 480 Ile Leu Glu Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly 485 490 495 Leu Lys Asp Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg 500 505 510 Ile Met Glu Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu 515 520 525 Cys Asn Gly Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu 530 535 540 Phe Leu Pro Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn 545 550 555 560 Thr Phe Glu Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu 565 570 575 <210> 11 <211> 57 <212> DNA <213> Artificial <220> <223> Synthetic <400> 11 gcactagtgg cggaggctcc ggcggtggcg cagatggccc ataccttcaa atattag 57 <210> 12 <211> 47 <212> DNA <213> Artificial <220> <223> Synthetic <400> 12 atgcggccgc ataggcctta gctccccttc tgacgtttcc tctgcac 47 <210> 13 <211> 44 <212> DNA <213> Artificial <220> <223> Synthetic <400> 13 gatccggccc tgagggccat tcttaaaatt ctgaacgaaa tagc 44 <210> 14 <211> 50 <212> DNA <213> Artificial <220> <223> Synthetic <400> 14 ccgccggagc ctccgccact agtgcctaga ccagttacct catgaaaatc 50 <210> 15 <211> 2643 <212> DNA <213> Artificial <220> <223> Synthetic <220> <221> promoter <222> (1)..(93) <223> T5-lac promoter <220> <221> CDS <222> (115)..(165) <223> 6xHis tag and linker <220> <221> CDS <222> (166)..(1623) <223> T4 ligase CDS <220> <221> CDS <222> (1624)..(1653) <223> Linker <220> <221> CDS <222> (1654)..(2640) <223> Human p50 CDS <400> 15 ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60 attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117 Met 1 aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165 Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala 5 10 15 att ctt aaa att ctg aac gaa ata gca tct att ggt tca act aaa cag 213 Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys Gln 20 25 30 aag caa gca att ctt gaa aag aat aaa gat aat gaa ttg ctt aaa cga 261 Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys Arg 35 40 45 gta tat cgt ctg act tat tct cgt ggg tta cag tat tat atc aag aaa 309 Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys Lys 50 55 60 65 tgg cct aaa cct ggt att gct acc cag agt ttt gga atg ttg act ctt 357 Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr Leu 70 75 80 acc gat atg ctt gac ttc att gaa ttc aca tta gct act cgg aaa ttg 405 Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys Leu 85 90 95 act gga aat gca gca att gag gaa tta act gga tat atc acc gat ggt 453 Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp Gly 100 105 110 aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg atg atg cga gac ctt 501 Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp Leu 115 120 125 gaa tgt ggt gct tca gta tct att gca aac aaa gtt tgg cca ggt tta 549 Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly Leu 130 135 140 145 att cct gaa caa cct caa atg ctc gca agt tct tat gat gaa aaa ggc 597 Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly 150 155 160 att aat aag aat atc aaa ttt cca gcc ttt gct cag tta aaa gct gat 645 Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp 165 170 175 gga gct cgg tgt ttt gct gaa gtt aga ggt gat gaa tta gat gat gtt 693 Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val 180 185 190 cgt ctt tta tca cga gct ggt aat gaa tat cta gga tta gat ctt ctt 741 Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu 195 200 205 aag gaa gag tta att aaa atg acc gct gaa gcc cgc cag att cat cca 789 Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His Pro 210 215 220 225 gaa ggt gtg ttg att gat ggc gaa ttg gta tac cat gag caa gtt aaa 837 Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val Lys 230 235 240 aag gag cca gaa ggc cta gat ttt ctt ttt gat gct tat cct gaa aac 885 Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu Asn 245 250 255 agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa tca cgt act gct tct 933 Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala Ser 260 265 270 aat gga atc gcc aat aaa tct tta aag gga acc att tct gaa aaa gaa 981 Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys Glu 275 280 285 gca caa tgc atg aag ttt cag gtc tgg gat tat gtc ccg ttg gta gaa 1029 Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val Glu 290 295 300 305 ata tac agt ctt cct gca ttt cgt ttg aaa tat gat gta cgt ttt tct 1077 Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe Ser 310 315 320 aaa cta gaa caa atg aca tct gga tat gat aaa gta att tta att gaa 1125 Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile Glu 325 330 335 aac cag gta gta aat aac cta gat gaa gct aag gta att tat aaa aag 1173 Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys Lys 340 345 350 tat att gac caa ggt ctt gaa ggt att att ctc aaa aat atc gat gga 1221 Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp Gly 355 360 365 tta tgg gaa aat gct cgt tca aaa aat ctt tat aaa ttt aaa gaa gta 1269 Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val 370 375 380 385 att gat gtt gat tta aaa att gta gga att tat cct cac cgt aaa gac 1317 Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys Asp 390 395 400 cct act aaa gcg ggt gga ttt att ctt gag tca gag tgt gga aaa att 1365 Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys Ile 405 410 415 aag gta aat gct ggt tca ggc tta aaa gat aaa gcc ggt gta aaa tcg 1413 Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys Ser 420 425 430 cat gaa ctt gac cgt act cgc att atg gaa aac caa aat tat tat att 1461 His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr Ile 435 440 445 gga aaa att cta gag tgc gaa tgc aac ggt tgg tta aaa tct gat ggc 1509 Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp Gly 450 455 460 465 cgc act gat tac gtt aaa tta ttt ctt ccg att gcg att cgt tta cgt 1557 Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu Arg 470 475 480 gaa gat aaa act aaa gct aat aca ttc gaa gat gta ttt ggt gat ttt 1605 Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp Phe 485 490 495 cat gag gta act ggt cta ggc act agt ggc gga ggc tcc ggc ggt ggc 1653 His Glu Val Thr Gly Leu Gly Thr Ser Gly Gly Gly Ser Gly Gly Gly 500 505 510 gca gat ggc cca tac ctt caa ata tta gag caa cct aaa cag aga gga 1701 Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg Gly 515 520 525 ttt cgt ttc cgt tat gta tgt gaa ggc cca tcc cat ggt gga tta cct 1749 Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu Pro 530 535 540 545 ggt gcc tct agt gaa aag aac aag aag tct tac cct cag gtc aaa atc 1797 Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys Ile 550 555 560 tgc aac tat gtg gga cca gca aag gtt att gtt cag ttg gtc aca aat 1845 Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr Asn 565 570 575 gga aaa aat atc cac ctg cat gcc cac agc ctg gtg gga aaa cac tgt 1893 Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His Cys 580 585 590 gag gat ggg atc tgc act gta act gct gga ccc aag gac atg gtg gtc 1941 Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val Val 595 600 605 ggc ttc gca aac ctg ggt ata ctt cat gtg aca aag aaa aaa gta ttt 1989 Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val Phe 610 615 620 625 gaa aca ctg gaa gca cga atg aca gag gcg tgt ata agg ggc tat aat 2037 Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr Asn 630 635 640 cct gga ctc ttg gtg cac cct gac ctt gcc tat ttg caa gca gaa ggt 2085 Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu Gly 645 650 655 gga ggg gac cgg cag ctg gga gat cgg gaa aaa gag cta atc cgc caa 2133 Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg Gln 660 665 670 gca gct ctg cag cag acc aag gag atg gac ctc agc gtg gtg cgg ctc 2181 Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg Leu 675 680 685 atg ttt aca gct ttt ctt ccg gat agc act ggc agc ttc aca agg cgc 2229 Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg Arg 690 695 700 705 ctg gaa ccc gtg gta tca gac gcc atc tat gac agt aaa gcc ccc aat 2277 Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro Asn 710 715 720 gca tcc aac ttg aaa att gta aga atg gac agg aca gct gga tgt gtg 2325 Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys Val 725 730 735 act gga ggg gag gaa att tat ctt ctt tgt gac aaa gtt cag aaa gat 2373 Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys Asp 740 745 750 gac atc cag att cga ttt tat gaa gag gaa gaa aat ggt gga gtc tgg 2421 Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val Trp 755 760 765 gaa gga ttt gga gat ttt tcc ccc aca gat gtt cat aga caa ttt gcc 2469 Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe Ala 770 775 780 785 att gtc ttc aaa act cca aag tat aaa gat att aat att aca aaa cca 2517 Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys Pro 790 795 800 gcc tct gtg ttt gtc cag ctt cgg agg aaa tct gac ttg gaa acc agt 2565 Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr Ser 805 810 815 gaa cca aaa cct ttc ctc tac tat cct gaa atc aaa gat aaa gaa gaa 2613 Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu Glu 820 825 830 gtg cag agg aaa cgt cag aag ggg agc taa 2643 Val Gln Arg Lys Arg Gln Lys Gly Ser 835 840 <210> 16 <211> 842 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 16 Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg 1 5 10 15 Ala Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 20 25 30 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 35 40 45 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 50 55 60 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 65 70 75 80 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 85 90 95 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 100 105 110 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 115 120 125 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 130 135 140 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 145 150 155 160 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 165 170 175 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 180 185 190 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 195 200 205 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 210 215 220 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 225 230 235 240 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 245 250 255 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 260 265 270 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 275 280 285 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 290 295 300 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 305 310 315 320 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 325 330 335 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 340 345 350 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 355 360 365 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 370 375 380 Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 385 390 395 400 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 405 410 415 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 420 425 430 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 435 440 445 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 450 455 460 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 465 470 475 480 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 485 490 495 Phe His Glu Val Thr Gly Leu Gly Thr Ser Gly Gly Gly Ser Gly Gly 500 505 510 Gly Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg 515 520 525 Gly Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu 530 535 540 Pro Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys 545 550 555 560 Ile Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr 565 570 575 Asn Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His 580 585 590 Cys Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val 595 600 605 Val Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val 610 615 620 Phe Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr 625 630 635 640 Asn Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu 645 650 655 Gly Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg 660 665 670 Gln Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg 675 680 685 Leu Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg 690 695 700 Arg Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro 705 710 715 720 Asn Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys 725 730 735 Val Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys 740 745 750 Asp Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val 755 760 765 Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe 770 775 780 Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys 785 790 795 800 Pro Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr 805 810 815 Ser Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu 820 825 830 Glu Val Gln Arg Lys Arg Gln Lys Gly Ser 835 840 <210> 17 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic <400> 17 ggcttcgcga cctaccgtaa cactgac 27 <210> 18 <211> 23 <212> DNA <213> Artificial <220> <223> Synthetic <400> 18 gccgacgccg tcgccgtttt gac 23 <210> 19 <211> 32 <212> DNA <213> Artificial <220> <223> Synthetic <400> 19 gataacaatt tcacacagaa ttcattaaag ag 32 <210> 20 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic <400> 20 cccattaaca tcaccatcta attcaac 27

Claims (50)

  1. 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 선별, 정제, 또는 재조합된 융합 폴리펩티드.
  2. 제1항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드 중에서 적어도 하나는 DNA-리가아제 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
  3. 제1항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드 중에서 적어도 하나는 RNA-리가아제 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 RNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 원핵 생물의 DNA리가아제, 원핵 생물의 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
  7. 제6항에 있어서, 상기 DNA 리가아제 폴리펩티드는 박테리아 DNA 리가아제, 박테리아 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
  8. 제7항에 있어서, 상기 DNA 리가아제 폴리펩티드는 대장균 DNA 리가아제 폴리펩티드 또는 기능이 있는 변형물 또는 이들의 기능이 있는 단편이거나 또는 포함하는 것을 특징으로 하는 융합 폴리펩티드.
  9. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 박테리오파지 DNA 리가아제, 변형물, 또는 이들의 기능이 있는 단편을 포함하는 바이러스 DNA 리가아제, 바이러스 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
  10. 제9항에 있어서, 상기 DNA 리가아제 폴리펩티드는 T4 DNA 리가아제, 또는 기능이 있는 변형물 또는 기능이 있는 이들의 단편인 것을 특징으로 하는 융합 폴리펩티드.
  11. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 진핵 생물의 DNA 리가아제, 기능이 있는 이들의 변형물, 또는 기능이 있는 이들의 단편인 것을 특징으로 하는 융합 폴리펩티드.
  12. 제11항에 있어서, 상기 DNA 리가아제 폴리펩티드는 곰팡이의 DNA 리가아제, 포유류의 DNA 리가아제, 또는 기능이 있는 변형물 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
  13. 제1항 내지 12항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 서열 비-특이적 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 펩티드.
  14. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 서열 특이적 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
  15. 제4항 내지 제14항 중 어느 한 항에 있어서, 상기 DNA-결합 폴리펩티드는 염색체 단백질, 히스톤, HMf-유사 단백질, 및 고세균(archael)의 작고 기본적인 DNA-결합 단백질을 포함하는 군으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
  16. 제4항 내지 제15항 중 어느 한 항에 있어서, 상기 DNA-결합 폴리펩티드는,
    디이노코쿠스 라디오두란스(Deinococcus radiodurans) (GenBank 접근 번호 BAA21374) 유래의 PprA 단백질;
    호모 사피엔스 유래의 NF-kappaB 단백질, 또한 NF-kappaB p50 단백질 또는 인간 NF-kappaB 단백질의 아미노산 40-366을 포함하는 단편과 같은 하나 또는 하나 이상의 그들의 단편을 포함하는 포유류 NF-kappaB 단백질;
    결핵균(Mycobacterium tuberculosi) (GenBank 접근 번호 NP_215452) 유래의 Ku 단백질;
    술포로버스 솔파타리쿠스(Sulfolobus solfataricus) (GenBank 접근 번호 NP_343889) 유래의 Sso7d 단백질;
    술포로버스 애시도칼다리우스(Sulfolobus acidocaldarius) (GenBank 접근 번호 P13123) 유래의 Sac7d 단백질;
    데이노코쿠스 라디오두란스(Deinococcus radiodurans)의 DdrA 단백질;
    유전자 이식 생쥐(Mus musculus) 유래의 NFATcI 단백질, 또는 유전자 이식 생쥐 유래의 NFATcI 단백질의 아미노산 403-703을 포함하는 하나 또는 하나 이상의 기능이 있는 이들의 단편, 또는 하나 또는 하나 이상의 기능이 있는 이들의 변형물과 같은 포유류 NFATc 단백질; 및
    상기 물질들의 하나 또는 하나 이상의 상동체(homologues), 상기 물질들의 하나 또는 하나 이상의 기능이 있는 변형물 또는 기능이 있는 단편, 및 상기 물질들의 두 개 이상의 조합물;
    을 포함하는 군으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
  17. 제16항에 있어서, 상기 DNA-결합 폴리펩티드는 NFAT-Ala-p50 혼성 DNA-결합 단백질(cTF)인 것을 특징으로 하는 융합 폴리펩티드.
  18. 제16항 또는 제17항에 있어서, 상기 DNA 리가아제는 T4 DNA 리가아제인 것을 특징으로 하는 융합 폴리펩티드.
  19. 제16항 또는 제18항에 있어서, 상기 DNA-결합 폴리펩티드는 PprA, Sso7d, 및 p50으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
  20. 제19항에 있어서, 상기 T4 DNA 리가아제 및 p50을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
  21. 제1항에 있어서, 서열 번호 6, 8, 10, 또는 16 중 어느 하나에서 10개 이상의 인접한 아미노산을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
  22. 제21항에 있어서, 상기 융합 폴리펩티드는,
    서열번호 6의 아미노산 8 내지 344;
    서열번호 8의 아미노산 18 내지 300;
    서열번호 16의 아미노산 514 내지 842;
    를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 아미노산; 및
    서열번호 6의 아미노산 358 내지 843;
    서열번호 8의 아미노산 311 내지 796;
    서열번호 10의 아미노산 90 내지 575; 및
    서열번호 16의 아미노산 18 내지 503;
    을 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 아미노산;
    을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
  23. 제1항에 있어서, 본 발명의 실시예에서 참조로 설명된 것을 특징으로 하는 융합 폴리펩티드.
  24. 제1항 내지 23항 중 어느 한 항에 따른 융합 폴리펩티드를 인코딩한 선별, 정제 또는 재조합된 것을 특징으로 하는 폴리뉴클레오티드.
  25. 서열번호 5, 7, 9, 및 15 중 어느 하나에서 하나 이상의 인접한 뉴클레오티드를 포함하는 선별, 정제 또는 재조합된 것을 특징으로 하는 폴리뉴클레오티드.
  26. 제25항에 있어서, 상기 폴리뉴클레오티드는,
    서열번호 5의 뉴클레오티드 166 내지 1146;
    서열번호 5의 뉴클레오티드 166 내지 1185;
    서열번호 7의 뉴클레오티드 166 내지 1014;
    서열번호 7의 뉴클레오티드 166 내지 1044;
    서열번호 9의 뉴클레오티드 166 내지 351;
    서열번호 9의 뉴클레오티드 166 내지 381;
    서열번호 15의 뉴클레오티드 1624 내지 2640; 및
    서열번호 15의 뉴클레오티드 1654 내지 2640;
    를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개 이상의 인접한 뉴클레오티드; 및
    서열번호 5의 뉴클레오티드 1147 내지 2643;
    서열번호 5의 뉴클레오티드 1186 내지 2643;
    서열번호 7의 뉴클레오티드 1015 내지 2502;
    서열번호 7의 뉴클레오티드 1045 내지 2502;
    서열번호 9의 뉴클레오티드 352 내지 1839;
    서열번호 9의 뉴클레오티드 382 내지 1839;
    서열번호 15의 뉴클레오티드 166 내지 1623; 및
    서열번호 15의 뉴클레오티드 166 내지 1653;
    를 포함하는 군으로부터 선택된 하나의 서열로부터 적어도 10개 이상의 인접한 뉴클레오티드를 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  27. 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
  28. 제27항에 있어서, DNA-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
  29. 제27항 또는 제28항에 있어서, DNA-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
  30. 제28항 또는 제29항에 있어서, 상기 구조물은 하나의 DNA 리가아제 폴리펩티드 및 하나의 DNA-결합 폴리펩티드를 포함하는 하나의 융합 폴리펩티드를 인코딩하는 것을 특징으로 하는 발현 구조물.
  31. 제29항 또는 제30항에 있어서, 상기 DNA 리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 상기 DNA-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열은 하나의 전사 해석틀(open reading frame)로 존재하는 것을 특징으로 하는 발현 구조물.
  32. 제27항 내지 제31항 중 어느 한 항에 있어서, 상기 발현 구조물은 청구항 6 내지 23항 중 어느 한 항에 따른 융합 폴리펩티드를 인코드하는 것을 특징으로 하는 발현 구조물.
  33. 제27항 내지 제32항 중 어느 한 항에 있어서, 상기 발현 구조물은 서열번호 5, 7, 9, 또는 15 중 어느 하나에서 10개 이상의 인접한 뉴클레오티드를 포함하는 것을 특징으로 하는 발현 구조물.
  34. 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물을 포함하는 것을 특징으로 하는 벡터.
  35. 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물 또는 제34항에 따른 벡터를 포함하는 것을 특징으로 하는 숙주 세포.
  36. 제1항 내지 제23항 중 어느 한 항에 따른 융합 단백질, 제24항 내지 제26항 중 어느 한 항에 따른 폴리뉴클레오티드, 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물, 제34항에 따른 벡터, 또는 제35항에 따른 숙주세포를 포함하는 것을 특징으로 하는 조성물.
  37. 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 숙주 세포를 제공하는 단계;
    발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주 세포를 유지하는 단계; 및
    상기 숙주 세포로부터 융합 폴리펩티드를 분리하는 단계;
    를 포함하는 것을 특징으로 하는 융합 폴리펩티드의 생산 방법.
  38. 제37항에 있어서, 상기 발현 구조물은 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물인 것을 특징으로 하는 융합 폴리펩티드의 생산 방법.
  39. 하나 또는 하나 이상의 융합 폴리펩티드와 하나 또는 하나 이상의 핵산분자를 접촉하는 단계를 포함하는 하나 이상의 핵산 분자의 연결 방법으로,
    상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드와 융합된 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  40. 제39항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  41. 제39항 또는 제40항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  42. 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 DNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  43. 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 적어도 두 개의 DNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  44. 제39항 내지 제43항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 RNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
  45. 하나 이상의 핵산을 하나의 융합 폴리펩티드에 접촉시키는 단계를 포함하는 인산디에스테르 결합 형성의 촉매방법으로,
    상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
  46. 제45항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
  47. 제45항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 인산디에스테르 결합은 분자내(intermolecular)의 결합인 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
  49. 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 인산디에스테르 결합은 분자간(intermolucular)의 결합인 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
  50. 제1항 내지 제23항의 어느 한 항에 따른 하나 이상의 융합 폴리펩티드, 제24항 내지 제26항의 어느 한 항에 따른 폴리뉴클레오티드, 제27항 내지 제33항의 어느 한 항에 따른 발현 구조물, 제35에 따른 숙주세포, 또는 제36항에 따른 조성물을 포함하고,
    선택적으로 하나 이상의 버퍼, 보조인자, 양성 인자, 음성 인자, 기질, 또는 본 발명의 융합 폴리펩티드의 활성에 요구되는 다른 시약을 포함하는 것을 특징으로 하는 키트.
KR1020127009669A 2009-09-16 2010-09-16 융합 폴리펩티드 및 이들의 용도 KR20120093882A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US24286509P 2009-09-16 2009-09-16
US61/242,865 2009-09-16
US32960410P 2010-04-30 2010-04-30
US61/329,604 2010-04-30

Publications (1)

Publication Number Publication Date
KR20120093882A true KR20120093882A (ko) 2012-08-23

Family

ID=43758865

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127009669A KR20120093882A (ko) 2009-09-16 2010-09-16 융합 폴리펩티드 및 이들의 용도

Country Status (9)

Country Link
US (1) US20120214208A1 (ko)
EP (1) EP2478014A4 (ko)
JP (1) JP2013505016A (ko)
KR (1) KR20120093882A (ko)
CN (1) CN102597006A (ko)
AU (1) AU2010296086A1 (ko)
CA (1) CA2774333A1 (ko)
SG (1) SG179200A1 (ko)
WO (1) WO2011034449A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101468585B1 (ko) * 2012-12-13 2014-12-03 한국 한의학 연구원 하나의 핵산상에서 서로 떨어져 있는 복수의 염기서열 요소들의 pcr 증폭 방법

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014145269A1 (en) * 2013-03-15 2014-09-18 Theranos, Inc. Thermostable blunt-end ligase and methods of use
WO2015175748A1 (en) * 2014-05-14 2015-11-19 Evorx Technologies, Inc. Methods and compositions for controlling gene expression and treating cancer
CA3062550A1 (en) * 2017-05-08 2018-11-15 Codexis, Inc. Engineered ligase variants
CN113166270A (zh) * 2018-12-17 2021-07-23 深圳华大生命科学研究院 融合蛋白及其应用
WO2021198341A1 (en) * 2020-03-31 2021-10-07 Arcticzymes As Atp-dependent dna ligase
CN113774032B (zh) * 2021-11-12 2022-03-01 翌圣生物科技(上海)股份有限公司 重组t4连接酶突变体、编码dna及ngs建库方法
US20230295707A1 (en) * 2022-03-21 2023-09-21 Abclonal Science, Inc. T4 DNA Ligase Variants with Increased Ligation Efficiency
CN118291587A (zh) * 2023-01-03 2024-07-05 南京诺唯赞生物科技股份有限公司 一种组合物及其在核酸纯化中的应用

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5871902A (en) * 1994-12-09 1999-02-16 The Gene Pool, Inc. Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids
US6706505B1 (en) * 2000-03-08 2004-03-16 Amgen Inc Human E3α ubiquitin ligase family
US6627424B1 (en) * 2000-05-26 2003-09-30 Mj Bioworks, Inc. Nucleic acid modifying enzymes
US20070015148A1 (en) * 2001-01-25 2007-01-18 Orr Michael S Gene expression profiles in breast tissue
US7271005B2 (en) * 2002-04-30 2007-09-18 University Of Florida Research Foundation, Inc. Modulation of bacterial membrane permeability
EP2264155A1 (en) * 2002-07-25 2010-12-22 Bio-Rad Laboratories, Inc. Hybrid polymerase methods and compositions
JPWO2006085407A1 (ja) * 2005-02-09 2008-12-18 学校法人日本大学 Hcv量に関連する遺伝子のスクリーニング方法
JP5241493B2 (ja) * 2005-07-15 2013-07-17 アジレント・テクノロジーズ・インク Dna結合タンパク質−ポリメラーゼのキメラ
US20070059713A1 (en) * 2005-09-09 2007-03-15 Lee Jun E SSB-DNA polymerase fusion proteins
WO2008005310A2 (en) * 2006-06-30 2008-01-10 Ambit Biosciences Corp. Detectable nucleic acid tag
ATE542830T1 (de) * 2006-12-04 2012-02-15 Pasteur Institut Als gerüst verwendeter ob-fold zur entwicklung neuer spezifischer bindemittel
US20110020877A1 (en) * 2008-01-11 2011-01-27 Genesys Limited Cren7 chimeric protein

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101468585B1 (ko) * 2012-12-13 2014-12-03 한국 한의학 연구원 하나의 핵산상에서 서로 떨어져 있는 복수의 염기서열 요소들의 pcr 증폭 방법

Also Published As

Publication number Publication date
CA2774333A1 (en) 2011-03-24
AU2010296086A1 (en) 2012-05-10
EP2478014A4 (en) 2013-11-27
US20120214208A1 (en) 2012-08-23
JP2013505016A (ja) 2013-02-14
EP2478014A1 (en) 2012-07-25
WO2011034449A1 (en) 2011-03-24
CN102597006A (zh) 2012-07-18
SG179200A1 (en) 2012-04-27

Similar Documents

Publication Publication Date Title
KR20120093882A (ko) 융합 폴리펩티드 및 이들의 용도
JP7518549B2 (ja) 遺伝子編集における非意図的な変異の阻害
US11926854B2 (en) Soluble intein fusion proteins and methods for purifying biomolecules
Sharp et al. The interface of ς with core RNA polymerase is extensive, conserved, and functionally specialized
TWI682997B (zh) 用於改善插入序列傾向及增加dna輸入耐受度之經修飾的轉位酶
Evans Jr et al. Intein‐mediated protein ligation: Harnessing nature's escape artists
US5723584A (en) Biotinylation of proteins
Garinot-Schneider et al. Identification of putative active-site residues in the DNase domain of colicin E9 by random mutagenesis
Evans et al. Mechanistic and kinetic considerations of protein splicing
Endo et al. High-throughput, genome-scale protein production method based on the wheat germ cell-free expression system
Schmohl et al. Engineering sortase a by screening a second‐generation library using phage display
KR20090125047A (ko) 증대된 단백질 발현 및 정제를 위한 방법 및 조성물
Arsène et al. Role of region C in regulation of the heat shock gene-specific sigma factor of Escherichia coli, ς32
AU2002341204B2 (en) Method for producing and identifying soluble protein domains
CA2837503C (en) Sequence-specific engineered ribonuclease h and the method for determining the sequence preference of dna-rna hybrid binding proteins
JP5587528B2 (ja) c−Jun蛋白質と複合体を形成する蛋白質、及び、それをコードする核酸、ならびに、それらの利用方法
JP2017530726A (ja) 抗体様タンパク質
WO2002038580A1 (en) Streptavidin-binding peptides and uses thereof
JP2006180886A (ja) Dnaポリメラーゼの製造方法
Zhang Protein Engineering in the Study of Protein Labeling and Degradation
JP3829174B2 (ja) Dnaポリメラーゼ活性と3’−5’エキソヌクレアーゼ活性を有する耐熱性ヘテロダイマー酵素およびその製法
JPH07126297A (ja) カルモジュリン融合蛋白質
WO2024178215A2 (en) Chimeric biosensor for the detection 2&#39;3&#39;-cyclic gmp-amp (cgamp) and methods of use thereof
Schirra et al. Role of Region C in Regulation of the Heat
Reid-Varley A Cutting-Edge Tail: Crystallisation of UCH-L5 C-terminal Domain William-Bernard Reid-Varley Petsko-Ringe Lab

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid