KR100530598B1 - 초내열성 프로테아제 발현계 - Google Patents

초내열성 프로테아제 발현계 Download PDF

Info

Publication number
KR100530598B1
KR100530598B1 KR10-1999-7011547A KR19997011547A KR100530598B1 KR 100530598 B1 KR100530598 B1 KR 100530598B1 KR 19997011547 A KR19997011547 A KR 19997011547A KR 100530598 B1 KR100530598 B1 KR 100530598B1
Authority
KR
South Korea
Prior art keywords
gly
val
ala
ser
thr
Prior art date
Application number
KR10-1999-7011547A
Other languages
English (en)
Other versions
KR20010013540A (ko
Inventor
히까루 다까꾸라
미오 모리시따
도모꼬 시모조
기요조 아사다
이꾸노신 가또
Original Assignee
다카라 바이오 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다카라 바이오 가부시키가이샤 filed Critical 다카라 바이오 가부시키가이샤
Publication of KR20010013540A publication Critical patent/KR20010013540A/ko
Application granted granted Critical
Publication of KR100530598B1 publication Critical patent/KR100530598B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Abstract

유전자 공학적인 수법에 의해 공업적 사용에 유리한 초호열균의 프로테아제를 제공하기 위해 서열표의 서열번호 1에 나타낸 아미노산 서열 및 그 서열의 1 또는 다수의 아미노산이 결실, 치환, 삽입 또는 부가된 아미노산 서열을 갖는 내열성 프로테아제, 그것을 코드하는 내열성 프로테아제 유전자, 그 프로테아제의 제조방법을 개시한다.

Description

초내열성 프로테아제 발현계{System for expressing hyperthermostable protease}
본 발명은 공업용 효소로서 유용한 초내열성 프로테아제, 그것을 코드하는 유전자 및 그 효소의 유전자 공학적 제조방법에 관한 것이다.
프로테아제는 단백질의 펩티드 결합을 절단하는 효소로서, 동물, 식물, 미생물에서 수많은 효소가 발견되고 있다. 그 용도는 연구용 시약, 의약 외에 세제로의 첨가, 식품의 가공, 역반응을 이용한 화학 합성이라는 공업적 분야에 있어서도 산업상 매우 중요한 효소라고 할 수 있다. 공업적 분야에서 사용되는 프로테아제에는 물리적, 화학적으로 높은 안정성이 요구되고 있어, 특히 내열성의 효소가 사용되고 있다. 바실러스(Bacillus)속 세균이 생산하는 프로테아제는 비교적 높은 내열성을 나타내므로 현재 산업적으로 사용되고 있는 프로테아제의 주류를 차지하고 있다. 그러나, 더 뛰어난 효소가 요망되고 있으며 고온에서 생육하는 미생물, 예를 들어 호열성 바실러스속 세균이나 초호열균에서 효소를 취득하고자 하는 시도도 이루어지고 있다.
예를 들어, 초호열균의 하나인 피로코커스 퓨리오서스(Pyrococcus furiosus)가 프로테아제를 생산하는 것이 알려져 있다[Appl. Environ. Microbiol. 제56권, 제1992∼1998페이지(1990); FEMS Microbiol. Letters 제71권, 제17∼20페이지(1990); J. Gen. Microbiol. 제137권, 제1193∼1199페이지(1991)].
또한, 피로코커스 속에 속하는 초호열균, 피로코커스 종 KOD1주(Pyrococcus sp. strain KOD1)는 티올프로테아제(시스테인 프로테아제)를 생산하는 것이 보고된 바 있다[Appl. Environ. Microbiol., 제60권, 제4559∼4566페이지(1994)]. 마찬가지로 초호열균인 써모코커스(Thermococcus)속, 스타필로서머스(Staphylothermus) 속, 써모박테로이데스(Thermobacteroides)속의 세균에 관해서도 프로테아제의 생산이 알려져 있다(Appl. Microbiol. Biotechnol.) 제34권, 제715∼719페이지(1991).
상기한 바와 같은 초호열균 유래의 프로테아제는 높은 열안정성을 갖고 있어 현재 사용되고 있는 내열성 프로테아제를 대신하거나, 또는 지금까지는 프로테아제의 사용을 생각할 수 없었던 분야에서 이용되는 것이 기대되고 있다.
그러나, 이것들의 효소를 생산하는 미생물의 대부분은 고온 조건에서만 생육하는 것으로, 예를 들어 피로코커스 퓨리오서스의 경우에는 90∼100℃에서의 배양이 필요하다. 이와 같은 고온에서의 배양조작은 에너지 비용면에서 불리하다. 또한, 이것들의 초호열균의 프로테아제 생산성은 지금까지 사용되어 온 미생물 프로테아제에 비해서 낮다. 이와 같이 초호열균 유래의 프로테아제의 공업적인 제조방법은 문제를 갖고 있다.
한편, 목적하는 효소의 유전자를 단리시켜 배양이 용이한 숙주 미생물에 이것을 도입하여 유전자 공학적인 효소의 생산을 행하는 것은 현재 널리 행해지고 있다. 그러나, 숙주에게 도입된 효소의 유전자는 반드시 의도하였던 것과 같은 효율로 발현된다고는 할 수는 없다. 이것은 도입되는 유전자의 GC 함량이나 코돈의 사용 빈도가 숙주의 유전자의 것과 다른 것 등이 주된 원인이라고 생각되고 있다. 따라서, 그 사용 목적에 들어 맞는 효소 생산성을 얻기 위해서는 도입유전자, 숙주마다 발현 방법을 적정화하는 것이 필요하다.
본 발명의 목적은 상기의 과제를 해결하기 위해서 공업적인 사용에 유리한 초호열균의 프로테아제를 제공하는 것, 그 초호열균의 프로테아제를 코드하는 유전자를 단리하는 것, 및 그 유전자를 이용한 초내열성 프로테아제의 유전자 공학적 제조 방법을 제공하는 데 있다.
초호열균이 생산하는 프로테아제의 중에는, 그 아미노산 서열의 상동성으로부터 섭틸리신-타입이라고 하는 알칼리성 프로테아제로 분류될 수 있는 것이 있다. 이것들의 유전자를 예를 들어 유전공학적 생산에 범용되는 바실러스 섭틸리스(Bacillus subtilis)에 도입한 경우, 그 효소의 생산성은 바실러스 섭틸리스가 원래 생산하는 단백질에는 못 미친다.
본 발명자 등은 예의 연구의 결과, 발현시키고자 하는 초호열균 유래 프로테아제 유전자의 상류에 섭틸리신 유래의 시그널 펩티드(신호 서열)을 코드하는 유전자를 위치시키고, 또한 그 절단점 주변의 아미노산 서열을 변형시킴으로서 목적유전자가 바실러스 섭틸리스에서 고효율로 발현됨을 발견하였다. 또한, 목적하는 초호열균 유래 프로테아제 유전자중에서 효소활성의 발현에는 필수가 아닌 부분을 결실시킴에 의해서도 효소발현량이 증가됨을 밝혀내어 본 발명을 완성시킴에 이르렀다.
본 발명을 개략적으로 설명하면, 본 발명의 제 1의 발명은 서열표의 서열번호 1에 나타낸 아미노산 서열을 갖는 내열성 프로테아제, 및 서열표의 서열번호 1에 나타낸 아미노산 서열에 있어서 1 또는 수개의 아미노산이 결실, 치환, 삽입 또는 부가된 아미노산 서열을 가지며, 또 내열성 프로테아제 활성을 갖는 프로테아제이다.
또한, 본 발명의 제 2의 발명은 제 1의 발명의 내열성 프로테아제를 코드하는 유전자, 및 그 유전자에 하이브리다이즈하는 내열성 프로테아제 유전자이다.
본 발명의 제 3의 발명은 초호열균 유래의 내열성 프로테아제를 유전공학적으로 제조하기 위해서 사용되는 유전자로서 이는 식 Ⅰ:
SIG-Ala-Gly-Gly-Asn-PRO [Ⅰ]
[식중, SIG는 섭틸리신 유래의 시그널 펩티드의 아미노산 서열을, PRO는 발현시키고자 하는 단백질의 아미노산 서열을 각각 나타낸다]로 표시되는 아미노산 서열을 코드하는 것을 특징으로 한다. SIG는 바람직하게는 서열표의 서열번호 3에 나타낸 아미노산 서열이고, 또한 PRO는 바람직하게는 초호열균 유래의 내열성 프로테아제, 특히 바람직하게는 피로코커스 퓨리오서스 유래의 프로테아제의 아미노산 서열이다.
본 발명의 제 4의 발명은 단백질의 유전공학적인 제조 방법에 관한 것으로, 제 3의 발명의 유전자를 도입한 바실러스속 세균를 배양하여, 그 배양물로부터 목적하는 단백질을 수집하는 공정을 함유하는 것을 특징으로 한다.
본 발명의 제 5의 발명은 단백질을 유전공학적으로 제조하기 위해서 사용되는 플라스미드로 제 3의 발명의 유전자가 삽입되어 있는 것을 특징으로 한다.
본 발명에 의해 개시되는 프로테아제를 포함시켜 천연에 존재하는 단백질에는 그것을 코드하는 유전자의 다형이나 돌연변이의 것 외에, 생성후의 단백질의 생체내 및 정제중의 수식반응 등에 의해서 그 아미노산 서열 중에 1 또는 수개의 아미노산의 결실, 삽입, 부가, 치환 등의 돌연변이가 일어날 수 있지만, 그럼에도 불구하고 돌연변이 단백질은 돌연변이를 갖지 않는 단백질과 실질적으로 동등한 생리, 생물학적 활성을 나타내는 것으로 알려져 있다. 인위적으로 단백질의 아미노산 서열에 상기한 바와 같은 돌연변이를 도입한 경우도 동일하며, 이 경우에는 다종다양의 돌연변이체를 제작하는 것이 한층 가능하다. 예를 들어, 인간 인터류킨 2(IL-2)의 아미노산 서열 중의 어떤 시스테인 잔기를 세린으로 치환한 폴리펩티드가 인터류킨 2 활성을 유지하는 것이 알려져 있다[Science, 제224권, 1431페이지(1984)]. 이와 같이 본 발명에 개시된 아미노산 서열 중에 1 또는 수개의 아미노산의 결실, 삽입, 부가, 치환 등이 발생한 아미노산 서열을 가지며, 또 본 발명의 프로테아제와 동등한 활성을 갖는 프로테아제는 본 발명의 범위내에 속하는 것이다.
본 명세서에서의 「(특정 유전자와)하이브리다이즈하는 유전자」는, 특정 유전자와 유사한 염기서열을 갖는 유전자이다. 특정 유전자와 유사한 염기 서열을 갖는 유전자는 거기에 코드되어 있는 단백질의 아미노산 서열, 또는 그 단백질이 갖고 있는 기능도 유사할 가능성이 높다. 유전자의 염기서열의 유사성은 양 유전자 또는 그 일부끼리 긴축 조건에서 하이브리드를 형성하는(하이브리다이즈하는)지의 여부에 의해 조사할 수 있으며, 이것을 이용하여 특정 유전자가 코드하는 단백질과 동일한 기능을 갖는 단백질를 코드하는 유전자를 취득할 수 있다. 즉, 본 발명에 의해 얻어진 유전자, 또는 그 일부를 프로브에 이용하여 공지의 방법으로 하이브리다이제이션을 행함으로써 본 발명의 유전자와 유사의 염기서열을 갖는 유전자를 취득할 수 있다. 하이브리다이제이션은 예를 들어 1989년, Cold Spring Harbor Laboratory 발행, T. 마니아티스(T. Maniatis) 등 편집, Molecular Cloning: A Laboratory Manua1 2nd ed.에 기재된 방법에 의해 실시할 수 있다. 더욱 구체적으로는, 예를 들어 이하의 조건으로 하이브리다이제이션을 할 수 있다. 즉, DNA를 고정한 멤브레인을 0.5% SDS, 0.1% 소혈청알부민(BSA), 0.1% 폴리비닐피롤리돈, 0.1% 피콜 400, 0.01% 변성연어정자 DNA를 포함하는 6×SSC(1×SSC는 0.15M NaCl, 0.015M 구연산나트륨, pH 7.0을 나타낸다)중에서, 50℃에서 12∼20시간, 프로브와 동시에 배양한다. 배양 종료후, 0.5% SDS를 포함하는 2×SSC중에서 37℃에서의 세정으로부터 시작하여 SSC 농도는 0.1× 까지의 범위로 낮추면서, 또 온도는 50℃까지의 범위로 올리면서 변화시켜 고정된 DNA 유래의 시그널이 백그라운드와 구별할 수 있게 될 때까지 멤브레인을 세정한다.
별법으로, 하이브리다이제이션을 대신하여 본 발명에 의해 얻어진 유전자의 염기서열의 일부를 프라이머에 이용하는 유전자증폭법, 예를 들어 PCR 법을 이용할 수도 있다. 이렇게 해서 얻어진 유전자가 목적하는 기능을 갖는 단백질을 코드하는 지의 여부는 얻어진 유전자를 적당한 숙주 및 발현계를 이용하여 발현시켜 얻어진 단백질의 활성을 조사함에 의해 알 수 있다.
도 1은 플라스미드 pSTC3의 제한효소 지도이다.
도 2는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 3은 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 4는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 5는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 6은 플라스미드 pSNP1의 제한효소 지도이다.
도 7은 플라스미드 pPS1의 제한효소 지도이다.
도 8은 플라스미드 pNAPS1의 제한효소 지도이다.
본 발명에 따른 초내열성 프로테아제로서는 여러가지의 초호열균 유래의 프로테아제를 들 수 있다. 예를 들어, WO95/34645호 공보에는 피로코커스 퓨리오서스 (Pyrococcus furiosus) 및 써모코커스 셀러(Thermococus celer) 유래의 프로테아제에 대하여 기재되어 있다.
피로코커스 퓨리오서스 DSM3638 유래의 프로테아제 유전자는 그 균주의 게놈 DNA 라이브러리로부터 내열성의 프로테아제 활성을 지표로 하여 단리되었다. 그 유전자를 함유하는 플라스미드는 플라스미드 pTPR12로 명명되며, 또한 그 플라스미드로 형질전환된 대장균 JM109는 대장균 JM109/pTPR12로 명명, 표시되어, 1994년 5월 24일(원기탁일) 부타페스트조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5103으로서 기탁되어 있다.
이후, 본 명세서에서는 이 프로테아제를 프로테아제 PFUL이라고 부른다. 프로테아제 PFUL은 높은 열안정성을 갖는 프로테아제로서 95℃에서도 프로테아제 활성을 나타낸다.
상기의 플라스미드 pTPR12에 삽입된 피로코커스 퓨리오서스 유래의 DNA 단편의 염기서열은 이미 결정되어 있다. 플라스미드 pTPR12의 삽입 DNA 단편중에서 2개의 DraI 부위에서 끼워진 약 4.8kb 부분의 염기서열을 서열표의 서열번호 5에 나타내었다. 또한, 그 염기서열로부터 추정되는 유전자 산물의 아미노산 서열을 서열표의 서열번호 6에 나타낸다. 즉, 서열표의 서열번호 6에 나타낸 아미노산 서열은 상기의 프로테아제 PFUL의 아미노산 서열이다. 그 서열에 나타내어지는 바와 같이 프로테아제 PFUL은 1398 아미노산 잔기로 이루어지며 분자량 15만을 넘는 고분자량의 프로테아제이다.
서열표의 서열번호 6에 나타낸 상기의 프로테아제 PFUL의 아미노산 서열을 이미 알고 있는 미생물 유래 프로테아제의 아미노산 서열과 비교함으로써 프로테아제 PFUL의 전반부분의 아미노산 서열과 섭틸리신로 대표되는 1군의 알칼리성 세린프로테아제[Protein Engineering, 제4권, 제719∼737페이지(1991)]와의 사이에 상동성이 존재하고, 특히 프로테아제의 촉매활성에 중요시되는 4개의 아미노산 잔기 주변에 매우 높은 상동성이 존재하고 있는 것을 판명하고 있다.
이와 같이 초호열균 피로코커스 퓨리오서스의 생산하는 프로테아제 PFUL의 아미노산 서열중에, 상온균 유래의 프로테아제와 공통하여 존재하는 영역이 보존되어 있는 것이 분명해져 피로코커스 퓨리오서스 이외의 초호열균이 생산하는 동종의 프로테아제에도 이 영역이 존재하고 있는 것을 기대할 수 있다.
예를 들어, 초내열성 프로테아제의 유전자는 프로테아제 PFUL의 아미노산 서열중에서 섭틸리신 등과 높은 상동성을 나타내는 영역을 코드하는 프로테아제 PFUL 유전자의 염기서열을 바탕으로 합성한 올리고뉴클레오티드 PRO-1F, PRO-2F, PRO-2R 및 PRO-4R을 조합하여 프라이머로 이용하여 각종 초호열균의 염색체 DNA를 주형으로 한 PCR을 행함으로써 스크리닝할 수가 있다.
서열표의 서열번호 7, 8, 9 및 10에 각각 올리고뉴클레오티드 PRO-1F, PRO-2F, PRO-2R 및 PRO-4R의 염기서열을 나타낸다.
본 발명에 관계되는 프로테아제의 유래하는 초호열균으로서는 피로코커스속, 써모코커스속, 스타필로서머스속, 써모박테로이데스속 등에 속하는 세균을 사용할 수 있으며, 써모코커스속에 속하는 세균으로서는, 예를 들어 써모코커스·셀러(Thermococcus celer) DSM2476을 사용할 수 있고, 그 균주는 도이체 잠룽 폰 미크로오르가니스만 운트 쩨르쿠르츄렌 GmbH으로부터 입수가능한 균주이다. 써모코커스·셀러 DSM2476의 염색체 DNA를 주형으로 하여 상기의 올리고뉴클레오티드 PRO-1F와 PRO-2R의 조합, 또는 PRO-2F와 PRO-4R의 조합을 프라이머로서 이용하여 PCR를 행한 경우에는 특이적인 DNA 단편의 증폭이 확인되어 프로테아제 유전자의 존재를 알 수 있다. 또한, 이것들의 DNA 단편을 적당한 플라스미드 벡터에 삽입한 재조합 플라스미드를 제작한 후, 삽입 DNA 단편의 염기서열을 디데옥시법으로 조사함으로써 그 단편에 의해 코드되는 아미노산 서열을 추정할 수 있다. 그 결과, 이 DNA 단편은 프로테아제 PFUL, 및 각종 미생물 유래의 알칼리성 세린 프로테아제의 아미노산 서열과 상동성이 있는 아미노산 서열을 코드하고, 상기의 PCR 증폭 DNA 단편은 프로테아제 유전자를 주형으로 하여 증폭된 것임이 분명해졌다.
다음에, 초내열성 프로테아제 유전자, 예를 들어 써모코커스 셀러가 생산하는 초내열성 프로테아제의 유전자는 상기의 올리고뉴클레오티드, 또는 상기의 PCR에 의해 얻어진 증폭 DNA 단편을 프로브로서 이용하여 초호열균으로부터의 유전자 라이브러리를 스크리닝함으로써 얻을 수 있다.
예를 들어, 목적하는 유전자를 포함하는 파지 클론은 상기의 PCR에 의해 얻어진 증폭 DNA 단편을 프로브로서 이용한 라이브러리에 대해서 플래크 하이브리다이제이션을 행하여 얻을 수 있다.
그러한 라이브러리는 써모코커스 셀러 DSM2476의 염색체 DNA를 제한효소 Sau3AI로 부분소화하여 얻어진 DNA 단편과, 람다 GEM-11 벡터(프로메가사 제품)를 라이게이션한 후, 인 비트로 팩케이징법에 의해서 람다 파지 입자 중에 팩케이징함으로써 얻어진다.
이렇게 하여 얻어진 파지 클론에 함유되는 DNA 단편을 해석한 결과, 약 1.9kb의 SacI 단편에 프로테아제 유전자가 존재하는 것으로 밝혀졌고, 또한 그 염기서열을 조사함으로써 이 단편은 프로테아제 유전자의 5'측 영역이 결여된 것으로 밝혀졌다.
이 5'측 영역은 카셋트, 및 카셋트 프라이머를 이용하는 PCR을 사용하여 취득할 수 있다(타카라슈조 유전자공학 제품 가이드, 1994-1995년판, 제250∼251페이지). 이렇게 해서 플라스미드 pTCS6에 결여된 초내열성 프로테아제 유전자의 5'측 영역을 커버하는 DNA 단편을 얻을 수 있으며, 또한 써모코커스 셀러 유래의 초내열성 프로테아제 유전자 전장의 염기서열을 이 두 DNA 단편의 염기서열로부터 결정할 수 있다.
결정된 염기서열 중에 존재하는 개방 해독 프레임의 염기서열을 서열표의 서열번호 11에, 또한 그 염기서열로부터 추정되는 아미노산 서열을 서열표의 서열번호 12에 각각 나타낸다.
써모코커스 셀러 유래의 초내열성 프로테아제를 코드하는 유전자의 염기 서열 및 아미노산 서열을 결정하였다. 이 프로테아제는 프로테아제 TCES로 명명되었다.
상기 2개의 DNA 단편을 조합함으로써 프로테아제 TCES 유전자의 전장을 재구성한 발현 플라스미드를 구축할 수가 있지만, 대장균을 숙주로 한 경우에는 목적하는 발현 플라스미드가 도입된 형질전환체는 얻어지지 않았다. 이것은 균체내에 그 유전자의 발현산물이 생성되는 것이 대장균에 유해하거나, 또는 치사적으로 되는 것이 원인이라고 예상된다. 이러한 경우에는, 예를 들어 바실러스 섭틸리스를 숙주로 하여 프로테아제를 세포 외에 분비발현시켜 그 활성을 확인하는 것을 고려할 수 있다.
바실러스 섭틸리스로서는 바실러스 섭틸리스 DB104를 사용할 수 있고, 이 균주는 Gene 제83권, 제215∼233페이지(1989)에 기재된 공지의 균주이다. 클로닝벡터로서는 플라스미드 pUB18-P43을 사용할 수 있고, 그 플라스미드는 Calgary 대학, 수이-람 웡(Sui-Lam Wong)박사로부터 혜여(惠與)된 플라스미드이다. 또한, 그 플라스미드는 선별 마커로서 가나마이신 내성 유전자를 포함하고 있다.
플라스미드 벡터 pUB18-P43의 P43 프로모터 하류에 프로테아제 TCES 유전자가 삽입된 재조합 플라스미드는 플라스미드 pSTC3으로 명명되어 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSTC3으로 명명, 표시되어 1995년 12월 1일(원기탁일) 부타페스트조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5635로서 기탁되어 있다.
도 1에 플라스미드 pSTC3의 제한효소지도를 나타낸다. 도 중에서 굵은 실선이 플라스미드 벡터 pUB18-P43으로의 삽입 DNA 단편이다.
상기의 Bacillus subtilis DB104/pSTC3을 배양하여 배양 상층액, 및 균체추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성을 확인할 수 있다.
그 형질전환체 배양물로부터 얻어지는 프로테아제의 조효소 표품의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠말린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메칠쿠말린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
37∼95℃에서 효소활성을 나타내며, 그 적정온도는 70∼80℃이다.
(3) 적정 pH:
pH 5.5∼9 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 7∼8이다.
(4) 열안정성:
80℃, 3시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
프로테아제 PFUL, 프로테아제 TCES 및 섭틸리신[섭틸리신 BPN', Nucl. Acids Res. 제11권, 제7911∼7925페이지(1983)]의 아미노산 서열을 도 2∼도 5에 나타낸 바와 같이 상동성이 있는 영역이 일치하도록 나열해 보면, 프로테아제 PFUL에는 그 C 말단측 뿐만아니라, 상동성이 있는 영역의 사이에도 프로테아제 TCES 및 섭틸리신에는 확인되지 않은 서열이 존재하는 것을 알 수 있다. 이러한 결과로부터, 피로코커스 퓨리오서스에는 프로테아제 PFUL 이외에, 그것보다도 분자량이 작은 프로테아제 TCES 또는 섭틸리신과 같은 프로테아제가 존재할 가능성도 있다.
그래서 상기의 상동성을 갖는 영역에 유래하는 DNA 프로브를 사용하고 피로코커스 퓨리오서스로부터 조제한 염색체 DNA를 타킷으로 하여 서던 하이브리다이제이션을 행하면, 프로테아제 PFUL의 유전자 이외에도 시그널이 관찰되었고 또한 다른 1종의 프로테아제 유전자의 존재가 분명해졌다.
이 신규한 프로테아제 유전자는 이하와 같은 조작에 의해서 단리할 수 있다.
예를 들어, 신규한 프로테아제를 코드하는 유전자를 포함하는 DNA 단편은 피로코커스 퓨리오서스의 염색체 DNA를 적당한 제한효소로 소화시킨 후, 이것을 타킷으로 하여 상기의 것과 같은 서던 하이브리다이제이션에 의해서 취득한다. 그 DNA 단편의 염기서열을 조사하여 이 염기 서열이 상기의 프로테아제와 상동성을 갖는 아미노산 서열을 코드하는 것인지의 여부를 확인한다. 그 DNA 단편이 목적하는 유전자의 전장을 포함하고 있지 않은 경우에는 역 PCR 법 등에 따라 부족한 부분을 추가로 얻는다.
예를 들어, 피로코커스 퓨리오서스의 염색체 DNA를 제한효소 SacI 및 SpeI(타카라 슈조사 제품)으로 소화시키고 이것을 이용하여 서던 하이브리다이제이션을 한 경우에는 약 0.6 kb의 사이즈의 시그널이 확인된다. 이 사이즈의 DNA 단편을 회수하여 이것을 플라스미드 벡터 pBluescriptSK(-)(스트라타진사 제품)의 SpeI-SacI 부위 사이에 삽입하여 얻어지는 재조합 플라스미드로 대장균 JM109를 형질전환시킨다. 이 형질전환체으로부터 상기의 서던 하이브리다이제이션에 사용한 것과 동일한 프로브를 이용한 콜로니 하이브리다이제이션에 의해서 목적하는 단편이 들어있는 클론을 취득할 수 있다. 얻어진 클론에 함유된 플라스미드가 프로테아제를 코드하는 서열을 갖는 지의 여부는 플라스미드의 삽입 DNA 단편의 염기서열을 조사함으로써 확인할 수 있다. 이렇게 하여 프로테아제 유전자의 존재가 확인된 플라스미드는 플라스미드 pSS3으로 명명하였다.
플라스미드 pSS3에 삽입된 DNA 단편의 염기서열로부터 추정되는 아미노산 서열은 섭틸리신, 프로테아제 PFUL, 프로테아제 TCES 등의 서열과 상동성이 있는 것으로 밝혀졌다. 이렇게 해서 피로코커스 퓨리오서스로부터 새롭게 그 일부가 얻어진 프로테아제 PFUL 유전자와는 다른 프로테아제 유전자의 산물은 프로테아제 PFUS로 명명되어 있다. 그 프로테아제의 N 말단측을 코드하는 영역, 및 C 말단측을 코드하는 영역은 역 PCR 법에 의해서 얻을 수 있다.
역 PCR에 사용하는 프라이머는 상기의 플라스미드 pSS3에 포함되는 삽입 DNA 단편의 염기서열을 바탕으로 제작할 수가 있다. 다음으로 피로코커스 퓨리오서스의 염색체 DNA를 적당한 제한효소로 소화시킨 후, 발생된 DNA 단편에 대해서 분자내 라이게이션 반응을 행한다. 이 반응액을 주형으로 하여 상기의 프라이머를 이용한 PCR을 행하여 플라스미드 pSS3에 포함되는 프로테아제 유전자의 단편에 인접한 영역의 DNA 단편을 취득할 수 있다. 이렇게 해서 얻어진 DNA 단편의 염기서열을 해석함으로써 그 영역에 코드되어 있는 효소 단백질의 아미노산 서열을 추정한다. 또, 피로코커스 퓨리오서스의 염색체 DNA를 사용하여 주형 프로테아제 PFUS 유전자의 전장을 증폭하는 것이 가능한 프라이머를 제작할 수 있다.
프로테아제 PFUS의 개시코돈의 직전 염기서열을 가지며 그 5'측에 BamHI 부위가 도입될 수 있는 프라이머 NPF-4, 및 프로테아제 PFUS 유전자의 3'측 부분에 상보적인 서열을 가져서 그 5'측에 SphI 부위를 도입할 수 있는 프라이머 NPR-4를 설정할 수 있다.
상기의 프라이머 NPF-4 및 NPR-4의 염기서열을 서열표의 서열번호 13 및 14에 나타낸다. 이 2종의 프라이머를 이용하여 피로코커스 퓨리오서스의 염색체 DNA를 주형으로 사용하여 프로테아제 PFUS 유전자의 전장을 증폭할 수가 있다.
프로테아제 TCES의 경우와 동일하게 프로테아제 PFUS를 바실러스 섭틸리스를 숙주로 하여 발현시킬 수 있다. 프로테아제 PFUS를 발현시키기 위한 플라스미드는 프로테아제 TCES의 발현 플라스미드 pSTC3을 바탕으로 하여 구축할 수 있다. 즉, 상기의 프라이머를 이용한 PCR에 의해서 증폭되는 프로테아제 PFUS 유전자 전장을 포함하는 DNA 단편을 플라스미드 pSTC3상의 프로테아제 TCES 유전자와 치환함으로써 프로테아제 PFUS의 발현을 위한 플라스미드를 구축할 수 있다. 이렇게 하여 구축된 발현 플라스미드는 플라스미드 pSNPl로 명명되며 또한, 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSNP1로 명명, 표시되어, 1995년 12월 1일(원기탁일) 부타페스트 조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5634로서 기탁되어 있다. 도 6에 플라스미드 pSNP1의 제한효소 지도를 나타낸다.
프로테아제 PFUS를 코드하는 유전자의 개방 해독 프레임 부분의 염기서열을 서열표의 서열번호 15에, 또한 그 염기서열로부터 추정되는 프로테아제 PFUS의 아미노산 서열을 서열표의 서열번호 16에 나타냈다.
상기의 바실러스 섭틸리스 DB104/pSNP1을 배양하여 배양 상층액, 및 균체추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성이 확인된다. 즉, 발현된 프로테아제 PFUS의 일부는 배양 상층액중에 분비되어 있다.
그 형질전환체의 배양물로부터 얻어지는 프로테아제의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠마린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메틸쿠마린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
40∼110℃에서 효소활성을 나타내며, 적정 온도는 80∼95℃이다.
(3) 적정 pH:
pH 5∼10 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 6∼8이다.
(4) 열안정성:
95℃, 8시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
(5) pH 안정성:
pH 5∼11, 95℃, 60분간의 처리후에도 95% 이상의 활성을 유지하고 있다.
(6) 분자량:
SDS-PAGE상에서 약 45kDa의 분자량을 나타낸다.
프로테아제 TCES 유전자 및 프로테아제 PFUS 유전자의 경우와 동일한 방법에 의해 이것들의 유전자에게 상동성을 갖는 프로테아제 유전자를 피로코커스 퓨리오서스, 써모코커스 셀러 이외의 초호열균으로부터 취득할 수 있다.
서열표의 서열번호 6에 나타낸 프로테아제 PFUL의 아미노산 서열의 323번째의 잔기로부터 650번째의 잔기까지의 서열을 코드하는 약 1kb의 DNA 단편을 조제하여, 이것을 프로브로서 스타필로서머스 마리너스(Staphylothermus marinus) DSM3639 및 써모박테로이데스 프로테올리티커스(Thermobacteroides proteoliticus) DSM5265의 염색체 DNA를 이용한 게놈의 서던 하이브리다이제이션을 행할 수 있다. 그 결과, PstI(타카라 슈조사 제품)로 소화한 스타필로서머스 마리너스의 염색체 DNA를 이용한 경우에는 약 4.8kb의 위치에, 또한 XbaI로 소화한 써모박테로이데스 프로테올리티커스의 염색체 DNA에서는 약 3.5kb의 위치에 시그널들이 확인된다.
이 결과로부터 스타필로서머스 마리너스 및 써모박테로이데스 프로테올리티커스의 염색체 DNA에도 프로테아제 PFUL, 프로테아제 PFUS, 및 프로테아제 TCES 등의 유전자와 상동성이 있는 서열이 존재하는 것이 분명해졌다. 이렇게 해서 검출된 DNA 단편으로부터 프로테아제 TCES 및 프로테아제 PFUS를 코드하는 유전자를 단리, 동정(同定)했을 때와 동일한 방법을 이용함으로써 스타필로서머스 마리너스 및 서머박테로이데스 프로테올리티커스에 존재하는 초내열성 프로테아제를 코드하는 유전자를 단리, 동정할 수 있다.
일반적으로 유전공학적인 수법으로 단백질 대량으로 조제하고자 하는 경우에는 목적하는 단백질을 코드하는 유전자 자신이 갖추고 있는 프로모터가 아닌 숙주에 있어서 효과적으로 작용하는 프로모터를 사용하는 것이 유리하다고 생각된다. 이 점에서 프로테아제 TCES, PFUS의 발현계 구축에서 사용된 P43 프로모터는 바실러스 섭틸리스 유래의 프로모터이지만, 이들 2종의 프로테아제의 발현에는 충분한 효과를 나타내지 않았다.
그래서 한층 발현량을 향상시키기 위해서는 바실러스 섭틸리스로 높게 발현되는 유전자, 특히 분비 단백질의 유전자를 이용할 수 있다. 이러한 유전자로서는, α-아밀라아제나 여러 균체외 프로테아제의 유전자 등을 사용할 수 있어 예를 들어 섭틸리신의 프로모터와 시그널 펩티드-암호화 영역을 이용하여 프로테아제 PFUS의 발현량을 증가시키는 것이 기대된다.
즉, 프로모터영역을 포함하는 섭틸리신 유전자의 시그널 펩티드를 코드하는 영역의 뒤에 프로테아제 PFUS 유전자 전장을 양 유전자의 번역 프레임이 일치하도록 연결함으로써 섭틸리신 유전자의 프로모터의 제어하에 융합단백으로서 프로테아제 PFUS를 발현시킬 수 있다.
본 발명에 사용되는 섭틸리신 유전자로서는, 예를 들어 섭틸리신 E를 코드하는 유전자를 사용할 수 있다. J. Bacteriol. 제171권, 제2657∼2665페이지(1989)에 기재되어 있는 플라스미드 pKWZ에 삽입되어 있는 섭틸리신 E의 프로모터와 시그널 펩티드-코딩 영역을 사용할 수 있다. 그 유전자의 염기 서열은 프로모터 서열을 포함하는 5'상류 영역에 대하여 상기의 문헌에, 또한 섭틸리신를 코드하는 영역에 대해서는 J. Bacteriol. 제158권, 제411∼418페이지(1984)에 각각 기재되어 있다.
이들 서열을 바탕으로, 그 유전자의 프로모터 서열 상류에 EcoRI 부위를 도입하기 위한 프라이머 SUB4와, 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 뒤에 BamHI 부위를 도입하기 위한 프라이머 BmR1를 각각 합성한다. 서열표의 서열번호 17 및 18에 각각 프라이머 SUB4, BmR1의 염기서열을 나타내었다. 프라이머 SUB4, BmR1을 이용하여 플라스미드 pKWZ를 주형으로 한 PCR에 의해 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역을 포함하는 약 0.3kb의 DNA 단편을 증폭시킬 수 있다.
그 DNA 단편의 하류에 위치되는 프로테아제 PFUS 유전자는 PCR 법에 의해서 피로코커스 퓨리오서스의 염색체 DNA로부터 취득할 수 있다. 그 유전자의 5'측에 하이브리다이즈하는 프라이머로서는 상기의 프라이머 NPF-4를 사용할 수 있다. 또한, 유전자의 3' 측에 하이브리다이즈하는 프라이머에는 그 유전자의 종지코돈 하류의 염기서열로부터 설계되며 또한 SphI 부위를 갖는 프라이머 NPM-1을 사용할 수 있다. 서열표의 서열번호 19에 프라이머 NPM-1의 서열을 나타냈다.
한편, BamHI 부위를 이용하여 프로테아제 PFUS 유전자를 상기의 0.3kb DNA 단편에 연결하는 경우에는 그 유전자중에 1개소 존재하는 BamHI 부위가 조작하는데 지장이 된다. 이 BamHI 부위를 PCR-변이도입(mutagenesis)법에 의해 제거하기 위한 프라이머 mutRR, mutFR은 서열표의 서열번호 15에 나타낸 바의 프로테아제 PFUS 유전자의 염기 서열을 바탕으로 제작할 수 있다.
프라이머 mutRR, mutFR의 염기서열을 각각 서열표의 서열번호 20, 21에 나타낸다. 또, 이것들의 프라이머를 이용하여 BamHI 부위를 제거한 경우에는 그 부위에 도입되는 염기치환으로 인하여 이 부위에 의해 암호화되는 아미노산 잔기, 즉 서열표의 서열번호 16에 나타낸 바의 프로테아제 PFUS의 아미노산 서열중에서 560번째로 존재하는 글리신이 발린으로 치환된다.
이들 프라이머를 사용함으로써 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역에 연결하기 위한 프로테아제 PFUS 유전자를 얻을 수 있다. 즉, 피로코커스 퓨리오서스의 염색체 DNA를 주형으로 하여 프라이머 mutRR과 NPF-4, 및 프라이머 mutFR과 NPM-1의 2가지의 프라이머쌍를 사용하는 2종류의 PCR를 행한다. 또한 각각의 PCR에서 증폭된 DNA 단편을 혼합하여 형성되는 헤테로 듀플렉스(heteroduplex)를 주형으로 하고, 프라이머 NPF-4 및 NPM-1을 이용하여 2회째의 PCR을 행한다. 이렇게 하여 그 내부에 BamHI 부위를 포함하지 않는 약 2.4 kb의 프로테아제 PFUS 유전자 전장을 증폭할 수 있다.
상기의 PCR 증폭 DNA 단편을 BamHI, SphI로 소화하여 얻어지는 약 2.4kb의 DNA 단편을 단리, 상기 플라스미드 pSNP1 중의 프로테아제 PFUS 유전자를 포함하는 BamHI-SphI 단편과 바꿔 놓는다. 이렇게 하여 구축된 발현 플라스미드는 플라스미드 pPS1로 명명되고 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pPS1로 명명되어 있다. 그 형질전환체를 배양한 경우, 배양 상층액, 및 균체 추출물의 양쪽에 플라스미드 pSNP1을 사용한 경우와 동일한 프로테아제 활성이 발견되어 상기의 아미노산 치환이 효소 활성에 영향을 주지 않음이 확인된다. 도 7에 플라스미드 pPS1의 제한효소 지도를 나타냈다.
상기의 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역을 포함하는 약 0.3kb의 DNA 단편을 EcoRI, BamHI로 소화하여 상기 플라스미드 pPS1 중의 P43 프로모터와 리보솜 결합부위 서열을 포함하는 EcoRI-BamHI 단편과 바꿔 놓는다. 이렇게 하여 구축된 발현 플라스미드는 pNAPS1로 명명되어 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pNAPS1로 명명되었다. 그 형질전환체를 배양하여 배양 상층액 및 균체 추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성이 확인되고, 그 발현량은 바실러스 섭틸리스 DB104/pSNP1에 비하여 증가하고 있다. 도 8에 플라스미드 pNAPS1의 제한효소 지도를 나타냈다.
이 형질전환체로부터 발현되는 프로테아제는 상기의 바실러스 섭틸리스 DB104/pSNP1에 의해 발현되는 프로테아제의 것과 동등한 효소화학적 성질을 나타낸다. 또한, 그 형질전환체에 의해 발현되는 프로테아제를 정제하여, 그 N-말단아미노산 서열을 해석한 바, 서열표의 서열번호 22에 나타낸 아미노산 서열이 얻어졌다. 그 서열은 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째∼144번째의 서열과 일치하고 있어 성숙형의 프로테아제 PFUS는 이 부분 이후의 폴리펩티드로 이루어지는 효소임을 나타낸다. 이 결과로부터 추측되는 성숙형의 프로테아제 PFUS의 아미노산 서열을 서열표의 서열번호 4에 나타낸다.
바실러스 섭틸리스 DB104/pNAPS1이 생산하는 프로테아제의 양은 바실러스 섭틸리스 DB104/pSNP1(FERM BP-5634)과 비교하여 증가하고 있지만, 더욱 생산량을 올리는 것이 요망된다. pNAPS1에는 섭틸리신의 시그널 펩티드와 프로테아제 PFUS의 융합 펩티드가 코드되어 있지만, 이 연결 부분을 변형하여 시그널 펩티드의 제거가 효율적으로 일어나도록 함으로써 프로테아제의 발현량이 증가될 것이 기대된다. 상기의 플라스미드 pNAPS1에서는 서열표의 서열번호 3에 나타낸 섭틸리신 E의 시그널 펩티드의 C-말단 아미노산(Ala)과 프로테아제 PFUS의 N-말단 아미노산(Met)과의 사이에는 Ala-Gly-Ser의 3 아미노산 잔기로 이루어지는 펩티드가 삽입되어 있다. 플라스미드 pNAPS1상의 이 펩티드를 코드하는 부분의 DNA에 돌연변이를 도입하여 얻어지는 돌연변이 플라스미드를 도입한 형질전환체에 대해서 프로테아제 생산능을 조사함으로써 프로테아제 발현량이 향상된 형질전환체를 얻을 수 있다.
우선, 플라스미드 pNAPS1 상의 섭틸리신 E-프로테아제 PFUS의 융합 단백질을 코드하는 유전자에 대하여 상기의 3 아미노산 펩티드 중의 Ser을 코드하는 부분을 임의의 2 아미노산을 코드하는 염기서열로 변형한 돌연변이 플라스미드를 조제한다. 이러한 돌연변이 플라스미드는 PCR을 이용하여 제작할 수가 있다. 예를들면 상기의 Ser을 코드하는 코돈(TCC) 부분을 임의의 6 염기로 치환한 서열을 갖는 프라이머 SPOF0 및 SPOR0(서열표의 서열번호 24 및 25에 각각 프라이머 SPOF0 및 SPOR0의 염기서열을 나타낸다)와, 이 전후 영역의 염기서열로부터 제작한 프라이머 SUB3 및 NPR-10(서열표의 서열번호 26 및 27에 각각 프라이머 SUB3 및 NPR-10의 염기서열을 나타낸다)을 사용한 PCR을 행함으로써 상기의 Ser을 코드하는 코돈(TCC) 부분에 목적하는 돌연변이가 도입된 DNA 단편을 얻을 수 있다. 이 단편을 플라스미드 pNAPS1 상의 대응하는 영역과 바꿔 놓음으로써 돌연변이가 도입된 프로테아제 유전자를 함유하는 돌연변이 플라스미드를 얻을 수 있다.
이어서 이렇게 해서 얻어진 돌연변이플라스미드를 적당한 숙주, 예를 들어 바실러스 섭틸리스 DB104에 도입하여 얻어지는 형질전환체에 대해서 프로테아제 발현량을 조사함으로써 발현량이 증가된 형질전환체를 취득할 수 있다. 프로테아제 발현량의 확인은 단리된 형질전환체를 개별로 배양하여 그 배양물 중의 활성을 조사함에 의해 행할 수 있지만, 별법으로 기질을 함유하는 한천 플레이트를 배양에 이용함으로써 발현량이 상승한 형질전환체를 용이하게 선택하는 것도 가능하다.
즉, 상기의 돌연변이 플라스미드가 도입된 형질전환체를 탈지유를 포함하는 한천 플레이트 상에 생육시킨 후, 이 플레이트를 프로테아제 PFUS가 그 활성을 나타내는 온도, 예를들면 70℃에서 보온시킨다. 프로테아제를 발현하는 형질전환체로서는 그 콜로니 주변의 탈지유가 분해되어 투명해진다. 투명 영역의 크기로부터 프로테아제의 발현량을 추측할 수 있다.
이렇게 해서 얻어진 바실러스 섭틸리스 DB104/pNAPS1과 비교하여 프로테아제 활성을 높게 발현하는 형질전환체의 하나는 바실러스 섭틸리스 DB104/pSPO124로 명명되어 있다. 그 형질전환체에 함유되는 플라스미드(이 플라스미드는 pSPO124로 명명되어 있다)를 조제하여 그 염기서열을 해석한 결과, 상기의 Ser을 코드하는 부분은 염기서열 GGGAAT로 돌연변이되어 있고, 따라서 Ser이 Gly-Asn로 돌연변이된 단백질이 코드되어 있는 것이 분명해졌다.
이렇게 하여 섭틸리신의 시그널 펩티드의 뒤에 Ala-Gly-Gly-Asn인 4 아미노산으로 이루어지는 펩티드를 배치한 후에 이를 목적하는 단백질의 N-말단에 융합시켜 발현시킴으로써 바실러스속 세균을 숙주로 하여 그 발현량을 증가시키는 것이 가능함이 분명해졌다. 바실러스속 세균이 생산하는 섭틸리신에는 본 발명에서 사용한 섭틸리신 E(Bacillus subtilis 유래)의 것 외에 바실러스 아밀로리퀘파시엔스 (Bacillus amyloliquefacience) 유래의 섭틸리신 BPN' (Nucl. Acids Res., 제11권, 제7911∼7925페이지(1983)), 바실러스 리케니포르미스 (Bacillus licheniformis) 유래의 섭틸리신 Carlsberg (Nucl. Acids Res., 제13권, 제8913∼8926페이지(1985)) 등이 알려져 있고, 그 아미노산 서열에는 약간의 상이점이 있지만 이것들의 시그널 펩티드도 본 발명에 적합하게 사용할 수 있다. 본 발명에서는 발현을 제어하기 위한 프로모터로서, 섭틸리신 E 유래의 프로모터가 사용되었지만, 이를 대신하여 바실러스속 세균으로 작용하는 여러 프로모터를 사용하는 것이 가능하다.
또한, 발현시키는 단백질에 대해서도 아무런 제한은 없고, 단백질의 유전자가 입수가능한 것이라면 본 발명을 적용하여 유전공학적으로 높게 발현시키는 것이 가능하다. 본 발명의 숙주 이외의 생물에 유래하는 단백질의 발현에 이용가능한 것은, 바실러스속 세균과 분류학상의 위치를 달리하는 피로코커스 퓨리오서스 유래의 단백질이 높은 수준으로 발현되는 것으로부터도 분명하다. 본 발명은 특히 상기의 프로테아제 PFUS와 구조적으로 유사한 프로테아제 PFUL, 프로테아제 TCES나 스타필로서머스 마리너스, 서머박테로이데스 프로테올리티커스 유래의 프로테아제의 유전공학적생산에 적합이다.
이와 같은 섭틸리신과의 상동성에 기초하여, 프로테아제 PFUS는 시그널 펩티드와 프로펩티드를 갖는 전구체 단백질로서 발현되어, 그 후 프로세싱되어 성숙형 효소가 되는 것으로 생각되고 있다. 또한, 상기의 프로테아제 PFUS 성숙형 효소의 N-말단 아미노산 서열 해석의 결과로부터 성숙형 효소는 서열표의 서열번호 4에 나타낸 아미노산 서열로 이루어지는 효소라고 예상된다. 그러나, 정제된 성숙형 프로테아제 PFUS의 분자량은 약 45kDa로서, 이 아미노산 서열로부터 계산된 것에 비해서 작다. 이것은 전구체로서 발현된 프로테아제 PFUS가 그 C-말단측의 펩티드도 프로세싱되어 성숙형 프로테아제로 전환됨을 시사한다.
이 프로세싱에 의해서 제거되는 C-말단측 펩티드가 효소활성, 및 효소 단백질의 바른 구조로의 폴딩에 필수적인 것이 아니라면, 유전자상의 이 부분을 코드하는 영역을 결실시켜 발현시킴에 의해서도 프로테아제 PFUS의 발현량의 증가가 기대된다.
상기의 바실러스 섭틸리스 DB104/pNAPS1로부터 얻어지는 성숙형 프로테아제 PFUS에 대해서 예를 들어 질량분석장치를 이용하여 그 분자량을 정밀하게 측정할 수 있다. 이 분자량과 앞서 분명해진 성숙형 프로테아제 PFUS의 N-말단 아미노산 서열로부터 그 프로테아제가 서열표의 서열번호 15에 나타낸 아미노산 서열의 133번째의 Ala부터 552번째의 Thr까지 대응하는 폴리펩티드인 것을 알 수 있다. 또한 상기의 플라스미드 pNAPS1에 포함되는 프로테아제 PFUS 유전자의 552번째의 Thr을 코드하는 부위의 근방에 종지코돈을 도입함으로써 효소 활성에는 불필요한 폴리펩티드를 결실시킨 프로테아제 PFUS를 발현하는 플라스미드를 구축할 수 있다.
즉, 원하는 종지코돈이 도입된 염기서열을 갖는 DNA 단편은 플라스미드 pNAPS1 상의 프로테아제 PFUS 유전자 중에서 그 개시코돈으로부터 544번째의 아미노산(Ser)을 코드하는 코돈의 C-말단측에 종지코돈(TGA)을 도입할 수가 있는 프라이머 NPR544(서열표의 서열번호 28에 프라이머 NPR544의 염기서열을 나타낸다)와, 상기 유전자 상의 NspV 부위의 상류영역의 염기서열을 갖는 프라이머 NPFE81(서열표의 서열번호 29에 프라이머 NPFE81의 염기서열을 나타낸다)를 사용한 PCR에 의해 을 얻을 수 있다. 이어서 이 단편을 플라스미드 pNAPS1상의 대응하는 영역과 바꿔 놓음으로써 원하는 돌연변이가 도입된 프로테아제 유전자를 함유하는 돌연변이 플라스미드를 얻을 수 있다. 이 플라스미드는 플라스미드 pNAPS△C로 명명되고, 또한 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pNAPS△C로 명명하였다. 이 형질전환체는 프로테아제 PFUS와 동등한 성질을 갖는 프로테아제 활성을 발현하며 그 발현량은 바실러스 DB104/pNAPS1에 비해서 높다.
이렇게 해서 플라스미드 pNAPS△C에 함유되는 프로테아제 PFUS 유전자가, 그 효소의 활성 발현에 충분한 영역을 갖고 있음이 분명해졌다. 이 플라스미드에 존재하는 프로테아제 PFUS를 코드하는 영역의 염기서열을 서열표의 서열번호 2에 나타낸다. 또한, 이 염기서열에 코드되는 아미노산 서열을 서열표의 서열번호 1에 나타낸다.
또한, 상기의 플라스미드 pSPO124의 프로테아제 PFUS 유전자에 플라스미드 pNAPS△C와 동일한 돌연변이를 도입하여, C-말단측 펩티드를 결실시킨 프로테아제 PFUS를 발현시킬 수 있다.
즉, 상기의 플라스미드 pNAPS△C를 NspV와 SphI로 소화하여 얻어지는 약 13kb의 DNA 단편을 미리 NspV와 SphI로 소화한 플라스미드 pSPO124와 혼합하여 라이게이션을 행함으로써 목적하는 플라스미드를 구축할 수 있다. 이 플라스미드는 플라스미드 pSPO124△Cfh 명명되고, 또한 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSPO124△C로 명명, 표시되어 1997년 5월 16일(원기탁일) 부타베스트조약하에 일본국 이바라키껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-6294로 기탁되어 있다. 그 형질전환체는 바실러스 DB104/pNAPS1에 비해서 프로테아제의 발현량이 향상되어 있다.
상기의 형질전환체, 바실러스 섭틸리스 DB104/pNAPS△C 및 바실러스 섭틸리스 DB104/pSPO124△C가 생산하는 프로테아제의 효소학적, 이화학적 성질은 바실러스 섭틸리스 DB104/pSNP1이 생산하는 프로테아제의 것과 차이는 보이지 않는다. 즉 이것들의 양 형질전환체 배양물로부터 얻어지는 프로테아제의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠마린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메틸쿠말린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
40∼110℃에서 효소활성을 나타내며, 그 적정온도는 80∼95℃이다.
(3) 적정 pH:
pH 5∼10 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 6∼8이다.
(4) 열안정성:
95℃, 8시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
(5) pH 안정성:
pH 5∼11, 95℃, 60분간의 처리후에도 95% 이상의 활성을 유지하고 있다.
(6) 분자량:
SDS-PAGE상에서 약 45kDa의 분자량을 나타낸다.
따라서, 높은 열안정성을 갖는 프로테아제 및 그 유전자가 제공된다. 또한, 그 프로테아제의 대량발현을 가능케 하는 신규한 단백질 발현계도 본 발명에 의해 개시된다. 그 발현계는 본 발명의 프로테아제의 것 외에 여러 단백질의 유전공학적인 제조에 있어서 유용하다.
이하에 실시예를 들어 본 발명을 더욱 상세하게 설명하지만, 본 발명은 이들에 한정되는 것은 아니다.
실시예 1
(1) 피로코커스 퓨리오서스의 염색체 DNA의 조제
피로코커스 퓨리오서스 DSM3638의 배양은 이하와 같이 행하였다.
1% 트립톤, 0.5% 효모엑기스, 1% 가용성전분, 3.5% 쟈마린 S 솔리드(Jamarine Laboratory 제품), 0.5% 쟈마린 S 리퀴드(Jamarine Laboratory 제품), 0.003% MgSO4, O.001% NaCl, 0.0001% FeSO4·7H2O, 0.0001% CuSO4, 0.0001% CaCl2·7H2O, 0.0001% ZnSO4, 0.1ppm CuSO4·5H2O, 0.1ppm H3BO3, 0.1ppm KAl(SO4)2, 0.1ppm Na2MoO4·2H2O, 0.25ppm NiCl2·H2O의 조성 배지를 2리터 용량의 배지 병에 넣고 120℃에서 20분간 살균한 후, 질소가스를 불어넣어 용존산소를 제거한 후, 이것에 상기 균주를 접종하여 95℃에서 16시간 정치 배양하였다. 배양종료후에 원심분리에 의해서 균체를 모았다.
이어서 얻어진 균체를 25% 스크로오스를 포함하는 50mM 트리스-HCl(pH 8.0) 4㎖에 현탁하고 이 현탁액에 2㎖의 0.2M EDTA, 0.8㎖의 라이소자임(5㎎/㎖)을 가하여 이 혼합물을 20℃에서 1시간 보온한 후, 24㎖의 SET 용액(150mM NaCl, 1mM EDTA, 20mM 트리스-HCl, pH 8.0), 4㎖의 5% SDS, 400㎕의 프로테이나제 K(10㎎/㎖)를 가하여, 다시 37℃에서 1시간 보온시켰다. 페놀-클로로포름 추출을 행하여 반응을 정지한 후에 에탄올침전을 행하여 약 3.2㎎의 염색체 DNA를 얻었다.
실시예 2
(1) 플라스미드 pNSP1의 구축을 위한 프라이머의 합성
프로테아제 PFUS 유전자 전장의 증폭에 사용하기 위한 프라이머를 합성하기 위해서, 이 유전자 전장을 포함하는 플라스미드 pSNP1을 바실러스 섭틸리스 DB104/pSNP1(FERM BP-5634)로부터 단리하여 필요한 영역의 염기서열을 결정하였다. 이 염기서열을 바탕으로 프로테아제 PFUS 유전자의 개시코돈 직전에 BamHI 부위를 도입하기 위한 프라이머 NPF-4, 및 그 유전자의 3'측에 하이브리다이즈하고 SphI의 인식 서열을 포함하는 프라이머 NPM-1을 합성하였다. 서열표의 서열번호 13, 19에 각각 프라이머 NPF-4, 프라이머 NPM-1의 염기서열을 나타낸다.
또한, 프로테아제 PFUS 유전자의 내부, 개시코돈으로부터 약 1.7kb 하류에 존재하는 BamHI 부위를 제거하기 위한 프라이머 mutRR, mutFR을 합성하였다. 서열표의 서열번호 20, 21에 각각 프라이머 mutRR, mutFR의 염기 서열을 나타낸다.
(2) 플라스미드 pPS1의 조제
각각 주형으로서 피로코커스 퓨리오서스의 염색체 DNA를, 또한 프라이머로서 상기 프라이머 NPF-4와 mutRR의 조합, 또는 프라이머 mutFR와 NPM-1의 조합을 포함하는 2조의 LA-PCR 반응 혼합물을 조제하여, 각각을 94℃, 30초 - 55℃, 1분 - 68℃, 3분을 1 사이클로 한 30사이클의 반응을 행하였다. LA-PCR 반응 혼합물의 조제에는 LA PCR Kit Ver.2 (타카라 슈조사 제품)를 사용하였다. 이 반응액의 일부를 이용하여 아가로스전기 영동을 행하면, 프라이머 NPF-4 및 mutRR을 이용한 경우에는 약 1.8kb의, 프라이머 mutFR 및 NPM-1을 이용한 경우에는 약 0.6kb의 DNA 단편이 증폭되었다.
상기의 두 가지의 PCR 반응액으로부터 SUPREC-02(타카라 슈조사 제품)를 이용하여 프라이머를 제거하여 증폭된 DNA 단편을 조제하였다. 이들 두 증폭 DNA 단편을 포함하고, 프라이머 또는 LA Taq는 포함하지 않은 LA-PCR 반응액을 조제하여 94℃에서 10분간의 열변성을 행하여, 30분에 걸쳐 30℃까지 냉각시킨 후, 30℃에서 15분간 보온하여 헤테로 듀플렉스를 형성시켰다. 이어서 이 반응액에 LA Taq(타카라 슈조사 제품)를 첨가하여 72℃에서 30분간 반응시킨 후, 프라이머 NPF-4, NPM-1을 더욱 첨가하여 94℃, 30초 - 55℃, 1분 - 68℃, 3분을 1 사이클로 하여 25 사이클의 반응을 행하였다. 이 반응액중에는 약 2.4kb의 DNA 단편의 증폭이 관찰되었다.
상기 약 2.4kb의 DNA 단편을 BamHI, SphI(모두 타카라 슈조사 제품)로 소화하여, 이 단편을 미리 BamHI, SphI로 소화하여 프로테아제 PFUS 유전자 전장을 제거한 플라스미드 pSNP1과 혼합하여 라이게이션을 행한 후, 바실러스 섭틸리스 DB104에 도입하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하여 상기의 약 2.4kb 단편 1 분자 만이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pPS1로 명명하였다. 또한, 이 플라스미드 ppS1로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pPS1로 명명하였다.
도 7에 플라스미드 pPS1의 제한효소 지도를 나타낸다.
(3) 섭틸리신 E 유전자의 프로모터-시그널 펩티드 코딩 영역의 DNA 단편의 증폭
섭틸리신 E 유전자의 프로모터-시그날 펩티드 코딩 영역을 얻기 위한 프라이머들을 합성하였다. 우선, J. Bacterio1. 제171권, 제2657∼2665페이지(1989)에 기재된 섭틸리신 E 유전자의 프로모터 영역 부분의 염기서열을 참고로, 그 영역의 상류에 하이브리다이즈하여 EcoRI 부위를 포함하는 프라이머 SUB4(서열표의 서열번호 17에 프라이머 SUB4의 염기서열을 나타낸다)를 합성하였다. 다음에 J. Bacteriol. 제158권, 제411∼418페이지(1984)에 기재된 섭틸리신 E 유전자의 염기서열을 참고로, 시그널 펩티드 암호화 영역의 바로 하류에 BamH1 부위를 도입할 수 있는 프라이머 BmR1(서열표의 서열번호 18에 프라이머 BmRI의 염기서열을 나타낸다)을 합성하였다.
J. Bacteriol. 제171권, 제2657∼2665페이지(1989)에 기재된 섭틸리신 E 유전자를 포함하는 플라스미드 pKWZ를 주형으로 하여 상기의 프라이머 SUB4, BmR1을 포함하는 PCR 반응 혼합물을 조제하고 94℃, 30초 - 55℃, 1분 - 68℃, 2분을 1 사이클로 하는 30 사이클의 반응을 행하였다. 이 반응액의 일부를 이용하여 아가로스 전기영동을 행하면, 약 0.3kb의 DNA 단편의 증폭이 확인되었다.
(4) 프로테아제 발현 플라스미드 pNAPS1의 구축
상기한 바의 약 0.3kb의 DNA 단편을 EcoRI(타카라 슈조사 제품), BamHI로 소화한 후, 미리 EcoR I, BamHI로 소화시킨 실시예 3에 기재된 플라스미드 pPS1과 혼합하여 라이게이션한 후, 바실러스 섭틸리스 DB104에 도입하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.3kb 단편 1 분자만이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pNAPS1로 명명하였다. 또한, 그 플라스미드 pNAPS1에서 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pNAPS1로 명명하였다.
도 8에 플라스미드 pNAPS1의 제한효소지도를 나타낸다.
(5) 플라스미드 pSNP2의 구축
상기의 플라스미드 pNAPS1 중에 존재하는 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 상류에 BamHI 부위를 도입하기 위한 프라이머 SUB17R(서열표의 서열번호 23에 프라이머 SUB17R의 염기 서열을 나타낸다)을 합성하였다. 주형으로서 플라스미드 pNAPS1 및 프라이머 SUB17R과 SUB4를 포함하는 PCR 반응액을 조제하여 94℃, 30초 - 55℃, 1분 - 72℃, 1 분을 1 사이클로 하는 25사이클의 반응을 행하였다. 증폭된 약 0.21kb의 DNA 단편을 EcoRI과 BamHI로 소화하여, 섭틸리신 E의 프로모터와 SD 서열을 포함하는 약 0.2kb의 DNA 단편을 얻었다. 이 단편을 미리 EcoRI와 BamHI로 소화한 플라스미드 pNAPS1과 혼합하여 라이게이션한 반응 혼합물을 이용하여 바실러스 섭틸리스 DB104를 형질전환시켰다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.2kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pSNP2로 명명하였다.
(6) 프로테아제를 높은 수준으로 발현하는 돌연변이 플라스미드의 제작
상기의 플라스미드 pNAPS1 중의 섭틸리신 E의 시그널 펩티드와 프로테아제 PFUS의 개시 코돈과의 결합부의 아미노산의 Ser(염기서열 TCC)을 임의의 2개의 아미노산과 바꿔 놓기 위한 프라이머 SPOF0와 SPOR0(서열표의 서열번호 24 및 25에 각각 프라이머 SPOF0와 SPOR0의 염기서열을 나타낸다)를 합성하였다. 또한, 플라스미드 pNAPS1중의 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 직전에 BamHI 부위를 도입하기 위한 프라이머 SUB3, 및 프로테아제 PFUS를 코드하는 영역내의 SpeI 부위를 포함하는 프라이머 NPR-10(서열표의 서열번호 26 및 27에 프라이머 SUB3 및 프라이머 NPR-10의 염기서열을 나타낸다)를 합성하였다.
각각 플라스미드 pNAPS1을 주형으로서, 상기 프라이머 SPOF0와 NPR-10을 포함하는 PCR 반응액 및 상기 프라이머 SUB3과 SPOR0를 포함하는 PCR 반응액을 조제하여, 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1 사이클로 하는 20 사이클의 반응을 행하였다. 두 반응 혼합물 중에 증폭된 각각 약 0.13 kb와 약 0.35 kb의 DNA 단편을 혼합하여 94℃에서 10분간 열변성시킨 후, 37℃까지 서서히 냉각시켜 헤테로 듀플렉스를 형성시키고, 더욱 Taq 폴리머라아제(타카라 슈조사 제품)에 의해서 이 헤테로 듀플렉스로부터 2본쇄 DNA를 제작하였다. 이렇게 해서 얻어진 2본쇄 DNA를 주형으로 하여 상기의 프라이머 SUB3, 프라이머 NPR-10을 포함하는 PCR 반응 혼합물을 조제하여 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1사이클로 하는 25사이클의 반응을 행하였다. 증폭된 약 0.43kb의 DNA 단편을 BamHI와 SpeI(타카라 슈조사 제품)로 소화하여 얻은 DNA 단편을, 미리 BamHI와 SpeI로 소화한 상기의 플라스미드 pSNP2와 혼합하여 라이게이션을 행하고 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다.
얻어진 가나마이신 내성의 형질전환체를 탈지유 플레이트(1O㎍/㎖ 가나마이신, 1% 탈지유를 포함하는 LB-고온 배양용 한천 배지) 상에 접종하여 콜로니를 형성시킨 후, 이 플레이트를 70℃로 보온하여 콜로니 주변의 탈지유의 분해 상태로부터 각 형질전환체의 발현하는 프로테아제 활성을 조사하였다. 그 결과, 특히 높은 활성이 검출된 한 클론을 단리하고 이 클론으로부터 플라스미드를 조제하여, 이것을 플라스미드 pSPO124로 명명하였다. 또한, 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pSPO124로 명명하였다. 플라스미드 pSPO124에 대하여 그 염기서열을 해석한 바, 플라스미드 pNAPS1에 있어서 상기의 Ser을 코드하고 있는 부분의 염기서열은 GGGAAT로 치환되었고, 즉 Ser이 Gly-Asn의 2아미노산으로 돌연변이된 단백질이 코드되어 있었다. 또한, 이 돌연변이와 동시에 프로테아제 PFUS의 개시코돈으로부터 25번째로 존재하는 Pro에 해당하는 코돈(CCA)이 Leu를 코드하는 것(CTA)으로 변화되었음이 판명되었다.
(7) 프로테아제 발현 플라스미드 pNAPS△C의 구축
상기의 플라스미드 pNAPS1 중의 프로테아제 PFUS 유전자의 개시 코돈으로부터 544번째의 아미노산의 C-말단측에 종지 코돈를 도입하여 이 부위의 하류를 결실시킨 프로테아제를 발현하는 플라스미드를 구축하였다. 상기 유전자상의 544번째의 아미노산을 코드하는 코돈의 C-말단측에 종지 코돈(염기서열 TGA)을 도입하고, 또 SphI 부위를 갖는 프라이머 NPR544(서열표의 서열번호28에 프라이머 NPR544의 염기서열을 나타낸다)를 합성하였다. 또한 상기 유전자상의 NspV 부위의 상류부분의 염기서열을 바탕으로 프라이머 NPFE81(서열표의 서열번호 29에 프라이머 NPFE81의 염기 서열을 나타낸다)을 합성하였다.
플라스미드 pNAPS1을 주형으로서 상기 프라이머 NPFES1과 NPR544를 포함하는 PCR 반응액을 조제하여, 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1 사이클로 하는 20사이클의 반응을 행하였다. 증폭된 약 0.61 kb의 DNA 단편을 NspV(타카라 슈조사 제품)와 SphI로 소화시켜 종지 코돈를 포함하는 약 0.13kb의 DNA 단편을 얻었다. 이 DNA 단편을 미리 제한효소 NspV와 SphI로 소화시킨 플라스미드 pNAPS1과 혼합하여 라이게이션을 행하고 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다. 얻어진 가나마이신내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.13kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pNAPS△C로 명명하였다. 또한 이 플라스미드 pNAPS△C로 형질전환된 바실러스 섭틸리스DB104를 바실러스 섭틸리스 DB104/pNAPS△C로 명명하였다.
(8) 프로테아제 발현 플라스미드 pSPO124△C의 구축
상기 플라스미드 pNAPS△C를 NspV와 SphI로 소화하여 얻어지는 약 1.3kb의 DNA 단편을 단리하여, 이것을 미리 NspV와 SphI로 소화한 플라스미드 pSPO124와 혼합하여 라이게이션를 행하였다. 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 1.3kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pSPO124△C로 명명하였다. 또한 이 플라스미드 pSPOl24△C로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pSPO124△C로 명명하였다.
실시예 3
(1) 프로테아제 PFUS 유전자를 함유하는 플라스미드로 형질전환된 바실러스섭틸리스의 배양과 조효소액의 조제
프로테아제 PFUS 유전자를 함유하는 플라스미드 pNAPS1을 실시예 2에 기술한 바와 같이 도입시킨 바실러스 섭틸리스 DB104인, 바실러스 섭틸리스 DB104/pNAPS1을 10㎍/㎖의 가나마이신을 포함하는 LB 배지(트립톤 10g/리터, 효모 엑기스 5g/리터, NaCl 5g/리터, pH 7.2) 2㎖ 중에 37℃에서 24시간 동안 배양하였다. 배양액은 원심분리하여 배양 상층액(표품1-S)과 균체를 얻었다.
얻어진 균체는 100㎕의 50mM 트리스-HCl, pH 7.5에 현탁하여, 2㎎의 라이소자임(시그마사 제품)을 가한 후에, 37℃에서 45분간 소화시켰다. 소화후의 시료를 95℃에서 10분간 더 가열처리한 후, 원심분리하여 상청을 모아 무세포 추출액 (표품1-L)을 얻었다.
마찬가지로, 상기의 플라스미드 pSPO124를 함유하는 바실러스 섭틸리스 DB104/pSPO124, 상기의 플라스미드 pNAPS△C를 함유하는 바실러스 섭틸리스 DB104/pNAPS△C, 또는 pSPO124△C를 함유하는 바실러스 섭틸리스 DB104/pSPO124△C로부터 상기와 동일한 조작으로 배양 상층액, 무세포 추출액을 조제하였다. 바실러스 섭틸리스 DB104/pSPO124의 배양 상층액을 124-S, 무세포 추출액을 124-L로 명명하였다. 바실러스 섭틸리스 DB104/pNAPS△C의 배양 상층액을 △C-S, 무세포 추출액을 △C-L로 명명하였다. 바실러스 섭틸리스 DB104/pSPO124△C의 배양 상층액을 124△C-S, 무세포 추출액을 124△C-L로 명명하였다. 이것들의 표품을 이용하여 프로테아제 활성을 측정하고 각 표품 중에 포함된 프로테아제 농도를 조사하였다.
(2) 프로테아제 생산능의 비교
프로테아제 PFUS의 활성 측정은 Suc-Ala-Ala-Pro-Phe-p-NA(시그마사 제품)를 기질로 하고, 효소에 의한 가수분해 반응에 의해서 생성되는 p-니트로아닐린을 분광학적으로 측정함으로써 행하였다. 즉, 효소 활성을 측정하고자 하는 효소 표품을 적절히 희석하고, 그 시료용액 50㎕에 1mM Suc-Ala-Ala-Pro-Phe-p-NA 용액(100mM 인산완충액, pH 7.0) 50㎕를 가하여 95℃에서 30분간 반응시켰다. 빙냉하에 반응을 정지한 후, 405nm에서의 흡광도를 측정하여 p-니트로아닐린의 생성량을 구하였다. 효소 1단위는, 95℃에서 1분간에 1μmole의 p-니트로아닐린를 생성하는 효소량으로 하였다. 또한 얻어진 효소활성을 바탕으로 배양 상층액 및 균체내에 발현된 효소단백질량을 프로테아제 PFUS의 단백질 중량당의 비활성을 9.5 단위/㎎로서 산출하였다.
실시예 3(1)에서 조제한 각 효소 표품의 프로테아제 활성을 측정하여, 그 측정결과로부터 산출한 각 형질전환체 배양액 1 리터 당 프로테아제 PFUS 생산량을 표 1에 나타낸다.
바실러스 섭틸리스 DB104/pSPO124에서는 바실러스 섭틸리스 DB104/pNAPS1과 비교하여 균체내의 프로테아제 PFUS 생산량이 3.6배 증가하였다. 또한, 바실러스 섭틸리스 DB104/pNAPS△C에서는 배양 상층액에서 2.4배, 균체내에서 2.2배의 프로테아제 PFUS 생산량의 증가를 나타냈다. 또한 바실러스 섭틸리스 DB104/pSPO124△C에서도 배양 상층액에서 2배, 균체내에서 2.4배로 프로테아제P FUS 생산량이 증가하였다. 그리고 균체당의 생산량도 증가하였다.
배양 상층액, 균체내의 프로테아제 PFUS 생산량의 합계치를 바실러스 섭틸리스 DB104/pNAPS1에서의 값과 비교하면, 바실러스 섭틸리스 DB104/pSPO124에서 2.1배, 바실러스 섭틸리스 DB104/pNAPS△C에서 2.1배, 바실러스 섭틸리스 DB104/pSPO124△C에서 2.2배로 각각 증가하였다.
표 1 프로테아제 PFUS의 생산량(배양액 1리터당, 단위 ㎎)
형질전환체(플라스미드) 배양 상층액 균체 배양액+균체
pNAPS1 15.1 12.5 27.6
pSPO124 13.1 45.4 58.5
pNAPS△C 35.5 28.1 63.6
pSPO124△C 30.5 30.1 60.6
실시예 4
(1) 성숙형 프로테아제 PFUS의 정제 효소 표품의 조제
모두 실시예 2에 기술된 바 대로 도입시킨 본 발명의 초내열성 프로테아제 유전자를 도입시킨 바실러스 섭틸리스 DB104인, 바실러스 섭틸리스 DB104/pNAPS1 및 바실러스 섭틸리스 DB104/pSPO124△C를 각각 10㎍/㎖의 가나마이신을 포함하는 LB 배지 5㎖를 포함하는 시험관에 접종하여, 37℃에서 7시간 진탕 배양하였다. 10㎍/㎖의 가나마이신을 포함하는 TM 배지(콩가루 5g/리터, 폴리펩톤 10g/리터, 고기엑기스 5g/리터, 효모엑기스 2g/리터, 글루코오스 10g/리터, FeSO4·7H2O 1O㎎/리터, MnSO4·4H2O 10㎎/리터, ZnSO4·7H2O 1㎎/리터, pH 7.0) 500㎖를 5리터 용량의 엘렌메이어 플라스크에 넣고 상기 배양액을 5㎖를 접종하여 30℃에서 3일간 진탕 배양하였다. 얻어진 배양액을 초음파처리한 후, 95℃에서 30분간 가열처리하여 원심분리후, 상층액을 회수하였다. 상층액이 25% 포화되도록 황산암모늄을 가한 후, 원심분리를 하여 얻어진 상층액을 25% 포화 황산암모늄을 포함하는 25mM 트리스-염산완충액(pH 7.6)으로 평형화한 마이크로프렙 메틸 HIC(Micro-Prep Methyl HIC, 바이오라드사 제품) 컬럼에 가하였다. 동일한 완충액으로 겔을 세정한 후, 40% 에탄올을 포함하는 25mM 트리스-염산 완충액(pH 7.6)을 이용한 단계별 용출에 의해 컬럼에 흡착된 프로테아제 PFUS를 용출하였다. 이렇게 해서 얻어진 프로테아제 PFUS를 포함하는 분획을 20% 아세토니트릴을 포함하는 0.05% 트리플루오로아세트산으로 평형화한 NAP-25 칼럼(파마시아사 제품)을 이용한 겔 여과에 제공하여 프로테아제 PFUS를 변성시킴과 동시에 탈염을 행하여 정제 프로테아제 PFUS 표품을 얻었다. 또한 바실러스 섭틸리스 DB104/pNAPS1로부터 얻어진 표품을 NAPS-1, 그리고 바실러스 섭틸리스 DB104/pSPO124△C로부터 얻어진 표품을 SPO-124△C로 각각 명명하였다.
0.1% SDS-10% 폴리아크릴아미드 겔를 이용하여 상기의 두 정제 효소 표품의 전기영동을 행하여, 쿠마시 브릴리언트 블루 R-250으로 염색을 행하면, 정제 효소 표품 NAPS-1, SPO-l24△C는 모두 다 단일의 밴드를 나타내고, 추정 분자량은 모두 약 45kDa이었다.
(2) 성숙형의 프로테아제 PFUS의 N-말단 아미노산 서열 분석
GlOOOA 프로테인 시퀀서(휴렛·팩커드사 제품)를 이용한 자동 에드만 법에 의해 정제 효소 표품 NAPS-1, SPO-124△C의 N-말단 아미노산 서열 분석을 행하였다. 이들 2종의 정제 효소 표품의 N-말단 아미노산 서열은, 모두 서열표의 서열번호 22에 나타낸 것이다. 이 서열은 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째로부터 144번째의 서열과 일치하고 있어, NAPS-1, SPO-124△C 모두 이 부분 이후의 폴피펩티드로 이루어지는 효소임을 의미한다.
(3) 성숙형의 프로테아제 PFUS의 질량분석
APl300 사중극삼연(quadrupole triple) 질량분석장치(퍼킨엘머 사이엑스사 제품)를 이용하여 정제 효소 표품 NAPS-1, SPO-124△C의 질량분석을 행하였다. NAPS-1의 분자량은 43,744Da로 추정되는 것으로부터 바실러스 섭틸리스 DB104/pNAPS1이 생산하는 성숙형의 프로테아제 PFUS는 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째의 Ala부터 552번째의 Thr까지의 폴리펩티드로 이루어지는 효소인 것으로 밝혀졌다. 또한, SPO-124△C의 분자량은 42,906Da로 추정된 것으로부터 바실러스 섭틸리스 DB104/pSPO124△C가 생산하는 성숙형의 프로테아제 PFUS는 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째의 Ala부터 544번째의 Ser까지의 폴리펩티드, 즉 서열표의 서열번호 2에 나타낸 아미노산 서열로 이루어지는 효소인 것으로 밝혀졌다.
SEQUENCE LISTING APPLICANT NAME: TAKARA SHUZO CO., LTD. TITLE OF INVENTION: SYSTEM FOR EXPRESSING HYPERTHERMOSTABLE PROTEIN REFERENCE/DOCKET NUMBER: 660782 CURRENT APPLICATION NUMBER: CURRENT FILING DATE: PRIOR APPLICATION NUMBER: 151969/1997 PRIOR FILING DATE: 10-JUN-1997 NUMBER OF SEQUENCES: 29 INFORMATION FOR SEQ ID NO:1: LENGTH: 412 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala 5 10 15 Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile 20 25 30 Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln 35 40 45 Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr 50 55 60 Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala 65 70 75 Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala 80 85 90 Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly 95 100 105 Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val 110 115 120 Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu 125 130 135 Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala 140 145 150 Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala 155 160 165 Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala 170 175 180 Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val 185 190 195 Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu 200 205 210 Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg 215 220 225 Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr 230 235 240 Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile 245 250 255 Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys 260 265 270 Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp 275 280 285 Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr 290 295 300 Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly 305 310 315 Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser 320 325 330 Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn 335 340 345 Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val 350 355 360 Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr 365 370 375 Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr 380 385 390 Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser 395 400 405 Leu Ser Gln Pro Gly Ser Ser 410 INFORMATION FOR SEQ ID NO:2: LENGTH: 1236 TYPE: nucleic acid STRANDEDNESS: double TOPOLOGY: linear MOLECULE TYPE: Genomic DNA ORIGINAL SOURCE: ORGANISM: Pyrococcus furiosus STRAIN: DSM3638 SEQUENCE DESCRIPTION: GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC 60 TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT 120 CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT 180 CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA 240 GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT 300 CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT 360 GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC 420 TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT 480 GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT 540 GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA 600 AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG 660 ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA 720 GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC 780 CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT 840 ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC 900 AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA 960 GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020 TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080 GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140 GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200 GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA 1236 INFORMATION FOR SEQ ID NO:3: LENGTH: 29 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr 5 10 15 Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala 20 25 INFORMATION FOR SEQ ID NO:4: LENGTH: 522 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide FEATURES: OTHER INFORMATION: Xaa at position 428 is Gly or Val SEQUENCE DESCRIPTION: Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala 5 10 15 Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile 20 25 30 Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln 35 40 45 Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr 50 55 60 Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala 65 70 75 Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala 80 85 90 Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly 95 100 105 Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val 110 115 120 Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu 125 130 135 Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala 140 145 150 Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala 155 160 165 Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala 170 175 180 Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val 185 190 195 Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu 200 205 210 Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg 215 220 225 Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr 230 235 240 Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile 245 250 255 Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys 260 265 270 Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp 275 280 285 Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr 290 295 300 Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly 305 310 315 Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser 320 325 330 Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn 335 340 345 Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val 350 355 360 Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr 365 370 375 Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr 380 385 390 Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser 395 400 405 Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr 410 415 420 Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp 425 430 435 Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys 440 445 450 Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp 455 460 465 Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu 470 475 480 Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro 485 490 495 Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp 500 505 510 Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly 515 520 INFORMATION FOR SEQ ID NO:5: LENGTH: 4765 TYPE: nucleic acid STRANDEDNESS: double TOPOLOGY: linear MOLECULE TYPE: Genomic DNA ORIGINAL SOURCE: ORGANISM: Pyrococcus furiosus STRAIN: DSM3638 SEQUENCE DESCRIPTION: TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60 AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120 AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180 CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240 ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300 ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360 GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420 ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480 GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540 AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600 CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660 ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720 ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780 GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840 AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900 ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960 TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020 ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080 GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140 GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200 TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260 AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320 TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380 CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440 GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500 AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560 AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620 GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680 GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740 CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800 GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860 ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920 GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980 AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040 TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100 AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160 GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220 CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280 ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340 AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400 GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460 ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520 ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580 CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640 TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700 GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760 ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820 AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880 CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940 TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000 AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060 GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120 GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180 ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240 AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300 GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360 TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420 GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480 CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540 AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600 TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660 ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720 CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG 3780 GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840 GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900 GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960 TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020 ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080 GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140 AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200 ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260 GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320 TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380 TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440 CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500 CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT 4560 AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620 TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680 CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740 TGGCATCATC AATTTTCTCT TTAAA 4765 INFORMATION FOR SEQ ID NO:6: LENGTH: 1398 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu 5 10 15 Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro 20 25 30 Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln 35 40 45 Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met 50 55 60 Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly 65 70 75 Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu 80 85 90 Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile 95 100 105 Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu 110 115 120 Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val 125 130 135 Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met 140 145 150 Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu 155 160 165 Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr 170 175 180 Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly 185 190 195 Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe 200 205 210 Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu 215 220 225 Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn 230 235 240 Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val 245 250 255 Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr 260 265 270 His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp 275 280 285 Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr 290 295 300 Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr 305 310 315 Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr 320 325 330 Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val 335 340 345 Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp 350 355 360 Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly 365 370 375 Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser 380 385 390 Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr 395 400 405 Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln 410 415 420 Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met 425 430 435 Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala 440 445 450 Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp 455 460 465 Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys 470 475 480 Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly 485 490 495 Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr 500 505 510 Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser 515 520 525 Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro 530 535 540 Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro 545 550 555 Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr 560 565 570 Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe 575 580 585 Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val 590 595 600 Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn 605 610 615 Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu 620 625 630 Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln 635 640 645 Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys 650 655 660 Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp 665 670 675 Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile 680 685 690 Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp 695 700 705 His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile 710 715 720 Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val 725 730 735 Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp 740 745 750 Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile 755 760 765 Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr 770 775 780 Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu 785 790 795 Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe 800 805 810 Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr 815 820 825 Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe 830 835 840 Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met 845 850 855 Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro 860 865 870 Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile 875 880 885 Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn 890 895 900 Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro 905 910 915 Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala 920 925 930 Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile 935 940 945 Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn 950 955 960 Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser 965 970 975 Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu 980 985 990 Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val 995 1000 1005 Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr 1010 1015 1020 Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn 1025 1030 1035 Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser 1040 1045 1050 Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr 1055 1060 1065 Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr 1070 1075 1080 Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val 1085 1090 1095 Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly 1100 1105 1110 Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala 1115 1120 1125 Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly Asn 1130 1135 1140 Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr 1145 1150 1155 Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys 1160 1165 1170 Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val 1175 1180 1185 Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu 1190 1195 1200 Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu 1205 1210 1215 Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile 1220 1225 1230 Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro 1235 1240 1245 Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val 1250 1255 1260 Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile 1265 1270 1275 Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr 1280 1285 1290 Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe 1295 1300 1305 Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu 1310 1315 1320 Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu 1325 1330 1335 Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu 1340 1345 1350 Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly 1355 1360 1365 Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu 1370 1375 1380 Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu 1385 1390 1395 Gly Glu Glu INFORMATION FOR SEQ ID NO:7: LENGTH: 35 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35 INFORMATION FOR SEQ ID NO:8: LENGTH: 32 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: KSTCACGGAA CTCACGTDGC BGGHACDGTT GC 32 INFORMATION FOR SEQ ID NO:9: LENGTH: 33 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33 INFORMATION FOR SEQ ID NO:10: LENGTH: 34 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC 34 INFORMATION FOR SEQ ID NO:11: LENGTH: 1977 TYPE: nucleic acid STRANDEDNESS: double TOPOLOGY: linear MOLECULE TYPE: Genomic DNA ORIGINAL SOURCE: ORGANISM: Thermococcus celer STRAIN: DSM2476 SEQUENCE DESCRIPTION: ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG 60 GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC 120 GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG 180 GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG 240 CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA 300 AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA 360 AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT 420 TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT 480 GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG 540 GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC 600 GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC 660 GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC 720 GTCTCCACCA TCATCGCGGG TGTTGACTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA 780 AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840 CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900 GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960 GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020 AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080 ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140 ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200 GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260 GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320 GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380 GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440 GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500 GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560 AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620 TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680 CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740 GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800 CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860 AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920 GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977 INFORMATION FOR SEQ ID NO:12: LENGTH: 659 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly 5 10 15 Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val 20 25 30 Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro 35 40 45 Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val 50 55 60 Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala 65 70 75 Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr 80 85 90 Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu 95 100 105 Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr 110 115 120 Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln 125 130 135 Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val 140 145 150 Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Ala Ile 155 160 165 Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys 170 175 180 Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr 185 190 195 Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly 200 205 210 Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala 215 220 225 Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser 230 235 240 Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys 245 250 255 Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser 260 265 270 Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn 275 280 285 Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser 290 295 300 Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys 305 310 315 Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser 320 325 330 Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu 335 340 345 Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly 350 355 360 Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser 365 370 375 Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu 380 385 390 Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr 395 400 405 Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala 410 415 420 Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile 425 430 435 Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala 440 445 450 Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr 455 460 465 Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile 470 475 480 Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser 485 490 495 Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro 500 505 510 Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala 515 520 525 Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln 530 535 540 Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr 545 550 555 Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr 560 565 570 Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala 575 580 585 Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp 590 595 600 Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg 605 610 615 Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro 620 625 630 Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr 635 640 645 Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly 650 655 INFORMATION FOR SEQ ID NO:13: LENGTH: 28 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AGAGGGATCC ATGAAGGGGC TGAAAGCT 28 INFORMATION FOR SEQ ID NO:14: LENGTH: 28 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AGAGGCATGC GCTCTAGACT CTGGGAGAGT 28 INFORMATION FOR SEQ ID NO:15: LENGTH: 1962 TYPE: nucleic acid STRANDEDNESS: double TOPOLOGY: linear MOLECULE TYPE: Genomic DNA ORIGINAL SOURCE: ORGANISM: Pyrococcus furiosus STRAIN: DSM3638 SEQUENCE DESCRIPTION: ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC 60 GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120 CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180 ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240 ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300 GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360 AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420 TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480 ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540 ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600 ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660 ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720 ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780 AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840 CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900 GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960 GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020 AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080 ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140 ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200 GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260 GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320 GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380 ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440 GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500 GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560 AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 1620 CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680 TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740 ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800 TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860 GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920 GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962 INFORMATION FOR SEQ ID NO:16: LENGTH: 654 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly 5 10 15 Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu 20 25 30 Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly 35 40 45 Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser 50 55 60 Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val 65 70 75 Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His 80 85 90 Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu 95 100 105 Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val 110 115 120 Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu 125 130 135 Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val 140 145 150 Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile 155 160 165 Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val 170 175 180 Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp 185 190 195 Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr 200 205 210 Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala 215 220 225 Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser 230 235 240 Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys 245 250 255 Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser 260 265 270 Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala 275 280 285 Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser 290 295 300 Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys 305 310 315 Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser 320 325 330 Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu 335 340 345 Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly 350 355 360 Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro 365 370 375 Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu 380 385 390 Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr 395 400 405 Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala 410 415 420 Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile 425 430 435 Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala 440 445 450 Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser 455 460 465 Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu 470 475 480 Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser 485 490 495 Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro 500 505 510 Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser 515 520 525 Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln 530 535 540 Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala 545 550 555 Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp 560 565 570 Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly 575 580 585 Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu 590 595 600 Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn 605 610 615 Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp 620 625 630 Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr 635 640 645 Glu Leu Thr Ala Lys Val Tyr Tyr Gly 650 INFORMATION FOR SEQ ID NO:17: LENGTH: 25 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: TCTGAATTCG TTCTTTTCTG TATGG 25 INFORMATION FOR SEQ ID NO:18: LENGTH: 20 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: TGTACTGCTG GATCCGGCAG 20 INFORMATION FOR SEQ ID NO:19: LENGTH: 25 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AGAGGCATGC GTATCCATCA GATTTTTGAG 30 INFORMATION FOR SEQ ID NO:20: LENGTH: 20 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AGTGAACGGA TACTTGGAAC 20 INFORMATION FOR SEQ ID NO:21: LENGTH: 20 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GTTCCAAGTA TCCGTTCACT 20 INFORMATION FOR SEQ ID NO:22: LENGTH: 12 TYPE: amino acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: peptide SEQUENCE DESCRIPTION: Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln 5 10 INFORMATION FOR SEQ ID NO:23: LENGTH: 24 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: TCATGGATCC ACCCTCTCCT TTTA 24 INFORMATION FOR SEQ ID NO:24: LENGTH: 26 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC 26 INFORMATION FOR SEQ ID NO:25: LENGTH: 29 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GAGAGCTTTC AGCCCCTTCA TNNNNNNTCC GGCAGCCTGC GCAGACATG 29 INFORMATION FOR SEQ ID NO:26: LENGTH: 27 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AGAGGGGGAT CCGTGAGAAG CAAAAAA 27 INFORMATION FOR SEQ ID NO:27: LENGTH: 20 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GATGACTAGT AAGTCTCTAA 20 INFORMATION FOR SEQ ID NO:28: LENGTH: 20 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: AAGCCTGAGG TTGTTGCTCC 20 INFORMATION FOR SEQ ID NO:29: LENGTH: 29 TYPE: nucleic acid STRANDEDNESS: single TOPOLOGY: linear MOLECULE TYPE: Other nucleic acid (synthetic DNA) SEQUENCE DESCRIPTION: GGGCATGCTC ATGAACTTCC AGGCTGTGA 29

Claims (22)

  1. 서열표의 서열번호 4에 나타낸 아미노산 서열로 이루어진 프로테아제.
  2. 서열표의 서열번호 4에 나타낸 아미노산 서열의 413번과 522번 사이의 위치에서 하나 이상의 아미노산 잔기가 결실된 아미노산 서열로 이루어지며, 내열성 프로테아제 활성을 갖는 프로테아제.
  3. 제 2항에 있어서, 서열표의 서열번호 1에 나타낸 아미노산 서열로 이루어진 프로테아제.
  4. 제 1항 내지 제 3항 중 어느 한 항에 따른 프로테아제를 코딩하는 유전자.
  5. 삭제
  6. 제 4 항에 있어서, 서열표의 서열번호 2에 나타낸 염기서열로 이루어지는 유전자.
  7. 삭제
  8. 삭제
  9. 식 Ⅰ:
    SIG-Ala-Gly-Gly-Asn-PRO [Ⅰ]
    [식중, SIG는 섭틸리신 유래의 시그널 펩티드의 아미노산 서열을, PRO은 발현시키고자 하는 단백질의 아미노산 서열을 나타내며, 상기 단백질은 제 1항 내지 제 3항 중 어느 한 항에 따른 프로테아제이다]
    로 나타내어지는 아미노산 서열을 코드하는 유전자.
  10. 제 9 항에 있어서, SIG가 서열표의 서열번호 3에 나타낸 아미노산 서열인 유전자.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 제 9 항에 있어서, pSPO124 또는 pSPO124△C로부터 선택되는 플라스미드에 함유되는 것임을 특징으로 하는 유전자(여기에서 pSPO124는 하기 개열지도를 가지며, pSPO124△C는 바실러스 섭틸리스 DB104/pSPO124△C FERM BP-6294로부터 얻는다).
  15. 삭제
  16. 제 9 항에 따른 유전자가 도입된 바실러스(Bacillus) 속 세균을 배양하여, 그 배양물로부터 목적하는 단백질를 회수하는 공정으로 이루어짐을 특징으로 하는 단백질의 제조방법.
  17. 제 16 항에 있어서, 바실러스속 세균이 바실러스 섭틸리스(Bacillus subtilis)인 단백질의 제조방법.
  18. 제 16 항에 있어서, 상기 유전자가 플라스미드 벡터에 의해서 바실러스속 세균에 도입된 것인 단백질의 제조방법.
  19. 제 18 항에 있어서, pSPO124, pSPO124△C로부터 선택되는 플라스미드가 바실러스속 세균에 도입된 것인 단백질의 제조방법(여기에서 pSPO124 또는 pSPO124△C는 제14항에서 정의한 바와 같다).
  20. 제 19 항에 있어서, 바실러스 섭틸리스 DB104/pSPO124△C FERM BP-6294를 배양하여, 그 배양물로부터 목적하는 단백질을 회수하는 공정으로 이루어짐을 특징으로 하는 단백질의 제조방법.
  21. 제 9 항에 따른 유전자가 삽입된 플라스미드벡터.
  22. 제 21 항에 있어서, pSPO124, pSPO124△C로부터 선택되는 플라스미드 벡터(여기에서 pSPO124 또는 pSPO124△C는 제14항에서 정의한 바와 같다).
KR10-1999-7011547A 1997-06-10 1998-06-04 초내열성 프로테아제 발현계 KR100530598B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP1997/151969 1997-06-10
JP15196997 1997-06-10
PCT/JP1998/002465 WO1998056926A1 (fr) 1997-06-10 1998-06-04 Systeme pour exprimer une proteine hyperthermostable

Publications (2)

Publication Number Publication Date
KR20010013540A KR20010013540A (ko) 2001-02-26
KR100530598B1 true KR100530598B1 (ko) 2005-11-23

Family

ID=15530186

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-7011547A KR100530598B1 (ko) 1997-06-10 1998-06-04 초내열성 프로테아제 발현계

Country Status (10)

Country Link
US (3) US6358726B1 (ko)
EP (1) EP0994191B1 (ko)
JP (1) JP3601835B2 (ko)
KR (1) KR100530598B1 (ko)
CN (2) CN1190494C (ko)
AT (1) ATE318913T1 (ko)
AU (1) AU7550098A (ko)
DE (1) DE69833652T2 (ko)
TW (1) TW530088B (ko)
WO (1) WO1998056926A1 (ko)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000061711A1 (fr) * 1999-04-07 2000-10-19 Takara Shuzo Co., Ltd. Composition de decomposition de proteines
DE60229361D1 (de) 2001-03-14 2008-11-27 Takara Bio Inc Promotoren
KR20050052666A (ko) * 2002-10-10 2005-06-03 다이버사 코포레이션 프로테아제, 이를 암호화하는 핵산, 및 이를 제조하고사용하는 방법
DE10315640A1 (de) * 2003-04-04 2004-10-14 Ignatov, Konstantin Verfahren zur kontrollierten Freisetzung von Komponenten in eine Lösung
DK1639105T4 (da) * 2003-06-19 2012-12-10 Novozymes As Proteases
GB2416352B (en) * 2004-07-21 2009-01-28 Bioline Ltd A method for performing the hot start of enzymatic reactions
US8097444B2 (en) * 2006-12-21 2012-01-17 Danisco Us Inc. Compositions and uses for an alpha-amylase polypeptide of bacillus species 195
US8535928B2 (en) * 2008-07-31 2013-09-17 Osaka University Protease and use thereof
JP5602635B2 (ja) * 2008-10-21 2014-10-08 一般財団法人化学及血清療法研究所 封入体形成タンパク質の製造方法
US9617527B2 (en) 2010-04-14 2017-04-11 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
EP2654567B1 (en) 2010-12-22 2018-04-04 Novozymes North America, Inc. Process for producing fermentation products from starch containing materials
ES2627987T3 (es) 2011-10-11 2017-08-01 Novozymes North America, Inc. Proceso de licuefacción para producir productos de fermentación
EP2794873A1 (en) * 2011-11-08 2014-10-29 Novozymes A/S Methods for production of archeae protease in yeast
WO2013082486A1 (en) 2011-12-02 2013-06-06 Novozymes A/S Processes for producing fermentation products
ES2935920T3 (es) 2012-03-30 2023-03-13 Novozymes North America Inc Procesos de elaboración de productos de fermentación
WO2014088940A1 (en) * 2012-12-07 2014-06-12 Danisco Us Inc. Compositions and methods of use
CA2891504A1 (en) * 2012-12-07 2014-06-12 Danisco Us Inc. Compositions and methods of use
US11939552B2 (en) 2013-06-24 2024-03-26 Novozymes A/S Process of recovering oil
ES2754203T3 (es) 2013-06-24 2020-04-16 Novozymes As Proceso de extracción de aceite a partir de vinaza diluida
US9926584B2 (en) 2013-06-25 2018-03-27 Novozymes A/S Expression of natively secreted polypeptides without signal peptide
CA2915336C (en) 2013-07-17 2024-03-12 Novozymes A/S Pullulanase chimeras and polynucleotides encoding same
CN105934518A (zh) 2013-09-11 2016-09-07 诺维信公司 用于生产发酵产品的方法
DK3097192T3 (en) 2014-01-22 2018-11-19 Novozymes As PULLULANASE VARIATIONS AND POLYNUCLEOTIDES CODING THEM
EP3161133B1 (en) 2014-06-25 2018-12-12 Novozymes A/S Xylanase variants and polynucleotides encoding same
WO2016062875A2 (en) 2014-10-23 2016-04-28 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
WO2016087327A1 (en) 2014-12-01 2016-06-09 Novozymes A/S Polypeptides having pullulanase activity comprising the x25, x45 and cbm41 domains
AU2016225049B2 (en) 2015-02-27 2022-03-31 Microbiogen Pty. Ltd. Processes of producing ethanol using a fermenting organism
US10676727B2 (en) 2015-06-18 2020-06-09 Novozymes A/S Polypeptides having trehalase activity and the use thereof in process of producing fermentation products
WO2017015329A1 (en) 2015-07-23 2017-01-26 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
WO2017066255A1 (en) 2015-10-14 2017-04-20 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
US10689630B2 (en) 2015-12-22 2020-06-23 Novozymes A/S Processes for producing fermentation products
WO2018075430A1 (en) 2016-10-17 2018-04-26 Novozymes A/S Methods of reducing foam during ethanol fermentation
WO2018098381A1 (en) 2016-11-23 2018-05-31 Novozymes A/S Improved yeast for ethanol production
EP3606936B1 (en) 2017-04-03 2021-10-20 Novozymes A/S Recovery process
US11279921B2 (en) 2017-04-11 2022-03-22 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
EP3609631A1 (en) * 2017-04-14 2020-02-19 Novozymes A/S Processes for solubilizing municipal solid waste with enzyme compositions comprising protease and enzyme compositions thereof
CA3064042A1 (en) 2017-06-02 2018-12-06 Novozymes A/S Improved yeast for ethanol production
ES2908190T3 (es) 2017-06-28 2022-04-28 Novozymes As Polipéptidos con actividad de trehalasa y polinucleótidos que los codifican
MX2020001282A (es) 2017-08-08 2020-03-12 Novozymes As Polipeptidos que tienen actividad trehalasa y uso de los mismos en proceso de produccion de productos de fermentacion.
BR112020004476A2 (pt) 2017-09-15 2020-09-08 Novozymes A/S processo para produção de um produto de fermentação, e, uso de uma combinação de enzimas
US11326187B2 (en) 2017-10-23 2022-05-10 Novozymes A/S Processes for producing a fermentation product
MX2020005724A (es) 2017-12-08 2020-08-13 Novozymes As Variantes de alfa-amilasa y polinucleotidos que codifican las mismas.
EP3720955B1 (en) 2017-12-08 2023-06-14 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
CN113286871A (zh) 2018-01-29 2021-08-20 诺维信公司 用于乙醇生产的氮利用提高的微生物
US11473109B2 (en) 2018-02-15 2022-10-18 Novozymes A/S Yeast for ethanol production
CN112105729A (zh) 2018-04-09 2020-12-18 诺维信公司 具有α-淀粉酶活性的多肽以及编码它们的多核苷酸
MX2020012754A (es) 2018-05-31 2021-02-26 Novozymes As Procesos para mejorar el crecimiento y la productividad de la levadura.
EP3821024A1 (en) 2018-07-11 2021-05-19 Novozymes A/S Processes for producing fermentation products
CA3107110A1 (en) 2018-07-25 2020-01-30 Novozymes A/S Enzyme-expressing yeast for ethanol production
WO2020076697A1 (en) 2018-10-08 2020-04-16 Novozymes A/S Enzyme-expressing yeast for ethanol production
EP3918060A1 (en) 2019-01-31 2021-12-08 Novozymes A/S Polypeptides having xylanase activity and use thereof for improving the nutritional quality of animal feed
CN113490740A (zh) 2019-03-18 2021-10-08 诺维信公司 适合用于液化中的具有普鲁兰酶活性的多肽
BR112021017085A2 (pt) 2019-04-02 2022-02-08 Novozymes As Processo de produção de um produto de fermentação
MX2021015821A (es) 2019-07-26 2022-02-03 Novozymes As Microorganismos con transporte de nitrogeno mejorado para la produccion de etanol.
AR119596A1 (es) 2019-08-05 2021-12-29 Novozymes As Mezclas de enzimas y procesos para producir un ingrediente alimenticio de alto contenido proteico a partir de un subproducto de la vinaza entera
US20220307036A1 (en) 2019-08-06 2022-09-29 Novozymes A/S Fusion proteins for improved enzyme expression
US20230012672A1 (en) 2019-09-16 2023-01-19 Novozymes A/S Polypeptides having beta-glucanase activity and polynucleotides encoding same
US20230002794A1 (en) 2019-12-10 2023-01-05 Novozymes A/S Microorganism for improved pentose fermentation
BR112022011634A2 (pt) 2019-12-16 2022-08-30 Novozymes As Processos para produção de um produto de fermentação, para diminuição da quantidade de amido residual presente em um liquefato e para aumento da quantidade de oligossacarídeos de cadeia curta presente em um liquefato
BR112022015805A2 (pt) 2020-02-10 2022-10-11 Novozymes As Variante de alfa-amilase de uma alfa-amilase genitora, polinucleotídeo isolado, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, composição, formulação de caldo inteiro ou composição de cultura de células, uso de uma alfa-amilase variante, processo de produção de um produto de fermentação a partir de material contendo amido e de um produto de xarope, e, planta transgênica, parte de planta ou célula de planta
EP4103709A2 (en) 2020-02-10 2022-12-21 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
CN111876435A (zh) * 2020-07-31 2020-11-03 山东大学 一种海洋嗜热胶原蛋白酶a69及其编码基因与应用
EP4237555A1 (en) 2020-11-02 2023-09-06 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
BR112023025624A2 (pt) 2021-06-07 2024-02-27 Novozymes As Célula de levedura recombinante, célula hospedeira recombinante, composição, cocultura, métodos de produção de um derivado de uma célula hospedeira recombinante e de produção de um produto de fermentação, e, uso de uma célula hospedeira recombinante

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1228925B (it) * 1987-08-07 1991-07-10 Eniricerche Spa Procedimento per la preparazione dell'ormone della crescita umano
CN1086737C (zh) * 1994-06-13 2002-06-26 宝酒造株式会社 超热稳定蛋白酶基因
KR100452447B1 (ko) 1995-12-12 2005-06-27 다카라 바이오 가부시키가이샤 초고열 안정성 프로테아제 유전자

Also Published As

Publication number Publication date
WO1998056926A1 (fr) 1998-12-17
CN1311075C (zh) 2007-04-18
JP3601835B2 (ja) 2004-12-15
CN1260002A (zh) 2000-07-12
CN1657614A (zh) 2005-08-24
US20020132335A1 (en) 2002-09-19
EP0994191B1 (en) 2006-03-01
TW530088B (en) 2003-05-01
US6358726B1 (en) 2002-03-19
US7144719B2 (en) 2006-12-05
EP0994191A4 (en) 2003-04-23
US6783970B2 (en) 2004-08-31
EP0994191A1 (en) 2000-04-19
DE69833652D1 (de) 2006-04-27
US20050084934A1 (en) 2005-04-21
CN1190494C (zh) 2005-02-23
AU7550098A (en) 1998-12-30
KR20010013540A (ko) 2001-02-26
ATE318913T1 (de) 2006-03-15
DE69833652T2 (de) 2006-09-21

Similar Documents

Publication Publication Date Title
KR100530598B1 (ko) 초내열성 프로테아제 발현계
FI102969B (fi) Lämpö- ja pH-stabiileja Bacillus-subtilisiinianalogeja, menetelmä niid en valmistamiseksi ja niitä sisältävä pesuainekoostumus
US5093257A (en) Hybrid prokaryotic polypeptides produced by in vivo homologous recombination
US20090029416A1 (en) Hyperthermostable protease gene
EP0483224B1 (en) Inducible expression vectors
DK175020B1 (da) Fremgangsåde til udtrykkelse og ekstracellulær udskillelse af proteiner i G(-)bakterie, rekombinant DNA-konstruktion og plasmidvektor kodende herfor, samt G(-)bakterie indeholdende disse
AU638042B2 (en) Modified proteases and their use in foodstuffs
EP0154351A2 (en) Expression plasmids useful in B. subtilis
Shiroza et al. Secretion of heterologous proteins by genetically engineered Streptococcus gordonii
Ferrari HOMOLOGOUS a-AMYLASES OF BACILLUS AND GENERATION OF THEIR HYBRIDS IN VIVO
JPH01141596A (ja) アルカリプロテアーゼをコードする遺伝子系
JPH0833484A (ja) アルカリプロテアーゼの製造方法

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091110

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee