KR20010013540A - 초내열성 프로테아제 발현계 - Google Patents

초내열성 프로테아제 발현계 Download PDF

Info

Publication number
KR20010013540A
KR20010013540A KR1019997011547A KR19997011547A KR20010013540A KR 20010013540 A KR20010013540 A KR 20010013540A KR 1019997011547 A KR1019997011547 A KR 1019997011547A KR 19997011547 A KR19997011547 A KR 19997011547A KR 20010013540 A KR20010013540 A KR 20010013540A
Authority
KR
South Korea
Prior art keywords
gly
val
ala
protease
ser
Prior art date
Application number
KR1019997011547A
Other languages
English (en)
Other versions
KR100530598B1 (ko
Inventor
히까루 다까꾸라
미오 모리시따
도모꼬 시모조
기요조 아사다
이꾸노신 가또
Original Assignee
오미야 히사시
다까라 슈조 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오미야 히사시, 다까라 슈조 가부시키가이샤 filed Critical 오미야 히사시
Publication of KR20010013540A publication Critical patent/KR20010013540A/ko
Application granted granted Critical
Publication of KR100530598B1 publication Critical patent/KR100530598B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Abstract

유전자 공학적인 수법에 의해 공업적 사용에 유리한 초호열균의 프로테아제를 제공하기 위해 서열표의 서열번호 1에 나타낸 아미노산 서열 및 그 서열의 1 또는 다수의 아미노산이 결실, 치환, 삽입 또는 부가된 아미노산 서열을 갖는 내열성 프로테아제, 그것을 코드하는 내열성 프로테아제 유전자, 그 프로테아제의 제조방법을 개시한다.

Description

초내열성 프로테아제 발현계{System for expressing hyperthermostable protein}
SEQUENCE LISTING
APPLICANT NAME: TAKARA SHUZO CO., LTD.
TITLE OF INVENTION: SYSTEM FOR EXPRESSING HYPERTHERMOSTABLE PROTEIN
REFERENCE/DOCKET NUMBER: 660782
CURRENT APPLICATION NUMBER:
CURRENT FILING DATE:
PRIOR APPLICATION NUMBER: 151969/1997
PRIOR FILING DATE: 10-JUN-1997
NUMBER OF SEQUENCES: 29
INFORMATION FOR SEQ ID NO:1:
LENGTH: 412
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala
5 10 15
Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile
20 25 30
Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln
35 40 45
Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr
50 55 60
Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala
65 70 75
Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala
80 85 90
Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly
95 100 105
Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val
110 115 120
Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu
125 130 135
Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala
140 145 150
Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala
155 160 165
Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala
170 175 180
Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val
185 190 195
Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu
200 205 210
Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg
215 220 225
Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
230 235 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile
245 250 255
Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys
260 265 270
Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp
275 280 285
Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr
290 295 300
Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly
305 310 315
Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser
320 325 330
Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn
335 340 345
Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val
350 355 360
Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr
365 370 375
Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr
380 385 390
Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser
395 400 405
Leu Ser Gln Pro Gly Ser Ser
410
INFORMATION FOR SEQ ID NO:2:
LENGTH: 1236
TYPE: nucleic acid
STRANDEDNESS: double
TOPOLOGY: linear
MOLECULE TYPE: Genomic DNA
ORIGINAL SOURCE:
ORGANISM: Pyrococcus furiosus
STRAIN: DSM3638
SEQUENCE DESCRIPTION:
GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC 60
TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT 120
CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT 180
CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA 240
GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT 300
CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT 360
GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC 420
TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT 480
GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT 540
GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA 600
AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG 660
ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA 720
GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC 780
CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT 840
ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC 900
AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA 960
GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020
TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080
GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140
GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200
GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA 1236
INFORMATION FOR SEQ ID NO:3:
LENGTH: 29
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr
5 10 15
Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala
20 25
INFORMATION FOR SEQ ID NO:4:
LENGTH: 522
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
FEATURES:
OTHER INFORMATION: Xaa at position 428 is Gly or Val
SEQUENCE DESCRIPTION:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala
5 10 15
Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile
20 25 30
Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln
35 40 45
Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr
50 55 60
Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala
65 70 75
Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala
80 85 90
Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly
95 100 105
Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val
110 115 120
Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu
125 130 135
Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala
140 145 150
Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala
155 160 165
Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala
170 175 180
Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val
185 190 195
Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu
200 205 210
Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg
215 220 225
Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
230 235 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile
245 250 255
Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys
260 265 270
Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp
275 280 285
Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr
290 295 300
Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly
305 310 315
Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser
320 325 330
Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn
335 340 345
Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val
350 355 360
Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr
365 370 375
Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr
380 385 390
Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser
395 400 405
Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr
410 415 420
Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp
425 430 435
Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
440 445 450
Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp
455 460 465
Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu
470 475 480
Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro
485 490 495
Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp
500 505 510
Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly
515 520
INFORMATION FOR SEQ ID NO:5:
LENGTH: 4765
TYPE: nucleic acid
STRANDEDNESS: double
TOPOLOGY: linear
MOLECULE TYPE: Genomic DNA
ORIGINAL SOURCE:
ORGANISM: Pyrococcus furiosus
STRAIN: DSM3638
SEQUENCE DESCRIPTION:
TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60
AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120
AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180
CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240
ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300
ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360
GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420
ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480
GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540
AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600
CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660
ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720
ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780
GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840
AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900
ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960
TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020
ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080
GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140
GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200
TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260
AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320
TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380
CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440
GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500
AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560
AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620
GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680
GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740
CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800
GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860
ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920
GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980
AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040
TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100
AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160
GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220
CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280
ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340
AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400
GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460
ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520
ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580
CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640
TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700
GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760
ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820
AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880
CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940
TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000
AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060
GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120
GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180
ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240
AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300
GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360
TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420
GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480
CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540
AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600
TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660
ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720
CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG 3780
GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840
GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900
GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960
TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020
ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080
GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140
AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200
ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260
GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320
TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380
TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440
CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500
CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATCTTTAGCTCAT 4560
AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620
TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680
CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740
TGGCATCATC AATTTTCTCT TTAAA 4765
INFORMATION FOR SEQ ID NO:6:
LENGTH: 1398
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu
5 10 15
Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro
20 25 30
Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln
35 40 45
Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met
50 55 60
Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly
65 70 75
Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu
80 85 90
Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile
95 100 105
Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu
110 115 120
Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val
125 130 135
Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met
140 145 150
Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu
155 160 165
Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr
170 175 180
Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly
185 190 195
Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe
200 205 210
Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu
215 220 225
Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn
230 235 240
Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val
245 250 255
Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr
260 265 270
His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp
275 280 285
Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr
290 295 300
Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr
305 310 315
Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr
320 325 330
Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val
335 340 345
Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp
350 355 360
Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly
365 370 375
Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser
380 385 390
Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr
395 400 405
Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln
410 415 420
Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met
425 430 435
Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala
440 445 450
Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp
455 460 465
Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys
470 475 480
Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly
485 490 495
Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr
500 505 510
Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser
515 520 525
Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro
530 535 540
Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro
545 550 555
Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr
560 565 570
Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe
575 580 585
Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val
590 595 600
Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn
605 610 615
Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu
620 625 630
Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln
635 640 645
Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys
650 655 660
Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp
665 670 675
Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile
680 685 690
Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp
695 700 705
His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile
710 715 720
Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
725 730 735
Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp
740 745 750
Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile
755 760 765
Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr
770 775 780
Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu
785 790 795
Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe
800 805 810
Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr
815 820 825
Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe
830 835 840
Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met
845 850 855
Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro
860 865 870
Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile
875 880 885
Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn
890 895 900
Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro
905 910 915
Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala
920 925 930
Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile
935 940 945
Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn
950 955 960
Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser
965 970 975
Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu
980 985 990
Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val
995 1000 1005
Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr
1010 1015 1020
Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn
1025 1030 1035
Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser
1040 1045 1050
Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr
1055 1060 1065
Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr
1070 1075 1080
Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val
1085 1090 1095
Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
1100 1105 1110
Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala
1115 1120 1125
Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly Asn
1130 1135 1140
Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr
1145 1150 1155
Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys
1160 1165 1170
Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val
1175 1180 1185
Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu
1190 1195 1200
Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu
1205 1210 1215
Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile
1220 1225 1230
Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro
1235 1240 1245
Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val
1250 1255 1260
Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile
1265 1270 1275
Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr
1280 1285 1290
Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe
1295 1300 1305
Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu
1310 1315 1320
Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu
1325 1330 1335
Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu
1340 1345 1350
Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly
1355 1360 1365
Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu
1370 1375 1380
Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu
1385 1390 1395
Gly Glu Glu
INFORMATION FOR SEQ ID NO:7:
LENGTH: 35
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35
INFORMATION FOR SEQ ID NO:8:
LENGTH: 32
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
KSTCACGGAA CTCACGTDGC BGGHACDGTT GC 32
INFORMATION FOR SEQ ID NO:9:
LENGTH: 33
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33
INFORMATION FOR SEQ ID NO:10:
LENGTH: 34
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC 34
INFORMATION FOR SEQ ID NO:11:
LENGTH: 1977
TYPE: nucleic acid
STRANDEDNESS: double
TOPOLOGY: linear
MOLECULE TYPE: Genomic DNA
ORIGINAL SOURCE:
ORGANISM: Thermococcus celer
STRAIN: DSM2476
SEQUENCE DESCRIPTION:
ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG 60
GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC 120
GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG 180
GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG 240
CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA 300
AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA 360
AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT 420
TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT 480
GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG 540
GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC 600
GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC 660
GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC 720
GTCTCCACCA TCATCGCGGG TGTTGACTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA 780
AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840
CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900
GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960
GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020
AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080
ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140
ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200
GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260
GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320
GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380
GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440
GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500
GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560
AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620
TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680
CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740
GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800
CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860
AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920
GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977
INFORMATION FOR SEQ ID NO:12:
LENGTH: 659
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly
5 10 15
Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val
20 25 30
Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro
35 40 45
Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val
50 55 60
Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala
65 70 75
Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr
80 85 90
Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu
95 100 105
Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr
110 115 120
Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln
125 130 135
Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val
140 145 150
Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Ala Ile
155 160 165
Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys
170 175 180
Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr
185 190 195
Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly
200 205 210
Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala
215 220 225
Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240
Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys
245 250 255
Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270
Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn
275 280 285
Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser
290 295 300
Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315
Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser
320 325 330
Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345
Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly
350 355 360
Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser
365 370 375
Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu
380 385 390
Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
395 400 405
Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala
410 415 420
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile
425 430 435
Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala
440 445 450
Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr
455 460 465
Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile
470 475 480
Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser
485 490 495
Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
500 505 510
Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala
515 520 525
Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
530 535 540
Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr
545 550 555
Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr
560 565 570
Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala
575 580 585
Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp
590 595 600
Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg
605 610 615
Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro
620 625 630
Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr
635 640 645
Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly
650 655
INFORMATION FOR SEQ ID NO:13:
LENGTH: 28
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AGAGGGATCC ATGAAGGGGC TGAAAGCT 28
INFORMATION FOR SEQ ID NO:14:
LENGTH: 28
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AGAGGCATGC GCTCTAGACT CTGGGAGAGT 28
INFORMATION FOR SEQ ID NO:15:
LENGTH: 1962
TYPE: nucleic acid
STRANDEDNESS: double
TOPOLOGY: linear
MOLECULE TYPE: Genomic DNA
ORIGINAL SOURCE:
ORGANISM: Pyrococcus furiosus
STRAIN: DSM3638
SEQUENCE DESCRIPTION:
ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC 60
GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120
CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180
ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240
ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300
GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360
AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420
TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480
ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540
ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600
ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660
ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720
ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780
AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840
CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900
GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960
GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020
AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080
ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140
ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200
GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260
GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320
GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380
ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440
GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500
GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560
AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 1620
CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680
TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740
ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800
TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860
GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920
GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962
INFORMATION FOR SEQ ID NO:16:
LENGTH: 654
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly
5 10 15
Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu
20 25 30
Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly
35 40 45
Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser
50 55 60
Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val
65 70 75
Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His
80 85 90
Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu
95 100 105
Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val
110 115 120
Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu
125 130 135
Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val
140 145 150
Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile
155 160 165
Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
170 175 180
Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp
185 190 195
Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr
200 205 210
Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala
215 220 225
Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240
Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys
245 250 255
Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270
Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala
275 280 285
Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300
Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315
Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser
320 325 330
Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345
Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly
350 355 360
Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro
365 370 375
Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu
380 385 390
Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
395 400 405
Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
410 415 420
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile
425 430 435
Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala
440 445 450
Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser
455 460 465
Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu
470 475 480
Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser
485 490 495
Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
500 505 510
Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser
515 520 525
Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
530 535 540
Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala
545 550 555
Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp
560 565 570
Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly
575 580 585
Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu 590 595 600
Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn
605 610 615
Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp
620 625 630
Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr
635 640 645
Glu Leu Thr Ala Lys Val Tyr Tyr Gly
650
INFORMATION FOR SEQ ID NO:17:
LENGTH: 25
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
TCTGAATTCG TTCTTTTCTG TATGG 25
INFORMATION FOR SEQ ID NO:18:
LENGTH: 20
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
TGTACTGCTG GATCCGGCAG 20
INFORMATION FOR SEQ ID NO:19:
LENGTH: 25
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AGAGGCATGC GTATCCATCA GATTTTTGAG 30
INFORMATION FOR SEQ ID NO:20:
LENGTH: 20
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AGTGAACGGA TACTTGGAAC 20
INFORMATION FOR SEQ ID NO:21:
LENGTH: 20
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GTTCCAAGTA TCCGTTCACT 20
INFORMATION FOR SEQ ID NO:22:
LENGTH: 12
TYPE: amino acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: peptide
SEQUENCE DESCRIPTION:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln
5 10
INFORMATION FOR SEQ ID NO:23:
LENGTH: 24
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
TCATGGATCC ACCCTCTCCT TTTA 24
INFORMATION FOR SEQ ID NO:24:
LENGTH: 26
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC 26
INFORMATION FOR SEQ ID NO:25:
LENGTH: 29
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GAGAGCTTTC AGCCCCTTCA TNNNNNNTCC GGCAGCCTGC GCAGACATG 29
INFORMATION FOR SEQ ID NO:26:
LENGTH: 27
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AGAGGGGGAT CCGTGAGAAG CAAAAAA 27
INFORMATION FOR SEQ ID NO:27:
LENGTH: 20
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GATGACTAGT AAGTCTCTAA 20
INFORMATION FOR SEQ ID NO:28:
LENGTH: 20
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
AAGCCTGAGG TTGTTGCTCC 20
INFORMATION FOR SEQ ID NO:29:
LENGTH: 29
TYPE: nucleic acid
STRANDEDNESS: single
TOPOLOGY: linear
MOLECULE TYPE: Other nucleic acid (synthetic DNA)
SEQUENCE DESCRIPTION:
GGGCATGCTC ATGAACTTCC AGGCTGTGA 29
프로테아제는 단백질의 펩티드 결합을 절단하는 효소로서, 동물, 식물, 미생물에서 수많은 효소가 발견되고 있다. 그 용도는 연구용 시약, 의약 외에 세제로의 첨가, 식품의 가공, 역반응을 이용한 화학 합성이라는 공업적 분야에 있어서도 산업상 매우 중요한 효소라고 할 수 있다. 공업적 분야에서 사용되는 프로테아제에는 물리적, 화학적으로 높은 안정성이 요구되고 있어, 특히 내열성의 효소가 사용되고 있다. 바실러스(Bacillus)속 세균이 생산하는 프로테아제는 비교적 높은 내열성을 나타내므로 현재 산업적으로 사용되고 있는 프로테아제의 주류를 차지하고 있다. 그러나, 더 뛰어난 효소가 요망되고 있으며 고온에서 생육하는 미생물, 예를 들어 호열성 바실러스속 세균이나 초호열균에서 효소를 취득하고자 하는 시도도 이루어지고 있다.
예를 들어, 초호열균의 하나인 피로코커스 퓨리오서스(Pyrococcus furiosus)가 프로테아제를 생산하는 것이 알려져 있다[Appl. Environ. Microbiol. 제56권, 제1992∼1998페이지(1990); FEMS Microbiol. Letters 제71권, 제17∼20페이지(1990); J. Gen. Microbiol. 제137권, 제1193∼1199페이지(1991)].
또한, 피로코커스 속에 속하는 초호열균, 피로코커스 종 KOD1주(Pyrococcus sp. strain KOD1)는 티올프로테아제(시스테인 프로테아제)를 생산하는 것이 보고된 바 있다[Appl. Environ. Microbiol., 제60권, 제4559∼4566페이지(1994)]. 마찬가지로 초호열균인 써모코커스(Thermococcus)속, 스타필로서머스(Staphylothermus) 속, 써모박테로이데스(Thermobacteroides)속의 세균에 관해서도 프로테아제의 생산이 알려져 있다(Appl. Microbiol. Biotechnol.) 제34권, 제715∼719페이지(1991).
상기한 바와 같은 초호열균 유래의 프로테아제는 높은 열안정성을 갖고 있어 현재 사용되고 있는 내열성 프로테아제를 대신하거나, 또는 지금까지는 프로테아제의 사용을 생각할 수 없었던 분야에서 이용되는 것이 기대되고 있다.
그러나, 이것들의 효소를 생산하는 미생물의 대부분은 고온 조건에서만 생육하는 것으로, 예를 들어 피로코커스 퓨리오서스의 경우에는 90∼100℃에서의 배양이 필요하다. 이와 같은 고온에서의 배양조작은 에너지 비용면에서 불리하다. 또한, 이것들의 초호열균의 프로테아제 생산성은 지금까지 사용되어 온 미생물 프로테아제에 비해서 낮다. 이와 같이 초호열균 유래의 프로테아제의 공업적인 제조방법은 문제를 갖고 있다.
한편, 목적하는 효소의 유전자를 단리시켜 배양이 용이한 숙주 미생물에 이것을 도입하여 유전자 공학적인 효소의 생산을 행하는 것은 현재 널리 행해지고 있다. 그러나, 숙주에게 도입된 효소의 유전자는 반드시 의도하였던 것과 같은 효율로 발현된다고는 할 수는 없다. 이것은 도입되는 유전자의 GC 함량이나 코돈의 사용 빈도가 숙주의 유전자의 것과 다른 것 등이 주된 원인이라고 생각되고 있다. 따라서, 그 사용 목적에 들어 맞는 효소 생산성을 얻기 위해서는 도입유전자, 숙주마다 발현 방법을 적정화하는 것이 필요하다.
본 발명의 목적은 상기의 과제를 해결하기 위해서 공업적인 사용에 유리한 초호열균의 프로테아제를 제공하는 것, 그 초호열균의 프로테아제를 코드하는 유전자를 단리하는 것, 및 그 유전자를 이용한 초내열성 프로테아제의 유전자 공학적 제조 방법을 제공하는 데 있다.
초호열균이 생산하는 프로테아제의 중에는, 그 아미노산 서열의 상동성으로부터 섭틸리신-타입이라고 하는 알칼리성 프로테아제로 분류될 수 있는 것이 있다. 이것들의 유전자를 예를 들어 유전공학적 생산에 범용되는 바실러스 섭틸리스(Bacillus subtilis)에 도입한 경우, 그 효소의 생산성은 바실러스 섭틸리스가 원래 생산하는 단백질에는 못 미친다.
본 발명자 등은 예의 연구의 결과, 발현시키고자 하는 초호열균 유래 프로테아제 유전자의 상류에 섭틸리신 유래의 시그널 펩티드(신호 서열)을 코드하는 유전자를 위치시키고, 또한 그 절단점 주변의 아미노산 서열을 변형시킴으로서 목적유전자가 바실러스 섭틸리스에서 고효율로 발현됨을 발견하였다. 또한, 목적하는 초호열균 유래 프로테아제 유전자중에서 효소활성의 발현에는 필수가 아닌 부분을 결실시킴에 의해서도 효소발현량이 증가됨을 밝혀내어 본 발명을 완성시킴에 이르렀다.
본 발명을 개략적으로 설명하면, 본 발명의 제 1의 발명은 서열표의 서열번호 1에 나타낸 아미노산 서열을 갖는 내열성 프로테아제, 및 서열표의 서열번호 1에 나타낸 아미노산 서열에 있어서 1 또는 수개의 아미노산이 결실, 치환, 삽입 또는 부가된 아미노산 서열을 가지며, 또 내열성 프로테아제 활성을 갖는 프로테아제이다.
또한, 본 발명의 제 2의 발명은 제 1의 발명의 내열성 프로테아제를 코드하는 유전자, 및 그 유전자에 하이브리다이즈하는 내열성 프로테아제 유전자이다.
본 발명의 제 3의 발명은 초호열균 유래의 내열성 프로테아제를 유전공학적으로 제조하기 위해서 사용되는 유전자로서 이는 식 Ⅰ:
SIG-Ala-Gly-Gly-Asn-PRO [Ⅰ]
[식중, SIG는 섭틸리신 유래의 시그널 펩티드의 아미노산 서열을, PRO는 발현시키고자 하는 단백질의 아미노산 서열을 각각 나타낸다]로 표시되는 아미노산 서열을 코드하는 것을 특징으로 한다. SIG는 바람직하게는 서열표의 서열번호 3에 나타낸 아미노산 서열이고, 또한 PRO는 바람직하게는 초호열균 유래의 내열성 프로테아제, 특히 바람직하게는 피로코커스 퓨리오서스 유래의 프로테아제의 아미노산 서열이다.
본 발명의 제 4의 발명은 단백질의 유전공학적인 제조 방법에 관한 것으로, 제 3의 발명의 유전자를 도입한 바실러스속 세균를 배양하여, 그 배양물로부터 목적하는 단백질을 수집하는 공정을 함유하는 것을 특징으로 한다.
본 발명의 제 5의 발명은 단백질를 유전공학적으로 제조하기 위해서 사용되는 플라스미드로 제 3의 발명의 유전자가 삽입되어 있는 것을 특징으로 한다.
본 발명에 의해 개시되는 프로테아제를 포함시켜 천연에 존재하는 단백질에는 그것을 코드하는 유전자의 다형이나 돌연변이의 것 외에, 생성후의 단백질의 생체내 및 정제중의 수식반응 등에 의해서 그 아미노산 서열 중에 1 또는 수개의 아미노산의 결실, 삽입, 부가, 치환 등의 돌연변이가 일어날 수 있지만, 그럼에도 불구하고 돌연변이 단백질은 돌연변이를 갖지 않는 단백질과 실질적으로 동등한 생리, 생물학적 활성을 나타내는 것으로 알려져 있다. 인위적으로 단백질의 아미노산 서열에 상기한 바와 같은 돌연변이를 도입한 경우도 동일하며, 이 경우에는 다종다양의 돌연변이체를 제작하는 것이 한층 가능하다. 예를 들어, 인간 인터류킨 2(IL-2)의 아미노산 서열 중의 어떤 시스테인 잔기를 세린으로 치환한 폴리펩티드가 인터류킨 2 활성을 유지하는 것이 알려져 있다[Science, 제224권, 1431페이지(1984)]. 이와 같이 본 발명에 개시된 아미노산 서열 중에 1 또는 수개의 아미노산의 결실, 삽입, 부가, 치환 등이 발생한 아미노산 서열을 가지며, 또 본 발명의 프로테아제와 동등한 활성을 갖는 프로테아제는 본 발명의 범위내에 속하는 것이다.
본 명세서에서의 「(특정 유전자와)하이브리다이즈하는 유전자」는, 특정 유전자와 유사한 염기서열을 갖는 유전자이다. 특정 유전자와 유사한 염기 서열을 갖는 유전자는 거기에 코드되어 있는 단백질의 아미노산 서열, 또는 그 단백질이 갖고 있는 기능도 유사할 가능성이 높다. 유전자의 염기서열의 유사성은 양 유전자 또는 그 일부끼리 긴축 조건에서 하이브리드를 형성하는(하이브리다이즈하는)지의 여부에 의해 조사할 수 있으며, 이것을 이용하여 특정 유전자가 코드하는 단백질과 동일한 기능을 갖는 단백질를 코드하는 유전자를 취득할 수 있다. 즉, 본 발명에 의해 얻어진 유전자, 또는 그 일부를 프로브에 이용하여 공지의 방법으로 하이브리다이제이션을 행함으로써 본 발명의 유전자와 유사의 염기서열을 갖는 유전자를 취득할 수 있다. 하이브리다이제이션은 예를 들어 1989년, Cold Spring Harbor Laboratory 발행, T. 마니아티스(T. Maniatis) 등 편집, Molecular Cloning: A Laboratory Manua1 2nd ed.에 기재된 방법에 의해 실시할 수 있다. 더욱 구체적으로는, 예를 들어 이하의 조건으로 하이브리다이제이션을 할 수 있다. 즉, DNA를 고정한 멤브레인을 0.5% SDS, 0.1% 소혈청알부민(BSA), 0.1% 폴리비닐필로리돈, 0.1% 피콜 400, 0.01% 변성연어정자 DNA를 포함하는 6×SSC(1×SSC는 0.15M NaCl, 0.015M 구연산나트륨, pH 7.0을 나타낸다)중에서, 50℃에서 12∼20시간, 프로브와 동시에 배양한다. 배양 종료후, 0.5% SDS를 포함하는 2×SSC중에서 37℃에서의 세정으로부터 시작하여 SSC 농도는 0.1× 까지의 범위로 낮추면서, 또 온도는 50℃까지의 범위로 올리면서 변화시켜 고정된 DNA 유래의 시그널이 백그라운드와 구별할 수 있게 될 때까지 멤브레인을 세정한다.
별법으로, 하이브리다이제이션을 대신하여 본 발명에 의해 얻어진 유전자의 염기서열의 일부를 프라이머에 이용하는 유전자증폭법, 예를 들어 PCR 법을 이용할 수도 있다. 이렇게 해서 얻어진 유전자가 목적하는 기능을 갖는 단백질을 코드하는 지의 여부는 얻어진 유전자를 적당한 숙주 및 발현계를 이용하여 발현시켜 얻어진 단백질의 활성을 조사함에 의해 알 수 있다.
본 발명은 공업용 효소로서 유용한 초내열성 프로테아제, 그것을 코드하는 유전자 및 그 효소의 유전자 공학적 제조방법에 관한 것이다.
도 1은 플라스미드 pSTC3의 제한효소 지도이다.
도 2는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 3은 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 4는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 5는 프로테아제 PFUS, 프로테아제 TCES 및 섭틸리신의 아미노산 서열을 비교하는 도면이다.
도 6은 플라스미드 pSNP1의 제한효소 지도이다.
도 7은 플라스미드 pPS1의 제한효소 지도이다.
도 8은 플라스미드 pNAPS1의 제한효소 지도이다.
본 발명에 따른 초내열성 프로테아제로서는 여러가지의 초호열균 유래의 프로테아제를 들 수 있다. 예를 들어, WO95/34645호 공보에는 피로코커스 퓨리오서스 (Thermococcus furiosus) 및 써모코커스 셀러(Thermococus celer) 유래의 프로테아제에 대하여 기재되어 있다.
피로코커스 퓨리오서스 DSM3638 유래의 프로테아제 유전자는 그 균주의 게놈 DNA 라이브러리로부터 내열성의 프로테아제 활성을 지표로 하여 단리되었다. 그 유전자를 함유하는 플라스미드는 플라스미드 pTPR12로 명명되며, 또한 그 플라스미드로 형질전환된 대장균 JM109는 대장균 JM109/pTPR12로 명명, 표시되어, 1994년 5월 24일(원기탁일) 부타페스트조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5103으로서 기탁되어 있다.
이후, 본 명세서에서는 이 프로테아제를 프로테아제 PFUL이라고 부른다. 프로테아제 PFUL은 높은 열안정성을 갖는 프로테아제로서 95℃에서도 프로테아제 활성을 나타낸다.
상기의 플라스미드 pTPR12에 삽입된 피로코커스 퓨리오서스 유래의 DNA 단편의 염기서열은 이미 결정되어 있다. 플라스미드 pTPR12의 삽입 DNA 단편중에서 2개의 DraI 부위에서 끼워진 약 4.8kb 부분의 염기서열을 서열표의 서열번호 5에 나타내었다. 또한, 그 염기서열로부터 추정되는 유전자 산물의 아미노산 서열을 서열표의 서열번호 6에 나타낸다. 즉, 서열표의 서열번호 6에 나타낸 아미노산 서열은 상기의 프로테아제 PFUL의 아미노산 서열이다. 그 서열에 나타내어지는 바와 같이 프로테아제 PFUL은 1398 아미노산 잔기로 이루어지며 분자량 15만을 넘는 고분자량의 프로테아제이다.
서열표의 서열번호 6에 나타낸 상기의 프로테아제 PFUL의 아미노산 서열을 이미 알고 있는 미생물 유래 프로테아제의 아미노산 서열과 비교함으로써 프로테아제 PFUL의 전반부분의 아미노산 서열과 섭틸리신로 대표되는 1군의 알칼리성 세린프로테아제[Protein Engineering, 제4권, 제719∼737페이지(1991)]와의 사이에 상동성이 존재하고, 특히 프로테아제의 촉매활성에 중요시되는 4개의 아미노산 잔기 주변에 매우 높은 상동성이 존재하고 있는 것을 판명하고 있다.
이와 같이 초호열균 피로코커스 퓨리오서스의 생산하는 프로테아제 PFUL의 아미노산 서열중에, 상온균 유래의 프로테아제와 공통하여 존재하는 영역이 보존되어 있는 것이 분명해져 피로코커스 퓨리오서스 이외의 초호열균이 생산하는 동종의 프로테아제에도 이 영역이 존재하고 있는 것을 기대할 수 있다.
예를 들어, 초내열성 프로테아제의 유전자는 프로테아제 PFUL의 아미노산 서열중에서 섭틸리신 등과 높은 상동성을 나타내는 영역을 코드하는 프로테아제 PFUL 유전자의 염기서열을 바탕으로 합성한 올리고뉴클레오티드 PRO-1F, PRO-2F, PRO-2R 및 PRO-4R을 조합하여 프라이머로 이용하여 각종 초호열균의 염색체 DNA를 주형으로 한 PCR을 행함으로써 스크리닝할 수가 있다.
서열표의 서열번호 7, 8, 9 및 10에 각각 올리고뉴클레오티드 PRO-1F, PRO-2F, PRO-2R 및 PRO-4R의 염기서열을 나타낸다.
본 발명에 관계되는 프로테아제의 유래하는 초호열균으로서는 피로코커스속, 써모코커스속, 스타필로서머스속, 써모박테로이데스속 등에 속하는 세균을 사용할 수 있으며, 써모코커스속에 속하는 세균으로서는, 예를 들어 써모코커스·셀러(Thermococcus celer) DSM2476을 사용할 수 있고, 그 균주는 도이체 잠룽 폰 미크로오르가니스만 운트 쩨르쿠르츄렌 GmbH으로부터 입수가능한 균주이다. 써모코커스·셀러 DSM2476의 염색체 DNA를 주형으로 하여 상기의 올리고뉴클레오티드 PRO-1F와 PRO-2R의 조합, 또는 PRO-2F와 PRO-4R의 조합을 프라이머로서 이용하여 PCR를 행한 경우에는 특이적인 DNA 단편의 증폭이 확인되어 프로테아제 유전자의 존재를 알 수 있다. 또한, 이것들의 DNA 단편을 적당한 플라스미드 벡터에 삽입한 재조합 플라스미드를 제작한 후, 삽입 DNA 단편의 염기서열을 디데옥시법으로 조사함으로써 그 단편에 의해 코드되는 아미노산 서열을 추정할 수 있다. 그 결과, 이 DNA 단편은 프로테아제 PFUL, 및 각종 미생물 유래의 알칼리성 세린 프로테아제의 아미노산 서열과 상동성이 있는 아미노산 서열을 코드하고, 상기의 PCR 증폭 DNA 단편은 프로테아제 유전자를 주형으로 하여 증폭된 것임이 분명해졌다.
다음에, 초내열성 프로테아제 유전자, 예를 들어 써모코커스 셀러가 생산하는 초내열성 프로테아제의 유전자는 상기의 올리고뉴클레오티드, 또는 상기의 PCR에 의해 얻어진 증폭 DNA 단편을 프로브로서 이용하여 초호열균으로부터의 유전자 라이브러리를 스크리닝함으로써 얻을 수 있다.
예를 들어, 목적하는 유전자를 포함하는 파지 클론은 상기의 PCR에 의해 얻어진 증폭 DNA 단편을 프로브로서 이용한 라이브러리에 대해서 플래크 하이브리다이제이션을 행하여 얻을 수 있다.
그러한 라이브러리는 써모코커스 셀러 DSM2476의 염색체 DNA를 제한효소 Sau3AI로 부분소화하여 얻어진 DNA 단편과, 람다 GEM-11 벡터(프로메가사 제품)를 라이게이션한 후, 인 비트로 팩케이징법에 의해서 람다 파지 입자 중에 팩케이징함으로써 얻어진다.
이렇게 하여 얻어진 파지 클론에 함유되는 DNA 단편을 해석한 결과, 약 1.9kb의 SacI 단편에 프로테아제 유전자가 존재하는 것으로 밝혀졌고, 또한 그 염기서열을 조사함으로써 이 단편은 프로테아제 유전자의 5'측 영역이 결여된 것으로 밝혀졌다.
이 5'측 영역은 카셋트, 및 카셋트 프라이머를 이용하는 PCR을 사용하여 취득할 수 있다(타카라슈조 유전자공학 제품 가이드, 1994-1995년판, 제250∼251페이지). 이렇게 해서 플라스미드 pTCS6에 결여된 초내열성 프로테아제 유전자의 5'측 영역을 커버하는 DNA 단편을 얻을 수 있으며, 또한 써모코커스 셀러 유래의 초내열성 프로테아제 유전자 전장의 염기서열을 이 두 DNA 단편의 염기서열로부터 결정할 수 있다.
결정된 염기서열 중에 존재하는 개방 해독 프레임의 염기서열을 서열표의 서열번호 11에, 또한 그 염기서열로부터 추정되는 아미노산 서열을 서열표의 서열번호 12에 각각 나타낸다.
써모코커스 셀러 유래의 초내열성 프로테아제를 코드하는 유전자의 염기 서열 및 아미노산 서열을 결정하였다. 이 프로테아제는 프로테아제 TCES로 명명되었다.
상기 2개의 DNA 단편을 조합함으로써 프로테아제 TCES 유전자의 전장을 재구성한 발현 플라스미드를 구축할 수가 있지만, 대장균을 숙주로 한 경우에는 목적하는 발현 플라스미드가 도입된 형질전환체는 얻어지지 않았다. 이것은 균체내에 그 유전자의 발현산물이 생성되는 것이 대장균에 유해하거나, 또는 치사적으로 되는 것이 원인이라고 예상된다. 이러한 경우에는, 예를 들어 바실러스 섭틸리스를 숙주로 하여 프로테아제를 세포 외에 분비발현시켜 그 활성을 확인하는 것을 고려할 수 있다.
바실러스 섭틸리스로서는 바실러스 섭틸리스 DB104를 사용할 수 있고, 이 균주는 Gene 제83권, 제215∼233페이지(1989)에 기재된 공지의 균주이다. 클로닝벡터로서는 플라스미드 pUB18-P43을 사용할 수 있고, 그 플라스미드는 Calgary 대학, 수이-람 웡(Sui-Lam Wong)박사로부터 혜여(惠與)된 플라스미드이다. 또한, 그 플라스미드는 선별 마커로서 가나마이신 내성 유전자를 포함하고 있다.
플라스미드 벡터 pUB18-P43의 P43 프로모터 하류에 프로테아제 TCES 유전자가 삽입된 재조합 플라스미드는 플라스미드 pSTC3으로 명명되어 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSTC3으로 명명, 표시되어 1995년 12월 1일(원기탁일) 부타페스트조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5635로서 기탁되어 있다.
도 1에 플라스미드 pSTC3의 제한효소지도를 나타낸다. 도 중에서 굵은 실선이 플라스미드 벡터 pUB18-P43으로의 삽입 DNA 단편이다.
상기의 Bacillus subtilis DB104/pSTC3을 배양하여 배양 상층액, 및 균체추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성을 확인할 수 있다.
그 형질전환체 배양물로부터 얻어지는 프로테아제의 조효소 표품의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠말린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메칠쿠말린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
37∼95℃에서 효소활성을 나타내며, 그 적정온도는 70∼80℃이다.
(3) 적정 pH:
pH 5.5∼9 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 7∼8이다.
(4) 열안정성:
80℃, 3시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
프로테아제 PFUL, 프로테아제 TCES 및 섭틸리신[섭틸리신 BPN', Nucl. Acids Res. 제11권, 제7911∼7925페이지(1983)]의 아미노산 서열을 도 2∼도 5에 나타낸 바와 같이 상동성이 있는 영역이 일치하도록 나열해 보면, 프로테아제 PFUL에는 그 C 말단측 뿐만아니라, 상동성이 있는 영역의 사이에도 프로테아제 TCES 및 섭틸리신에는 확인되지 않은 서열이 존재하는 것을 알 수 있다. 이러한 결과로부터, 피로코커스 퓨리오서스에는 프로테아제 PFUL 이외에, 그것보다도 분자량이 작은 프로테아제 TCES 또는 섭틸리신과 같은 프로테아제가 존재할 가능성도 있다.
그래서 상기의 상동성을 갖는 영역에 유래하는 DNA 프로브를 사용하고 피로코커스 퓨리오서스로부터 조제한 염색체 DNA를 타킷으로 하여 서던 하이브리다이제이션을 행하면, 프로테아제 PFUL의 유전자 이외에도 시그널이 관찰되었고 또한 다른 1종의 프로테아제 유전자의 존재가 분명해졌다.
이 신규한 프로테아제 유전자는 이하와 같은 조작에 의해서 단리할 수 있다.
예를 들어, 신규한 프로테아제를 코드하는 유전자를 포함하는 DNA 단편은 피로코커스 퓨리오서스의 염색체 DNA를 적당한 제한효소로 소화시킨 후, 이것을 타킷으로 하여 상기의 것과 같은 서던 하이브리다이제이션에 의해서 취득한다. 그 DNA 단편의 염기서열을 조사하여 이 염기 서열이 상기의 프로테아제와 상동성을 갖는 아미노산 서열을 코드하는 것인지의 여부를 확인한다. 그 DNA 단편이 목적하는 유전자의 전장을 포함하고 있지 않은 경우에는 역 PCR 법 등에 따라 부족한 부분을 추가로 얻는다.
예를 들어, 피로코커스 퓨리오서스의 염색체 DNA를 제한효소 SacI 및 SpeI(타카라 슈조사 제품)으로 소화시키고 이것을 이용하여 서던 하이브리다이제이션을 한 경우에는 약 0.6 kb의 사이즈의 시그널이 확인된다. 이 사이즈의 DNA 단편을 회수하여 이것을 플라스미드 벡터 pBluescriptSK(-)(스트라타진사 제품)의 SpeI-SacI 부위 사이에 삽입하여 얻어지는 재조합 플라스미드로 대장균 JM109를 형질전환시킨다. 이 형질전환체으로부터 상기의 서던 하이브리다이제이션에 사용한 것과 동일한 프로브를 이용한 콜로니 하이브리다이제이션에 의해서 목적하는 단편이 들어있는 클론을 취득할 수 있다. 얻어진 클론에 함유된 플라스미드가 프로테아제를 코드하는 서열을 갖는 지의 여부는 플라스미드의 삽입 DNA 단편의 염기서열을 조사함으로써 확인할 수 있다. 이렇게 하여 프로테아제 유전자의 존재가 확인된 플라스미드는 플라스미드 pSS3으로 명명하였다.
플라스미드 pSS3에 삽입된 DNA 단편의 염기서열로부터 추정되는 아미노산 서열은 섭틸리신, 프로테아제 PFUL, 프로테아제 TCES 등의 서열과 상동성이 있는 것으로 밝혀졌다. 이렇게 해서 피로코커스 퓨리오서스로부터 새롭게 그 일부가 얻어진 프로테아제 PFUL 유전자와는 다른 프로테아제 유전자의 산물은 프로테아제 PFUS로 명명되어 있다. 그 프로테아제의 N 말단측을 코드하는 영역, 및 C 말단측을 코드하는 영역은 역 PCR 법에 의해서 얻을 수 있다.
역 PCR에 사용하는 프라이머는 상기의 플라스미드 pSS3에 포함되는 삽입 DNA 단편의 염기서열을 바탕으로 제작할 수가 있다. 다음으로 피로코커스 퓨리오서스의 염색체 DNA를 적당한 제한효소로 소화시킨 후, 발생된 DNA 단편에 대해서 분자내 라이게이션 반응을 행한다. 이 반응액을 주형으로 하여 상기의 프라이머를 이용한 PCR을 행하여 플라스미드 pSS3에 포함되는 프로테아제 유전자의 단편에 인접한 영역의 DNA 단편을 취득할 수 있다. 이렇게 해서 얻어진 DNA 단편의 염기서열을 해석함으로써 그 영역에 코드되어 있는 효소 단백질의 아미노산 서열을 추정한다. 또, 피로코커스 퓨리오서스의 염색체 DNA를 사용하여 주형 프로테아제 PFUS 유전자의 전장을 증폭하는 것이 가능한 프라이머를 제작할 수 있다.
프로테아제 PFUS의 개시코돈의 직전 염기서열을 가지며 그 5'측에 BamHI 부위가 도입될 수 있는 프라이머 NPF-4, 및 프로테아제 PFUS 유전자의 3'측 부분에 상보적인 서열을 가져서 그 5'측에 SphI 부위를 도입할 수 있는 프라이머 NPR-4를 설정할 수 있다.
상기의 프라이머 NPF-4 및 NPR-4의 염기서열을 서열표의 서열번호 13 및 14에 나타낸다. 이 2종의 프라이머를 이용하여 피로코커스 퓨리오서스의 염색체 DNA를 주형 프로테아제 PFUS 유전자의 전장을 증폭할 수가 있다.
프로테아제 TCES의 경우와 동일하게 프로테아제 PFUS를 바실러스 섭틸리스를 숙주로 하여 발현시킬 수 있다. 프로테아제 PFUS를 발현시키기 위한 플라스미드는 프로테아제 TCES의 발현 플라스미드 pSTC3을 바탕으로 하여 구축할 수 있다. 즉, 상기의 프라이머를 이용한 PCR에 의해서 증폭되는 프로테아제 PFUS 유전자 전장을 포함하는 DNA 단편을 플라스미드 pSTC3상의 프로테아제 TCES 유전자와 치환함으로써 프로테아제 PFUS의 발현을 위한 플라스미드를 구축할 수 있다. 이렇게 하여 구축된 발현 플라스미드는 플라스미드 pSNPl로 명명되며 또한, 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSNP1로 명명, 표시되어, 1995년 12월 1일(원기탁일) 부타페스트 조약하에 일본국 이바라끼껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-5634로서 기탁되어 있다. 도 6에 플라스미드 pSNP1의 제한효소 지도를 나타낸다.
프로테아제 PFUS를 코드하는 유전자의 개방 해독 프레임 부분의 염기서열을 서열표의 서열번호 15에, 또한 그 염기서열로부터 추정되는 프로테아제 PFUS의 아미노산 서열을 서열표의 서열번호 16에 나타냈다.
상기의 바실러스 섭틸리스 DB104/pSNP1을 배양하여 배양 상층액, 및 균체추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성이 확인된다. 즉, 발현된 프로테아제 PFUS의 일부는 배양 상층액중에 분비되어 있다.
그 형질전환체의 배양물로부터 얻어지는 프로테아제의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠마린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메틸쿠마린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
40∼110℃에서 효소활성을 나타내며, 적정 온도는 80∼95℃이다.
(3) 적정 pH:
pH 5∼10 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 6∼8이다.
(4) 열안정성:
95℃, 8시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
(5) pH 안정성:
pH 5∼11, 95℃, 60분간의 처리후에도 95% 이상의 활성을 유지하고 있다.
(6) 분자량:
SDS-PAGE상에서 약 45kDa의 분자량을 나타낸다.
프로테아제 TCES 유전자 및 프로테아제 PFUS 유전자의 경우와 동일한 방법에 의해 이것들의 유전자에게 상동성을 갖는 프로테아제 유전자를 피로코커스 퓨리오서스, 써모코커스 셀러 이외의 초호열균으로부터 취득할 수 있다.
서열표의 서열번호 6에 나타낸 프로테아제 PFUL의 아미노산 서열의 323번째의 잔기로부터 650번째의 잔기까지의 서열을 코드하는 약 1kb의 DNA 단편을 조제하여, 이것을 프로브로서 스타필로서머스 마리너스(Staphylothermus marinus) DSM3639 및 써모박테로이데스 프로테올리티커스(Thermobacteroides proteoliticus) DSM5265의 염색체 DNA를 이용한 게놈의 서던 하이브리다이제이션을 행할 수 있다. 그 결과, PstI(타카라 슈조사 제품)로 소화한 스타필로서머스 마리너스의 염색체 DNA를 이용한 경우에는 약 4.8kb의 위치에, 또한 XbaI로 소화한 써모박테로이데스 프로테올리티커스의 염색체 DNA에서는 약 3.5kb의 위치에 시그널들이 확인된다.
이 결과로부터 스타필로서머스 마리너스 및 써모박테로이데스 프로테올리티커스의 염색체 DNA에도 프로테아제 PFUL, 프로테아제 PFUS, 및 프로테아제 TCES 등의 유전자와 상동성이 있는 서열이 존재하는 것이 분명해졌다. 이렇게 해서 검출된 DNA 단편으로부터 프로테아제 TCES 및 프로테아제 PFUS를 코드하는 유전자를 단리, 동정(同定)했을 때와 동일한 방법을 이용함으로써 스타필로서머스 마리너스 및 서머박테로이데스 프로테올리티커스에 존재하는 초내열성 프로테아제를 코드하는 유전자를 단리, 동정할 수 있다.
일반적으로 유전공학적인 수법으로 단백질 대량으로 조제하고자 하는 경우에는 목적하는 단백질을 코드하는 유전자 자신이 갖추고 있는 프로모터가 아닌 숙주에 있어서 효과적으로 작용하는 프로모터를 사용하는 것이 유리하다고 생각된다. 이 점에서 프로테아제 TCES, PFUS의 발현계 구축에서 사용된 P43 프로모터는 바실러스 섭틸리스 유래의 프로모터이지만, 이들 2종의 프로테아제의 발현에는 충분한 효과를 나타내지 않았다.
그래서 한층 발현량을 향상시키기 위해서는 바실러스 섭틸리스로 높게 발현되는 유전자, 특히 분비 단백질의 유전자를 이용할 수 있다. 이러한 유전자로서는, α-아밀라아제나 여러 균체외 프로테아제의 유전자 등을 사용할 수 있어 예를 들어 섭틸리신의 프로모터와 시그널 펩티드-암호화 영역을 이용하여 프로테아제 PFUS의 발현량을 증가시키는 것이 기대된다.
즉, 프로모터영역을 포함하는 섭틸리신 유전자의 시그널 펩티드를 코드하는 영역의 뒤에 프로테아제 PFUS 유전자 전장을 양 유전자의 번역 프레임이 일치하도록 연결함으로써 섭틸리신 유전자의 프로모터 1의 제어하에 융합단백으로서 프로테아제 PFUS를 발현시킬 수 있다.
본 발명에 사용되는 섭틸리신 유전자로서는, 예를 들어 섭틸리신 E를 코드하는 유전자를 사용할 수 있다. J. Bacteriol. 제171권, 제2657∼2665페이지(1989)에 기재되어 있는 플라스미드 pKWZ에 삽입되어 있는 섭틸리신 E의 프로모터와 시그널 펩티드-코딩 영역을 사용할 수 있다. 그 유전자의 염기 서열은 프로모터 서열을 포함하는 5'상류 영역에 대하여 상기의 문헌에, 또한 섭틸리신를 코드하는 영역에 대해서는 J. Bacteriol. 제158권, 제411∼418페이지(1984)에 각각 기재되어 있다.
이들 서열을 바탕으로, 그 유전자의 프로모터 서열 상류에 EcoRI 부위를 도입하기 위한 프라이머 SUB4와, 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 뒤에 BamHI 부위를 도입하기 위한 프라이머 BmR1를 각각 합성한다. 서열표의 서열번호 17 및 18에 각각 프라이머 SUB4, BmR1의 염기서열을 나타내었다. 프라이머 SUB4, BmR1을 이용하여 플라스미드 pKWZ를 주형으로 한 PCR에 의해 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역을 포함하는 약 0.3kb의 DNA 단편을 증폭시킬 수 있다.
그 DNA 단편의 하류에 위치되는 프로테아제 PFUS 유전자는 PCR 법에 의해서 피로코커스 퓨리오서스의 염색체 DNA로부터 취득할 수 있다. 그 유전자의 5'측에 하이브리다이즈하는 프라이머로서는 상기의 프라이머 NPF-4를 사용할 수 있다. 또한, 유전자의 3' 측에 하이브리다이즈하는 프라이머에는 그 유전자의 종지코돈 하류의 염기서열로부터 설계되며 또한 SphI 부위를 갖는 프라이머 NPM-1을 사용할 수 있다. 서열표의 서열번호 19에 프라이머 NPM-1의 서열을 나타냈다.
한편, BamHI 부위를 이용하여 프로테아제 PFUS 유전자를 상기의 0.3kb DNA 단편에 연결하는 경우에는 그 유전자중에 1개소 존재하는 BamHI 부위가 조작하는데 지장이 된다. 이 BamHI 부위를 PCR-변이도입(mutagenesis)법에 의해 제거하기 위한 프라이머 mutRR, mutFR은 서열표의 서열번호 15에 나타낸 바의 프로테아제 PFUS 유전자의 염기 서열을 바탕으로 제작할 수 있다.
프라이머 mutRR, mutFR의 염기서열을 각각 서열표의 서열번호 20, 21에 나타낸다. 또, 이것들의 프라이머를 이용하여 BamHI 부위를 제거한 경우에는 그 부위에 도입되는 염기치환으로 인하여 이 부위에 의해 암호화되는 아미노산 잔기, 즉 서열표의 서열번호 16에 나타낸 바의 프로테아제 PFUS의 아미노산 서열중에서 560번째로 존재하는 글리신이 발린으로 치환된다.
이들 프라이머를 사용함으로써 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역에 연결하기 위한 프로테아제 PFUS 유전자를 얻을 수 있다. 즉, 피로코커스 퓨리오서스의 염색체 DNA를 주형으로 하여 프라이머 mutRR과 NPF-4, 및 프라이머 mutFR과 NPM-1의 2가지의 프라이머쌍를 사용하는 2종류의 PCR를 행한다. 또한 각각의 PCR에서 증폭된 DNA 단편을 혼합하여 형성되는 헤테로 듀플렉스(heteroduplex)를 주형으로 하고, 프라이머 NPF-4 및 NPM-1을 이용하여 2회째의 PCR을 행한다. 이렇게 하여 그 내부에 BamHI 부위를 포함하지 않는 약 2.4 kb의 프로테아제 PFUS 유전자 전장을 증폭할 수 있다.
상기의 PCR 증폭 DNA 단편을 BamHI, SphI로 소화하여 얻어지는 약 2.4kb의 DNA 단편을 단리, 상기 플라스미드 pSNP1 중의 프로테아제 PFUS 유전자를 포함하는 BamHI-SphI 단편과 바꿔 놓는다. 이렇게 하여 구축된 발현 플라스미드는 플라스미드 pPS1로 명명되고 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pPS1로 명명되어 있다. 그 형질전환체를 배양한 경우, 배양 상층액, 및 균체 추출물의 양쪽에 플라스미드 pSNP1을 사용한 경우와 동일한 프로테아제 활성이 발견되어 상기의 아미노산 치환이 효소 활성에 영향을 주지 않음이 확인된다. 도 7에 플라스미드 pPS1의 제한효소 지도를 나타냈다.
상기의 섭틸리신 E 유전자의 프로모터 및 시그널 펩티드를 코드하는 영역을 포함하는 약 0.3kb의 DNA 단편을 EcoRI, BamHI로 소화하여 상기 플라스미드 pPS1 중의 P43 프로모터와 리보솜 결합부위 서열을 포함하는 EcoRI-BamHI 단편과 바꿔 놓는다. 이렇게 하여 구축된 발현 플라스미드는 pNAPS1로 명명되어 그 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pNAPS1로 명명되었다. 그 형질전환체를 배양하여 배양 상층액 및 균체 추출물에 대하여 프로테아제 활성을 조사하면, 모두에서 내열성의 프로테아제 활성이 확인되고, 그 발현량은 바실러스 섭틸리스 DB104/pSNP1에 비하여 증가하고 있다. 도 8에 플라스미드 pNAPS1의 제한효소 지도를 나타냈다.
이 형질전환체로부터 발현되는 프로테아제는 상기의 바실러스 섭틸리스 DB104/pSNP1에 의해 발현되는 프로테아제의 것과 동등한 효소화학적 성질을 나타낸다. 또한, 그 형질전환체에 의해 발현되는 프로테아제를 정제하여, 그 N-말단아미노산 서열을 해석한 바, 서열표의 서열번호 22에 나타낸 아미노산 서열이 얻어졌다. 그 서열은 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째∼144번째의 서열과 일치하고 있어 성숙형의 프로테아제 PFUS는 이 부분 이후의 폴리펩티드로 이루어지는 효소임을 나타낸다. 이 결과로부터 추측되는 성숙형의 프로테아제 PFUS의 아미노산 서열을 서열표의 서열번호 4에 나타낸다.
바실러스 섭틸리스 DB104/pNAPS1이 생산하는 프로테아제의 양은 바실러스 섭틸리스 DB104/pSNP1(FERM BP-5634)과 비교하여 증가하고 있지만, 더욱 생산량을 올리는 것이 요망된다. pNAPS1에는 섭틸리신의 시그널 펩티드와 프로테아제 PFUS의 융합 펩티드가 코드되어 있지만, 이 연결 부분을 변형하여 시그널 펩티드의 제거가 효율적으로 일어나도록 함으로써 프로테아제의 발현량이 증가될 것이 기대된다. 상기의 플라스미드 pNAPS1에서는 서열표의 서열번호 3에 나타낸 섭틸리신 E의 시그널 펩티드의 C-말단 아미노산(Ala)과 프로테아제 PFUS의 N-말단 아미노산(Met)과의 사이에는 Ala-Gly-Ser의 3 아미노산 잔기로 이루어지는 펩티드가 삽입되어 있다. 플라스미드 pNAPS1상의 이 펩티드를 코드하는 부분의 DNA에 돌연변이를 도입하여 얻어지는 돌연변이 플라스미드를 도입한 형질전환체에 대해서 프로테아제 생산능을 조사함으로써 프로테아제 발현량이 향상된 형질전환체를 얻을 수 있다.
우선, 플라스미드 pNAPS1 상의 섭틸리신 E-프로테아제 PFUS의 융합 단백질을 코드하는 유전자에 대하여 상기의 3 아미노산 펩티드 중의 Ser을 코드하는 부분을 임의의 2 아미노산을 코드하는 염기서열로 변형한 돌연변이 플라스미드를 조제한다. 이러한 돌연변이 플라스미드는 PCR을 이용하여 제작할 수가 있다. 예를들면 상기의 Ser을 코드하는 코돈(TCC) 부분을 임의의 6 염기로 치환한 서열을 갖는 프라이머 SPOF0 및 SPOR0(서열표의 서열번호 24 및 25에 각각 프라이머 SPOF0 및 SPOR0의 염기서열을 나타낸다)와, 이 전후 영역의 염기서열로부터 제작한 프라이머 SUB3 및 NPR-10(서열표의 서열번호 26 및 27에 각각 프라이머 SUB3 및 NPR-10의 염기서열을 나타낸다)을 사용한 PCR을 행함으로써 상기의 Ser을 코드하는 코돈(TCC) 부분에 목적하는 돌연변이가 도입된 DNA 단편을 얻을 수 있다. 이 단편을 플라스미드 pNAPS1 상의 대응하는 영역과 바꿔 놓음으로써 돌연변이가 도입된 프로테아제 유전자를 함유하는 돌연변이 플라스미드를 얻을 수 있다.
이어서 이렇게 해서 얻어진 돌연변이플라스미드를 적당한 숙주, 예를 들어 바실러스 섭틸리스 DB104에 도입하여 얻어지는 형질전환체에 대해서 프로테아제 발현량을 조사함으로써 발현량이 증가된 형질전환체를 취득할 수 있다. 프로테아제 발현량의 확인은 단리된 형질전환체를 개별로 배양하여 그 배양물 중의 활성을 조사함에 의해 행할 수 있지만, 별법으로 기질을 함유하는 한천 플레이트를 배양에 이용함으로써 발현량이 상승한 형질전환체를 용이하게 선택하는 것도 가능하다.
즉, 상기의 돌연변이 플라스미드가 도입된 형질전환체를 탈지유를 포함하는 한천 플레이트 상에 생육시킨 후, 이 플레이트를 프로테아제 PFUS가 그 활성을 나타내는 온도, 예를들면 70℃에서 보온시킨다. 프로테아제를 발현하는 형질전환체로서는 그 콜로니 주변의 탈지유가 분해되어 투명해진다. 투명 영역의 크기로부터 프로테아제의 발현량을 추측할 수 있다.
이렇게 해서 얻어진 바실러스 섭틸리스 DB104/pNAPS1과 비교하여 프로테아제 활성을 높게 발현하는 형질전환체의 하나는 바실러스 섭틸리스 DB104/pSPO124로 명명되어 있다. 그 형질전환체에 함유되는 플라스미드(이 플라스미드는 pSPO124로 명명되어 있다)를 조제하여 그 염기서열을 해석한 결과, 상기의 Ser을 코드하는 부분은 염기서열 GGGAAT로 돌연변이되어 있고, 따라서 Ser이 Gly-Asn로 돌연변이된 단백질이 코드되어 있는 것이 분명해졌다.
이렇게 하여 섭틸리신의 시그널 펩티드의 뒤에 Ala-Gly-Gly-Asn인 4 아미노산으로 이루어지는 펩티드를 배치한 후에 이를 목적하는 단백질의 N-말단에 융합시켜 발현시킴으로써 바실러스속 세균을 숙주로 하여 그 발현량을 증가시키는 것이 가능함이 분명해졌다. 바실러스속 세균이 생산하는 섭틸리신에는 본 발명에서 사용한 섭틸리신 E(Bacillus subtilis 유래)의 것 외에 바실러스 아밀로리퀘파시엔스 (Bacillus amyloliquefacience) 유래의 섭틸리신 BPN' (Nucl. Acids Res., 제11권, 제7911∼7925페이지(1983)), 바실러스 리케니포르미스 (Bacillus licheniformis) 유래의 섭틸리신 Carlsberg (Nucl. Acids Res., 제13권, 제8913∼8926페이지(1985)) 등이 알려져 있고, 그 아미노산 서열에는 약간의 상이점이 있지만 이것들의 시그널 펩티드도 본 발명에 적합하게 사용할 수 있다. 본 발명에서는 발현을 제어하기 위한 프로모터로서, 섭틸리신 E 유래의 프로모터가 사용되었지만, 이를 대신하여 바실러스속 세균으로 작용하는 여러 프로모터를 사용하는 것이 가능하다.
또한, 발현시키는 단백질에 대해서도 아무런 제한은 없고, 단백질의 유전자가 입수가능한 것이라면 본 발명을 적용하여 유전공학적으로 높게 발현시키는 것이 가능하다. 본 발명의 숙주 이외의 생물에 유래하는 단백질의 발현에 이용가능한 것은, 바실러스속 세균과 분류학상의 위치를 달리하는 피로코커스 퓨리오서스 유래의 단백질이 높은 수준으로 발현되는 것으로부터도 분명하다. 본 발명은 특히 상기의 프로테아제 PFUS와 구조적으로 유사한 프로테아제 PFUL, 프로테아제 TCES나 스타필로서머스 마리너스, 서머박테로이데스 프로테올리티커스 유래의 프로테아제의 유전공학적생산에 적합이다.
이와 같은 섭틸리신과의 상동성에 기초하여, 프로테아제 PFUS는 시그널 펩티드와 프로펩티드를 갖는 전구체 단백질로서 발현되어, 그 후 프로세싱되어 성숙형 효소가 되는 것으로 생각되고 있다. 또한, 상기의 프로테아제 PFUS 성숙형 효소의 N-말단 아미노산 서열 해석의 결과로부터 성숙형 효소는 서열표의 서열번호 4에 나타낸 아미노산 서열로 이루어지는 효소라고 예상된다. 그러나, 정제된 성숙형 프로테아제 PFUS의 분자량은 약 45kDa로서, 이 아미노산 서열로부터 계산된 것에 비해서 작다. 이것은 전구체로서 발현된 프로테아제 PFUS가 그 C-말단측의 펩티드도 프로세싱되어 성숙형 프로테아제로 전환됨을 시사한다.
이 프로세싱에 의해서 제거되는 C-말단측 펩티드가 효소활성, 및 효소 단백질의 바른 구조로의 폴딩에 필수적인 것이 아니라면, 유전자상의 이 부분을 코드하는 영역을 결실시켜 발현시킴에 의해서도 프로테아제 PFUS의 발현량의 증가가 기대된다.
상기의 바실러스 섭틸리스 DB104/pNAPS1로부터 얻어지는 성숙형 프로테아제 PFUS에 대해서 예를 들어 질량분석장치를 이용하여 그 분자량을 정밀하게 측정할 수 있다. 이 분자량과 앞서 분명해진 성숙형 프로테아제 PFUS의 N-말단 아미노산 서열로부터 그 프로테아제가 서열표의 서열번호 15에 나타낸 아미노산 서열의 133번째의 Ala부터 552번째의 Thr까지 대응하는 폴리펩티드인 것을 알 수 있다. 또한 상기의 플라스미드 pNAPS1에 포함되는 프로테아제 PFUS 유전자의 552번째의 Thr을 코드하는 부위의 근방에 종지코돈을 도입함으로써 효소 활성에는 불필요한 폴리펩티드를 결실시킨 프로테아제 PFUS를 발현하는 플라스미드를 구축할 수 있다.
즉, 원하는 종지코돈이 도입된 염기서열을 갖는 DNA 단편은 플라스미드 pNAPS1 상의 프로테아제 PFUS 유전자 중에서 그 개시코돈으로부터 544번째의 아미노산(Ser)을 코드하는 코돈의 C-말단측에 종지코돈(TGA)을 도입할 수가 있는 프라이머 NPR544(서열표의 서열번호 28에 프라이머 NPR544의 염기서열을 나타낸다)와, 상기 유전자 상의 NspV 부위의 상류영역의 염기서열을 갖는 프라이머 NPFE81(서열표의 서열번호 29에 프라이머 NPFE81의 염기서열을 나타낸다)를 사용한 PCR에 의해 을 얻을 수 있다. 이어서 이 단편을 플라스미드 pNAPS1상의 대응하는 영역과 바꿔 놓음으로써 원하는 돌연변이가 도입된 프로테아제 유전자를 함유하는 돌연변이 플라스미드를 얻을 수 있다. 이 플라스미드는 플라스미드 pNAPS△C로 명명되고, 또한 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pNAPS△C로 명명하였다. 이 형질전환체는 프로테아제 PFUS와 동등한 성질을 갖는 프로테아제 활성을 발현하며 그 발현량은 바실러스 DB104/pNAPS1에 비해서 높다.
이렇게 해서 플라스미드 pNAPS△C에 함유되는 프로테아제 PFUS 유전자가, 그 효소의 활성 발현에 충분한 영역을 갖고 있음이 분명해졌다. 이 플라스미드에 존재하는 프로테아제 PFUS를 코드하는 영역의 염기서열을 서열표의 서열번호 2에 나타낸다. 또한, 이 염기서열에 코드되는 아미노산 서열을 서열표의 서열번호 1에 나타낸다.
또한, 상기의 플라스미드 pSPO124의 프로테아제 PFUS 유전자에 플라스미드 pNAPS△C와 동일한 돌연변이를 도입하여, C-말단측 펩티드를 결실시킨 프로테아제 PFUS를 발현시킬 수 있다.
즉, 상기의 플라스미드 pNAPS△C를 NspV와 SphI로 소화하여 얻어지는 약 13kb의 DNA 단편을 미리 NspV와 SphI로 소화한 플라스미드 pSPO124와 혼합하여 라이게이션을 행함으로써 목적하는 플라스미드를 구축할 수 있다. 이 플라스미드는 플라스미드 pSPO124△Cfh 명명되고, 또한 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104는 바실러스 섭틸리스 DB104/pSPO124△C로 명명, 표시되어 1997년 5월 16일(원기탁일) 부타베스트조약하에 일본국 이바라키껭 쯔꾸바시 히가시 1쵸메 1반 3고 소재의 통산성 공업기술원 생명공학공업기술연구소에 수탁번호 FERM BP-6294로 기탁되어 있다. 그 형질전환체는 바실러스 DB104/pNAPS1에 비해서 프로테아제의 발현량이 향상되어 있다.
상기의 형질전환체, 바실러스 섭틸리스 DB104/pNAPS△C 및 바실러스 섭틸리스 DB104/pSPO124△C가 생산하는 프로테아제의 효소학적, 이화학적 성질은 바실러스 섭틸리스 DB104/pSNP1이 생산하는 프로테아제의 것과 차이는 보이지 않는다. 즉 이것들의 양 형질전환체 배양물로부터 얻어지는 프로테아제의 주된 성질은 이하와 같다.
(1) 작용:
카세인, 젤라틴을 분해하여 단쇄 폴리펩티드를 생성한다.
숙시닐-L-류실-L-류실-L-발릴-L-티로신-4-메틸쿠마린-7-아미드(Suc-Leu-Leu-Val-Tyr-MCA)를 가수분해하여 형광물질(7-아미노-4-메틸쿠말린)을 생성한다.
숙시닐-L-알라닐-L-알라닐-L-프롤릴-L-페닐알라닌-p-니트로아닐리드(Suc-Ala-Ala-Pro-Phe-p-NA)를 가수분해하여 황색물질(p-니트로아닐린)을 생성한다.
(2) 적정 온도:
40∼110℃에서 효소활성을 나타내며, 그 적정온도는 80∼95℃이다.
(3) 적정 pH:
pH 5∼10 사이에서 효소활성을 나타내며, 그 적정 pH는 pH 6∼8이다.
(4) 열안정성:
95℃, 8시간의 처리후에도 90% 이상의 효소활성을 유지하고 있다.
(5) pH 안정성:
pH 5∼11, 95℃, 60분간의 처리후에도 95% 이상의 활성을 유지하고 있다.
(6) 분자량:
SDS-PAGE상에서 약 45kDa의 분자량을 나타낸다.
따라서, 높은 열안정성을 갖는 프로테아제 및 그 유전자가 제공된다. 또한, 그 프로테아제의 대량발현을 가능케 하는 신규한 단백질 발현계도 본 발명에 의해 개시된다. 그 발현계는 본 발명의 프로테아제의 것 외에 여러 단백질의 유전공학적인 제조에 있어서 유용하다.
이하에 실시예를 들어 본 발명을 더욱 상세하게 설명하지만, 본 발명은 이들에 한정되는 것은 아니다.
실시예 1
(1) 피로코커스 퓨리오서스의 염색체 DNA의 조제
피로코커스 퓨리오서스 DSM3638의 배양은 이하와 같이 행하였다.
1% 트립톤, 0.5% 효모엑기스, 1% 가용성전분, 3.5% 쟈마린 S 솔리드(Jamarine Laboratory 제품), 0.5% 쟈마린 S 리퀴드(Jamarine Laboratory 제품), 0.003% MgSO4, O.001% NaCl, 0.0001% FeSO4·7H2O, 0.0001% CuSO4, 0.0001% CaCl2·7H2O, 0.0001% ZnSO4, 0.1ppm CuSO4·5H2O, 0.1ppm H3BO3, 0.1ppm KAl(SO4)2, 0.1ppm Na2MoO4·2H2O, 0.25ppm NiCl2·H2O의 조성 배지를 2리터 용량의 배지 병에 넣고 120℃에서 20분간 살균한 후, 질소가스를 불어넣어 용존산소를 제거한 후, 이것에 상기 균주를 접종하여 95℃에서 16시간 정치 배양하였다. 배양종료후에 원심분리에 의해서 균체를 모았다.
이어서 얻어진 균체를 25% 스크로오스를 포함하는 50mM 트리스-HCl(pH 8.0) 4㎖에 현탁하고 이 현탁액에 2㎖의 0.2M EDTA, 0.8㎖의 라이소자임(5㎎/㎖)을 가하여 이 혼합물을 20℃에서 1시간 보온한 후, 24㎖의 SET 용액(150mM NaCl, 1mM EDTA, 20mM 트리스-HCl, pH 8.0), 4㎖의 5% SDS, 400㎕의 프로테이나제 K(10㎎/㎖)를 가하여, 다시 37℃에서 1시간 보온시켰다. 페놀-클로로포름 추출을 행하여 반응을 정지한 후에 에탄올침전을 행하여 약 3.2㎎의 염색체 DNA를 얻었다.
실시예 2
(1) 플라스미드 pNSP1의 구축을 위한 프라이머의 합성
프로테아제 PFUS 유전자 전장의 증폭에 사용하기 위한 프라이머를 합성하기 위해서, 이 유전자 전장을 포함하는 플라스미드 pSNP1을 바실러스 섭틸리스 DB104/pSNP1(FERM BP-5634)로부터 단리하여 필요한 영역의 염기서열을 결정하였다. 이 염기서열을 바탕으로 프로테아제 PFUS 유전자의 개시코돈 직전에 BamHI 부위를 도입하기 위한 프라이머 NPF-4, 및 그 유전자의 3'측에 하이브리다이즈하고 SphI의 인식 서열을 포함하는 프라이머 NPM-1을 합성하였다. 서열표의 서열번호 13, 19에 각각 프라이머 NPF-4, 프라이머 NPM-1의 염기서열을 나타낸다.
또한, 프로테아제 PFUS 유전자의 내부, 개시코돈으로부터 약 1.7kb 하류에 존재하는 BamHI 부위를 제거하기 위한 프라이머 mutRR, mutFR을 합성하였다. 서열표의 서열번호 20, 21에 각각 프라이머 mutRR, mutFR의 염기 서열을 나타낸다.
(2) 플라스미드 pPS1의 조제
각각 주형으로서 피로코커스 퓨리오서스의 염색체 DNA를, 또한 프라이머로서 상기 프라이머 NPF-4와 mutRR의 조합, 또는 프라이머 mutFR와 NPM-1의 조합을 포함하는 2조의 LA-PCR 반응 혼합물을 조제하여, 각각을 94℃, 30초 - 55℃, 1분 - 68℃, 3분을 1 사이클로 한 30사이클의 반응을 행하였다. LA-PCR 반응 혼합물의 조제에는 LA PCR Kit Ver.2 (타카라 슈조사 제품)를 사용하였다. 이 반응액의 일부를 이용하여 아가로스전기 영동을 행하면, 프라이머 NPF-4 및 mutRR을 이용한 경우에는 약 1.8kb의, 프라이머 mutFR 및 NPM-1을 이용한 경우에는 약 0.6kb의 DNA 단편이 증폭되었다.
상기의 두 가지의 PCR 반응액으로부터 SUPREC-02(타카라 슈조사 제품)를 이용하여 프라이머를 제거하여 증폭된 DNA 단편을 조제하였다. 이들 두 증폭 DNA 단편을 포함하고, 프라이머 또는 LA Taq는 포함하지 않은 LA-PCR 반응액을 조제하여 94℃에서 10분간의 열변성을 행하여, 30분에 걸쳐 30℃까지 냉각시킨 후, 30℃에서 15분간 보온하여 헤테로 듀플렉스를 형성시켰다. 이어서 이 반응액에 LA Taq(타카라 슈조사 제품)를 첨가하여 72℃에서 30분간 반응시킨 후, 프라이머 NPF-4, NPM-1을 더욱 첨가하여 94℃, 30초 - 55℃, 1분 - 68℃, 3분을 1 사이클로 하여 25 사이클의 반응을 행하였다. 이 반응액중에는 약 2.4kb의 DNA 단편의 증폭이 관찰되었다.
상기 약 2.4kb의 DNA 단편을 BamHI, SphI(모두 타카라 슈조사 제품)로 소화하여, 이 단편을 미리 BamHI, SphI로 소화하여 프로테아제 PFUS 유전자 전장을 제거한 플라스미드 pSNP1과 혼합하여 라이게이션을 행한 후, 바실러스 섭틸리스 DB104에 도입하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하여 상기의 약 2.4kb 단편 1 분자 만이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pPS1로 명명하였다. 또한, 이 플라스미드 ppS1로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pPS1로 명명하였다.
도 7에 플라스미드 pPS1의 제한효소 지도를 나타낸다.
(3) 섭틸리신 E 유전자의 프로모터-시그널 펩티드 코딩 영역의 DNA 단편의 증폭
섭틸리신 E 유전자의 프로모터-시그날 펩티드 코딩 영역을 얻기 위한 프라이머들을 합성하였다. 우선, J. Bacterio1. 제171권, 제2657∼2665페이지(1989)에 기재된 섭틸리신 E 유전자의 프로모터 영역 부분의 염기서열을 참고로, 그 영역의 상류에 하이브리다이즈하여 EcoRI 부위를 포함하는 프라이머 SUB4(서열표의 서열번호 17에 프라이머 SUB4의 염기서열을 나타낸다)를 합성하였다. 다음에 J. Bacteriol. 제158권, 제411∼418페이지(1984)에 기재된 섭틸리신 E 유전자의 염기서열을 참고로, 시그널 펩티드 암호화 영역의 바로 하류에 BamH1 부위를 도입할 수 있는 프라이머 BmR1(서열표의 서열번호 18에 프라이머 BmRI의 염기서열을 나타낸다)을 합성하였다.
J. Bacteriol. 제171권, 제2657∼2665페이지(1989)에 기재된 섭틸리신 E 유전자를 포함하는 플라스미드 pKWZ를 주형으로 하여 상기의 프라이머 SUB4, BmR1을 포함하는 PCR 반응 혼합물을 조제하고 94℃, 30초 - 55℃, 1분 - 68℃, 2분을 1 사이클로 하는 30 사이클의 반응을 행하였다. 이 반응액의 일부를 이용하여 아가로스 전기영동을 행하면, 약 0.3kb의 DNA 단편의 증폭이 확인되었다.
(4) 프로테아제 발현 플라스미드 pNAPS1의 구축
상기한 바의 약 0.3kb의 DNA 단편을 EcoRI(타카라 슈조사 제품), BamHI로 소화한 후, 미리 EcoR I, BamHI로 소화시킨 실시예 3에 기재된 플라스미드 pPS1과 혼합하여 라이게이션한 후, 바실러스 섭틸리스 DB104에 도입하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.3kb 단편 1 분자만이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pNAPS1로 명명하였다. 또한, 그 플라스미드 pNAPS1에서 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pNAPS1로 명명하였다.
도 8에 플라스미드 pNAPS1의 제한효소지도를 나타낸다.
(5) 플라스미드 pSNP2의 구축
상기의 플라스미드 pNAPS1 중에 존재하는 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 상류에 BamHI 부위를 도입하기 위한 프라이머 SUB17R(서열표의 서열번호 23에 프라이머 SUB17R의 염기 서열을 나타낸다)을 합성하였다. 주형으로서 플라스미드 pNAPS1 및 프라이머 SUB17R과 SUB4를 포함하는 PCR 반응액을 조제하여 94℃, 30초 - 55℃, 1분 - 72℃, 1 분을 1 사이클로 하는 25사이클의 반응을 행하였다. 증폭된 약 0.21kb의 DNA 단편을 EcoRI과 BamHI로 소화하여, 섭틸리신 E의 프로모터와 SD 서열을 포함하는 약 0.2kb의 DNA 단편을 얻었다. 이 단편을 미리 EcoRI와 BamHI로 소화한 플라스미드 pNAPS1과 혼합하여 라이게이션한 반응 혼합물을 이용하여 바실러스 섭틸리스 DB104를 형질전환시켰다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.2kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pSNP2로 명명하였다.
(6) 프로테아제를 높은 수준으로 발현하는 돌연변이 플라스미드의 제작
상기의 플라스미드 pNAPS1 중의 섭틸리신 E의 시그널 펩티드와 프로테아제 PFUS의 개시 코돈과의 결합부의 아미노산의 Ser(염기서열 TCC)을 임의의 2개의 아미노산과 바꿔 놓기 위한 프라이머 SPOF0와 SPOR0(서열표의 서열번호 24 및 25에 각각 프라이머 SPOF0와 SPOR0의 염기서열을 나타낸다)를 합성하였다. 또한, 플라스미드 pNAPS1중의 섭틸리신 E의 시그널 펩티드를 코드하는 영역의 직전에 BamHI 부위를 도입하기 위한 프라이머 SUB3, 및 프로테아제 PFUS를 코드하는 영역내의 SpeI 부위를 포함하는 프라이머 NPR-10(서열표의 서열번호 26 및 27에 프라이머 SUB3 및 프라이머 NPR-10의 염기서열을 나타낸다)를 합성하였다.
각각 플라스미드 pNAPS1을 주형으로서, 상기 프라이머 SPOF0와 NPR-10을 포함하는 PCR 반응액 및 상기 프라이머 SUB3과 SPOR0를 포함하는 PCR 반응액을 조제하여, 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1 사이클로 하는 20 사이클의 반응을 행하였다. 두 반응 혼합물 중에 증폭된 각각 약 0.13 kb와 약 0.35 kb의 DNA 단편을 혼합하여 94℃에서 10분간 열변성시킨 후, 37℃까지 서서히 냉각시켜 헤테로 듀플렉스를 형성시키고, 더욱 Taq 폴리머라아제(타카라 슈조사 제품)에 의해서 이 헤테로 듀플렉스로부터 2본쇄 DNA를 제작하였다. 이렇게 해서 얻어진 2본쇄 DNA를 주형으로 하여 상기의 프라이머 SUB3, 프라이머 NPR-10을 포함하는 PCR 반응 혼합물을 조제하여 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1사이클로 하는 25사이클의 반응을 행하였다. 증폭된 약 0.43kb의 DNA 단편을 BamHI와 SpeI(타카라 슈조사 제품)로 소화하여 얻은 DNA 단편을, 미리 BamHI와 SpeI로 소화한 상기의 플라스미드 pSNP2와 혼합하여 라이게이션을 행하고 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다.
얻어진 가나마이신 내성의 형질전환체를 탈지유 플레이트(1O㎍/㎖ 가나마이신, 1% 탈지유를 포함하는 LB-고온 배양용 한천 배지) 상에 접종하여 콜로니를 형성시킨 후, 이 플레이트를 70℃로 보온하여 콜로니 주변의 탈지유의 분해 상태로부터 각 형질전환체의 발현하는 프로테아제 활성을 조사하였다. 그 결과, 특히 높은 활성이 검출된 한 클론을 단리하고 이 클론으로부터 플라스미드를 조제하여, 이것을 플라스미드 pSPO124로 명명하였다. 또한, 이 플라스미드로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pSPO124로 명명하였다. 플라스미드 pSPO124에 대하여 그 염기서열을 해석한 바, 플라스미드 pNAPS1에 있어서 상기의 Ser을 코드하고 있는 부분의 염기서열은 GGGAAT로 치환되었고, 즉 Ser이 Gly-Asn의 2아미노산으로 돌연변이된 단백질이 코드되어 있었다. 또한, 이 돌연변이와 동시에 프로테아제 PFUS의 개시코돈으로부터 25번째로 존재하는 Pro에 해당하는 코돈(CCA)이 Leu를 코드하는 것(CTA)으로 변화되었음이 판명되었다.
(7) 프로테아제 발현 플라스미드 pNAPS△C의 구축
상기의 플라스미드 pNAPS1 중의 프로테아제 PFUS 유전자의 개시 코돈으로부터 544번째의 아미노산의 C-말단측에 종지 코돈를 도입하여 이 부위의 하류를 결실시킨 프로테아제를 발현하는 플라스미드를 구축하였다. 상기 유전자상의 544번째의 아미노산을 코드하는 코돈의 C-말단측에 종지 코돈(염기서열 TGA)을 도입하고, 또 SphI 부위를 갖는 프라이머 NPR544(서열표의 서열번호28에 프라이머 NPR544의 염기서열을 나타낸다)를 합성하였다. 또한 상기 유전자상의 NspV 부위의 상류부분의 염기서열을 바탕으로 프라이머 NPFE81(서열표의 서열번호 29에 프라이머 NPFE81의 염기 서열을 나타낸다)을 합성하였다.
플라스미드 pNAPS1을 주형으로서 상기 프라이머 NPFES1과 NPR544를 포함하는 PCR 반응액을 조제하여, 94℃, 30초 - 50℃, 1분 - 72℃, 1분을 1 사이클로 하는 20사이클의 반응을 행하였다. 증폭된 약 0.61 kb의 DNA 단편을 NspV(타카라 슈조사 제품)와 SphI로 소화시켜 종지 코돈를 포함하는 약 0.13kb의 DNA 단편을 얻었다. 이 DNA 단편을 미리 제한효소 NspV와 SphI로 소화시킨 플라스미드 pNAPS1과 혼합하여 라이게이션을 행하고 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다. 얻어진 가나마이신내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 0.13kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pNAPS△C로 명명하였다. 또한 이 플라스미드 pNAPS△C로 형질전환된 바실러스 섭틸리스DB104를 바실러스 섭틸리스 DB104/pNAPS△C로 명명하였다.
(8) 프로테아제 발현 플라스미드 pSPO124△C의 구축
상기 플라스미드 pNAPS△C를 NspV와 SphI로 소화하여 얻어지는 약 1.3kb의 DNA 단편을 단리하여, 이것을 미리 NspV와 SphI로 소화한 플라스미드 pSPO124와 혼합하여 라이게이션를 행하였다. 이 반응액을 이용하여 바실러스 섭틸리스 DB104를 형질전환하였다. 얻어진 가나마이신 내성의 형질전환체로부터 플라스미드를 조제하고, 상기의 약 1.3kb의 DNA 단편이 삽입된 플라스미드를 선택하여 이것을 플라스미드 pSPO124△C로 명명하였다. 또한 이 플라스미드 pSPOl24△C로 형질전환된 바실러스 섭틸리스 DB104를 바실러스 섭틸리스 DB104/pSPO124△C로 명명하였다.
실시예 3
(1) 프로테아제 PFUS 유전자를 함유하는 플라스미드로 형질전환된 바실러스섭틸리스의 배양과 조효소액의 조제
프로테아제 PFUS 유전자를 함유하는 플라스미드 pNAPS1을 실시예 2에 기술한 바와 같이 도입시킨 바실러스 섭틸리스 DB104인, 바실러스 섭틸리스 DB104/pNAPS1을 10㎍/㎖의 가나마이신을 포함하는 LB 배지(트립톤 10g/리터, 효모 엑기스 5g/리터, NaCl 5g/리터, pH 7.2) 2㎖ 중에 37℃에서 24시간 동안 배양하였다. 배양액은 원심분리하여 배양 상층액(표품1-S)과 균체를 얻었다.
얻어진 균체는 100㎕의 50mM 트리스-HCl, pH 7.5에 현탁하여, 2㎎의 라이소자임(시그마사 제품)을 가한 후에, 37℃에서 45분간 소화시켰다. 소화후의 시료를 95℃에서 10분간 더 가열처리한 후, 원심분리하여 상청을 모아 무세포 추출액 (표품1-L)을 얻었다.
마찬가지로, 상기의 플라스미드 pSPO124를 함유하는 바실러스 섭틸리스 DB104/pSPO124, 상기의 플라스미드 pNAPS△C를 함유하는 바실러스 섭틸리스 DB104/pNAPS△C, 또는 pSPO124△C를 함유하는 바실러스 섭틸리스 DB104/pSPO124△C로부터 상기와 동일한 조작으로 배양 상층액, 무세포 추출액을 조제하였다. 바실러스 섭틸리스 DB104/pSPO124의 배양 상층액을 124-S, 무세포 추출액을 124-L로 명명하였다. 바실러스 섭틸리스 DB104/pNAPS△C의 배양 상층액을 △C-S, 무세포 추출액을 △C-L로 명명하였다. 바실러스 섭틸리스 DB104/pSPO124△C의 배양 상층액을 124△C-S, 무세포 추출액을 124△C-L로 명명하였다. 이것들의 표품을 이용하여 프로테아제 활성을 측정하고 각 표품 중에 포함된 프로테아제 농도를 조사하였다.
(2) 프로테아제 생산능의 비교
프로테아제 PFUS의 활성 측정은 Suc-Ala-Ala-Pro-Phe-p-NA(시그마사 제품)를 기질로 하고, 효소에 의한 가수분해 반응에 의해서 생성되는 p-니트로아닐린을 분광학적으로 측정함으로써 행하였다. 즉, 효소 활성을 측정하고자 하는 효소 표품을 적절히 희석하고, 그 시료용액 50㎕에 1mM Suc-Ala-Ala-Pro-Phe-p-NA 용액(100mM 인산완충액, pH 7.0) 50㎕를 가하여 95℃에서 30분간 반응시켰다. 빙냉하에 반응을 정지한 후, 405nm에서의 흡광도를 측정하여 p-니트로아닐린의 생성량을 구하였다. 효소 1단위는, 95℃에서 1분간에 1μmole의 p-니트로아닐린를 생성하는 효소량으로 하였다. 또한 얻어진 효소활성을 바탕으로 배양 상층액 및 균체내에 발현된 효소단백질량을 프로테아제 PFUS의 단백질 중량당의 비활성을 9.5 단위/㎎로서 산출하였다.
실시예 3(1)에서 조제한 각 효소 표품의 프로테아제 활성을 측정하여, 그 측정결과로부터 산출한 각 형질전환체 배양액 1 리터 당 프로테아제 PFUS 생산량을 표 1에 나타낸다.
바실러스 섭틸리스 DB104/pSPO124에서는 바실러스 섭틸리스 DB104/pNAPS1과 비교하여 균체내의 프로테아제 PFUS 생산량이 3.6배 증가하였다. 또한, 바실러스 섭틸리스 DB104/pNAPS△C에서는 배양 상층액에서 2.4배, 균체내에서 2.2배의 프로테아제 PFUS 생산량의 증가를 나타냈다. 또한 바실러스 섭틸리스 DB104/pSPO124△C에서도 배양 상층액에서 2배, 균체내에서 2.4배로 프로테아제P FUS 생산량이 증가하였다. 그리고 균체당의 생산량도 증가하였다.
배양 상층액, 균체내의 프로테아제 PFUS 생산량의 합계치를 바실러스 섭틸리스 DB104/pNAPS1에서의 값과 비교하면, 바실러스 섭틸리스 DB104/pSPO124에서 2.1배, 바실러스 섭틸리스 DB104/pNAPS△C에서 2.1배, 바실러스 섭틸리스 DB104/pSPO124△C에서 2.2배로 각각 증가하였다.
표 1 프로테아제 PFUS의 생산량(배양액 1리터당, 단위 ㎎)
형질전환체(플라스미드) 배양 상층액 균체 배양액+균체
pNAPS1 15.1 12.5 27.6
pSPO124 13.1 45.4 58.5
pNAPS△C 35.5 28.1 63.6
pSPO124△C 30.5 30.1 60.6
실시예 4
(1) 성숙형 프로테아제 PFUS의 정제 효소 표품의 조제
모두 실시예 2에 기술된 바 대로 도입시킨 본 발명의 초내열성 프로테아제 유전자를 도입시킨 바실러스 섭틸리스 DB104인, 바실러스 섭틸리스 DB104/pNAPS1 및 바실러스 섭틸리스 DB104/pSPO124△C를 각각 10㎍/㎖의 가나마이신을 포함하는 LB 배지 5㎖를 포함하는 시험관에 접종하여, 37℃에서 7시간 진탕 배양하였다. 10㎍/㎖의 가나마이신을 포함하는 TM 배지(콩가루 5g/리터, 폴리펩톤 10g/리터, 고기엑기스 5g/리터, 효모엑기스 2g/리터, 글루코오스 10g/리터, FeSO4·7H2O 1O㎎/리터, MnSO4·4H2O 10㎎/리터, ZnSO4·7H2O 1㎎/리터, pH 7.0) 500㎖를 5리터 용량의 엘렌메이어 플라스크에 넣고 상기 배양액을 5㎖를 접종하여 30℃에서 3일간 진탕 배양하였다. 얻어진 배양액을 초음파처리한 후, 95℃에서 30분간 가열처리하여 원심분리후, 상층액을 회수하였다. 상층액이 25% 포화되도록 황산암모늄을 가한 후, 원심분리를 하여 얻어진 상층액을 25% 포화 황산암모늄을 포함하는 25mM 트리스-염산완충액(pH 7.6)으로 평형화한 마이크로프렙 메틸 HIC(Micro-Prep Methyl HIC, 바이오라드사 제품) 컬럼에 가하였다. 동일한 완충액으로 겔을 세정한 후, 40% 에탄올을 포함하는 25mM 트리스-염산 완충액(pH 7.6)을 이용한 단계별 용출에 의해 컬럼에 흡착된 프로테아제 PFUS를 용출하였다. 이렇게 해서 얻어진 프로테아제 PFUS를 포함하는 분획을 20% 아세토니트릴을 포함하는 0.05% 트리플루오로아세트산으로 평형화한 NAP-25 칼럼(파마시아사 제품)을 이용한 겔 여과에 제공하여 프로테아제 PFUS를 변성시킴과 동시에 탈염을 행하여 정제 프로테아제 PFUS 표품을 얻었다. 또한 바실러스 섭틸리스 DB104/pNAPS1로부터 얻어진 표품을 NAPS-1, 그리고 바실러스 섭틸리스 DB104/pSPO124△C로부터 얻어진 표품을 SPO-124△C로 각각 명명하였다.
0.1% SDS-10% 폴리아크릴아미드 겔를 이용하여 상기의 두 정제 효소 표품의 전기영동을 행하여, 쿠마시 브릴리언트 블루 R-250으로 염색을 행하면, 정제 효소 표품 NAPS-1, SPO-l24△C는 모두 다 단일의 밴드를 나타내고, 추정 분자량은 모두 약 45kDa이었다.
(2) 성숙형의 프로테아제 PFUS의 N-말단 아미노산 서열 분석
GlOOOA 프로테인 시퀀서(휴렛·팩커드사 제품)를 이용한 자동 에드만 법에 의해 정제 효소 표품 NAPS-1, SPO-124△C의 N-말단 아미노산 서열 분석을 행하였다. 이들 2종의 정제 효소 표품의 N-말단 아미노산 서열은, 모두 서열표의 서열번호 22에 나타낸 것이다. 이 서열은 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째로부터 144번째의 서열과 일치하고 있어, NAPS-1, SPO-124△C 모두 이 부분 이후의 폴피펩티드로 이루어지는 효소임을 의미한다.
(3) 성숙형의 프로테아제 PFUS의 질량분석
APl300 사중극삼연(quadrupole triple) 질량분석장치(퍼킨엘머 사이엑스사 제품)를 이용하여 정제 효소 표품 NAPS-1, SPO-124△C의 질량분석을 행하였다. NAPS-1의 분자량은 43,744Da로 추정되는 것으로부터 바실러스 섭틸리스 DB104/pNAPS1이 생산하는 성숙형의 프로테아제 PFUS는 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째의 Ala부터 552번째의 Thr까지의 폴리펩티드로 이루어지는 효소인 것으로 밝혀졌다. 또한, SPO-124△C의 분자량은 42,906Da로 추정된 것으로부터 바실러스 섭틸리스 DB104/pSPO124△C가 생산하는 성숙형의 프로테아제 PFUS는 서열표의 서열번호 15에 나타낸 프로테아제 PFUS의 아미노산 서열의 133번째의 Ala부터 544번째의 Ser까지의 폴리펩티드, 즉 서열표의 서열번호 2에 나타낸 아미노산 서열로 이루어지는 효소인 것으로 밝혀졌다.

Claims (22)

  1. 서열표의 서열번호 4에 나타낸 아미노산 서열의 C-말단으로부터 하나 이상의 아미노산 잔기가 결실된 아미노산 서열로 이루어지고 내열성 프로테아제 활성을 갖는 프로테아제.
  2. 제 1 항에 있어서, 서열표의 서열번호 1에 나타낸 아미노산 서열로 이루어진 프로테아제.
  3. 서열표의 서열번호 1에 나타낸 아미노산 서열에서 1 내지 수개의 아미노산이 결실, 치환, 삽입 또는 부가된 아미노산 서열로 이루어지고 내열성 프로테아제 활성을 갖는 프로테아제.
  4. 서열표의 서열번호 4에 나타낸 아미노산 서열의 C-말단으로부터 하나 이상의 아미노산이 결실된 아미노산 서열로 이루어지며, 내열성 프로테아제 활성을 갖는 단백질을 코드하는 유전자.
  5. 제 4 항에 있어서, 서열표의 서열번호 1에 나타낸 아미노산 서열을 코드하는 프로테아제 유전자.
  6. 제 5 항에 있어서, 서열표의 서열번호 2에 나타낸 염기서열로 이루어지는 프로테아제 유전자.
  7. 서열표의 서열번호 1에 나타낸 아미노산 서열에서 1 내지 수개의 아미노산 잔기가 결실, 치환, 삽입 또는 부가된 아미노산 서열로 이루어지며, 내열성 프로테아제 활성을 갖는 단백질를 코드하는 프로테아제 유전자.
  8. 제 6 항에 따른 프로테아제 유전자와 긴축 조건하에서 하이브리다이즈하며, 내열성 프로테아제 활성을 갖는 단백질을 코드하는 프로테아제 유전자.
  9. 식 Ⅰ:
    SIG-Ala-Gly-Gly-Asn-PRO [Ⅰ]
    [식중, SIG는 섭틸리신 유래의 시그널 펩티드의 아미노산 서열을, PRO은 발현시키고자 하는 단백질의 아미노산 서열을 각각 나타낸다]
    로 나타내어지는 아미노산 서열을 코드하는 유전자.
  10. 제 9 항에 있어서, SIG가 서열표의 서열번호 3에 나타낸 아미노산 서열인 유전자.
  11. 제 9 항에 있어서, PRO가 초호열균 유래의 내열성 프로테아제의 아미노산 서열인 유전자.
  12. 제 11 항에 있어서, PRO가 피로코커스 퓨리오서스(Pyrococcus furiosus) 유래의 프로테아제의 아미노산 서열인 유전자.
  13. 제 12 항에 있어서, PRO가 제 1 항 또는 제 2 항에 따른 프로테아제의 아미노산 서열을 함유하는 것인 유전자.
  14. 제 13 항에 있어서, pSPO124, pSPO124△C로부터 선택되는 플라스미드에 함유되는 것임을 특징으로 하는 유전자.
  15. 제 9 항에 있어서, PRO가 제 2 항에 따른 프로테아제의 아미노산 서열을 포함하는 것인 유전자.
  16. 제 9 항 내지 제 15 항 중의 어느 한 항에 따른 유전자가 도입된 바실러스(Bacillus) 속 세균을 배양하여, 그 배양물로부터 목적하는 단백질를 회수하는 공정으로 이루어짐을 특징으로 하는 단백질의 제조방법.
  17. 제 16 항에 있어서, 바실러스속 세균이 바실러스 섭틸리스(Bacillus subtilis)인 단백질의 제조방법.
  18. 제 16 항에 있어서, 제 9 항 내지 제 15 항 중의 어느 한 항에 따른 유전자가 플라스미드 벡터에 의해서 바실러스속 세균에 도입된 것인 단백질의 제조방법.
  19. 제 18 항에 있어서, pSPO124, pSPO124△C로부터 선택되는 플라스미드가 바실러스속 세균에 도입된 것인 단백질의 제조방법.
  20. 제 19 항에 있어서, 바실러스 섭틸리스 DB104/pSPO124△C FERM P-16227을 배양하여, 그 배양물로부터 목적하는 단백질을 회수하는 공정으로 이루어짐을 특징으로 하는 단백질의 제조방법.
  21. 제 9 항 내지 제 15 항중의 어느 한 항에 따른 유전자가 삽입된 플라스미드벡터.
  22. 제 21 항에 있어서, pSPO124, pSPO124△C로부터 선택되는 플라스미드 벡터.
KR10-1999-7011547A 1997-06-10 1998-06-04 초내열성 프로테아제 발현계 KR100530598B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP1997/151969 1997-06-10
JP15196997 1997-06-10
PCT/JP1998/002465 WO1998056926A1 (fr) 1997-06-10 1998-06-04 Systeme pour exprimer une proteine hyperthermostable

Publications (2)

Publication Number Publication Date
KR20010013540A true KR20010013540A (ko) 2001-02-26
KR100530598B1 KR100530598B1 (ko) 2005-11-23

Family

ID=15530186

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-7011547A KR100530598B1 (ko) 1997-06-10 1998-06-04 초내열성 프로테아제 발현계

Country Status (10)

Country Link
US (3) US6358726B1 (ko)
EP (1) EP0994191B1 (ko)
JP (1) JP3601835B2 (ko)
KR (1) KR100530598B1 (ko)
CN (2) CN1190494C (ko)
AT (1) ATE318913T1 (ko)
AU (1) AU7550098A (ko)
DE (1) DE69833652T2 (ko)
TW (1) TW530088B (ko)
WO (1) WO1998056926A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110086711A (ko) * 2008-10-21 2011-07-29 잇빤 자이단호진 가가쿠오요비겟세이료호겐쿠쇼 봉입체 형성 단백질의 제조방법
CN111876435A (zh) * 2020-07-31 2020-11-03 山东大学 一种海洋嗜热胶原蛋白酶a69及其编码基因与应用

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3455000A (en) * 1999-04-07 2000-11-14 Takara Shuzo Co., Ltd. Composition for decomposing protein
ATE411383T1 (de) 2001-03-14 2008-10-15 Takara Bio Inc Promotoren
EP1578935A2 (en) * 2002-10-10 2005-09-28 Diversa Corporation Proteases, nucleic acids encoding them and methods for making and using them
DE10315640A1 (de) * 2003-04-04 2004-10-14 Ignatov, Konstantin Verfahren zur kontrollierten Freisetzung von Komponenten in eine Lösung
AU2004247801B2 (en) * 2003-06-19 2010-09-23 Novozymes A/S Proteases
GB2416352B (en) * 2004-07-21 2009-01-28 Bioline Ltd A method for performing the hot start of enzymatic reactions
JP2010512787A (ja) * 2006-12-21 2010-04-30 ダニスコ・ユーエス・インク、ジェネンコー・ディビジョン バシルス(Bacillus)種195のアルファ‐アミラーゼポリペプチドの組成物と使用。
CN102112611B (zh) * 2008-07-31 2013-07-24 国立大学法人大阪大学 新型蛋白酶及其应用
US9617527B2 (en) 2010-04-14 2017-04-11 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
ES2673940T3 (es) 2010-12-22 2018-06-26 Novozymes North America, Inc. Proceso para producir productos de fermentación a partir de materiales que contienen almidón
IN2014CN03467A (ko) 2011-10-11 2015-10-16 Novozymes North America Inc
WO2013068309A1 (en) * 2011-11-08 2013-05-16 Novozymes A/S Methods for production of archeae protease in yeast
IN2014CN04905A (ko) * 2011-12-02 2015-09-18 Novozymes As
ES2935920T3 (es) 2012-03-30 2023-03-13 Novozymes North America Inc Procesos de elaboración de productos de fermentación
EP2929022B1 (en) * 2012-12-07 2016-11-09 Danisco US Inc. Compositions and methods of use
EP2929021A1 (en) * 2012-12-07 2015-10-14 Danisco US Inc. Compositions and methods of use
CN105339501A (zh) 2013-06-24 2016-02-17 诺维信公司 用于从发酵产物过程中回收油的方法以及用于生产发酵产物的方法
US11939552B2 (en) 2013-06-24 2024-03-26 Novozymes A/S Process of recovering oil
US9926584B2 (en) 2013-06-25 2018-03-27 Novozymes A/S Expression of natively secreted polypeptides without signal peptide
DK3022300T3 (en) 2013-07-17 2018-10-22 Novozymes As : Pullulan chimeras and polynucleotides encoding them
EP3063282B1 (en) 2013-09-11 2020-03-25 Novozymes A/S Processes for producing fermentation products
DK3097192T3 (en) 2014-01-22 2018-11-19 Novozymes As PULLULANASE VARIATIONS AND POLYNUCLEOTIDES CODING THEM
ES2712402T3 (es) 2014-06-25 2019-05-13 Novozymes As Variantes de xilanasa y polinucleótidos que las codifican
ES2743515T3 (es) 2014-10-23 2020-02-19 Novozymes As Variantes de glucoamilasa y polinucleótidos que codifican las mismas
WO2016087327A1 (en) 2014-12-01 2016-06-09 Novozymes A/S Polypeptides having pullulanase activity comprising the x25, x45 and cbm41 domains
WO2016138437A1 (en) 2015-02-27 2016-09-01 Novozymes A/S Processes of producing ethanol using a fermenting organism
CA2981342A1 (en) 2015-06-18 2016-12-22 Novozymes A/S Polypeptides having trehalase activity and the use thereof in process of producing fermentation products
US20180208916A1 (en) 2015-07-23 2018-07-26 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
EP3362574B1 (en) 2015-10-14 2021-07-07 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
WO2017112533A1 (en) 2015-12-22 2017-06-29 Novozymes A/S Process of extracting oil from thin stillage
EP3526336A1 (en) 2016-10-17 2019-08-21 Novozymes A/S Methods of reducing foam during ethanol fermentation
US10889836B2 (en) 2016-11-23 2021-01-12 Novozymes A/S Yeast for ethanol production
BR112019020772A2 (pt) 2017-04-03 2020-04-28 Novozymes As processo de recuperação
MX2019011900A (es) 2017-04-11 2019-12-05 Novozymes As Variantes de glucoamilasa y polinucleotidos que las codifican.
US20220297171A1 (en) * 2017-04-14 2022-09-22 Novozymes A/S Processes For Solubilizing Municipal Solid Waste With Enzyme Compositions Comprising Protease And Enzyme Compositions Thereof
WO2018222990A1 (en) 2017-06-02 2018-12-06 Novozymes A/S Improved yeast for ethanol production
US11584783B2 (en) 2017-06-28 2023-02-21 Novozymes A/S Processes for producing a fermentation product
US11220679B2 (en) 2017-08-08 2022-01-11 Novozymes A/S Polypeptides having trehalase activity
CN111164214A (zh) 2017-09-15 2020-05-15 诺维信公司 用于改进动物饲料营养质量的酶共混物和方法
CA3075907A1 (en) 2017-10-23 2019-05-02 Novozymes A/S Processes for reducing lactic acid in a biofuel fermentation system
BR112020011278A2 (pt) 2017-12-08 2020-11-17 Novozymes A/S variante de alfa-amilase, composição, polinucleotídeo, construto de ácido nucleico, vetor de expressão, célula hospedeira, métodos para produção de uma variante de alfa-amilase e para aumento da estabilidade de uma alfa-amilase genitora, uso da variante, e, processo para produção de um xarope a partir de material contendo amido
CA3081096A1 (en) 2017-12-08 2019-06-13 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
CA3089135A1 (en) 2018-01-29 2019-08-01 Novozymes A/S Microorganisms with improved nitrogen utilization for ethanol production
MX2020008309A (es) 2018-02-15 2020-10-14 Novozymes As Levadura mejorada para produccion de etanol.
EP3775191A1 (en) 2018-04-09 2021-02-17 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
EP3810785A2 (en) 2018-05-31 2021-04-28 Novozymes A/S Processes for enhancing yeast growth and productivity
US20210269833A1 (en) 2018-07-11 2021-09-02 Novozymes A/S Processes for producing fermentation products
CA3107110A1 (en) 2018-07-25 2020-01-30 Novozymes A/S Enzyme-expressing yeast for ethanol production
WO2020076697A1 (en) 2018-10-08 2020-04-16 Novozymes A/S Enzyme-expressing yeast for ethanol production
WO2020160126A1 (en) 2019-01-31 2020-08-06 Novozymes A/S Polypeptides having xylanase activity and use thereof for improving the nutritional quality of animal feed
US20220154226A1 (en) 2019-03-18 2022-05-19 Novozymes A/S Polypeptides Having Pullulanase Activity Suitable For Use In Liquefaction
EP3947701A1 (en) 2019-04-02 2022-02-09 Novozymes A/S Process for producing a fermentation product
EP4004029A1 (en) 2019-07-26 2022-06-01 Novozymes A/S Microorganisms with improved nitrogen transport for ethanol production
BR112022002203A2 (pt) 2019-08-05 2022-09-06 Novozymes As Misturas de enzimas e processos para produção de um ingrediente alimentar com alto teor de proteína a partir de um subproduto de vinhaça completa
MX2021015818A (es) 2019-08-06 2022-02-03 Novozymes As Proteinas de fusion para mejorar la expresion de enzimas.
EP4031661A1 (en) 2019-09-16 2022-07-27 Novozymes A/S Polypeptides having beta-glucanase activity and polynucleotides encoding same
BR112022011271A2 (pt) 2019-12-10 2022-09-06 Novozymes As Célula hospedeira recombinante, composição, métodos para produzir um derivado de uma célula e um produto de fermentação, e, uso de uma célula hospedeira recombinante
AR120775A1 (es) 2019-12-16 2022-03-16 Novozymes As Procesos para obtener productos de fermentación
EP4103709A2 (en) 2020-02-10 2022-12-21 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
WO2021163011A2 (en) 2020-02-10 2021-08-19 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
MX2023004938A (es) 2020-11-02 2023-05-17 Novozymes As Variantes de glucoamilasa y polinucleotidos que codifican las mismas.
BR112023025624A2 (pt) 2021-06-07 2024-02-27 Novozymes As Célula de levedura recombinante, célula hospedeira recombinante, composição, cocultura, métodos de produção de um derivado de uma célula hospedeira recombinante e de produção de um produto de fermentação, e, uso de uma célula hospedeira recombinante

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1228925B (it) * 1987-08-07 1991-07-10 Eniricerche Spa Procedimento per la preparazione dell'ormone della crescita umano
ATE210181T1 (de) 1994-06-13 2001-12-15 Takara Shuzo Co Gen für hyperthermostabile protease
US6261822B1 (en) * 1995-12-12 2001-07-17 Takara Shuzo Co., Ltd. Ultrathermostable protease genes

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110086711A (ko) * 2008-10-21 2011-07-29 잇빤 자이단호진 가가쿠오요비겟세이료호겐쿠쇼 봉입체 형성 단백질의 제조방법
CN111876435A (zh) * 2020-07-31 2020-11-03 山东大学 一种海洋嗜热胶原蛋白酶a69及其编码基因与应用

Also Published As

Publication number Publication date
CN1657614A (zh) 2005-08-24
US20020132335A1 (en) 2002-09-19
CN1260002A (zh) 2000-07-12
DE69833652T2 (de) 2006-09-21
EP0994191A1 (en) 2000-04-19
US20050084934A1 (en) 2005-04-21
KR100530598B1 (ko) 2005-11-23
US6358726B1 (en) 2002-03-19
DE69833652D1 (de) 2006-04-27
JP3601835B2 (ja) 2004-12-15
EP0994191A4 (en) 2003-04-23
AU7550098A (en) 1998-12-30
EP0994191B1 (en) 2006-03-01
CN1311075C (zh) 2007-04-18
US6783970B2 (en) 2004-08-31
US7144719B2 (en) 2006-12-05
WO1998056926A1 (fr) 1998-12-17
TW530088B (en) 2003-05-01
CN1190494C (zh) 2005-02-23
ATE318913T1 (de) 2006-03-15

Similar Documents

Publication Publication Date Title
KR100530598B1 (ko) 초내열성 프로테아제 발현계
US5399283A (en) Thermally stable and pH stable subtilisin analogs and method for production thereof
US5093257A (en) Hybrid prokaryotic polypeptides produced by in vivo homologous recombination
Kimura et al. Nucleotide sequence of the beta-cyclodextrin glucanotransferase gene of alkalophilic Bacillus sp. strain 1011 and similarity of its amino acid sequence to those of alpha-amylases
US20090029416A1 (en) Hyperthermostable protease gene
EP0483224B1 (en) Inducible expression vectors
Olędzka et al. High-level expression, secretion, and purification of the thermostable aqualysin I from Thermus aquaticus YT-1 in Pichia pastoris
DK175020B1 (da) Fremgangsåde til udtrykkelse og ekstracellulær udskillelse af proteiner i G(-)bakterie, rekombinant DNA-konstruktion og plasmidvektor kodende herfor, samt G(-)bakterie indeholdende disse
Ho et al. Co-expression of a prophage system and a plasmid system in Bacillus subtilis
AU638042B2 (en) Modified proteases and their use in foodstuffs
Shiroza et al. Secretion of heterologous proteins by genetically engineered Streptococcus gordonii
JPH01141596A (ja) アルカリプロテアーゼをコードする遺伝子系
JPH0833484A (ja) アルカリプロテアーゼの製造方法
JPH07184649A (ja) 新規なプロテアーゼ、該酵素の製造方法、該酵素をコードする遺伝子、該酵素の変異体酵素

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091110

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee