KR20010043334A - 살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열 - Google Patents

살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열 Download PDF

Info

Publication number
KR20010043334A
KR20010043334A KR1020007012306A KR20007012306A KR20010043334A KR 20010043334 A KR20010043334 A KR 20010043334A KR 1020007012306 A KR1020007012306 A KR 1020007012306A KR 20007012306 A KR20007012306 A KR 20007012306A KR 20010043334 A KR20010043334 A KR 20010043334A
Authority
KR
South Korea
Prior art keywords
seq
lys
leu
asn
ser
Prior art date
Application number
KR1020007012306A
Other languages
English (en)
Other versions
KR100763074B1 (ko
Inventor
제랄드에스. 파이텔슨
에이취.어네스트 슈네프
케네쓰이. 나르바
브리안에이. 스톡호프
제임스 슈마이츠
데이비드 로워
찰스조셉 덜럼
쥬디 뮬러-콘
리사 스탬프
죠지 모릴
스테이씨 핀스태드-리
Original Assignee
칼튼 제이. 에이블
마이코겐 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 칼튼 제이. 에이블, 마이코겐 코포레이션 filed Critical 칼튼 제이. 에이블
Publication of KR20010043334A publication Critical patent/KR20010043334A/ko
Application granted granted Critical
Publication of KR100763074B1 publication Critical patent/KR100763074B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pest Control & Pesticides (AREA)
  • Insects & Arthropods (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Agronomy & Crop Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Dentistry (AREA)
  • Environmental Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

신규한 바실러스 슈린지엔시스(Bacillus thrungiensis) 분리주, 살충성 독소, 유전자, 및 해충에 대하여 활성을 가지는 독소를 코딩하는 유전자의 확인을 위한 뉴클레오티드 프로브 및 프라이머를 개시하고 청구한다. 상기 프라이머는 이러한 독소를 코딩하는 유전자의 특징인 유전자 단편을 생산하기 위한 PCR 기술에 유용하다. 본 발명은 바실러스 배양액의 상등액으로부터 수득될 수 있는 전적으로 신규한 패밀리의 독소를 제공한다.

Description

살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열{PESTICIDAL TOXINS AND NUCLEOTIDE SEQUENCES WHICH ENCODE THESE TOXINS}
SEQUENCE LISTING
(1) GENERAL INFORMATION:
(i) APPLICANTS:
Applicant Name(s): MYCOGEN CORPORATION
Street address: 5501 Oberlin Drive
City: San Diego
State/Province: California
Country: US
Postal code/Zip: 92121
Phone number: (800) 745-7475
Fax number: (619) 453-0142
(ii) TITLE OF INVENTION: Novel Pesticidal Toxins and Nucleotide
Sequences Which Encode These Toxins
(iii) NUMBER OF SEQUENCES: 54
(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: Saliwanchik, Lloyd & Saliwanchik
(B) STREET: 2421 N.W. 41st Street, Suite A-1
(C) CITY: Gainesville
(D) STATE: FL
(E) COUNTRY: US
(F) ZIP: 32606-6669
(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release #1.0, Version #1.30
(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER:
(B) FILING DATE:
(C) CLASSIFICATION:
(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 09/073,898
(B) FILING DATE: 05-MAY-1998
(viii) ATTORNEY/AGENT INFORMATION:
(A) NAME: Sanders, Jay M.
(B) REGISTRATION NUMBER: 39,355
(C) REFERENCE/DOCKET NUMBER: MA-708C2
(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 352-375-8100
(B) TELEFAX: 352-372-5800
(2) INFORMATION FOR SEQ ID NO:1:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2375 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: Jav90
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:
ATGAACAAGA ATAATACTAA ATTAAGCACA AGAGCCTTAC CAAGTTTTAT TGATTATTTT 60
AATGGCATTT ATGGATTTGC CACTGGTATC AAAGACATTA TGAACATGAT TTTTAAAACG 120
GATACAGGTG GTGATCTAAC CCTAGACGAA ATTTTAAAGA ATCAGCAGTT ACTAAATGAT 180
ATTTCTGGTA AATTGGATGG GGTGAATGGA AGCTTAAATG ATCTTATCGC ACAGGGAAAC 240
TTAAATACAG AATTATCTAA GGAAATATTA AAAATTGCAA ATGAACAAAA TCAAGTTTTA 300
AATGATGTTA ATAACAAACT CGATGCGATA AATACGATGC TTCGGGTATA TCTACCTAAA 360
ATTACCTCTA TGTTGAGTGA TGTAATGAAA CAAAATTATG CGCTAAGTCT GCAAATAGAA 420
TACTTAAGTA AACAATTGCA AGAGATTTCT GATAAGTTGG ATATTATTAA TGTAAATGTA 480
CTTATTAACT CTACACTTAC TGAAATTACA CCTGCGTATC AAAGGATTAA ATATGTGAAC 540
GAAAAATTTG AGGAATTAAC TTTTGCTACA GAAACTAGTT CAAAAGTAAA AAAGGATGGC 600
TCTCCTGCAG ATATTCTTGA TGAGTTAACT GAGTTAACTG AACTAGCGAA AAGTGTAACA 660
AAAAATGATG TGGATGGTTT TGAATTTTAC CTTAATACAT TCCACGATGT AATGGTAGGA 720
AATAATTTAT TCGGGCGTTC AGCTTTAAAA ACTGCATCGG AATTAATTAC TAAAGAAAAT 780
GTGAAAACAA GTGGCAGTGA GGTCGGAAAT GTTTATAACT TCTTAATTGT ATTAACAGCT 840
CTGCAAGCAA AAGCTTTTCT TACTTTAACA ACATGCCGAA AATTATTAGG CTTAGCAGAT 900
ATTGATTATA CTTCTATTAT GAATGAACAT TTAAATAAGG AAAAAGAGGA ATTTAGAGTA 960
AACATCCTCC CTACACTTTC TAATACTTTT TCTAATCCTA ATTATGCAAA AGTTAAAGGA 1020
AGTGATGAAG ATGCAAAGAT GATTGTGGAA GCTAAACCAG GACATGCATT GATTGGGTTT 1080
GAAATTAGTA ATGATTCAAT TACAGTATTA AAAGTATATG AGGCTAAGCT AAAACAAAAT 1140
TATCAAGTCG ATAAGGATTC CTTATCGGAA GTTATTTATG GTGATATGGA TAAATTATTG 1200
TGCCCAGATC AATCTGAACA AATCTATTAT ACAAATAACA TAGTATTTCC AAATGAATAT 1260
GTAATTACTA AAATTGATTT CACTAAAAAA ATGAAAACTT TAAGATATGA GGTAACAGCG 1320
AATTTTTATG ATTCTTCTAC AGGAGAAATT GACTTAAATA AGAAAAAAGT AGAATCAAGT 1380
GAAGCGGAGT ATAGAACGTT AAGTGCTAAT GATGATGGGG TGTATATGCC GTTAGGTGTC 1440
ATCAGTGAAA CATTTTTGAC TCCGATTAAT GGGTTTGGCC TCCAAGCTGA TGAAAATTCA 1500
AGATTAATTA CTTTAACATG TAAATCATAT TTAAGAGAAC TACTGCTAGC AACAGACTTA 1560
AGCAATAAAG AAACTAAATT GATYGTCCCG CCAAGTGGTT TTATTAGCAA TATTGTAGAG 1620
AACGGGTCCA TAGAAGAGGA CAATTTAGAG CCGTGGAAAG CAAATAATAA GAATGCGTAT 1680
GTAGATCATA CAGGCGGAGT GAATGGAACT AAAGCTTTAT ATGTTCATAA GGACGGAGGA 1740
ATTTCACAAT TTATTGGAGA TAAGTTAAAA CCGAAAACTG AGTATGTAAT CCAATATACT 1800
GTTAAAGGAA AACCTTCTAT TCATTTAAAA GATGAAAATA CTGGATATAT TCATTATGAA 1860
GATACAAATA ATAATTTAGA AGATTATCAA ACTATTAATA AACGTTTTAC TACAGGAACT 1920
GATTTAAAGG GAGTGTATTT AATTTTAAAA AGTCAAAATG GAGATGAAGC TTGGGGAGAT 1980
AACTTTATTA TTTTGGAAAT TAGTCCTTCT GAAAAGTTAT TAAGTCCAGA ATTAATTAAT 2040
ACAAATAATT GGACGAGTAC GGGATCAACT AATATTAGCG GTAATACACT CACTCTTTAT 2100
CAGGGAGGAC GAGGGATTCT AAAACAAAAC CTTCAATTAG ATAGTTTTTC AACTTATAGA 2160
GTGTATTTTT CTGTGTCCGG AGATGCTAAT GTAAGGATTA GAAATTCTAG GGAAGTGTTA 2220
TTTGAAAAAA GATATATGAG CGGTGCTAAA GATGTTTCTG AAATGTTCAC TACAAAATTT 2280
GAGAAAGATA ACTTTTATAT AGAGCTTTCT CAAGGGAATA ATTTATATGG TGGTCCTATT 2340
GTACATTTTT ACGATGTCTC TATTAAGTAA CCCAA 2375
(2) INFORMATION FOR SEQ ID NO:2:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 790 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: Jav90
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe
1 5 10 15
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
20 25 30
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
35 40 45
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
50 55 60
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65 70 75 80
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
85 90 95
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
100 105 110
Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
115 120 125
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
130 135 140
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val
145 150 155 160
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
165 170 175
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
180 185 190
Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
195 200 205
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
210 215 220
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225 230 235 240
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
245 250 255
Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
260 265 270
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
275 280 285
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
290 295 300
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305 310 315 320
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
325 330 335
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
340 345 350
Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
355 360 365
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
370 375 380
Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
385 390 395 400
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
405 410 415
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
420 425 430
Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
435 440 445
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
450 455 460
Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
465 470 475 480
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
485 490 495
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
500 505 510
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
515 520 525
Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
530 535 540
Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545 550 555 560
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
565 570 575
Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
580 585 590
Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
595 600 605
Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
610 615 620
Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr
625 630 635 640
Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
645 650 655
Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
660 665 670
Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
675 680 685
Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
690 695 700
Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg
705 710 715 720
Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
725 730 735
Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
740 745 750
Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
755 760 765
Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
770 775 780
Asp Val Ser Ile Lys Pro
785 790
(2) INFORMATION FOR SEQ ID NO:3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:
GGRTTAMTTG GRTAYTATTT 20
(2) INFORMATION FOR SEQ ID NO:4:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:
ATATCKWAYA TTKGCATTTA 20
(2) INFORMATION FOR SEQ ID NO:5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1042 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: 66D3
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:
TTAATTGGGT ACTATTTTAA AGGAAAAGAT TTTAATAATC TTACTATATT TGCTCCAACA 60
CGTGAGAATA CTCTTATTTA TGATTTAGAA ACAGCGAATT CTTTATTAGA TAAGCAACAA 120
CAAACCTATC AATCTATTCG TTGGATCGGT TTAATAAAAA GCAAAAAAGC TGGAGATTTT 180
ACCTTTCAAT TATCGGATGA TGAGCATGCT ATTATAGAAA TCGATGGGAA AGTTATTTCG 240
CAAAAAGGCC AAAAGAAACA AGTTGTTCAT TTAGAAAAAG ATAAATTAGT TCCCATCAAA 300
ATTGAATATC AATCTGATAA AGCGTTAAAC CCAGATAGTC AAATGTTTAA AGAATTGAAA 360
TTATTTAAAA TAAATAGTCA AAAACAATCT CAGCAAGTGC AACAAGACGA ATTGAGAAAT 420
CCTGAATTTG GTAAAGAAAA AACTCAAACA TATTTAAAGA AAGCATCGAA AAGCAGCCTG 480
TTTAGCAATA AAAGTAAACG AGATATAGAT GAAGATATAG ATGAGGATAC AGATACAGAT 540
GGAGATGCCA TTCCTGATGT ATGGGAAGAA AATGGGTATA CCATCAAAGG AAGAGTAGCT 600
GTTAAATGGG ACGAAGGATT AGCTGATAAG GGATATAAAA AGTTTGTTTC CAATCCTTTT 660
AGACAGCACA CTGCTGGTGA CCCCTATAGT GACTATGAAA AGGCATCAAA AGATTTGGAT 720
TTATCTAATG CAAAAGAAAC ATTTAATCCA TTGGTGGCTG CTTTTCCAAG TGTCAATGTT 780
AGCTTGGAAA ATGTCACCAT ATCAAAAGAT GAAAATAAAA CTGCTGAAAT TGCGTCTACT 840
TCATCGAATA ATTGGTCCTA TACAAATACA GAGGGGGCAT CTATTGAAGC TGGAATTGGA 900
CCAGAAGGTT TGTTGTCTTT TGGAGTAAGT GCCAATTATC AACATTCTGA AACAGTGGCC 960
AAAGAGTGGG GTACAACTAA GGGAGACGCA ACACAATATA ATACAGCTTC AGCAGGATAT 1020
CTAAATGCCA ATGTACGATA TA 1042
(2) INFORMATION FOR SEQ ID NO:6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 347 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: 66D3
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:
Leu Ile Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn Asn Leu Thr Ile
1 5 10 15
Phe Ala Pro Thr Arg Glu Asn Thr Leu Ile Tyr Asp Leu Glu Thr Ala
20 25 30
Asn Ser Leu Leu Asp Lys Gln Gln Gln Thr Tyr Gln Ser Ile Arg Trp
35 40 45
Ile Gly Leu Ile Lys Ser Lys Lys Ala Gly Asp Phe Thr Phe Gln Leu
50 55 60
Ser Asp Asp Glu His Ala Ile Ile Glu Ile Asp Gly Lys Val Ile Ser
65 70 75 80
Gln Lys Gly Gln Lys Lys Gln Val Val His Leu Glu Lys Asp Lys Leu
85 90 95
Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Lys Ala Leu Asn Pro Asp
100 105 110
Ser Gln Met Phe Lys Glu Leu Lys Leu Phe Lys Ile Asn Ser Gln Lys
115 120 125
Gln Ser Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Gly
130 135 140
Lys Glu Lys Thr Gln Thr Tyr Leu Lys Lys Ala Ser Lys Ser Ser Leu
145 150 155 160
Phe Ser Asn Lys Ser Lys Arg Asp Ile Asp Glu Asp Ile Asp Glu Asp
165 170 175
Thr Asp Thr Asp Gly Asp Ala Ile Pro Asp Val Trp Glu Glu Asn Gly
180 185 190
Tyr Thr Ile Lys Gly Arg Val Ala Val Lys Trp Asp Glu Gly Leu Ala
195 200 205
Asp Lys Gly Tyr Lys Lys Phe Val Ser Asn Pro Phe Arg Gln His Thr
210 215 220
Ala Gly Asp Pro Tyr Ser Asp Tyr Glu Lys Ala Ser Lys Asp Leu Asp
225 230 235 240
Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro
245 250 255
Ser Val Asn Val Ser Leu Glu Asn Val Thr Ile Ser Lys Asp Glu Asn
260 265 270
Lys Thr Ala Glu Ile Ala Ser Thr Ser Ser Asn Asn Trp Ser Tyr Thr
275 280 285
Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Ile Gly Pro Glu Gly Leu
290 295 300
Leu Ser Phe Gly Val Ser Ala Asn Tyr Gln His Ser Glu Thr Val Ala
305 310 315 320
Lys Glu Trp Gly Thr Thr Lys Gly Asp Ala Thr Gln Tyr Asn Thr Ala
325 330 335
Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr
340 345
(2) INFORMATION FOR SEQ ID NO:7:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2645 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: PS177C8a
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:
ATGAAGAAGA AGTTAGCAAG TGTTGTAACG TGTACGTTAT TAGCTCCTAT GTTTTTGAAT 60
GGAAATGTGA ATGCTGTTTA CGCAGACAGC AAAACAAATC AAATTTCTAC AACACAGAAA 120
AATCAACAGA AAGAGATGGA CCGAAAAGGA TTACTTGGGT ATTATTTCAA AGGAAAAGAT 180
TTTAGTAATC TTACTATGTT TGCACCGACA CGTGATAGTA CTCTTATTTA TGATCAACAA 240
ACAGCAAATA AACTATTAGA TAAAAAACAA CAAGAATATC AGTCTATTCG TTGGATTGGT 300
TTGATTCAGA GTAAAGAAAC GGGAGATTTC ACATTTAACT TATCTGAGGA TGAACAGGCA 360
ATTATAGAAA TCAATGGGAA AATTATTTCT AATAAAGGGA AAGAAAAGCA AGTTGTCCAT 420
TTAGAAAAAG GAAAATTAGT TCCAATCAAA ATAGAGTATC AATCAGATAC AAAATTTAAT 480
ATTGACAGTA AAACATTTAA AGAACTTAAA TTATTTAAAA TAGATAGTCA AAACCAACCC 540
CAGCAAGTCC AGCAAGATGA ACTGAGAAAT CCTGAATTTA ACAAGAAAGA ATCACAGGAA 600
TTCTTAGCGA AACCATCGAA AATAAATCTT TTCACTCAAA AAATGAAAAG GGAAATTGAT 660
GAAGACACGG ATACGGATGG GGACTCTATT CCTGACCTTT GGGAAGAAAA TGGGTATACG 720
ATTCAAAATA GAATCGCTGT AAAGTGGGAC GATTCTYTAG CAAGTAAAGG GTATACGAAA 780
TTTGTTTCAA ATCCGCTAGA AAGTCACACA GTTGGTGATC CTTATACAGA TTATGAAAAG 840
GCAGCAAGAG ACCTAGATTT GTCAAATGCA AAGGAAACGT TTAACCCATT GGTAGCTGCT 900
TTTCCAAGTG TGAATGTTAG TATGGAAAAG GTGATATTAT CACCAAATGA AAATTTATCC 960
AATAGTGTAG AGTCTCATTC ATCCACGAAT TGGTCTTATA CAAATACAGA AGGTGCTTCT 1020
GTTGAAGCGG GGATTGGACC AAAAGGTATT TCGTTCGGAG TTAGCGTAAA CTATCAACAC 1080
TCTGAAACAG TTGCACAAGA ATGGGGAACA TCTACAGGAA ATACTTCGCA ATTCAATACG 1140
GCTTCAGCGG GATATTTAAA TGCAAATGTT CGATATAACA ATGTAGGAAC TGGTGCCATC 1200
TACGATGTAA AACCTACAAC AAGTTTTGTA TTAAATAACG ATACTATCGC AACTATTACG 1260
GCGAAATCTA ATTCTACAGC CTTAAATATA TCTCCTGGAG AAAGTTACCC GAAAAAAGGA 1320
CAAAATGGAA TCGCAATAAC ATCAATGGAT GATTTTAATT CCCATCCGAT TACATTAAAT 1380
AAAAAACAAG TAGATAATCT GCTAAATAAT AAACCTATGA TGTTGGAAAC AAACCAAACA 1440
GATGGTGTTT ATAAGATAAA AGATACACAT GGAAATATAG TAACTGGCGG AGAATGGAAT 1500
GGTGTCATAC AACAAATCAA GGCTAAAACA GCGTCTATTA TTGTGGATGA TGGGGAACGT 1560
GTAGCAGAAA AACGTGTAGC GGCAAAAGAT TATGAAAATC CAGAAGATAA AACACCGTCT 1620
TTAACTTTAA AAGATGCCCT GAAGCTTTCA TATCCAGATG AAATAAAAGA AATAGAGGGA 1680
TTATTATATT ATAAAAACAA ACCGATATAC GAATCGAGCG TTATGACTTA CTTAGATGAA 1740
AATACAGCAA AAGAAGTGAC CAAACAATTA AATGATACCA CTGGGAAATT TAAAGATGTA 1800
AGTCATTTAT ATGATGTAAA ACTGACTCCA AAAATGAATG TTACAATCAA ATTGTCTATA 1860
CTTTATGATA ATGCTGAGTC TAATGATAAC TCAATTGGTA AATGGACAAA CACAAATATT 1920
GTTTCAGGTG GAAATAACGG AAAAAAACAA TATTCTTCTA ATAATCCGGA TGCTAATTTG 1980
ACATTAAATA CAGATGCTCA AGAAAAATTA AATAAAAATC GTACTATTAT ATAAGTTTAT 2040
ATATGAAGTC AGAAAAAAAC ACACAATGTG AGATTACTAT AGATGGGGAG ATTTATCCGA 2100
TCACTACAAA AACAGTGAAT GTGAATAAAG ACAATTACAA AAGATTAGAT ATTATAGCTC 2160
ATAATATAAA AAGTAATCCA ATTTCTTCAA TTCATATTAA AACGAATGAT GAAATAACTT 2220
TATTTTGGGA TGATATTTCT ATAACAGATG TAGCATCAAT AAAACCGGAA AATTTAACAG 2280
ATTCAGAAAT TAAACAGATT TATAGTAGGT ATGGTATTAA GTTAGAAGAT GGAATCCTTA 2340
TTGATAAAAA AGGTGGGATT CATTATGGTG AATTTATTAA TGAAGCTAGT TTTAATATTG 2400
AACCATTGCA AAATTATGTG ACAAAATATA AAGTTACTTA TAGTAGTGAG TTAGGACAAA 2460
ACGTGAGTGA CACACTTGAA AGTGATAAAA TTTACAAGGA TGGGACAATT AAATTTGATT 2520
TTACAAAATA TAGTRAAAAT GAACAAGGAT TATTTTATGA CAGTGGATTA AATTGGGACT 2580
TTAAAATTAA TGCTATTACT TATGATGGTA AAGAGATGAA TGTTTTTCAT AGATATAATA 2640
AATAG 2645
(2) INFORMATION FOR SEQ ID NO:8:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 881 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: PS177C8a (xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:
Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala Pro
1 5 10 15
Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys Thr
20 25 30
Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp Arg
35 40 45
Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn Leu
50 55 60
Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln Gln
65 70 75 80
Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile
85 90 95
Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe
100 105 110
Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys Ile
115 120 125
Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys Gly
130 135 140
Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn
145 150 155 160
Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser
165 170 175
Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu
180 185 190
Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys Ile
195 200 205
Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr Asp
210 215 220
Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr
225 230 235 240
Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys
245 250 255
Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val Gly
260 265 270
Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser
275 280 285
Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val
290 295 300
Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser
305 310 315 320
Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr
325 330 335
Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe
340 345 350
Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp
355 360 365
Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly
370 375 380
Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile
385 390 395 400
Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr Ile
405 410 415
Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro
420 425 430
Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser
435 440 445
Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln Val
450 455 460
Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln Thr
465 470 475 480
Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr Gly
485 490 495
Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser
500 505 510
Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala Ala
515 520 525
Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys
530 535 540
Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly
545 550 555 560
Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met Thr
565 570 575
Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn Asp
580 585 590
Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys Leu
595 600 605
Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn
610 615 620
Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile
625 630 635 640
Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro
645 650 655
Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys
660 665 670
Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr
675 680 685
Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys
690 695 700
Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala
705 710 715 720
His Asn Ile Lys Ser Asn Pro Ile Ser Ser Ile His Ile Lys Thr Asn
725 730 735
Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val Ala
740 745 750
Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr
755 760 765
Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys
770 775 780
Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile
785 790 795 800
Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Lys Val Thr Tyr Ser Ser
805 810 815
Glu Leu Gly Gln Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr
820 825 830
Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Xaa Asn Glu
835 840 845
Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn
850 855 860
Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr Asn
865 870 875 880
Lys
(2) INFORMATION FOR SEQ ID NO:9:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1022 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: 177I8
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:
TGGATTAATT GGGTATTATT TCAAAGGAAA AGATTTTAAT AATCTTACTA TGTTTGCACC 60
GACACGTGAT AATACCCTTA TGTATGACCA ACAAACAGCG AATGCATTAT TAGATAAAAA 120
ACAACAAGAA TATCAGTCCA TTCGTTGGAT TGGTTTGATT CAGAGTAAAG AAACGGGCGA 180
TTTCACATTT AACTTATCAA AGGATGAACA GGCAATTATA GAAATCGATG GGAAAATCAT 240
TTCTAATAAA GGGAAAGAAA AGCAAGTTGT CCATTTAGAA AAAGAAAAAT TAGTTCCAAT 300
CAAAATAGAG TATCAATCAG ATACGAAATT TAATATTGAT AGTAAAACAT TTAAAGAACT 360
TAAATTATTT AAAATAGATA GTCAAAACCA ATCTCAACAA GTTCAACTGA GAAACCCTGA 420
ATTTAACAAA AAAGAATCAC AGGAATTTTT AGCAAAAGCA TCAAAAACAA ACCTTTTTAA 480
GCAAAAAATG AAAAGAGATA TTGATGAAGA TACGGATACA GATGGAGACT CCATTCCTGA 540
TCTTTGGGAA GAAAATGGGT ACACGATTCA AAATAAAGTT GCTGTCAAAT GGGATGATTC 600
GCTAGCAAGT AAGGGATATA CAAAATTTGT TTCGAATCCA TTAGACAGCC ACACAGTTGG 660
CGATCCCTAT ACTGATTATG AAAAGGCCGC AAGGGATTTA GATTTATCAA ATGCAAAGGA 720
AACGTTCAAC CCATTGGTAG CTGCTTTYCC AAGTGTGAAT GTTAGTATGG AAAAGGTGAT 780
ATTATCACCA AATGAAAATT TATCCAATAG TGTAGAGTCT CATTCATCCA CGAATTGGTC 840
TTATACGAAT ACAGAAGGAG CTTCCATTGA AGCTGGTGGC GGTCCATTAG GCCTTTCTTT 900
TGGAGTGAGT GTTAATTATC AACACTCTGA AACAGTTGCA CAAGAATGGG GAACATCTAC 960
AGGAAATACT TCACAATTCA ATACGGCTTC AGCGGGATAT TTAAATGCCA ATATACGATA 1020
TA 1022
(2) INFORMATION FOR SEQ ID NO:10:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 340 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: 177I8
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:
Gly Leu Ile Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn Asn Leu Thr
1 5 10 15
Met Phe Ala Pro Thr Arg Asp Asn Thr Leu Met Tyr Asp Gln Gln Thr
20 25 30
Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg
35 40 45
Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn
50 55 60
Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu Ile Asp Gly Lys Ile Ile
65 70 75 80
Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys Glu Lys
85 90 95
Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile
100 105 110
Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln
115 120 125
Asn Gln Ser Gln Gln Val Gln Leu Arg Asn Pro Glu Phe Asn Lys Lys
130 135 140
Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser Lys Thr Asn Leu Phe Lys
145 150 155 160
Gln Lys Met Lys Arg Asp Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp
165 170 175
Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Lys
180 185 190
Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys
195 200 205
Phe Val Ser Asn Pro Leu Asp Ser His Thr Val Gly Asp Pro Tyr Thr
210 215 220
Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu
225 230 235 240
Thr Phe Asn Pro Leu Val Ala Ala Xaa Pro Ser Val Asn Val Ser Met
245 250 255
Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu
260 265 270
Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser
275 280 285
Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu Ser Phe Gly Val Ser Val
290 295 300
Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr
305 310 315 320
Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala
325 330 335
Asn Ile Arg Tyr
340
(2) INFORMATION FOR SEQ ID NO:11:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1341 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: PS177C8a
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:
ATGTTTATGG TTTCTAAAAA ATTACAAGTA GTTACTAAAA CTGTATTGCT TAGTACAGTT 60
TTCTCTATAT CTTTATTAAA TAATGAAGTG ATAAAAGCTG AACAATTAAA TATAAATTCT 120
CAAAGTAAAT ATACTAACTT GCAAAATCTA AAAATCACTG ACAAGGTAGA GGATTTTAAA 180
GAAGATAAGG AAAAAGCGAA AGAATGGGGG AAAGAAAAAG AAAAAGAGTG GAAACTAACT 240
GCTACTGAAA AAGGAAAAAT GAATAATTTT TTAGATAATA AAAATGATAT AAAGACAAAT 300
TATAAAGAAA TTACTTTTTC TATGGCAGGC TCATTTGAAG ATGAAATAAA AGATTTAAAA 360
GAAATTGATA AGATGTTTGA TAAAACCAAT CTATCAAATT CTATTATCAC CTATAAAAAT 420
GTGGAACCGA CAACAATTGG ATTTAATAAA TCTTTAACAG AAGGTAATAC GATTAATTCT 480
GATGCAATGG CACAGTTTAA AGAACAATTT TTAGATAGGG ATATTAAGTT TGATAGTTAT 540
CTAGATACGC ATTTAACTGC TCAACAAGTT TCCAGTAAAG AAAGAGTTAT TTTGAAGGTT 600
ACGGTTCCGA GTGGGAAAGG TTCTACTACT CCAACAAAAG CAGGTGTCAT TTTAAATAAT 660
AGTGAATACA AAATGCTCAT TGATAATGGG TATATGGTCC ATGTAGATAA GGTATCAAAA 720
GTGGTGAAAA AAGGGGTGGA GTGCTTACAA ATTGAAGGGA CTTTAAAAAA GAGTCTTGAC 780
TTTAAAAATG ATATAAATGC TGAAGCGCAT AGCTGGGGTA TGAAGAATTA TGAAGAGTGG 840
GCTAAAGATT TAACCGATTC GCAAAGGGAA GCTTTAGATG GGTATGCTAG GCAAGATTAT 900
AAAGAAATCA ATAATTATTT AAGAAATCAA GGCGGAAGTG GAAATGAAAA ACTAGATGCT 960
CAAATAAAAA ATATTTCTGA TGCTTTAGGG AAGAAACCAA TACCGGAAAA TATTACTGTG 1020
TATAGATGGT GTGGCATGCC GGAATTTGGT TATCAAATTA GTGATCCGTT ACCTTCTTTA 1080
AAAGATTTTG AAGAACAATT TTTAAATACA ATCAAAGAAG ACAAAGGATA TATGAGTACA 1140
AGCTTATCGA GTGAACGTCT TGCAGCTTTT GGATCTAGAA AAATTATATT ACGATTACAA 1200
GTTCCGAAAG GAAGTACGGG TGCGTATTTA AGTGCCATTG GTGGATTTGC AAGTGAAAAA 1260
GAGATCCTAC TTGATAAAGA TAGTAAATAT CATATTGATA AAGTAACAGA GGTAATTATT 1320
AAGGTGTTAA GCGATATGTA G 1341
(2) INFORMATION FOR SEQ ID NO:12:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 446 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(vi) ORIGINAL SOURCE:
(C) INDIVIDUAL ISOLATE: PS177C8a
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:
Met Phe Met Val Ser Lys Lys Leu Gln Val Val Thr Lys Thr Val Leu
1 5 10 15
Leu Ser Thr Val Phe Ser Ile Ser Leu Leu Asn Asn Glu Val Ile Lys
20 25 30
Ala Glu Gln Leu Asn Ile Asn Ser Gln Ser Lys Tyr Thr Asn Leu Gln
35 40 45
Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu Asp Lys Glu
50 55 60
Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr
65 70 75 80
Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn Lys Asn Asp
85 90 95
Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Met Ala Gly Ser Phe
100 105 110
Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met Phe Asp Lys
115 120 125
Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr
130 135 140
Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser
145 150 155 160
Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys
165 170 175
Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln Val Ser Ser
180 185 190
Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly Lys Gly Ser
195 200 205
Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys
210 215 220
Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys Val Ser Lys
225 230 235 240
Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys
245 250 255
Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala His Ser Trp
260 265 270
Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln
275 280 285
Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn
290 295 300
Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala
305 310 315 320
Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu
325 330 335
Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln
340 345 350
Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu
355 360 365
Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser
370 375 380
Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln
385 390 395 400
Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe
405 410 415
Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys Tyr His Ile
420 425 430
Asp Lys Val Thr Glu Val Ile Ile Lys Val Leu Ser Asp Met
435 440 445
(2) INFORMATION FOR SEQ ID NO:13:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13:
GCTGATGAAC CATTTAATGC C 21
(2) INFORMATION FOR SEQ ID NO:14:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14:
CTCTTTAAAG TAGATACTAA GC 22
(2) INFORMATION FOR SEQ ID NO:15:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15:
GATGAGAACT TATCAAATAG TATC 24
(2) INFORMATION FOR SEQ ID NO:16:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 33 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16:
CGAATTCTTT ATTAGATAAG CAACAACAAA CCT 33
(2) INFORMATION FOR SEQ ID NO:17:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17:
GTTATTTCGC AAAAAGGCCA AAAG 24
(2) INFORMATION FOR SEQ ID NO:18:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18:
GAATATCAAT CTGATAAAGC GTTAAACCCA G 31
(2) INFORMATION FOR SEQ ID NO:19:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19:
GCAGCYTGTT TAGCAATAAA AGT 23
(2) INFORMATION FOR SEQ ID NO:20:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20:
CAAAGGAAGA GTAGCTGTTA 20
(2) INFORMATION FOR SEQ ID NO:21:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21:
CAATGTTAGC TTGGAAAATG TCACC 25
(2) INFORMATION FOR SEQ ID NO:22:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22:
GCTTAGTATC TACTTTAAAG AG 22
(2) INFORMATION FOR SEQ ID NO:23:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23:
GATACTATTT GATAAGTTCT CATC 24
(2) INFORMATION FOR SEQ ID NO:24:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24:
CTTTTGGCCT TTTTGCGAAA TAAC 24
(2) INFORMATION FOR SEQ ID NO:25:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:
CTGGGTTTAA CGCTTTATCA GATTGATATT C 31
(2) INFORMATION FOR SEQ ID NO:26:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26:
ACTTTTATTG CTAAACARGC TGC 23
(2) INFORMATION FOR SEQ ID NO:27:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27:
TAACAGCTAC TCTTCCTTTG 20
(2) INFORMATION FOR SEQ ID NO:28:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28:
GGTGACATTT TCCAAGCTAA CATTG 25
(2) INFORMATION FOR SEQ ID NO:29:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29:
CCAGTCCAAT GAACCTCTTA C 21
(2) INFORMATION FOR SEQ ID NO:30:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30:
AGGGAACAAA CCTTCCCAAC C 21
(2) INFORMATION FOR SEQ ID NO:31:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31:
CARMTAKTAA MTAGGGATAG 20
(2) INFORMATION FOR SEQ ID NO:32:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32:
AGYTTCTATC GAAGCTGGGR ST 22
(2) INFORMATION FOR SEQ ID NO:33:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1035 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33:
GGGTTAATTG GGTATTATTT TAAAGGGAAA GATTTTAATA ATCTGACTAT GTTTGCACCA 60
ACCATAAATA ATACGCTTAT TTATGATCGG CAAACAGCAG ATACACTATT AAATAAGCAG 120
CAACAAGAGT TCAATTCTAT TCGATGGATT GGTTTAATAC AAAGTAAAGA AACAGGTGAC 180
TTTACATTCC AATTATCAGA TGATAAAAAT GCCATCATTG AAATAGATGG AAAAGTTGTT 240
TCTCGTAGAG GAGAAGATAA ACAAACTATC CATTTAGAAA AAGGAAAGAT GGTTCCAATC 300
AAAATTGAGT ACCAGTCCAA TGAACCTCTT ACTGTAGATA GTAAAGTATT TAACGATCTT 360
AAACTATTTA AAATAGATGG TCATAATCAA TCGCATCAAA TACAGCAAGA TGATTTGAAA 420
ATCCTGAATT TAATAAAAAG GAAACGAAAG AGCTTTTATC AAAAACAGCA AAAAGAACCT 480
TTTCTCTTCA AAACGGGGTT GAGAAGCGAT GAGGATGATG ATCTAGGATA CAGATGGTGA 540
TAGCATTCCT GGATAATTGG GAAATGAATG GATATACCAT TCAAACGAAA AATGGCAGTC 600
AAATGGGATG ATTCATTTGC AGAAAAAGGA TATACAAAAT TTGTTTCGAA TCCATATGAA 660
GCCCATACAG CAGGAGATCC TTATACCGAT TATGAAAAAG CAGCAAAAGA TATTCCTTTA 720
TCGAACGCAA AAGAAGCCTT TAATCCTCTT GTAGCTGCTT TTCCATCTGT CAATGTAGGA 780
TTAGAAAAAG TAGTAATTTC TAAAAATGAG GATATGAGTC AGGGTGTATC ATCCAGCACT 840
TCGAATAGTG CCTCTAATAC AAATTCAATT GGTGTTACCG TAGATGCTGG TTGGGAAGGT 900
TTGTTCCCTA AATTTGGTAT TTCAACTAAT TATCAAAACA CATGGACCAC TGCACAAGAA 960
TGGGGCTCTT CTAAAGAAGA TTCTACCCAT ATAAATGGAG CACAATCAGC CTTTTTAAAT 1020
GCAAATGTAC GATAT 1035
(2) INFORMATION FOR SEQ ID NO:34:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 345 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34:
Gly Leu Ile Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn Asn Leu Thr
1 5 10 15
Met Phe Ala Pro Thr Ile Asn Asn Thr Leu Ile Tyr Asp Arg Gln Thr
20 25 30
Ala Asp Thr Leu Leu Asn Lys Gln Gln Gln Glu Phe Asn Ser Ile Arg
35 40 45
Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Gln
50 55 60
Leu Ser Asp Asp Lys Asn Ala Ile Ile Glu Ile Asp Gly Lys Val Val
65 70 75 80
Ser Arg Arg Gly Glu Asp Lys Gln Thr Ile His Leu Glu Lys Gly Lys
85 90 95
Met Val Pro Ile Lys Ile Glu Tyr Gln Ser Asn Glu Pro Leu Thr Val
100 105 110
Asp Ser Lys Val Phe Asn Asp Leu Lys Leu Phe Lys Ile Asp Gly His
115 120 125
Asn Gln Ser His Gln Ile Gln Gln Asp Asp Leu Lys Ile Leu Asn Leu
130 135 140
Ile Lys Arg Lys Arg Lys Ser Phe Tyr Gln Lys Gln Gln Lys Glu Pro
145 150 155 160
Phe Leu Phe Lys Thr Gly Leu Arg Ser Asp Glu Asp Asp Asp Leu Gly
165 170 175
Tyr Arg Trp Xaa Xaa His Ser Trp Ile Ile Gly Lys Xaa Met Asp Ile
180 185 190
Pro Phe Lys Arg Lys Met Ala Val Lys Trp Asp Asp Ser Phe Ala Glu
195 200 205
Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Tyr Glu Ala His Thr Ala
210 215 220
Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Lys Asp Ile Pro Leu
225 230 235 240
Ser Asn Ala Lys Glu Ala Phe Asn Pro Leu Val Ala Ala Phe Pro Ser
245 250 255
Val Asn Val Gly Leu Glu Lys Val Val Ile Ser Lys Asn Glu Asp Met
260 265 270
Ser Gln Gly Val Ser Ser Ser Thr Ser Asn Ser Ala Ser Asn Thr Asn
275 280 285
Ser Ile Gly Val Thr Val Asp Ala Gly Trp Glu Gly Leu Phe Pro Lys
290 295 300
Phe Gly Ile Ser Thr Asn Tyr Gln Asn Thr Trp Thr Thr Ala Gln Glu
305 310 315 320
Trp Gly Ser Ser Lys Glu Asp Ser Thr His Ile Asn Gly Ala Gln Ser
325 330 335
Ala Phe Leu Asn Ala Asn Val Arg Tyr
340 345
(2) INFORMATION FOR SEQ ID NO:35:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1037 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35:
GGGTTAATTG GGTATTATTT TAAAGGGAAA GATTTTAATA ATCTGACTAT GTTTGCACCA 60
ACCATAAATA ATACGCTTAT TTATGATCGG CAAACAGCAG ATACACTATT AAATAAGCAG 120
CAACAAGAGT TCAATTCTAT TCGATGGATT GGTTTAATAC AAAGTAAAGA AACAGGTGAC 180
TTTACATTCC AATTATCAGA TGATAAAAAT GCCATCATTG AAATAGATGG AAAAGTTGTT 240
TCTCGTAGAG GAGAAGATAA ACAAACTATC CATTTAGAAA AAGGAAAGAT GGTTCCAATC 300
AAAATTGAGT ACCAGTCCAA TGAACCTCTT ACTGTAGATA GTAAAGTATT TAACGATCTT 360
AAACTATTTA AAATAGATGG TCATAATCAA TCGCATCAAA TACAGCAAGA TGATTTGAAA 420
AATCCTGAAT TTAATAAAAA AGAAACGAAA GAGCTTTTAT CAAAAACAGC AAAAAGRAAC 480
CTTTTCTCTT CAAACGRRGT KGAGAAGCGA TGAGGATGAT RATCYTAGAT ACAGGTGGKG 540
ATAGCATTCC YKGATAATTG GGGAAATGAA WGGRTATACC ATTCAACSGA AAAATGGSAG 600
TCAAATGGGA TGATTCATTT GCGGAAAAAG GATATACAAA ATTTGTTTCG AATCCATATG 660
AAGCCCATAC AGCAGGAGAT CCTTATACCG ATTATGAAAA AGCAGCAAAA GATATTCCTT 720
TATCGAACGC AAAAGAAGCC TTTAATCCTC TTGTAGCTGC TTTTCCATCT GTCAATGTAG 780
GATTAGAAAA AGTAGTAATT TCTAAAAATG AGGATATGAG TCAGGGTGTA TCATCCAGCA 840
CTTCGAATAG TGCCTCTAAT ACAAATTCAA TTGGTGTTAC CGTAGATGCT GGTTGGGAAG 900
GTTTGTTCCC TAAATTTGGT ATTTCAACTA ATTATCAAAA CACATGGACC ACTGCACAAG 960
AATGGGGCTC TTCTAAAGAA GATTCTACCC ATATAAATGG AGCACAATCA GCCTTTTTAA 1020
ATGCAAATGT ACGATAT 1037
(2) INFORMATION FOR SEQ ID NO:36:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1048 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36:
TGGGTTAATT GGGTATTATT TTAAAGGGCA AGAGTTTAAT CATCTTACTT TGTTCGCACC 60
AACACGTGAT AATACCCTTA TTTATGATCA ACAAACAGCG AATTCCTTAT TAGATACCAA 120
GCAACAAGAA TATCAATCTA TTCGCTGGAT TGGTTTAATT CAAAGTAAAG AAACGGGTGA 180
TTTCACATTT AACTTATCAG ATGATCAACA TGCAATTATA GAAATCGATG GCAAAATCAT 240
TTCGCATAAA GGACAGAATA AACAAGTTGT TCACTTAGAA AAAGGAAAGT TAGTCCCGAT 300
AAAAATTGAG TATCAATCAG ATCAACTATT AAATAGGGAT AGTAACATCT TTAAAGAGTT 360
TAAATTATTC AAAGTAGATA GTCAGCAACA CGCTCACCAA GTTCAACTAG ACGAATTAAG 420
AAACCCTGCG TTTAATAAAA AGGAAACACA ACAATCTTAA GAAAAAGCAT CCAAAAACAA 480
TCTTTTTACA CCAGGGACAT TAAAAGGAAG ATACTGATGA TGATGATAAG GATAACAGGA 540
TGGGAGATTC TATTCCTGGA CCTTTTGGGG GAAGAAAATG GGTATACCAA TCCCAAAATA 600
AAATAGCTGG TCCAAGTGGG ATGTTCATTC GCCGCGAAAG GGTATACAAA TTTGTTTCTT 660
AATCCACTTG ATAGTCATAC AGTTGGAGAT CCCTATACGG ATTATGAAAA AGCAGCAAGA 720
GATTTAGACT TGGCCCAATG CAAAAGAAAC ATTTAACCCA TTAGTAGCTG CTTTTCCAAG 780
TGTGAATGTG AATTTGGAAA AAGTCATTTT ATCTAAAGAT GAAAATCTAT CCAATAGTGT 840
AGAGTCACAT TCCTCCACCA ACTGGTCTTA TACGAATACA GAAGGAGCTT CTATCGAAGC 900
TGGGGCTAAA CCAGAGGGTC CTACTTTTGG AGTGAGTGCT ACTTATCAAC ACTCTGAAAC 960
AGTTGCAAAA GAATGGGGAA CATCTACAGG AAATACCTCG CAATTTAATA CAGCTTCAGC 1020
AGGATATTTA AATGCAAATG TACGATAT 1048
(2) INFORMATION FOR SEQ ID NO:37:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1175 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37:
ACCTCTAGAT GCANGCTCGA GCGGCCGCCA GTGTGATGGA TATCTGCAGA ATTCGGATTA 60
CTTGGGTATT ATTTTAAAGG GAAAGAGTTT AATCATCTTA CTTTGTTCGC ACCAACACGT 120
GATAATACCC TTATTTATGA TCAACAAACA GCGAATTCCT TATTAGATAC CAAACAACAA 180
GAATATCAAT CTATTCGCTG GATTGGTTTG ATTCAAAGTA AAGAAACAGG TGATTTCACG 240
TTTAACTTAT CTGATGATCA AAATGCAATT ATAGAAATAG ATGGCAAAAT CATTTCGCAT 300
AAAGGACAGA ATAAACAAGT TGTTCACTTA GAAAAAGGAA AGTTAGTCCC GATAAAAATT 360
GAGTATCAAT CAGATCAGAT ATTAACTAGG GATAGTAACA TCTTTAAAGA GTTCAATTAT 420
TCAAAGTAGA TAGTCAAGCA ACACTCTCAC CAAAGTTCAA CTTAGGNCNG AATTAAGNAA 480
CCCTNGGATT TTAANTTNAA AAAAAGGAAC CCNCANCATT CTTTAGGAAA AAGCAGCAAN 540
AACCAAATCC TTTTTTACCA CAGGATATTG AAAAGGAGAT ACGGGNTNGA TGATGGATTG 600
ATACCGGGAT ACCAGTTGGG GNTTCTANTC CCTGACCTTT GGGGAAAGAA AATNGGTATA 660
CCNATCCCAA AANTTAAGCC AGCTGTCCAG GTGGGATGAT TCAATTCGCC CGCGAAAGGG 720
TATACCAAAA TTTGTTTCTT AATCCACTTG AGAGTCATAC AGTTGGAGAT CCCTATACGG 780
ATTATGAAAA AGCAGCAAGA GATTTAGACT TGGCCAATGC AAAAGAAACA TTTAACCCAT 840
TAGTAGCTGC TTTTCCAAGT GTGAATGTGA ATTTGGAAAA AGTAATATTA TCCCCAGATG 900
AGAATTTATC TAACAGTGTA GAATCTCATT CGTCTACAAA TTGGTCTTAT ACGAATACTG 960
AAGGAGCTTC TATCGAAGCT GGGGGTGGTC CATTAGGTAT TTCATTTGGA GTGAGTGCTA 1020
ATTATCAACA CTCTGAAACA GTTGCAAAAG AATGGGGAAC ATCTACAGGA AATACCTCGC 1080
AATTTAATAC AGCTTCAGCA GGATATTTAA ATGCCAATGG TCGATNTAAG CCGAATNCCA 1140
NCACACTGNC GGCCGTTAGT AGTGGCACCG AGCCC 1175
(2) INFORMATION FOR SEQ ID NO:38:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1030 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38:
GGRTTAMTTG GGTATTATTT TAAAGGGAAA GATTTTAATG ATCTTACTGT ATTTGCACCA 60
ACGCGTGGGA ATACTCTTGT ATATGATCAA CAAACAGCAA ATACATTACT AAATCAAAAA 120
CAACAAGACT TTCAGTCTAT TCGTTGGGTT GGTTTAATTC AAAGTAAAGA AGCAGGCGAT 180
TTTACATTTA ACTTATCAGA TGATGAACAT ACGATGATAG AAATCGATGG GAAAGTTATT 240
TCTAATAAAG GGAAAGAAAA ACAAGTTGTC CATTTAGAAA AAGGACAGTT CGTTTCTATC 300
AAAATAGAAT ATCAAGCTGA TGAACCATTT AATGCGGATA GTCAAACCTT TAAAAATTTG 360
AAACTCYTTA AAGTAGATAC TAAGCAACAG TCCCAGCAAA TTCAACTAGA TGAATTAAGA 420
AACCCTGRAA TTTAATAAAA AAGAAACACA AGAATTTCTA ACAAAAGCAA CAAAAACAAA 480
CCTTATTACT CAAAAAGTGA AGAGTACTAG GGATGAAGAC ACGGATACAG ATGGAGATTC 540
TATTCCAGAC ATTTGGGAAG AAAATGGGTA TACCATCCAA AATAAGATTG CCGTCAAATG 600
GGATGATTCA TTAGCAAGTA AAGGATATAC GAAATTTGTT TCAAACCCAC TAGATACTCA 660
CACGGTTGGA GATCCTTATA CAGATTATGA AAAAGCAGCA AGGGATTTAG ATTTGTCAAA 720
TGCAAAAGAA ACATTTAACC CATTAGTTGC GGCTTTTCCA AGTGTGAATG TGAGTATGGA 780
AAAAGTGATA TTGTCTCCAG ATGAGAACTT ATCAAATAGT ATCGAGTCTC ATTCATCTAC 840
GAATTGGTCG TATACGAATA CAGAAGGGGC TTCTATTGAA GCTGGTGGGG GAGCATTAGG 900
CCTATCTTTT GGTGTAAGTG CAAACTATCA ACATTCTGAA ACAGTTGGGT ATGAATGGGG 960
AACATCTACG GGAAATACTT CGCAATTTAA TACAGCTTCA GCGGGGTATT TAAATGCCAA 1020
TRTAMGATAT 1030
(2) INFORMATION FOR SEQ ID NO:39:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39:
CACTCAAAAA ATGAAAAGGG AAA 23
(2) INFORMATION FOR SEQ ID NO:40:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40:
CCGGTTTTAT TGATGCTAC 19
(2) INFORMATION FOR SEQ ID NO:41:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41:
AGAACAATTT TTAGATAGGG 20
(2) INFORMATION FOR SEQ ID NO:42:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42:
TCCCTAAAGC ATCAGAAATA 20
(2) INFORMATION FOR SEQ ID NO:43:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1170 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43:
ATGAAGAAAC AAATAGCAAG CGTTGTAACT TGTACGCTAT TAGCCCCTAT GCTTTTTAAT 60
GGAGATATGA ACGCTGCTTA CGCAGCTAGT CAAACAAAAC AAACACCTGC AGCTCAGGTA 120
AACCAAGAGA AAGAAGTAGA TCGAAAAGGA TTACTTGGCT ATTACTTTAA AGGGAAAGAT 180
TTTAATGATC TTACTGTATT TGCACCAACG CGTGGGAATA CTCTTGTATA TGATCAACAA 240
ACAGCAAATA CATTACTAAA TCAAAAACAA CAAGACTTTC AGTCTATTCG TTGGGTTGGT 300
TTAATTCAAA GTAAAGAAGC AGGCGATTTT ACATTTAACT TATCAGATGA TGAACATACG 360
ATGATAGAAA TCGATGGGAA AGTTATTTCT AATAAAGGGA AAGAAAAACA AGTTGTCCAT 420
TTAGAAAAAG GACAGTTCGT TTCTATAAAA TGATTCAGCT GATGAACCAT TTAATGCGGT 480
AGTAAACCTT TAAAAATTTG AAACTCTTTA AAGTAGATAC TAAGCAACAG TCCCAGCAAA 540
TTCAACTAGA TGAATTAAGA AACCCTGAAT TTAATAAAAA AGAAACACAA GAATTTCTAA 600
CAAAAGCAAC AAAAACAAAC CTTATTACTC AAAAAGTGAA GAGTACTAGG GATGAAGACA 660
CGGATACAGA TGGAGATTCT ATTCCAGACA TTTGGGAAGA AAATGGGTAT ACCATCCAAA 720
ATAAATTGCC GTCAAATGGG ATGATTCATT AGCAAGTAAA GGATATACGA AATTTGTTTC 780
AAACCCACTA GATACTCACA CGGTTGGAGA TCCTTATACA GATTATGAAA AAGCAGCAAG 840
GGATTTAGAT TTGTCAAATG CAAAAGAAAC ATTTAACCCA TTAGTTGCGG CTTTTCCAAG 900
TGTAATTGAG TATGGAAAAA GGATTTGTTC CAGATGAGAA CTTATCAAAT AGTATCGAGT 960
TCATTCATTC CTACAATTGG TCGATACGAA TACAGAAGGG GCTTCTATTG AAGCTGGTGG 1020
GGGAGCATTA GGCCTATCTT TTGGTGTAAG TGCAAACTAT CAACATTCTG AAACAGTTGG 1080
GTATGAATGG GGAACATCTA CGGGAAATAC TTCGCAATTT AATACAGCTT CAGCGGGGTA 1140
TTTAAATGCG AATGTTGCTA CAATAACGTG 1170
(2) INFORMATION FOR SEQ ID NO:44:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 348 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:
Met Lys Lys Gln Ile Ala Ser Val Val Thr Cys Thr Leu Leu Ala Pro
1 5 10 15
Met Leu Phe Asn Gly Asp Met Asn Ala Ala Tyr Ala Ala Ser Gln Thr
20 25 30
Lys Gln Thr Pro Ala Ala Gln Val Asn Gln Glu Lys Glu Val Asp Arg
35 40 45
Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn Asp Leu
50 55 60
Thr Val Phe Ala Pro Thr Arg Gly Asn Thr Leu Val Tyr Asp Gln Gln
65 70 75 80
Thr Ala Asn Thr Leu Leu Asn Gln Lys Gln Gln Asp Phe Gln Ser Ile
85 90 95
Arg Trp Val Gly Leu Ile Gln Ser Lys Glu Ala Gly Asp Phe Thr Phe
100 105 110
Asn Leu Ser Asp Asp Glu His Thr Met Ile Glu Ile Asp Gly Lys Val
115 120 125
Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys Gly
130 135 140
Gln Phe Val Ser Xaa Lys Xaa Xaa Xaa Xaa Ala Asp Glu Pro Phe Asn
145 150 155 160
Ala Xaa Ser Xaa Thr Phe Lys Asn Leu Lys Leu Phe Lys Val Asp Thr
165 170 175
Lys Gln Gln Ser Gln Gln Ile Gln Leu Asp Glu Leu Arg Asn Pro Glu
180 185 190
Phe Asn Lys Lys Glu Thr Gln Glu Phe Leu Thr Lys Ala Thr Lys Thr
195 200 205
Asn Leu Ile Thr Gln Lys Val Lys Ser Thr Arg Asp Glu Asp Thr Asp
210 215 220
Thr Asp Gly Asp Ser Ile Pro Asp Ile Trp Glu Glu Asn Gly Tyr Thr
225 230 235 240
Ile Gln Asn Xaa Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys
245 250 255
Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Thr His Thr Val Gly
260 265 270
Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser
275 280 285
Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val
290 295 300
Asn Xaa Ser Met Glu Lys Xaa Ile Leu Xaa Pro Asp Glu Asn Leu Ser
305 310 315 320
Asn Ser Ile Glu Xaa His Ser Phe Leu Xaa Ile Gly Arg Ile Arg Ile
325 330 335
Gln Lys Gly Leu Leu Leu Lys Leu Val Gly Glu His
340 345
(2) INFORMATION FOR SEQ ID NO:45:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 3 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:
ATG 3
(2) INFORMATION FOR SEQ ID NO:46:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46:
Met
1
(2) INFORMATION FOR SEQ ID NO:47:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2583 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47:
ATGACATATA TGAAAAAAAA GTTAGTTAGT GTTGTAACTT GCACGTTATT GGCTCCGATA 60
TTTTTGACTG GAAATGTACA TCCTGTTAAT GCAGACAGTA AAAAAAGTCA GCCTTCTACA 120
GCGCAGGAAA AACAAGAAAA GCCGGTTGAT CGAAAAGGGT TACTCGGCTA TTTTTTTAAA 180
GGGAAAGAGT TTAATCATCT TACTTTGTTC GCACCAACAC GTGATAATAC CCTTATTTAT 240
GATCAACAAA CAGCGAATTC CTTATTAGAT ACCAAACAAC AAGAATATCA ATCTATTCGC 300
TGGATTGGTT TGATTCAAAG TAAAGAAACA GGTGATTTCA CGTTTAACTT ATCTGATGAT 360
CAAAATGCAA TTATAGAAAT AGATGGCAAA ATCATTTCGC ATAAAGGACA GAATAAACAA 420
GTTGTTCACT TAGAAAAAGG AAAGTTAGTC CCGATAAAAA TTGAGTATCA ATCAGATCAG 480
ATATTAACTA GGGATAGTAA CATCTTTAAA GAGTTTCAAT TATTCAAAGT AGATAGTCAG 540
CAACACTCTC ACCAAGTTCA ACTAGACGAA TTAAGAAACC CTGATTTTAA TAAAAAAGAA 600
ACACAACAAT TCTTAGAAAA AGCAGCAAAA ACAAATCTTT TTACACAGAA TATGAAAAGA 660
GATACGGATG ATGATGATGA TACGGATACA GATGGAGATT CTATTCCTGA CCTTTGGGAA 720
GAAAATGGGT ATACCATCCA AAATAAAGTA GCTGTCAAGT GGGATGATTC ATTCGCCGCG 780
AAAGGGTATA CAAAATTTGT TTCTAATCCA CTTGAGAGTC ATACAGTTGG AGATCCCTAT 840
ACGGATTATG AAAAAGCAGC AAGAGATTTA GACTTGGCCA ATGCAAAAGA AACATTTAAC 900
CCATTAGTAG CTGCTTTTCC AAGTGTGAAT GTGAATTTGG AAAAAGTAAT ATTATCCCCA 960
GATGAGAATT TATCTAACAG TGTAGAATCT CATTCGTCTA CAAATTGGTC TTATACGAAT 1020
ACTGAAGGAG CTTCTATCGA AGCTGGGGGT GGTCCATTAG GTATTTCATT TGGAGTGAGT 1080
GCTAATTATC AACACTCTGA AACAGTTGCA AAAGAATGGG GAACATCTAC AGGAAATACC 1140
TCGCAATTTA ATACAGCTTC AGCAGGATAT TTGAATGCGA ATGTTCGATA CAATAATGTG 1200
GGAACAGGTG CGATTTATGA GGTGAAACCT ACAACAAGTT TTGTATTAGA TAAAGATACT 1260
GTAGCAACAA TTACCGCAAA ATCGAATTCG ACAGCTTTAA GTATATCTCC AGGAGAAAGT 1320
TATCCCAAAA AAGGACAAAA TGGAATTGCA ATTAATACAA TGGATGATTT TAATTCCCAT 1380
CCGATTACAT TAAATAAACA ACAATTAGAT CAACTATTAA ATAATAAACC TCTTATGTTA 1440
GAAACAAATC AGGCAGATGG TGTTTATAAA ATAAAGGATA CAAGCGGTAA TATTGTGACT 1500
GGTGGAGAAT GGAACGGTGT TATCCAACAA ATTCAAGCAA AAACAGCCTC TATTATCGTT 1560
GATACGGGAG AAAGTGTTTC AGAAAAGCGT GTCGCAGCAA AAGATTATGA TAATCCTGAG 1620
GATAAAACAC CTTCTTTATC TTTAAAAGAG GCACTTAAAC TTGGATATCC AGAAGAAATT 1680
AAAGAAAAAG ATGGATTGTT GTACTATAAG GACAAGCCAA TTTACGAATC TAGTGTTATG 1740
ACTTATCTAG ATGAGAATAC AGCCAAGGAA GTGGAAAAAC AATTACAGGA TACAACCGGA 1800
ATATATAAAG ATATCAATCA TTTATATGAT GTGAAATTAA CACCTACAAT GAATTTTACG 1860
ATTAAATTAG CTTCCTTATA TGATGGAGCT GAAAATAATG ATGTGAAGAA TGGTCCTATA 1920
GGACATTGGT ATTATACCTA TAATACAGGG GGAGGAAATA CTGGAAAACA CCAATATAGG 1980
TCTGCTAATC CCAGTGCAAA TGTAGTTTTA TCTTCTGAAG CGAAAAGTAA GTTAGATAAA 2040
AATACAAATT ACTACCTTAG TATGTATATG AAAGCTGAGT CTGATACAGA GCCTACAATA 2100
GAAGTAAGTG GTGAGAATTC TACGATAACG AGTAAAAAGG TAAAACTAAA CAGTGAGGGC 2160
TATCAAAGAG TAGATATTTT AGTGCCGAAT TCTGAAAGAA ATCCAATAAA TCAAATATAT 2220
GTAAGAGGAA ATAATACAAC AAATGTATAC TGGGATGATG TTTCAATTAC AAATATTTCA 2280
GCTATAAACC CAAAAACTTT AACAGATGAA GAAATTAAAG AAATATATAA AGATTTTAGT 2340
GAGTCTAAAG ACTGGCCTTG GTTCAATGAT GTTACGTTTA AAAATATTAA ACCATTAGAG 2400
AATTATGTAA AACAATATAG AGTTGATTTC TGGAATACTA ATAGTGATAG ATCATTTAAT 2460
AGGATTAAGG ACAGTTACCC AGTTAATGAA GATGGAAGTG TTAAAGTCAA CATGACAGAA 2520
TATAATGAAG GATATCCACT TAGAATTGAA TCCGCCTACC ATTTAAATAT TTCAGATCTA 2580
TAA 2583
(2) INFORMATION FOR SEQ ID NO:48:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 860 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48:
Met Thr Tyr Met Lys Lys Lys Leu Val Ser Val Val Thr Cys Thr Leu
1 5 10 15
Leu Ala Pro Ile Phe Leu Thr Gly Asn Val His Pro Val Asn Ala Asp
20 25 30
Ser Lys Lys Ser Gln Pro Ser Thr Ala Gln Glu Lys Gln Glu Lys Pro
35 40 45
Val Asp Arg Lys Gly Leu Leu Gly Tyr Phe Phe Lys Gly Lys Glu Phe
50 55 60
Asn His Leu Thr Leu Phe Ala Pro Thr Arg Asp Asn Thr Leu Ile Tyr
65 70 75 80
Asp Gln Gln Thr Ala Asn Ser Leu Leu Asp Thr Lys Gln Gln Glu Tyr
85 90 95
Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp
100 105 110
Phe Thr Phe Asn Leu Ser Asp Asp Gln Asn Ala Ile Ile Glu Ile Asp
115 120 125
Gly Lys Ile Ile Ser His Lys Gly Gln Asn Lys Gln Val Val His Leu
130 135 140
Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Gln
145 150 155 160
Ile Leu Thr Arg Asp Ser Asn Ile Phe Lys Glu Phe Gln Leu Phe Lys
165 170 175
Val Asp Ser Gln Gln His Ser His Gln Val Gln Leu Asp Glu Leu Arg
180 185 190
Asn Pro Asp Phe Asn Lys Lys Glu Thr Gln Gln Phe Leu Glu Lys Ala
195 200 205
Ala Lys Thr Asn Leu Phe Thr Gln Asn Met Lys Arg Asp Thr Asp Asp
210 215 220
Asp Asp Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu
225 230 235 240
Glu Asn Gly Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp
245 250 255
Ser Phe Ala Ala Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu
260 265 270
Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg
275 280 285
Asp Leu Asp Leu Ala Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala
290 295 300
Ala Phe Pro Ser Val Asn Val Asn Leu Glu Lys Val Ile Leu Ser Pro
305 310 315 320
Asp Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp
325 330 335
Ser Tyr Thr Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro
340 345 350
Leu Gly Ile Ser Phe Gly Val Ser Ala Asn Tyr Gln His Ser Glu Thr
355 360 365
Val Ala Lys Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn
370 375 380
Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val
385 390 395 400
Gly Thr Gly Ala Ile Tyr Glu Val Lys Pro Thr Thr Ser Phe Val Leu
405 410 415
Asp Lys Asp Thr Val Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala
420 425 430
Leu Ser Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly
435 440 445
Ile Ala Ile Asn Thr Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu
450 455 460
Asn Lys Gln Gln Leu Asp Gln Leu Leu Asn Asn Lys Pro Leu Met Leu
465 470 475 480
Glu Thr Asn Gln Ala Asp Gly Val Tyr Lys Ile Lys Asp Thr Ser Gly
485 490 495
Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Gln
500 505 510
Ala Lys Thr Ala Ser Ile Ile Val Asp Thr Gly Glu Ser Val Ser Glu
515 520 525
Lys Arg Val Ala Ala Lys Asp Tyr Asp Asn Pro Glu Asp Lys Thr Pro
530 535 540
Ser Leu Ser Leu Lys Glu Ala Leu Lys Leu Gly Tyr Pro Glu Glu Ile
545 550 555 560
Lys Glu Lys Asp Gly Leu Leu Tyr Tyr Lys Asp Lys Pro Ile Tyr Glu
565 570 575
Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Glu
580 585 590
Lys Gln Leu Gln Asp Thr Thr Gly Ile Tyr Lys Asp Ile Asn His Leu
595 600 605
Tyr Asp Val Lys Leu Thr Pro Thr Met Asn Phe Thr Ile Lys Leu Ala
610 615 620
Ser Leu Tyr Asp Gly Ala Glu Asn Asn Asp Val Lys Asn Gly Pro Ile
625 630 635 640
Gly His Trp Tyr Tyr Thr Tyr Asn Thr Gly Gly Gly Asn Thr Gly Lys
645 650 655
His Gln Tyr Arg Ser Ala Asn Pro Ser Ala Asn Val Val Leu Ser Ser
660 665 670
Glu Ala Lys Ser Lys Leu Asp Lys Asn Thr Asn Tyr Tyr Leu Ser Met
675 680 685
Tyr Met Lys Ala Glu Ser Asp Thr Glu Pro Thr Ile Glu Val Ser Gly
690 695 700
Glu Asn Ser Thr Ile Thr Ser Lys Lys Val Lys Leu Asn Ser Glu Gly
705 710 715 720
Tyr Gln Arg Val Asp Ile Leu Val Pro Asn Ser Glu Arg Asn Pro Ile
725 730 735
Asn Gln Ile Tyr Val Arg Gly Asn Asn Thr Thr Asn Val Tyr Trp Asp
740 745 750
Asp Val Ser Ile Thr Asn Ile Ser Ala Ile Asn Pro Lys Thr Leu Thr
755 760 765
Asp Glu Glu Ile Lys Glu Ile Tyr Lys Asp Phe Ser Glu Ser Lys Asp
770 775 780
Trp Pro Trp Phe Asn Asp Val Thr Phe Lys Asn Ile Lys Pro Leu Glu
785 790 795 800
Asn Tyr Val Lys Gln Tyr Arg Val Asp Phe Trp Asn Thr Asn Ser Asp
805 810 815
Arg Ser Phe Asn Arg Ile Lys Asp Ser Tyr Pro Val Asn Glu Asp Gly
820 825 830
Ser Val Lys Val Asn Met Thr Glu Tyr Asn Glu Gly Tyr Pro Leu Arg
835 840 845
Ile Glu Ser Ala Tyr His Leu Asn Ile Ser Asp Leu
850 855 860
(2) INFORMATION FOR SEQ ID NO:49:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1356 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49:
ATGGTATCCA AAAAGTTACA ATTAGTCACA AAAACTTTAG TGTTTAGTAC AGTTTTGTCA 60
ATACCGTTAT TAAATAATAG TGAGATAAAA GCGGAACAAT TAAATATGAA TTCTCAAATT 120
AAATATCCTA ACTTCCAAAA TATAAATATC GCTGATAAGC CAGTAGATTT TAAAGAGGAT 180
AAAGAAAAAG CACGAGAATG GGGAAAAGAA AAAGAAAAAG AGTGGAAACT AACTGCTACT 240
GAAAAAGGGA AAATTAATGA TTTTTTAGAT GATAAAGATG GATTAAAAAC AAAATACAAA 300
GAAATTAATT TTTCTAAGAA TTTTGAATAT GAAACAGAGT TAAAACAGCT TGAAAAAATT 360
AATAGCATGC TAGATAAAGC AAATCTAACA AATTCAATTG TCACGTATAA AAACGTTGAG 420
CCTACAACAA TAGGATTCAA TCACTCTTTG ACTGATGGGA ATCAAATTAA TTCCGAAGCT 480
CAACAGAAGT TCAAGGAACA GTTTTTAGGA AATGATATTA AATTTGATAG TTATTTGGAT 540
ATGCACTTAA CTGAACAAAA TGTTTCCGGT AAAGAAAGGG TTATTTTAAA AGTTACAGTA 600
CTTAGTGGGA AAGGTTCTAC TCCAACAAAA GCAGGTGTTG TTTTAAATAA TAAAGAATAC 660
AAAATGTTGA TTGATAATGG ATATATACTA CATGTAGAAA ACATAACGAA AGTTGTAAAA 720
AAAGGACAGG AATGTTTACA AGTTGAAGGA ACGTTAAAAA AGAGCTTGGA CTTTAAAAAT 780
GATAGTGACG GTAAGGGAGA TTCCTGGGGA AAGAAAAATT ACAAGGAATG GTCTGATTCT 840
TTAACAAATG ATCAGAGAAA AGACTTAAAT GATTATGGTG CGCGAGGTTA TACCGAAATA 900
AATAAATATT TACGTGAAGG GGGTACCGGA AATACAGAGT TGGAGGAAAA AATTAAAAAT 960
ATTTCTGACG CACTAGAAAA GAATCCTATC CCTGAAAACA TTACTGTTTA TAGATATTGC 1020
GGAATGGCGG AATTTGGTTA TCCAATTCAA CCCGAGGCTC CCTCCGTACA AGATTTTGAA 1080
GAGAAATTTT TGGATAAAAT TAAGGAAGAA AAAGGATATA TGAGTACGAG CTTATCAAGT 1140
GATGCGACTT CTTTTGGCGC AAGAAAAATT ATCTTAAGAT TGCAGATACC AAAAGGAAGT 1200
TCAGGAGCAT ATGTAGCTGG TTTAGATGGA TTTAAACCAG CAGAGAAGGA GATTCTTATT 1260
GATAAGGGAA GCAAGTATCA TATTGATAAA GTAACAGAAG TAGTTGTGAA AGGTATTAGA 1320
AAACTCGTAG TAGATGCGAC ATTATTATTA AAATAA 1356
(2) INFORMATION FOR SEQ ID NO:50:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 451 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50:
Met Val Ser Lys Lys Leu Gln Leu Val Thr Lys Thr Leu Val Phe Ser
1 5 10 15
Thr Val Leu Ser Ile Pro Leu Leu Asn Asn Ser Glu Ile Lys Ala Glu
20 25 30
Gln Leu Asn Met Asn Ser Gln Ile Lys Tyr Pro Asn Phe Gln Asn Ile
35 40 45
Asn Ile Ala Asp Lys Pro Val Asp Phe Lys Glu Asp Lys Glu Lys Ala
50 55 60
Arg Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr
65 70 75 80
Glu Lys Gly Lys Ile Asn Asp Phe Leu Asp Asp Lys Asp Gly Leu Lys
85 90 95
Thr Lys Tyr Lys Glu Ile Asn Phe Ser Lys Asn Phe Glu Tyr Glu Thr
100 105 110
Glu Leu Lys Gln Leu Glu Lys Ile Asn Ser Met Leu Asp Lys Ala Asn
115 120 125
Leu Thr Asn Ser Ile Val Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile
130 135 140
Gly Phe Asn His Ser Leu Thr Asp Gly Asn Gln Ile Asn Ser Glu Ala
145 150 155 160
Gln Gln Lys Phe Lys Glu Gln Phe Leu Gly Asn Asp Ile Lys Phe Asp
165 170 175
Ser Tyr Leu Asp Met His Leu Thr Glu Gln Asn Val Ser Gly Lys Glu
180 185 190
Arg Val Ile Leu Lys Val Thr Val Leu Ser Gly Lys Gly Ser Thr Pro
195 200 205
Thr Lys Ala Gly Val Val Leu Asn Asn Lys Glu Tyr Lys Met Leu Ile
210 215 220
Asp Asn Gly Tyr Ile Leu His Val Glu Asn Ile Thr Lys Val Val Lys
225 230 235 240
Lys Gly Gln Glu Cys Leu Gln Val Glu Gly Thr Leu Lys Lys Ser Leu
245 250 255
Asp Phe Lys Asn Asp Ser Asp Gly Lys Gly Asp Ser Trp Gly Lys Lys
260 265 270
Asn Tyr Lys Glu Trp Ser Asp Ser Leu Thr Asn Asp Gln Arg Lys Asp
275 280 285
Leu Asn Asp Tyr Gly Ala Arg Gly Tyr Thr Glu Ile Asn Lys Tyr Leu
290 295 300
Arg Glu Gly Gly Thr Gly Asn Thr Glu Leu Glu Glu Lys Ile Lys Asn
305 310 315 320
Ile Ser Asp Ala Leu Glu Lys Asn Pro Ile Pro Glu Asn Ile Thr Val
325 330 335
Tyr Arg Tyr Cys Gly Met Ala Glu Phe Gly Tyr Pro Ile Gln Pro Glu
340 345 350
Ala Pro Ser Val Gln Asp Phe Glu Glu Lys Phe Leu Asp Lys Ile Lys
355 360 365
Glu Glu Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Asp Ala Thr Ser
370 375 380
Phe Gly Ala Arg Lys Ile Ile Leu Arg Leu Gln Ile Pro Lys Gly Ser
385 390 395 400
Ser Gly Ala Tyr Val Ala Gly Leu Asp Gly Phe Lys Pro Ala Glu Lys
405 410 415
Glu Ile Leu Ile Asp Lys Gly Ser Lys Tyr His Ile Asp Lys Val Thr
420 425 430
Glu Val Val Val Lys Gly Ile Arg Lys Leu Val Val Asp Ala Thr Leu
435 440 445
Leu Leu Lys
450
(2) INFORMATION FOR SEQ ID NO:51:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 47 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51:
GCTCTAGAAG GAGGTAACTT ATGAACAAGA ATAATACTAA ATTAAGC 47
(2) INFORMATION FOR SEQ ID NO:52:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52:
GGGGTACCTT ACTTAATAGA GACATCG 27
(2) INFORMATION FOR SEQ ID NO:53:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2364 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53:
ATGAATATGA ATAATACTAA ATTAAACGCA AGGGCCCTAC CGAGTTTTAT TGATTATTTT 60
AATGGCATTT ATGGATTTGC CACTGGTATC AAAGACATTA TGAATATGAT TTTTAAAACG 120
GATACAGGTG GTAATCTAAC CTTAGACGAA ATCCTAAAGA ATCAGCAGTT ACTAAATGAG 180
ATTTCTGGTA AATTGGATGG GGTAAATGGG AGCTTAAATG ATCTTATCGC ACAGGGAAAC 240
TTAAATACAG AATTATCTAA GGAAATCTTA AAAATTGCAA ATGAACAGAA TCAAGTCTTA 300
AATGATGTTA ATAACAAACT CGATGCGATA AATACGATGC TTCATATATA TCTACCTAAA 360
ATCACATCTA TGTTAAGTGA TGTAATGAAG CAAAATTATG CGCTAAGTCT GCAAGTAGAA 420
TACTTAAGTA AACAATTGAA AGAAATTTCT GATAAATTAG ATGTTATTAA CGTAAATGTT 480
CTTATTAACT CTACACTTAC TGAAATTACA CCTGCATATC AACGGATTAA ATATGTAAAT 540
GAAAAATTTG AAGAATTAAC TTTTGCTACA GAAACCACTT TAAAAGTAAA AAAGGATAGC 600
TCGCCTGCTG ATATTCTTGA CGAGTTAACT GAATTAACTG AACTAGCGAA AAGTGTTACA 660
AAAAATGACG TGGATGGTTT TGAATTTTAC CTTAATACAT TCCACGATGT AATGGTAGGA 720
AATAATTTAT TCGGGCGTTC AGCTTTAAAA ACTGCTTCAG AATTAATTGC TAAAGAAAAT 780
GTGAAAACAA GTGGCAGTGA AGTAGGAAAT GTTTATAATT TCTTAATTGT ATTAACAGCT 840
CTACAAGCAA AAGCTTTTCT TACTTTAACA ACATGCCGAA AATTATTAGG CTTAGCAGAT 900
ATTGATTATA CATCTATTAT GAATGAACAT TTAAATAAGG AAAAAGAGGA ATTTAGAGTA 960
AACATCCTTC CTACACTTTC TAATACTTTT TCTAATCCTA ATTATGCAAA AGTTAAAGGA 1020
AGTGATGAAG ATGCAAAGAT GATTGTGGAA GCTAAACCAG GACATGCATT GGTTGGGTTT 1080
GAAATTAGTA ATGATTCAAT GACAGTATTA AAAGTATATG AAGCTAAGCT AAAACAAAAT 1140
TACCAAGTTG ATAAGGATTC CTTATCGGAA GTCATTTATA GTGATATGGA TAAATTATTG 1200
TGCCCAGATC AATCTGAACA AATTTATTAT ACAAATAATA TAGTATTTCC AAATGAATAT 1260
GTAATTACTA AAATTGATTT TACTAAGAAA ATGAAAACTT TAAGATATGA GGTAACAGCT 1320
AATTCTTACG ATTCTTCTAC AGGAGAAATT GACTTAAATA AGAAGAAAGT AGAATCAAGT 1380
GAAGCGGAGT ATAGGACGTT AAGTGCTAAT AATGATGGAG TATATATGCC GTTAGGTGTC 1440
ATCAGTGAAA CATTTTTGAC TCCAATTAAT GGATTTGGCC TCCAAGCTGA TGAAAATTCA 1500
AGATTAATTA CTTTAACATG TAAATCATAT TTAAGGGAAC TACTACTAGC GACAGACTTA 1560
AGCAATAAAG AAACTAAATT GATTGTCCCG CCTATTAGTT TTATTAGTAA TATTGTAGAA 1620
AATGGGAACT TAGAGGGAGA AAACTTAGAG CCGTGGATAG CAAATAACAA AAATGCGTAT 1680
GTAGATCATA CAGGTGGTAT AAATGGAACT AAAGTTTTAT ATGTTCATAA GGATGGTGAG 1740
TTTTCACAAT TTGTTGGAGG TAAGTTAAAA TCGAAAACAG AATATGTAAT TCAATATATT 1800
GTAAAGGGAA AAGCTTCTAT TTATTTAAAA GATAAAAAAA ATGAGAATTC CATTTATGAA 1860
GAAATAAATA ATGATTTAGA AGGTTTTCAA ACTGTTACTA AACGTTTTAT TACAGGAACG 1920
GATTCTTCAG GGATTCATTT AATTTTTACC AGTCAAAATG GCGAGGGAGC ATTTGGAGGA 1980
AACTTTATTA TCTCAGAAAT TAGGACATCC GAAGAGTTAT TAAGTCCAGA ATTGATTATG 2040
TCGGATGCTT GGGTTGGATC CCAGGGAACT TGGATCTCAG GAAATTCTCT CACTATTAAT 2100
AGTAATGTAA ATGGAACCTT TCGACAAAAT CTTCCGTTAG AAAGTTATTC AACCTATAGT 2160
ATGAACTTTA CTGTGAATGG ATTTGGCAAG GTGACAGTAA GAAATTCTCG TGAAGTATTA 2220
TTTGAAAAAA GTTATCCGCA GCTTTCACCT AAAGATATTT CTGAAAAATT TACAACTGCA 2280
GCCAATAATA CCGGATTATA TGTAGAGCTT TCTCGCTCAA CGTCGGGTGG TGCAATAAAT 2340
TTCCGAGATT TTTCAATTAA GTAA 2364
(2) INFORMATION FOR SEQ ID NO:54:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 787 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54:
Met Asn Met Asn Asn Thr Lys Leu Asn Ala Arg Ala Leu Pro Ser Phe
1 5 10 15
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
20 25 30
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asn Leu Thr Leu
35 40 45
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Glu Ile Ser Gly Lys
50 55 60
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65 70 75 80
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
85 90 95
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
100 105 110
Met Leu His Ile Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
115 120 125
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Val Glu Tyr Leu Ser Lys
130 135 140
Gln Leu Lys Glu Ile Ser Asp Lys Leu Asp Val Ile Asn Val Asn Val
145 150 155 160
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
165 170 175
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
180 185 190
Thr Leu Lys Val Lys Lys Asp Ser Ser Pro Ala Asp Ile Leu Asp Glu
195 200 205
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
210 215 220
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225 230 235 240
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
245 250 255
Ala Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
260 265 270
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
275 280 285
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
290 295 300
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305 310 315 320
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
325 330 335
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
340 345 350
Pro Gly His Ala Leu Val Gly Phe Glu Ile Ser Asn Asp Ser Met Thr
355 360 365
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
370 375 380
Lys Asp Ser Leu Ser Glu Val Ile Tyr Ser Asp Met Asp Lys Leu Leu
385 390 395 400
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
405 410 415
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
420 425 430
Thr Leu Arg Tyr Glu Val Thr Ala Asn Ser Tyr Asp Ser Ser Thr Gly
435 440 445
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
450 455 460
Arg Thr Leu Ser Ala Asn Asn Asp Gly Val Tyr Met Pro Leu Gly Val
465 470 475 480
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
485 490 495
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
500 505 510
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
515 520 525
Val Pro Pro Ile Ser Phe Ile Ser Asn Ile Val Glu Asn Gly Asn Leu
530 535 540
Glu Gly Glu Asn Leu Glu Pro Trp Ile Ala Asn Asn Lys Asn Ala Tyr
545 550 555 560
Val Asp His Thr Gly Gly Ile Asn Gly Thr Lys Val Leu Tyr Val His
565 570 575
Lys Asp Gly Glu Phe Ser Gln Phe Val Gly Gly Lys Leu Lys Ser Lys
580 585 590
Thr Glu Tyr Val Ile Gln Tyr Ile Val Lys Gly Lys Ala Ser Ile Tyr
595 600 605
Leu Lys Asp Lys Lys Asn Glu Asn Ser Ile Tyr Glu Glu Ile Asn Asn
610 615 620
Asp Leu Glu Gly Phe Gln Thr Val Thr Lys Arg Phe Ile Thr Gly Thr
625 630 635 640
Asp Ser Ser Gly Ile His Leu Ile Phe Thr Ser Gln Asn Gly Glu Gly
645 650 655
Ala Phe Gly Gly Asn Phe Ile Ile Ser Glu Ile Arg Thr Ser Glu Glu
660 665 670
Leu Leu Ser Pro Glu Leu Ile Met Ser Asp Ala Trp Val Gly Ser Gln
675 680 685
Gly Thr Trp Ile Ser Gly Asn Ser Leu Thr Ile Asn Ser Asn Val Asn
690 695 700
Gly Thr Phe Arg Gln Asn Leu Pro Leu Glu Ser Tyr Ser Thr Tyr Ser
705 710 715 720
Met Asn Phe Thr Val Asn Gly Phe Gly Lys Val Thr Val Arg Asn Ser
725 730 735
Arg Glu Val Leu Phe Glu Lys Ser Tyr Pro Gln Leu Ser Pro Lys Asp
740 745 750
Ile Ser Glu Lys Phe Thr Thr Ala Ala Asn Asn Thr Gly Leu Tyr Val
755 760 765
Glu Leu Ser Arg Ser Thr Ser Gly Gly Ala Ile Asn Phe Arg Asp Phe
770 775 780
Ser Ile Lys
785
곤충 및 다른 해충들은 농작물 손실과 이러한 해충들을 방제(control)하는 비용에 있어서 농부에게 해마다 수천만 달러의 비용을 부담시킨다. 농작물 생산 환경에서 해충에 의하여 야기되는 손실은 농작물 수율의 감소, 농작물 질의 저하, 및 추수 비용 증가를 포함한다.
윤작 및 부정근(adventitious root) 시스템의 성장을 촉진하기 위한 높은 질소 수준의 적용과 같은 경작 방법은 농경 해충에 의하여 야기되는 문제들을 부분적으로 해결하여 왔다. 농경지 활용에 대한 경제적인 요구는 윤작의 활용을 제한한다. 또한, 몇몇 곤충들의 겨울을 나는 습성은 몇몇 지역에서의 윤작을 혼란시킨다. 따라서, 원하는 수준의 방제를 보장하기 위하여 화학적인 살충제에 가장 많이 의존한다. 살충제는 토양위에 결합되거나 또는 토양속으로 삽입된다. .
화학적 살충제의 사용은 몇 가지 결점을 가지고 있다. 살충제의 지속적인 사용은 내성 곤충이 진화하는 것을 허용하여 왔다. 매우 많은 개체수의 유충, 폭우, 및 살충제 적용 장비의 부적절한 측정과 같은 상황들이 만족스럽지 못한 통제를 초래할 수 있다. 살충제의 사용은 종종 토양과 표면 및 지하 수원의 오염과 같은 환경적인 관심사를 야기한다. 대중은 또한 음식에서 발견될 수 있는 합성 화학약품의 잔류량에 관심을 가져 왔다. 살충제를 가지고 작업하는 일은 또한 그것을 사용하는 사람에게 해를 끼친다. 따라서, 합성 화학약품은 그들의 잠재적인 유독성 환경 결과들에 대하여 점점 더 면밀히 검사되고 있다. 광범위하게 사용되는 합성 화학 살충제의 예에는 유기염화물, 예를 들면 DDT, 미렉스(mirex), 케폰(kepone), 린단(lindane), 알드린(aldrin), 클로르단(chlordane), 알디카브(aldicarb), 및 디엘드린(dieldrin); 유기인산물, 예를 들면, 클로르피리포스(chlorpyripos), 파라치온(parathion), 말라치온(malathion), 및 다이아지논(diazinon); 및 카바메이츠(carbamates)가 포함된다. 살충제 사용에 대한 엄격한 새로운 규제 및 몇몇 유효한 살충제의 절판은 해를 끼치고 비용을 발생시키는 해충을 방제하기 위한 경제적이고 효과적인 선택권을 제한할 수 있다. 유기 합성 화학 살충제의 사용과 연관된 문제점들 때문에, 이러한 제제의 사용을 제한해야 할 분명한 필요와 대체성 방제 제제를 발견해야 할 필요가 있다. 합성 화학 살충제의 대체, 또는 이러한 제제와 생물학적인 살충제의 조합은 환경에서 독성 화학약품의 수준을 감소시킬 수 있다.
사용이 증가하고 있는 생물학적인 살충제는 토양 미생물인 바실러스 슈린지엔시스(Bacillus thuringiensis, "B.t.")이다. 토양 미생물인 바실러스 슈린지엔시스는 그람-양성, 포자-형성 세균이다. 대부분의 B.t. 균주는 살충 활성을 나타내지 않는다. 몇몇 B.t. 균주는 포자에 붙어있는 결정상태의 단백질 봉입체(inclusioin)를 생산하고, 그에 의하여 특징지어질 수 있다. 이러한 봉입체는 종종 뚜렷한 형태를 가진 결정으로서 현미경으로 관찰된다. 몇몇 B.t. 단백질은 곤충과 같은 해충에 대하여 매우 유독하며, 그들의 독성 활성에 있어서 특이적이다. 어떤 살충성 B.t. 단백질은 상기 봉입체에 결합되어 있다. 이러한 "δ-엔도톡신"은 비특이적인 숙주 범위를 가지고 있는 엑소톡신과는 다르다. 바실러스의 다른 종 또한 살충성 단백질을 생산한다.
어떤 바실러스 독소 유전자는 분리되어 서열이 밝혀졌으며, 재조합 DNA에 기초한 산물이 생산되고 사용이 승인되어 왔다. 게다가, 유전공학 기술의 사용과 함께 이러한 독소를 농경 환경에 전달하기 위한 새로운 접근 방법이 개발 중에 있다. 이들은 곤충에 내성을 가지는 독소 유전자에 의해 유전적으로 조작된 식물의 사용 및 독소 전달 수단으로서 안정화된 완전한 미생물 세포의 사용을 포함한다. 이와 같이, 분리된 바실러스 독소 유전자는 상업적으로 가치가 있어지고 있다.
최근 15년까지는 B.t. 살충제의 상업적 사용이 대부분 협소한 범위의 인시류(애벌레) 해충을 타겟팅하는데 제한되어 왔다. 바실러스 슈린지엔시스의 아종인 커스타키(kurstaki)의 포자 및 결정의 조성물은 인시류(Lepidoptera) 해충에 대한 상업적인 살충제로서 수년간 사용되어 왔다. 예를 들면, 바실러스 슈린지엔시스 바. 커스타키 HD-1(Bacillus thuringiensis var. kurstaki HD-1)은 많은 인시류 곤충의 유충에 대하여 독성을 가지는 결정형 δ-엔도톡신을 생산한다.
그러나, 최근 수년간 연구가들은 보다 넓은 범위의 해충에 대하여 특이성을 가지는 B.t. 살충제를 발견하여 왔다. 예를 들면, B.t.의 다른 종, 주로 이스라엘렌시스(israelensis) 및 모리소니(morisoni: a.k.a. tenebrionis, a.k.a. B.t. M-7, a.k.a. B.t. sandiego)가 쌍시류(Diptera) 및 초시류(Coleoptera) 목의 곤충을 방제하기 위하여 상업적으로 사용되어 왔다. 바실러스 슈린지엔시스 바. 테네브리오니스(Bacillus thuringiensis var. tenebrionis)는 초시류 목의 두 가지 딱정벌레(콜로라도 감자 딱정벌레: Leptinotarsa decemlineata 및 Agelastica alni)에 대하여 활성을 가지는 것으로 보고되어 왔다.
보다 최근에, 새로운 B.t.의 아종이 밝혀졌으며, 활성이 있는 δ-엔도톡신 단백질을 생산하는 유전자가 분리되었다. 회프테(Hofte) 및 휘텔리(Whiteley)는 B.t. 결정 단백질 유전자를 네 개의 주요 부류로 분류하였다(참조: Hofte, H., H.R. Whiteley [1989] Microbiological Reviews 52(2):242-255). 상기 부류는 CryI(인시류-특이적), CryII(인시류 및 쌍시류-특이적), CryIII(초시류-특이적), 및 CryIV(쌍시류-특이적)이다. 다른 해충에 대하여 특이적으로 독성을 가지는 균주의 발견이 보고되어 왔다. 예를 들면, CryV 및 CryVI가 선충(nematode)-특이적 독성 유전자의 부류를 표시하는 것으로 제안되어 왔다.
회프테(Hofte) 및 휘텔리(Whiteley)의 1989년의 결정 단백질 명명 및 분류 안은 독소의 유추된(deduced) 아미노산 서열 및 숙주 범위에 기초한 것이다. 그 시스템은 5개의 주요 부류로 나누어진 14가지 상이한 타입의 독성 유전자를 커버하는데 적합하도록 수정되었다. 서열분석된 바실러스 슈린지엔시스 결정 단백질 유전자의 개수는 현재 50개 이상이다. 오로지 아미노산 정체에만 근거를 둔 수정된 명명안이 제안되어 왔다(참조: Crickmore et al. [1996] Society for Invertebrate Pathology, 29th Annual Meeting, IIIrd International Colloquium on Bacillus thuringiensis, University of Cordoba, Cordoba, Spain, September 1-6, 1996, abstract). 기억하기 쉬운 "cry"는 별개의 부류인 cytA와 cytB를 제외한 모든 독소 유전자를 위하여 사용되어 왔다. 1차 랭크에 있는 아라비아 숫자를 로마숫자로 대체하였으며, 3차 랭크에 있는 괄호를 없앴다. 다수가 재분류되었음에도 불구하고, 언급된 예외를 제외하고는 원래의 이름들 중 많은 것이 유지되어 왔다.
다른 많은 B.t. 유전자가 확인되어 왔다. 국제공개 제 94/21795호, 국제공개 제 96/10083호, 국제공개 제 98/44137호, 및 에스트루치 등의 문헌(참조: Estruch, J. J. et al., [1996] PNAS 93:5398-5394)은 바실러스 미생물로부터 수득한 Vip1A(a), Vip1A(b), Vip2A(a), Vip2A(b), Vip3A(a), 및 Vip3A(b) 독소를 개시하고 있다. 이러한 독소는 생장력이 있는 세포의 성장 동안 생산되는 것으로 보고되어 왔으며, 따라서 VIP(vegetative insecticidal proteins)로 명명되었다. 이들 독소의 특정 인시류 및 특정 초시류 해충에 대한 활성이 보고되었다. 국제공개 제 98/18932호는 살충성 독소의 새로운 부류를 개시하고 있다.
성공적인 바실러스 독소의 사용에 대한 장애는 곤충에 의한 B.t. 독소에 대한 내성의 개발을 포함한다. 또한, 어떤 곤충은 바실러스 독소의 효과가 잘 듣지 않으며, 이러한 곤충의 예에는 바구미 또는 검은색 뿌리 잘라먹는 벌레(black cutworm)와 같은 곤충뿐만 아니라, 이제까지 B.t. δ-엔도톡신에 대해 뚜렷한 주목할 만한 감수성을 보이지 않아 온 대부분 종의 성충이 포함된다. B.t. 트랜스유전자 식물 공학에 있어서 내성 관리 방법이 큰 관심의 대상이 되어왔음에도 불구하고, 다양한 곤충을 효과적으로 방제하기 위해서 식물에서 발현될 수 있는 추가적인 유전자를 개발할 필요가 남아있다.
본 출원은 국제공개 제 98/18932호에 개시된 독소 및 유전자에 더하여, 국제공개 제 94/21795호, 국제공개 제 96/10083호, 국제공개 제 98/44137호 및 에스트루치 등의 문헌에 개시된 것과 상이한 새로운 부류의 독소 및 유전자를 제공한다.
[발명의 간단한 요약]
본 발명은 비포유동물 해충, 상세하게는 식물 해충의 방제에 유용한 재료 및 방법에 관한 것이다. 일구현에서, 본 발명은 비포유동물 해충에 대하여 유익한 활성을 가지는 신규한 바실러스 분리주(isolates)를 제공한다. 또 다른 일구현에서, 본 발명은 비포유동물 해충의 방제에 유용한 신규한 독소를 제공한다. 바람직한 일구현에서, 이러한 해충은 인시류 및/또는 초시류이다. 본 발명의 독소는 δ-엔도톡신 및 바실러스 배양액의 상등액으로부터 수득한 가용성 독소를 포함한다.
본 발명은 또한 본 발명의 독소를 코딩하는 뉴클레오티드 서열을 제공한다. 본 발명은 또한 살충성 독소를 코딩하는 유전자의 확인 및 특성규명에 유용한 뉴클레오티드 서열 및 방법을 제공한다.
일구현에서, 본 발명은 혼성화 프로브 및/또는 PCR 기술의 프라이머로 유용한 특이한 뉴클레오티드 서열에 관한 것이다. 상기 프라이머는 특정 독소 유전자의 확인, 특성규명, 및/또는 분리에 사용될 수 있는 특유의 유전자 단편을 생산한다. 본 발명의 상기 뉴클레오티드 서열은 이전에 개시된 독소와는 상이한 독소를 코딩한다.
특정 구현에서, 본 발명은 유익한 살충 활성을 가지고 있는 신규한 부류의 독소를 제공한다. 이러한 부류의 독소는 특정한 증폭된 서열과 혼성화하는 능력 및/또는 특정한 증폭된 프라이머를 사용하는 PCR에 의해 증폭되는 능력에 의해 특징지어지는 폴리뉴클레오티드 서열에 의하여 코딩될 수 있다.
본 발명의 한 측면은 유익한 살충 활성을 가지고 있는 전적으로 신규한 패밀리의 바실러스 독소의 확인 및 특성규명에 관한 것이다. 본 발명은 여기에서 MIS-7 및 MIS-8로 언급되는 신규한 부류의 유전자 및 독소를 포함한다. 신규한 WAR- 및 SUP- 부류의 유전자 및 독소 또한 개시된다. 특정 MIS-1 및 MIS-2의 독소 및 유전자 또한 여기에서 더 특성이 규명된다.
이러한 패밀리의 독소, 및 그들을 코딩하는 유전자는 예를 들면 독소 또는 유전자의 크기, DNA 또는 아미노산 서열, 살충 활성, 및/또는 항체 반응성에 의하여 특성화될 수 있다. 본 발명의 신규한 독소 패밀리를 코딩하는 유전자와 관련하여, 본 개시는 예시화된 패밀리 각각의 DNA를 확인하고 특성을 규명하는데 사용될 수 있는 독특한 혼성화 프로브 및 PCR 프라이머를 제공한다.
본 발명의 일구현에 있어서, 바실러스 분리주는 그 미생물의 높은 증식을 초래하는 조건하에서 배양될 수 있다. 상기 미생물을 처리하여 한가닥 지놈 핵산을 제공한 후에, 상기 DNA를 본 발명의 프라이머와 접촉시켜 PCR 증폭에 적용할 수 있다. 독소-코딩 유전자의 특유의 단편이 상기 과정에 의해 증폭될 것이며, 따라서 독소-코딩 유전자(들)의 존재를 학인하게 된다.
본 발명의 다른 측면은 개시된 뉴클레오티드 서열을 해충에 대하여 활성을 가지는 바실러스 독소를 코딩하는 유전자를 검출하기 위한 프로브로 사용하는 것이다.
본 발명의 다른 측면은 여기에 개시된 방법 및 뉴클레오티드 서열을 사용하여 확인된 유전자 및 분리주를 포함한다. 이와 같이 확인된 유전자는 해충에 대하여 활성을 가지는 독소를 코딩한다. 유사하게, 상기 분리주는 이러한 해충에 대하여 활성을 가질 것이다. 바람직한 일구현에서, 이러한 해충은 인시류 또는 초시류의 해충이다.
바람직한 일구현에서, 본 발명은 본 발명의 폴리뉴클레오티드 서열 중 적어도 하나로 형질감염(transfection)되어, 타겟 해충에 의해 소비되는 조직에서 살충성 독소를 발현하는 식물 세포에 관한 것이다. 여기에서 기술된 바와 같이, 본 발명에 따른 유용한 독소는 다수의 독소의 일부분들을 조합하여 생산된 키메라 독소일 수 있다. 또한, 독소들의 혼합물 및/또는 조합이 본 발명에 따라 사용될 수 있다.
여기에 개시된 유전자 구조물(construct)로 식물을 형질감염시키는 일은 당업계에서 통상의 지식을 가진 자에게 공지된 기술을 사용하여 이루어질 수 있으며, 전형적으로 식물에서 독소의 발현을 최적화하기 위하여 상기 유전자를 변화시키는 일을 포함할 것이다.
이와 달리, 본 발명의 바실러스 분리주, 또는 여기에 기술된 독소를 발현하는 재조합 미생물을 해충을 방제하는데 사용할 수 있다. 이러한 측면에서, 본 발명은 실질적으로 완전한 바실러스 세포의 처리, 및/또는 상기 실질적으로 완전한 세포가 타겟 해충의 환경에 적용되었을 때 살충 활성을 지속하도록 처리된, 본 발명의 발현된 독소를 포함하는 재조합 세포를 포함한다. 상기 처리된 세포는 상기 살충성 독소를 위한 보호성 코팅으로서 작용한다. 상기 독소는 타겟 해충에 의하여 소화되었을 때 활성을 가지게 된다.
[서열의 간단한 설명]
서열 1은 B.t. 균주 자벨린(Javelin) 1990으로부터 유래된 독소를 코딩하는 뉴클레오티드 서열이다.
서열 2는 상기 자벨린 1990 독소의 아미노산 서열이다.
서열 3은 본 발명에 따라 사용된 정방향(forward) 프라이머이다.
서열 4는 본 발명에 따라 사용된 역방향(reverse) 프라이머이다.
서열 5는 B.t. 균주 PS66D3로부터 유래된 독소 유전자의 뉴클레오티드 서열이다.
서열 6은 상기 66D3 독소로부터의 아미노산 서열이다.
서열 7은 B.t. 균주 PS177C8으로부터 유래된 MIS 독소 유전자의 뉴클레오티드 서열이다.
서열 8은 상기 177C8-MIS 독소로부터의 아미노산 서열이다.
서열 9는 B.t. 균주 PS177I8로부터 유래된 독소 유전자의 뉴클레오티드 서열이다.
서열 10은 상기 177I8 독소로부터의 아미노산 서열이다.
서열 11은 B.t. 균주 PS177C8로부터 유래된 177C8-WAR 독소 유전자를 코딩하는 뉴클레오티드 서열이다.
서열 12는 B.t. 균주 PS177C8으로부터 유래된 177C8-WAR 독소의 아미노산 서열이다.
서열 13 내지 21은 본 발명에 따라 사용된 프라이머이다.
서열 22는 서열 14의 프라이머의 역방향 상대물(reverse complement)이다.
서열 23은 서열 15의 프라이머의 역방향 상대물(complement)이다.
서열 24는 서열 17의 프라이머의 역방향 상대물(complement)이다.
서열 25는 서열 18의 프라이머의 역방향 상대물(complement)이다.
서열 26은 서열 19의 프라이머의 역방향 상대물(complement)이다.
서열 27은 서열 20의 프라이머의 역방향 상대물(complement)이다.
서열 28은 서열 21의 프라이머의 역방향 상대물(complement)이다.
서열 29는 MIS-7 정방향 프라이머이다.
서열 30은 MIS-7 역방향 프라이머이다.
서열 31은 MIS-8 정방향 프라이머이다.
서열 32는 MIS-8 역방향 프라이머이다.
서열 33은 B.t. 균주 PS157C1으로부터 유래된 157C1-A로 명명된 MIS-7 독소 유전자의 뉴클레오티드 서열이다.
서열 34는 B.t. 균주 PS157C1으로부터 유래된 157C1-A로 명명된 MIS-7 독소의 아미노산 서열이다.
서열 35는 B.t. 균주 PS201Z로부터 유래된 MIS-7 독소 유전자의 뉴클레오티드 서열이다.
서열 36은 B.t. 균주 PS31F2로부터 유래된 MIS-8 독소 유전자의 뉴클레오티드 서열이다.
서열 37은 B.t. 균주 PS185Y2로부터 유래된 MIS-8 독소 유전자의 뉴클레오티드 서열이다.
서열 38은 B.t. 균주 PS33F1으로부터 유래된 MIS-1 독소 유전자의 뉴클레오티드 서열이다.
서열 39는 본 발명에 따른 용도의 MIS 프라이머이다.
서열 40은 본 발명에 따른 용도의 MIS 프라이머이다.
서열 41은 본 발명에 따른 용도의 WAR 프라이머이다.
서열 42는 본 발명에 따른 용도의 WAR 프라이머이다.
서열 43은 PS205C로부터 유래된 MIS-7 유전자의 부분적인 뉴클레오티드 서열이다.
서열 44는 PS205C로부터 유래된 MIS-7 독소의 부분적인 아미노산 서열이다.
서열 45는 PS205C로부터 유래된 WAR 유전자의 부분적인 뉴클레오티드 서열이다.
서열 46은 PS205C로부터 유래된 WAR 독소의 부분적인 아미노산 서열이다.
서열 47은 PS31F2로부터 유래된 MIS-8 유전자의 뉴클레오티드 서열이다.
서열 48은 PS31F2로부터 유래된 MIS-8 독소의 아미노산 서열이다.
서열 49는 PS31F2로부터 유래된 WAR 유전자의 뉴클레오티드 서열이다.
서열 50은 PS31F2로부터 유래된 WAR 독소의 아미노산 서열이다.
서열 51은 본 발명에 따른 용도의 SUP 프라이머이다.
서열 52는 본 발명에 따른 용도의 SUP 프라이머이다.
서열 53은 KB59A4-6으로부터 유래된 SUP 유전자의 뉴클레오티드 서열이다.
서열 54는 KB59A4-6으로부터 유래된 SUP 독소의 아미노산 서열이다.
본 발명은 비포유동물 해충의 방제를 위한 재료 및 방법에 관한 것이다. 특정 구현에서, 본 발명은 인시류 및/또는 초시류에 대하여 활성을 가지는 신규한 바실러스 슈린지엔시스 분리주 및 독소에 관한 것이다. 본 발명은 또한 살충성 독소를 코딩하는 신규한 유전자 및 유용한 특성을 가지고 있는 독소를 코딩하는 바실러스 유전자를 확인하고 특성을 규명하기 위한 신규한 방법에 관한 것이다. 본 발명은 이러한 독소를 코딩하는 폴리뉴클레오티드 서열뿐만 아니라, 상기 독소를 발현하는 재조합 숙주를 생산하기 위한 상기 폴리뉴클레오티드 서열의 용도에 관한 것이다. 본 발명의 단백질은 예전에 바실러스 슈린지엔시스로부터 분리된 단백질 독소와는 상이하다.
본 발명에 따른 B.t. 분리주는 농업 연구 배양균 기탁소(Agricultural Research Service Patent Culture Collection, "NRRL"; Northern Regional Research Center, 1815 North University Street, Peoria, Illinois 61604, USA)의 영구적인 콜렉션(permanent collection)에 기탁되었다. B.t. 균주의 수탁번호는 하기와 같다:
배양주 수탁번호 기탁일자 특허번호
B.t. PS157C1(MT104) NRRL B-18240 1987. 7. 17. 5,262,159
B.t. PS31F2 NRRL B-21876 1997. 10. 24.
B.t. PS66D3 NRRL B-21858 1997. 10. 24.
B.t. PS177C8a NRRL B-21867 1997. 10. 24.
B.t. PS177I8 NRRL B-21868 1997. 10. 24.
KB53A49-4 NRRL B-21879 1997. 10. 24.
KB68B46-2 NRRL B-21877 1997. 10. 24.
KB68B51-2 NRRL B-21880 1997. 10. 24.
KB68B55-2 NRRL B-21878 1997. 10. 24.
PS33F1 NRRL B-21977 1998. 4. 24.
PS71G4 NRRL B-21978 1998. 4. 24.
PS86D1 NRRL B-21979 1998. 4. 24.
PS185V2 NRRL B-21980 1998. 4. 24.
PS191A21 NRRL B-21981 1998. 4. 24.
PS201Z NRRL B-21982 1998. 4. 24.
PS205A3 NRRL B-21983 1998. 4. 24.
PS205C NRRL B-21984 1998. 4. 24.
PS234E1 NRRL B-21985 1998. 4. 24.
PS248N10 NRRL B-21986 1998. 4. 24.
KB63B19-13 NRRL B-21990 1998. 4. 29
KB63B19-7 NRRL B-21989 1998. 4. 29
KB68B62-7 NRRL B-21991 1998. 4. 29
KB68B63-2 NRRL B-21992 1998. 4. 29
KB69A125-1 NRRL B-21993 1998. 4. 29
KB69A125-3 NRRL B-21994 1998. 4. 29
KB69A125-5 NRRL B-21995 1998. 4. 29
KB69A127-7 NRRL B-21996 1998. 4. 29
KB69A132-1 NRRL B-21997 1998. 4. 29
KB69B2-1 NRRL B-21998 1998. 4. 29
KB70B5-3 NRRL B-21999 1998. 4. 29
KB71A125-15 NRRL B-30001 1998. 4. 29
KB71A35-6 NRRL B-30000 1998. 4. 29
KB71A72-1 NRRL B-21987 1998. 4. 29
KB71A134-2 NRRL B-21988 1998. 4. 29
PS185Y2 NRRL B-30121 1999. 5. 4
KB59A4-6 NRRL B-
MR992 NRRL B-30124 1999. 5. 4
MR983 NRRL B-30123 1999. 5. 4
MR993 NRRL B-30125 1999. 5. 4
MR951 NRRL B-30122 1999. 5. 4
본 특허출원의 목적으로 기탁된 배양주는 본 특허출원이 계류중인 동안 37 CFR 1.14 및 35 U.S.C. 122하에 자격이 부여된 특허상표청장에 의하여 결정된 사람에게는 상기 배양에 대한 접근이 이용가능함을 보장하는 조건하에 기탁되었다. 상기 기탁은 본 출원의 counterpart 또는 그의 progeny가 출원된 국가에서 외국 특허법에 의해 요구될 때 이용가능할 것이다. 그러나, 기탁의 이용가능성은 정부의 결정에 의하여 부여받은 특허권의 훼손에 있어서 본 발명을 실행하기 위한 인허를 구성하지는 않음을 이해하여야만 한다.
또한, 본 배양주의 기탁은 미생물 기탁에 대한 부다페스트 조약의 규정에 따라 보관되고 공중에게 이용가능할 것이다. 즉, 그들은 상기 기탁의 표본 분양에 대한 가장 최근의 요구 이후 적어도 5년 동안, 그리고 어떤 경우에는 기탁일 이후 30년 동안 또는 상기 배양(들)의 개시를 공포하는 모든 특허의 시행가능한 수명 동안, 그들을 살아있는 상태로 그리고 오염되지 않은 상태로 유지하는데 필요한 모든 주의를 가지고 보관될 것이다. 기탁자들은 상기 기탁의 상태 때문에 상기 수탁자가 요구받았을 때 표본을 분양할 수 없는 경우, 상기 기탁(들)을 대체하여야 하는 의무를 양지하고 있다. 본 배양주 기탁의 공중에 의한 이용가능성에 대한 모든 제한은 그들을 개시하고 있는 특허의 등록시 비가역적으로 제거될 것이다.
본 발명에 따른 유용한 많은 균주들은 이러한 균주를 개시하고 있는 특허의 발행에 의해, 공공 콜렉션에 기탁함으로써, 또는 상업적 상품 내에 그들을 포함시킴으로써 쉽사리 이용가능하다. 예를 들면, 상업적 상품에 사용되는 B.t. 균주는 자벨린(Javelin)이며, HD 분리주는 모두 대중에 의해 이용가능하다.
여기에서 언급되는 상기 분리주의 돌연변이주(mutant)는 당업계에서 공지된 방법에 의해 만들어질 수 있다. 예를 들면, 포자비형성 돌연변이주는 한 분리주의 EMS 돌연변이유발법(ethylmethane sulfonate mutagenesis)에 의해 얻어질 수 있다. 상기 돌연변이주는 당업계에서 공지된 방법에 따라 자외선 및 니트로소구아니딘(nitrosoguanidine)을 사용하여 만들어질 수 있다.
일구현에서, 본 발명은 비포유동물 해충에 대하여 활성을 가지는 단백질 독소를 코딩하는 바실러스 유전자를 분리하고, 특성을 규명하고, 확인하기 위한 뉴클레오티드 프라이머 및 프로브를 포함하는 재료 및 방법에 관한 것이다. 여기에 기술된 상기 뉴클레오티드 서열은 또한 신규한 살충성 바실러스 분리주를 확인하는데 사용될 수 있다. 본 발명은 또한 여기에 개시된 방법 및 재료를 사용하여 확인된 유전자, 분리주, 및 독소에 관한 것이다.
여기에서 제공되는 신규한 독소 및 폴리뉴클레오티드 서열은 몇 가지 파라미터에 의해 정의된다. 여기에 기술된 독소의 한 가지 특성은 살충 활성이다. 특정 구현에서, 이러한 독소는 초시류 및/또는 인시류 해충에 대하여 활성을 가지고 있다. 본 발명의 독소 및 유전자는 그들의 아미노산 서열 및 뉴클레오티드 서열에 의해 더 정의될 수 있다. 상기 분자들의 서열은 특정한 예시화된 서열에 대한 상동성(homology)에 의해서 뿐만 아니라, 특정한 예시화된 프로브 및 프라이머와 혼성화하거나 또는 그에 의해 증폭되는 능력에 의해서 정의될 수 있다. 여기에서 제공되는 독소는 또한 특정 항체와의 면역반응성에 근거하여 확인될 수도 있다.
본 발명의 중요한 한 측면은 바실러스 독소의 신규한 패밀리, 및 이러한 독소를 코딩하는 유전자의 확인 및 특성규명이다. 이러한 패밀리는 MIS-7과 MIS-8으로 명명되었다. 신규한 WAR- 및 SUP-형 독소 패밀리 또한 여기에 개시되어 있다. 이러한 패밀리 내의 독소를 코딩하는 유전자 뿐만 아니라 이러한 패밀리 내의 독소는 여기에 기술된 바와 같이, 예를 들면 크기, 아미노산 또는 DNA 서열, 및 항체 반응성에 의해 용이하게 확인될 수 있다. 아미노산 및 DNA 서열 특성은 예시화된 서열과의 상동성, DNA 프로브와 혼성화하는 능력, 및 특이적인 프라이머로 증폭될 수 있는 능력을 포함한다.
MIS-1 패밀리의 한 유전자 및 독소(PS33F1으로부터 수득된)와 MIS-2 패밀리의 한 유전자 및 독소(PS66D3으로부터 수득된) 또한 여기에서 더 특성이 규명된다.
여기에서 확인된 신규한 독소 패밀리는 MIS-7 패밀리이다. 상기 패밀리는 B.t. 분리주 PS157C1, PS205C, 및 PS201Z로부터 수득될 수 있는 독소를 포함한다. 본 발명은 또한 상기 MIS-7 유전자 및 독소의 확인을 위한 프로브 및 프라이머를 제공한다.
또한, 여기에서 확인된 신규한 독소 패밀리는 MIS-8 패밀리이다. 상기 패밀리는 B.t. 분리주 PS31F2 및 PS185Y2로부터 수득될 수 있는 독소를 포함한다. 본 발명은 또한 상기 MIS-8 유전자 및 독소의 확인을 위한 프로브 및 프라이머를 제공한다.
바람직한 일구현에서, 상기 MIS 패밀리의 유전자는 약 70 내지 100kDa의 분자량을 가지는 독소 및, 가장 바람직하게는 약 80kDa의 크기를 가지는 독소를 코딩한다. 전형적으로, 이들 독소는 가용성이고, 여기에서 기술된 바와 같이 바실러스 배양액의 상등액으로부터 수득될 수 있다. 이들 독소는 비포유동물 해충에 대하여 독성을 가진다. 바람직한 일구현에서, 이러한 독소는 초시류 해충에 대하여 활성을 가진다. 상기 MIS 단백질은 세포에서 구멍을 형성하는 그들의 능력 때문에 더욱 유용하다. 이들 단백질은 예를 들면, 다른 단백질을 포함하는 2차 물질(entities)과 함께 사용될 수 있다. 2차 물질과 함께 사용될 때, 상기 MIS 단백질은 2차 제제의 타겟 세포 내로의 진입을 촉진할 것이다. 바람직한 일구현에서, 상기 MIS 단백질은 타겟 세포내의 MIS 수용체와 상호작용하여, 상기 타겟 세포내에서 구멍의 형성을 야기한다. 상기 2차 물질은 세포내로 도입시키기를 원하는 독소 또는 다른 분자일 수 있다.
본 발명은 또한 WAR-형 독소라고 명명된 독소 패밀리에 관한 것이다. 상기 WAR 독소는 전형적으로 약 30 내지 50kDa의 크기를 가지고 있으며, 가장 전형적으로는 약 40kDa의 크기를 가지고 있다. 전형적으로 이들 독소는 가용성이고, 여기에서 기술된 바대로 바실러스 배양액의 상등액으로부터 수득될 수 있다. 상기 WAR 독소는 여기에 기술된 프라이머 뿐만 아니라 항체를 가지고 확인될 수 있다.
본 발명에 따라 제공되는 추가적인 독소 패밀리는 SUP-형 독소라 명명된 독소이다. 전형적으로, 이들 독소는 가용성이고, 여기에서 기술된 바대로 바실러스 배양액의 상등액으로부터 수득될 수 있다. 바람직한 일구현에서, 상기 SUP 독소는 인시류 해충에 대하여 활성을 가진다. 상기 SUP 독소는 전형적으로 70 내지 100kDa, 바람직하게는 약 80kDa의 크기를 가지고 있다. 상기 SUP 패밀리는 KB59A4-6 분리주로부터 유래된 독소에 의해 여기에 예시화된다. 본 발명은 SUP 패밀리의 독소 및 유전자의 확인에 유용한 프로브 및 프라이머를 제공한다.
본 발명은 또한 추가적인 MIS, WAR, 및 SUP 독소 및 유전자를 포함하는, 추가적인 바실러스 독소 및 유전자를 제공한다.
상기 MIS, WAR, 및 SUP 패밀리의 독소는 모두 가용성이고, 여기에서 기술된 바대로 바실러스 배양액의 상등액으로부터 수득될 수 있다. 이들 독소는 단독으로 또는 다른 독소와 함께 해충을 방제하는데 사용될 수 있다. 예를 들면, MIS 패밀리로부터 유래된 독소는 해충, 특히 초시류 해충의 방제를 달성하기 위하여 WAR-형 독소와 함께 사용될 수 있다 이들 독소는 또한 예를 들면, 바실러스 분리주로부터 수득된 δ-엔도톡신과 함께 사용될 수 있다.
하기 표 2는 본 발명의 신규한 패밀리의 독소 및 유전자를 요약하여 나타낸 것이다. 특정 MIS 패밀리가 하기 표 2에서 보여지는 개개의 B.t. 분리주로부터 수득될 수 있는 독소에 의하여 여기에 특별히 예시화되어 있다. 이들 패밀리 각각에 있는 독소를 코딩하는 유전자는 표 2에 개시된 특정 프로브와 혼성화하는 능력을 포함하여 다양한 매우 특이적인 파라미터들에 의해 확인될 수 있다. 표 2에 개시된 프로브에 대하여 약 80%를 초과하는 서열상동성 또한 다양한 패밀리의 유전자를 확인하는데 사용될 수 있다. 또한 본 발명의 유전자를 증폭하는데 사용될 수 있는 개개의 프라이머 쌍도 예시화되어 있다. 나타낸 패밀리 내의 유전자의 한 부분은 전형적으로 하기에 열거된 프라이머 쌍 중의 적어도 하나로 증폭가능하다. 바람직한 일구현에서, 상기 증폭된 부분은 거의 표시된 단편(fragment) 크기일 것이다. 하기 표 2에서 보여지는 프라이머는 여기에 첨부된 서열목록에서 보여지는 펩티드를 코딩하는 폴리뉴클레오티드 서열로 이루어져 있다. 추가적인 프라이머 및 프로브를 당업계에서 통상의 지식을 가진 자가 용이하게 구축(construct)하여, 동일한 아미노산 서열을 코딩하는 대체 폴리뉴클레오티드 서열이 살충성 독소를 코딩하는 추가적인 유전자의 확인 및/또는 특성규명에 사용되도록 할 수 있다. 바람직한 일구현에서, 이러한 추가적인 독소, 및 그들의 유전자는 바실러스 분리주로부터 수득될 수 있다.
패밀리 분리주 프로브(서열) 프라이머 쌍(서열) 단편 크기(nt)
MIS-1 PS33F1 37 13 및 2213 및 2314 및 23 69506458
MIS-2 PS66D3 5 16 및 2416 및 2516 및 2616 및 2716 및 2817 및 2517 및 2617 및 2717 및 2818 및 2618 및 2718 및 2819 및 2719 및 2820 및 28 160239400509703102263372566191300494131325213
MIS-7 PS205CPS157C1(157C1-A)PS201Z 33, 35 29 및 30 598
MIS-8 PS31F2, PS185Y2 36, 37 31 및 32 585
SUP KB59A4-6 1 51 및 52
아울러, 본 발명에 따르면 키메라 독소가 사용될 수 있다. B.t. 단백질의 부분들을 결합함으로써 유용한 키메라 독소를 만들기 위한 방법이 개발되어 왔다. 결합되는 부분들은 부분들의 조합이 살충성을 가지는 키메라 단백질을 생성하는 한, 그들 자체가 살충성일 필요는 없다. 이것은 예를 들면, 유럽특허 0 228 838; 게 등의 문헌(참조: Ge, A.Z., N.L. Shivarova, D.H. Dean [1989] Proc. Natl. Acad. Sci. USA 86:4037-4041); 게 등의 문헌(참조: Ge, A.Z., D. Rivers, R. Milne, D.H. Dean [1991] J. Biol. Chem. 266:17954-17958); 슈네프 등의 문헌(참조: Schnepf, H.E., K. Tomczak, J.P. Ortega, H.R. Whiteley [1990] J. Biol. Chem. 265:20923-20930); 및 호네 등의 문헌(참조: Honee, G., D. Convents, J. Van Rie, S. Jansens, M. Peferoen, B. Visser [1991] Mol. Microbiol. 5:2799-2806)에 기술된 바와 같이 제한 효소를 사용하여 이루어질 수 있다. 이와 달리, 세포 재조합(cellular recombination) 메카니즘을 사용한 재조합이 유사한 결과를 이루기 위하여 사용될 수 있다(참조: 예를 들면, Caramori, T., A.M. Albertini, A. Galizzi [1991] Gene 98:37-44; Winder, W.R., H.R. Whiteley [1990] J. Bacteriol. 172:2826-2832; Bosch, D., B. Schipper, H. van der Kliej, R.A. de Maagd, W.J. Stickema [1994] Biotechnology 12:915-918). 키메라 DNA를 만들 수 있는 많은 다른 방법이 당업계에서 알려져 있다. 본 발명은 본 출원에서 확인된 신규한 서열을 활용한 키메라 단백질을 포함한다.
여기에 제공되는 가르침에 따라, 당업계에서 통상의 지식을 가진 자는 여기에 기술된 다양한 독소 및 폴리뉴클레오티드 서열을 용이하게 생산하고 사용할 수 있을 것이다.
유전자 및 독소
본 발명에 따른 유용한 유전자 및 독소는 전체 길이의 서열 뿐만 아니라 이러한 서열, 변이체(variant), 돌연변이체(mutant), 및 여기에 특별히 예시화된 독소의 특징적인 살충 활성을 보유하고 있는 융합 단백질을 포함한다. 하나 이상의 바실러스 독소 또는 유전자로부터 유래된 부분들을 결합하여 생산된 키메라 유전자 및 독소 또한 본 발명의 가르침에 따라 이용될 수 있다. 여기에서 사용된 "변이체(variant)"라는 용어는 타겟 해충에 대하여 예시화된 독소와 동일하거나 또는 근본적으로 동일한 생물학적 활성을 가지는 독소를 의미한다. 예를 들면, 미국특허 제 5,605,793호는 임의적인 단편화(random fragmentation) 후에 DNA를 재조립함으로써 추가적인 분자 다양성을 생성하는 방법을 개시하고 있다.
활성이 있는 독소를 코딩하는 유전자가 몇 가지 수단을 통해 확인되고 수득될 수 있음은 당업계에서 통상의 지식을 가진 자에게 분명하다. 여기에 예시화된 특정 유전자는 상술한 바대로 배양 수탁자에게 기탁된 분리주로부터 수득될 수 있다. 이러한 유전자, 또는 그들의 부분 또는 변이체 또한 예를 들면 유전자 합성기를 사용하여 합성적으로 구축될 수 있다. 유전자의 변이체는 점 돌연변이를 만들기 위한 표준 기술을 사용하여 용이하게 구축될 수 있다. 또한, 이들 유전자의 단편은 표준 방법에 따라 상업적으로 이용가능한 엑소뉴클라아제 또는 엔도뉴클라아제를 사용하여 만들어질 수 있다. 예를 들면, Bal31과 같은 효소 또는 부위-특이적 돌연변이유발법(site-directed mutagenesis)이 이러한 유전자의 말단으로부터 뉴클레오티드를 정연하게 절단하는데 사용될 수 있다. 또한, 활성이 있는 단편을 코딩하는 유전자를 다양한 제한효소를 사용하여 수득할 수 있다. 이들 독소의 활성이 있는 단편을 직접적으로 수득하기 위하여 프로테아제를 사용할 수도 있다.
균등한 독소 및/또는 이들 균등한 독소를 코딩하는 유전자는 여기에 제공되는 가르침을 사용하여 바실러스 분리주 및/또는 DNA 라이브러리로부터 유래될 수 있다. 본 발명의 살충성 독소를 수득하기 위한 많은 방법들이 있다. 예를 들면, 여기에 개시하고 청구된 살충성 독소에 대한 항체를 단백질 혼합물로부터 독소를 확인하고 분리하는데 사용할 수 있다. 특히, 항체는 가장 일정(constant)하고 다른 바실러스 독소와 가장 상이한 독소의 부분에 대하여 생성될 수 있다. 이러한 항체는 이어서 면역침강법, ELISA(enzyme-linked immunosorbent assay), 또는 웨스턴 블랏으로 특징적인 활성을 가지고 있는 균등한 독소를 확인하는데 사용될 수 있다. 여기에 개시된 독소, 또는 균등한 독소에 대한 항체는 당업계에서의 표준 방법을 사용하여 용이하게 제조될 수 있다. 이러한 독소를 코딩하는 유전자는 이어서 상기 미생물로부터 수득될 수 있다.
예시화된 독소의 살충 활성을 보유하고 있는 단편 및 등가물은 본 발명의 범위 내에 있다. 또한, 유전자 코드의 중복성(redundancy)때문에, 다양한 상이한 DNA 서열이 여기에 개시된 아미노산 서열을 코딩할 수 있다. 동일한, 또는 근본적으로 동일한 독소를 코딩하는 이러한 대체 DNA 서열을 생성하는 것은 당업계에서 통상의 지식을 가진 자의 기술 내에 있다. 이러한 변이 DNA 서열은 본 발명의 범위 내에 있다. 여기에서 사용된, "근본적으로 동일한(essentially the same)" 서열은 살충 활성에 실질적으로 영향을 주지 않는 아미노산 치환, 결실, 추가, 또는 삽입을 의미한다. 살충 활성을 보유하고 있는 단편 또한 이러한 정의내에 포함된다.
본 발명의 독소 및 유전자를 확인하기 위한 추가적인 방법은 올리고뉴클레오티드 프로브를 사용하여 이루어진다. 이러한 프로브는 검출가능한 뉴클레오티드 서열이다. 프로브는 본 발명의 독소-코딩 유전자의 확인을 위한 신속한 방법을 제공한다. 본 발명에 따라 프로브로 사용되는 뉴클레오티드 단편은 DNA 합성기 및 표준 방법을 사용하여 합성될 수 있다.
본 발명의 특정 독소는 특별히 여기에 예시화되어 있다. 이러한 독소는 본 발명의 독소의 단순한 예이므로, 본 발명이 상기 예시화된 독소와 동일하거나 유사한 살충 활성을 가지는 변이체 또는 균등한 독소(및 균등한 독소를 코딩하는 뉴클레오티드 서열)를 포함한다는 것은 분명하다. 균등한 독소는 예시화된 독소와 아미노산 상동성을 가질 것이다. 이러한 아미노산 상동성은 전형적으로 60% 이상, 바람직하게는 75% 이상, 보다 바람직하게는 80% 이상, 보다 바람직하게는 90% 이상일 것이며, 95% 이상일 수 있다. 이러한 상동성은 표준 정렬(alignment) 기술을 사용하여 결정된다. 아미노산 상동성은 생물학적 활성을 나타내거나 또는 생물학적 활성에 궁극적으로 책임이 있는 3차원 형태의 결정에 포함되는 독소의 중요한 영역에서 가장 높을 것이다. 이와 관련하여, 어떤 아미노산 치환은 허용가능하며, 이러한 치환이 활성에 결정적이지 않은 영역에 있거나 또는 분자의 3차원 형태에 영향을 주지 않는 보존적(conservative) 아미노산 치환이라면 예상될 수 있다. 예를 들면, 아미노산은 다음 부류 내에 위치할 수 있다: 비극성, 전하를 띠지 않은 극성, 염기성, 및 산성. 한 부류의 아미노산이 동일형의 다른 아미노산으로 교체되는 보존적 치환은, 상기 치환이 실질적으로 그 화합물의 생물학적 활성을 변화시키지 않는 한 본 발명의 범위 내에 있다. 하기 표 3은 각 부류에 속하는 아미노산 예의 목록이다.
아미노산 부류 아미노산의 예
비극성 Ala, Val, Leu, Ile, Pro, Met, Phe, Trp
전하를 띠지 않은 극성 Gly, Ser, Thr, Cys, Tyr, Asn, Gln
산성 Asp, Glu
염기성 Lys, Arg, His
어떤 경우에, 비보존적인 치환 또한 만들어질 수 있다. 결정적인 요인은 이러한 치환이 상기 독소의 생물학적 활성을 심각하게 저하시키지 않아야 한다는 것이다.
본 발명의 δ-엔도톡신은 또한 상술한 독소 봉입체(inclusion)의 형태 및 위치에 의해 특징지어질 수 있다.
여기에서 사용되는 "분리된" 폴리뉴클레오티드 및/또는 "정제된" 독소란 이들 분자가 자연계에서 함께 발견될 수 있는 다른 분자와 결합해 있지 않을 때의 분자를 의미한다. 따라서, "분리된 및 정제된"은 여기에 기술되는 "인간의 손길(hand of man)"의 개입을 뜻한다. 키메라 독소 및 유전자 또한 "인간의 손길"을 의미한다.
재조합 숙주
본 발명의 독소-코딩 유전자는 다양한 미생물 또는 식물 숙주내로 도입될 수 있다. 상기 독소 유전자의 발현은 직접적으로 또는 간접적으로 살충제의 생산 및 유지를 초래한다. 적절한 미생물 숙주, 예를 들면 슈도모나스(Pseudomonas)를 가지고, 상기 미생물은 그들이 증식하고 소화될 해충 부위에 적용될 수 있다. 그 결과는 해충의 방제이다. 이와 달리, 독소 유전자의 숙주가 되는 미생물은 독소의 활성을 지속시키고 세포를 안정화하는 조건하에서 죽여서 처리될 수 있다. 처리된 독소 활성을 보유하고 있는 세포는 이어서 타겟 해충이 있는 환경에 적용될 수 있다.
바실러스 독소 유전자가 적절한 벡터를 통해 미생물 숙주 내로 도입되고, 상기 숙주가 살아있는 상태로 환경에 도입되는 경우, 특정 숙주 미생물을 사용하는 것이 필수적이다. 관심있는 하나 또는 그 이상의 농작물의 "phytosphere"(phylloplane, phyllosphere, rhizosphere, 및/또는 rhizoplane)를 차지하는 것으로 알려진 미생물 숙주가 선택된다. 이러한 미생물은 특정 환경에서 야생형(wild-type) 미생물과 성공적으로 경쟁할 수 있고, 폴리펩티드 살충제를 발현하는 유전자의 안정된 유지 및 발현을 제공하고, 및 바람직하게는 상기 살충제의 환경적인 분해 및 불활성화로부터의 향상된 보호를 제공하도록 선택된다.
다수의 미생물이 다양한 중요 농작물의 필로플레인(식물 잎의 표면) 및/또는 리조스피어(식물 뿌리 주위의 토양)에 살고 있는 것으로 알려져 있다. 이러한 미생물은 박테리아, 조류(algae), 및 곰팡이류(fungi)를 포함한다. 박테리아, 예를 들면 제네라 슈도모나스(genera Pseudomonas), 어위니아(Erwinia), 세라티아(Serratia), 크산토모나스(Xanthomonas), 스트렙토마이세스(Streptomyces), 리조비움(Rhizobium), 로도슈도모나스(Rhodopseudomonas), 메틸로필러스(Methylophilus), 아그로박테리움(Agrobacterium), 아세토박터(Acetobacter), 락토바실러스(Lactobacillus), 아쓰로박터(Arthrobacter), 아조토박터(Azotobacter), 류코노스톡(Leuconostoc), 및 알칼리제네스(Alcaligenes); 및 곰팡이류, 특히 효모, 예를 들면 제네라 사카로마이세스(genera Saccharomyces), 크립토코커스(Cryptococcus), 클류버로마이세스(Kluyveromyces), 스포로볼로마이세스(Sporobolomyces), 로도토룰라(Rhodotorula), 및 아우레오바시디움(Aureobasidium)와 같은 미생물이 특히 중요하다. 슈도모나스 시린재(Pseudomonas syringae), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 세라티아 마르세센스(Serratia marcescens), 아세토박터 자일리눔(Acetobacter xylinum), 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens), 로도슈도모나스 스페로이데스(Rhodopseudomonas spheroides), 크산토모나스 캄페스트리스(Xanthomonas campestris), 리조비움 멜리오티(Rhizobium melioti), 알칼리제네스 엔트로퍼스(Alcaligenes entrophus), 및 아조토박터 빈란디(Azobacter vinlandii)와 같은 피토스피어 박테리아 종; 및 로도토룰라 루브라(Rhodotorula Rubra), 로도토룰라 글루티니스(R. glutinis), 로도토룰라 마리나(R. marina), 로도토룰라 아우란티아카(R. aurantiaca), 크립토코커스 알비더스(Cryptococcus albidus), 크립토코커스 디풀루엔스(C. diffluens), 크립토코커스 라우렌티(C. laurentti), 사카로마이세스 로자이(Saccharomyces rosei), 사카로마이세스 프레토리엔시스(S. pretoriensis), 사카로마이세스 세레비지애(S. cerevisiae), 스포로볼로마이세스 로제우스(Sporobolomyces roseus), 스포로볼로마이세스 오도루스(S. odorus), 클류버로마이세스 베로내(Kluyveromyces veronae), 및 아우레오바시디움 폴루란스(Aureobasidium pollulans)와 같은 피토스피어 효모 종이 특히 중요하다. 색소를 함유한 미생물이 특히 중요하다.
독소를 코딩하는 바실러스 유전자를 그 유전자의 안정적인 유지 및 발현을 허용하는 조건하에서 미생물 숙주 내로 도입하기 위하여 다양한 방법이 이용가능하다. 이러한 방법은 당업계에서 통상의 지식을 가진 자에게 잘 알려져 있으며, 예를 들면 여기에 참조문헌으로 포함된 미국특허 제 5,135,867호에 기술되어 있다.
본 발명의 독소와 기능적으로 균등한 합성 유전자 또한 숙주를 형질감염시키는데 사용될 수 있다. 합성 유전자를 생산하기 위한 방법은 예를 들면 미국특허 제 5,380,831호에서 찾아볼 수 있다.
세포의 처리
상기에서 언급한 같이, 바실러스 또는 바실러스 독소를 발현하는 재조합 세포는 독소 활성을 지속시키고 세포를 안정화하도록 처리될 수 있다. 형성된 살충제 마이크로캡슐은 안정화되었으며 상기 마이크로캡슐이 타겟 해충이 있는 환경에 적용될 때 독소를 보호해줄 세포 구조 내에 있는 바실러스 독소를 포함한다. 적절한 숙주 세포는 원핵세포 또는 진핵세포를 포함할 수 있다. 숙주로서, 원핵세포와 곰팡이류 같은 하등 진핵세포가 특히 중요할 것이다. 세포는 일반적으로 완전하며, 처리될 때 실질적으로 포자 형태보다는 증식 형태에 있을 것이다.
미생물 세포, 예를 들면 바실러스 독소 유전자를 포함하는 미생물의 처리는, 처리기술이 독소의 특성을 저하시키지 않고 상기 독소를 보호하는 세포의 능력을 감소시키지 않는 한, 화학적 또는 물리적 수단, 또는 화학적 및/또는 물리적 수단의 조합에 의해 이루어질 수 있다. 미생물 세포의 처리 방법은 여기에 참조문헌으로 포함된 미국특허 제 4,695,455호 및 제 4,695,462호에 개시되어 있다.
해충 방제를 위한 방법 및 조성물(formulations)
본 발명의 분리주, 독소, 및 유전자를 사용한 해충의 방제는 당업계에서 통상의 지식을 가진 자에게 공지된 다양한 방법에 의하여 이루어질 수 있다. 이러한 방법은 예를 들면, 바실러스 분리주의 해충(또는 그들의 소재지)에의 적용, 재조합 미생물의 해충(또는 그들의 소재지)에의 적용, 및 본 발명의 살충성 독소를 코딩하는 유전자로의 식물의 형질전환(transformation)을 포함한다. 형질전환은 표준 기술을 사용하여 당업계에서 통상의 지식을 가진 자에 의하여 이루어질 수 있다. 이러한 형질전환에 필요한 재료는 여기에 개시되어 있거나 또는 그렇지 않다면 통상의 지식을 가진 자에게 용이하게 이용가능하다.
유인물질(attractant) 및 바실러스 분리주의 독소를 포함하는 조성물화된(formulated) 먹이 과립, 또는 여기에 개시된 바실러스 분리주로부터 수득가능한 유저자를 포함하는 재조합 미생물이 토양에 적용될 수 있다. 조성물화된 제품은 또한 농작물 주기의 후기 단계에서 종자-코팅제, 뿌리 처리제, 또는 전체 식물의 처리제로서 적용될 수 있다. 바실러스 세포로 된 식물 및 토양 처리제는 유기 미네랄(필로실리케이트, 카보네이트, 설페이트, 포스페이트 등) 또는 식물성 물질(분말화된 옥수수 속대, 쌀겨, 호두 껍질 등)과 같은 다양한 불활성 물질과 혼합함으로써, 젖을 수 있는 파우더, 과립 또는 분말로서 사용될 수 있다. 상기 조성물은 분무기-스티커 매질(adjuvant), 안정화제, 다른 살충 첨가제, 또는 계면활성제를 포함할 수 있다. 액상 조성물은 수성계 또는 비수성계일 수 있으며, 거품, 젤, 현탁액, 유상액화 될 수 있는 농축물 등으로서 사용될 수 있다. 유동학적 제제, 계면활성제, 유상액화제, 분산제, 또는 중합체가 성분으로 포함될 수 있다.
당업계에서 통상의 지식을 가진 자가 이해하고 있듯이, 살충제 농도는 특정 조성물의 성질, 특히 그 조성물이 농축물인지 또는 직접 사용될 것인지의 여부에 따라 매우 다양할 수 있다. 상기 살충제는 적어도 1 중량%로 존재할 것이며, 100 중량%일 수도 있다. 상기 액상 조성물이 일반적으로 액체상 중에 고형성분을 약 1 내지 60 중량% 포함하는 것에 반하여, 건조한 조성물은 상기 살충제를 약 1 내지 95 중량% 포함할 것이다. 세포를 함유하는 조성물은 일반적으로 약 102내지 104세포/㎎를 포함할 것이다. 이러한 조성물은 헥타르 당 50㎎(액상 또는 건조한 형태) 내지 1㎏ 또는 그 이상으로 사용될 수 있다.
상기 조성물은 분무, 살포, 흩뿌림 등에 의해 해충이 있는 환경, 예를 들면 토양 및 잎에 적용될 수 있다.
폴리뉴클레오티드 프로브
DNA가 염기 상보성(base complementarity)이라고 불리는 중요한 특성을 가지고 있음이 잘 알려져 있다. 자연계에서, DNA는 일반적으로 역평행(anti-parallel) 가닥 쌍의 형태로 존재하는데, 각 가닥의 염기는 그 가닥으로부터 다른 가닥을 향하여 뻗어있다. 한 가닥에 있는 아데닌(A) 염기는 항상 다른 가닥에 있는 티미딘(T) 염기에 대하여 반대쪽에 위치하고, 구아니딘(G) 염기는 시토신(C) 염기에 대하여 반대쪽에 위치할 것이다. 상기 염기들은 이러한 특이적인 방식으로 수소결합할 수 있는 그들의 능력에 의하여 반대편에 고정된다. 각각의 개별 결합이 상대적으로 약할 지라도, 다수의 인접한 수소결합된 염기의 전체적인 효과가 염기 층 효과(base stacking effect)와 함께 두 개의 상보적인 가닥을 안정적으로 연결한다. 이러한 결합은 높은 pH 또는 고온과 같은 처리에 의하여 깨질 수 있으며, 이러한 상황은 상기 두 가닥의 분리, 즉 "변성(denaturation)"을 초래한다. 만약 DNA가 이어서 열역학적으로 선호되는 염기의 수소결합을 형성하는 조건하에 놓인다면, DNA 가닥은 복원(anneal), 즉 "혼성화(hybridize)"하여, 원래의 이중가닥 DNA를 재형성할 것이다. 적절한 조건하에서 수행된다면, 이러한 혼성화는 매우 특이적일 수 있다. 즉, 고도의 염기 상보성을 가지는 가닥만이 안정한 이중 가닥 구조를 형성할 수 있을 것이다. 반응 조건과 혼성화 특이성의 관계는 잘 알려져 있다. 따라서, 혼성화는 두 조각의 DNA가 그들의 염기 서열에 있어 상보적인지 여부를 테스트하는데 사용될 수 있다. 이러한 혼성화 메카니즘이 본 발명의 프로브를 사용하여 관심있는 DNA 서열을 쉽사리 검출하고 특성을 규명하는 것을 용이하게 한다.
상기 프로브는 RNA, DNA 또는 PNA(peptide nucleic acid)일 수 있다. 상기 프로브는 보통 적어도 약 10개 염기, 보다 일반적으로는 적어도 약 17개 염기를 가질 것이며, 약 100개 또는 그 이상의 염기까지 가질 수 있다. 더 긴 프로브를 쉽사리 이용할 수 있으며, 그러한 프로브는 예를 들면, 길이가 수 kb일 수 있다. 상기 프로브 서열은 적어도 관심있는 독소를 코딩하는 유전자의 한 부분과 실질적으로 상보적이도록 고안된다. 상기 프로브는 그것이 혼성화할 서열에 대하여 완벽하게 상보적일 필요는 없다. 상기 프로브는 당업계에서 통상의 지식을 가진 자에게 공지된 기술을 이용하여 표지되어도 좋다.
본 발명을 프로브로서 사용하기 위한 한 가지 접근방법은 바실러스 분리주 유전자 뱅크의 서던 블랏 분석에 의해 개시된 뉴클레오티드 서열과 상동적인 모든 DNA 단편을 우선 확인하는 과정을 수반한다. 따라서, 생물학적 분석 없이, 많은 신규한 바실러스 분리주 및 주어진 바실러스 분리주에 의하여 발현되는 개개의 유전자 산물의 있음직한 활성을 미리 아는 것이 가능하다. 그러한 프로브 분석은 다양한 B.t. 아종 내의 잠재적으로 상업적으로 가치있는 살충성 독소 유전자를 확인하는 신속한 방법을 제공한다.
본 발명에 따른 한 가지 혼성화 방법은 전형적으로 관심있는 DNA 표본을 분리하고 그것을 화학적으로 정제하는 초기 단계를 포함한다. 용해된(lysed) 박테리아 또는 박테리아로부터 분리된 분획된(fractionated) 핵산 전체가 사용될 수 있다. 세포는 그들의 DNA(및/또는 RNA)를 유리시키기 위하여 공지의 기술을 사용하여 처리될 수 있다. 상기 DNA 표본은 적절한 제한효소에 의해 조각으로 절단될 수 있다. 상기 조각은 젤, 일반적으로 아가로오스 또는 아크릴아미드 젤에서의 전기영동을 통해 크기에 따라 분리될 수 있다. 관심있는 조각은 고정화용 막으로 전달될 수 있다.
특별한 혼성화 기술이 본 발명에 필수적인 것은 아니다. 혼성화 기술에 있어 향상이 이루어진 경우, 그들을 곧바로 적용할 수 있다.
상기 프로브 및 표본은 이어서 혼성화 완충용액 내에서 결합되어, 서냉복원(annealing)이 일어날 때까지 적절한 온도에서 유지된다. 그런 다음, 상기 막을 이물질이 없도록 세척하여, 상기 표본 및 결합된 프로브 분자를 전형적으로 자동방사선 사진술 및/또는 LSC(liquid scintillation counting)에 의해 검출 및 정량될 상태로 남겨둔다. 당업계에서 공지된 바와 같이, 만약 상기 프로브 분자와 핵산 표본이 두 분자간의 강력한 비공유 결합에 의해 혼성화한다면, 상기 프로브와 표본이 근본적으로 동일함을 합리적으로 추측할 수 있다. 상기 프로브의 검출가능한 라벨은 혼성화가 일어났는지 여부를 알려진 방식으로 결정하기 위한 수단을 제공한다.
뉴클레오티드 단편을 프로브로 사용함에 있어서, 특정 프로브는 방사성 및 비방사성 라벨을 포함하여 당업계에서 통상의 지식을 가진 자에게 알려진 어떤 적절한 라벨로 표지된다. 전형적인 방사성 라벨은32P,35S 등을 포함한다. 비방사성 라벨은 예를 들면, 가수분해 효소 또는 퍼옥시다아제와 같은 효소뿐만 아니라, 비오틴이나 티록신과 같은 리간드, 루시페린과 같은 다양한 화학적 발광물질, 또는 플루오레신(fluorescein) 및 그의 유도체와 같은 형광 화합물을 포함한다. 상기 프로브는 국제공개 제 93/16095호에 기술된 대로 원래부터 형광성으로 제조될 수 있다.
다양한 정도의 혼성화 스트린젠시(stringency)가 사용될 수 있다. 조건이 가혹할수록, 이중가닥을 형성하기 위하여 더 큰 상보성이 요구된다. 가혹성(severity)은 온도, 프로브 농도, 프로브 길이, 이온 강도, 시간 등에 의해 조절될 수 있다. 바람직하게는, 혼성화는 예를 들면 켈러 등의 문헌(참조: Keller, G.H., M.M. Manak [1987] DNA Probes, Stockton Press, New York, NY., pp.169-170)에 기술된 바와 같이 당업계에서 공지된 기술에 의해 적당한 내지 높은 스트린젠시 조건하에서 수행된다.
여기에서 사용된 "적당한 내지 높은 스트린젠시(moderate to high stringency)" 혼성화 조건은 본 출원에 의하여 사용된 조건과 동일하거나 또는 거의 동일한 정도의 혼성화 특이성을 달성할 수 있는 조건을 의미한다. 적당한 및 높은 스트린젠시 조건의 예가 여기에 제공된다. 상세하게는, 서던 블랏 상에 고정된 DNA와32P로 표지된 유전자-특이적 프로브의 혼성화는 표준 방법(참조: Maniatis et al.)에 의해 수행된다. 일반적으로, 혼성화 및 뒤이은 세척은 예시화된 독소 유전자와 상동적인 타겟 서열의 검출을 위하여 허용되는 적당한 내지 높은 스트린젠시 조건하에서 수행되었다. 이중가닥 DNA 유전자 프로브의 경우, 혼성화는 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1㎎/㎖의 변성된 DNA 내에서 DNA 하이브리드의 Tm(melting temperature)으로부터 20 내지 25℃ 이하의 온도에서 밤새도록 수행되었다. 상기 Tm은 다음의 공식에 의해 기술된다(참조: Beltz, G.A., K.A. Jacobs, T.H. Eickbush, P.T. Cherbas, and F.C. Kafatos [1983] Methods of Enzymology, R. Wu, L. Grossman and K. Moldave [eds.] Academic Press, New York 100:266-285).
Tm = 81.5℃+16.6 Log[Na+]+0.41(%G+C)-0.61(%포름아미드)-600/이중가닥의 염기쌍 길이
세척은 전형적으로 하기와 같이 수행된다:
(1) 1XSSPE, 0.1%SDS 내에서 15분 동안 실온에서 2회(낮은 스트린젠시 세척)
(2) 0.2XSSPE, 0.1%SDS 내에서 15분 동안 Tm-20℃에서 1회(적절한 스트린젠시 세척)
올리고뉴클레오티드 프로브의 경우, 혼성화는 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1㎎/㎖의 변성된 DNA 내에서 DNA 하이브리드의 Tm(melting temperature)으로부터 10 내지 20℃ 이하의 온도에서 밤새도록 수행되었다. 올리고뉴클레오티드 프로브의 Tm은 다음의 공식에 의하여 결정되었다.
Tm(℃) = 2(T/A 염기쌍의 수)+4(G/C 염기쌍의 수)(참조: Suggs, S.V., T. Miyake, E.H. Kawashime, M.J. Johnson, K. Itakura, and R.B. Wallace [1981] ICN-UCLA Symp. Dev. Biol. Using Purified Genes, D.D. Brown [ed.], Academic Press, New York, 23:683-693).
세척은 전형적으로 하기와 같이 수행된다:
(1) 1XSSPE, 0.1%SDS 내에서 15분 동안 실온에서 2회(낮은 스트린젠시 세척)
(2) 0.2XSSPE, 0.1%SDS 내에서 15분 동안 상기 혼성화 온도에서 1회(적절한 스트린젠시 세척)
일반적으로, 염 및/또는 온도는 스트린젠시를 바꾸기 위하여 변화될 수 있다. 길이가 >70 또는 그쯤되는 표지된 DNA 단편의 경우, 하기와 같은 조건이 사용될 수 있다.
낮은: 1 또는 2X SSPE, 실온
낮은: 1 또는 2X SSPE, 42℃
적절한: 0.2X 또는 1X SSPE, 65℃
높은: 0.1X SSPE, 65℃
이중가닥 형성 및 안정성은 하이브리드의 두 가닥간의 실질적인 상보성에 의존하며, 상기에서 언급한 바와 같이 어느 정도의 미스매치는 견딜 수 있다. 따라서, 본 발명의 프로브 서열은 돌연변이(단일 또는 다수의), 결실, 상술한 서열의 삽입, 및 그들의 조합을 포함하며, 여기에서 상기 돌연변이, 삽입 및 결실은 관심있는 타겟 폴리뉴클레오티드와의 안정한 하이브리드의 형성을 허용한다. 돌연변이, 삽입 및 결실은 다양한 방식으로 주어진 폴리뉴클레오티드 서열내에 생산될 수 있으며, 이러한 방법은 당업계에서 통상의 지식을 가진 자에게 알려져 있다. 다른 방법도 미래에 알려질 수 있다.
이와 같이, 개시된 뉴클레오티드 서열의 돌연변이성, 삽입성, 및 결실성 변이체는 당업계에서 통상의 지식을 가진 자에게 공지된 방법에 의해 용이하게 제조될 수 있다. 이러한 변이체는 상기 변이체가 원래의 서열과 실질적인 서열 상동성을 가지고 있는 한, 예시화된 프라이머 서열과 동일한 방식으로 사용될 수 있다. 여기에서 사용된 실질적인 서열 상동성이란 상기 변이체 프로브가 원래의 프로브와 동일한 능력으로 기능하는 것을 가능케하는데 충분한 상동성을 의미한다. 바람직하게는, 이러한 상동성은 50% 이상이며, 보다 바람직하게는 이러한 상동성은 75% 이상이며, 가장 바람직하게는 이러한 상동성은 90% 이상이다. 상기 변이체가 그의 의도된 능력으로 기능하는데 필요한 상동성 정도는 그 서열의 의도된 용도에 의존한다. 상기 서열의 기능을 향상하거나 또는 그렇지 않으면 방법론적인 이익을 제공하도록 고안된 돌연변이성, 삽입성, 및 결실성 돌연변이체를 만드는 것은 당업계에서 통상의 지식을 가진 자의 기술 내에 있다.
PCR 기술
DNA 중합효소 연쇄반응(PCR)은 반복적이며, 효소적인 핵산 서열의 프라이민된 합성(primed synthesis)이다. 상기 방법은 당업계에서 통상의 지식을 가진 자에게 잘 알려져 있으며, 통상적으로 사용된다(참조: 미국특허 제 4,683,195호, 제 4,683,202호, 및 제 4,800,159호; Saiki, Randall K., Stephen Scharf, Fred Faloona, Kary B. Mullis, Glenn T. Horn, Henry A. Erlich, Norman Arnheim [1985] "Enzymatic Amplification of β-Globin Genomic Sequences and Restriction Site Analysis for Diagnosis of Sickle Cell Anemia," Science 230:1350-1354). PCR은 타겟 서열의 반대되는 가닥에 혼성화하는 두 개의 올리고뉴클레오티드 프라이머에 의해 측접되는 관심있는 DNA 단편의 효소적인 증폭에 기초한다. 상기 프라이머들은 서로를 향하여 3' 말단을 가리키도록 방향이 정해진다. 주형(template)의 열 변성, 상기 프라이머의 그들의 상보적인 서열에의 서냉복원, 및 DNA 중합효소에 의한 상기 서냉복원된 프라이머의 신장(extension)의 반복적인 주기는 상기 PCR 프라이머의 5' 말단에 의해 지정된 단편의 증폭을 초래한다. 각 프라이머의 신장 산물은 다른 한 프라이머의 주형으로서 작용하기 때문에, 각 주기는 근본적으로 이전 주기에서 생산된 DNA 단편의 양을 두 배로 늘린다. 이는 수 시간 내에 수백만 배까지 특정 타겟 단편의 지수적인 축적을 초래한다. 호열성 박테리아인 써무스 아쿠아티쿠스(Thermus aquaticus)로부터 분리된 Taq 중합효소와 같은 열에 안정한 DNA 중합효소를 사용함으로써, 상기 증폭 과정은 완전히 자동화될 수 있다. 사용될 수 있는 다른 효소들은 당업계에서 통상의 지식을 가진 자에게 공지되어 있다.
본 발명의 DNA 서열은 PCR 증폭의 프라이머로서 사용될 수 있다. PCR 증폭을 수행함에 있어서, 프라이머와 주형 간의 어느 정도의 미스매치는 견딜 수 있다. 따라서, 상기 예시화된 프라이머들의 돌연변이, 결실, 및 삽입(특히 5' 말단에의 뉴클레오티드의 추가)은 본 발명의 범위 내에 있다. 돌연변이, 삽입, 및 결실은 통상의 지식을 가진 자에게 공지된 방법에 의해 주어진 프라이머 내에 생성될 수 있다.
여기에서 인용된 모든 참조문헌은 여기에 참조문헌으로서 포함된다.
하기는 본 발명을 시행하는 방법을 설명하는 실시예이다. 이들 실시예는 본 발명을 제한하는 것으로 해석되어서는 안된다. 달리 언급되지 않으면, 모든 %는 중량%이며, 모든 용매 혼합비는 부피비이다.
실시예 1 - 본 발명에 따른 유용한 바실러스 분리주의 배양
바실러스의 살충성 유전자를 포함하는 세포 숙주는 모든 편리한 영양 배지에서 배양될 수 있다. 이러한 세포는 이어서 통상의 방법에 따라 수확된다. 이와 달리, 상기 세포는 수확 이전에 처리될 수 있다.
본 발명의 바실러스 세포를 표준 아트(art) 배지 및 발효 기술을 사용하여 배양할 수 있다. 발효 주기 동안, 상기 박테리아는 우선 바실러스의 생장력이 있는 세포, 포자, 결정, 및 용해된 세포 잔해를 당업계에서 공지된 수단으로 발효 브로쓰(broth)으로부터 분리함으로써 수확될 수 있다. 형성된 모든 바실러스 포자 또는 결정형 δ-엔토톡신을 공지의 기술을 사용하여 회수하여 통상의 δ-엔토톡신 B.t. 조성물로서 사용할 수 있다. 상기 발효공정으로부터의 상등액은 본 발명의 독소를 포함한다. 상기 독소는 공지의 기술을 사용하여 분리 및 정제된다.
바실러스 분리주 또는 그의 돌연변이주의 계대배양액(subculture)을 TB 브로쓰로 알려진 하기의 배지를 접종하는데 사용할 수 있다:
트립토판 12 g/ℓ
효모 추출물 24 g/ℓ
글리세롤 4 g/ℓ
KH2PO42.1 g/ℓ
K2HPO414.7 g/ℓ
pH 7.4
인산 칼륨은 압열멸균(autoclave)된 브로쓰에 냉각 후 첨가되었다. 플라스크를 회전 진탕기에서 250rpm에서 24 내지 36시간 동안 배양하였다.
상기 방법은 당업계에서 공지된 방법에 의하여 대량 발효조로 용이하게 규모를 늘릴 수 있다.
상기 발효에서 수득된 바실러스는 당업계에서 공지된 방법에 의하여 분리될 수 있다. 자주 사용되는 방법은 수확된 발효 브로쓰를 분리 기술, 예를 들면 원심분리에 적용하는 것이다. 특정 구현에서, 본 발명에 따른 유용한 단백질은 상등액으로부터 수득될 수 있다. 활성이 있는 단백질을 포함하는 배양 상등액을 생물학적 검정(bioassay)에 사용할 수 있다.
이와 달리, 바실러스 분리주 또는 그의 돌연변이주의 계대배양액을 하기의 펩톤, 포도당, 염 배지를 접종하는데 사용할 수 있다.
박토 펩톤 7.5 g/ℓ
포도당 1.0 g/ℓ
KH2PO43.4 g/ℓ
K2HPO44.35 g/ℓ
염 용액 5.0㎖/ℓ
CaCl2용액 5.0㎖/ℓ
pH 7.2
염 용액(100㎖)
MgSO4·7H2O 2.46g
MnSO4·H2O 0.04g
ZnSO4·7H2O 0.28g
FeSO4·7H2O 0.40g
CaCl2용액(100㎖)
CaCl2·2H2O 3.66g
상기 염 용액과 CaCl2용액은 필터로 멸균화된 다음, 접종 시 압열멸균되고 조리된 브로쓰에 첨가된다. 플라스크를 회전 진탕기에서 200rpm에서 64시간 동안 배양한다. 상기 방법은 당업계에서 공지된 방법에 의하여 대량 발효조로 용이하게 규모를 늘릴 수 있다.
상기 발효에서 수득된 바실러스 포자 및/또는 결정을 당업계에서 공지된 방법에 의해 분리할 수 있다. 자주 사용되는 방법은 상기 수확된 발효 브로쓰를 분리 기술, 예를 들면 원심분리에 적용하는 것이다.
실시예 2 - PCR용 세포 DNA의 분리 및 정제
스피지젠스 아가(Spizizen's agar), 또는 당업계에서 통상의 지식을 가진 자에게 공지된 다른 최소(minimal) 아가 또는 영양강화(enriched) 아가 상에서 약 16시간 동안 배양된 세포로부터 DNA를 제조(preparation)할 수 있다. 스피지젠스 카사미노산(casamino acid) 아가는 23.2g/ℓ 스피지젠스 최소 염[(NH4)2SO4, 120g; K2HPO4, 840g; KH2PO4, 360g; 시트르산 나트륨, 60g; MgSO7H2O, 12g. 전체: 1392g]; 1.0g/ℓ 비타민이 없는 카사미노산; 및 15.0 g/ℓ 디프코(Difco) 아가를 포함한다. 상기 아가를 제조함에 있어서, 상기 혼합물을 30분 동안 압열멸균하고, 이어서 멸균된 50% 포도당 용액을 최종 농도가 0.5%(1/100 vol)가 되도록 첨가할 수 있다. 일단 세포가 16시간 동안 성장하면, 세포 약 1㎠ 패치를 아가로부터 긁어내어 10mM Tris-HCl(pH 8.0)-1mM EDTA 300 ㎕에 넣을 수 있다. 단백질분해효소 K를 50 ㎍/㎖로 첨가하고 55℃에서 15분 동안 배양하였다. 뉴클레아제 활성이 결여된 다른 적절한 단백질분해효소를 사용할 수도 있다. 상기 시료를 15분 동안 끓는 물에서 중탕하여, 상기 단백질분해효소를 불활성화시키고 DNA를 변성시켰다. 이는 또한 원하지 않는 요소를 침전시킨다. 이어서, 상기 시료를 에펜도르프 마이크로퓨즈(Eppendorf microfuge)에서 14,000xg로 실온에서 5분 동안 원심분리하여, 세포 잔해를 제거하였다. 조제(crude) DNA를 포함하는 상등액을 새로운 튜브로 옮겨 담아 PCR 반응에 사용할 때까지 -20℃에서 냉동보관하였다.
이와 달리, 전체 세포 DNA를 퀴아젠사(Qiagen, Santa Clarita, CA)의 퀴아앰프 티슈 킷트(QIAamp Tissue Kit)를 사용하여 제조자의 지시에 따라 플레이트에서 배양된 세포로부터 제조할 수도 있다.
실시예 3 - 독소 유전자의 확인 및/또는 특성규명에 유용한 프라이머
하기 세트의 PCR 프라이머가 살충성 독소를 코딩하는 본 발명의 유전자를 확인 및/또는 특성을 밝히는데 사용될 수 있다.
GGRTTAMTTGGRTAYTATTT(서열 3)
ATATCKWAYATTKGCATTTA(서열 4)
본 개시 전체에 걸쳐 사용되는 중복성(redundant) 뉴클레오티드 코드는 IUPAC 협정에 따른 것으로 다음을 포함한다:
R = A 또는 G
M = A 또는 C
Y = C 또는 T
K = G 또는 T
W = A 또는 T
실시예 4 - 바실러스 균주 유래의 신규한 가용성 단백질을 코딩하는 유전자의 확인 및 서열분석
서열 3 및 서열 4의 프라이머를 사용한 PCR을 광범위한 B.t. 균주로부터 분리된 전체 세포 지놈 DNA에 대하여 수행하였다. 약 1kb 밴드를 생성하는 시료를 DNA 서열분석에 의한 특성규명을 위하여 선별하였다. 증폭된 DNA 단편을 우선 PCR DNA TA-클로닝 플라스미드 벡터인 pCR2.1 내에 공급자(Invitrogen, San Diego, CA)에 의하여 기술된 바대로 클로닝하였다. 플라스미드를 재조합 클론으로부터 분리하여, 플라스미드 프라이머 T3 및 T7을 사용하여 PCR로 약 1kbp 삽입체의 존재에 대하여 테스트하였다.
다음 균주들이 약 1000bp의 예상된 밴드를 생성하였으며, 따라서 MIS-형 독소 유전자의 존재를 나타내었다: PS66D3, PS177C8, PS177I8, PS33F1, PS1571(157C1-A), PS201Z, PS31F2, 및 PS185Y2.
이어서, 플라스미드를 서열분석 주형으로 사용하기 위하여 퀴아젠(QIAGEN, Santa Clarita, CA) 미니프렙 킷트를 사용하여 공급자에 의해 기술된 바대로 분리하였다. 서열분석 반응을 피이 어플라이드 바이오시스템즈(PE Applied Biosystems)사의 다이 터미네이터 사이클 시퀀싱 레디 리액션 킷트(Dye Terminator Cycle Sequencing Ready Reaction Kit)를 사용하여 수행하였다. 서열분석 반응을 에이비아이 프리즘 377(ABI PRISM 377) 자동화된 서열분석기 상에서 수행하였다. 서열 데이터를 피이 에이비아이 사(PE ABI)의 에이비아이 프리즘 377 콜렉션(ABI PRISM 377 Collection), 팩튜라(Factura), 및 오토어셈블러 (AutoAssembler) 소프트웨어를 사용하여 수집, 편집, 및 조립하였다.
다음 분리주들로부터 유래된 신규한 독소 유전자의 일부분에 대하여 DNA 서열을 분석하였다: PS66D3, PS177C8, PS177I8, PS33F1, PS1571(157C1-A), PS201Z, PS31F2, 및 PS185Y2. 이들 뉴클레오티드 서열을 각각 서열 5, 7, 9, 38, 33, 35, 36 및 37에 도시하였다. 하기의 분리주로부터 유래된 코딩된 신규한 가용성 독소의 일부분에 대하여 폴리펩티드 서열을 유추하였다: PS66D3, PS177C8, PS177I8 및 PS1571(독소 157C1-A). 이들 뉴클레오티드 서열을 각각 서열 6, 8, 10 및 34에 도시하였다.
실시예 5 - 바실러스 슈린지엔시스 균주로부터 유래된 독소의 RFLP(Restriction Fragment Length Polymorphism)
600nm 가시광선에서의 O.D. 0.5 내지 0.8까지 배양된 다양한 바실러스 슈린지엔시스(B.t.) 균주로부터 전체 세포 DNA를 제조하였다. 퀴아젠 지노믹-팁 500/G 킷트(Qiagen Genomic-tip 500/G kit) 및 지노믹 DNA 버퍼 세트(Genomic DNA Buffer Set; Qiagen Inc., Valencia, CA)를 사용하여 그람 양성 박테리아용 방법에 따라 DNA를 추출하였다.
32P로 표지된 표준 서던 혼성화 방법을 사용하여 전체 지놈 DNA 조성물 내에 있는 신규한 독소 유전자를 확인하고 특성을 규명하였다. 제조된 전체 지놈 DNA를 다양한 제한효소로 처리하여, 1% 아가로오스 젤 상에서 전기영동하고, 표준 방법(참조: Maniatis et al.)을 사용하여 지지된 나일론 막 상에 고정하였다.
PCR로 증폭된 길이가 1.0 내지 1.1kb인 DNA 단편을 프로브로 사용하기 위하여 젤 정제하였다. 각 DNA 단편 약 25ng을 DNA 중합효소 I 클레노우 단편(New England Biolabs), 랜덤 헥사뉴클레오티드 프라이머(Boehringer Mannheim) 및32PdCTP를 사용하는 프라이밍 네이슨트 DNA 합성(priming nascent DNA synthesis)용 주형으로 사용하였다.
32P로 표지된 각 단편은 그의 상응하는 지놈 DNA 블랏에 대한 특이적 프로브로 작용하였다. 고정화된 DNA와 임의적으로 표지된32P 프로브와의 혼성화를 5X SSPE, 5X 덴하르트 용액, 0.5% SDS, 0.1㎎/㎖를 포함하는 표준 수성 완충액 중에서 65℃에서 밤새도록 수행하였다. 블랏을 0.2X SSC, 0.1% SDS 중에서 65℃에서 적절한 스트린젠시 하에 세척하고, 필름에 노출시켰다. 관심있는 신규한 유전자의 전체 또는 일부를 포함하는 특이적인 혼성화 밴드를 보여주는 RFLP 데이터를 각 균주에 대하여 얻었다.
(균주)/유전자명 프로브 서열 RFLP 데이터(대략적인 밴드 크기)
(PS)66D3 24 BamHI: 4.5kbp, HindIII: >23kbp, Kpn1: 23kbp, PstI: 15kbp, XbaI: >23kbp
(PS)177I8 33 BamHI: >23kbp, EcoRI: 10kbp, HindIII: 2kbp, SalI: >23kbp, XbaI: 3.5kbp
별개의 실험에서, MIS와 WAR 유전자용 대체 프로브를 사용하여,32P 자동방사선 사진술, 또는 DIG 핵산 표지 및 검출 시스템(Boehringer Mannheim; Indianapolis, IN)을 사용하는 비방사성 방법에 의해 지놈 DNA의 서던 블랏 상에서 신규한 독소 유전자를 검출하였다. 길이가 약 2.6kb 및 1.3kb인 DNA 단편을 각 개별 유전자의 5' 및 3' 말단에 대하여 상동적인 프라이머를 사용하여 플라스미드 pMYC2450으로부터 PCR로 증폭하였다. pMYC2450은 pHTBlueII(pBluescript S/K[Stratagene, La jolla, CA] 및 내재하는 B.t. 플라스미드 유래의 복제 기점[D. Lereclus et al., 1989; FEMS Microbiology Letters 60:211-218]을 포함하는 E. coli/B. thuringiensis 셔틀 벡터) 내에 약 14kbp ClaI 단편 상의 PS177C8 MIS 및 WAR 유전자를 포함하고 있는 재조합 플라스미드이다. 이들 DNA 단편을 MIS RFLP 클래스 A부터 N까지 및 WAR RFLP 클래스 A부터 L까지를 위한 프로브로 사용하였다. 클래스 O에 대한 하기 표 5의 RFLP 데이터는 프라이머 S1-633F(CACTCAAAAAATGAAAAGGGAAA; 서열 39) 및 S1-2269R(CCGGTTTTATTGATGCTAC; 서열 40)로 증폭된 약 1636bp MIS 단편을 사용하여 생성되었다. 클래스 M에 대한 하기 표 6의 RFLP 데이터는 프라이머 S2-501F(AGAACAATTTTTAGATAGGG; 서열 41) 및 S2-995R(TCCCTAAAGCATCAGAAATA; 서열 42)로 증폭된 약 495bp WAR 단편을 사용하여 생성되었다.
단편들을 젤 정제하여, 각 DNA단편 약 25ng을 방사성 검출을 위하여32P로 임의적으로 표지하거나 또는 각 DNA단편 약 300ng을 비방사성 검출을 위하여 DIG 하이 프라임 킷트(DIG High Prime kit)로 임의적으로 표지하였다. 고정화된 DNA와 임의적으로 표지된32P 프로브의 혼성화를 표준 포름아미드 조건하에서 수행하였다: 50% 포름아미드, 5X SSPE, 5X 덴하르트 용액, 2% SDS, 0.1ng/㎖ 초음파 처리된 정자 DNA, 42℃, 12시간. 블랏을 2X SSC, 0.1% SDS 내에서 42℃에서 낮은 스트린젠시 하에서 세척하고 필름에 노출시켰다. 관심있는 신규한 유전자의 전체 또는 일부를 포함하는 DNA 밴드의 RFLP 데이터를 각 균주에 대하여 수득하였다.
상술한 MIS 프로브를 사용한 RFLP 데이터는 하기와 같다:
RFLP 클래스 균주 번호(들) RFLP 데이터(대략적인 bp 단위의 밴드 크기)
A 177C8, 74H3, 66D3 HindIII: 2,454; 1,645XbaI: 14,820; 9,612; 8,138; 5,642; 1,440
B 177I8 HindIII: 2,454XbaI: 3,500 (매우 희미한 7,000)
C 66D3 HindIII: 2,454 (희미한 20,000)XbaI: 3,500(희미한 7,000)
D 28M, 31FG, 71G5, 71G7, 71I1, 71N1, 146F, 185Y2, 201JJ7, KB73, KB68B46-2, KB71A35-4, KB71A116-1 HindIII: 11,378; 7,614XbaI: 10,622; 6,030
D1 70B2, 71C2 HindIII: 11,738; 6,898; 7,614XbaI: 11,354; 10,622; 6,030
E KB68B51-2, KB68B55-2 HindIII: 6,975; 2,527XbaI: 10,000; 6,144
F KB33A49-4 HindIII: 5,766XbaI: 6,757
G 86D1 HindIII: 4,920XbaI: 11,961
H HD573B, 33F1, 67B3 HindIII: 6,558; 1,978XbaI: 7,815; 6,558
I 205C, 40C1 HindIII: 6,752XbaI: 4,618
J 130A3, 143A2, 157C1 HindIII: 9,639; 3,943; 1,954; 1,210XbaI: 7,005; 6,165; 4,480; 3,699
K 201Z HindIII: 9,639; 4,339XbaI: 7,232; 6,365
L 71G4 HindIII: 7,005XbaI: 9,639
M KB42A33-8, KB71A72-1,KB71A33-11 HindIII: 3,721XbaI: 3,274
N KB71A134-2 HindIII: 7,523XbaI: 10,360; 3,490
O KB69A125-3, KB69A127-7,KB69A136-2, KB71A20-4 HindIII: 6,360; 3,726; 1,874; 1,098XbaI: 6,360; 5,893; 5,058; 3,726
상술한 WAR 프로브를 사용한 RFLP 데이터는 하기와 같다:
RFLP 클래스 균주 번호(들) RFLP 데이터(대략적인 bp 단위의 밴드 크기)
A 177C8, 74H3 HindIII: 3,695; 2,454; 606XbaI: 5,457; 4,469; 1,440; 966
B 177I8, 66D3 데이터를 얻을 수 없음
C 28M, 31FG, 71G5, 71G7, 71I1, 71N1, 146F, 185Y2, 201JJ7, KB73, KB68B46-2, KB71A35-4, KB71A116-1 HindIII: 7,614XbaI: 10,982; 6,235
C1 70B2, 71C2 HindIII: 8,698; 7,614XbaI: 11,354, 6,235
D KB68B51-2, KB68B55-2 HindIII: 7,200XbaI: 6,342(및 51-2의 경우 11,225)(및 55-2의 경우 9,888)
E KB33A49-4 HindIII: 5,766XbaI: 6,757
F HD573B, 33F1, 67B3 HindIII: 3,348; 2,037(및 HD573B의 경우에만 6,558)XbaI: 6,953(및 HD573B의 경우에만 7,815; 6,185)
G 205C, 40C1 HindIII: 3,158XbaI: 6,558; 2,809
H 130A3, 143A2, 157C1 HindIII: 4,339; 3,361; 1,954; 660; 349XbaI: 9,043; 4,203; 3,583; 2,958; 581; 464
I 201Z HindIII: 4,480; 3,819; 703XbaI: 9,336; 3,256; 495
J 71G4 HindIII: 7,005XbaI: 9,639
K KB42A33-8, KB71A72-1,KB71A33-11 혼성화 시그널이 없음
L KB71A134-2 HindIII: 7,523XbaI: 10,360
M KB69A125-3, KB69A127-7,KB69A136-2, KB71A20-4 HindIII: 5,058; 3,726; 3,198; 2,745; 257XbaI: 5,255; 4,341; 3,452; 1,490; 474
실시예 6 - WAR 독소의 특성규명 및/또는 확인
본 발명의 다른 구현에서, 살충성 독소는 여기에 예시화된 살충성 독소에 대한 항체와의 반응성 수준에 의해 특성규명 및/또는 확인될 수 있다. 특정 일구현에서, 항체는 PS177C8a로부터 수득가능한 독소와 같은 WAR 독소에 대하여 생성될 수 있다. 다른 WAR 독소는 이어서 그들의 상기 항체와의 반응성에 의해 확인 및/또는 특성규명될 수 있다. 바람직한 일구현에서, 상기 항체는 폴리클로날(polyclonal) 항체이다. 이러한 실시예에서, 177C8a-WAR 독소와 가장 큰 유사성을 가지는 독소가 상기 폴리클로날 항체와 가장 큰 방응성을 가질 것이다. WAR 독소는 상기 177C8a 폴리클로날 항체와 보다 큰 다양성을 가지고 그러나 더 적은 정도로 반응한다. 177C8a WAR 독소에 대하여 생성된 폴리클로날 항체와 면역반응하는 독소는 예를 들면 PS177C8a, PS171I8, PS66D3, KB68B55-2, PS185Y2, KB53A49-4, KB68B51-2, PS31F2, PS74H3, PS28M, PS71G6, PS71G7, PS71I1, PS71N1, PS201JJ7, KB73, KB68B46-2, KB71A35-4, KB71A116-1, PS70B2, PS71C2, PS86D1, HD573B, PS33F1, PS67B3, PS205C, PS40C1, PS130A3, PS143A2, PS157C1, PS201Z, PS71G4, KB42A33-8, KB71A72-1, KB71A133-11, KB71A134-2, KB69A125-3, KB69A127-7, KB69A136-2 및 KB71A20-4로 명명된 분리주로부터 수득될 수 있다. PS31F2 및 KB68B46-2 분리주는 매우 약한 항체 반응성을 보여, 유리한 다양성을 제안한다.
실시예 7 - 바실러스 슈린지엔시스 균주 PS205C로부터 유래된 가용성 살충 단백질(MIS 및 WAR) 유전자의 클로닝 및 DNA 서열 분석
LB(Luria Bertani) 브로쓰 내에서 600nm 가시광선에서의 O.D. 0.5 내지 0.8까지 배양된 바실러스 슈린지엔시스 균주 PS205C로부터 전체 세포 DNA를 제조하였다. 퀴아젠 지노믹-팁 500/G 킷트(Qiagen Genomic-tip 500/G kit) 및 지노믹 DNA 버퍼 세트(Qiagen Inc., Valencia, CA)를 사용하여 그람 양성 박테리아용 방법에 따라 DNA를 추출하였다. NdeII로 부분적으로 절단된 PS205C 전체 세포 DNA를 삽입체로 사용하여, PS205C 코스미드 라이브러리를 수퍼코스 벡터(SuperCos 벡터; Stratagene) 내에 구축하였다. XL1-Blue 세포(Stratagene)를 포장된 코스미드로 형질감염시켜, 카르베니실린(carbenicillin) 및 카나마이신(kanamycin)에 대하여 내성을 가지는 클론을 수득하였다. 576개 코스미드 클론을 96-웰 블록 내에서 1㎖ LB + 카르베니실린(100㎍/㎖) + 카나마이신(50㎍/㎖) 중에서 37℃에서 18시간 동안 배양하고, 혼성화에 의한 스크리닝을 위하여 나일론 필터 상으로 평판복사(replica plating)하였다.
PS205C MIS 유전자의 약 1000bp를 포함하는 PCR 앰플리콘(amplicon)을 상기 실시예 4에 기술된 프라이머 서열 3 및 서열 4를 사용하여 PS205 지놈 DNA로부터 증폭하였다. 상기 DNA 단편을 퀴아엑스II 엑스트랙션(QiaexII extraction; Qiagen)을 사용하여 젤 정제하였다. 상기 프로브를 프라임-잇 II 킷트(Prime-It II kit; Stratagene)를 사용하여32P-dCTP로 방사성 표지하고, 콜로니 리프트 필터와 함께 65℃에서 16시간 동안 수성 혼성화 용액(6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1㎎/㎖ 변성된 DNA)중에서 혼성화시켰다. 상기 콜로니 리프트 필터를 실온에서 2X SSC/0.1% SDS로 1회 짧게 세척하고, 0.5X SSC/0.1% SDS로 10분 동안 2회 더 세척하였다. 이어서, 상기 필터를 X-선 필름에 5.5시간 동안 노출시켰다. 상기 프로브에 강하게 혼성화한 하나의 코스미드 클론을 다음 분석을 위하여 선별하였다. 상기 코스미드 클론은 프라이머 서열 3 및 서열 4를 사용한 PCR 증폭에 의해 MIS 유전자를 포함하고 있는 것으로 확인되었다. 상기 코스미드 클론을 pMYC3105라 명명하고, pMYC3105를 포함하는 대장균 XL1-Blue MR 세포를 MR992라 명명하였다.
MR992 계대배양주를 1999년 5월 4일자에 농업 연구 배양균 기탁소(NRRL; Regional Research Center, 1815 North University Street, Peoria, Illinois 61604, USA)의 영구적인 콜렉션에 기탁하였다. 수탁번호는 NRRL B-30124이다. PS205C의 단축된(truncated) 플라스미드 클론 또한 1999년 5월 4일자에 기탁되었다. 수탁번호는 NRRL B-30122이다.
PS205C MIS 및 WAR 유전자의 서열을 분석하고자, GPS-1 지놈 프라이밍 시스템(GPS-1 Genome Priming System; New England Biolabs) 및 방법을 사용하여 pMYC3105 내로 임의적으로 트랜스포존(transposon)을 삽입하였다. 트랜스포존이 삽입된 코스미드를 선별하기 위하여 클로람페니콜 내성을 코딩하는 GPS2 전위(transposition) 벡터를 선택하였다. 트랜스포존을 획득한 pMYC3105 코스미드를 앰피실린, 카나마이신 및 클로람페니콜을 함유하는 배지 상에서 대장균 XL1-Blue의 형질전환(transformation) 및 선별에 의해 확인하였다. 코스미드 주형을 서열분석용 주형으로 사용하기 위하여 멀티스크린 96-웰 플라스미드 프렙(Multiscreen 96-well plasmid prep; Millipore)을 사용하여 각 콜로니로부터 제조하였다. pMYC3105에 의해 코딩되는 MIS 및 WAR 유전자를 ABI377 자동화된 서열분석 시스템 및 연관 소프트웨어를 사용하여 GPS2 프라이머로 서열분석하였다. MIS 및 WAR 유전자는 뚜렷한 전사 오페론 내에서 서로 이웃하여 위치하고 있는 것으로 밝혀졌다. 뉴클레오티드 및 유추된 폴리펩티드 서열을 서열 43-46으로 명명하였다.
실시예 8 - 바실러스 슈린지엔시스 균주 PS31F2로부터 유래된 가용성 살충 단백질(MIS 및 WAR) 유전자의 클로닝 및 DNA 서열 분석
a. 지놈 DNA의 제조(preparation) 및 클로닝
LB(Luria Bertani) 브로쓰 내에서 600nm 가시광선에서의 O.D. 0.5 내지 0.8까지 배양된 바실러스 슈린지엔시스 균주 PS31F2로부터 전체 세포 DNA를 제조하였다. 퀴아젠 지노믹-팁 500/G 킷트(Qiagen Genomic-tip 500/G kit) 또는 퀴아젠 지노믹-팁 20/G 킷트(Qiagen Genomic-tip 20/G kit) 및 지노믹 DNA 버퍼 세트(Qiagen Inc., Valencia, CA)를 사용하여 그람 양성 박테리아용 방법에 따라 DNA를 추출하였다.
바실러스 슈린지엔시스 균주 PS31F2로부터의 전체 지놈 DNA를 포함하는 람다 라이브러리를 NdeII로 부분적으로 절단된 DNA로부터 제조하였다. 부분적인 NdeII 제한효소 처리물을 0.7% 아가로오스 젤 상에서 전기영동하고, 9 내지 20kb의 크기 범위 내에 있는 DNA 단편을 포함하는 젤 영역을 젤로부터 도려내었다. DNA를 상기 젤 단편으로부터 0.1X TAE 완충액 내에서 약 30V에서 1시간 동안 전기용출(electroelution)하고, 일루팁-디 컬럼(Elutip-d column; Schleicher and Schuell, Keene, NH)을 사용하여 정제하였다.
정제되고 분획된 DNA를 BamHI 처리된 람다-GEM-11 암(Lambda-GEM-11 arm; Promega Corp., Madison, WI)에 리게이션(ligation)시켰다. 리게이션된 DNA를 이어서 기가팩 III 골드 패키징 엑스트렉트(Gigapack III Gold packaging extract; Stratagene Corp., La Jolla, CA)를 사용하여 람다 파아지(phage) 내로 패키징하였다. 대장균 균주 KW251을 재조합 파아지로 감염시키고, LB 탑 아가로오스로 LB 플레이트 상에 플레이팅하였다.
플라크를 니트로셀룰로오스 필터 상으로 리프트시키고, 표준 방법(Maniatis et al.)을 사용한 혼성화를 위하여 준비하였다. 길이가 약 1.1kb(PS177C8 MIS) 또는 700bp(PS177C8 WAR)인 DNA 단편을 플라스미드 pMYC2450으로부터 PCR 증폭하여 프로브로 사용하였다. 단편을 젤 정제하여, 각 DNA 단편 약 25ng을32P-dCTP로 임의적으로 표지하였다. 고정된 DNA와32P로 표지된 PS177C8 프로브의 혼성화를 표준 포름아미드 조건하에서 수행하였다: 50% 포름아미드, 5X SSPE, 5X 덴하르트 용액, 2% SDS, 0.1ng/㎖ 초음파 처리된 정자 DNA, 42℃, 12시간. 블랏을 2X SSC, 0.1% SDS 내에서 42℃에서 낮은 스트린젠시 하에서 세척하고 필름에 노출시켰다. 상기 플레이트로부터 혼성화하는 플라크를 분리하여 SM 완충액에 현탁시켰다. 파아지 DNA를 람다소브 파아지 흡착제(LambdaSorb phage adsorbent; Promega, Madison, WI)를 사용하여 정제하였다. 타겟 유전자의 존재를 입증하기 위하여, 올리고뉴클레오티드 프라이머 서열 3 및 서열 4를 사용하는 PCR을 파아지 DNA를 주형으로 삼아 수행하였다. 상기 PCR 반응은 두 DNA 시료 모두에서 예상된 1kb 밴드를 생성하여, 상기 파아지 클론들이 관심있는 유전자를 포함하고 있음을 학인하였다. 서브클로닝을 위하여, 파아지 DNA를 다양한 제한효소로 처리하고, 1% 아가로오스 젤 상에서 분획한 후 서던 분석을 위하여 블랏팅하였다. 상술한 바와 같이 서던 분석을 수행하였다. PS31F2 독소 유전자를 포함하고 있는 크기가 약 8kb인 HindIII 단편이 확인되었다. 상기 단편을 젤 정제하여 pBluescriptII(SK+)의 HindIII 사이트 내로 클로닝하였다; 상기 플라스미드 클론을 pMYC2610이라 명명하였다. 재조합 대장균 E. coli XL10GOLD[pMYC2610]균주를 MR983이라 명명하였다.
MR983의 계대배양주를 1999년 5월 4일자에 농업 연구 배양균 기탁소(NRRL; Regional Research Center, 1815 North University Street, Peoria, Illinois 61604, USA)의 영구적인 콜렉션에 기탁하였다. 수탁번호는 NRRL B-30123이다.
b. DNA 서열분석
PS31F2 독소 유전자를 포함하고 있는 pMYC2610 HindIII 단편을 제한효소 처리로 분리하여 0.7% 아가로오스 젤 상에서 분획한 다음, 퀴아엑스II 킷트(QiaexII kit; Qiagen Inc., Valencia, CA)를 사용하여 젤 기질로부터 정제하였다. 이어서, 젤 정제된 삽입 DNA를 제한효소 AluI, MseI, 또는 RsaI으로 따로따로 처리하고, 1% 아가로오스 젤 상에서 분획하였다. 0.5와 1.5kb 사이의 DNA 단편을 젤로부터 도려내어 퀴아엑스 II 킷트를 사용하여 정제하였다. 회수된 단편을 EcoRV로 처리된 pBluescriptII 내로 리게이션시키고, E. coli XL10 Gold 세포로 형질전환시켰다. 임의적으로 선택된 형질전환주(transformant)로부터 플라스미드 DNA를 제조하여, NotI과 ApaI으로 처리하여 삽입체의 크기를 확인하고, 플라스미드 벡터 서열과 상동적인 프라이머와 함께 서열분석용 주형으로 사용하였다. 프라이머 워킹법(primer walking)으로 서열을 완성하였다. 서열분석 반응을 디로다민(dRhodamine) 또는 빅다이(BigDye) 시퀸싱 킷트(ABI Prism/Perkin Elmer Applied Biosystems)를 사용하여 수행하고, ABI 373 또는 377 자동화된 서열분석기 에 적용하였다. 데이터를 팩튜라(Factura), 오토어셈블러(Autoassembler, ABI Prism) 및 제네틱스 컴퓨터 그룹(Genetics Computer Group; Madison, WI) 프로그램을 사용하여 분석하였다. 상기 MIS 및 WAR 유전자는 뚜렷한 전사 오페론 내에서 서로 이웃하여 위치하고 있는 것으로 확인되었다. WAR 유전자는 MIS 유전자에 대하여 5'이고, 상기 두 유전자는 4개 뉴클레오티드 염기에 의하여 분리되어 있다.
PS31F2로부터의 신규한 MIS 및 WAR 유전자에 대한 뉴클레오티드 서열 및 유추된 펩티드 서열이 신규한 서열 47-50으로 보고된다.
c. 바실러스 슈린지엔시스의 서브클로닝 및 형질전환
천연 바실러스 프로모터로부터의 발현을 위하여, pMYC2610으로부터 유래된 8kb HindIII 단편 상의 PS31F2 독소 유전자를 E. coli/B.t. 셔틀 벡터 pHT370(참조: O. Arantes and D. Lereclus [1991] Gene 108:115-119) 내로 서브클로닝하였다. 이로부터 생성된 플라스미드 구조물(construct)을 pMYC2615라 명명하였다. pMYC2415 플라스미드 DNA를 일렉트로포레이숀(electroporation)에 의해 acrystallierous(Cry-) B.t. 숙주인 CryB(참조: A. Aronson, Purdue University, West Lafayette, IN) 내로 형질전환시키고자 재조합 대장균 E. coli XL10Gold로부터 제조하였다. 재조합 CryB[pMYC2615] 균주를 MR558이라 명명하였다.
실시예 9 - 바실러스 슈린지엔시스 균주 KB59A4-6으로부터 유래된 신규한 SUP 독소 유전자의 클로닝 및 DNA 서열 분석
LB(Luria Bertani) 브로쓰 내에서 600nm 가시광선에서의 O.D. 0.5 내지 0.8까지 배양된 바실러스 슈린지엔시스 균주 KB59A4-6으로부터 전체 세포 DNA를 제조하였다. 퀴아젠 지노믹-팁 500/G 킷트(Qiagen Genomic-tip 500/G kit) 및 지노믹 DNA 버퍼 세트(Qiagen Inc., Valencia, CA)를 사용하여 그람 양성 박테리아용 방법에 따라 DNA를 추출하였다. DNA를 HindIII로 절단하고, 표준방법(Maniatis et al.)에 의한 서던 블랏 분석을 위하여 0.7% 아가로오스 젤 상에서 전기영동하였다. 올리고머 "3A-atg"(GCTCTAGAAGGAGGTAACTTATGAACAAGAATAATACTAAATTAAGC; 서열 51) 및 "3A-taa"(GGGGTACCTTACTTAATAGAGACATCG; 서열 52)를 사용하여 자벨린(Javelin)-90 지놈 DNA로부터 SUP-유사(SUP-like) 유전자(서열 1)을 포함하는 PCR 앰플리콘을 수득하였다. 상기 DNA 단편을 젤 정제하여, 프로브로 사용하기 위하여 프라임-잇 II 랜덤 프라이머 레이블링 킷트(Prime-It II Random Primer Labeling kit; Stratagene)를 사용하여32P-dCTP로 방사성 표지하였다. 서던 블랏 필터의 혼성화를 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 및 0.1㎎/㎖ 변성된 DNA를 포함하는 용액 중에서 42℃에서 밤새도록 진탕 항온수조에서 수행하였다. 이어서, 상기 필터를 1X SSPE 및 0.1% SDS 내에서 25℃에서 1회 세척하고, 37℃에서 2회 더 세척하였다. 그런 다음, 혼성화된 필터를 -80℃에서 X-선 필름에 노출시켰다. 자벨린 90 SUP 프로브에 혼성화한 KB59A4-6 지놈 DNA의 약 1kbp HindIII 단편을 확인하였다.
KB59A4-6 지놈 DNA의 람다 라이브러리를 하기와 같이 구축하였다. DNA를 Sau3A로 부분적으로 절단하고, 아가로오스 젤 상에서 크기 별로 분획하였다. 9.0과 23kbp 사이의 단편을 함유하는 젤 영역을 도려내어, DNA를 0.1X TAE 완충액 내에서 전기용출하여 분리하고 일루팁-디 컬럼(Elutip-d column; Schleicher and Schuell, Keene, NH)을 사용하여 정제하였다. 크기 별로 분획된 DNA 삽입체를 BamHI 처리된 Lambda-Gem 11(Promega)에 리게이션하고, 재조합 파아지를 기가팩 III XL 패키징 엑스트렉트(Gigapack III XL packaging extract; Stratagene)를 사용하여 패키징하였다. 파아지를 혼성화에 의한 스크리닝을 위하여 대장균 VCS257 세포 상에 플레이팅하였다. 플라크를 나일론 필터로 전달하고, 진공하에서 80℃에서 건조시켰다. 이어서, 상술한 바와 같이 자벨렌 90 SUP 프로브로 혼성화를 수행하였다. 양성 시그널을 보이는 플라크를 파스퇴르 피펫을 사용하여 선별하여 플러그(plug)를 수득하였다. 상기 플러그를 실온에서 밤새도록 1㎖ SM 완충액 + 10㎕ CHCl3에 담가두었다. 상기 파아지로 감염된 대장균 KW251의 액상 용해질(lysate)로부터 대규모(large-scale) 파아지 DNA 제조물(참조: Maniatis et al.)을 수득하였다.
서던 혼성화에 의해 확인된 약 5.5kbp SacI/XbaI 단편 상의 KB59A4-6 독소 유전자를 E. coli/B.t. 셔틀 벡터 pHT370(참조: O. Arantes and D. Lereclus [1991] Gene 108:115-119) 내로 서브클로닝하였다. 상기 플라스미드 서브 클론을 pMYC2473이라 명명하였다. 상기 구조물을 포함하는 재조합 대장균 E. coli XL10-GOLD 세포(Stratagene)를 MR993이라 명명하였다. 상기 살충성 독소 유전자를 pMYC2473 플라스미드 및 PCR 앰플리콘을 DNA 주형으로 사용하는 프라이머 워킹에 의하여 서열분석하였다. 서열분석 반응을 다이 터미네이터 사이클 시퀀싱 레디 리액션 킷트(Dye Terminator Cycle Sequencing Ready Reaction Kit; PE Applied Biosystems)를 사용하여 수행하고, 에이비아이 프리즘 377(ABI PRISM 377) 자동화된 서열분석기에 적용하였다. 서열 데이터를 피이 에이비아이 프리즘 377 콜렉션(PE ABI PRISM 377 Collection), 팩튜라(Factura), 및 오토어셈블러(Autoassembler) 소프트웨어를 사용하여 분석하였다. KB59A4-6 독소의 DNA 서열 및 유추된 아미노산 서열이 각각 신규한 서열 53 및 54로 보고된다.
MR993의 계대배양주를 1999년 5월 4일자에 농업 연구 배양균 기탁소(NRRL; Regional Research Center, 1815 North University Street, Peoria, Illinois 61604, USA)의 영구적인 콜렉션에 기탁하였다. 수탁번호는 NRRL B-30125이다.
실시예 10 - 인시류 및 초시류에 대한 활성의 생물학적 검정
본 발명의 독소 및 분리주에 대한 생물학적 활성은 표준 생물학적 검정 방법을 사용하여 확인될 수 있다. 그러한 검정법 중 한 가지는 싹벌레-목화씨 벌레(budworm-bollworm: Heliothis virescens [Fabricus] 및 Helicoverpa zea [Boddie]) 검정법이다. 인시류 검정은 시료를 인공 곤충먹이 표면에 도포하거나 또는 먹이 내에 삽입함으로써 수행될 수 있다. 모든 인시류 곤충을 신생(neonate) 단계에서 두 번째 령(instar) 단계까지 테스트하였다. 모든 검정은 구운 콩 분말 인공먹이 또는 검은색 뿌리 잘라먹는 벌레(cutworm)용 인공 먹이(BioServ, Frenchtown, NJ)를 가지고 수행되었다.
먹이 삽입은 상기 시료를 인공먹이와 시료 현탁액 6㎖ 대 먹이 54㎖의 비율로 혼합함으로써 수행될 수 있다. 혼합한 후에, 상기 혼합물을 칸이 구분된 3㎖ 웰이 있는 플라스틱 접시(Nutrend Container Corporation, Jacksonville, FL)에 부었다. B.t.를 함유하고 있지 않은 물만 들어있는 블랭크(blank)를 대조군으로 사용하였다. 첫 번째 령 단계의 유충(USDA-ARS, Stoneville, MS)을 상기 먹이 혼합물 위에 놓아두었다. 이어서, 웰을 태킹 다리미(tacking iron)를 사용하여 마일라 쉬팅(Mylar sheeting; ClearLam Packaging, IL)으로 밀봉하고, 각 웰에 바늘 구멍을 몇 개 만들어 가스 교환이 일어나도록 하였다. 유충을 25℃의 14:10(빛:어둠) 유지실에서 6일 동안 유지하였다. 6일 후에 사망률과 성장이 저해된 유충의 수를 기록하였다.
탑-로드 방법(top load method)에 의한 생물학적 검정은 상술한 것과 동일한 시료와 먹이 조성물을 사용한다. 시료를 곤충 먹이의 표면에 도포하였다. 특정 일구현에서, 표면적은 접시의 크기에 따라 0.3 내지 약 0.8㎠ 범위였으며, 상술한 접시 외에 96웰 조직 배양 플레이트를 사용하였다.
도포 후, 시료를 곤충이 들끓기 전에 공기 중에서 건조시켰다. B.t.를 함유하고 있지 않은 물만 들어있는 블랭크를 대조군으로 사용하였다. 알을 처리된 각 웰에 담고, 태킹 다리미(tacking iron)를 사용하여 마일라 쉬팅(ClearLam Packaging, IL)으로 밀봉하고, 각 웰에 바늘 구멍을 몇 개 만들어 가스 교환이 일어나도록 하였다. 생물학적 검정을 25℃의 14:10(빛:어둠) 유지실에서 7일 동안 또는 28℃의 14:10(빛:어둠) 유지실에서 4일 동안 계속하였다. 각 생물학적 검정 후에 사망률과 성장이 저해된 곤충의 수를 기록하였다.
본 발명에 따른 유용한 또 다른 생물학적 검정법은 웨스턴 옥수수 뿌리벌레(Western corn rootworm) 검정법이다. 시료를 아가계 인공 먹이 위에 160㎖/㎠의 비율로 탑-로딩함으로써 신생 웨스턴 옥수수 뿌리벌레 유충(Diabrotica virgifera virgifera)에 대하여 시료를 생물학적으로 검정할 수 있다. 인공먹이를 48웰 조직 배양 플레이트 또는 그와 유사한 플레이트의 0.78㎠ 웰에 나누어 굳힐 수 있다. 먹이가 굳은 후에, 시료를 피펫으로 상기 먹이 표면위로 분배한다. 이어서, 여분의 액체를 표면으로부터 증발시키고, 낙타털 브러쉬로 각 웰당 신생 유충 약 3 마리씩을 상기 먹이 표면위로 옮겨준다. 가스 교환을 허용하는 동안 곤충이 도망가는 것을 방지하기 위하여, 웰을 2-mil 구멍난 폴리에스테르 필름으로 27HT 접착제(Oliver Products Company, Grand Rapids, Michigan)를 사용하여 열-밀봉하였다. 생물학적 검정을 어두운 곳에서 25℃에서 계속하고, 4일 후에 사망률을 측정하였다.
검은색 뿌리 잘라먹는 벌레(Agrotis ipsilon)와 같은 다른 해충에 대한 활성을 검정하기 위하여, 유사한 생물학적 검정이 당업계에서 통상의 지식을 가진 자에 의하여 수행될 수 있다.
결과를 하기 표 7에 나타내었다.
인시류 및 초시류에 대한 활성에 대하여 스크리닝된 농축된 B.t. 상등액의 유전학 및 기능
균주 약 339bp PCR 단편 총단백질(㎍/㎠) ca. 80-100kDa 단백질(㎍/㎠) H. virescens H. zen Diabrotica
%치사율 성장이 저해된곤충수 %치사율 성장이 저해된곤충수 %치사율
PS157C1(#1) - 24 2 43 yes 13 yes -
PS157C1(#2) - 93 8 - - - - 40
PS157C1(#3) - 35 3 - - - - 18
Javelin 1990 ++ 43.2 3.6 100 yes 96 yes NT
water 0 - 8 - 0 - 4 - 12
실시예 11 - 웨스턴 옥수수 뿌리벌레 생물학적 검정의 결과 및 상기 독소의 추가적인 특성규명
본 발명에 따라 수득된 농축된 액상 상등액의 웨스턴 옥수수 뿌리벌레(WCRW)에 대한 활성을 테스트하였다. 하기 분리주로부터의 상등액은 WCRW에 대하여 사망을 야기하는 것으로 밝혀졌다: PS31F2, PS66D3, PS177I8, KB53A49-4, KB68B51-2, KB68B55-2, 및 PS177C8.
하기 분리주로부터의 상등액 또한 WCRW에 대하여 사망을 야기하는 것으로 밝혀졌다: PS205A3, PS185V2, PS234E1, PS71G4, PS248N10, PS191A21, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-3, KB69A125-5, KB69A127-7, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, 및 KB71A35-6; 이러한 활성은 열에 불안정한 것으로 확인되었다. 또한, 하기 분리주의 상등액은 WAR 항체(참조: 실시예 12)와 반응하지 않고, MIS 프로브(서열 31) 및 WAR 프로브(서열 51)와 반응하지 않는 것으로 결정되었다: PS205A3, PS185V2, PS234E1, PS71G4, PS248N10, PS191A21, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-5, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, 및 KB71A35-6; KB69A125-3 및 KB69A127-7 분리주의 상등액은 양성 테스트 결과를 나타내었다.
실시예 12 - 31F2 클론의 배양 및 31F2 독소의 웨스턴 옥수수 뿌리벌레(WCRW)에 대한 생물학적 검정
대장균 MR983 및 음성 대조(negative control) 균주 MR948(E. coli XL1-Blue[pSupercos]; vector control)을 50㎖ 디프코 테리픽 브로쓰(DIFCO Terrific Broth) 배지가 들어있는 250㎖ bottom baffled 플라스크에서 배양하였다. 배양액을 250rpm에서 교반하는 뉴 브런스윅(New Brunswick) 진탕기 내에서 30℃에서 약 23시간 동안 인큐베이션하였다. 23시간 동안 인큐베이션한 후, 시료를 무균적으로 채취하여 오염물질의 존재를 체크하기 위해서 상기 배양액을 현미경하에서 관찰하였다. 배양액 30㎖을 50㎖ 원심분리 튜브에 덜어, 소발 원심분리기(Sorvall centrifuge)로 15,000rpm에서 20분 동안 원심분리하였다. 1X 상등액을 남겨두었다가 WCRW에 대한 생물학적 검정에 사용하였다. 펠렛(pellet)은 10mM Tris 완충액으로 5회 재현탁하여, 초음파 처리한 다음 WCRW에 대한 생물학적 검정에 사용하였다.
B.t. 균주 MR558 및 음성 대조 균주 MR539(B.t. CryB[pHT BlueII]; vector control)를 테리픽 브로쓰 배지로부터 글리세롤을 뺀 것을 제외하고는 동일한 방식으로 배양하였다. B.t. 세포 펠렛을 완충액 보다는 물에 재현탁하여 초음파 처리하였다.
상기 31F2 독소 유전자를 포함하는 대장균 클론 MR983 및 바실러스 슈린지엔시스 클론 MR558의 웨스턴 옥수수 뿌리벌레 대한 검정을 하기의 예외를 제외하고는 상기 실시예 10과 동일한 방식으로 행하였다: 상등액 시료를 약 160㎕/㎠의 양으로 먹이 위에 탑-로딩하였다. 5X 농도의 B.t. 세포 펠렛을 두 클론 모두에 대해서 약 160㎕/㎠의 양으로, MR558 바실러스 슈린지엔시스 클론에 대해서 약 75 및 약 35㎕/㎠의 양(둘 중의 어느 한 클론에 대해서는 알려지지 않은 활성이 있는 독소의 양임)으로 상기 먹이 위에 탑-로딩하였다. 시료로부터 여분의 액체를 증발시킨 직후 약 6 내지 8 마리의 유충을 상기 먹이 위로 옮겼다. 생물학적 검정 플레이트를 태킹 다리미를 사용하여 마일라 쉬팅으로 밀봉하고, 각 웰에 바늘 구멍을 몇 개 만들어 가스 교환이 일어나도록 하였다. MR983 및 MR558 클론 모두 독소-음성 클론인 MR948 및 MR539에 비하여 웨스턴 옥수수 뿌리벌레에 대하여 어느 정도의 생물학적 활성(더 큰 사망률)을 나타내었다.
하기 표 8은 클로닝된 PS31F2 독소의 웨스턴 옥수수 뿌리벌레에 대한 생물학적 활성을 보여주는 결과를 나타낸다.
WCRW의 퍼센트 치사율
상등액 펠렛 5X 펠렛 5X 펠렛 5X
균주 독소 유전자 율⇒ 160 ㎕/㎠ 150 ㎕/㎠ 75 ㎕/㎠ 35 ㎕/㎠
MR983 31F2 7%(4/56) 19%(5/27) -- --
MR948 없음 4%(1/24) 26%(6/23) -- --
MR983 31F2 3%(5/147) -- 20%(49/245) --
MR948 없음 27%(19/70) -- 51%(79/154) --
MR983 31F2 13%(32/243) -- 33%(85/259) --
MR948 없음 9%(14/155) -- 20%(55/273) --
MR558 31F2 35%(41/118) 88%(43/49) 9%(9/100) 13%(13/97)
MR539 없음 10%(14/134) 14%(3/21) 15%(17/111) 17%(19/111)
MR558 31F2 3%(1/29) 35%(17/48) 29%(15/52) 13%(7/55)
MR539 없음 19%(5/27) 20%(9/46) 31%(18/57) 18%(9/49)
MR558 31F2 13%(9/69) 38%(19/50) 18%(15/85) 15%(10/65)
MR539 없음 29%(16/55) 24%(14/58) 14%(13/91) 28%(18/64)
MR558 31F2 7%(5/74) 14%(9/66) 17%(14/83) 11%(6/57)
MR539 없음 11%(9/79) 32%(19/59) 9%(7/78) 15%(10/67)
실시예 13 - 타겟 해충
본 발명의 독소는 하나 또는 그 이상의 비포유동물 해충을 방제하기 위하여 단독으로 또는 다른 독소와 조합하여 사용될 수 있다. 이러한 해충은 예를 들면 하기 표 9에 열거된 것들이다. 활성은 여기에 제공된 생물학적 검정법, 이들 생물학적 검정법의 변형, 및/또는 당업계에서 통상의 지식을 가진 자에게 공지된 다른 생물학적 검정법을 사용하여 용이하게 확인될 수 있다.
타겟 해충종
목/일반명 라틴명
LEPIDOPTERA
European Corn Borer Ostrinia nubilalis
European Corn Borer resistant to Cry1A-class of toxins Ostrinia Nubilalis
Black Cutworm Agrotis ipsilon
Fall Armyworm Spodoptera furgiperda
Southwestern Corn Borer Diatraea grandiosella
Corn Earworm/Bollworm Helicoverpa sea
Tobacco Budworm Heliothis virescens
Tobacco Budworm resistant to Cry1A-class of toxins Heliothis virescens
Sunflower Head Moth Homeosoma ellectellum
Banded Sunflower Moth Cochylis hospes
Argentine Looper Rachiplusia nu
Spilosoma Spilosoma virginica
Bertha Armyworm Mamestra configurata
Diamondback Moth Plutella xylostells
Diamondback Moth resistant to Cry1A-class of toxins Plutella xylostells
COLEOPTERA
Red Sunflower seed Weevil Smicronyx fulvus
Sunflower Stem Weevil Cylindrocopturus adspersus
Sunflower Beetle Zygoramma excla mationis
Canola Flea Beetle Phyllotreta cruciferae
Western Corn Rootworm Diabrotica virgifera virgifera
DIPTERA
Hessian Fly Mayetiola destructor
HOMOPTERA
Greenbug Schizaphis graminum
HEMIPTERA
Lygus Bug Lygus lineolaris
NEMATODA Heterodera glycines
실시예 14 - 독소 유전자의 식물 내로의 삽입(insertion)
본 발명의 한 측면은 본 발명의 살충성 독소를 코딩하는 유전자로 식물을 형질전환시키는 것이다. 형질전환된 식물은 타겟 해충의 공격에 대하여 내성을 가진다.
여기에 개시된 살충성 독소를 코딩하는 유전자를 당업계에서 공지된 다양한 기술을 사용하여 식물 세포 내로 삽입할 수 있다. 예를 들면, 대장균에서의 복제 시스템 및 형질전환된 세포의 선별을 허용하는 마커를 포함하는 많은 클로닝 벡터가 외래(foreign) 유전자의 고등 식물 내로의 삽입을 위한 조성물 용으로 사용될 수 있다. 이러한 벡터는 예를 들면, pBR322, pUC 시리즈, M13mp 시리즈, pACYC184 등을 포함한다. 따라서, 바실러스 독소를 코딩하는 서열을 적절한 제한효소 사이트에서 벡터 내로 삽입할 수 있다. 이로부터 생성된 플라스미드는 대장균 내로의 형질전환을 위하여 사용된다. 상기 대장균 세포를 적절한 영양 배지 내에서 배양한 다음, 수확하여 용해(lyse)시킨다. 상기 플라스미드를 회수한다. 서열 분석, 제한효소 분석(restriction analysis), 전기영동, 및 다른 생화학적-분자적 생물학적 방법을 분석 방법으로서 일반적으로 수행한다. 각 조작(manipulation) 후에, 사용된 DNA 서열을 잘라내어 다음 DNA 서열에 결합시킬 수 있다. 각 플라스미드 서열을 동일한 또는 다른 플라스미드에 클로닝 할 수 있다. 원하는 유전자를 식물 내로 삽입하는 방법에 따라, 다른 DNA 서열이 필요할 수도 있다. 만약, 예를 들어 Ti 또는 Ri 플라스미드를 식물 세포의 형질전환에 사용한다면, Ti 또는 Ri 플라스미드 T-DNA의 적어도 오른쪽 가장자리, 그러나 자주는 오른쪽 및 왼쪽 가장자리를 삽입될 유전자의 측접하는 영역(flanking region)으로서 결합시켜야 한다.
식물 세포의 형질전환을 위한 T-DNA의 사용은 집중적으로 연구되어 왔으며, 유럽특허 120 516; 훼케마의 문헌(참조: Hoekema [1985] The Binary Plant Vector System, Offset-durkkerij Kanters B.V., Alblasserdam, Chapter 5); 프랠리 등의 문헌(참조: Fraley et al., Crit. Rev. Plant. Sci. 4:1-460) 및 안 등의 문헌(참조: An et al. [1985] EMBO J. 4:277-287)에 충분히 기술되어 있다.
삽입된 DNA가 일단 지놈 내로 통합되면, 그것은 거기에서 상대적으로 안정하며, 대체로 다시 빠져 나오지 않는다. 그것은 보통 형질전환된 식물 세포에 생물독(biocide), 또는 카나마이신, G418, 블레오마이신, 히그로마이신, 또는 클로람페니콜과 같은 항생제에 대한 내성을 부여하는 선별 마커를 포함하고 있다. 개별적으로 사용된 마커는 따라서 상기 삽입된 DNA를 포함하지 않는 세포보다는 형질전환된 세포의 선별을 허용한다.
DNA를 식물 숙주 세포 내로 삽입하기 위하여 많은 기술이 이용가능하다. 그러한 기술은 형질전환 제제로서 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens) 또는 아그로박테리움 리조제네스(Agrobacterium rhizogenes)를 사용하는 T-DNA로의 형질전이, 융합(fusion), 주입(injection), 바이오리스틱스(biolistics: microparticle bombardment), 또는 일렉트로포레이숀 뿐만 아니라 다른 가능한 방법들을 포함한다. 만약 아그로박테리아를 형질전환에 사용한다면, 삽입될 DNA는 특별한 플라스미드, 즉 매개(intermediate) 벡터 또는 이원(binary) 벡터 내로 클로닝되어야 한다. 상기 매개 벡터는 T-DNA에 있는 서열과 상동적인(homologous) 서열 때문에 상동 재조합에 의해 Ti 또는 Ri 플라스미드 내로 통합될 수 있다. 상기 Ti 또는 Ri 플라스미드는 또한 T-DNA의 전달에 필요한 vir 영역을 포함한다. 매개 벡터는 아그로박테리아 내에서 그들 스스로는 복제할 수 없다. 상기 매개 벡터는 헬퍼(helper) 플라스미드에 의해 아그로박테리움 튜메파시엔스 내로 전달될 수 있다(접합: conjugation). 이원 벡터는 대장균 및 아그로박테리아 모두에서 그들 스스로 복제할 수 있다. 그들은 오른쪽 및 왼쪽 T-DNA 가장자리 영역에 의해 구획된(framed) 선별 마커 유전자 및 링커(linker) 또는 폴리링커를 포함한다. 그들은 아그로박테리아 내로 직접 형질전환될 수 있다(참조: Holsters et al. [1978] Mol. Gen. Genet. 163:181-187). 숙주 세포로 사용되는 아그로박테리움은 vir 영역을 지니고 다니는 플라스미드를 포함해야 한다. 상기 vir 영역은 T-DNA를 식물 세포 내로 전달하는데 필요하다. 부가적인 T-DNA 또한 포함될 수 있다. 그렇게 형질전환된 박테리아는 식물 세포를 형질전환시키는데 사용된다. 식물 이식편(explant)은 DNA를 식물 세포 내로 전달하기 위하여 아그로박테리움 튜메파시엔스 또는 아그로박테리움 리조제네스와 함께 유리하게 배양될 수 있다. 이어서, 선별용 항생제 또는 생물독을 포함하여도 좋은 적절한 배지에서 감염된 식물 재료(예를 들면, 잎 조각, 줄기 조각, 뿌리, 원형질, 또는 배양된 세포의 현탁액)로부터 전체 식물이 재생될 수 있다. 그런 다음, 그렇게 얻어진 식물을 삽입된 DNA의 존재에 대하여 테스트할 수 있다. 주입 및 일렉트로포레이숀의 경우에 플라스미드에 대한 특별한 요구 사항은 없다. 예를 들면 pUC 유도체(derivatives)와 같은 통상적인 플라스미드를 사용하는 것이 가능하다. 바이오리스틱 형질전환에 있어, 플라스미드 DNA 또는 선형 DNA가 사용될 수 있다.
형질전환된 세포는 통상적인 방식으로 형태학적으로 정상적인 식물로 재생된다. 만약, 형질전환이 생식세포 계열(germ line) 세포를 포함한다면, 삽입된 DNA 및 그에 상응하는 형태학적 형질(들)이 자손 식물에 전해질 것이다. 그러한 식물은 보통 방식으로 키울 수 있으며, 동일한 형질전환된 유전적 인자 또는 다른 유전적 인자를 가지고 있는 식물과 교배될 수 있다. 이로부터 생성되는 하이브리드 개체는 그에 상응하는 형태학적 특성을 가진다.
본 발명의 바람직한 일구현에서, 식물은 코돈 사용성이 식물을 위해 최적화된 유전자로 형질전환될 것이다(참조: 예를 들면, 미국특허 제 5,380,831호). 또한, 유리하게는 단축된(truncated) 독소를 코딩하는 식물이 사용될 것이다. 상기 단축된 독소는 전형적으로 독소의 전체 길이의 약 55 내지 80%를 코딩할 것이다. 식물에 사용하기 위한 합성 바실러스 유전자를 생성하기 위한 방법은 당업계에서 공지되어 있다.
여기에 기술된 실시예 및 구현은 오로지 설명의 목적을 위한 것으로 그들의 다양한 변형 또는 변화가 당업계에서 통상의 지식을 가진 자에게 제안될 것이며, 본 출원 및 첨부된 청구항의 정신 및 권한 내에 포함되어야 한다.

Claims (48)

  1. 서열 29, 서열 30, 서열 31, 서열 32, 서열 33, 서열 35, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 52, 서열 53, 및 서열 54로 구성되는 군으로부터 선택되는 뉴클레오티드 서열이 스트린젠트 조건(stringent condition) 하에서 살충 활성이 있는 단백질을 코딩하거나 또는 상기 단백질을 코딩하는 뉴클레오티드 서열에 대하여 상보적인 뉴클레오티드 서열과 혼성화하는, 살충 활성이 있는 단백질을 코딩하는 분리된 폴리뉴클레오티드.
  2. 서열 34, 서열 44, 서열 46, 서열 48, 서열 50, 및 서열 54로 구성되는 군으로부터 선택되는 아미노산 서열의 적어도 살충 활성이 있는 부분을 코딩하는 분리된 폴리뉴클레오티드.
  3. B.t. 분리주 PS33F1에 의해 생산되는 MIS-1 단백질; MIS-7 단백질; MIS-8 단백질; 및 KB59A4-6에 의해 생산되는 SUP 단백질로 구성되는 군으로부터 선택되는 단백질의 적어도 살충 활성이 있는 부분을 코딩하는 분리된 폴리뉴클레오티드.
  4. PS33F1, PS71G4, PS86D1, PS185V2, PS191A21, PS201Z, PS205A3, PS205C, PS234E1, PS248N10, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-3, KB69A125-5, KB69A127-7, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, KB71A35-6, KB71A72-1, KB71A134-2, PS185Y2, 및 KB59A4-6으로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는 살충 활성이 있는 단백질을 코딩하는 분리된 폴리뉴클레오티드.
  5. 제 4항에 있어서,
    상기 단백질은 PS177C8a, PS66D3, PS177I8, PS31F2, PS185Y2, KB68B46-2, KB68B51-2, KB68B55-2, KB53A49-4, PS86D1, HD573B, PS33F1, PS205C, PS157C1, PS201Z, PS71G4, KB71A72-1, KB71A134-2, KB69A125-3, 및 KB69A127-7로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는 MIS 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  6. 제 4항에 있어서,
    상기 단백질은 PS177C8a, PS66D3, PS177I8, PS31F2, PS185Y2, KB68B46-2, KB68B51-2, KB68B55-2, KB53A49-4, HD573B, PS33F1, PS205C, PS157C1, PS201Z, PS71G4, KB71A72-1, KB71A134-2, KB69A125-3, 및 KB69A127-7로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는 WAR 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  7. 제 4항에 있어서,
    상기 단백질은 KB68B46-2, PS86D1, HD573B, PS33F1, PS205C, PS157C1, PS201Z, PS71G4, KB71A72-1, KB71A134-2, KB69A125-3, KB69A127-7, PS31F2, 및 KB68B46-2로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는 WAR 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  8. 제 4항에 있어서,
    상기 단백질은 웨스턴 옥수수 뿌리벌레(western corn rootworm)에 대하여 활성이 있고, PS205A3, PS185V2, PS234E1, PS71G4, PS248N10, PS191A21, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-3, KB69A125-5, KB69A127-7, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, 및 KB71A35-6으로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는 것을 특징으로 하는 폴리뉴클레오티드.
  9. 제 3항에 있어서,
    상기 단백질은 B.t. 분리주 PS157C1-A에 의하여 생산되는 MIS-7 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  10. 제 3항에 있어서,
    상기 단백질은 서열 34에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  11. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 33에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  12. 제 3항에 있어서,
    상기 단백질은 B.t. 분리주 PS201Z에 의하여 생산되는 MIS-7 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  13. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 35에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  14. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 서열 35에서 보여지는 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  15. 제 3항에 있어서,
    상기 단백질은 B.t. 분리주 PS205C에 의하여 생산되는 MIS-7 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  16. 제 3항에 있어서,
    상기 단백질은 서열 44에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  17. 3항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 43에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  18. 제 3항에 있어서,
    상기 단백질은 B.t. 분리주 PS31F2에 의하여 생산되는 MIS-8 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  19. 제 3항에 있어서,
    상기 단백질은 서열 48에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  20. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 45에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  21. 제 3항에 있어서,
    상기 단백질은 B.t. 분리주 PS185Y2에 의하여 생산되는 MIS-8 단백질인 것을 특징으로 하는 폴리뉴클레오티드.
  22. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 서열 37에서 보여지는 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  23. 제 3항에 있어서,
    상기 폴리뉴클레오티드는 서열 38에서 보여지는 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  24. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 서열 46에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 단백질을 코딩하는 것을 특징으로 하는 폴리뉴클레오티드.
  25. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 45에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  26. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 서열 50에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 단백질을 코딩하는 것을 특징으로 하는 폴리뉴클레오티드.
  27. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 49에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  28. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 서열 54에서 보여지는 아미노산 서열의 적어도 살충 활성이 있는 부분을 포함하는 단백질을 코딩하는 것을 특징으로 하는 폴리뉴클레오티드.
  29. 제 1항에 있어서,
    상기 폴리뉴클레오티드는 살충 활성이 있는 단백질을 코딩하기에 충분한 서열 53에서 보여지는 뉴클레오티드 서열의 적어도 한 부분을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
  30. 제 1항에 따른 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 숙주.
  31. 제 30항에 있어서,
    상기 숙주는 식물 세포인 것을 특징으로 하는 재조합 숙주.
  32. 제 30항에 있어서,
    상기 숙주는 식물인 것을 특징으로 하는 재조합 숙주.
  33. 제 2항에 따른 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 숙주.
  34. 제 3항에 따른 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 숙주.
  35. 제 4항에 따른 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 숙주.
  36. 제 1항에 따른 폴리뉴클레오티드에 의하여 코딩되는 살충 활성이 있는 단백질.
  37. 제 2항에 따른 폴리뉴클레오티드에 의하여 코딩되는 살충 활성이 있는 단백질.
  38. 제 3항에 따른 폴리뉴클레오티드에 의하여 코딩되는 살충 활성이 있는 단백질.
  39. 제 4항에 따른 폴리뉴클레오티드에 의하여 코딩되는 살충 활성이 있는 단백질.
  40. 비포유동물 해충을 제 1항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시킴으로써 비포유동물 해충을 방제하는 방법.
  41. 비포유동물 해충을 제 2항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시킴으로써 비포유동물 해충을 방제하는 방법.
  42. 비포유동물 해충을 제 3항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시킴으로써 비포유동물 해충을 방제하는 방법.
  43. 비포유동물 해충을 제 4항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시킴으로써 비포유동물 해충을 방제하는 방법.
  44. 옥수수 뿌리벌레(corn rootworm)를 PS205A3, PS185V2, PS234E1, PS71G4, PS248N10, PS191A21, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-3, KB69A125-5, KB69A127-7, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, 및 KB71A35-6으로 구성되는 군으로부터 선택되는 분리주에 의하여 생산되는, 제 1항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시키는 단계를 포함하는 옥수수 뿌리벌레를 방제하는 방법.
  45. 제 44항에 있어서,
    상기 옥수수 뿌리벌레는 웨스턴 옥수수 뿌리벌레(Western corn rootworm)인 것을 특징으로 하는 방법.
  46. 옥수수 뿌리벌레를 B.t. 분리주 PS31F2에 의하여 생산되는, 제 1항에 따른 폴리뉴클레오티드에 의하여 코딩되는 적어도 하나의 살충 활성이 있는 단백질과 접촉시키는 단계를 포함하는 옥수수 뿌리벌레를 방제하는 방법.
  47. PS33F1, PS71G4, PS86D1, PS185V2, PS191A21, PS201Z, PS205A3, PS205C, PS234E1, PS248N10, KB63B19-13, KB63B19-7, KB68B62-7, KB68B63-2, KB69A125-1, KB69A125-3, KB69A125-5, KB69A127-7, KB69A132-1, KB69B2-1, KB70B5-3, KB71A125-15, KB71A35-6, KB71A72-1, KB71A134-2, PS185Y2, 및 KB59A4-6으로 구성되는 군으로부터 선택되는, 제 1항의 폴리뉴클레오티드에 의하여 코딩되는 살충 활성이 있는 단백질을 생산하는 B.t. 분리주의 생물학적으로 순수한 배양주(culture).
  48. 서열 29, 서열 30, 서열 31, 서열 32, 서열 33, 서열 35, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 52, 서열 53, 및 서열 54로 구성되는 군으로부터 선택되는 뉴클레오티드 서열을 포함하는, 제 1항에 따른 폴리뉴클레오티드에 혼성화시키기 위한 프로브 또는 프라이머로 사용하기 위한 진단용 폴리뉴클레오티드.
KR1020007012306A 1998-05-06 1999-05-06 살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열 KR100763074B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/073,898 US6242669B1 (en) 1996-10-30 1998-05-06 Pesticidal toxins and nucleotide sequences which encode these toxins
US09/073,898 1998-05-06

Publications (2)

Publication Number Publication Date
KR20010043334A true KR20010043334A (ko) 2001-05-25
KR100763074B1 KR100763074B1 (ko) 2007-10-04

Family

ID=22116467

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007012306A KR100763074B1 (ko) 1998-05-06 1999-05-06 살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열

Country Status (16)

Country Link
US (2) US6242669B1 (ko)
EP (2) EP1944372B1 (ko)
JP (1) JP2002513574A (ko)
KR (1) KR100763074B1 (ko)
CN (1) CN1296482C (ko)
AR (1) AR016989A1 (ko)
AT (1) ATE556138T1 (ko)
AU (1) AU759579B2 (ko)
BR (1) BR9915969B1 (ko)
CA (1) CA2327266C (ko)
DK (1) DK1944372T3 (ko)
ES (1) ES2383997T3 (ko)
HU (1) HUP0101991A3 (ko)
MX (1) MXPA00010890A (ko)
TR (1) TR200003264T2 (ko)
WO (1) WO1999057282A2 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR020141A1 (es) 1998-08-10 2002-04-10 Mycogen Corp Toxinas y genes pesticidas de cepas de bacillus laterosporus
US7700838B1 (en) * 1999-09-17 2010-04-20 Monsanto Technology Llc Bacillus thuringiensis chromosomal genome sequences and uses thereof
US7091399B2 (en) * 2000-05-18 2006-08-15 Bayer Bioscience N.V. Transgenic plants expressing insecticidal proteins and methods of producing the same
BRPI0110867B1 (pt) * 2000-05-18 2018-04-03 Bayer Cropscience N.V. Proteínas inseticidas, proteína híbrida, dna codificando as mesmas, genes quiméricos, processos para controle de insetos e para tornar uma planta resistente a insetos, bem como composição compreendendo as referidas proteínas, e microrganismo
US6706860B2 (en) 2000-05-18 2004-03-16 Bayer Bioscience N.V. Toxins
CN101385467B (zh) * 2001-03-30 2014-11-05 辛根塔参与股份公司 新的杀虫毒素
AR035799A1 (es) * 2001-03-30 2004-07-14 Syngenta Participations Ag Toxinas insecticidas aisladas de bacillus thuringiensis y sus usos.
JP2006500908A (ja) 2002-03-06 2006-01-12 シンジェンタ パーティシペーションズ アクチェンゲゼルシャフト 新規なVip3トキシン及び使用方法
EP2213681A1 (en) 2002-03-22 2010-08-04 Bayer BioScience N.V. Novel Bacillus thuringiensis insecticidal proteins
BR0312448A (pt) 2002-06-28 2005-10-18 Dow Agrosciences Llc Proteìnas pesticidamente ativas e polinucleotìdeos obtenìveis a partir de espécies paenibacillus
CN100420752C (zh) * 2006-03-10 2008-09-24 浙江大学 一种杀虫基因及其用途
EA019578B1 (ru) 2006-06-03 2014-04-30 Зингента Партисипейшнс Аг Выделенная молекула нуклеиновой кислоты и ее применение
UA111592C2 (uk) 2010-07-07 2016-05-25 Сінгента Партісіпейшнс Аг Спосіб контролю над твердокрилими комахами-шкідниками
BR122020017359B1 (pt) 2011-07-28 2021-10-13 Syngenta Participations Ag Método para controle de uma praga de nemátodos
CN104145020B (zh) 2012-02-16 2020-06-02 先正达参股股份有限公司 工程化的杀有害生物蛋白质
CN106455545B (zh) 2014-06-20 2021-03-09 美国陶氏益农公司 可用于控制昆虫有害生物的营养生长杀虫蛋白
US10743535B2 (en) 2017-08-18 2020-08-18 H&K Solutions Llc Insecticide for flight-capable pests
BR112021004683A2 (pt) * 2018-09-11 2021-06-08 Pioneer Hi-Bred International, Inc. proteínas inseticidas e métodos para seu uso
CN110903361B (zh) * 2019-12-24 2021-08-06 隆平生物技术(海南)有限公司 一种植物抗虫基因mVip3Aa及其载体和应用

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4467036A (en) 1981-11-12 1984-08-21 The Board Of Regents Of The University Of Washington Bacillus thuringiensis crystal protein in Escherichia coli
US4448885A (en) 1981-04-27 1984-05-15 Board Of The Regents Of The University Of Washington Bacillus thuringiensis crystal protein in Escherichia coli
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4695462A (en) 1985-06-28 1987-09-22 Mycogen Corporation Cellular encapsulation of biological pesticides
US4695455A (en) 1985-01-22 1987-09-22 Mycogen Corporation Cellular encapsulation of pesticides produced by expression of heterologous genes
US4797276A (en) 1985-03-22 1989-01-10 Mycogen Corporation Control of cotton boll weevil, alfalfa weevil, and corn rootworm via contact with a strain of Bacillus thuringiensis
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4918006A (en) 1985-07-01 1990-04-17 E. I. Du Pont De Nemours And Company Gene coding for insecticidal crystal protein
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
CA1341092C (en) 1985-12-12 2000-09-05 David L. Edwards Process for altering the host range of bacillus thuringiensis toxins, and novel toxins produced thereby
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5322932A (en) 1987-08-12 1994-06-21 Mycogen Corporation Nematode-active toxin from a Bacillus thuringiensis isolate
US5262399A (en) 1987-08-12 1993-11-16 Mycogen Corporation Compositions and methods for the control of flukes
US4948734A (en) 1987-08-12 1990-08-14 Mycogen Corporation Novel isolates of bacillus thuringiensis having activity against nematodes
US5236843A (en) 1987-08-12 1993-08-17 Mycogen Corporation Gene encoding a nematode-active toxin cloned from a Bacillus thuringiensis isolate
US5281530A (en) 1987-08-12 1994-01-25 Mycogen Corporation Genes encoding nematode-active toxins cloned from bacillus thuringiensis isolate PS17
US5151363A (en) 1990-07-27 1992-09-29 Mycogen Corporation Isolates of Bacillus thuringiensis that are active against nematodes
US5439881A (en) 1987-08-12 1995-08-08 Mycogen Corporation Gene encoding nematode-active toxin PS63B cloned from Bacillus thuringiensis isolate
US5093120A (en) 1987-08-12 1992-03-03 Mycogen Corporation Novel isolates of Bacillus thuringiensis having activity against nematodes
NZ230375A (en) 1988-09-09 1991-07-26 Lubrizol Genetics Inc Synthetic gene encoding b. thuringiensis insecticidal protein
US4990332A (en) 1988-10-25 1991-02-05 Mycogen Corporation Novel lepidopteran-active Bacillus thuringiensis isolate
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
US5169629A (en) 1988-11-01 1992-12-08 Mycogen Corporation Process of controlling lepidopteran pests, using bacillus thuringiensis isolate denoted b.t ps81gg
US5135867A (en) 1988-11-01 1992-08-04 Mycogen Corporation Gene encoding a lepidopteran-active toxin from Bacillus thuringiensis isolate denoted B.t. .PS81GG active against lepidopteran pests
US5164180A (en) 1989-05-18 1992-11-17 Mycogen Corporation Bacillus thuringiensis isolates active against lepidopteran pests
US5126133A (en) 1989-06-27 1992-06-30 Mycogen Corporation Bacillus thuringiensis isolate active against lepidopteran pests, and genes encoding novel lepidopteran-active toxins
US5204237A (en) 1989-10-25 1993-04-20 Mycogen Corporation Universal and specific probes for Bacillus thuringiensis endotoxin genes
US5270448A (en) 1990-07-27 1993-12-14 Mycogen Corporation Isolates of Bacillus thuringiensis that are active against nematodes
US5686069A (en) 1990-10-15 1997-11-11 Mycogen Corporation Protein toxins active against lepidopteran pests
EP0628051B1 (en) 1992-02-12 2003-07-02 Chromagen, Inc. Applications of fluorescent n-nucleosides and fluorescent structural analogs of n-nucleosides
US5262159A (en) 1992-08-24 1993-11-16 Mycogen Corporation Use of Bacillus thuringiensis isolates for controlling pests in the family aphididae
AU677956B2 (en) 1992-08-27 1997-05-15 Bayer Cropscience Nv New bacillus thuringiensis strains and their insecticidal proteins
US5849870A (en) 1993-03-25 1998-12-15 Novartis Finance Corporation Pesticidal proteins and strains
NZ263445A (en) 1993-03-25 1996-11-26 Ciba Geigy Ag Bacillus strains producing pesticidal protein during vegetive growth
US5877012A (en) 1993-03-25 1999-03-02 Novartis Finance Corporation Class of proteins for the control of plant pests
WO1994024264A1 (en) 1993-04-09 1994-10-27 Plant Genetic Systems N.V. New bacillus thuringiensis strains and their insecticidal proteins
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5667993A (en) 1995-10-06 1997-09-16 Mycogen Corporation Primers and probes for the identification of bacillus thuringiensis genes and isolates
US5670365A (en) 1995-10-06 1997-09-23 Mycogen Corporation Identification of, and uses for, nematicidal bacillus thuringiensis genes, toxins, and isolates
KR20000022459A (ko) * 1996-07-01 2000-04-25 칼튼 제이. 에이블 밤나방과 해충에 대해 활성적인 바실루스 츄린겐시스 독소
US7129212B2 (en) * 1996-10-30 2006-10-31 Mycogen Corporation Polynucleotides, pesticidal proteins, and novel methods of using them
KR20000053001A (ko) 1996-10-30 2000-08-25 칼튼 제이. 에이블 신규한 살충독소 및 이들 독소를 코드화하는 뉴클레오티드 서열
AU727218B2 (en) 1997-04-03 2000-12-07 Syngenta Participations Ag Plant pest control

Also Published As

Publication number Publication date
HUP0101991A2 (hu) 2001-10-28
US20020100080A1 (en) 2002-07-25
TR200003264T2 (tr) 2001-02-21
WO1999057282A3 (en) 2000-06-22
AU759579B2 (en) 2003-04-17
CA2327266A1 (en) 1999-11-11
CN1296482C (zh) 2007-01-24
CA2327266C (en) 2010-01-12
EP1944372A2 (en) 2008-07-16
KR100763074B1 (ko) 2007-10-04
US6656908B2 (en) 2003-12-02
AU3888399A (en) 1999-11-23
BR9915969A (pt) 2001-08-28
HUP0101991A3 (en) 2003-03-28
JP2002513574A (ja) 2002-05-14
EP1944372B1 (en) 2012-05-02
EP1075522A2 (en) 2001-02-14
MXPA00010890A (es) 2002-04-24
BR9915969B1 (pt) 2014-10-14
AR016989A1 (es) 2001-08-01
US6242669B1 (en) 2001-06-05
EP1944372A3 (en) 2010-06-02
DK1944372T3 (da) 2012-06-04
ES2383997T3 (es) 2012-06-28
CN1307639A (zh) 2001-08-08
ATE556138T1 (de) 2012-05-15
WO1999057282A2 (en) 1999-11-11

Similar Documents

Publication Publication Date Title
KR100763074B1 (ko) 살충성 독소 및 상기 독소를 코딩하는 뉴클레오티드 서열
US6204435B1 (en) Pesticidal toxins and nucleotide sequences which encode these toxins
JP2001507208A (ja) 害虫に対して有効な毒素
US7129212B2 (en) Polynucleotides, pesticidal proteins, and novel methods of using them
JP2002500166A (ja) ヨーロッパアワノメイガ(Ostrinianubilalis)に対して活性な毒素
US6603063B1 (en) Plants and cells transformed with a nucleic acid from Bacillus thuringiensis strain KB59A4-6 encoding a novel SUP toxin
US6534644B1 (en) Toxins active against pests
US6710027B2 (en) Bacillus thuringiensis toxins and genes for controlling coleopteran pests
AU5394899A (en) Pesticidal toxins and genes from (bacillus laterosporus) strains
US6051550A (en) Materials and methods for controlling homopteran pests
AU775377B2 (en) Novel pesticidal toxins and nucleotide sequences which encode these toxins

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120907

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130906

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140826

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150819

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160818

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170818

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee