KR20220127844A - 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 - Google Patents

바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20220127844A
KR20220127844A KR1020227026692A KR20227026692A KR20220127844A KR 20220127844 A KR20220127844 A KR 20220127844A KR 1020227026692 A KR1020227026692 A KR 1020227026692A KR 20227026692 A KR20227026692 A KR 20227026692A KR 20220127844 A KR20220127844 A KR 20220127844A
Authority
KR
South Korea
Prior art keywords
seq
lys
cell
leu
sequence
Prior art date
Application number
KR1020227026692A
Other languages
English (en)
Inventor
스티븐 디 도이그
라이언 엘 프리쉬
홍샨 허
크리스 레플랑
전 마
브라이언 제임스 폴
Original Assignee
다니스코 유에스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니스코 유에스 인크. filed Critical 다니스코 유에스 인크.
Publication of KR20220127844A publication Critical patent/KR20220127844A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1235Diphosphotransferases (2.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y502/00Cis-trans-isomerases (5.2)
    • C12Y502/01Cis-trans-Isomerases (5.2.1)
    • C12Y502/01008Peptidylprolyl isomerase (5.2.1.8), i.e. cyclophilin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/07Bacillus
    • C12R2001/10Bacillus licheniformis

Abstract

본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 구성 및/또는 획득하기 위한 조성물 및 방법에 관한 것이다. 따라서, 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 모체 바실러스 리체니포르미스 균주로부터 유래된 유전자 변형 바실러스 리체니포르미스 균주에 관한 것이다.

Description

바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법
본 발명은 일반적으로 세균학, 미생물학, 유전학, 분자 생물학, 효소학, 및 산업 단백질 생산 등의 분야에 관한 것이다. 따라서, 본 발명의 특정 구현예는 단백질 생산 표현형이 향상된 바실러스 리체니포르미스(Bacillus licheniformis) 세포/균주를 구성하기 위한 조성물 및 방법에 관한 것이다.
관련 출원에 대한 상호 참조
본 출원은 2020년 1월 15일에 출원된 미국 가출원 62/961,234호의 이익을 주장하며, 그 전문은 본원에 참조로 포함된다.
서열 목록에 대한 참조
"NB41684-WO-PCT_SequenceListing.txt"라는 파일명의 서열 목록 텍스트 파일의 전자 제출 내용은 2021년 1월 7일에 생성되었으며 크기는 425 KB이고, 전체가 본원에 참조로 포함된다.
바실러스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 및 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens)와 같은 그람 양성 박테리아는 우수한 발효 특성 및 높은 수율(예를 들어, 배양액 1 리터당 최대 25 그램; 문헌[Van Dijl and Hecker, 2013])로 인해 산업 관련 단백질의 생산을 위한 미생물 공장으로 자주 사용된다. 예를 들어, B. 서브틸리스는 식품, 직물, 세탁, 의료 기기 세척, 제약 산업 등에 필요한 α-아밀라제(문헌[Jensen et al., 2000; Raul et al., 2014]) 및 프로테아제(문헌[Brode et al., 1996])를 생성하는 것으로 잘 알려져 있다(문헌[Westers et al., 2004]). 이러한 비병원성 그람 양성 박테리아의 경우 독성 부산물(예를 들어, 내독소로도 알려진 리포다당류; LPS)이 전혀 없는 단백질이 생산되기 때문에 유럽 식품 안전청(European Food Safety Authority)의 "공인된 안전성 추정"(QPS) 등급을 획득했으며, 많은 제품이 미국 식품의약국의 "GRAS(Generally Recognized As Safe)" 등급을 받았다(문헌[Olempska-Beer et al., 2006; Earl et al., 2008; Caspers et al., 2010]).
따라서, 미생물 숙주 세포에서 단백질(예를 들어, 효소, 항체, 수용체 등)을 생산하는 것은 생명공학 분야에서 특히 관심 대상이다. 마찬가지로, 하나 이상의 관심 단백질의 생산 및 분비에 대한 바실러스 숙주 세포의 최적화는 특히 산업 생명공학 환경에서 관련성이 높으며, 단백질 수율의 작은 개선은 단백질을 대규모의 산업적인 양으로 생산할 때 매우 중요하다. 보다 구체적으로, B. 리체니포르미스는 산업적으로 매우 중요한 바실러스 종 숙주 세포이므로, 단백질 발현/생산을 향상/증가시키기 위해 B. 리체니포르미스 숙주 세포를 변형 및 조작할 수 있음은 새로운 개선된 B. 리체니포르미스 생산 균주의 구성에 매우 바람직하다. 따라서, 본 발명은 단백질 생산 능력이 향상된 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주 세포)를 획득하고 구성하기 위한 매우 바람직한 충족되지 않은 요구에 관한 것이다.
본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 획득하기 위한 조성물 및 방법에 관한 것이다. 따라서, 본 발명의 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 이러한 변형된 B. 리체니포르미스 세포/균주를 구성하는 방법에 관한 것이다.
따라서, 본 발명의 특정 구현예는 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서, (a) POI를 발현하는 모체 B. 리체니포르미스 세포를 수득하고, 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써 모세포를 변형시키는 단계, 및 (b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 상기 방법의 특정 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 상기 방법의 다른 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 바람직한 특정 구현예에서, 모세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하고, 이에 따라 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질의 제2 카피를 암호화한다. 다른 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 상기 방법의 또 다른 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
다른 특정 구현예에서, 본 발명은 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서, (a) (i) POI를 암호화하는 발현 카세트 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 모체 B. 리체니포르미스 세포에 도입하는 단계, 및 (b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 상기 방법의 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 다른 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 상기 방법의 또 다른 구현예에서, 내인성 prsA 유전자는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 바람직한 특정 구현예에서, 모세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하고, 이에 따라 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질의 제2 카피를 암호화한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 바람직한 특정 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
본 발명의 다른 구현예는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스 세포/균주로부터 유래된 변형된 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 또 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 특정 구현예에서, 천연 prsA 단백질을 암호화하는 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 바람직한 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 변형된 세포는 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 구성체를 포함한다. 다른 구현예에서, 이종성 POI는 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 특정 구현예는 본 발명의 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
따라서, 본 발명의 다른 특정 구현예는 변형이 유래된 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것이다. 따라서, 특정 구현예에서, 본 발명은 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것으로, 변형된 세포는 POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고, 변형된 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산한다. 다른 구현예에서, 변형된 바실러스 리체니포르미스 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 또 다른 구현예에서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함한다. 다른 특정 구현예에서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함한다. 다른 구현예에서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 다른 특정 구현예는 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
다른 구현예에서, 본 발명은 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것으로, 변형된 세포는 POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고, 변형된 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함한다. 또 다른 구현예에서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함한다. 다른 특정 구현예에서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함한다. 다른 구현예에서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 다른 특정 구현예는 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
생물학적 서열의 간단한 설명
서열번호 1은 천연 S. 피오게네스 Cas9 단백질을 암호화하는 아미노산 서열이다.
서열번호 2는 서열번호 1의 Cas9 단백질을 암호화하는 핵산 서열로서, 바실러스 종 세포에서의 발현에 대해 코돈 최적화된 핵산 서열이다.
서열번호 3은 합성 N-말단 핵 국재화 신호(NLS)의 아미노산 서열이다.
서열번호 4는 합성 C-말단 핵 국재화 신호(NLS)의 아미노산 서열이다.
서열번호 5는 합성 데카-히스티딘 태그의 아미노산 서열이다.
서열번호 6B. 서브틸리스 aprE 프로모터 서열이다.
서열번호 7은 합성 종결자 핵산 서열이다.
서열번호 8은 정방향 프라이머 핵산 서열이다.
서열번호 9는 역방향 프라이머 핵산 서열이다.
서열번호 10은 합성 pKB320 백본 핵산 서열이다.
서열번호 11은 합성 pKB320 핵산 서열이다.
서열번호 12는 프라이머 핵산 서열이다.
서열번호 13은 프라이머 핵산 서열이다.
서열번호 14는 프라이머 핵산 서열이다.
서열번호 15는 프라이머 핵산 서열이다.
서열번호 16은 프라이머 핵산 서열이다.
서열번호 17은 프라이머 핵산 서열이다.
서열번호 18은 프라이머 핵산 서열이다.
서열번호 19는 프라이머 핵산 서열이다.
서열번호 20은 프라이머 핵산 서열이다.
서열번호 21은 프라이머 핵산 서열이다.
서열번호 22는 프라이머 핵산 서열이다.
서열번호 23은 프라이머 핵산 서열이다.
서열번호 24는 프라이머 핵산 서열이다.
서열번호 25는 합성 pRF694 핵산 서열이다.
서열번호 26은 합성 pRF801 핵산 서열이다.
서열번호 27은 합성 pRF806 핵산 서열이다.
서열번호 28B. 리체니포르미스 표적 부위 1(TS1) 핵산 서열이다.
서열번호 29B. 리체니포르미스 표적 부위 2(TS2) 핵산 서열이다.
서열번호 30B. 리체니포르미스 serA1 오픈 리딩 프레임(ORF) 서열이다.
서열번호 31은 뉴클레오티드 "AGG"를 포함하는 표적 부위 1 PAM 서열이다.
서열번호 32는 가변 표적화 (VT) 부위 1을 암호화하는 핵산 서열이다.
서열번호 33은 CER 도메인을 암호화하는 합성 핵산 서열이다.
서열번호 34는 부위 1을 표적화하는 합성 가이드 RNA(gRNA) 서열이다.
서열번호 35는 합성 spac 프로모터 핵산 서열이다.
서열번호 36은 합성 t0 종결자 핵산 서열이다.
서열번호 37B. 리체니포르미스 serA1 상동성 아암 1 핵산 서열이다.
서열번호 38은 합성 serA1 상동성 아암 1 정방향 프라이머 서열이다.
서열번호 39는 합성 serA1 상동성 아암 1 역방향 프라이머 서열이다.
서열번호 40B. 리체니포르미스 serA1 상동성 아암 2 핵산 서열이다.
서열번호 41은 합성 serA1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 42는 합성 serA1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 43은 표적 부위 1(TS1) gRNA를 암호화하는 발현 카세트이다.
서열번호 44는 합성 serA1 결실 편집 주형이다.
서열번호 45B. 리체니포르미스 rghR1 오픈 리딩 프레임(ORF) 서열이다.
서열번호 46은 뉴클레오티드 "CGG"를 포함하는 표적 부위 2 PAM 서열이다.
서열번호 47은 부위 2를 표적화하는 합성 가이드 RNA(gRNA) 서열이다.
서열번호 48B. 리체니포르미스 rghR1 상동성 아암 1 핵산 서열이다.
서열번호 49는 합성 rghR1 상동성 아암 1 정방향 프라이머 서열이다.
서열번호 50은 합성 rghR1 상동성 아암 1 역방향 프라이머 서열이다.
서열번호 51B. 리체니포르미스 rghR1 상동성 아암 2 핵산 서열이다.
서열번호 52는 합성 rghR1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 53은 합성 rghR1 상동성 아암 2 역방향 프라이머 서열이다.
서열번호 54는 표적 부위 2(TS2) gRNA를 암호화하는 발현 카세트이다.
서열번호 55는 합성 rghR1 결실 편집 주형이다.
서열번호 56은 Cas9(Y155H) 변이 단백질을 암호화하는 아미노산 서열이다.
서열번호 57은 합성 Y155H 정방향 프라이머 서열이다.
서열번호 58은 합성 Y155H 역방향 프라이머 서열이다.
서열번호 59는 합성 pRF827 핵산 서열이다.
서열번호 60은 서열번호 56의 변이 Cas9(Y155H) 단백질을 암호화하는 발현 카세트이다.
서열번호 61은 합성 pRF856 핵산 서열이다.
서열번호 62는 합성 pRF862 핵산 서열이다.
서열번호 63은 합성 Y155H 단편 서열이다.
서열번호 64는 합성 Y155H 단편 정방향 프라이머 서열이다.
서열번호 65는 합성 Y155H 단편 역방향 프라이머 서열이다.
서열번호 66은 합성 pRF694 단편 서열이다.
서열번호 67은 합성 pRF694 단편 정방향 프라이머 서열이다.
서열번호 68은 합성 pRF694 단편 역방향 프라이머 서열이다.
서열번호 69는 합성 pRF869 핵산 서열이다.
서열번호 70B. 리체니포르미스 rghR2 오픈 리딩 프레임(ORF) 서열이다.
서열번호 71은 합성 rghR2 stop 단편이다.
서열번호 72는 합성 rghR2 stop 편집 주형이다.
서열번호 73rghR2 gRNA를 암호화하는 발현 카세트이다.
서열번호 74는 합성 단편 정방향 프라이머이다.
서열번호 75는 합성 단편 역방향 프라이머이다.
서열번호 76은 합성 pRF862 백본 정방향 프라이머이다.
서열번호 77은 합성 pRF862 백본 역방향 프라이머이다.
서열번호 78은 합성 pRF879 핵산 서열이다.
서열번호 79B. 리체니포르미스 pRF879 표적 부위 및 PAM 핵산 서열이다.
서열번호 80은 합성 pRF879 편집 주형 서열이다.
서열번호 81은 합성 pRF946 핵산 서열이다.
서열번호 82B. 리체니포르미스 pR946 표적 부위 및 PAM 핵산 서열이다.
서열번호 83은 합성 pR946 편집 주형 서열이다.
서열번호 84는 합성 pZM221 핵산 서열이다.
서열번호 85는 합성 pZM221 표적 부위 및 PAM 핵산 서열이다.
서열번호 86은 합성 pZM221 편집 주형 서열이다.
서열번호 87B. 리체니포르미스 lysA 오픈 리딩 프레임(ORF) 서열이다.
서열번호 88은 합성 pBl.comK 핵산 서열이다.
서열번호 89는 합성 스펙티노마이신 마커 핵산 서열이다.
서열번호 90B. 서브틸리스 xylR 핵산 서열이다.
서열번호 91B. 서브틸리스 xylAp 핵산 서열이다.
서열번호 92는 합성 comK 핵산 서열이다.
서열번호 93은 합성 cat_prsA 핵산 서열이다.
서열번호 94B. 리체니포르미스 cat 업스트림 핵산 서열이다.
서열번호 95B. 리체니포르미스 cat 프로모터 핵산 서열이다.
서열번호 96B. 리체니포르미스 catH 핵산 서열이다.
서열번호 97은 합성 이중 종결자 핵산 서열이다.
서열번호 98B. 리체니포르미스 catH 종결자 핵산 서열이다.
서열번호 99B. 서브틸리스 spoVG 종결자 핵산 서열이다.
서열번호 100B. 리체니포르미스 prsA 프로모터 핵산 서열이다.
서열번호 101B. 리체니포르미스 prsA 오픈 리딩 프레임(ORF) 서열이다.
서열번호 102B. 리체니포르미스 amyL 종결자 핵산 서열이다.
서열번호 103B. 리체니포르미스 cat 다운스트림 핵산 서열이다.
서열번호 104는 합성 정방향 프라이머 핵산 서열이다.
서열번호 105는 합성 역방향 프라이머 핵산 서열이다.
서열번호 106은 합성 prsA(제2 카피) 검증 핵산 서열이다.
서열번호 107은 합성 프라이머 서열이다.
서열번호 108은 합성 프라이머 서열이다.
서열번호 109는 합성 프라이머 서열이다.
서열번호 110B. 리체니포르미스 결실 catHPcatH 암호화 핵산 서열이다.
서열번호 111cat catH 결실에서의 합성 prsA(제2 카피) 발현 카세트이다.
서열번호 112는 합성 catH(제2 카피) 결실 검증 PCR 산물이다.
서열번호 113은 합성 정방향 프라이머 서열이다.
서열번호 114는 합성 역방향 프라이머 서열이다.
서열번호 115는 합성 dltA-2 검증 PCR 산물이다.
서열번호 116은 합성 dltA-2 모체 검증 PCR 산물이다.
서열번호 117은 합성 정방향 프라이머 서열이다.
서열번호 118은 합성 역방향 프라이머 서열이다.
서열번호 119는 합성 rghR2 결실 검증 PCR 산물이다.
서열번호 120B. 리체니포르미스 모체 rghR2 결실 검증 PCR 산물이다.
서열번호 121B. 리체니포르미스 모체 rghR2 유전자좌이다.
서열번호 122B. 리체니포르미스 모체 dltA 유전자좌이다.
서열번호 123B. 리체니포르미스 모체 cat 유전자좌이다.
서열번호 124는 합성 cat 2x prsA 유전자좌이다.
서열번호 125는 합성 dltA-2 유전자좌이다.
서열번호 126B. 리체니포르미스 아밀라제 1 단백질의 아미노산 서열이다.
서열번호 127은 합성 serA1 아밀라제 1 카세트이다.
서열번호 128은 합성 p3 프로모터 서열이다.
서열번호 129는 합성 변형된 aprE 5'-UTR 서열이다.
서열번호 130amyL 신호 서열을 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 131은 서열번호 126의 아밀라제 1 단백질을 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 132는 합성 lysA 아밀라제 1 카세트이다.
서열번호 133은 합성 lysA 모체 유전자좌 핵산 서열이다.
서열번호 134lysA를 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 135는 합성 p2 프로모터 서열이다.
서열번호 136은 아밀라제 2 단백질의 아미노산 서열이다.
서열번호 137은 합성 serA1 아밀라제 2 카세트이다.
서열번호 138B. 서브틸리스 rrnI 프로모터 서열이다.
서열번호 139B. 서브틸리스 aprE 5'-UTR 서열이다.
서열번호 140은 서열번호 136의 아밀라제 2 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 141은 합성 amyL 또는 lysA 아밀라제 2 카세트이다.
서열번호 142는 합성 amyL 모체 유전자좌이다.
서열번호 143은 아밀라제 3 단백질의 아미노산 서열이다.
서열번호 144는 합성 serA1 아밀라제 3 카세트이다.
서열번호 145는 서열번호 143의 아밀라제 3 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 146은 합성 lysA 아밀라제 3 카세트이다.
서열번호 147은 아밀라제 4 단백질의 아미노산 서열이다.
서열번호 148은 합성 serA1 아밀라제 4 카세트이다.
서열번호 149는 서열번호 147의 아밀라제 4 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 150은 합성 lysA Amylase 4 카세트이다.
서열번호 151은 아밀라제 5 단백질의 아미노산 서열이다.
서열번호 152는 합성 serA1 아밀라제 5 카세트이다.
서열번호 153은 서열번호 151의 아밀라제 5 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 154는 합성 lysA 아밀라제 5 카세트이다.
서열번호 155는 천연 B. 리체니포르미스 prsA 단백질의 아미노산 서열이다.
서열번호 156은 천연 B. 리체니포르미스 RghR2 단백질의 아미노산 서열이다.
서열번호 157은 변이 B. 리체니포르미스 RghR2 단백질의 아미노산 서열이다.
서열번호 158은 서열번호 157의 변이 RghR2 단백질을 암호화하는 변이 B. 리체니포르미스 rghR2 유전자의 핵산 서열이다.
본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 획득하기 위한 조성물 및 방법에 관한 것이다. 본 발명의 특정 구현예는 모체 B. 리체니포르미스 세포/균주로부터 유래된 유전자 변형 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 본 발명의 다른 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 이러한 변형된 B. 리체니포르미스 세포/균주를 구성하는 방법에 관한 것이다.
예를 들어, 본 발명의 특정 구현예는 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 특정 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함한다. 특정 구현예에서, 관심 단백질(POI)은 효소이다. 특정 구현예에서, 효소는 프로테아제 또는 아밀라제이다.
본 발명의 다른 구현예는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스 세포/균주로부터 유래된 변형된 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
따라서, 본 발명의 특정 구현예는 본 발명의 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
I. 정의
본 발명의 변형된 B. 리체니포르미스 세포 및 본원에 기재된 이의 방법과 관련하여, 다음의 용어 및 어구가 정의된다. 본원에 정의되지 않은 용어는 당업계에서 사용되는 통상적인 의미를 따른다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 조성물 및 방법의 실시 또는 시험에 사용될 수도 있지만, 대표적인 예시적 방법 및 재료가 이제 기술된다. 본원에 인용된 모든 간행물 및 특허는 그 전체가 참조로 포함된다.
또한, 임의의 선택적 요소를 제외하도록 청구범위가 작성될 수 있음에 유의한다. 따라서, 이러한 서술은 청구 요소의 설명과 관련하여 "전적으로", "단지", "~를 제외한", "~를 포함하지 않는" 등과 같은 배타적 용어를 사용하거나, "부정적" 제한이나 그 단서를 사용하기 위한 선행 근거로서의 역할을 하기 위한 것이다.
본원에 기재되고 예시된 개별 구현예 각각은 본원에 기재된 본 발명의 조성물 및 방법의 범위 또는 사상을 벗어나지 않으면서 임의의 다른 여러 구현예의 특징과 쉽게 분리되거나 조합될 수 있는 별개의 구성요소 및 특징을 가지며, 이는 본 개시내용을 읽을 때 당업자에게 명백할 것이다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원에서 사용되는 바와 같이, "바실러스 속"은 B. 서브틸리스(subtilis), B. 리체니포르미스(licheniformis), B. 렌투스(lentus), B. 브레비스(brevis), B. 스테아로써모필루스(stearothermophilus), B. 알칼로필루스(alkalophilus), B. 아밀로리퀘파시엔스(amyloliquefaciens), B. 클라우시(clausii), B. 할로두란스(halodurans), B. 메가테리움(megaterium), B. 코아굴란스(coagulans), B. 서큘란스(circulans), B. 라우투스(lautus), 및 B. 투링기엔시스(thuringiensis)를 비롯해(이에 한정되지 않음), 당업계에 알려진 "바실러스" 속 내의 모든 종을 포함한다. 바실러스 속은 계속해서 분류학적 재편성을 거치는 것으로 알려져 있다. 따라서, 상기 속은 현재 "지오바실러스 스테아로써모필루스(Geobacillus stearothermophilus)"로 명명된 B. 스테아로써모필루스와 같은 유기체를 비롯한(이에 한정되지 않음) 재분류된 종을 포함한다.
본원에서 사용되는 바와 같이, "모세포"는 "변형되지 않은 세포"(예를 들어, 변형되지 않은 B. 리체니포르미스 모세포와 같은 세포)를 의미한다.
본원에서 사용되는 바와 같이, "변형된 세포" 또는 "딸세포"는 변형된("딸") 세포가 유래된 "모세포"에 존재하지 않는 적어도 하나의 유전자 변형을 포함하는 재조합 B. 리체니포르미스 세포를 의미한다.
특정 구현예에서, "변형되지 않은" B. 리체니포르미스(모) 세포는, 특히 "변형된" B. 리체니포르미스(딸) 세포와 비교할 때 또는 이에 대해 상대적으로 "대조 세포"로 지칭될 수 있다.
본원에서 사용되는 바와 같이, "변형되지 않은"(모) 세포에서의 관심 단백질(POI)의 발현 및/또는 생산이 "변형된"(딸) 세포에서의 동일한 POI의 발현 및/또는 생산과 비교될 때, "변형된" 세포와 "변형되지 않은" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등이 동일한 조건)하에 성장/배양/발효된다는 것은 이해될 것이다.
본원에서 사용되는 바와 같이, "숙주 세포"는 새로 도입된 DNA 서열에 대한 숙주 또는 발현 비히클로서 작용하는 능력을 갖는 세포를 의미한다. 본 발명의 특정 구현예에서, 숙주 세포는 바실러스 종 또는 E. 콜라이(coli) 세포이다.
본원에서 사용되는 바와 같이, 본 발명의 "천연 B. 리체니포르미스 prsA 프로모터"는 서열번호 100에 대해 약 95%의 서열 동일성을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA 프로모터는 서열번호 100에 대해 약 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
본원에서 사용되는 바와 같이, "천연 B. 리체니포르미스 prsA 오픈 리딩 프레임(ORF)"은 서열번호 101에 대해 약 90% 이상의 서열 동일성을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA ORF는 서열번호 101에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
바실러스 서브틸리스prsA 유전자는 문헌[Kontinen and Sarvas (1993) 및 PCT 공개 WO1994/019471호]에 설명된 바 있으며, 해당 문헌에서는 prsA 유전자가 단백질 분비에 관여(즉, 세포 분비 기구의 구성요소를 암호화)하고, prsA 유전자 산물이 막관련 지단백질이라는 것이 제시되어 있다.
본원에서 사용되는 바와 같이, "천연 B. 리체니포르미스 prsA 단백질"은 서열번호 155에 대해 약 90% 이상의 서열 동일성을 포함하고 펩티딜-프롤릴-시스-트랜스-이소머라제 활성(EC 5.2.1.8)을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA 단백질은 서열번호 155에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
본원에서 사용되는 바와 같이, "모체 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하며", 따라서, 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질을 암호화하는 폴리뉴클레오티드가 본 발명의 변형된 B. 리체니포르미스 세포에 도입되는 경우, 도입된 폴리뉴클레오티드는 본원에서 제2 prsA 카피로 지칭될 수 있다. 예를 들어, 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질을 암호화하는 도입된 폴리뉴클레오티드를 포함하는 본 발명의 변형된 B. 리체니포르미스 세포는 본원에서, 천연 prsA 단백질을 암호화하는 제1 내인성(야생형) prsA 유전자, 및 prsA 단백질을 암호화하는 제2 도입된 폴리뉴클레오티드를 포함하는 2개의 카피 prsA(변형된) B. 리체니포르미스 세포로 지칭될 수 있다.
B. 서브틸리스에서, dlt 오페론은 DltA, DltB, DltC, DltD, 및 DltE로 각각 명명된 단백질을 암호화하는 5개의 ORF(dltA, dltB, dltC, dltD, 및 dltE)를 포함한다(문헌[May et al., 2005]). 예를 들어, 문헌[May et al. (2005)]에 기재된 바와 같이, DltA 단백질은 D-Ala를 세포벽의 리포테이코산으로 통합하는 데 관여하는 D-알라닌:D-알라닐 운반 단백질 리가제이다.
본원에서 사용되는 바와 같이, "dltA 유전자"는 서열번호 122에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, dltA 유전자는 서열번호 155에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
B. 서브틸리스 rghR 유전자는 당해 분야에서 rapG, rapH의 억제인자로서 기술된 RghR이라는 전사 조절 단백질을 암호화한다(문헌[Ogura and Fujita, 2007]). 대조적으로, 최근 PCT 공개 WO2018/156705호에 기재된 바와 같이, B. 리체니포르미스는 RghR1 및 RghR2라는 2개의 RghR 전사 조절 단백질 상동체를 암호화한다. 이후에 설명되는 바와 같이, 본 발명의 특정 구현예는 변형된(예를 들어, 결실 또는 파괴된) rghr2 유전자를 포함하는 B. 리체니포르미스 세포에 관한 것이다.
본원에서 사용되는 바와 같이, 본원에 기재된 유전자 변형에 적합한 "B. 리체니포르미스 rghR2 유전자"는 서열번호 156에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 156에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하는 천연 RhgR2 단백질을 암호화하는 야생형 B. 리체니포르미스 rghR2 유전자(서열번호 121)일 수 있거나, 서열번호 157에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 156에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하는 변이 RhgR2 단백질을 암호화하는 변이 B. 리체니포르미스 rghR2 유전자(서열번호 158)일 수 있다. 예를 들어, 서열번호 157에 제시된 바와 같이, 변이 RhgR2 단백질은 서열번호 157의 아미노산 잔기 36~41에 "Ala-Ala-Ala-Ile-Ser-Arg"의 6개의 아미노산 잔기 반복을 포함하며, 이 6개의 아미노산 반복은 천연 RghR2 단백질(즉, 서열번호 156의 아미노산 잔기 1~134)에는 존재하지 않는다.
따라서, 다른 특정 구현예에서, rghR2 유전자, 또는 이의 오픈 리딩 프레임은 천연 rghR2 유전자에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 121에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하거나; 변이 rghR2 유전자에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 158에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함한다.
본원에서 사용되는 바와 같이, "BF140" 또는 "BF140(ΔserAlysA)"로 명명된 모체 B. 리체니포르미스 균주는 serA 유전자 결실(ΔserA) 및 lysA 유전자 결실(ΔlysA)을 포함한다.
본원에서 사용되는 바와 같이, "BF561" 또는 "BF561(제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 모균주 BF140으로부터 유래되었고, 변형된 BF561 균주는 천연 prsA 단백질을 암호화하는 야생형 B. 리체니포르미스 prsA 유전자의 도입된 제2 카피를 포함한다.
본원에서 사용되는 바와 같이, "BF598" 또는 "BF598(ΔdltA_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF561 균주로부터 유래되었고, 변형된 BF598은 B. 리체니포르미스 dltA 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "BF602" 또는 "BF602(ΔrghR2_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF561 균주로부터 유래되었고, 변형된 BF602는 B. 리체니포르미스 rghR2 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "BF613" 또는 "BF613(ΔrghR2dltA_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF598(ΔdltA_제2 카피 prsA) 균주로부터 유래되었고, 변형된 BF613은 B. 리체니포르미스 rghR2 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "아밀라제 1"은 당업계에서 일반적으로 AmyL로 지칭되는 천연 B. 리체니포르미스 α-아밀라제이며, 서열번호 126의 아미노산 서열을 포함한다.
본원에서 사용되는 바와 같이, "아밀라제 2"는 국제 PCT 공개 WO2018/184004호(전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 136을 포함하는 변이 바실러스 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 3"은 국제 PCT 공개 WO2014/164777호, WO2012/164800호, 및 WO2014/164834호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 143을 포함하는 변이 사이토파가(Cytophaga) 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 4"는 국제 PCT 공개 WO2014/164777호, WO2012/164800호, 및 WO2014/164834호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 147을 포함하는 변이 사이토파가 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 5"는 국제 PCT 공개 WO2008/153805호 및 US 특허공개 US2014/0057324호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 151을 포함하는 변이 바실러스 종 707 알칼리성 α-아밀라제이다.
본원에서 사용되는 바와 같이, "Cas9 Y155H"로 명명된 본원의 변이 Cas9 단백질은 PCT 공개 WO2019/118463호(전체가 본원에 참조로 포함됨)에 기재되어 있다.
본원에서 사용되는 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, 다음을 포함한다: (a) 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자 또는 이의 ORF의 전사 또는 번역에 필요한 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자의 하향조절, (f) 특이적 돌연변이유발, 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 무작위 돌연변이유발.
본원에서 사용되는 바와 같이, "변형된 숙주 세포는 (변형되지 않은) 모체 숙주 세포에 비해 하나 이상의 관심 단백질의 '증가된 양을 발현/생산한다"와 같은 어구에서 사용될 때, "증가된 양"은 특히, 변형된 숙주 세포에서 발현/생산된 임의의 관심 단백질(POI)의 "증가된 양"을 나타내며, "증가된 양"은 항상, 동일한 POI를 발현/생산하는 (변형되지 않은) 모체 B. 리체니포르미스 세포에 대해 상대적인 것이고, 여기서 변형된 세포와 변형되지 않은 세포는 동일한 조건(예를 들어, 배지, 온도, pH 등이 동일한 조건)하에 성장/배양/발효된다. 예를 들어, 증가된 양의 POI는 내인성 바실러스 종 POI, 또는 본 발명의 변형된 바실러스 종 세포에서 발현된 이종성 POI일 수 있다.
본원에서 사용되는 바와 같이, 단백질 생산의 "증가" 또는 "증가된" 단백질 생산은 증가된 양의 생산된 단백질(예를 들어, 관심 단백질)을 의미한다. 단백질은 숙주 세포 내에서 생산되거나, 배양 배지 내로 분비(또는 수송)될 수 있다. 특정 구현예에서, 관심 단백질은 배양 배지 내로 생산(분비)된다. 예를 들어, 단백질 생산의 증가는 예를 들어 모체 숙주 세포와 비교하여 더 높은 최대 수준의 단백질 또는 효소 활성(예를 들어, 프로테아제 활성, 아밀라제 활성, 셀룰라제 활성, 헤미셀룰라제 활성 등), 또는 생산된 총 세포외 단백질로서 검출될 수 있다.
본원에서 사용되는 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정적 축적을 나타낸다. 발현은 또한 mRNA의 폴리펩티드로의 번역을 나타낼 수 있다. 따라서, 용어 "발현"은 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는(이에 한정되지 않음), 폴리펩티드의 생산에 관여된 임의의 단계를 포함한다.
본원에서 사용되는 바와 같이, "핵산"은 뉴클레오티드 서열 또는 폴리뉴클레오티드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중가닥 또는 단일가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA, 및 RNA를 지칭한다. 유전 암호의 축퇴로 인해 다수의 뉴클레오티드 서열이 주어진 단백질을 암호화할 수 있다는 것을 이해할 수 있을 것이다.
본원에 기술된 폴리뉴클레오티드(또는 핵산 분자)는 "유전자", "벡터", 및 "플라스미드"를 포함하는 것이 이해된다.
따라서, 용어 "유전자"는 단백질 암호화 서열의 전부 또는 일부를 포함하는 아미노산의 특정 서열을 암호화하는 폴리뉴클레오티드를 나타내며, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 서열과 같은 조절(비전사) DNA 서열을 포함할 수 있다. 유전자의 전사 영역은 인트론, 5'-비번역 영역(UTR), 및 3'-UTR을 포함하는 비번역 영역(UTR)뿐만 아니라 암호화 서열도 포함할 수 있다.
본원에서 사용되는 바와 같이, 용어 "암호화 서열"은 (암호화된) 단백질 산물의 아미노산 서열을 직접 특정하는 뉴클레오티드 서열을 나타낸다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임(이하, "ORF")에 의해 결정되며, 이는 대개 ATG 시작 코돈으로 시작된다. 암호화 서열은 일반적으로 DNA, cDNA, 및 재조합 뉴클레오티드 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(다운스트림)에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서, 또는 상이한 발달 단계에서, 또는 상이한 환경 조건 또는 생리적 조건에 응답하여 유전자의 발현을 지시할 수 있음이 당업자에 의해 이해된다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터를 일반적으로 "항시성 프로모터"라고 한다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 길이가 다른 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 인정된다.
본원에서 사용되는 바와 같이, "작동가능하게 연결된"이라는 용어는 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 결합된 것을 나타낸다. 예를 들어, 프로모터가 암호화 서열(예를 들어, ORF)의 발현에 영향을 미칠 수 있는 경우(즉, 암호화 서열이 프로모터의 전사 제어하에 있는 경우) 해당 암호화 서열과 작동가능하게 연결된 것이다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동가능하게 연결될 수 있다.
핵산이 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동가능하게 연결된" 것이다. 예를 들어, 분비 리더(즉, 신호 펩티드)를 암호화하는 DNA가 폴리펩티드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우에 해당 폴리펩티드에 대한 DNA에 작동가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 해당 서열에 작동가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 암호화 서열에 작동가능하게 연결된다. 일반적으로 "작동가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
본원에서 사용되는 바와 같이, "관심 유전자의 단백질 암호화 서열에 연결된 관심 유전자(또는 이의 오픈 리딩 프레임)의 발현을 제어하는 기능적 프로모터 서열"은, 바실러스에서 암호화 서열의 전사 및 번역을 제어하는 프로모터 서열을 지칭한다. 예를 들어, 특정 구현예에서, 본 발명은 5' 프로모터(또는 5' 프로모터 영역 또는 탠덤 5' 프로모터 등)를 포함하는 폴리뉴클레오티드에 관한 것이며, 프로모터 영역은 관심 단백질을 암호화하는 핵산 서열(예를 들어, ORF)에 작동가능하게 연결된다.
본원에서 사용되는 바와 같이, "적합한 조절 서열"은 암호화 서열의 업스트림(5' 비암호화 서열), 암호화 서열 내, 또는 암호화 서열의 다운스트림(3' 비암호화 서열)에 위치하며 관련 암호화 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 및 스템-루프 구조를 포함할 수 있다.
본원에서 사용되는 바와 같이, 적어도 하나의 폴리뉴클레오티드 오픈 리딩 프레임(ORF), 또는 이의 유전자, 또는 이의 벡터를 "박테리아 세포 내로 도입" 또는 "B. 리체니포르미스 세포 내로 도입"과 같은 어구에서 사용되는 용어 "도입"은 원형질체 융합, 천연 또는 인공 형질전환(예: 염화칼슘, 전기천공), 형질도입, 형질감염, 접합 등을 포함하여(이에 한정되지 않음), 폴리뉴클레오티드를 세포에 도입하기 위한 당업계에 알려진 방법을 포함한다(예를 들어, 문헌[Ferrari et al., 1989]참조).
본원에서 사용되는 바와 같이, "형질전환"은 재조합 DNA 기술을 사용하여 세포가 형질전환되었음을 의미한다. 형질전환은 일반적으로 하나 이상의 뉴클레오티드 서열(예를 들어, 폴리뉴클레오티드, ORF, 또는 유전자)을 세포에 삽입함으로써 일어난다. 삽입된 뉴클레오티드 서열은 이종성 뉴클레오티드 서열(즉, 형질전환될 세포에서 자연적으로 발생하지 않는 서열)일 수 있다. 따라서, 형질전환은 일반적으로 외인성 DNA를 숙주 세포에 도입하여 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 하는 것을 의미한다.
본원에서 사용되는 바와 같이, "형질전환 DNA", "형질전환 서열", 및 "DNA 구성체"는 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA를 지칭한다. 형질전환 DNA는 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA이다. 이러한 DNA는 PCR 또는 임의의 다른 적합한 기술에 의해 시험관내에서 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 구현예에서는 상동성 박스에 의해 플랭킹된 유입 서열을 추가로 포함한다. 또 다른 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터 내 삽입과 같이 닫힌 원을 형성하도록 닫힐 수 있다.
본원에서 사용되는 바와 같이, "유전자의 파괴" 또는 "유전자 파괴"는 상호교환적으로 사용되며, 숙주 세포가 기능적 유전자 산물(예를 들어, 단백질)을 생산하는 것을 실질적으로 방지하는 임의의 유전자 변형을 광범위하게 지칭한다. 따라서, 본원에서 사용되는 바와 같이, 유전자 파괴는 프레임시프트 돌연변이, 조기 정지 코돈(즉, 기능적 단백질이 만들어지지 않음), 단백질의 활성을 제거하거나 감소시키는 치환, 내부 결실(즉, 기능적 단백질이 만들어지지 않음), 암호화 서열을 파괴하는 삽입, 전사에 필요한 천연 프로모터와 오픈 리딩 프레임 사이의 작동가능한 연결을 제거하는 돌연변이 등을 포함하나 이에 한정되지 않는다.
본원에서 사용되는 바와 같이, "유입 서열"은 바실러스 종 염색체 내로 도입되는 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 구성체의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환될 세포의 게놈에 이미 존재할 수 있거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유전자의 기능을 파괴하기 위해 비기능적 서열이 유전자에 삽입될 수 있다. 다른 구현예에서, 유입 서열은 선택 마커를 포함한다. 추가 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에서 사용되는 바와 같이, "상동성 박스"는 바실러스 염색체 내의 서열에 대해 상동성인 핵산 서열을 지칭한다. 보다 구체적으로, 상동성 박스는 본 발명에 따라 결실, 파괴, 비활성화, 하향조절 등이 될 유전자 또는 유전자의 일부의 인접 플랭킹 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 업스트림 또는 다운스트림 영역이다. 이러한 서열은 DNA 구성체가 바실러스 염색체에서 어느 위치에 통합되는지를 지시하고, 바실러스 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1 염기쌍(bp) 내지 200 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb, 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택 마커의 5' 및 3' 말단은 상동성 박스에 의해 플랭킹되고, 상동성 박스는 유전자의 암호화 영역을 바로 플랭킹하는 핵산 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "선별 마커 암호화 뉴클레오티드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 결핍 하에 성장할 수 있는 능력을 부여하는 뉴클레오티드 서열을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "선별 마커" 및 "선택 마커"는 숙주 세포에서 발현이 가능한 핵산(예를 들어, 유전자)으로서, 벡터를 함유하는 숙주의 선택을 용이하게 하는 핵산을 지칭한다. 이러한 선별 마커의 예는 항미생물제를 포함하나 이에 한정되지 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 의미한다. 일반적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 외인성 서열을 받지 않은 세포와 구별될 수 있도록 숙주 세포에 항균성 내성 또는 대사 이점을 부여하는 유전자이다.
"상주 선별 마커(residing selectable marker)"는 형질전환될 미생물의 염색체 상에 위치하는 것이다. 상주 선별 마커는 형질전환 DNA 구성체 상의 선별 마커와 상이한 유전자를 암호화한다. 선택 마커는 당업자에게 잘 알려져 있다. 위에서 나타낸 바와 같이, 마커는 항균성 내성 마커(예를 들어, ampR, phleoR, specR, kanR, eryR, tetR, cmpR, 및 neoR)일 수 있다(예를 들어, 문헌[Guerot-Fleury, 1995; Palmeros et al., 2000; 및 Trieu-Cuot et al., 1983] 참조). 일부 구현예에서, 본 발명은 클로람페니콜 내성 유전자(예를 들어, pC194에 존재하는 유전자, 및 바실러스 리체니포르미스 게놈에 존재하는 내성 유전자)를 제공한다. 이러한 내성 유전자는 본 발명에서, 뿐만 아니라 염색체 통합 카세트 및 통합형 플라스미드의 염색체 증폭과 관련된 구현예에서도 특히 유용하다(예를 들어, 문헌[Albertini and Galizzi, 1985; Stahl and Ferrari, 1984] 참조). 본 발명에 따른 유용한 다른 마커는 세린, 리신, 트립토판과 같은 영양요구성 마커; 및 β-갈락토시다제와 같은 검출 마커를 포함하나 이에 한정되지 않는다.
본원에서 정의되는 바와 같이, 숙주 세포 "게놈", 박테리아 (숙주) 세포 "게놈", 또는 바실러스 종 (숙주) 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "플라스미드", "벡터", 및 "카세트"는, 일반적으로 세포의 중심 대사의 일부가 아닌 보통 원형 이중가닥 DNA 분자의 형태인 대개 유전자를 운반하는 염색체외 요소를 지칭한다. 이러한 요소는 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 구성체로 다수의 뉴클레오티드 서열이 연결되거나 재조합된, 임의의 공급원 유래의 단일가닥 또는 이중가닥 DNA 또는 RNA의 선형 또는 원형, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있다.
본원에서 사용되는 바와 같이, 용어 "플라스미드"는 클로닝 벡터로서 사용되며 많은 박테리아 및 일부 진핵 생물에서 염색체외 자가 복제성 유전 요소를 형성하는 원형 이중가닥(ds) DNA 구성체를 지칭한다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈에 통합된다. 일부 구현예에서, 플라스미드는 모세포에 존재하고 딸세포에서 소실된다.
본원에서 사용되는 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 외래 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특정 벡터를 나타낸다.
본원에서 사용되는 바와 같이, "벡터"라는 용어는 세포에서 복제(증식)될 수 있고 새로운 유전자 또는 DNA 절편을 세포 내로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 구성체를 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스(pro-virus), 플라스미드, 파지미드(phagemid), 트랜스포존(transposon), 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"이다(즉, 자율적으로 복제되거나 숙주 생물의 염색체 내에 통합될 수 있음).
"발현 벡터"는 세포에서 이종성 DNA를 통합하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용가능하고 당업자에게 알려져 있다. 적절한 발현 벡터를 선택하는 것은 당업자가 알고 있다.
본원에서 사용되는 바와 같이, 용어 "발현 카세트" 또는 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 가능케 하는 일련의 명시된 핵산 요소(즉, 전술한 바와 같은 벡터 또는 벡터 요소)를 사용해 재조합적으로 또는 합성에 의해 생성된 핵산 구성체를 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스, 또는 핵산 단편에 통합될 수 있다. 일반적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 특히, 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 구성체는 표적 세포에서 특정 핵산의 전사를 가능하게 하는 일련의 명시된 핵산 요소를 또한 포함한다. 특정 구현예에서, 본 발명의 DNA 구성체는 본원에 정의된 바와 같은 선택 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에서 사용되는 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오티드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체에 돌연변이를 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭킹 서열)을 포함한다. 말단은 표적화 벡터가 예를 들어 벡터 내 삽입과 같이 닫힌 원을 형성하도록 닫힐 수 있다. 예를 들어, 특정 구현예에서, 모체 B. 리체니포르미스 (숙주) 세포는 하나 이상의 "표적화 벡터"를 도입함으로써 변형(예를 들어, 형질전환)된다.
본원에서 사용되는 바와 같이, 용어 "관심 단백질" 또는 "POI"는 변형된 B. 리체니포르미스(딸) 숙주 세포에서 발현되기를 원하는 관심 폴리펩티드를 지칭하며, POI는 바람직하게는 증가된(즉, "변형되지 않은"(모) 세포에 비해 증가된) 수준으로 발현된다. 따라서, 본원에서 사용되는 바와 같이, POI는 효소, 기질-결합 단백질, 표면-활성 단백질, 구조 단백질, 수용체 단백질 등일 수 있다. 특정 구현예에서, 본 발명의 변형된 세포는 모세포에 비해 증가된 양의 이종성 관심 단백질 또는 내인성 관심 단백질을 생산한다. 특정 구현예에서, 본 발명의 변형된 세포에 의해 생산된 관심 단백질의 증가된 양은 모세포에 비해 0.5% 이상의 증가, 1.0% 이상의 증가, 5.0% 이상의 증가, 또는 5.0% 초과의 증가이다.
유사하게, 본원에서 정의되는 바와 같이, "관심 유전자" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예를 들어, 폴리뉴클레오티드, 유전자, 또는 ORF)을 지칭한다. "관심 단백질"을 암호화하는 "관심 유전자"는 자연 발생적 유전자, 돌연변이 유전자, 또는 합성 유전자일 수 있다.
본원에서 사용되는 바와 같이, 용어 "폴리펩티드" 및 "단백질"은 상호교환적으로 사용되며, 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭한다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에서 사용된다. 폴리펩티드는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있으며, 비아미노산이 개재될 수 있다. 폴리펩티드라는 용어는 자연적으로 변형되었거나, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 임의의 다른 조작 또는 변형, 예컨대, 표지 성분과의 접합과 같은 개입에 의해 변형된 아미노산 중합체를 또한 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예컨대, 비천연 아미노산 등을 포함함)뿐만 아니라 당업계에 알려진 다른 변형을 포함하는 폴리펩티드도 정의에 포함된다.
특정 구현예에서, 본 발명의 유전자는 상업적으로 관련된 산업적 관심 단백질, 예컨대 효소(예를 들어, 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나제, 아라비노푸라노시다제, 탄산무수화효소, 카복시펩티다제, 카탈라제, 셀룰라제, 키티나제, 키모신, 큐티나제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나제, 글루칸 라이사제, 엔도-β-글루카나제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 하이드롤라제, 인버타제, 이소머라제, 라카제, 리파제, 리아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴 분해 효소, 퍼하이드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 헥소스 옥시다제, 및 이들의 조합)를 암호화한다.
본원에서 사용되는 바와 같이, "변이체" 폴리펩티드는, 일반적으로 재조합 DNA 기술에 의한 하나 이상의 아미노산의 치환, 추가, 또는 결실에 의해 모체(또는 기준) 폴리펩티드로부터 유래되는 폴리펩티드를 지칭한다. 변이체 폴리펩티드는 적은 수의 아미노산 잔기만큼 모체 폴리펩티드와 상이할 수 있으며, 모체(기준) 폴리펩티드와의 일차 아미노산 서열 상동성/동일성 수준에 의해 정의될 수 있다.
바람직하게는, 변이체 폴리펩티드는 모체(기준) 폴리펩티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 아미노산 서열 동일성을 갖는다. 본원에서 사용되는 바와 같이, "변이체" 폴리뉴클레오티드는 변이체 폴리펩티드를 암호화하는 폴리뉴클레오티드를 지칭하며, "변이체 폴리뉴클레오티드"는 모체 폴리뉴클레오티드와 명시된 정도의 서열 상동성/동일성을 갖거나, 엄격한 혼성화 조건하에 모체 폴리뉴클레오티드(또는 이의 상보체)와 혼성화된다. 바람직하게는, 변이체 폴리뉴클레오티드는 모체(기준) 폴리뉴클레오티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 뉴클레오티드 서열 동일성을 갖는다.
본원에서 사용되는 바와 같이, "돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 나타낸다. 점 돌연변이, 결실 돌연변이, 침묵 돌연변이, 프레임 시프트 돌연변이, 스플라이싱 돌연변이 등을 포함하는 여러 가지 유형의 돌연변이가 존재한다. 돌연변이는 특이적으로(예를 들어, 부위 지정 돌연변이유발을 통해) 또는 무작위로(예를 들어, 화학작용제, 복구 결핍된 박테리아 균주를 통한 계대배양을 통해) 수행될 수 있다.
본원에서 사용되는 바와 같이, 폴리펩티드 또는 이의 서열의 맥락에서, 용어 "치환"은 하나의 아미노산을 또 다른 아미노산으로 대체(즉, 치환)하는 것을 의미한다.
본원에서 정의되는 바와 같이, "내인성 유전자"는 유기체의 게놈 내의 자연적 위치에 있는 유전자를 지칭한다.
본원에서 정의되는 바와 같이, "이종성" 유전자, "비내인성" 유전자, 또는 "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않고 유전자 전달에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "외래" 유전자(들)는 비천연 유기체 내로 삽입된 천연 유전자(또는 ORF) 및/또는 천연 또는 비천연 유기체 내로 삽입된 키메라 유전자를 포함한다.
본원에서 정의되는 바와 같이, "이종성 제어 서열"은 자연에서는 관심 유전자의 발현을 조절하는(제어하는) 기능을 하지 않는 유전자 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 나타낸다. 일반적으로, 이종성 핵산 서열은 이들이 존재하는 세포 또는 게놈의 일부에 대해 내인성이 아니며(천연이 아니며), 감염, 전달감염, 형질전환, 미세주입, 전기천공 등에 의해 세포에 부가되었다. "이종성" 핵산 구성체는 천연 숙주 세포에서 발견되는 조절 서열/DNA 암호화 서열의 조합과 동일하거나 이와는 상이한 조절 서열/DNA 암호화(ORF) 서열의 조합을 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "신호 서열" 및 "신호 펩티드"는 성숙한 단백질 또는 전구체 형태의 단백질의 분비 또는 직접 수송에 참여할 수 있는 아미노산 잔기의 서열을 지칭한다. 신호 서열은 일반적으로 전구체 또는 성숙 단백질 서열의 N-말단에 위치한다. 신호 서열은 내인성 또는 외인성일 수 있다. 신호 서열은 일반적으로 성숙 단백질에 존재하지 않는다. 신호 서열은 일반적으로 단백질이 수송된 후 신호 펩티다제에 의해 단백질로부터 절단된다.
용어 "유래된"은 용어 "기인된", "수득된", "수득 가능한" 및 "생성된"을 포함하며, 일반적으로 하나의 명시된 물질 또는 조성물의 기원이 또 다른 명시된 물질 또는 조성물에서 발견되거나, 또 다른 명시된 물질 또는 조성물을 참조하여 기술될 수 있는 특징을 가진다는 것을 나타낸다.
본원에서 사용되는 바와 같이, 용어 "상동성"은 상동 폴리뉴클레오티드 또는 폴리펩티드와 관련된다. 둘 이상의 폴리뉴클레오티드 또는 둘 이상의 폴리펩티드가 상동성일 경우, 이는 상동 폴리뉴클레오티드 또는 폴리펩티드가 적어도 60%, 더 바람직하게는 적어도 70%, 한층 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 95%, 및 가장 바람직하게는 적어도 98%의 "동일성 정도"를 갖는 것을 의미한다. 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열이 본원에서 정의된 바와 같이 상동성이 되기에 충분히 높은 정도의 동일성을 갖는지 여부는 본 기술 분야에 공지된 컴퓨터 프로그램, 예를 들어 GCG 프로그램 패키지로 제공되는 "GAP"(Program Manual for the Wisconsin Package, 버전 8, 1994년 8월, [53711] 미국 위스콘신주 매디슨 사이언스 드라이브 575 소재의 제네틱스 컴퓨터 그룹(Genetics Computer Group))을 사용하여 두 서열을 정렬함으로써 적절히 조사할 수 있다(문헌[Needleman and Wunsch, (1970)]). DNA 서열 비교를 위하여 하기 설정을 갖는 GAP를 사용한다: 5.0의 GAP 생성 페널티 및 0.3의 GAP 연장 페널티.
본원에서 사용되는 바와 같이, 용어 "동일성 백분율(%)"은, 폴리펩티드를 암호화하는 핵산 서열들 또는 폴리펩티드의 아미노산 서열들을 서열 정렬 프로그램을 사용하여 정렬할 때, 이들 사이의 핵산 서열 또는 아미노산 서열의 동일성 수준을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "비생산성(specific productivity)"은 주어진 기간에 걸쳐 시간당 세포당 생산된 단백질의 총량이다.
본원에서 정의되는 바와 같이, "정제된", "단리된" 또는 "풍부화된"이라는 용어는, 생체분자(예를 들어, 폴리펩티드 또는 폴리뉴클레오티드)가 자연에서 이들과 결합되어 있는 자연 발생 구성 성분 중 일부 또는 전부로부터 분리됨으로써 이의 자연 상태로부터 변경되는 것을 의미한다. 이러한 단리 또는 정제는 최종 조성물에서 바람직하지 않은 전체 세포, 세포 잔여물, 불순물, 외부 단백질, 또는 효소를 제거하기 위한 이온 교환 크로마토그래피, 친화성 크로마토그래피, 소수성 분리, 투석, 프로테아제 처리, 황산암모늄 침전 또는 기타 단백질 염 침전, 원심분리, 크기 배제 크로마토그래피, 여과, 미세여과, 겔 전기영동 또는 구배에 의한 분리와 같은 본 기술 분야에서 인정된 분리 기술에 의해 달성될 수 있다. 이후, 추가 이득을 제공하는 구성 성분, 예를 들어 활성화제, 항저해제, 바람직한 이온, pH를 제어하기 위한 화합물 또는 기타 효소 또는 화학물질을 정제되거나 단리된 생체분자 조성물에 첨가하는 것이 추가로 가능하다.
본원에서 사용되는 바와 같이, 용어 "ComK 폴리펩티드"는, 재조합에서 DNA-결합과 흡수에 관여하는 후기 유능성 유전자(late competence gene)의 발현 활성화와 관련하여, 유능성 발생 이전에 최종 자동-조절 제어 스위치로서 작용하는 전사 인자인 comK 유전자의 산물로서 정의된다(문헌[Liu and Zuber, 1998, Hamoen et al., 1998]). 예시적인 ComK 핵산은 서열번호 92에 제시되어 있다.
본원에서 사용되는 바와 같이, "재조합"은 이종성 핵산 서열의 도입에 의해 변형되었거나, 그렇게 변형된 세포로부터 세포가 유래되는, 세포 또는 벡터에 대한 언급을 포함한다. 따라서, 예를 들어, 재조합 세포는 세포의 천연(비재조합) 형태 내에서는 동일한 형태로 발견되지 않는 유전자를 발현하거나, 의도적인 인간의 개입으로 인해 달리 비정상적으로 발현되었거나, 덜 발현되었거나, 전혀 발현되지 않은 천연 유전자를 발현한다. "재조합" 또는 "재조합된" 핵산을 생성하는 것은 일반적으로 2개 이상의 핵산 단편을 조립하는 것이며, 조립을 통해 키메라 유전자가 생성된다.
본원에서 사용되는 바와 같이, "플랭킹 서열"은 논의 중인 서열의 업스트림 또는 다운스트림에 있는 임의의 서열을 지칭한다(예를 들어, 유전자 A-B-C의 경우, 유전자 B는 A 및 C 유전자 서열에 의해 플랭킹됨). 특정 구현예에서, 유입 서열은 각 측의 상동성 박스에 의해 플랭킹된다. 다른 구현예에서, 유입 서열 및 상동성 박스는 각 측의 스터퍼 서열에 의해 플랭킹되는 단위를 포함한다. 일부 구현예에서, 플랭킹 서열은 일 측(3' 또는 5')에만 존재하지만, 바람직한 구현예에서는, 플랭킹되는 서열의 각 측에 존재한다. 각각의 상동성 박스의 서열은 바실러스 염색체 내의 서열에 대해 상동성이다. 이러한 서열은 새로운 구성체가 바실러스 염색체에서 어느 위치에 통합되는지를 지시하고, 바실러스 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 다른 구현예에서, 선택 마커의 5' 및 3' 말단은 비활성화 염색체 절편의 섹션을 포함하는 폴리뉴클레오티드 서열에 의해 플랭킹된다. 일부 구현예에서, 플랭킹 서열은 일 측(3' 또는 5')에만 존재하는 반면, 다른 구현예에서는, 플랭킹되는 서열의 각 측에 존재한다.
II. 향상된 단백질 생산 표현형을 포함하는 변형된 바실러스 리체니포르미스 세포
하기 실시예 섹션에 일반적으로 기술된 바와 같이, 본 출원인은 일련의 숙주 변형을 구성하여 모체 B. 리체니포르미스 균주에 도입하였다. 보다 구체적으로, 하기 실시예에 제시된 바와 같이(예를 들어, 표 18 참조), 본 실시예에 사용된 모체 B. 리체니포르미스 균주는 serA1 유전자(서열번호 30) 및 lysA 유전자(서열번호 87)의 결실을 포함하고, BF140(ΔserAlysA)로 명명되었다. 본 출원인은 후속적으로 (1) 천연 prsA 단백질을 암호화하는 야생형 B. 리체니포르미스 prsA 유전자의 제2 카피의 도입(BF561로 명명; 제2 카피 prsA), (2) B. 리체니포르미스 dltA 유전자의 결실(BF598로 명명; ΔdltA_제2 카피 prsA), (3) B. 리체니포르미스 rghR2 유전자의 결실(BF602로 명명; ΔrghR2_제2 카피 prsA), 및 (4) B. 리체니포르미스 rghR2 유전자 및 dltA 유전자의 조합된 결실(BF613로 명명; ΔrghR2dltA_제2 카피 prsA)을 비롯한 특정 유전자 변형을 모체 B. 리체니포르미스 균주(BF140)에 도입하였다.
상기 변형된 균주의 구성 후, 일련의 α-아밀라제 발현 카세트를 변형된 B. 리체니포르미스 균주(BF561, BF598, BF602, 및 BF613) 및 모체 B. 리체니포르미스 균주(BF140)에 도입하였다. 보다 구체적으로, 하기 실시예 4에 제시된 바와 같이, 5개의 상이한 α-아밀라제 발현 카세트(즉, "아밀라제 1", "아밀라제 2", "아밀라제 3", "아밀라제 4", 및 "아밀라제 5")의 2개의 카피를 B. 리체니포르미스 균주에 도입하였다.
하기 실시예 5에서 추가로 설명되는 바와 같이, 아밀라제 1~5에 대한 발현 카세트의 2개의 카피를 포함하는 모체(BF140) 및 변형된(BF561, BF598, BF602, 및 BF613) B. 리체니포르미스 균주를 아밀라제의 생성에 대해 분석하였다(예를 들어, 표 19 참조). 예를 들어, 다양한 α-아밀라제 그룹에서 시험된 5가지 아밀라제 모두는 변형되지 않은 모체 숙주 BF140과 비교하여, 결실된 dltA-2dltA-2) 대립유전자(서열번호 125), 결실된 rghR2rghR2) 대립유전자(서열번호 80), 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)의 삽입을 포함하는 BF613 변형 백그라운드(ΔrghR2_ ΔdltA_제2 카피 prsA)에서 α-아밀라제 생성의 개선을 보여준다. 아밀라제 2 및 아밀라제 3의 경우, 결실된 rghR2rghR2) 대립유전자(서열번호 80) 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)를 포함하는 BF602 변형 백그라운드(ΔrghR2_제2 카피 prsA)에서 α-아밀라제 생성의 개선은 BF613 변형 숙주에서 관찰되는 생산성 개선과 거의 같은 정도로 우수하다. 이러한 관찰은 일부 아밀라제의 경우 생산성 개선이 이러한 2개의 대립유전자(즉, ΔrghR2_제2 카피 prsA)의 존재만을 필요로 하며 ΔdltA-2 대립유전자의 존재가 이러한 개선에 해롭지 않음을 시사한다.
III. 분자 생물학
상기에 일반적으로 기재된 바와 같이, 본 발명의 특정 구현예는 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스(딸) 세포에 관한 것이다. 보다 구체적으로는, 본 발명의 특정 구현예는 증가된 단백질 생산 능력, 증가된 2차 대사산물 생산 능력 등을 갖는 변형된 바실러스(숙주) 세포(예를 들어, 단백질 생산 숙주 세포, 세포 공장)를 생산하고 구성하기 위한 변형된 바실러스(딸) 세포 및 이의 방법에 관한 것이다.
특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 dltA 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피 및 결실된 dltA 유전자를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피 및 결실된 rghR2 유전자를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 dltA 유전자 및 결실된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피, 결실된 dltA 유전자, 및 결실된 rghR2 유전자를 포함한다.
따라서, 본 발명의 특정 구현예는 본 발명의 모체 바실러스 세포를 유전자 변형(변경)시켜 이의 변형된 바실러스 세포, 보다 구체적으로는 (변형되지 않은) 모체 B. 리체니포르미스 세포에 비해 증가된 양의 내인성 및/또는 이종성 관심 단백질을 생산하는 변형된 바실러스 세포를 생성하기 위한 조성물 및 방법을 제공한다.
따라서, 본 발명의 특정 구현예는 바실러스 세포를 유전자 변형시키는 방법에 관한 것이며, 변형은 (a) 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자 또는 이의 ORF의 전사 또는 번역에 필요한 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 부위특이적 돌연변이유발, 및/또는 (g) 무작위 돌연변이유발을 포함한다.
특정 구현예에서, 본 발명의 변형된 바실러스 세포는 상기 제시된 유전자의 발현을 당업계에 잘 알려진 방법(예를 들어, 삽입, 파괴, 대체, 또는 결실)을 사용하여 감소시키거나 제거함으로써 구성된다. 변형 또는 비활성화 대상인 유전자 부분은 예를 들어 암호화 영역이거나 암호화 영역의 발현에 필요한 조절 요소일 수 있다.
이러한 조절 또는 제어 서열의 예는 프로모터 서열 또는 이의 기능적 부분(즉, 핵산 서열의 발현에 영향을 미치기에 충분한 부분)일 수 있다. 변형을 위한 다른 제어 서열은 리더 서열, 프로-펩티드 서열, 신호 서열, 전사 종결자, 전사 활성자 등을 포함하나 이에 한정되지 않는다.
다른 특정 구현예에서, 변형된 바실러스 세포는 본 발명의 상기 언급된 유전자 중 적어도 하나의 발현을 제거하거나 감소시키기 위한 유전자 결실에 의해 구성된다. 유전자 결실 기술은 유전자(들)를 부분적으로 또는 완전하게 제거하여, 이들의 발현이 제거되거나 비기능적(또는 활성이 감소된) 단백질 산물이 발현되도록 할 수 있다. 이러한 방법에서, 유전자(들)의 결실은 유전자를 플랭킹하는 5' 및 3' 영역을 인접하여 포함하도록 구성된 플라스미드를 사용하는 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은 예를 들어 pE194와 같은 온도 감수성 플라스미드 상에서, 플라스미드가 세포에서 확립될 수 있게 하는 허용 온도에서 제2 선별 마커와 함께 바실러스 세포에 도입될 수 있다. 그런 다음, 플라스미드를 상동성 플랭킹 영역 중 하나에서 염색체에 통합시키는 세포를 선택하기 위해 허용되지 않는 온도로 세포를 이동시킨다. 플라스미드의 통합에 대한 선택은 제2 선별 마커에 대한 선택에 의해 수행된다. 통합 후, 선택 없이 여러 세대 동안 허용 온도로 세포를 이동시킴으로써 제2 상동성 플랭킹 영역에서의 재조합 이벤트가 자극된다. 세포를 플레이팅하여 단일 콜로니를 수득하고, 두 선별 마커의 손실에 대해 콜로니를 검사한다(예를 들어, 문헌[Perego, 1993] 참조). 따라서, 당업자는 전체 또는 부분 결실에 적합한 유전자의 암호화 서열 및/또는 유전자의 비암호화 서열의 뉴클레오티드 영역을 쉽게 확인할 수 있다.
다른 구현예에서, 본 발명의 변형된 바실러스 세포는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거에 의해 구성된다. 예를 들어, 정지 코돈의 도입, 시작 코돈의 제거, 또는 오픈 리딩 프레임의 프레임 이동을 일으키도록 뉴클레오티드를 삽입하거나 제거할 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR 생성 돌연변이유발에 의해 달성될 수 있다(예를 들어, 문헌[Botstein and Shortle, 1985; Lo et al., 1985; Higuchi et al., 1988; Shimada, 1996; Ho et al., 1989; Horton et al., 1989; 및 Sarkar and Sommer, 1990] 참조). 따라서, 특정 구현예에서, 본 발명의 유전자는 완전 또는 부분 결실에 의해 비활성화된다.
다른 구현예에서, 변형된 바실러스 세포는 유전자 전환의 프로세스에 의해 구성된다(예를 들어, 문헌[Iglesias and Trautner, 1983] 참조). 예를 들어, 유전자 전환 방법에서, 유전자(들)에 상응하는 핵산 서열을 시험관내 돌연변이화하여 결함 있는 핵산 서열을 생성한 후, 이를 모체 바실러스 세포로 형질전환시켜 결함 있는 유전자를 생성한다. 상동성 재조합에 의해, 결함 있는 핵산 서열이 내인성 유전자를 대체한다. 결함 있는 유전자 또는 유전자 단편이 결함 있는 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커를 또한 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 있는 유전자는 선별 마커와 함께 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건하에 마커에 대한 선택에 의해 수행된다. 유전자 대체로 이어지는 제2 재조합 이벤트에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 수행된다(문헌[Perego, 1993]). 대안적으로, 결함 있는 핵산 서열은 후술하는 바와 같이, 유전자의 하나 이상의 뉴클레오티드의 삽입, 치환, 또는 결실을 포함할 수 있다.
다른 구현예에서, 변형된 바실러스 세포는 유전자의 핵산 서열에 상보적인 뉴클레오티드 서열을 사용하는 확립된 안티센스 기술에 의해 구성된다(문헌[Parish and Stoker, 1997]). 보다 구체적으로, 바실러스 세포에 의한 유전자의 발현은 세포에서 전사될 수 있고 세포에서 생성된 mRNA에 혼성화될 수 있는, 유전자의 핵산 서열에 상보적인 뉴클레오티드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보적인 안티센스 뉴클레오티드 서열이 mRNA에 혼성화될 수 있는 조건하에서, 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오티드 등을 포함하나 이에 한정되지 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 변형된 바실러스 세포는 CRISPR-Cas9 편집을 통해 생산/구성된다. 예를 들어, 관심 단백질을 암호화하는 유전자는, DNA 상의 표적 서열에 엔도뉴클레아제를 보충하는 가이드 RNA(예: Cas9) 및 Cpf1 또는 가이드 DNA(예: NgAgo)에 결합함으로써 표적 DNA를 찾아내는 핵산 가이드된 엔도뉴클레아제에 의해 편집 또는 파괴(또는 결실 또는 하향조절)될 수 있고, 엔도뉴클레아제는 DNA에서 단일가닥 또는 이중가닥 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되며, 제공된 편집 주형과 재조합하여 유전자를 파괴하거나 결실시킬 수 있다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(이 목적의 경우, S. 피오게네스로부터의 Cas9) 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자는 바실러스 세포에서 활성이 있는 프로모터 및 바실러스 세포에서 활성이 있는 종결자에 작동가능하게 연결됨으로써, 바실러스 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다. 예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 구성체를 구성하기 위해, 가변 표적화 도메인(VT)은 프로토-스페이서 인접 모티프(PAM)의 5'인 표적 부위의 뉴클레오티드(TGG)를 포함할 것이며, 이 뉴클레오티드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합은 이에 따라 gRNA를 암호화하는 DNA를 생성한다. 따라서, gRNA를 암호화하는 DNA를 바실러스 세포에서 활성이 있는 프로모터 및 바실러스 세포에서 활성이 있는 종결자에 작동가능하게 연결함으로써 gRNA에 대한 바실러스 발현 카세트가 생성된다.
특정 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정확하게 복구하기 위해, 세포의 DNA 복구 기구가 편집 주형을 이용할 수 있도록 뉴클레오티드 편집 주형이 제공된다. 예를 들어, 표적화된 유전자의 5’에 있는 약 500 bp가 표적화된 유전자의 3’에 있는 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 바실러스 숙주의 기구에 의해 사용되어 RGEN에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트, 및 편집 주형은 다양한 방법(예를 들어, 원형질체 융합, 전기천공, 자연적 능력, 또는 유도된 능력)을 사용하여 사상 진균 세포에 공동으로 전달될 수 있다. 형질전환된 세포는 정방향 및 역방향 프라이머로 유전자좌를 증폭시켜 표적 유전자좌를 PCR 증폭함으로써 스크리닝된다. 이러한 프라이머는 야생형 유전자좌 또는 RGEN에 의해 편집된 변형된 유전자좌를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여, 편집된 콜로니를 식별한다.
또 다른 구현예에서, 변형된 바실러스 세포는 당업계에 잘 알려진 방법(화학적 돌연변이유발(예를 들어, 문헌[Hopwood, 1970] 참조) 및 전위(예를 들어, 문헌[Youngman et al., 1983] 참조)를 포함하나 이에 한정되지 않음)을 사용하여 무작위 또는 특이적 돌연변이유발에 의해 구성된다. 유전자의 변형은 모세포에 대한 돌연변이유발 및 유전자의 발현이 감소 또는 제거된 돌연변이 세포에 대한 스크리닝에 의해 수행될 수 있다. 특이적 또는 무작위적일 수 있는 돌연변이유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제의 사용, 적합한 올리고뉴클레오티드의 사용, 또는 DNA 서열에 대한 PCR 생성 돌연변이유발에 의해 수행될 수 있다. 또한, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용하여 수행될 수 있다.
본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 하이드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산, 및 뉴클레오티드 유사체를 포함한다. 이러한 제제가 사용되는 경우, 돌연변이 유발은 일반적으로, 돌연변이 대상 모세포를 적합한 조건에서 선택 돌연변이 유발제의 존재하에 인큐베이션하고, 유전자의 발현이 감소되거나 나타나지 않는 돌연변이 세포를 선택함으로써 수행된다.
다른 특정 구현예에서, 변형된 바실러스 세포는 내인성 유전자의 결실을 포함한다. 다른 구현예에서, 변형된 바실러스 세포는 내인성 유전자의 파괴를 포함한다. 특정 구현예에서, 본 발명의 폴리뉴클레오티드 파괴 카세트는 마커 유전자를 포함한다.
다른 구현예에서, 변형된 바실러스 세포는 하향조절된 내인성 유전자를 포함한다. 예를 들어, 특정 구현예에서, 상기 제시된 하나 이상의 유전자의 하향조절은 유전자의 업스트림 또는 다운스트림 조절 요소의 결실 또는 파괴를 포함한다.
PCT 공개 WO2003/083125호는 E. 콜라이를 우회하는 PCR 융합을 사용한 바실러스 결실 균주 및 DNA 구성체의 생성과 같은 바실러스 세포의 변형 방법을 개시한다.
PCT 공개 WO2002/14490호는 (1) 통합 플라스미드(pComK)의 구성 및 형질전환, (2) 암호화 서열, 신호 서열, 및 프로펩티드 서열의 무작위 돌연변이유발, (3) 상동성 재조합, (4) 형질전환 DNA에 대한 비상동성 플랭크의 추가에 의한 형질전환 효율 증대, (5) 이중 교차(cross-over) 통합의 최적화, (6) 부위 지정 돌연변이유발, 및 (7) 마커가 없는(marker-less) 결실을 포함하는, 바실러스 세포의 변형 방법을 개시한다.
당업자는 폴리뉴클레오티드 서열을 박테리아 세포(예를 들어, E. 콜라이바실러스 종)에 도입하기 위한 적합한 방법을 잘 알고 있다(예를 들어, 문헌[Ferrari et al., 1989; Saunders et al., 1984; Hoch et al., 1967; Mann et al., 1986; Holubova, 1985; Chang et al., 1979; Vorobjeva et al., 1980; Smith et al., 1986; Fisher et. al., 1981; 및 McDonald, 1984]). 실제로, 원형질체 형질전환과 응축(congression)을 포함하는 형질전환, 형질도입, 및 원형질체 융합과 같은 방법이 알려져 있으며 본 발명에서 사용하기에 적합하다. 본 발명의 DNA 구성체를 숙주 세포에 도입하는 데 형질전환 방법이 특히 바람직하다.
일반적으로 사용되는 방법에 추가적으로, 일부 구현예에서, 숙주 세포는 직접 형질전환된다(즉, 숙주 세포에 도입되기 전에 DNA 구성체의 증폭 또는 다른 처리를 위해 중간 세포가 사용되지 않음). DNA 구성체를 숙주 세포에 도입하는 것은 DNA를 플라스미드 또는 벡터 내 삽입 없이 숙주 세포에 도입하기 위한, 당업계에 알려진 물리적 및 화학적 방법을 포함한다. 이러한 방법은 염화칼슘 침전, 전기천공, 네이키드 DNA, 리포솜 등을 포함하나 이에 한정되지 않는다. 추가 구현예에서, DNA 구성체는 플라스미드 내 삽입 없이 플라스미드와 공동으로 형질전환된다. 다른 구현예에서, 변형된 바실러스 균주로부터 선별 마커가 당업계에 알려진 방법에 의해 결실되거나 실질적으로 절단된다(예를 들어, 문헌[Stahl et al., 1984 및 Palmeros et al., 2000]). 일부 구현예에서, 숙주 염색체로부터 벡터를 분해하면 고유 염색체 영역이 제거되면서 염색체에 플랭킹 영역을 남긴다.
바실러스 세포에서 유전자, 이의 오픈 리딩 프레임(ORF), 및/또는 이의 변이체 서열의 발현에 사용하기 위한 프로모터 및 프로모터 서열 영역은 일반적으로 당업자에게 알려져 있다. 본 발명의 프로모터 서열은 일반적으로 바실러스 세포(예를 들어, B. 리체니포르미스 세포, B. 서브틸리스 세포 등)에서 기능하도록 선택된다. 특정 예시적인 바실러스 프로모터 서열은 표 6에 제시되어 있다. 마찬가지로, 바실러스 세포에서 유전자 발현을 유도하는 데 유용한 프로모터는 B. 서브틸리스 알칼리성 프로테아제(aprE) 프로모터(Stahl et al., 1984), B. 서브틸리스의 α-아밀라제 프로모터(Yang et al., 1983), B. 아밀로리퀘파시엔스의 α-아밀라제 프로모터(Tarkinen et al., 1983), B. 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(Yang et al., 1984), 돌연변이 aprE 프로모터(PCT 공개 WO2001/51643호), 또는 B 리체니포르미스 또는 기타 관련 바실러스로부터의 임의의 다른 프로모터를 포함하나 이에 한정되지 않는다. 다른 특정 구현예에서, 프로모터는 미국 특허 공개 2014/0329309호에 개시된 리보솜 단백질 프로모터 또는 리보솜 RNA 프로모터(예: rrnI 프로모터)이다. 바실러스 세포에서 다양한 활성(프로모터 강도)을 갖는 프로모터 라이브러리를 스크리닝하고 생성하는 방법은 PCT 공개 WO2003/089604호에 기재되어 있다.
IV. 관심 단백질의 생산을 위한 바실러스 세포의 배양
다른 구현예에서, 본 발명은 변형되지 않은 (모) 세포와 비교하여(즉, 이에 비해) 변형된 박테리아 세포의 단백질 생산성을 증가시키는 방법을 제공한다. 특정 구현예에서, 본 발명은 관심 단백질(POI)의 생산 방법으로서, 변형된 박테리아 세포를 발효/배양하는 단계를 포함하고, 변형된 세포는 POI를 배양 배지 내로 분비하는, 방법에 관한 것이다. 당업계에 잘 알려진 발효 방법을 적용하여 본 발명의 변형된 바실러스 세포 및 변형되지 않은 바실러스 세포를 발효시킬 수 있다.
일부 구현예에서, 세포는 회분식 또는 연속식 발효 조건하에 배양된다. 전형적인 회분식 발효는 배지의 조성이 발효 시작시 설정되어 발효 중에 변경되지 않는 폐쇄 시스템이다. 발효 시작시, 배지에 목적하는 유기체(들)를 접종한다. 이 방법에서는, 시스템에 어떤 구성요소도 첨가하지 않고 발효가 일어날 수 있다. 일반적으로, 회분식 발효는 탄소원의 추가와 관련하여 "회분식"으로 간주되며, pH 및 산소 농도와 같은 인자를 제어하려는 시도가 종종 이루어진다. 회분식 시스템의 대사산물 및 바이오매스의 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 일반적인 회분식 배양물 내에서, 세포는 정적 지체기를 거쳐 고성장 대수기로 진행하고, 최종적으로 성장 속도가 감소하거나 성장이 멈추는 정지기로 진행할 수 있다. 정지기의 세포는 처치되지 않으면 결국 사멸한다. 일반적으로, 대수기의 세포가 대부분의 제품 생산을 담당한다.
표준 회분식 시스템에 대한 적절한 변형은 "유가식 발효(fed-batch fermentation)" 시스템이다. 일반적인 회분식 시스템의 이러한 변형에서는, 발효가 진행됨에 따라 기질이 증분으로 추가된다. 유가식 시스템은 이화대사물 억제가 세포의 대사를 억제할 가능성이 있는 경우 및 배지에 제한된 양의 기질이 있는 것이 바람직한 경우에 유용하다. 유가식 시스템에서 실제 기질 농도는 측정이 어렵기 때문에, pH, 용존 산소량, 및 CO2와 같은 폐가스의 분압과 같은 측정가능한 인자의 변화에 기초하여 추정된다. 회분식 및 유가식 발효는 일반적이며 당업계에 알려져 있다.
연속식 발효는 규정 발효 배지가 생물 반응기에 연속적으로 첨가되고 동량의 조정된(conditioned) 배지가 프로세싱을 위해 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로, 세포가 주로 대수기 성장 중인 배양물을 일정한 고밀도로 유지한다. 연속식 발효는 세포 성장 및/또는 생성물 농도에 영향을 미치는 하나 이상의 인자의 조절이 가능하다. 예를 들어, 일 구현예에서, 탄소원 또는 질소원과 같은 제한 영양소가 고정 비율로 유지되고 다른 모든 파라미터는 조절될 수 있다. 다른 시스템에서, 배지 탁도에 의해 측정되는 세포 농도가 일정하게 유지되는 반면, 성장에 영향을 미치는 여러 인자는 계속 변경될 수 있다. 연속식 시스템은 정상 상태 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서의 세포 성장 속도와 균형을 이루어야 한다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 생성물 형성 속도를 최대화하는 기술은 산업 미생물학 분야에 잘 알려져 있다.
따라서, 특정 구현예에서, 형질전환된(변형된) 숙주 세포에 의해 생산된 POI는 원심분리 또는 여과에 의해 배지로부터 숙주 세포를 분리하는 것, 또는 필요한 경우 세포를 파괴하는 것, 및 세포 분획 및 잔사로부터 상청액을 제거하는 것을 포함하는 통상적인 절차에 의해 배양 배지로부터 회수할 수 있다. 일반적으로, 청징 후, 상청액 또는 여과액의 단백질 성분은 염(예: 황산암모늄)에 의해 침천된다. 침전된 단백질은 이후 가용화되고 다양한 크로마토그래피 절차, 예를 들어 이온 교환 크로마토그래피, 겔 여과에 의해 정제될 수 있다.
V. 변형된 (숙주) 세포에 의해 생산된 관심 단백질
본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 브리지를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이다. 즉, 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 또는 동일하지 않은(이종성) 서브유닛으로 구성되고, POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
예를 들어, 하기 실시예에 기재된 바와 같이, 본 발명의 변형된 바실러스 세포는 증가된 양의 내인성 및/또는 이종성 관심 단백질을 생산한다. 따라서, 특정 구현예에서, 본 발명의 변형된 세포는 내인성 POI, 이종성 POI, 또는 하나 이상의 이러한 POI의 조합을 발현한다. 예를 들어, 특정 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스 세포에 비해 증가된 양의 내인성 POI를 생산한다. 다른 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스 세포에 비해 증가된 양의 이종성 POI를 생산한다.
따라서, 특정 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스(대조군) 세포에 비해 증가된 양의 POI를 생산하고, POI의 증가된 양은 적어도 약 0.01%의 증가, 적어도 약 0.10%의 증가, 적어도 약 0.50%의 증가, 적어도 약 1.0%의 증가, 적어도 약 2.0%의 증가, 적어도 약 3.0%의 증가, 적어도 약 4.0%의 증가, 적어도 약 5.0%의 증가, 또는 5.0% 초과의 증가이다. 특정 구현예에서, POI의 증가된 양은 효소 활성 분석 및/또는 이의 비생산성(Qp) 분석/정량화에 의해 결정된다. 마찬가지로, 당업자는 하나 이상의 관심 단백질의 발현 또는 생산의 검출, 분석, 측정 등을 위한 당업계에 알려진 다른 통상적인 방법 및 기술을 이용할 수 있다.
특정 구현예에서, 본 발명의 변형된 바실러스 세포는 (변형되지 않은) 모체 바실러스 세포에 비해 증가된 POI 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산을 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
"Qp = gP/gDCW
Figure pct00001
hr"
여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간(h)으로서, 생산 시간과 성장 시간이 포함된다.
따라서, 다른 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 변형되지 않은 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.
특정 구현예에서, POI 또는 이의 변이체 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나제, 아라비노푸라노시다제, 탄산무수화효소, 카복시펩티다제, 카탈라제, 셀룰라제, 키티나제, 키모신, 큐티나제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나제, 글루칸 라이사제, 엔도-β-글루카나제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 하이드롤라제, 인버타제, 이소머라제, 라카제, 리가제, 리파제, 리아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 해중합효소, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼하이드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 헥소스 옥시다제, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
따라서, 특정 구현예에서, POI 또는 이의 변이체 POI는 효소 위원회(EC) 번호 EC 1, EC 2, EC 3, EC 4, EC 5, 또는 EC 6으로부터 선택된 효소이다.
예를 들어, 특정 구현예에서, POI는 EC 1.10.3.2(예: 라카제), EC 1.10.3.3(예: L-아스코르브산 옥시다제), EC 1.1.1.1(예: 알코올 탈수소효소), EC 1.11.1.10(예: 클로라이드 퍼옥시다제), EC 1.11.1.17(예: 퍼옥시다제), EC 1.1.1.27(예: L-락테이트 탈수소효소), EC 1.1.1.47(예: 글루코스 1-탈수소효소), EC 1.1.3.X(예: 글루코스 옥시다제), EC 1.1.3.10(예: 피라노스 옥시다제), EC 1.13.11.X(예: 이산소화효소), EC 1.13.11.12(예: 리네올레이트 13S-리폭시게나제), EC 1.1.3.13(예: 알코올 옥시다제), EC 1.14.14.1(예: 일산소화효소), EC 1.14.18.1(예: 모노페놀 일산소화효소) EC 1.15.1.1(예: 수퍼옥사이드 디스무타제), EC 1.1.5.9 (이전 명칭 EC 1.1.99.10, 예: 글루코스 탈수소효소), EC 1.1.99.18(예: 셀로비오스 탈수소효소), EC 1.1.99.29(예: 피라노스 탈수소효소), EC 1.2.1.X(예: 지방산 환원효소), EC 1.2.1.10(예: 아세트알데히드 탈수소효소), EC 1.5.3.X(예: 프룩토실 아민 환원효소), EC 1.8.1.X(예: 디설파이드 환원효소), 및 EC 1.8.3.2(예: 티올 옥시다제)로부터 선택된 EC 1(옥시도리덕타제) 효소를 포함하는(이에 한정되지 않음) 옥시도리덕타제 효소이다.
특정 구현예에서, POI는 EC 2.3.2.13(예: 트랜스글루타미나제), EC 2.4.1.X(예: 헥소실트랜스퍼라제), EC 2.4.1.40(예: 알터나수크라제), EC 2.4.1.18(예: 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예: 시클로말토덱스트린 글루카노트랜스퍼라제), EC 2.4.1.2(예: 덱스트린 덱스트라나제), EC 2.4.1.20(예: 셀로비오스 포스포릴라제), EC 2.4.1.25(예: 4-알파-글루카노트랜스퍼라제), EC 2.4.1.333(예: 1,2-베타-올리고글루칸 포스포 트랜스퍼라제), EC 2.4.1.4(예: 아밀로수크라제), EC 2.4.1.5(예: 덱스트란수크라제), EC 2.4.1.69(예: 갈락토시드 2-알파-L-푸코실 트랜스퍼라제), EC 2.4.1.9(예: 이눌로수크라제), EC 2.7.1.17(예: 자일룰로키나제), EC 2.7.7.89 (이전 명칭 EC 3.1.4.15, 예: [글루타민 합성효소]-아데닐릴-L-티로신 포스포릴라제), EC 2.7.9.4(예: 알파 글루칸 키나제), 및 EC 2.7.9.5(예: 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라제) 효소를 포함하는(이에 한정되지 않음) 트랜스퍼라제 효소이다.
다른 구현예에서, POI는 EC 3.1.X.X(예: 에스테라제), EC 3.1.1.1(예: 펙티나제), EC 3.1.1.14(예: 클로로필라제), EC 3.1.1.20(예: 탄나제), EC 3.1.1.23(예: 글리세롤-에스테르 아실하이드롤라제), EC 3.1.1.26(예: 갈락토리파제), EC 3.1.1.32(예: 포스포리파제 A1), EC 3.1.1.4(예: 포스포리파제 A2), EC 3.1.1.6(예: 아세틸에스테라제), EC 3.1.1.72(예: 아세틸자일란 에스테라제), EC 3.1.1.73(예: 페룰로일 에스테라제), EC 3.1.1.74(예: 큐티나제), EC 3.1.1.86(예: 람노갈락투로난 아세틸에스테라제), EC 3.1.1.87(예: 푸모신 B1 에스테라제), EC 3.1.26.5(예: 리보뉴클레아제 P), EC 3.1.3.X(예: 인산 모노에스테르 하이드롤라제), EC 3.1.30.1(예: 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예: 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예: 알칼리성 포스파타제), EC 3.1.3.2(예: 산 포스파타제), EC 3.1.3.8(예: 3-피타제), EC 3.1.4.1(예: 포스포디에스테라제 I), EC 3.1.4.11(예: 포스포이노시티드 포스포리파제 C), EC 3.1.4.3(예: 포스포리파제 C), EC 3.1.4.4(예: 포스포리파제 D), EC 3.1.6.1(예: 아릴수파타제), EC 3.1.8.2(예: 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예: 올리고-1,6-글루코시다제), EC 3.2.1.101(예: 만난 엔도-1,6-알파-만노시다제), EC 3.2.1.11(예: 알파-1,6-글루칸-6-글루카노하이드롤라제), EC 3.2.1.131(예: 자일란 알파-1,2-글루쿠로노시다제), EC 3.2.1.132(예: 키토산 N-아세틸글루코사미노하이드롤라제), EC 3.2.1.139(예: 알파-글루쿠로니다제), EC 3.2.1.14(예: 키티나제), EC 3.2.1.151(예: 자일로글루칸-특이적 엔도-베타-1,4-글루카나제), EC 3.2.1.155(예: 자일로글루칸-특이적 엑소-베타-1,4-글루카나제), EC 3.2.1.164(예: 갈락탄 엔도-1,6-베타-갈락토시다제), EC 3.2.1.17(예: 리소자임), EC 3.2.1.171(예: 람노갈락투로난 하이드롤라제), EC 3.2.1.174(예: 람노갈락투로난 람노하이드롤라제), EC 3.2.1.2(예: 베타-아밀라제), EC 3.2.1.20(예: 알파-글루코시다제), EC 3.2.1.22(예: 알파-갈락토시다제), EC 3.2.1.25(예: 베타-만노시다제), EC 3.2.1.26(예: 베타-프룩토푸라노시다제), EC 3.2.1.37(예: 자일란 1,4-베타-자일로시다제), EC 3.2.1.39(예: 글루칸 엔도-1,3-베타-D-글루코시다제), EC 3.2.1.40(예: 알파-L-람노시다제), EC 3.2.1.51(예: 알파-L-푸코시다제), EC 3.2.1.52(예: 베타-N-아세틸헥소스아미니다제), EC 3.2.1.55(예: 알파-N-아라비노푸라노시다제), EC 3.2.1.58(예: 글루칸 1,3-베타-글루코시다제), EC 3.2.1.59(예: 글루칸 엔도-1,3-알파-글루코시다제), EC 3.2.1.67(예: 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예: 이소아밀라제), EC 3.2.1.7(예: 1-베타-D-프룩탄 프룩타노하이드롤라제), EC 3.2.1.74(예: 글루칸 1,4-β-글루코시다제), EC 3.2.1.75(예: 글루칸 엔도-1,6-베타-글루코시다제), EC 3.2.1.77(예: 만난 1,2-(1,3)-알파-만노시다제), EC 3.2.1.80(예: 프룩탄 베타-프룩토시다제), EC 3.2.1.82(예: 엑소-폴리-알파-갈락투로노시다제), EC 3.2.1.83(예: 카파-카라기나제), EC 3.2.1.89(예: 아라비노갈락탄 엔도-1,4-베타-갈락토시다제), EC 3.2.1.91(예: 셀룰로스 1,4-베타-셀룰로비오시다제), EC 3.2.1.96(예: 만노실-당단백질 엔도-베타-N-아세틸글루코사미니다제), EC 3.2.1.99(예: 아라비난 엔도-1,5-알파-L-아라비나나제), EC 3.4.X.X(예: 펩티다제), EC 3.4.11.X(예: 아미노펩티다제), EC 3.4.11.1(예: 류실 아미노펩티다제), EC 3.4.11.18(예: 메티오닐 아미노펩티다제), EC 3.4.13.9(예: Xaa-Pro 디펩티다제), EC 3.4.14.5(예: 디펩티딜-펩티다제 IV), EC 3.4.16.X(예: 세린-타입 카복시펩티다제), EC 3.4.16.5(예: 카복시펩티다제 C), EC 3.4.19.3(예: 피로글루타밀-펩티다제 I), EC 3.4.21.X(예: 세린 엔도펩티다제), EC 3.4.21.1(예: 키모트립신), EC 3.4.21.19(예: 글루타밀 엔도펩티다제), EC 3.4.21.26(예: 프로릴 올리고펩티다제), EC 3.4.21.4(예: 트립신), EC 3.4.21.5(예: 트롬빈), EC 3.4.21.63(예: 오리진), EC 3.4.21.65(예: 써모마이콜린), EC 3.4.21.80(예: 스트렙토그리신 A), EC 3.4.22.X(예: 시스테인 엔도펩티다제), EC 3.4.22.14(예: 악티니다인), EC 3.4.22.2(예: 파파인), EC 3.4.22.3(예: 피카인), EC 3.4.22.32(예: 줄기 브로멜라인), EC 3.4.22.33(예: 과일 브로멜라인), EC 3.4.22.6(예: 키모파파인), EC 3.4.23.1(예: 펩신 A), EC 3.4.23.2(예: 펩신 B), EC 3.4.23.22(예: 엔도티아펩신), EC 3.4.23.23(예: 무코펩신), EC 3.4.23.3(예: 가스트릭신), EC 3.4.24.X(예: 메탈로엔도펩티다제), EC 3.4.24.39(예: 듀테로리신), EC 3.4.24.40(예: 세랄리신), EC 3.5.1.1(예: 아스파라기나제), EC 3.5.1.11(예: 페니실린 아미다제), EC 3.5.1.14(예: N-아실-알리파트-L아미노산 아미도하이드롤라제), EC 3.5.1.2(예: L-글루타민 아미도하이드롤라제), EC 3.5.1.28(예: N-아세틸무라모일-L-알라닌 아미다제), EC 3.5.1.4(예: 아미다제), EC 3.5.1.44(예: 단백질-L-글루타민 아미도하이드롤라제), EC 3.5.1.5(예: 우레아제), EC 3.5.1.52(예: 펩티드-N(4)-(N-아세틸-베타-글루코사미닐)아스파라긴 아미다제), EC 3.5.1.81(예: N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예: AMP 데아미나제), 및 EC 3.5.5.1(예: 니트릴라제)로부터 선택되는 EC 3(하이드롤라제) 효소를 포함하는(이에 한정되지 않음) 하이드롤라제 효소이다.
다른 구현예에서, POI는 EC 4.1.2.10(예: 만델로니트릴 리아제), EC 4.1.3.3(예: N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예: 탄산탈수효소), EC 4.2.2.-(예: 람노갈락투로난 리아제), EC 4.2.2.10(예: 펙틴 리아제), EC 4.2.2.22(예: 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예: 람노갈락투로난 엔도리아제), 및 EC 4.2.2.3(예: 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는(이에 한정되지 않음) 리아제 효소이다.
다른 특정 구현예에서, POI는 EC 5.1.3.3(예: 알도스 1-에피머라제), EC 5.1.3.30(예: D-사이코스 3-에피머라제), EC 5.4.99.11(예: 이소말툴로스 신타제), 및 EC 5.4.99.15(예: (1→4)-α-D-글루칸 1-α-D-글로코실무타제)로부터 선택된 EC 5(이소머라제) 효소를 포함하는(이에 한정되지 않음) 이소머라제 효소이다.
또 다른 구현예에서, POI는 EC 6.2.1.12(예: 4-쿠마레이트:코엔자임 A 리가제) 및 EC 6.3.2.28(예: L-아미노산 알파-리가제)로부터 선택된 EC 6(리가제) 효소를 포함하는(이에 한정되지 않음) 리가제 효소이다.
따라서, 특정 구현예에서, 산업용 프로테아제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다. 마찬가지로, 다른 특정 구현예에서, 산업용 아밀라제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다.
예를 들어, 일반적으로 바실러스 종에 의해 분비되는 2가지 일반적인 유형의 프로테아제, 즉 중성(또는 "메탈로프로테아제") 및 알칼리성(또는 "세린") 프로테아제가 있다. 예를 들어, 바실러스 서브틸리신 단백질(효소)은 본 발명에 사용하기 위한 예시적인 세린 프로테아제이다. 서브틸리신 168, 서브틸리신 BPN', 서브틸리신 칼스버그, 서브틸리신 DY, 서브틸리신 147, 및 서브틸리신 309와 같은 매우 다양한 바실러스 서브틸리신이 확인되었고 시퀀싱되었다(예를 들어, WO 1989/06279 및 문헌[Stahl et al., 1984]). 본 발명의 일부 구현예에서, 변형된 바실러스 세포는 돌연변이(즉, 변이체) 프로테아제를 생산한다. PCT 공개 번호 WO1999/20770; WO1999/20726; WO1999/20769; WO1989/06279; US RE34,606; US Patent Nos. 4,914,031; 4,980,288; 5,208,158; 5,310,675; 5,336,611; 5,399,283; 5,441,882; 5,482,849; 5,631,217; 5,665,587; 5,700,676; 5,741 ,694; 5,858,757; 5,880,080; 6,197,567; 및 6,218,165와 같은 많은 참고문헌에서 변이체 프로테아제의 예를 제공한다. 따라서, 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 프로테아제를 암호화하는 발현 구성체를 포함한다.
다른 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 아밀라제를 암호화하는 발현 구성체를 포함한다. 매우 다양한 아밀라제 효소 및 이의 변이체가 당업자에게 알려져 있다. 예를 들어, PCT 공개 번호 WO2006/037484 및 WO 2006/037483에는 용매 안정성이 개선된 변이체 α-아밀라제가 기재되어 있고, 공개 번호 WO1994/18314에는 산화 안정성 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1999/19467, WO2000/29560, 및 WO2000/60059에는 터마밀 유사 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO2008/112459에는 바실러스 종 707번으로부터 유래된 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1999/43794에는 말토겐 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1990/11352에는 초내열성 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO2006/089107에는 과립 전분 가수분해 활성을 갖는 α-아밀라제 변이체가 개시되어 있다.
다른 구현예에서, 본 발명의 변형된 세포에서 발현되고 생산된 POI 또는 변이체 POI는 펩티드, 펩티드 호르몬, 성장 인자, 응고 인자, 케모카인, 사이토카인, 림포카인, 항체, 수용체, 부착 분자, 미생물 항원(예를 들어, HBV 표면 항원, HPV E7 등), 이들의 변이체, 이들의 단편 등이다. 다른 유형의 관심 단백질(또는 이의 변이체)은 식품 또는 작물에 영양가를 제공할 수 있는 것일 수 있다. 비제한적인 예는 항영양 인자의 형성을 억제할 수 있는 식물성 단백질, 및 더 바람직한 아미노산 조성(예를 들어, 비형질전환 식물보다 높은 라이신 함량)을 갖는 식물성 단백질을 포함한다.
세포내 및 세포외 발현 단백질의 활성을 검출하고 측정하기 위한 다양한 분석법이 당업자에 알려져 있다. 특히, 프로테아제의 경우, Folin 방법을 사용하여 280 nm에서의 흡광도 또는 비색법으로 측정되는 카제인 또는 헤모글로빈으로부터 산-가용성 펩티드의 방출에 기초한 분석법이 있다(예를 들어, 문헌[Bergmeyer et al., 1984]). 다른 분석법은 발색 기질의 가용화를 포함한다(예를 들어, 문헌[Ward, 1983] 참조). 다른 예시적인 분석법은 숙시닐-Ala-Ala-Pro-Phe-파라-니트로아닐리드 분석법(SAAPFpNA) 및 2,4,6-트리니트로벤젠 설포네이트 나트륨 염 분석법(TNBS 분석법)을 포함한다. 당업자에게 알려진 많은 추가 참고문헌은 적합한 방법을 제공한다(예를 들어, 문헌[Wells et al., 1983; Christianson et al., 1994; 및 Hsia et al., 1999] 참조).
국제 PCT 공개 WO2014/164777호에는 본원에 기재된 아밀라제 활성에 유용한 Ceralpha α-아밀라제 활성 분석법이 개시되어 있다.
숙주 세포 내 관심 단백질의 분비 수준의 결정 수단 및 발현된 단백질의 검출 수단은 단백질에 특이적인 다클론 또는 단클론 항체를 이용한 면역분석법의 사용을 포함한다. 예는 효소 결합 면역흡착 분석법(ELISA), 방사면역분석법(RIA), 형광 면역분석법(FIA), 및 형광 활성화 세포 분류법(FACS)을 포함한다.
VI. 예시적 구현예
본 발명의 비제한적 구현예는 다음을 포함하나 이에 한정되지 않는다.
1. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
2. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) (i) POI를 암호화하는 발현 카세트 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 폴리뉴클레오티드를 도입함으로써, 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
3. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터 서열을 포함하는, 방법.
4. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 방법.
5. 구현예 1 또는 구현예 2에 있어서, 모세포는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는, 방법.
6. 구현예 5에 있어서, 내인성 prsA 유전자는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 방법.
7. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합되는, 방법.
8. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 추가로 포함하는, 방법.
9. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
10. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
11. 구현예 1 또는 구현예 2에 있어서, POI는 효소인, 방법.
12. 구현예 11에 있어서, 효소는 프로테아제 또는 아밀라제인, 방법.
13. 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
14. 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
15. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함하는, 변형된 세포.
16. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 변형된 세포.
17. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 변형된 세포.
18. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합되는, 변형된 세포.
19. 구현예 13 또는 구현예 14에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하는 변형된 세포.
20. 구현예 13 또는 구현예 14에 있어서, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
21. 구현예 13 또는 구현예 14에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
22. 구현예 13 또는 구현예 14에 있어서, 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 카세트를 포함하는 변형된 세포.
23. 구현예 22에 있어서, POI는 효소인, 변형된 세포.
24. 구현예 13 또는 구현예 14에 있어서, 모세포는 내인성 POI를 발현하는, 변형된 세포.
25. 구현예 22 또는 구현예 24의 변형된 세포에 의해 생산된 관심 단백질.
26. 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포로서, POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고; 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하고; 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하고; 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산하는 변형된 세포.
27. 구현예 26에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 추가로 포함하는 변형된 세포.
28. 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포로서, POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고; 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고; 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하고; 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산하는 변형된 세포.
29. 구현예 28에 있어서, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는 변형된 세포.
30. 구현예 26 또는 구현예 28에 있어서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는, 변형된 세포.
31. 구현예 26 또는 구현예 28에 있어서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는, 변형된 세포.
32. 구현예 26 또는 구현예 28에 있어서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는, 변형된 세포.
33. 구현예 26 또는 구현예 28에 있어서, POI는 효소인, 변형된 세포.
34. 구현예 33에 있어서, 효소는 프로테아제 또는 아밀라제인, 변형된 세포.
35. 구현예 26 또는 구현예 28의 변형된 세포에 의해 생산된 관심 단백질.
실시예
본 발명의 특정 양태는 하기 실시예를 고려하여 추가로 이해될 수 있으며, 이는 제한적인 것으로 해석되어서는 안 된다. 재료 및 방법의 변형은 당업자에게 명백할 것이다.
실시예 1
RGHR2 경로 유전자를 표적화하는 CAS9 벡터의 구성
S. 피오게네스로부터의 Cas9 단백질(서열번호 1)을 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열번호 3), C-말단 NLS("KKKKLK"; 서열번호 4), deca-히스티딘 태그("HHHHHHHHHH"; 서열번호 5), B. 서브틸리스로부터의 aprE 프로모터(서열번호 6), 및 종결자 서열(서열번호 7)을 첨가하여 바실러스에 대해 코돈 최적화하고(서열번호 2), 아래 표 1에 기재된 정방향(서열번호 8) 및 역방향(서열번호 9) 프라이머 쌍을 이용해 제조사의 지침에 따라 Q5 DNA 중합효소(NEB)를 사용하여 증폭시켰다.
Figure pct00002
플라스미드 pKB320(서열번호 11)의 백본(서열번호 10)을 아래 표 2에 기재된 정방향(서열번호 12) 및 역방향(서열번호 13) 프라이머 쌍을 이용해 제조사의 지침에 따라 Q5 DNA 중합효소(NEB)를 사용하여 증폭시켰다.
Figure pct00003
제조사의 지침에 따라 Zymo clean and concentrate 5 컬럼을 사용하여 PCR 산물을 정제하였다. 이후, Q5 중합효소(NEB)로 2개의 단편을 등몰비로 혼합하며 연장된 중첩 확장 PCR(POE-PCR)을 사용하여 PCR 산물을 조립하였다. POE-PCR 반응을 다음과 같이 사이클링하였다: 30회 사이클에 대해 5초 동안 98℃, 10초 동안 64℃, 4분 15초 동안 72℃. 제조사의 지침에 따라 5 μl의 POE-PCR(DNA)을 Top10 E. coli (Invitrogen)로 형질전환시키고, 50 μg/ml의 카나마이신 설페이트를 함유하는 용원성(L) 배양액(Miller 레시피; 1%(w/v) 트립톤, 0.5% 효모 추출물(w/v), 1% NaCl(w/v)) 상에서 선택하고 1.5% 한천으로 고화시켰다. 콜로니를 37℃에서 18시간 동안 성장시켰다. 콜로니를 선별하고, 제조사의 지침에 따라 Qiaprep DNA miniprep 키트를 사용하여 플라스미드 DNA를 제조하고, 55 μl의 ddH2O에 용리시켰다. 정확한 조립을 검증하기 위해 아래 표 3에 기재된 시퀀싱 프라이머를 사용하여 플라스미드 DNA의 Sanger 시퀀싱을 수행하였다.
Figure pct00004
정확히 조립된 플라스미드, pRF694(서열번호 25)를 사용하여 하기 기재된 바와 같은 표적 부위 1(TS1; 서열번호 28) 및 표적 부위 2(TS2; 서열번호 29)에서 B. 리체니포르미스 게놈을 편집하기 위한 플라스미드 pRF801(서열번호 26) 및 pRF806(서열번호 27)을 구성하였다.
B. 리체니포르미스serA1 오픈 리딩 프레임(서열번호 30)은 고유한 표적 부위, 표적 부위 1(TS1; 서열번호 28)을 역방향으로 포함한다. 표적 부위는 프로토스페이서 인접 모티프(서열번호 31)에 역방향으로 인접해 있다. 표적 부위는 가변 표적화 도메인을 암호화하는 DNA(서열번호 32)로 전환될 수 있다.
VT 도메인을 암호화하는 DNA 서열(서열번호 32)은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 1을 표적화하는 기능적 gRNA(서열번호 34)를 생성하도록, Cas9 엔도뉴클레아제 인식 도메인을 암호화하는 DNA 서열(CER, 서열번호 33)에 작동가능하게 융합된다. gRNA를 암호화하는 DNA를, 바실러스 종 세포에서 작동가능한 프로모터(예를 들어, spac 프로모터; 서열번호 35) 및 바실러스 종 세포에서 작동가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열번호 36)에, gRNA를 암호화하는 DNA(서열번호 33)의 업스트림(5')에 프로모터가 위치하고 gRNA를 암호화하는 DNA(서열번호 33)의 다운스트림(3')에 종결자가 위치하도록, 작동가능하게 연결하였다.
Cas9/gRNA 절단에 반응하여 serA1 유전자를 결실시키는 편집 주형을 B. 리체니포르미스 게놈 DNA(gDNA)의 2개의 상동성 아암의 증폭을 통해 생성하였다. 제1 단편은 serA1 오픈 리딩 프레임의 바로 업스트림에 있는 500 bp에 해당한다(서열번호 37). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 4에 기재된 정방향(서열번호 38) 및 역방향(서열번호 39) 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에 상동성인 18 bp를 제1 단편의 3' 말단에 도입하고 pRF694에 상동성인 20 bp를 제1 단편의 5' 말단에 도입한다.
Figure pct00005
제2 단편은 serA1 오픈 리딩 프레임의 3' 말단의 바로 다운스트림에 있는 500 bp에 해당한다(서열번호 40). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 5에 기재된 정방향(서열번호 41) 및 역방향(서열번호 42) 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에 상동성인 28 bp를 제2 단편의 5' 말단에 도입하고 pRF694에 상동성인 21 bp를 제2 단편의 3' 말단에 도입한다.
Figure pct00006
Cas9 발현 카세트(서열번호 2), serA1 오픈 리딩 프레임 내 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 43), 및 제1 상동성 아암(서열번호 37)과 제2 상동성 아암(서열번호 40)으로 구성된 편집 주형(서열번호 44)을 함유하는 E. 콜라이-B. 리체니포르미스 셔틀 플라스미드, pRF801(서열번호 26)을 생성하는 표준 분자 생물학 기술을 사용하여, 표적 부위 1 gRNA을 암호화하는 DNA 발현 카세트(서열번호 43), 제1 상동성 아암(서열번호 37), 및 제2 상동성 아암(서열번호 40)을 pRF694(서열번호 25)로 조립하였다. 표 3에 기재된 올리고를 사용하여 Sanger 시퀀싱에 의해 플라스미드를 검증하였다.
B. 리체니포르미스rghR1 오픈 리딩 프레임(서열번호 45)은 역 가닥 상의 고유한 표적 부위, 표적 부위 2(TS2; 서열번호 29)를 함유한다. 표적 부위는 역 가당 상의 프로토스페이서 인접 모티프(서열번호 46)에 인접해 있다. 표적 부위(서열번호 29)를 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 2를 표적화하는 기능적 gRNA(서열번호 47)를 생성하도록, Cas9 엔도뉴클레아제 인식 도메인을 암호화하는 DNA 서열(CER, 서열번호 33)에 작동가능하게 융합된다. gRNA를 암호화하는 DNA를, 바실러스 종 세포에서 작동가능한 프로모터(예를 들어, B. 서브틸리스로부터의 spac 프로모터; 서열번호 35) 및 바실러스 종 세포에서 작동가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열번호 36)에, gRNA를 암호화하는 DNA(서열번호 47)의 5'에 프로모터가 위치하고 gRNA를 암호화하는 DNA(서열번호 47)의 3'에 종결자가 위치하도록, 작동가능하게 연결하였다.
Cas9/gRNA 절단에 반응하여 rghR1 유전자를 변형시키는 편집 주형을 B. 리체니포르미스 게놈 DNA(gDNA)의 2개의 상동성 아암의 증폭을 통해 생성하였다. 제1 단편은 rghR1 오픈 리딩 프레임의 바로 업스트림에 있는 500 bp에 해당한다(서열번호 48). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 6에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에 상동성인 23 bp를 제1 단편의 3' 말단에 도입하고 pRF694에 상동성인 20 bp를 제1 단편의 5' 말단에 도입한다.
Figure pct00007
제2 단편은 rghR1 오픈 리딩 프레임의 3' 말단의 바로 다운스트림에 있는 500 bp에 해당한다(서열번호 51). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 7에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에 상동성인 20 bp를 제2 단편의 5' 말단에 도입하고 pRF694에 상동성인 21 bp를 제2 단편의 3' 말단에 도입한다.
Figure pct00008
Cas9 발현 카세트(서열번호 2), rghR1 오픈 리딩 프레임 내 표적 부위 2를 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 54), 및 제1 상동성 아암(서열번호 48)과 제2 상동성 아암(서열번호 51)으로 구성된 편집 주형(서열번호 55)을 함유하는 E. 콜라이-B. 리체니포르미스 셔틀 플라스미드, pRF806(서열번호 27)을 생성하는 표준 분자 생물학 기술을 사용하여, 표적 부위 2 gRNA를 암호화하는 DNA 발현 카세트(서열번호 54), 제1 상동성 아암(서열번호 48), 및 제2 상동성 아암(서열번호 51)을 pRF694(서열번호 25)로 조립하였다. 표 3에 기재된 올리고를 사용하여 Sanger 서열로 플라스미드를 검증하였다.
실시예 2
CAS9 Y155H 변이체 및 관련 표적화 플라스미드의 구성
본 실시예에서는, pRF801(서열번호 26) 및 pRF806 플라스미드(서열번호 27)에서 S. 피오게네스 Cas9의 Y155H 변이체(서열번호 56)를 구성한다. pRF801 플라스미드(서열번호 26) 또는 pRF806 플라스미드(서열번호 27)에서 Y155H 변이체를 도입하기 위해, 주형 DNA로서 pRF801(서열번호 26) 또는 pRF806(서열번호 27)을 사용하고 제조사의 지침에 따른 Quikchange 돌연변이유발 키트 및 아래 표 8의 올리고를 사용하여 부위 지정 돌연변이유발을 수행하였다.
Figure pct00009
반응의 생성 산물인, pRF827(서열번호 59)은 Cas9 Y155H 변이체 발현 카세트(서열번호 60), serA1 오픈 리딩 프레임 내 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 43), 및 제1 상동성 아암(서열번호 37)과 제2 상동성 아암(서열번호 40)으로 구성된 편집 주형(서열번호 44)을 함유하거나, pRF856(서열번호 61)은 Cas9 Y155H 변이체 발현 카세트(서열번호 60), rghR1 오픈 리딩 프레임 내 표적 부위 2를 표적화하는 gRNA 발현 카세트(서열번호 54), 및 제1 상동성 아암(서열번호 48)과 제2 상동성 아암(서열번호 51)으로 구성된 편집 주형(서열번호 55)을 함유하였다. 정확한 조립을 검증하기 위해 표 3에 기재된 시퀀싱 프라이머를 사용하여 플라스미드 DNA의 Sanger 시퀀싱을 수행하였다.
플라스미드 pRF862의 구성
pRF827(서열번호 59)로부터 Y155H 치환을 함유하는 Cas9 오픈 리딩 프레임의 단편(서열번호 63)을 이동시켜 플라스미드 pRF862(서열번호 62)를 구성하고, 표 9에 기재된 프라이머를 사용하여 증폭시켰다.
Figure pct00010
상기 pRF827 단편(서열번호 63)에 포함된 단편을 제외한 전체 플라스미드를 포함하도록 pRF694(서열번호 25)로부터 제2 단편(서열번호 66)을 증폭시켰다. 이 단편은 조립을 위해 pRF827 단편(서열번호 60)의 5' 및 3' 말단과 상동성을 공유했고, 표 10에 기재된 프라이머를 사용하여 증폭되었다.
Figure pct00011
제조사의 지침에 따라 NEBuilder를 사용하여 2개의 단편을 조립하고 E. 콜라이 적격 세포로 형질전환시켰다. 표 3에 기재된 바와 같이 Sanger 방법에 의해 플라스미드 서열을 검증하였다. 서열 검증된 단리물은 플라스미드 pRF862(서열번호 62)로 저장되었다.
rghR2 ORF(서열번호 70)를 표적화하고 3개의 인-프레임 정지 코돈을 삽입하는 플라스미드, pRF869(서열번호 69)를 2개의 부분을 사용하여 구성하였다. rghR2 ORF(서열번호 70)를 변형하기 위한 편집 주형(서열번호 72), 및 rghR2 ORF(서열번호 70)를 표적화하는 gRNA 발현 카세트(서열번호 73)를 함유하는 제1 부분(서열번호 71)을 IDT에 의해 합성하고, 표 11에 기재된 프라이머를 사용하여 조립을 위해 증폭시켰다.
Figure pct00012
표 12에 기재된 프라이머를 사용하여 pRF862를 증폭시켜 합성 단편을 pRF862(서열번호 62)에 삽입하였다.
Figure pct00013
제조사의 지침에 따라 NEBuilder를 사용하여 2개의 부분을 조립하고 E. 콜라이로 형질전환시켰다. 표 3에 기재된 바와 같이 Sanger 방법에 의해 플라스미드 서열을 검증하였다. 서열 검증된 단리물은 pRF869(서열번호 69)로 저장되었다.
몇몇 추가 Cas9 플라스미드를 실시예 1 및 2에서 전술한 바와 같이 조립하였다. 이들 플라스미드는 표적 부위 서열 및 편집 주형 효과와 함께 표 13에 기재되어 있다.
Figure pct00014
모든 플라스미드에 대해, RCA(롤링-서클 증폭)를 사용하여 플라스미드를 증폭시키고, TruPrime RCA 키트(Sygnis)를 사용하여 형질전환에 적합한 기질로 만들었다.
실시예 3
변형된 숙주 균주의 구성
본 실시예에서는, 일련의 숙주 변형을 모체 B. 리체니포르미스 균주에 도입하였다. 모체 B. 리체니포르미스 균주는 serA1(서열번호 30) 및 lysA 유전자(서열번호 87)의 결실을 포함하며 BF140으로 명명된다.
스펙티노마이신 마커(서열번호 89), XylR 억제인자를 암호화하는 DNA(서열번호 90), 및 B. 리체니포르미스 ComK 단백질을 암호화하는 DNA(서열번호 92)에 작동가능하게 연결된 B. 서브틸리스xylA 프로모터(서열번호 91)를 함유하는 pBl.comK 플라스미드(서열번호 88)를 포함하는 BF140의 버전(문헌[Liu and Zuber, 1998, Hamoen et al., 1998])을 B. 리체니포르미스prsA 유전자의 제2 카피(서열번호 93)의 통합을 위해 catH 유전자좌를 표적화하는 선형 PCR 산물로 형질전환시켰다. 구성체는 catH 프로모터(서열번호 95)에 작동가능하게 연결된 catH 유전자좌에 대한 업스트림 상동성 아암(서열번호 94), B. 서브틸리스spoVG 종결자(서열번호 99)에 작동가능하게 연결된 catH 종결자(서열번호 98)로 구성된 이중 종결자(서열번호 97)에 작동가능하게 연결된 CatH 단백질을 암호화하는 DNA(서열번호 96)를 함유한다.
이어서, 구성체는 catH 유전자좌에 대한 다운스트림 상동성 아암(서열번호 103)에 작동가능하게 연결된 B. 리체니포르미스amyL 유전자의 종결자(서열번호 102)에 작동가능하게 연결된 prsA 암호화 서열(서열번호 101)에 작동가능하게 연결된 B. 리체니포르미스prsA 프로모터(서열번호 100)를 함유한다. 요컨대, BF140/pBl.comK 적격 세포가 생성되었다. BF140/pBl.comK 균주를 100 ppm의 스펙티노마이신을 함유하는 37℃의 L 배양액에서 250 RPM으로 진탕하면서 밤새 성장시켰다. 다음 날 배양물을 100 ppm의 스펙티노마이신을 함유하는 신선한 L 배양액(OD600=0.7)으로 희석하였다. 이 새로운 배양물을 37℃에서 250 RPM으로 진탕하면서 1시간 동안 성장시켰다. D-자일로스를 0.1% w·v-1로 첨가하였다. 배양물을 37℃에서 250 RPM으로 진탕하면서 추가로 4시간 동안 성장시켰다. 1700 g로 7분 동안 세포를 채취하였다. 10%v·v-1 DMSO를 함유하는 사용된 배양 배지의 1/4 부피에 세포를 재현탁시켰다. 100 μl의 세포를 10 μl의 catH::[catH prsAp-prsA] 통합 단편(서열번호 94)과 혼합하였다. 세포/DNA 혼합물을 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 이어서, 혼합물을 10 ppm의 클로람페니콜을 함유하는 L 한천 플레이트에 플레이팅하였다. 접종된 플레이트를 37℃에서 48시간 동안 인큐베이션하였다.
10 ppm의 클로람페니콜을 함유하는 L 한천에서 형성된 콜로니를 콜로니 PCR을 사용해 스크리닝하여 표 14에 기재된 프라이머 및 표준 PCR 기술을 사용해 catH 유전자좌의 변형을 확인하였다.
Figure pct00015
이 PCR 산물, 2676 bp 단편(서열번호 106)을 Sanger 방법 및 표 15에 기재된 프라이머를 사용하여 시퀀싱하였다.
Figure pct00016
정확한 catH::[catH prsAp-prsA] 통합(서열번호 93)이 있는 단리물은 균주 BF547로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF547의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pRF946(서열번호 81) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드 형질전환을 위한 선택을 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다. 플레이트를 37℃에서 48시간 동안 인큐베이션하였다.
20 ppm의 카나마이신을 함유하는 L 한천에서 형성된 콜로니를 콜로니 PCR에 대해 스크리닝하여, 표준 PCR 기술 및 표 14에 기재된 프라이머를 사용하여 catH::[prsAp-prsA] 카세트(서열번호 111)를 유지하면서, catH 프로모터의 3' 말단을 암호화하는 DNA 및 CatH 단백질을 암호화하는 DNA(서열번호 110)의 결실을 확인하였다.
2676 bp 길이의 PCR 산물(서열번호 106)을 생성한 catH::[catH prsAp-prsA] 카세트(서열번호 93)를 함유하는 모체 콜로니와 대조적으로, catH::[prsAp-prsA] 카세트(서열번호 111)를 함유하는 정확한 콜로니는 1990 bp의 PCR 산물(서열번호 112)을 생성하였다. 표준 겔 전기영동 기술을 사용하여 차이를 시각적으로 평가하였다. 정확한 크기의 PCR 산물이 있는 단리물을 상기 표 15의 프라이머 1915(서열번호 107) 및 프라이머 1916(서열번호 108)을 사용하여 시퀀싱하였다.
catH::[prsAp-prsA] 카세트(서열번호 111)를 함유한 서열 검증된 단리물은 클로람페니콜(10 ppm)에 표현형적으로 민감하였고 BF561로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF561의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pZM221(서열번호 84) 또는 pRF879(서열번호 78) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드로 형질전환된 세포를 선택하기 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pZM221(서열번호 84)로 형질전환된 세포의 경우, 표준 PCR 기술 및 표 16의 프라이머를 사용하여 ΔdltA-2 대립유전자(서열번호 86), dltA 암호화 서열의 700 bp의 결실에 대해 스크리닝하였다.
Figure pct00017
ΔdltA-2 대립유전자를 갖는 콜로니는 표 16의 프라이머를 사용하여 2067 bp의 PCR 산물(서열번호 115)을 생성하는 반면, 온전한 dltA 유전자를 함유하는 모세포는 2767 bp의 PCR 산물(서열번호 116)을 생성한다. 이는 표준 전기영동 기술을 사용하여 구별할 수 있다. dltA의 700 bp 내부 결실(서열번호 86)을 함유하는 콜로니는 BF598로 저장되었다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pRF879(서열번호 78)로 형질전환된 세포의 경우, 표준 PCR 기술 및 아래 표 17의 프라이머를 사용하여, ΔrghR2 대립유전자(서열번호 80), 처음 9 bp 및 마지막 9 bp를 제외한 rghR2 암호화 서열의 결실에 대해 스크리닝하였다.
Figure pct00018
ΔrghR2 대립유전자(서열번호 80)를 갖는 콜로니는 표 17의 프라이머를 사용하여 1523 bp의 PCR 산물(서열번호 119)을 생성하는 반면, 온전한 rghR2 유전자를 함유하는 모세포는 1922 bp의 PCR 산물(서열번호 120)을 생성한다. 이들 두 산물 간의 차이는 표준 전기영동 기술을 사용하여 구별할 수 있다. rghR2 유전자의 결실(서열번호 84)을 함유하는 콜로니는 BF602로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF598의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pRF879(서열번호 78) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드로 형질전환된 세포를 선택하기 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pRF879(서열번호 78)로 형질전환된 세포의 경우, 표준 PCR 기술 및 상기 표 17의 프라이머를 사용하여, ΔrghR2 대립유전자(서열번호 80), 처음 9 bp 및 마지막 9 bp를 제외한 rghR2 암호화 서열의 결실에 대해 스크리닝하였다.
ΔrghR2 대립유전자(서열번호 80)를 갖는 콜로니는 표 17의 프라이머를 사용하여 1523 bp의 PCR 산물(서열번호 119)을 생성하는 반면, 온전한 rghR2 유전자를 함유하는 모세포는 1922 bp의 PCR 산물(서열번호 120)을 생성한다. 이들 두 산물 간의 차이는 표준 전기영동 기술을 사용하여 구별할 수 있다. rghR2 유전자의 결실(서열번호 80)을 함유하는 콜로니는 BF613로 저장되었다. 표 18은 본 실시예에서 생성된 변형된 숙주 균주를 실시예의 3개의 변형된 유전자좌에 대한 서열번호와 함께 나타낸다.
Figure pct00019
실시예 4
변형된 숙주 균주에서 아밀라제 발현 균주의 구성
본 실시예에서는, 일련의 아밀라제 및 아밀라제 변이체 발현 카세트를 실시예 2, 상기 표 18에 기재된 균주 계통에 도입하였다.
아밀라제 1
아밀라제 1(서열번호 126)은 B. 리체니포르미스의 천연 알파 아밀라제로서, 일반적으로 AmyL이라고 한다. 아밀라제 1의 제1 카세트(서열번호 127)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 1을 암호화하는 DNA(서열번호 131)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 1의 제2 카세트(서열번호 132)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 1을 암호화하는 DNA(서열번호 131)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 2
아밀라제 2(서열번호 136)는 PCT 공개 WO2018/184004호(전체가 본원에 참조로 포함됨)에 기재된 변이체 바실러스 종 α-아밀라제이다. 아밀라제 2의 제1 카세트(서열번호 137)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 2를 암호화하는 DNA(서열번호 140)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 B. 서브틸리스 rrnI 프로모터(서열번호 138) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133) 또는 amyL 유전자좌(서열번호 142)에 통합된 아밀라제 2의 제2 카세트(서열번호 141)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 2를 암호화하는 DNA(서열번호 140)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 3
아밀라제 3(서열번호 143)은 변이체 사이토파가 종α-아밀라제이다(예를 들어, PCT 공개 WO2014/164777호; WO2012/164800호; 및 WO2014/16483호 참조, 각각은 전체가 본원에 참조로 포함됨). 아밀라제 3의 제1 카세트(서열번호 144)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 3을 암호화하는 DNA(서열번호 145)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 3의 제2 카세트(서열번호 146)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 3을 암호화하는 DNA(서열번호 145)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 4
아밀라제 4(서열번호 147)는 변이체 사이토파가 종α-아밀라제이다(예를 들어, PCT 공개 WO2014/164777호; WO2012/164800호; 및 WO2014/16483호 참조, 각각은 전체가 본원에 참조로 포함됨). 아밀라제 4의 제1 카세트(서열번호 148)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 129)에 작동가능하게 연결된 아밀라제 4를 암호화하는 DNA(서열번호 149)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 4의 제2 카세트(서열번호 150)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 4를 암호화하는 DNA(서열번호 149)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 5
아밀라제 5(서열번호 151)는 변이체 바실러스 종 707 α-아밀라제이다(PCT 공개 WO2008/153805호 및 미국 특허 공개 US2014/0057324호 참조). 아밀라제 5의 제1 카세트(서열번호 152)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 5를 암호화하는 DNA(서열번호 153)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 5의 제2 카세트(서열번호 154)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 5를 암호화하는 DNA(서열번호 153)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
PCT 공개 WO2019/040412호(전체가 본원에 참조로 포함됨)에 기재된 방법을 사용하여 모든 아밀라제 발현 카세트를 변형된 숙주 균주로 형질전환시켰다.
실시예 5
아밀라제 생성에 대한 변형된 숙주 백그라운드의 영향
본 실시예에서는, 아밀라제 1 내지 5(실시예 4)에 대한 발현 카세트의 2개 카피를 함유하는 변형된 숙주 균주(즉, 표 19; BF140, BF561, BF598, BF602, 및 BF613)를 표준 소규모 또는 실험실 규모 발효 조건을 사용하여 α-아밀라제 생성에 대해 분석하였다(PCT 공개 WO2018/156705호 및 WO2019/055261호에 기재된 바와 같고, 각각은 본원에 참조로 포함됨). Bradford 또는 Ceralpha 분석법을 사용하여 알파-아밀라제 생성을 정량화했다. 아밀라제 생성의 상대적 개선은 하기 표 19에 제시된 동일한 α-아밀라제 발현 카세트를 포함하는 변형되지 않은 숙주와 비교된다.
Figure pct00020
따라서, 다양한 α-아밀라제 그룹에서 시험된 5가지 아밀라제 모두는 변형되지 않은 숙주 BF140과 비교하여, 결실된 dltA-2dltA-2) 대립유전자(서열번호 125), 결실된 rghR2 rghR2) 대립유전자(서열번호 80), 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)의 삽입을 포함하는 BF613 변형 백그라운드에서 α-아밀라제 생성의 개선을 보여준다.
아밀라제 2 및 아밀라제 3의 경우, 결실된 rghR2rghR2) 대립유전자(서열번호 80) 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)를 포함하는 BF602 변형 백그라운드에서 α-아밀라제 생성의 개선은 BF613 변형 숙주에서 관찰되는 개선과 거의 같은 정도로 우수하며, 이는 일부 아밀라제의 경우 개선이 이러한 2개의 대립유전자의 존재만을 필요로 할 뿐만 아니라 ΔdltA-2 대립유전자의 존재가 이러한 개선에 해롭지 않음을 시사한다.
참고문헌
PCT 공개 WO1989/06279호
PCT 공개 WO1990/11352호
PCT 공개 WO1994/18314호
PCT 공개 WO1999/19467호
PCT 공개 WO1999/20726호
PCT 공개 WO1999/20769호
PCT 공개 WO1999/20770호
PCT 공개 WO1999/43794호
PCT 공개 WO2000/29560호
PCT 공개 WO2000/60059호
PCT 공개 WO2001/51643호
PCT 공개 WO2002/14490호
PCT 공개 WO2003/083125호
PCT 공개 WO2003/089604호
PCT 공개 WO2006/037483호
PCT 공개 WO2006/037484호
PCT 공개 WO2006/089107호
PCT 공개 WO2008/112459호
PCT 공개 WO2014/164777호
PCT 공개 WO2019/040412호
PCT 공개 WO2018/156705호
PCT 공개 WO2019/055261호
U.S. 공개 US2014/0329309호
US 특허 4,914,031호
US 특허 4,980,288호
US 특허 5,208,158호
US 특허 5,310,675호
US 특허 5,336,611호
US 특허 5,399,283호
US 특허 5,441,882호
US 특허 5,482,849호
US 특허 5,665,587호
US 특허 5,700,676호
US 특허 5,741 ,694호
US 특허 5,858,757호
US 특허 5,880,080호
US 특허 6,197,567호
US 특허 6,218,165호
US RE34,606
Figure pct00021
Figure pct00022
<110> DANISCO US INC. <120> COMPOSITIONS AND METHODS FOR ENHANCED PROTEIN PRODUCTION IN BACILLUS LICHENIFORMIS <130> NB41684-WO-PCT <160> 158 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 2 <211> 4188 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 2 gtggccccaa aaaagaaacg caaggttatg gataaaaaat acagcattgg tctggatatc 60 ggaaccaaca gcgttgggtg ggcagtaata acagatgaat acaaagtgcc gtcaaaaaaa 120 tttaaggttc tggggaatac agatcgccac agcataaaaa agaatctgat tggggcattg 180 ctgtttgatt cgggtgagac agctgaggcc acgcgtctga aacgtacagc aagaagacgt 240 tacacacgtc gtaaaaatcg tatttgctac ttacaggaaa ttttttctaa cgaaatggcc 300 aaggtagatg atagtttctt ccatcgtctc gaagaatctt ttctggttga ggaagataaa 360 aaacacgaac gtcaccctat ctttggcaat atcgtggatg aagtggccta tcatgaaaaa 420 taccctacga tttatcatct tcgcaagaag ttggttgata gtacggacaa agcggatctg 480 cgtttaatct atcttgcgtt agcgcacatg atcaaatttc gtggtcattt cttaattgaa 540 ggtgatctga atcctgataa ctctgatgtg gacaaattgt ttatacaatt agtgcaaacc 600 tataatcagc tgttcgagga aaaccccatt aatgcctctg gagttgatgc caaagcgatt 660 ttaagcgcga gactttctaa gtcccggcgt ctggagaatc tgatcgccca gttaccaggg 720 gaaaagaaaa atggtctgtt tggtaatctg attgccctca gtctggggct taccccgaac 780 ttcaaatcca attttgacct ggctgaggac gcaaagctgc agctgagcaa agatacttat 840 gatgatgacc tcgacaatct gctcgcccag attggtgacc aatatgcgga tctgtttctg 900 gcagcgaaga atctttcgga tgctatcttg ctgtcggata ttctgcgtgt taataccgaa 960 atcaccaaag cgcctctgtc tgcaagtatg atcaagagat acgacgagca ccaccaggac 1020 ctgactcttc ttaaggcact ggtacgccaa cagcttccgg agaaatacaa agaaatattc 1080 ttcgaccagt ccaagaatgg ttacgcgggc tacatcgatg gtggtgcatc acaggaagag 1140 ttctataaat ttattaaacc aatccttgag aaaatggatg gcacggaaga gttacttgtt 1200 aaacttaacc gcgaagactt gcttagaaag caacgtacat tcgacaacgg ctccatccca 1260 caccagattc atttaggtga acttcacgcc atcttgcgca gacaagaaga tttctatccc 1320 ttcttaaaag acaatcggga gaaaatcgag aagatcctga cgttccgcat tccctattat 1380 gtcggtcccc tggcacgtgg taattctcgg tttgcctgga tgacgcgcaa aagtgaggaa 1440 accatcaccc cttggaactt tgaagaagtc gtggataaag gtgctagcgc gcagtctttt 1500 atagaaagaa tgacgaactt cgataaaaac ttgcccaacg aaaaagtcct gcccaagcac 1560 tctcttttat atgagtactt tactgtgtac aacgaactga ctaaagtgaa atacgttacg 1620 gaaggtatgc gcaaacctgc ctttcttagt ggcgagcaga aaaaagcaat tgtcgatctt 1680 ctctttaaaa cgaatcgcaa ggtaactgta aaacagctga aggaagatta tttcaaaaag 1740 atcgaatgct ttgattctgt cgagatctcg ggtgtcgaag atcgtttcaa cgcttcctta 1800 gggacctatc atgatttgct gaagataata aaagacaaag actttctcga caatgaagaa 1860 aatgaagata ttctggagga tattgttttg accttgacct tattcgaaga tagagagatg 1920 atcgaggagc gcttaaaaac ctatgcccac ctgtttgatg acaaagtcat gaagcaatta 1980 aagcgccgca gatatacggg gtggggccgc ttgagccgca agttgattaa cggtattaga 2040 gacaagcaga gcggaaaaac tatcctggat ttcctcaaat ctgacggatt tgcgaaccgc 2100 aattttatgc agcttataca tgatgattcg cttacattca aagaggatat tcagaaggct 2160 caggtgtctg ggcaaggtga ttcactccac gaacatatag caaatttggc cggctctcct 2220 gcgattaaga aggggatcct gcaaacagtt aaagttgtgg atgaacttgt aaaagtaatg 2280 ggccgccaca agccggagaa tatcgtgata gaaatggcgc gcgagaatca aacgacacaa 2340 aaaggtcaaa agaactcaag agagagaatg aagcgcattg aggaggggat aaaggaactt 2400 ggatctcaaa ttctgaaaga acatccagtt gaaaacactc agctgcaaaa tgaaaaattg 2460 tacctgtact acctgcagaa tggaagagac atgtacgtgg atcaggaatt ggatatcaat 2520 agactctcgg actatgacgt agatcacatt gtccctcaga gcttcctcaa ggatgattct 2580 atagataata aagtacttac gagatcggac aaaaatcgcg gtaaatcgga taacgtccca 2640 tcggaggaag tcgttaaaaa gatgaaaaac tattggcgtc aactgctgaa cgccaagctg 2700 atcacacagc gtaagtttga taatctgact aaagccgaac gcggtggtct tagtgaactc 2760 gataaagcag gatttataaa acggcagtta gtagaaacgc gccaaattac gaaacacgtg 2820 gctcagatcc tcgattctag aatgaataca aagtacgatg aaaacgataa actgatccgt 2880 gaagtaaaag tcattacctt aaaatctaaa cttgtgtccg atttccgcaa agattttcag 2940 ttttacaagg tccgggaaat caataactat caccatgcac atgatgcata tttaaatgcg 3000 gttgtaggca cggcccttat taagaaatac cctaaactcg aaagtgagtt tgtttatggg 3060 gattataaag tgtatgacgt tcgcaaaatg atcgcgaaat cagaacagga aatcggtaag 3120 gctaccgcta aatacttttt ttattccaac attatgaatt tttttaagac cgaaataact 3180 ctcgcgaatg gtgaaatccg taaacggcct cttatagaaa ccaatggtga aacgggagaa 3240 atcgtttggg ataaaggtcg tgactttgcc accgttcgta aagtcctctc aatgccgcaa 3300 gttaacattg tcaagaagac ggaagttcaa acagggggat tctccaaaga atctatcctg 3360 ccgaagcgta acagtgataa acttattgcc agaaaaaaag attgggatcc aaaaaaatac 3420 ggaggctttg attcccctac cgtcgcgtat agtgtgctgg tggttgctaa agtcgagaaa 3480 gggaaaagca agaaattgaa atcagttaaa gaactgctgg gtattacaat tatggaaaga 3540 tcgtcctttg agaaaaatcc gatcgacttt ttagaggcca aggggtataa ggaagtgaaa 3600 aaagatctca tcatcaaatt accgaagtat agtctttttg agctggaaaa cggcagaaaa 3660 agaatgctgg cctccgcggg cgagttacag aagggaaatg agctggcgct gccttccaaa 3720 tatgttaatt ttctgtacct tgccagtcat tatgagaaac tgaagggcag ccccgaagat 3780 aacgaacaga aacaattatt cgtggaacag cataagcact atttagatga aattatagag 3840 caaattagtg aattttctaa gcgcgttatc ctcgcggatg ctaatttaga caaagtactg 3900 tcagcttata ataaacatcg ggataagccg attagagaac aggccgaaaa tatcattcat 3960 ttgtttacct taaccaacct tggagcacca gctgccttca aatatttcga taccacaatt 4020 gatcgtaaac ggtatacaag tacaaaagaa gtcttggacg caaccctcat tcatcaatct 4080 attactggat tatatgagac acgcattgat ctttcacagc tgggcggaga caagaagaaa 4140 aaactgaaac tgcaccatca tcaccatcat catcaccatc attgataa 4188 <210> 3 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 3 Ala Pro Lys Lys Lys Arg Lys Val 1 5 <210> 4 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 4 Lys Lys Lys Lys Leu Lys 1 5 <210> 5 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 5 His His His His His His His His His His 1 5 10 <210> 6 <211> 607 <212> DNA <213> Bacillus subtilis <400> 6 attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60 aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120 aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180 cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240 atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300 cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360 taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420 ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480 aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540 aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600 gtaacta 607 <210> 7 <211> 247 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 7 acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct ccgcatgttc 60 aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa acggcgggtt 120 gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg cttcccggtt 180 tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg agacggcatt 240 cgtaatc 247 <210> 8 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 8 atatatgagt aaacttggtc tgacagaatt cctccatttt cttctgctat 50 <210> 9 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 9 tgcggccgcg aattcgatta cgaatgccgt ctccc 35 <210> 10 <211> 3290 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 10 gaattcgcgg ccgcacgcgt ccatggggat ccccgcgggt cgacctcgag agttacgcta 60 gggataacag ggtaatatag gagctccagt cggcttaaac cagttttcgc tggtgcgaaa 120 aaagagtgtc ttgtgacacc taaattcaaa atctatcggt cagatttata ccgatttgat 180 tttatatatt cttgaataac atacgccgag ttatcacata aaagcgggaa ccaatcataa 240 aatttaaact tcattgcata atccattaaa ctcttaaatt ctacgattcc ttgttcatca 300 ataaactcaa tcatttcttt aattaattta tatctatctg ttgttgtttt ctttaataat 360 tcattaacat ctacaccgcc ataaactatc atatcttctt tttgatattt aaatttatta 420 ggatcgtcca tgtgaagcat atatctcaca agacctttca cacttcctgc aatctgcgga 480 atagtcgcat tcaattcttc tgttaattat ttttatctgt tcataagatt tattaccctc 540 atacatcact agaatatgat aatgctcttt tttcatccta ccttctgtat cagtatccct 600 atcatgtaat ggagacacta caaattgaat gtgtaactct tttaaatact ctaaccactc 660 ggcttttgct gattctggat ataaaacaaa tgtccaatta cgtcctcttg aatttttctt 720 gttttcagtt tcttttatta cattttcgct catgatataa taacggtgct aatacactta 780 acaaaattta gtcatagata ggcagcatgc cagtgctgtc tatctttttt tgtttaaaat 840 gcaccgtatt cctcctttgc atattttttt attagaatac cggttgcatc tgatttgcta 900 atattatatt tttctttgat tctatttaat atctcatttt cttctgttgt aagtcttaaa 960 gtaacagcaa cttttttctc ttcttttcta tctacaacta tcactgtacc tcccaacatc 1020 tgtttttttc actttaacat aaaaaacaac cttttaacat taaaaaccca atatttattt 1080 atttgtttgg acaatggaca ctggacacct aggggggagg tcgtagtacc cccctatgtt 1140 ttctccccta aataacccca aaaatctaag aaaaaaagac ctcaaaaagg tctttaatta 1200 acatctcaaa tttcgcattt attccaattt cctttttgcg tgtgatgcga gctcatcggc 1260 tccgtcgata ctatgttata cgccaacttt caaaacaact ttgaaaaagc tgttttctgg 1320 tatttaaggt tttagaatgc aaggaacagt gaattggagt tcgtcttgtt ataattagct 1380 tcttggggta tctttaaata ctgtagaaaa gaggaaggaa ataataaatg gctaaaatga 1440 gaatatcacc ggaattgaaa aaactgatcg aaaaataccg ctgcgtaaaa gatacggaag 1500 gaatgtctcc tgctaaggta tataagctgg tgggagaaaa tgaaaaccta tatttaaaaa 1560 tgacggacag ccggtataaa gggaccacct atgatgtgga acgggaaaag gacatgatgc 1620 tatggctgga aggaaagctg cctgttccaa aggtcctgca ctttgaacgg catgatggct 1680 ggagcaatct gctcatgagt gaggccgatg gcgtcctttg ctcggaagag tatgaagatg 1740 aacaaagccc tgaaaagatt atcgagctgt atgcggagtg catcaggctc tttcactcca 1800 tcgacatatc ggattgtccc tatacgaata gcttagacag ccgcttagcc gaattggatt 1860 acttactgaa taacgatctg gccgatgtgg attgcgaaaa ctgggaagaa gacactccat 1920 ttaaagatcc gcgcgagctg tatgattttt taaagacgga aaagcccgaa gaggaacttg 1980 tcttttccca cggcgacctg ggagacagca acatctttgt gaaagatggc aaagtaagtg 2040 gctttattga tcttgggaga agcggcaggg cggacaagtg gtatgacatt gccttctgcg 2100 tccggtcgat cagggaggat atcggggaag aacagtatgt cgagctattt tttgacttac 2160 tggggatcaa gcctgattgg gagaaaataa aatattatat tttactggat gaattgtttt 2220 agtgactgca gtgagatctg gtaatgactc tctagcttga ggcatcaaat aaaacgaaag 2280 gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 2340 agtaggacaa atccgccgct ctagctaagc agaaggccat cctgacggat ggcctttttg 2400 cgtttctaca aactcttgtt aactctagag ctgcctgccg cgtttcggtg atgaagatct 2460 tcccgatgat taattaattc agaacgctcg gttgccgccg ggcgtttttt atgaagcttc 2520 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2580 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2640 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2700 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2760 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2820 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2880 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 2940 gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 3000 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3060 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3120 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3180 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3240 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3290 <210> 11 <211> 4204 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 11 gcggccgcac gcgtccatgg ggatccccgc gggtcgacct cgagagttac gctagggata 60 acagggtaat ataggagctc cagtcggctt aaaccagttt tcgctggtgc gaaaaaagag 120 tgtcttgtga cacctaaatt caaaatctat cggtcagatt tataccgatt tgattttata 180 tattcttgaa taacatacgc cgagttatca cataaaagcg ggaaccaatc ataaaattta 240 aacttcattg cataatccat taaactctta aattctacga ttccttgttc atcaataaac 300 tcaatcattt ctttaattaa tttatatcta tctgttgttg ttttctttaa taattcatta 360 acatctacac cgccataaac tatcatatct tctttttgat atttaaattt attaggatcg 420 tccatgtgaa gcatatatct cacaagacct ttcacacttc ctgcaatctg cggaatagtc 480 gcattcaatt cttctgttaa ttatttttat ctgttcataa gatttattac cctcatacat 540 cactagaata tgataatgct cttttttcat cctaccttct gtatcagtat ccctatcatg 600 taatggagac actacaaatt gaatgtgtaa ctcttttaaa tactctaacc actcggcttt 660 tgctgattct ggatataaaa caaatgtcca attacgtcct cttgaatttt tcttgttttc 720 agtttctttt attacatttt cgctcatgat ataataacgg tgctaataca cttaacaaaa 780 tttagtcata gataggcagc atgccagtgc tgtctatctt tttttgttta aaatgcaccg 840 tattcctcct ttgcatattt ttttattaga ataccggttg catctgattt gctaatatta 900 tatttttctt tgattctatt taatatctca ttttcttctg ttgtaagtct taaagtaaca 960 gcaacttttt tctcttcttt tctatctaca actatcactg tacctcccaa catctgtttt 1020 tttcacttta acataaaaaa caacctttta acattaaaaa cccaatattt atttatttgt 1080 ttggacaatg gacactggac acctaggggg gaggtcgtag taccccccta tgttttctcc 1140 cctaaataac cccaaaaatc taagaaaaaa agacctcaaa aaggtcttta attaacatct 1200 caaatttcgc atttattcca atttcctttt tgcgtgtgat gcgagctcat cggctccgtc 1260 gatactatgt tatacgccaa ctttcaaaac aactttgaaa aagctgtttt ctggtattta 1320 aggttttaga atgcaaggaa cagtgaattg gagttcgtct tgttataatt agcttcttgg 1380 ggtatcttta aatactgtag aaaagaggaa ggaaataata aatggctaaa atgagaatat 1440 caccggaatt gaaaaaactg atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt 1500 ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa cctatattta aaaatgacgg 1560 acagccggta taaagggacc acctatgatg tggaacggga aaaggacatg atgctatggc 1620 tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga acggcatgat ggctggagca 1680 atctgctcat gagtgaggcc gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa 1740 gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag gctctttcac tccatcgaca 1800 tatcggattg tccctatacg aatagcttag acagccgctt agccgaattg gattacttac 1860 tgaataacga tctggccgat gtggattgcg aaaactggga agaagacact ccatttaaag 1920 atccgcgcga gctgtatgat tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt 1980 cccacggcga cctgggagac agcaacatct ttgtgaaaga tggcaaagta agtggcttta 2040 ttgatcttgg gagaagcggc agggcggaca agtggtatga cattgccttc tgcgtccggt 2100 cgatcaggga ggatatcggg gaagaacagt atgtcgagct attttttgac ttactgggga 2160 tcaagcctga ttgggagaaa ataaaatatt atattttact ggatgaattg ttttagtgac 2220 tgcagtgaga tctggtaatg actctctagc ttgaggcatc aaataaaacg aaaggctcag 2280 tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2340 acaaatccgc cgctctagct aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 2400 tacaaactct tgttaactct agagctgcct gccgcgtttc ggtgatgaag atcttcccga 2460 tgattaatta attcagaacg ctcggttgcc gccgggcgtt ttttatgaag cttcgttgct 2520 ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2580 gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2640 cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2700 gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2760 tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2820 cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2880 cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2940 gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3000 agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3060 cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3120 tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3180 tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 3240 ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 3300 cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 3360 cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 3420 accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 3480 ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 3540 ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 3600 tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 3660 acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 3720 tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 3780 actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 3840 ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 3900 aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 3960 ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 4020 cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 4080 aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 4140 actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgga 4200 attc 4204 <210> 12 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 12 gggagacggc attcgtaatc gaattcgcgg ccgca 35 <210> 13 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 13 atagcagaag aaaatggagg aattctgtca gaccaagttt actcatatat 50 <210> 14 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 14 ccgactggag ctcctatatt acc 23 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 15 gctgtggcga tctgtattcc 20 <210> 16 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 16 gtcttttaag taagtctact ct 22 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 17 ccaaagcgat tttaagcgcg 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 18 cctggcacgt ggtaattctc 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 19 ggatttcctc aaatctgacg 20 <210> 20 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 20 gtagaaacgc gccaaattac g 21 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 21 gctggtggtt gctaaagtcg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 22 ggacgcaacc ctcattcatc 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 23 caggcatccg atttgcaagg 20 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 24 gcaagcagca gattacgcg 19 <210> 25 <211> 8347 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 25 gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60 tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120 taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180 ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240 gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300 agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360 tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420 tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480 ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540 acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600 gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660 ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720 tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780 ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840 agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900 gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960 gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020 catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080 gcggatctgc gtttaatcta tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140 ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200 gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260 aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320 ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380 accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440 gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500 ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560 aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620 caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680 gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740 caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800 ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860 tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920 ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980 ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040 agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100 cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160 cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220 tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280 gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340 ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400 gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460 aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520 agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580 aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640 ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700 gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760 cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820 ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880 aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940 acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000 aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060 gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120 gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180 gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240 aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300 gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360 agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420 aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480 ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540 gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600 ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660 gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720 atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780 gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840 acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900 atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960 tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020 aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080 gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140 atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200 gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260 ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320 ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380 cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440 attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500 aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560 atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620 accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680 catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740 aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800 gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040 agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 5220 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 5280 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 5340 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 5400 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 5460 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 5520 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 5580 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 5640 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 5700 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 5760 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 5820 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 5880 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 5940 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 6000 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 6060 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 6120 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 6180 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 6240 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 6300 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 6360 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 6420 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 6480 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 6540 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 6600 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 6660 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 6720 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 6780 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 6840 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 6900 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 6960 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 7020 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 7080 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 7140 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 7200 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 7260 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 7320 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 7380 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 7440 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 7500 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 7560 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 8040 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340 tctgaca 8347 <210> 26 <211> 9724 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 26 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720 gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780 ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840 taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900 ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960 aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020 actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080 tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140 tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200 caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260 ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320 gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380 atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440 gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500 aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560 gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620 tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 27 <211> 9724 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 27 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720 atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780 tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840 actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900 tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960 caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020 ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080 ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140 ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200 ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260 tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320 tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380 aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440 agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500 cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560 tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620 ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 28 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 28 ctcgacttcg aatacatcca 20 <210> 29 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 29 gatgccatca gttcctcata 20 <210> 30 <211> 1578 <212> DNA <213> Bacillus licheniformis <400> 30 atgtttcgag tattggtctc agataaaatg tccagcgacg gcctcaaacc attaatggaa 60 gcagatttta ttgaaattgt agaaaagaat gttgcggaag cggaagacga gcttcatacg 120 tttgacgcgc tcttggtgcg gagcgccacg aaggtaaccg aagagctgtt taaaaagatg 180 acttcgctga aaatcgtcgc cagagcaggt gtcggcgtcg acaatatcga tattgacgag 240 gcgacaaaac acggtgttat cgtcgtaaac gcgccaaacg ggaatacaat ttcaaccgct 300 gaacatacct ttgcaatgtt ttcagcgtta atgagacata ttccgcaggc aaacatctcc 360 gtgaaatcaa gggagtggaa tcgttcggct tacgtcggtt cagagcttta cggaaaaacg 420 ctcggcatca tcggaatggg ccgcatcgga agcgaaatcg cgagccgcgc aaaagcattc 480 ggtatgaccg ttcatgtatt tgacccgttc ctgacccaag aaagggcaag caagctcggc 540 gttaacgcga acagctttga agaagttctg gcatgcgccg acatcattac ggttcatacc 600 ccgctcacga aagaaacgaa gggacttttg aacaaagaaa ccatcgcaaa aacgaaaaaa 660 ggcgttcgtc tcgttaactg tgcaagaggc ggcatcatcg atgaagcagc gcttttggaa 720 gctctggaaa gcggacatgt cgctggcgct gccttggatg tattcgaagt cgagcctccg 780 gtcgattcaa aactgatcga tcatccgctt gtagtcgcga ctcctcactt gggcgcctca 840 acaaaagaag cccagctgaa tgtcgctgca caagtgtccg aagaagtcct tcagtatgcg 900 caaggaaacc ctgtgatgtc cgcgatcaac cttccggcca tgacaaagga ttcattcgaa 960 aaaatccagc cttatcatca gtttgccaat acgatcggaa accttgtgtc tcagtgcatg 1020 aatgagcctg ttcaagatgt agccatccaa tatgaaggct ccatcgccaa acttgaaacg 1080 tcatttatta cgaaaagcct tttggccgga tttctgaagc cgagggtcgc ggctaccgtt 1140 aacgaagtga atgccggcac cgttgcgaaa gagcgcggca tcagcttcag cgaaaaaatt 1200 tcttccaatg agtcaggcta tgaaaactgc atctctgtga ctgtcacggg agatgtaaca 1260 acattctctt taagagcgac gtacattccg cacttcggcg gacgcatcgt tgccttaaac 1320 ggctttgata ttgattttta tccggctgga caccttgtct acattcacca ccaggataaa 1380 ccaggggcta tcggccatgt cggacgaatt ttaggagacc atgacatcaa tatcgccact 1440 atgcaggtag gccgaaaaga aaaaggcgga gaagcgatca tgatgctttc ctttgaccgc 1500 caccttgagg acgatatttt agctgagctg aaaaacatcc cggatatcgt gtctgttaaa 1560 gccatcgacc ttccttaa 1578 <210> 31 <211> 3 <212> DNA <213> Bacillus licheniformis <400> 31 agg 3 <210> 32 <211> 20 <212> DNA <213> Bacillus licheniformis <400> 32 ctcgacttcg aatacatcca 20 <210> 33 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 33 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgc 76 <210> 34 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> synthetic <400> 34 cucgacuucg aauacaucca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 35 <211> 224 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 35 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tgga 224 <210> 36 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 36 gactcctgtt gatagatcca gtaatgacct cagaactcca tctggatttg ttcagaacgc 60 tcggttgccg ccgggcgttt tttattggtg agaat 95 <210> 37 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 37 aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60 tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120 ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180 gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240 gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300 aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360 ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420 gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480 tatttaggag gaaatcttac 500 <210> 38 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 38 tgagtaaact tggtctgaca aatggttctt tcccctgtcc 40 <210> 39 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 39 aggttccgca gcttctgtgt aagatttcct cctaaataag cgtcat 46 <210> 40 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 40 acagaagctg cggaacctga aaagaattcc tttcaggttc cgtttttttt aggaattctc 60 cctgatctca agcatctggc ggggataaat ccgctctcct ttcaaatcgt tccattcttt 120 gaggcgctgt acagttacgc ccattttttc ggcgatatga tgaagcgtat cccctttccg 180 cactacatat gtaccggtct tcgattcatc gtcatgaagg cggagtgttt ggccggcctt 240 gagatttgaa tgtttcaacc cgtttattct catgatctcc tcgatggata taccgctatc 300 cttgctgatt ctccagagcg tgtccccttt ttgaacggtc accgcaccgc tcattgtccc 360 ggcgttttga taaacgtgga tagaattttg ccggaacgcc tcctcacgaa gcaccgtcag 420 cggattgatt gcatatcttt tatcttcagt ccatgaaccg tgatgcattt caaaatgcag 480 gtgggttccg gtcgatattc 500 <210> 41 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 41 atgacgctta tttaggagga aatcttacac agaagctgcg gaacct 46 <210> 42 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 42 cagaagaaaa tggaggaatt cgaatatcga ccggaaccca c 41 <210> 43 <211> 415 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 43 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415 <210> 44 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 44 aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60 tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120 ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180 gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240 gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300 aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360 ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420 gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480 tatttaggag gaaatcttac acagaagctg cggaacctga aaagaattcc tttcaggttc 540 cgtttttttt aggaattctc cctgatctca agcatctggc ggggataaat ccgctctcct 600 ttcaaatcgt tccattcttt gaggcgctgt acagttacgc ccattttttc ggcgatatga 660 tgaagcgtat cccctttccg cactacatat gtaccggtct tcgattcatc gtcatgaagg 720 cggagtgttt ggccggcctt gagatttgaa tgtttcaacc cgtttattct catgatctcc 780 tcgatggata taccgctatc cttgctgatt ctccagagcg tgtccccttt ttgaacggtc 840 accgcaccgc tcattgtccc ggcgttttga taaacgtgga tagaattttg ccggaacgcc 900 tcctcacgaa gcaccgtcag cggattgatt gcatatcttt tatcttcagt ccatgaaccg 960 tgatgcattt caaaatgcag gtgggttccg gtcgatattc 1000 <210> 45 <211> 402 <212> DNA <213> Bacillus licheniformis <400> 45 atgacgaact ttggacacca tttacgacaa ttaagggaac ggaaaaaact gaccgtcaat 60 caactggcga tgtattccgg cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag 120 cgcggcgtgc cgaagccggc gacgatcaga aaactggcgg acgctttgaa agtcccgtat 180 gaggaactga tggcatctgc aggctatatc agcgcgtcta cagtccagga agcaagaagc 240 agctatgatt ccatttacga catcgtgtca cagtacgatt tagaggacct ttctctgttt 300 gacagcgaaa agtggaaggt gctttcaaaa aaagacatcg aaaacctgga caaatatttc 360 gactttctcg tgcaggaagc aagcagccga aacaaaaact ga 402 <210> 46 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 46 cgg 3 <210> 47 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> synthetic <400> 47 gaugccauca guuccucaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 48 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 48 ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60 ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120 acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180 catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240 cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300 gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360 taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420 tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480 gagattgcga ggttttggcc 500 <210> 49 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 49 tgagtaaact tggtctgaca ttgatattca gcaccctgcg 40 <210> 50 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 50 tgtgccgcgg agaagtatgg ccaaaacctc gcaatctc 38 <210> 51 <211> 500 <212> DNA <213> Bacillus licheniformis <400> 51 atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga tcctgctgtt 60 attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt tcctatagtc 120 aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga tgacaaggtt 180 cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc agcttgccat 240 gtatgccggt gtgagcgccg cagccatttc cagagccgca gccatttcca gaatcgaaaa 300 cggccaccgc ggcgttccca agcccgcgac gatcagaaaa ttggccgagg ctctgaaaat 360 gccgtacgag cagctcatgg atattgccgg ttatatgaga gctgacgaga ttcgcgaaca 420 gccgcgcggc tatgtcacga tgcaggagat cgcggccaag cacggcgtcg aagacctgtg 480 gctgtttaaa cccgagaaat 500 <210> 52 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 52 gagattgcga ggttttggcc atacttctcc gcggcaca 38 <210> 53 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 53 cagaagaaaa tggaggaatt catttctcgg gtttaaacag ccac 44 <210> 54 <211> 415 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 54 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415 <210> 55 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 55 ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60 ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120 acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180 catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240 cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300 gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360 taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420 tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480 gagattgcga ggttttggcc atacttctcc gcggcacact ctcctctcta tcattttcgt 540 ctgtttacga tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg 600 tctaagtatt tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg 660 gggatggcga tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg 720 tcggttaatc agcttgccat gtatgccggt gtgagcgccg cagccatttc cagagccgca 780 gccatttcca gaatcgaaaa cggccaccgc ggcgttccca agcccgcgac gatcagaaaa 840 ttggccgagg ctctgaaaat gccgtacgag cagctcatgg atattgccgg ttatatgaga 900 gctgacgaga ttcgcgaaca gccgcgcggc tatgtcacga tgcaggagat cgcggccaag 960 cacggcgtcg aagacctgtg gctgtttaaa cccgagaaat 1000 <210> 56 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 56 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 57 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 57 gatctgcgtt taatccatct tgcgttagcg cac 33 <210> 58 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 58 gtgcgctaac gcaagatgga ttaaacgcag atc 33 <210> 59 <211> 9724 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 59 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240 tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720 gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780 ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840 taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900 ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960 aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020 actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080 tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140 tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200 caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260 ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320 gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380 atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440 gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500 aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560 gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620 tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 60 <211> 5055 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 60 attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60 aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120 aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180 cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240 atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300 cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360 taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420 ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480 aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540 aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600 gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660 ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720 aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780 ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840 aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattt tttctaacga 900 aatggccaag gtagatgata gtttcttcca tcgtctcgaa gaatcttttc tggttgagga 960 agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020 tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080 ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140 aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200 gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260 agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320 accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380 cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440 tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500 gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560 taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620 ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680 aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740 ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800 acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860 catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920 ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980 ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040 tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100 gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160 caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220 cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280 cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340 caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400 ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460 tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520 agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580 gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640 tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700 gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760 gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820 ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880 agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940 gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000 ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060 aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120 tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180 tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240 cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300 caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360 tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420 acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480 gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540 ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600 aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660 ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720 cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780 aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840 gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900 gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960 tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020 aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080 cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140 ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200 agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260 cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320 ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380 cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440 tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500 agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560 cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620 cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680 tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740 gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataactcga 4800 gaaagcttac ataaaaaacc ggccttggcc ccgccggttt tttattattt ttcttcctcc 4860 gcatgttcaa tccgctccat aatcgacgga tggctccctc tgaaaatttt aacgagaaac 4920 ggcgggttga cccggctcag tcccgtaacg gccaagtcct gaaacgtctc aatcgccgct 4980 tcccggtttc cggtcagctc aatgccgtaa cggtcggcgg cgttttcctg ataccgggag 5040 acggcattcg taatc 5055 <210> 61 <211> 9724 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 61 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240 catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720 atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780 tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840 actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900 tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960 caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020 ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080 ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140 ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200 ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260 tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320 tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380 aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440 agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500 cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560 tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620 ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 62 <211> 8352 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 62 gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60 tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120 taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180 ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240 gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300 agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360 tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420 tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480 ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540 acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600 gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660 ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720 tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780 ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840 agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900 gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960 gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020 catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080 gcggatctgc gtttaatcca tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140 ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200 gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260 aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320 ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380 accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440 gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500 ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560 aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620 caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680 gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740 caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800 ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860 tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920 ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980 ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040 agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100 cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160 cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220 tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280 gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340 ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400 gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460 aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520 agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580 aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640 ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700 gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760 cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820 ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880 aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940 acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000 aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060 gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120 gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180 gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240 aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300 gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360 agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420 aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480 ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540 gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600 ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660 gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720 atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780 gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840 acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900 atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960 tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020 aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080 gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140 atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200 gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260 ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320 ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380 cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440 attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500 aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560 atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620 accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680 catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740 aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800 gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040 agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacactctt aaattcaaaa tctatcggtc 5220 agatttatac cgatttgatt ttatatattc ttgaataaca tacgccgagt tatcacataa 5280 aagcgggaac caatcataaa atttaaactt cattgcataa tccattaaac tcttaaattc 5340 tacgattcct tgttcatcaa taaactcaat catttcttta attaatttat atctatctgt 5400 tgttgttttc tttaataatt cattaacatc tacaccgcca taaactatca tatcttcttt 5460 ttgatattta aatttattag gatcgtccat gtgaagcata tatctcacaa gacctttcac 5520 acttcctgca atctgcggaa tagtcgcatt caattcttct gtaattattt ttatctgttc 5580 ataagattta ttaccctcat acatcactag aatatgataa tgctcttttt tcatcctacc 5640 ttctgtatca gtatccctat catgtaatgg agacactaca aattgaatgt gtaactcttt 5700 taaatactct aaccactcgg cttttgctga ttctggatat aaaacaaatg tccaattacg 5760 tcctcttgaa tttttcttgt tttcagtttc ttttattaca ttttcgctca tgatataata 5820 acggtgctaa tacacttaac aaaatttagt catagatagg cagcatgcca gtgctgtcta 5880 tctttttttg tttaaaatgc accgtattcc tcctttgcat atttttttat tagaataccg 5940 gttgcatctg atttgctaat attatatttt tctttgattc tatttaatat ctcattttct 6000 tctgttgtaa gtcttaaagt aacagcaact tttttctctt cttttctatc tacaactatc 6060 actgtacctc ccaacatctg tttttttcac tttaacataa aaaacaacct tttaacatta 6120 aaaacccaat atttatttat ttgtttggac aatggacact ggacacctag gggggaggtc 6180 gtagtacccc cctatgtttt ctcccctaaa taaccccaaa aatctaagaa aaaaagacct 6240 caaaaaggtc tttaattaac atctcaaatt tcgcatttat tccaatttcc tttttgcgtg 6300 tgatgcgagc tcatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 6360 gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 6420 gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 6480 aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 6540 gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 6600 aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 6660 gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 6720 ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 6780 cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 6840 tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 6900 gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 6960 gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 7020 agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 7080 aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt 7140 atgacattgc cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg 7200 agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 7260 tactggatga attgttttag tgactgcagt cgggaagatc tggtaatgac tctctagctt 7320 gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg 7380 tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ctctagctaa gcagaaggcc 7440 atcctgacgg atggcctttt tgcgtttcta caaactcttg ttaactctag agctgcctgc 7500 cgcgtttcgg tgatgaagat cttcccgatg attaattaat tcagaacgct cggttgccgc 7560 cgggcgtttt ttatgaagct tcgttgctgg cgtttttcca taggctccgc ccccctgacg 7620 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7680 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7740 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7800 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaccccc 7860 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7920 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7980 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 8040 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 8100 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 8160 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 8220 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 8280 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 8340 cttggtctga ca 8352 <210> 63 <211> 498 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 63 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 60 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 120 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 180 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 240 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 300 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 360 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 420 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 480 agaaaaatgg tctgtttg 498 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 64 cacgtcgtaa aaatcgtatt 20 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 65 caaacagacc atttttcttt 20 <210> 66 <211> 7888 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 66 aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta ccccgaactt 60 caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag atacttatga 120 tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc tgtttctggc 180 agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta ataccgaaat 240 caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc accaggacct 300 gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag aaatattctt 360 cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac aggaagagtt 420 ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt tacttgttaa 480 acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct ccatcccaca 540 ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt tctatccctt 600 cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc cctattatgt 660 cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa gtgaggaaac 720 catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc agtcttttat 780 agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc ccaagcactc 840 tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat acgttacgga 900 aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg tcgatcttct 960 ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt tcaaaaagat 1020 cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg cttccttagg 1080 gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca atgaagaaaa 1140 tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata gagagatgat 1200 cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga agcaattaaa 1260 gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg gtattagaga 1320 caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg cgaaccgcaa 1380 ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc agaaggctca 1440 ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg gctctcctgc 1500 gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa aagtaatggg 1560 ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa cgacacaaaa 1620 aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa aggaacttgg 1680 atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg aaaaattgta 1740 cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg atatcaatag 1800 actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg atgattctat 1860 agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata acgtcccatc 1920 ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg ccaagctgat 1980 cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta gtgaactcga 2040 taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga aacacgtggc 2100 tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac tgatccgtga 2160 agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag attttcagtt 2220 ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt taaatgcggt 2280 tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg tttatgggga 2340 ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa tcggtaaggc 2400 taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg aaataactct 2460 cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa cgggagaaat 2520 cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa tgccgcaagt 2580 taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat ctatcctgcc 2640 gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa aaaaatacgg 2700 aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag tcgagaaagg 2760 gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta tggaaagatc 2820 gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg aagtgaaaaa 2880 agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg gcagaaaaag 2940 aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc cttccaaata 3000 tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc ccgaagataa 3060 cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa ttatagagca 3120 aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca aagtactgtc 3180 agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata tcattcattt 3240 gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata ccacaattga 3300 tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc atcaatctat 3360 tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca agaagaaaaa 3420 actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg agaaagctta 3480 cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc cgcatgttca 3540 atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa cggcgggttg 3600 acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc ttcccggttt 3660 ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga gacggcattc 3720 gtaatcgaat tcgcggccgc acgcgtccat ggggatcccc gcgggtcgac ctcgagagtt 3780 acgctaggga taacagggta atataggagc tccagtcggc ttaaaccagt tttcgctggt 3840 gcgaaaaaag agtgtcttgt gacacctaaa ttcaaaatct atcggtcaga tttataccga 3900 tttgatttta tatattcttg aataacatac gccgagttat cacataaaag cgggaaccaa 3960 tcataaaatt taaacttcat tgcataatcc attaaactct taaattctac gattccttgt 4020 tcatcaataa actcaatcat ttctttaatt aatttatatc tatctgttgt tgttttcttt 4080 aataattcat taacatctac accgccataa actatcatat cttctttttg atatttaaat 4140 ttattaggat cgtccatgtg aagcatatat ctcacaagac ctttcacact tcctgcaatc 4200 tgcggaatag tcgcattcaa ttcttctgtt aattattttt atctgttcat aagatttatt 4260 accctcatac atcactagaa tatgataatg ctcttttttc atcctacctt ctgtatcagt 4320 atccctatca tgtaatggag acactacaaa ttgaatgtgt aactctttta aatactctaa 4380 ccactcggct tttgctgatt ctggatataa aacaaatgtc caattacgtc ctcttgaatt 4440 tttcttgttt tcagtttctt ttattacatt ttcgctcatg atataataac ggtgctaata 4500 cacttaacaa aatttagtca tagataggca gcatgccagt gctgtctatc tttttttgtt 4560 taaaatgcac cgtattcctc ctttgcatat ttttttatta gaataccggt tgcatctgat 4620 ttgctaatat tatatttttc tttgattcta tttaatatct cattttcttc tgttgtaagt 4680 cttaaagtaa cagcaacttt tttctcttct tttctatcta caactatcac tgtacctccc 4740 aacatctgtt tttttcactt taacataaaa aacaaccttt taacattaaa aacccaatat 4800 ttatttattt gtttggacaa tggacactgg acacctaggg gggaggtcgt agtacccccc 4860 tatgttttct cccctaaata accccaaaaa tctaagaaaa aaagacctca aaaaggtctt 4920 taattaacat ctcaaatttc gcatttattc caatttcctt tttgcgtgtg atgcgagctc 4980 atcggctccg tcgatactat gttatacgcc aactttcaaa acaactttga aaaagctgtt 5040 ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt cttgttataa 5100 ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa taaatggcta 5160 aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc gtaaaagata 5220 cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa aacctatatt 5280 taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg gaaaaggaca 5340 tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt gaacggcatg 5400 atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg gaagagtatg 5460 aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc aggctctttc 5520 actccatcga catatcggat tgtccctata cgaatagctt agacagccgc ttagccgaat 5580 tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg gaagaagaca 5640 ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag cccgaagagg 5700 aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa gatggcaaag 5760 taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat gacattgcct 5820 tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag ctattttttg 5880 acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta ctggatgaat 5940 tgttttagtg actgcagtga gatctggtaa tgactctcta gcttgaggca tcaaataaaa 6000 cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 6060 ctcctgagta ggacaaatcc gccgctctag ctaagcagaa ggccatcctg acggatggcc 6120 tttttgcgtt tctacaaact cttgttaact ctagagctgc ctgccgcgtt tcggtgatga 6180 agatcttccc gatgattaat taattcagaa cgctcggttg ccgccgggcg ttttttatga 6240 agcttcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 6300 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 6360 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 6420 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 6480 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 6540 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 6600 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 6660 gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 6720 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 6780 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 6840 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 6900 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 6960 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagaat 7020 tcctccattt tcttctgcta tcaaaataac agactcgtga ttttccaaac gagctttcaa 7080 aaaagcctct gccccttgca aatcggatgc ctgtctataa aattcccgat attggttaaa 7140 cagcggcgca atggcggccg catctgatgt ctttgcttgg cgaatgttca tcttatttct 7200 tcctccctct caataatttt ttcattctat cccttttctg taaagtttat ttttcagaat 7260 acttttatca tcatgctttg aaaaaatatc acgataatat ccattgttct cacggaagca 7320 cacgcaggtc atttgaacga attttttcga caggaatttg ccgggactca ggagcattta 7380 acctaaaaaa gcatgacatt tcagcataat gaacatttac tcatgtctat tttcgttctt 7440 ttctgtatga aaatagttat ttcgagtctc tacggaaata gcgagagatg atatacctaa 7500 atagagataa aatcatctca aaaaaatggg tctactaaaa tattattcca tctattacaa 7560 taaattcaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 7620 aactagtggc cccaaaaaag aaacgcaagg ttatggataa aaaatacagc attggtctgg 7680 atatcggaac caacagcgtt gggtgggcag taataacaga tgaatacaaa gtgccgtcaa 7740 aaaaatttaa ggttctgggg aatacagatc gccacagcat aaaaaagaat ctgattgggg 7800 cattgctgtt tgattcgggt gagacagctg aggccacgcg tctgaaacgt acagcaagaa 7860 gacgttacac acgtcgtaaa aatcgtat 7888 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 67 aaagaaaaat ggtctgtttg 20 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 68 aatacgattt ttacgacgtg 20 <210> 69 <211> 9790 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 69 gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60 tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120 taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180 ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240 gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300 agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360 tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420 tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480 ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540 acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600 gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660 ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720 tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780 ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840 agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900 gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960 gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020 catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080 gcggatctgc gtttaatcca tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140 ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200 gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260 aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320 ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380 accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440 gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500 ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560 aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620 caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680 gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740 caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800 ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860 tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920 ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980 ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040 agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100 cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160 cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220 tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280 gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340 ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400 gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460 aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520 agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580 aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640 ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700 gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760 cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820 ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880 aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940 acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000 aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060 gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120 gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180 gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240 aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300 gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360 agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420 aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480 ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540 gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600 ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660 gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720 atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780 gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840 acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900 atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960 tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020 aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080 gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140 atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200 gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260 ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320 ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380 cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440 attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500 aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560 atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620 accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680 catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740 aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800 gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040 agacggcatt cgtaatcggg tgaagtggtc aagacctcac taggcacctt aaaaatagcg 5100 caccctgaag aagatttatt tgaggtagcc cttgcctacc tagcttccaa gaaagatatc 5160 ctaacagcac aagagcggaa agatgttttg ttctacatcc agaacaacct ctgctaaaat 5220 tcctgaaaaa ttttgcaaaa agttgttgac tttatctaca aggtgtggca taatgtgtgg 5280 aagaatcgaa aacggccacc ggttttagag ctagaaatag caagttaaaa taaggctagt 5340 ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgac tcctgttgat agatccagta 5400 atgacctcag aactccatct ggatttgttc agaacgctcg gttgccgccg ggcgtttttt 5460 attggtgaga atcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 5520 catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 5580 gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 5640 aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 5700 gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 5760 tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 5820 gggggatggc gatgacaagg ttcggcgagc ggctcaaaga gctgagggaa caaagaagcc 5880 tgtcggttaa tcagcttgcc atgtatgccg gtgtgagcgc cgcagccatt tccagaatcg 5940 aaaacggcca ccgctaagtt cccaagcccg cgacgatcag aaaattggcc tgataactga 6000 aaatgccgta cgagcagctc atggatattg ccggttatat gagagctgac gagattcgcg 6060 aacagccgcg cggctatgtc acgatgcagg agatcgcggc caagcacggc gtcgaagacc 6120 tgtggctgtt taaacccgag aaatgggact gtttgtcccg cgaagacctg ctcaacctcg 6180 aacagtattt tcattttttg gttaatgaag cgaagaagcg ccaatcataa aaagccgaat 6240 ttccctttta ggagaagttc ggcttttttc ggctgcctta agcggcatcc ggattcggcg 6300 tcttgccttt atgatgctta acggggctca gcgcacgctc gagccatccc atgaacagat 6360 cggcgatgat cgccatcagc gccgtcggga tcgcgcctgc tagaatgatc gctgttccgt 6420 tggtcgcgtt tgatcccctg acaatgatat ccccgaggcc gcctgcgccg acaaacgtgc 6480 cgatggccgt aatgcgaatt cgcggccgca cgcgtccatg gggatccccg cgggtcgacc 6540 tcgagagtta cgctagggat aacagggtaa tataggagct ccagtcggct taaaccagtt 6600 ttcgctggtg cgaaaaaaga gtgtcttgtg acactcttaa attcaaaatc tatcggtcag 6660 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 6720 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 6780 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 6840 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 6900 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 6960 ttcctgcaat ctgcggaata gtcgcattca attcttctgt aattattttt atctgttcat 7020 aagatttatt accctcatac atcactagaa tatgataatg ctcttttttc atcctacctt 7080 ctgtatcagt atccctatca tgtaatggag acactacaaa ttgaatgtgt aactctttta 7140 aatactctaa ccactcggct tttgctgatt ctggatataa aacaaatgtc caattacgtc 7200 ctcttgaatt tttcttgttt tcagtttctt ttattacatt ttcgctcatg atataataac 7260 ggtgctaata cacttaacaa aatttagtca tagataggca gcatgccagt gctgtctatc 7320 tttttttgtt taaaatgcac cgtattcctc ctttgcatat ttttttatta gaataccggt 7380 tgcatctgat ttgctaatat tatatttttc tttgattcta tttaatatct cattttcttc 7440 tgttgtaagt cttaaagtaa cagcaacttt tttctcttct tttctatcta caactatcac 7500 tgtacctccc aacatctgtt tttttcactt taacataaaa aacaaccttt taacattaaa 7560 aacccaatat ttatttattt gtttggacaa tggacactgg acacctaggg gggaggtcgt 7620 agtacccccc tatgttttct cccctaaata accccaaaaa tctaagaaaa aaagacctca 7680 aaaaggtctt taattaacat ctcaaatttc gcatttattc caatttcctt tttgcgtgtg 7740 atgcgagctc atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 7800 aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 7860 cttgttataa ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa 7920 taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 7980 gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 8040 aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 8100 gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 8160 gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 8220 gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 8280 aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 8340 ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 8400 gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 8460 cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 8520 gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 8580 gacattgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 8640 ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 8700 ctggatgaat tgttttagtg actgcagtcg ggaagatctg gtaatgactc tctagcttga 8760 ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 8820 tgtcggtgaa cgctctcctg agtaggacaa atccgccgct ctagctaagc agaaggccat 8880 cctgacggat ggcctttttg cgtttctaca aactcttgtt aactctagag ctgcctgccg 8940 cgtttcggtg atgaagatct tcccgatgat taattaattc agaacgctcg gttgccgccg 9000 ggcgtttttt atgaagcttc gttgctggcg tttttccata ggctccgccc ccctgacgag 9060 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9120 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9180 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9240 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaccccccc 9300 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9360 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 9420 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 9480 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 9540 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 9600 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9660 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9720 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 9780 tggtctgaca 9790 <210> 70 <211> 399 <212> DNA <213> Bacillus licheniformis <400> 70 atgacaaggt tcggcgagcg gctcaaagag ctgagggaac aaagaagcct gtcggttaat 60 cagcttgcca tgtatgccgg tgtgagcgcc gcagccattt ccagaatcga aaacggccac 120 cgcggcgttc ccaagcccgc gacgatcaga aaattggccg aggctctgaa aatgccgtac 180 gagcagctca tggatattgc cggttatatg agagctgacg agattcgcga acagccgcgc 240 ggctatgtca cgatgcagga gatcgcggcc aagcacggcg tcgaagacct gtggctgttt 300 aaacccgaga aatgggactg tttgtcccgc gaagacctgc tcaacctcga acagtatttt 360 cattttttgg ttaatgaagc gaagaagcgc caatcataa 399 <210> 71 <211> 1438 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 71 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggaagaatc gaaaacggcc 240 accggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatcgcgt 420 ctacagtcca ggaagcaaga agcagctatg attccattta cgacatcgtg tcacagtacg 480 atttagagga cctttctctg tttgacagcg aaaagtggaa ggtgctttca aaaaaagaca 540 tcgaaaacct ggacaaatat ttcgactttc tcgtgcagga agcaagcagc cgaaacaaaa 600 actgaatact tctccgcggc acactctcct ctctatcatt ttcgtctgtt tacgatcctg 660 ctgttatttt atcccttatg ttaacttttg tcaatatttt tcctgtctaa gtatttccta 720 tagtcaacat ttgtattaaa atgttcatat catgaatttg cgggggggat ggcgatgaca 780 aggttcggcg agcggctcaa agagctgagg gaacaaagaa gcctgtcggt taatcagctt 840 gccatgtatg ccggtgtgag cgccgcagcc atttccagaa tcgaaaacgg ccaccgctaa 900 gttcccaagc ccgcgacgat cagaaaattg gcctgataac tgaaaatgcc gtacgagcag 960 ctcatggata ttgccggtta tatgagagct gacgagattc gcgaacagcc gcgcggctat 1020 gtcacgatgc aggagatcgc ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc 1080 gagaaatggg actgtttgtc ccgcgaagac ctgctcaacc tcgaacagta ttttcatttt 1140 ttggttaatg aagcgaagaa gcgccaatca taaaaagccg aatttccctt ttaggagaag 1200 ttcggctttt ttcggctgcc ttaagcggca tccggattcg gcgtcttgcc tttatgatgc 1260 ttaacggggc tcagcgcacg ctcgagccat cccatgaaca gatcggcgat gatcgccatc 1320 agcgccgtcg ggatcgcgcc tgctagaatg atcgctgttc cgttggtcgc gtttgatccc 1380 ctgacaatga tatccccgag gccgcctgcg ccgacaaacg tgccgatggc cgtaatgc 1438 <210> 72 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 72 cgcgtctaca gtccaggaag caagaagcag ctatgattcc atttacgaca tcgtgtcaca 60 gtacgattta gaggaccttt ctctgtttga cagcgaaaag tggaaggtgc tttcaaaaaa 120 agacatcgaa aacctggaca aatatttcga ctttctcgtg caggaagcaa gcagccgaaa 180 caaaaactga atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga 240 tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt 300 tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga 360 tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc 420 agcttgccat gtatgccggt gtgagcgccg cagccatttc cagaatcgaa aacggccacc 480 gctaagttcc caagcccgcg acgatcagaa aattggcctg ataactgaaa atgccgtacg 540 agcagctcat ggatattgcc ggttatatga gagctgacga gattcgcgaa cagccgcgcg 600 gctatgtcac gatgcaggag atcgcggcca agcacggcgt cgaagacctg tggctgttta 660 aacccgagaa atgggactgt ttgtcccgcg aagacctgct caacctcgaa cagtattttc 720 attttttggt taatgaagcg aagaagcgcc aatcataaaa agccgaattt cccttttagg 780 agaagttcgg cttttttcgg ctgccttaag cggcatccgg attcggcgtc ttgcctttat 840 gatgcttaac ggggctcagc gcacgctcga gccatcccat gaacagatcg gcgatgatcg 900 ccatcagcgc cgtcgggatc gcgcctgcta gaatgatcgc tgttccgttg gtcgcgtttg 960 atcccctgac aatgatatcc ccgaggccgc ctgcgccgac aaacgtgccg atggccgtaa 1020 tgc 1023 <210> 73 <211> 415 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 73 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggaagaatc gaaaacggcc 240 accggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415 <210> 74 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 74 cgtgcggccg cgaattc 17 <210> 75 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 75 cctgataccg ggagacggca ttcgtaatc 29 <210> 76 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 76 gaattcgcgg ccgcacg 17 <210> 77 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 77 gattacgaat gccgtctccc ggtatcagg 29 <210> 78 <211> 9738 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 78 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagcgagc ggctcaaaga 240 gctggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacacgt cagttcggca ggcatttcgc gaatcgaaaa cggaaagcgc ggcgtgccga 3720 agccggcgac gatcagaaaa ctggcggacg ctttgaaagt cccgtatgag gaactgatgg 3780 catctgcagg ctatatcagc gcgtctacag tccaggaagc aagaagcagc tatgattcca 3840 tttacgacat cgtgtcacag tacgatttag aggacctttc tctgtttgac agcgaaaagt 3900 ggaaggtgct ttcaaaaaaa gacatcgaaa acctggacaa atatttcgac tttctcgtgc 3960 aggaagcaag cagccgaaac aaaaactgaa tacttctccg cggcacactc tcctctctat 4020 cattttcgtc tgtttacgat cctgctgtta ttttatccct tatgttaact tttgtcaata 4080 tttttcctgt ctaagtattt cctatagtca acatttgtat taaaatgttc atatcatgaa 4140 tttgcggggg ggatggcgat gacaaggcaa tcataaaaag ccgaatttcc cttttaggag 4200 aagttcggct tttttcggct gccttaagcg gcatccggat tcggcgtctt gcctttatga 4260 tgcttaacgg ggctcagcgc acgctcgagc catcccatga acagatcggc gatgatcgcc 4320 atcagcgccg tcgggatcgc gcctgctaga atgatcgctg ttccgttggt cgcgtttgat 4380 cccctgacaa tgatatcccc gaggccgcct gcgccgacaa acgtgccgat ggccgtaatg 4440 ccgatcgcga tgacgagcgc ggttctgagc cccgccataa tgaccgacaa ggcgagggga 4500 agctccacca tccggagcac ttgaaatttc gtcatgccca tcgccttccc tgattcaaga 4560 taggcatgct cgatgctggc gattcccgta tatgtgtttc gaatgatcgg caacagcgaa 4620 tacaaaaaca atgaaagaat caccgtgttt gcgccgagcc ccatgacaag catcaagacg 4680 ggaattcctc cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct 4740 ttcaaaaaag cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg 4800 ttaaacagcg gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta 4860 tttcttcctc cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc 4920 agaatacttt tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg 4980 aagcacacgc aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc 5040 atttaaccta aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg 5100 ttcttttctg tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata 5160 cctaaataga gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat 5220 tacaataaat tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag 5280 agggtaacta gtggccccaa aaaagaaacg caaggttatg gataaaaaat acagcattgg 5340 tctggatatc ggaaccaaca gcgttgggtg ggcagtaata acagatgaat acaaagtgcc 5400 gtcaaaaaaa tttaaggttc tggggaatac agatcgccac agcataaaaa agaatctgat 5460 tggggcattg ctgtttgatt cgggtgagac agctgaggcc acgcgtctga aacgtacagc 5520 aagaagacgt tacacacgtc gtaaaaatcg tatttgctac ttacaggaaa ttttttctaa 5580 cgaaatggcc aaggtagatg atagtttctt ccatcgtctc gaagaatctt ttctggttga 5640 ggaagataaa aaacacgaac gtcaccctat ctttggcaat atcgtggatg aagtggccta 5700 tcatgaaaaa taccctacga tttatcatct tcgcaagaag ttggttgata gtacggacaa 5760 agcggatctg cgtttaatcc atcttgcgtt agcgcacatg atcaaatttc gtggtcattt 5820 cttaattgaa ggtgatctga atcctgataa ctctgatgtg gacaaattgt ttatacaatt 5880 agtgcaaacc tataatcagc tgttcgagga aaaccccatt aatgcctctg gagttgatgc 5940 caaagcgatt ttaagcgcga gactttctaa gtcccggcgt ctggagaatc tgatcgccca 6000 gttaccaggg gaaaagaaaa atggtctgtt tggtaatctg attgccctca gtctggggct 6060 taccccgaac ttcaaatcca attttgacct ggctgaggac gcaaagctgc agctgagcaa 6120 agatacttat gatgatgacc tcgacaatct gctcgcccag attggtgacc aatatgcgga 6180 tctgtttctg gcagcgaaga atctttcgga tgctatcttg ctgtcggata ttctgcgtgt 6240 taataccgaa atcaccaaag cgcctctgtc tgcaagtatg atcaagagat acgacgagca 6300 ccaccaggac ctgactcttc ttaaggcact ggtacgccaa cagcttccgg agaaatacaa 6360 agaaatattc ttcgaccagt ccaagaatgg ttacgcgggc tacatcgatg gtggtgcatc 6420 acaggaagag ttctataaat ttattaaacc aatccttgag aaaatggatg gcacggaaga 6480 gttacttgtt aaacttaacc gcgaagactt gcttagaaag caacgtacat tcgacaacgg 6540 ctccatccca caccagattc atttaggtga acttcacgcc atcttgcgca gacaagaaga 6600 tttctatccc ttcttaaaag acaatcggga gaaaatcgag aagatcctga cgttccgcat 6660 tccctattat gtcggtcccc tggcacgtgg taattctcgg tttgcctgga tgacgcgcaa 6720 aagtgaggaa accatcaccc cttggaactt tgaagaagtc gtggataaag gtgctagcgc 6780 gcagtctttt atagaaagaa tgacgaactt cgataaaaac ttgcccaacg aaaaagtcct 6840 gcccaagcac tctcttttat atgagtactt tactgtgtac aacgaactga ctaaagtgaa 6900 atacgttacg gaaggtatgc gcaaacctgc ctttcttagt ggcgagcaga aaaaagcaat 6960 tgtcgatctt ctctttaaaa cgaatcgcaa ggtaactgta aaacagctga aggaagatta 7020 tttcaaaaag atcgaatgct ttgattctgt cgagatctcg ggtgtcgaag atcgtttcaa 7080 cgcttcctta gggacctatc atgatttgct gaagataata aaagacaaag actttctcga 7140 caatgaagaa aatgaagata ttctggagga tattgttttg accttgacct tattcgaaga 7200 tagagagatg atcgaggagc gcttaaaaac ctatgcccac ctgtttgatg acaaagtcat 7260 gaagcaatta aagcgccgca gatatacggg gtggggccgc ttgagccgca agttgattaa 7320 cggtattaga gacaagcaga gcggaaaaac tatcctggat ttcctcaaat ctgacggatt 7380 tgcgaaccgc aattttatgc agcttataca tgatgattcg cttacattca aagaggatat 7440 tcagaaggct caggtgtctg ggcaaggtga ttcactccac gaacatatag caaatttggc 7500 cggctctcct gcgattaaga aggggatcct gcaaacagtt aaagttgtgg atgaacttgt 7560 aaaagtaatg ggccgccaca agccggagaa tatcgtgata gaaatggcgc gcgagaatca 7620 aacgacacaa aaaggtcaaa agaactcaag agagagaatg aagcgcattg aggaggggat 7680 aaaggaactt ggatctcaaa ttctgaaaga acatccagtt gaaaacactc agctgcaaaa 7740 tgaaaaattg tacctgtact acctgcagaa tggaagagac atgtacgtgg atcaggaatt 7800 ggatatcaat agactctcgg actatgacgt agatcacatt gtccctcaga gcttcctcaa 7860 ggatgattct atagataata aagtacttac gagatcggac aaaaatcgcg gtaaatcgga 7920 taacgtccca tcggaggaag tcgttaaaaa gatgaaaaac tattggcgtc aactgctgaa 7980 cgccaagctg atcacacagc gtaagtttga taatctgact aaagccgaac gcggtggtct 8040 tagtgaactc gataaagcag gatttataaa acggcagtta gtagaaacgc gccaaattac 8100 gaaacacgtg gctcagatcc tcgattctag aatgaataca aagtacgatg aaaacgataa 8160 actgatccgt gaagtaaaag tcattacctt aaaatctaaa cttgtgtccg atttccgcaa 8220 agattttcag ttttacaagg tccgggaaat caataactat caccatgcac atgatgcata 8280 tttaaatgcg gttgtaggca cggcccttat taagaaatac cctaaactcg aaagtgagtt 8340 tgtttatggg gattataaag tgtatgacgt tcgcaaaatg atcgcgaaat cagaacagga 8400 aatcggtaag gctaccgcta aatacttttt ttattccaac attatgaatt tttttaagac 8460 cgaaataact ctcgcgaatg gtgaaatccg taaacggcct cttatagaaa ccaatggtga 8520 aacgggagaa atcgtttggg ataaaggtcg tgactttgcc accgttcgta aagtcctctc 8580 aatgccgcaa gttaacattg tcaagaagac ggaagttcaa acagggggat tctccaaaga 8640 atctatcctg ccgaagcgta acagtgataa acttattgcc agaaaaaaag attgggatcc 8700 aaaaaaatac ggaggctttg attcccctac cgtcgcgtat agtgtgctgg tggttgctaa 8760 agtcgagaaa gggaaaagca agaaattgaa atcagttaaa gaactgctgg gtattacaat 8820 tatggaaaga tcgtcctttg agaaaaatcc gatcgacttt ttagaggcca aggggtataa 8880 ggaagtgaaa aaagatctca tcatcaaatt accgaagtat agtctttttg agctggaaaa 8940 cggcagaaaa agaatgctgg cctccgcggg cgagttacag aagggaaatg agctggcgct 9000 gccttccaaa tatgttaatt ttctgtacct tgccagtcat tatgagaaac tgaagggcag 9060 ccccgaagat aacgaacaga aacaattatt cgtggaacag cataagcact atttagatga 9120 aattatagag caaattagtg aattttctaa gcgcgttatc ctcgcggatg ctaatttaga 9180 caaagtactg tcagcttata ataaacatcg ggataagccg attagagaac aggccgaaaa 9240 tatcattcat ttgtttacct taaccaacct tggagcacca gctgccttca aatatttcga 9300 taccacaatt gatcgtaaac ggtatacaag tacaaaagaa gtcttggacg caaccctcat 9360 tcatcaatct attactggat tatatgagac acgcattgat ctttcacagc tgggcggaga 9420 caagaagaaa aaactgaaac tgcaccatca tcaccatcat catcaccatc attgataact 9480 cgagaaagct tacataaaaa accggccttg gccccgccgg ttttttatta tttttcttcc 9540 tccgcatgtt caatccgctc cataatcgac ggatggctcc ctctgaaaat tttaacgaga 9600 aacggcgggt tgacccggct cagtcccgta acggccaagt cctgaaacgt ctcaatcgcc 9660 gcttcccggt ttccggtcag ctcaatgccg taacggtcgg cggcgttttc ctgataccgg 9720 gagacggcat tcgtaatc 9738 <210> 79 <211> 23 <212> DNA <213> Bacillus licheniformis <400> 79 gcgagcggct caaagagctg agg 23 <210> 80 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 80 cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag cgcggcgtgc cgaagccggc 60 gacgatcaga aaactggcgg acgctttgaa agtcccgtat gaggaactga tggcatctgc 120 aggctatatc agcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 180 catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 240 gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 300 aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 360 gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 420 tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 480 gggggatggc gatgacaagg caatcataaa aagccgaatt tcccttttag gagaagttcg 540 gcttttttcg gctgccttaa gcggcatccg gattcggcgt cttgccttta tgatgcttaa 600 cggggctcag cgcacgctcg agccatccca tgaacagatc ggcgatgatc gccatcagcg 660 ccgtcgggat cgcgcctgct agaatgatcg ctgttccgtt ggtcgcgttt gatcccctga 720 caatgatatc cccgaggccg cctgcgccga caaacgtgcc gatggccgta atgccgatcg 780 cgatgacgag cgcggttctg agccccgcca taatgaccga caaggcgagg ggaagctcca 840 ccatccggag cacttgaaat ttcgtcatgc ccatcgcctt ccctgattca agataggcat 900 gctcgatgct ggcgattccc gtatatgtgt ttcgaatgat cggcaacagc gaatacaaaa 960 acaatgaaag aatcaccgtg tttgcgccga gccccatgac aagcatcaag acgg 1014 <210> 81 <211> 9724 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 81 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagagctt ctttttcttg 240 agcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacaacc tgtcagccaa agcttgcaga gacagcggat cgcgataaga ttcctcgatg 3720 atttccacca cacgctgtgc cagctcttca tccggcagca gcgccccggc cggattgcag 3780 cgtttgcagg ggcggtaccc ttctgataaa gcatcttttg cattgaaaaa gatctgcaca 3840 ttgtcgattt gcggaactct cgatttgcag gaagggcggc aaaatatgcc ggtcgttttg 3900 accgcgtaat aaaaaactcc gtcataggcg gaatcgtttt ccgtaatcgc ccgccacatt 3960 tcaggcgtca atcgtgattt gctgttcata tcttcacccc gatctatgtc agtataacct 4020 atatgacagc cggaggtgga gaggcggaga acggcacagc aagaagacaa agaagaagag 4080 agactgttgc ctggacctcc gaaacgcgct acaattcatt tacaacacag gatggggtga 4140 gaatattgcc ggaatcagtg aagcaggtga cagaggaaag gccgatatga ttcggccttt 4200 tttatatgta cttcttagcg ggtctctaaa ataaccaaaa agcaaggact gctgaaaggg 4260 ctgacataag ccttttgccg gcggtccttt tttaattctg atttttcaaa cttagccccc 4320 tcgagaaaac cgcttgagta tcctccgctc atgttattga cctccttttc ttgatcaata 4380 tatttgtatg agcggaaaga aaatttgact agacggatgc ccctctgttg aaaatctttt 4440 tacagcatgt cagaatatga tatgatacaa ttcaaaggaa agtttaaact gttatgatta 4500 ggagtgtttg catttatgaa gaagattgca attgcggcga ttacagcgac aagcgtgctg 4560 gctctcagcg catgcagcgg gggagattct gaggttgttg cggaaacaaa agctggaaat 4620 attacaaaag aagaccttta tcaaacatta aaagacaatg ccggagcgaa ttcctccatt 4680 ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740 tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800 aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860 tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920 atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980 catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040 agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100 aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160 aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220 agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280 ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340 ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400 aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460 ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520 cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580 tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640 acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700 ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760 taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820 atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880 atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940 gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000 agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060 aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120 atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180 cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240 ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300 ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360 accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420 ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480 ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540 agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600 taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660 gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720 tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780 aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840 ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900 gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960 ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020 aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080 cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140 aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200 aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260 gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320 agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380 ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440 tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500 ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560 gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620 gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680 ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740 tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800 tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860 ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920 aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980 cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040 aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100 agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160 taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220 acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280 taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340 ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400 ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460 cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520 tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580 acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640 agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700 gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760 aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820 cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880 atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940 tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000 ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060 aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120 ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180 cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240 ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300 gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360 ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420 tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480 taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540 ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600 ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660 ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720 aatc 9724 <210> 82 <211> 23 <212> DNA <213> Bacillus licheniformis <400> 82 gagcttcttt ttcttgagca cgg 23 <210> 83 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 83 acctgtcagc caaagcttgc agagacagcg gatcgcgata agattcctcg atgatttcca 60 ccacacgctg tgccagctct tcatccggca gcagcgcccc ggccggattg cagcgtttgc 120 aggggcggta cccttctgat aaagcatctt ttgcattgaa aaagatctgc acattgtcga 180 tttgcggaac tctcgatttg caggaagggc ggcaaaatat gccggtcgtt ttgaccgcgt 240 aataaaaaac tccgtcatag gcggaatcgt tttccgtaat cgcccgccac atttcaggcg 300 tcaatcgtga tttgctgttc atatcttcac cccgatctat gtcagtataa cctatatgac 360 agccggaggt ggagaggcgg agaacggcac agcaagaaga caaagaagaa gagagactgt 420 tgcctggacc tccgaaacgc gctacaattc atttacaaca caggatgggg tgagaatatt 480 gccggaatca gtgaagcagg tgacagagga aaggccgata tgattcggcc ttttttatat 540 gtacttctta gcgggtctct aaaataacca aaaagcaagg actgctgaaa gggctgacat 600 aagccttttg ccggcggtcc ttttttaatt ctgatttttc aaacttagcc ccctcgagaa 660 aaccgcttga gtatcctccg ctcatgttat tgacctcctt ttcttgatca atatatttgt 720 atgagcggaa agaaaatttg actagacgga tgcccctctg ttgaaaatct ttttacagca 780 tgtcagaata tgatatgata caattcaaag gaaagtttaa actgttatga ttaggagtgt 840 ttgcatttat gaagaagatt gcaattgcgg cgattacagc gacaagcgtg ctggctctca 900 gcgcatgcag cgggggagat tctgaggttg ttgcggaaac aaaagctgga aatattacaa 960 aagaagacct ttatcaaaca ttaaaagaca atgccggagc 1000 <210> 84 <211> 9754 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 84 gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60 atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120 gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180 aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggatccagt tgacgtatcg 240 attcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300 aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360 tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420 cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480 ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540 atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600 gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660 cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720 ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780 gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840 ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900 taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960 tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020 aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080 cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140 cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200 ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260 ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320 ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380 ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440 aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500 tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560 aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620 gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680 aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740 tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800 ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860 cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920 aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980 ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040 tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100 ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160 caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220 cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280 ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340 gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400 agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460 tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520 gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580 actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640 atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700 cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760 gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820 ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880 gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660 tctgacactc taatagcttc gctttgattg ttgtattatt tattttgctg atcattgtgg 3720 gctccgcttt tgtaaagtat taattcattc gcgcacgaag ccttcttccg aaaaactgca 3780 ggttcatatc gaaaggcgct ccgcttttca tatgagcctg tttttttgta atttaaaaag 3840 aatttatttc cacaataaca aaaaatgttt ataataggat aggctctgag ctgacggctg 3900 acggcgctcg gaaataaaaa ctctcccaca aatgaaactt ttatacaaca ttttcgtctt 3960 atactgttgt taaggcaatt caataacgga aaggaaaaga tcaatgttaa ataagctaag 4020 aatgttgtat gaaaaaacaa caatgaagtg gctgctcaac acttcctatt actttctcat 4080 tctggtgctg ctgtttttaa tttacggatt ccatacagca aatacaggtt catatattta 4140 taatgacttt taatggagaa gaaaacaatg aaactgattg aaacaattaa aaaataccac 4200 aaatgtgctt gatggatccg tcttattcgg aagagctgct tccggagctg agcttgttta 4260 tgttctgcgg agaaacgctt cctgcgtcag tcgccagaca gcttaaagaa agatttccaa 4320 aggctcgtgt ttttaacaca tacggcccga ccgaagcgac cgttgccgtc acttccatcg 4380 aagtaacaga cgacgtatta aacaagtatt cttctcttcc cgtcggttct gaaaagcccg 4440 aaaccgaaat cgtaatcatc aatgaagacg gaaaagccgt ccaagacggg gaaaaaggcg 4500 agatcataat taccggagca agcgtcagca aaggctattt aggcgaaaaa gcgctgacgg 4560 aaaaagcgtt tttctcttac aacggctccc ctgcttaccg caccggtgac gcaggttaca 4620 aagaaaacgg ccagctcttc ttcctcggaa gactcgattt ccaaatcaaa ctgcacggct 4680 accggattga gcttgaagaa ttcctccatt ttcttctgct atcaaaataa cagactcgtg 4740 attttccaaa cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata 4800 aaattcccga tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg 4860 gcgaatgttc atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct 4920 gtaaagttta tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata 4980 tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt 5040 gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta 5100 ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat 5160 agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa 5220 atattattcc atctattaca ataaattcac agaatagtct tttaagtaag tctactctga 5280 atttttttaa aaggagaggg taactagtgg ccccaaaaaa gaaacgcaag gttatggata 5340 aaaaatacag cattggtctg gatatcggaa ccaacagcgt tgggtgggca gtaataacag 5400 atgaatacaa agtgccgtca aaaaaattta aggttctggg gaatacagat cgccacagca 5460 taaaaaagaa tctgattggg gcattgctgt ttgattcggg tgagacagct gaggccacgc 5520 gtctgaaacg tacagcaaga agacgttaca cacgtcgtaa aaatcgtatt tgctacttac 5580 aggaaatttt ttctaacgaa atggccaagg tagatgatag tttcttccat cgtctcgaag 5640 aatcttttct ggttgaggaa gataaaaaac acgaacgtca ccctatcttt ggcaatatcg 5700 tggatgaagt ggcctatcat gaaaaatacc ctacgattta tcatcttcgc aagaagttgg 5760 ttgatagtac ggacaaagcg gatctgcgtt taatccatct tgcgttagcg cacatgatca 5820 aatttcgtgg tcatttctta attgaaggtg atctgaatcc tgataactct gatgtggaca 5880 aattgtttat acaattagtg caaacctata atcagctgtt cgaggaaaac cccattaatg 5940 cctctggagt tgatgccaaa gcgattttaa gcgcgagact ttctaagtcc cggcgtctgg 6000 agaatctgat cgcccagtta ccaggggaaa agaaaaatgg tctgtttggt aatctgattg 6060 ccctcagtct ggggcttacc ccgaacttca aatccaattt tgacctggct gaggacgcaa 6120 agctgcagct gagcaaagat acttatgatg atgacctcga caatctgctc gcccagattg 6180 gtgaccaata tgcggatctg tttctggcag cgaagaatct ttcggatgct atcttgctgt 6240 cggatattct gcgtgttaat accgaaatca ccaaagcgcc tctgtctgca agtatgatca 6300 agagatacga cgagcaccac caggacctga ctcttcttaa ggcactggta cgccaacagc 6360 ttccggagaa atacaaagaa atattcttcg accagtccaa gaatggttac gcgggctaca 6420 tcgatggtgg tgcatcacag gaagagttct ataaatttat taaaccaatc cttgagaaaa 6480 tggatggcac ggaagagtta cttgttaaac ttaaccgcga agacttgctt agaaagcaac 6540 gtacattcga caacggctcc atcccacacc agattcattt aggtgaactt cacgccatct 6600 tgcgcagaca agaagatttc tatcccttct taaaagacaa tcgggagaaa atcgagaaga 6660 tcctgacgtt ccgcattccc tattatgtcg gtcccctggc acgtggtaat tctcggtttg 6720 cctggatgac gcgcaaaagt gaggaaacca tcaccccttg gaactttgaa gaagtcgtgg 6780 ataaaggtgc tagcgcgcag tcttttatag aaagaatgac gaacttcgat aaaaacttgc 6840 ccaacgaaaa agtcctgccc aagcactctc ttttatatga gtactttact gtgtacaacg 6900 aactgactaa agtgaaatac gttacggaag gtatgcgcaa acctgccttt cttagtggcg 6960 agcagaaaaa agcaattgtc gatcttctct ttaaaacgaa tcgcaaggta actgtaaaac 7020 agctgaagga agattatttc aaaaagatcg aatgctttga ttctgtcgag atctcgggtg 7080 tcgaagatcg tttcaacgct tccttaggga cctatcatga tttgctgaag ataataaaag 7140 acaaagactt tctcgacaat gaagaaaatg aagatattct ggaggatatt gttttgacct 7200 tgaccttatt cgaagataga gagatgatcg aggagcgctt aaaaacctat gcccacctgt 7260 ttgatgacaa agtcatgaag caattaaagc gccgcagata tacggggtgg ggccgcttga 7320 gccgcaagtt gattaacggt attagagaca agcagagcgg aaaaactatc ctggatttcc 7380 tcaaatctga cggatttgcg aaccgcaatt ttatgcagct tatacatgat gattcgctta 7440 cattcaaaga ggatattcag aaggctcagg tgtctgggca aggtgattca ctccacgaac 7500 atatagcaaa tttggccggc tctcctgcga ttaagaaggg gatcctgcaa acagttaaag 7560 ttgtggatga acttgtaaaa gtaatgggcc gccacaagcc ggagaatatc gtgatagaaa 7620 tggcgcgcga gaatcaaacg acacaaaaag gtcaaaagaa ctcaagagag agaatgaagc 7680 gcattgagga ggggataaag gaacttggat ctcaaattct gaaagaacat ccagttgaaa 7740 acactcagct gcaaaatgaa aaattgtacc tgtactacct gcagaatgga agagacatgt 7800 acgtggatca ggaattggat atcaatagac tctcggacta tgacgtagat cacattgtcc 7860 ctcagagctt cctcaaggat gattctatag ataataaagt acttacgaga tcggacaaaa 7920 atcgcggtaa atcggataac gtcccatcgg aggaagtcgt taaaaagatg aaaaactatt 7980 ggcgtcaact gctgaacgcc aagctgatca cacagcgtaa gtttgataat ctgactaaag 8040 ccgaacgcgg tggtcttagt gaactcgata aagcaggatt tataaaacgg cagttagtag 8100 aaacgcgcca aattacgaaa cacgtggctc agatcctcga ttctagaatg aatacaaagt 8160 acgatgaaaa cgataaactg atccgtgaag taaaagtcat taccttaaaa tctaaacttg 8220 tgtccgattt ccgcaaagat tttcagtttt acaaggtccg ggaaatcaat aactatcacc 8280 atgcacatga tgcatattta aatgcggttg taggcacggc ccttattaag aaatacccta 8340 aactcgaaag tgagtttgtt tatggggatt ataaagtgta tgacgttcgc aaaatgatcg 8400 cgaaatcaga acaggaaatc ggtaaggcta ccgctaaata ctttttttat tccaacatta 8460 tgaatttttt taagaccgaa ataactctcg cgaatggtga aatccgtaaa cggcctctta 8520 tagaaaccaa tggtgaaacg ggagaaatcg tttgggataa aggtcgtgac tttgccaccg 8580 ttcgtaaagt cctctcaatg ccgcaagtta acattgtcaa gaagacggaa gttcaaacag 8640 ggggattctc caaagaatct atcctgccga agcgtaacag tgataaactt attgccagaa 8700 aaaaagattg ggatccaaaa aaatacggag gctttgattc ccctaccgtc gcgtatagtg 8760 tgctggtggt tgctaaagtc gagaaaggga aaagcaagaa attgaaatca gttaaagaac 8820 tgctgggtat tacaattatg gaaagatcgt cctttgagaa aaatccgatc gactttttag 8880 aggccaaggg gtataaggaa gtgaaaaaag atctcatcat caaattaccg aagtatagtc 8940 tttttgagct ggaaaacggc agaaaaagaa tgctggcctc cgcgggcgag ttacagaagg 9000 gaaatgagct ggcgctgcct tccaaatatg ttaattttct gtaccttgcc agtcattatg 9060 agaaactgaa gggcagcccc gaagataacg aacagaaaca attattcgtg gaacagcata 9120 agcactattt agatgaaatt atagagcaaa ttagtgaatt ttctaagcgc gttatcctcg 9180 cggatgctaa tttagacaaa gtactgtcag cttataataa acatcgggat aagccgatta 9240 gagaacaggc cgaaaatatc attcatttgt ttaccttaac caaccttgga gcaccagctg 9300 ccttcaaata tttcgatacc acaattgatc gtaaacggta tacaagtaca aaagaagtct 9360 tggacgcaac cctcattcat caatctatta ctggattata tgagacacgc attgatcttt 9420 cacagctggg cggagacaag aagaaaaaac tgaaactgca ccatcatcac catcatcatc 9480 accatcattg ataactcgag aaagcttaca taaaaaaccg gccttggccc cgccggtttt 9540 ttattatttt tcttcctccg catgttcaat ccgctccata atcgacggat ggctccctct 9600 gaaaatttta acgagaaacg gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg 9660 aaacgtctca atcgccgctt cccggtttcc ggtcagctca atgccgtaac ggtcggcggc 9720 gttttcctga taccgggaga cggcattcgt aatc 9754 <210> 85 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 85 tccagttgac gtatcgattc cgg 23 <210> 86 <211> 1030 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 86 ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60 ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120 atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180 ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240 tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300 tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360 tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420 ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480 ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac cacaaatgtg 540 cttgatggat ccgtcttatt cggaagagct gcttccggag ctgagcttgt ttatgttctg 600 cggagaaacg cttcctgcgt cagtcgccag acagcttaaa gaaagatttc caaaggctcg 660 tgtttttaac acatacggcc cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac 720 agacgacgta ttaaacaagt attcttctct tcccgtcggt tctgaaaagc ccgaaaccga 780 aatcgtaatc atcaatgaag acggaaaagc cgtccaagac ggggaaaaag gcgagatcat 840 aattaccgga gcaagcgtca gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc 900 gtttttctct tacaacggct cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa 960 cggccagctc ttcttcctcg gaagactcga tttccaaatc aaactgcacg gctaccggat 1020 tgagcttgaa 1030 <210> 87 <211> 1320 <212> DNA <213> Bacillus licheniformis <400> 87 ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60 gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120 attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180 gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240 gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300 ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360 ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420 gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480 gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540 ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600 ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660 gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720 gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780 gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840 ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900 actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960 atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020 gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080 tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140 gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200 attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260 gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320 1320 <210> 88 <211> 6393 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 88 aagcttcata tgcaagggtt tattgttttc taaaatctga ttaccaatta gaatgaatat 60 ttcccaaata ttaaataata aaacaaaaaa attgaaaaaa gtgtttccac cattttttca 120 atttttttat aattttttta atctgttatt taaatagttt atagttaaat ttacattttc 180 attagtccat tcaatattct ctccaagata actacgaact gctaacaaaa ttctctccct 240 atgttctaat ggagaagatt cagccactgc atttcccgca atatcttttg gtatgatttt 300 acccgtgtcc atagttaaaa tcatacggca taaagttaat atagagttgg tttcatcatc 360 ctgataatta tctattaatt cctctgacga atccataatg gctcttctca catcagaaaa 420 tggaatatca ggtagtaatt cctctaagtc ataatttccg tatattcttt tattttttcg 480 ttttgcttgg taaagcatta tggttaaatc tgaatttaat tccttctgag gaatgtatcc 540 ttgttcataa agctcttgta accattctcc ataaataaat tcttgtttgg gaggatgatt 600 ccacggtacc atttcttgct gaataataat tgttaattca atatatcgta agttgctttt 660 atctcctatt ttttttgaaa taggtctaat tttttgtata agtatttctt tactttgatc 720 tgtcaatggt tcagatacga cgactaaaaa gtcaagatca ctatttggtt ttagtccact 780 ctcaactcct gatccaaaca tgtaagtacc aataaggtta ttttttaaat gtttccgaag 840 tatttttttc actttattaa tttgttcgta tgtattcaaa tatatcctcc tcactatttt 900 gattagtacc tattttatat ccatagttgt taattaaata aacttaattt agtttattta 960 tggatttcat tggcttctaa attttttatc tagataataa ttattttagt taattttatt 1020 ctagattata tatgatatga tctttcattt ccataaaact aaagtaagtg taaacctatt 1080 cattgtttta aaaatatctc ttgccagtca cgttacgtta ttagttatag ttattataac 1140 atgtattcac gaacgggcgc gccggtatcc gcgcttcttg agcactattt attcaaagcc 1200 gctccagatc aatagcgctt tttcagctcc ctgaggatga attcgtatat cagctgattc 1260 cggtcttctt tcggatagag cataaattcc tgtttcttct gcatggggtt tccttcaatc 1320 ctgtcgataa attttgttct cagccatgcc gttcggtaaa cctggttttc gaaagatgag 1380 atggatacgg gcagctccag cgtttccccg ttgacaaacg tgacaaacgt gttgtcatac 1440 tttgccgcgc aaaactcgtg aacatgcgca tgggaaagcc acccgcactg aggacgagtt 1500 gaggaaaatg tggggaaaag aaaaatgttg tttgagtgat ccaccatgat cggcggttta 1560 tgggaaactt taatgacttc atatgtgccc gcttttcttc ccgcatagct cgatccgaaa 1620 tagcggcagc ttctttcgat aatttgaaac ggcttcatat tgacgcggaa agtcctgtcg 1680 gtctcaagta tttttgaggc ggatttctcc ccctcaccca gaggcaggac agccattgtc 1740 gaactgttta cttcatacgt atcctttgtc atatcctctg tgctcatgtg atttccccct 1800 taaaaataaa ttcattcaaa tacagatgca ttttatttca tatagtaagt acatcaccta 1860 ttagtttgtt gtttaaacaa actaacttat tttcatctta tataacctcg tcagtatttt 1920 caatattttt tttagttttt tatgaacaca ttagatttaa taaagggaag attcgctatg 1980 tactatgttg atacttaatt taaagattaa acaaatggag tggatgaagt ggatatcgct 2040 gatcaaacct ttgtcaaaaa agtaaatcaa aagttattat taaaagaaat ccttaaaaat 2100 tcacctattt caagagcaaa attatctgaa atgactggat taaataaatc aactgtctca 2160 tcacaggtaa acacgttaat gaaagaaagt atggtatttg aaataggtca aggacaatca 2220 agtggcggaa gaagacctgt catgcttgtt tttaataaaa aggcaggata ctccgttgga 2280 atagatgttg gtgtggatta tattaatggc attttaacag accttgaagg aacaatcgtt 2340 cttgatcaat accgccattt ggaatccaat tctccagaaa taacgaaaga cattttgatt 2400 gatatgattc atcactttat tacgcaaatg ccccaatctc cgtacgggtt tattggtata 2460 ggtacttgcg tgcctggact cattgataaa gatcaaaaaa ttgttttcac tccgaactcc 2520 aactggagag atattgactt aaaatcttcg atacaagaga agtacaatgt gtctgttttt 2580 attgaaaatg aggcaaatgc tggcgcatat ggagaaaaac tatttggagc tgcaaaaaat 2640 cacgataaca ttatttacgt aagtatcagc acaggaatag ggatcggtgt tattatcaac 2700 aatcatttat atagaggagt aagcggcttc tctggagaaa tgggacatat gacaatagac 2760 tttaatggtc ctaaatgcag ttgcggaaac cgaggatgct gggaattgta tgcttcagag 2820 aaggctttat ttaaatctct tcagaccaaa gagaaaaaac tgtcctatca agatatcata 2880 aacctcgccc atctgaatga tatcggaacc ttaaatgcat tacaaaattt tggattctat 2940 ttaggaatag gccttaccaa tattctaaat actctcaacc cacaagccgt aattttaaga 3000 aatagcataa ttgaatcgca tcctatggtt ttaaattcaa tgagaagtga agtatcatca 3060 agggtttatt cccaattagg caatagctat gaattattgc catcttcctt aggacagaat 3120 gcaccggcat taggaatgtc ctccattgtg attgatcatt ttctggacat gattacaatg 3180 taatttttta tggaatggac agctcatctt taaagatgag tttttttatt ctaggagtat 3240 ttctgaagca atagtgacat ggcaccttct catatgaaaa aggagttcta aaataaaaat 3300 ctcctttttc atgtgcaaat tatttttctt tataacgaaa atatctaaat gacaatgcat 3360 atgcaagagg ggatcacata aatatatatt ttaaaaatat cccactttat ccaattttcg 3420 tttgttgaac taatgggtgc tttagttgaa gaataaaaga ccacattaaa aaatgtggtc 3480 ttttgtgttt ttttaaagga tttgagcgta gcgaaaaatc cttttctttc ttatcttgat 3540 actatataga aacaacatca tttttcaaaa ttaggtcaaa gccttgtgta tcaagggttt 3600 gatggttctt tgacaggtaa aaactccttc tgctattatt aaatactata tagaaacaac 3660 atcatttttc aaaattaggt caaagccttg tgtatcaagg gtttgatggt tctttgacag 3720 gtaaaaactc cttctgctat tattaaggtg tcgaatcaaa ataatagaat gctagagaac 3780 tagctcagaa ggagtttttt tgttgattta ttcatctgaa aatgattata gcatcctcga 3840 agataaaacc gcaacaggta aaaagcggga ttggaagggg aaaaagagac ggacgaacct 3900 catggcggag cattacgaag cgttagagag taagattggg gcaccttact atggcaaaaa 3960 ggctgaaaaa ctaattagtt gtgcagagta tctttcgttt aagagagacc cggagacggg 4020 caagttaaaa ctgtatcaag cccatttttg taaagtgagg ttatgtccga tgtgtgcgtg 4080 gcgcaggtcg ttaaaaattg cttatcacaa taagttgatc gtagaggaag ccaatagaca 4140 gtacggctgc ggatggattt ttctcacgct gacgattcga aatgtaaagg gagaacggct 4200 gaagccacaa atttctgcga tgatggaagg ctttaggaaa ctgttccagt acaaaaaagt 4260 aaaaacttcg gttcttggat ttttcagagc tttagagatt accaaaaatc atgaagaaga 4320 tacatatcat cctcattttc atgtgttgat accagtaagg aaaaattatt ttgggaaaaa 4380 ctatattaag caggcggagt ggacgagcct ttggaaaaag gcgatgaaat tggattacac 4440 tccaattgtc gatattcgtc gagtgaaagg taaagctaag attgacgctg aacagattga 4500 aaacgatgtg cggaacgcaa tgatggagca aaaagctgtt ctcgaaatct ctaaatatcc 4560 ggttaaggat acggatgttg tgcgcggtaa taaggtgact gaagacaatc tgaacacggt 4620 gctttacttg gatgatgcgt tggcagctcg aaggttaatt ggatacggtg gcattttgaa 4680 ggagatacat aaagagctga atcttggtga tgcggaggac ggcgatctgg tcaagattga 4740 ggaagaagat gacgaggttg caaatggtgc atttgaggtt atggcttatt ggcatcctgg 4800 cattaaaaat tacataatca aataaaaaaa gcagaccttt agaaggcctg cttttttaac 4860 taacccattt gtattgtgtt gaaatatgtt ttgtatggtg cactctcagt acaatctgct 4920 ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 4980 gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5040 tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5100 gcctattttt ataggttaat gtcatgataa taatggtttc ttagcgattc acaaaaaata 5160 ggcacacgaa aaacaagtta agggatgcag tttatgcatc ccttaactta aaatactaaa 5220 aatgcccata ttttttcctc cttataaaat tagtataatt atagcacgag atctaaaagg 5280 atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5340 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5400 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5460 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5520 ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5580 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5640 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5700 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5760 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5820 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5880 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5940 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6000 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6060 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6120 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 6180 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 6240 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 6300 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 6360 ggaaacagct atgaccatga ttacgccgga tcc 6393 <210> 89 <211> 765 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 89 gtgaggagga tatatttgaa tacatacgaa caaattaata aagtgaaaaa aatacttcgg 60 aaacatttaa aaaataacct tattggtact tacatgtttg gatcaggagt tgagagtgga 120 ctaaaaccaa atagtgatct tgacttttta gtcgtcgtat ctgaaccatt gacagatcaa 180 agtaaagaaa tacttataca aaaaattaga cctatttcaa aaaaaatagg agataaaagc 240 aacttacgat atattgaatt aacaattatt attcagcaag aaatggtacc gtggaatcat 300 cctcccaaac aagaatttat ttatggagaa tggttacaag agctttatga acaaggatac 360 attcctcaga aggaattaaa ttcagattta accataatgc tttaccaagc aaaacgaaaa 420 aataaaagaa tatacggaaa ttatgactta gaggaattac tacctgatat tccattttct 480 gatgtgagaa gagccattat ggattcgtca gaggaattaa tagataatta tcaggatgat 540 gaaaccaact ctatattaac tttatgccgt atgattttaa ctatggacac gggtaaaatc 600 ataccaaaag atattgcggg aaatgcagtg gctgaatctt ctccattaga acatagggag 660 agaattttgt tagcagttcg tagttatctt ggagagaata ttgaatggac taatgaaaat 720 gtaaatttaa ctataaacta tttaaataac agattaaaaa aatta 765 <210> 90 <211> 1161 <212> DNA <213> Bacillus subtilis <400> 90 gtggatgaag tggatatcgc tgatcaaacc tttgtcaaaa aagtaaatca aaagttatta 60 ttaaaagaaa tccttaaaaa ttcacctatt tcaagagcaa aattatctga aatgactgga 120 ttaaataaat caactgtctc atcacaggta aacacgttaa tgaaagaaag tatggtattt 180 gaaataggtc aaggacaatc aagtggcgga agaagacctg tcatgcttgt ttttaataaa 240 aaggcaggat actccgttgg aatagatgtt ggtgtggatt atattaatgg cattttaaca 300 gaccttgaag gaacaatcgt tcttgatcaa taccgccatt tggaatccaa ttctccagaa 360 ataacgaaag acattttgat tgatatgatt catcacttta ttacgcaaat gccccaatct 420 ccgtacgggt ttattggtat aggtacttgc gtgcctggac tcattgataa agatcaaaaa 480 attgttttca ctccgaactc caactggaga gatattgact taaaatcttc gatacaagag 540 aagtacaatg tgtctgtttt tattgaaaat gaggcaaatg ctggcgcata tggagaaaaa 600 ctatttggag ctgcaaaaaa tcacgataac attatttacg taagtatcag cacaggaata 660 gggatcggtg ttattatcaa caatcattta tatagaggag taagcggctt ctctggagaa 720 atgggacata tgacaataga ctttaatggt cctaaatgca gttgcggaaa ccgaggatgc 780 tgggaattgt atgcttcaga gaaggcttta tttaaatctc ttcagaccaa agagaaaaaa 840 ctgtcctatc aagatatcat aaacctcgcc catctgaatg atatcggaac cttaaatgca 900 ttacaaaatt ttggattcta tttaggaata ggccttacca atattctaaa tactctcaac 960 ccacaagccg taattttaag aaatagcata attgaatcgc atcctatggt tttaaattca 1020 atgagaagtg aagtatcatc aagggtttat tcccaattag gcaatagcta tgaattattg 1080 ccatcttcct taggacagaa tgcaccggca ttaggaatgt cctccattgt gattgatcat 1140 tttctggaca tgattacaat g 1161 <210> 91 <211> 66 <212> DNA <213> Bacillus subtilis <400> 91 tgtacttact atatgaaata aaatgcatct gtatttgaat gaatttattt ttaaggggga 60 aatcac 66 <210> 92 <211> 576 <212> DNA <213> Bacillus licheniformis <400> 92 atgagcacag aggatatgac aaaggatacg tatgaagtaa acagttcgac aatggctgtc 60 ctgcctctgg gtgaggggga gaaatccgcc tcaaaaatac ttgagaccga caggactttc 120 cgcgtcaata tgaagccgtt tcaaattatc gaaagaagct gccgctattt cggatcgagc 180 tatgcgggaa gaaaagcggg cacatatgaa gtcattaaag tttcccataa accgccgatc 240 atggtggatc actcaaacaa catttttctt ttccccacat tttcctcaac tcgtcctcag 300 tgcgggtggc tttcccatgc gcatgttcac gagttttgcg cggcaaagta tgacaacacg 360 tttgtcacgt ttgtcaacgg ggaaacgctg gagctgcccg tatccatctc atctttcgaa 420 aaccaggttt accgaacggc atggctgaga acaaaattta tcgacaggat tgaaggaaac 480 cccatgcaga agaaacagga atttatgctc tatccgaaag aagaccggaa tcagctgata 540 tacgaattca tcctcaggga gctgaaaaag cgctat 576 <210> 93 <211> 4946 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 93 tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60 gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120 ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180 gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240 acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300 ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360 caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420 gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480 tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540 ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600 cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660 tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720 tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780 ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840 agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900 ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960 cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020 cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080 cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140 ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200 ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260 ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320 caatcgtgat ttgctgttca tatcttcacc ccgatctatg tcagtataac ctatatgaca 1380 gccggaggtg gagaggcgga gaacggcaca gcaagaagac aaagaagaag agagactgtt 1440 gcctggacct ccgaaacgcg ctacaattca tttacaacac aggatggggt gagaatattg 1500 ccggaatcag tgaagcaggc ctcctaaaat aaaaatctat attttaggag gtaaaacatg 1560 aattttcaaa caatcgagct tgacacatgg tatagaaaat cttattttga ccattacatg 1620 aaggaagcga aatgttcttt cagcatcacg gcaaacgtca atgtgacaaa tttgctcgcc 1680 gtgctcaaga aaaagaagct caagctgtat ccggctttta tttatatcgt atcaagggtc 1740 attcattcgc gccctgagtt tagaacaacg tttgatgaca aaggacagct gggttattgg 1800 gaacaaatgc atccgtgcta tgcgattttt catcaggacg accaaacgtt ttccgccctc 1860 tggacggaat actcagacga tttttcgcag ttttatcatc aatatcttct ggacgccgag 1920 cgctttggag acaaaagggg cctttgggct aagccggaca tcccgcccaa tacgttttca 1980 gtttcttcta ttccatgggt gcgcttttca aacttcaatt taaaccttga taacagcgaa 2040 cacttgctgc cgattattac aaacgggaaa tacttttcag aaggcaggga aacatttttg 2100 cccgtttcct tgcaagttca ccatgcagtg tgtgacggct atcatgccgg cgcttttata 2160 aacgagttgg aacggcttgc cgccgattgt gaggagtggc ttgtgtgaca gaggaaaggc 2220 cgatatgatt cggccttttt tatatgtact tcttagcggg tctctaaaat aaccaaaaag 2280 caaggactgc tgaaagggct gacataagcc ttttgccggc ggtccttttt taattctgat 2340 ttttcaaact tagccccctc gagaaaaccg cttgagtatc ctccgctcat gttattgacc 2400 tccttttctt gatcaatata tttgtatgag cggaaagaaa atttgactag acggatgccc 2460 ctctgttgaa aatcttttta cagcatgtca gaatatgata tgatacaatt caaaggaaag 2520 tttaaactgt tatgattagg agtgtttgca tttatgaaga agattgcaat tgcggcgatt 2580 acagcgacaa gcgtgctggc tctcagcgca tgcagcgggg gagattctga ggttgttgcg 2640 gaaacaaaag ctggaaatat tacaaaagaa gacctttatc aaacattaaa agacaatgcc 2700 ggagcggacg cactgaacat gcttgttcag caaaaagtac tcgatgataa atacgatgtc 2760 tccgacaaag aaatcgacaa aaagctgaac gagtacaaaa aatcaatggg tgaccagctc 2820 aaccagctca ttgaccaaaa aggcgaagac ttcgtcaaag aacagatcaa atacgaactt 2880 ctgatgcaaa aagccgcaaa ggataacata aaagtaaccg atgatgacgt aaaagaatat 2940 tatgacggcc tgaaaggcaa aatccactta agccacattc ttgtgaaaga aaagaaaacg 3000 gctgaagaag ttgagaaaaa gctgaaaaaa ggcgaaaaat tcgaagacct tgcaaaagag 3060 tattcaactg acggtacagc cgaaaaaggc ggcgacctcg gctgggtcgg caaagacgat 3120 aacatggaca aggatttcgt caaagcggca tttgctttga aaaccggcga aatcagcgga 3180 cctgtgaaat cccaattcgg ctatcacatc attaaaaaag acgaagaacg cggcaaatat 3240 gaagacatga aaaaagagct taaaaaagaa gtccaagaac aaaagcaaaa tgatcaaact 3300 gaactgcaat ccgtcattga caaacttgtc aaagatgctg atttaaaagt aaaagacaaa 3360 gagttgaaaa aacaagtcga ccagcgtcaa gctcagacaa gcagcagcag ctgaaagagc 3420 agagaggacg gatttcctga aggaaatccg tttttttatt tttaacatct ctcactgctg 3480 tgtgatttta ctcacggcat ttggaacgcc ggctctcaac aaactttctg tagtgaaaat 3540 catgaaccaa acggatcgtc ggcctgatta acagctgaaa gctgccgatc acaaacatcc 3600 atagtcccgc cggcttcagt tcctcggaga aaaagcagaa gctcccgaca aggaataaaa 3660 ggccgatgag aaaatcgttt aatgtatgta gaactttgta tctttttttg aaaaagagtt 3720 catatcgatt gttattgttt tgcggcattg cttgatcact ccaatccttt tatttaccct 3780 gccggaagcc ggagtgaaac gccggtatac ataggattta tgaattagga aaacatatgg 3840 ggaaataaac catccaggag tgaaaaatat gcggttattc atatgtgcat cgtgcctgtt 3900 cggcttgatt gttccgtcat ttgaaacgaa agcgctgacg tttgaagaat tgccggttaa 3960 acaagcttca aaacaatggg aagttcaaat cggtaaagcc gaagccggaa acggaatggc 4020 gaaaccggaa aaaggagcgt ttcatactta tgctgtcgaa atcaaaaaca ttggacacga 4080 tgtggcttcg gcggaaattt ttgtctatcg gaacgagcct aattcttcaa cgaaattttc 4140 gctttggaac attcctcacg aaaatccggt ttctttagcc aaaagcttaa atcacggaag 4200 ctctgtcaag caccgcaatc tgcttatggc agagaatgcg accgaattgg aagtggacat 4260 gatttggacg gaaaaaggaa gcgaaggcag acttttaaag gaaacgttca ttttcaaggg 4320 agatgaatca tgaagaaaaa atggccgttc atcgtcaacg gtcttttttt aatgacttag 4380 gcagccgatc gttcggccat acgatatcga agcgacctcg aaccagcaga gctcgtcaca 4440 aaacatttgc atttaaagaa aaatacagga tgttttcacc aatatttttc tcaatgatga 4500 tacactattg acaagctgct actttgggag ggtgtttcca tagatgccga tgaagcaaaa 4560 acaccaaatg tgtcatgaga gctctctcta atcgatataa aagtagggtg aaccggggtt 4620 gtcaatctgt aaaagatctt tttttatccc gtgatacgct tttggaattc tgaatcttca 4680 agaaagtccc cagccttttg ctgatcaatc gagaacaaag gatgatacat atgaaaagaa 4740 tagataaaat ctaccatcag ctgctggata attttcgcga aaagaatatc aatcagcttt 4800 taaagataca agggaattcg gctaaagaaa tcgccgggca gctgcaaatg gagcgttcca 4860 atgtcagctt tgaattaaac aatctcgttc gggccaaaaa ggtgatcaag attaaaacgt 4920 tccccgtccg ctacatcccg gtggaa 4946 <210> 94 <211> 1341 <212> DNA <213> Bacillus licheniformis <400> 94 tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60 gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120 ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180 gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240 acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300 ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360 caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420 gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480 tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540 ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600 cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660 tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720 tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780 ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840 agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900 ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960 cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020 cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080 cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140 ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200 ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260 ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320 caatcgtgat ttgctgttca t 1341 <210> 95 <211> 216 <212> DNA <213> Bacillus licheniformis <400> 95 atcttcaccc cgatctatgt cagtataacc tatatgacag ccggaggtgg agaggcggag 60 aacggcacag caagaagaca aagaagaaga gagactgttg cctggacctc cgaaacgcgc 120 tacaattcat ttacaacaca ggatggggtg agaatattgc cggaatcagt gaagcaggcc 180 tcctaaaata aaaatctata ttttaggagg taaaac 216 <210> 96 <211> 648 <212> DNA <213> Bacillus licheniformis <400> 96 atgaattttc aaacaatcga gcttgacaca tggtatagaa aatcttattt tgaccattac 60 atgaaggaag cgaaatgttc tttcagcatc acggcaaacg tcaatgtgac aaatttgctc 120 gccgtgctca agaaaaagaa gctcaagctg tatccggctt ttatttatat cgtatcaagg 180 gtcattcatt cgcgccctga gtttagaaca acgtttgatg acaaaggaca gctgggttat 240 tgggaacaaa tgcatccgtg ctatgcgatt tttcatcagg acgaccaaac gttttccgcc 300 ctctggacgg aatactcaga cgatttttcg cagttttatc atcaatatct tctggacgcc 360 gagcgctttg gagacaaaag gggcctttgg gctaagccgg acatcccgcc caatacgttt 420 tcagtttctt ctattccatg ggtgcgcttt tcaaacttca atttaaacct tgataacagc 480 gaacacttgc tgccgattat tacaaacggg aaatactttt cagaaggcag ggaaacattt 540 ttgcccgttt ccttgcaagt tcaccatgca gtgtgtgacg gctatcatgc cggcgctttt 600 ataaacgagt tggaacggct tgccgccgat tgtgaggagt ggcttgtg 648 <210> 97 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 97 aaaggccgat atgattcggc cttttttata tgtacttctt agcgggtctc taaaataacc 60 aaaaagcaag gactgctgaa agggctgaca taagcctttt gccggcggtc cttttttaat 120 tctgattttt caaacttagc cccctcgag 149 <210> 98 <211> 60 <212> DNA <213> Bacillus licheniformis <400> 98 tgacagagga aaggccgata tgattcggcc ttttttatat gtacttctta gcgggtctct 60 60 <210> 99 <211> 98 <212> DNA <213> Bacillus subtilis <400> 99 aaaataacca aaaagcaagg actgctgaaa gggctgacat aagccttttg ccggcggtcc 60 ttttttaatt ctgatttttc aaacttagcc ccctcgag 98 <210> 100 <211> 190 <212> DNA <213> Bacillus licheniformis <400> 100 aaaaccgctt gagtatcctc cgctcatgtt attgacctcc ttttcttgat caatatattt 60 gtatgagcgg aaagaaaatt tgactagacg gatgcccctc tgttgaaaat ctttttacag 120 catgtcagaa tatgatatga tacaattcaa aggaaagttt aaactgttat gattaggagt 180 gtttgcattt 190 <210> 101 <211> 861 <212> DNA <213> Bacillus licheniformis <400> 101 atgaagaaga ttgcaattgc ggcgattaca gcgacaagcg tgctggctct cagcgcatgc 60 agcgggggag attctgaggt tgttgcggaa acaaaagctg gaaatattac aaaagaagac 120 ctttatcaaa cattaaaaga caatgccgga gcggacgcac tgaacatgct tgttcagcaa 180 aaagtactcg atgataaata cgatgtctcc gacaaagaaa tcgacaaaaa gctgaacgag 240 tacaaaaaat caatgggtga ccagctcaac cagctcattg accaaaaagg cgaagacttc 300 gtcaaagaac agatcaaata cgaacttctg atgcaaaaag ccgcaaagga taacataaaa 360 gtaaccgatg atgacgtaaa agaatattat gacggcctga aaggcaaaat ccacttaagc 420 cacattcttg tgaaagaaaa gaaaacggct gaagaagttg agaaaaagct gaaaaaaggc 480 gaaaaattcg aagaccttgc aaaagagtat tcaactgacg gtacagccga aaaaggcggc 540 gacctcggct gggtcggcaa agacgataac atggacaagg atttcgtcaa agcggcattt 600 gctttgaaaa ccggcgaaat cagcggacct gtgaaatccc aattcggcta tcacatcatt 660 aaaaaagacg aagaacgcgg caaatatgaa gacatgaaaa aagagcttaa aaaagaagtc 720 caagaacaaa agcaaaatga tcaaactgaa ctgcaatccg tcattgacaa acttgtcaaa 780 gatgctgatt taaaagtaaa agacaaagag ttgaaaaaac aagtcgacca gcgtcaagct 840 cagacaagca gcagcagctg a 861 <210> 102 <211> 34 <212> DNA <213> Bacillus licheniformis <400> 102 cggatttcct gaaggaaatc cgttttttta tttt 34 <210> 103 <211> 1484 <212> DNA <213> Bacillus licheniformis <400> 103 taacatctct cactgctgtg tgattttact cacggcattt ggaacgccgg ctctcaacaa 60 actttctgta gtgaaaatca tgaaccaaac ggatcgtcgg cctgattaac agctgaaagc 120 tgccgatcac aaacatccat agtcccgccg gcttcagttc ctcggagaaa aagcagaagc 180 tcccgacaag gaataaaagg ccgatgagaa aatcgtttaa tgtatgtaga actttgtatc 240 tttttttgaa aaagagttca tatcgattgt tattgttttg cggcattgct tgatcactcc 300 aatcctttta tttaccctgc cggaagccgg agtgaaacgc cggtatacat aggatttatg 360 aattaggaaa acatatgggg aaataaacca tccaggagtg aaaaatatgc ggttattcat 420 atgtgcatcg tgcctgttcg gcttgattgt tccgtcattt gaaacgaaag cgctgacgtt 480 tgaagaattg ccggttaaac aagcttcaaa acaatgggaa gttcaaatcg gtaaagccga 540 agccggaaac ggaatggcga aaccggaaaa aggagcgttt catacttatg ctgtcgaaat 600 caaaaacatt ggacacgatg tggcttcggc ggaaattttt gtctatcgga acgagcctaa 660 ttcttcaacg aaattttcgc tttggaacat tcctcacgaa aatccggttt ctttagccaa 720 aagcttaaat cacggaagct ctgtcaagca ccgcaatctg cttatggcag agaatgcgac 780 cgaattggaa gtggacatga tttggacgga aaaaggaagc gaaggcagac ttttaaagga 840 aacgttcatt ttcaagggag atgaatcatg aagaaaaaat ggccgttcat cgtcaacggt 900 ctttttttaa tgacttaggc agccgatcgt tcggccatac gatatcgaag cgacctcgaa 960 ccagcagagc tcgtcacaaa acatttgcat ttaaagaaaa atacaggatg ttttcaccaa 1020 tatttttctc aatgatgata cactattgac aagctgctac tttgggaggg tgtttccata 1080 gatgccgatg aagcaaaaac accaaatgtg tcatgagagc tctctctaat cgatataaaa 1140 gtagggtgaa ccggggttgt caatctgtaa aagatctttt tttatcccgt gatacgcttt 1200 tggaattctg aatcttcaag aaagtcccca gccttttgct gatcaatcga gaacaaagga 1260 tgatacatat gaaaagaata gataaaatct accatcagct gctggataat tttcgcgaaa 1320 agaatatcaa tcagctttta aagatacaag ggaattcggc taaagaaatc gccgggcagc 1380 tgcaaatgga gcgttccaat gtcagctttg aattaaacaa tctcgttcgg gccaaaaagg 1440 tgatcaagat taaaacgttc cccgtccgct acatcccggt ggaa 1484 <210> 104 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 104 tcgttctgaa tgagcaagca 20 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 105 tgttaatcag gccgacgatc 20 <210> 106 <211> 2676 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 106 tcgttctgaa tgagcaagca aatcgaccgc tttctcaatc cttttctgca ggatgtattc 60 tgccggcgag acgcctttga ttcgtttaaa tgtccgctgc aggtgaaaag ggctgatatg 120 gcacctgtca gccaaagctt gcagagacag cggatcgcga taagattcct cgatgatttc 180 caccacacgc tgtgccagct cttcatccgg cagcagcgcc ccggccggat tgcagcgttt 240 gcaggggcgg tacccttctg ataaagcatc ttttgcattg aaaaagatct gcacattgtc 300 gatttgcgga actctcgatt tgcaggaagg gcggcaaaat atgccggtcg ttttgaccgc 360 gtaataaaaa actccgtcat aggcggaatc gttttccgta atcgcccgcc acatttcagg 420 cgtcaatcgt gatttgctgt tcatatcttc accccgatct atgtcagtat aacctatatg 480 acagccggag gtggagaggc ggagaacggc acagcaagaa gacaaagaag aagagagact 540 gttgcctgga cctccgaaac gcgctacaat tcatttacaa cacaggatgg ggtgagaata 600 ttgccggaat cagtgaagca ggcctcctaa aataaaaatc tatattttag gaggtaaaac 660 atgaattttc aaacaatcga gcttgacaca tggtatagaa aatcttattt tgaccattac 720 atgaaggaag cgaaatgttc tttcagcatc acggcaaacg tcaatgtgac aaatttgctc 780 gccgtgctca agaaaaagaa gctcaagctg tatccggctt ttatttatat cgtatcaagg 840 gtcattcatt cgcgccctga gtttagaaca acgtttgatg acaaaggaca gctgggttat 900 tgggaacaaa tgcatccgtg ctatgcgatt tttcatcagg acgaccaaac gttttccgcc 960 ctctggacgg aatactcaga cgatttttcg cagttttatc atcaatatct tctggacgcc 1020 gagcgctttg gagacaaaag gggcctttgg gctaagccgg acatcccgcc caatacgttt 1080 tcagtttctt ctattccatg ggtgcgcttt tcaaacttca atttaaacct tgataacagc 1140 gaacacttgc tgccgattat tacaaacggg aaatactttt cagaaggcag ggaaacattt 1200 ttgcccgttt ccttgcaagt tcaccatgca gtgtgtgacg gctatcatgc cggcgctttt 1260 ataaacgagt tggaacggct tgccgccgat tgtgaggagt ggcttgtgtg acagaggaaa 1320 ggccgatatg attcggcctt ttttatatgt acttcttagc gggtctctaa aataaccaaa 1380 aagcaaggac tgctgaaagg gctgacataa gccttttgcc ggcggtcctt ttttaattct 1440 gatttttcaa acttagcccc ctcgagaaaa ccgcttgagt atcctccgct catgttattg 1500 acctcctttt cttgatcaat atatttgtat gagcggaaag aaaatttgac tagacggatg 1560 cccctctgtt gaaaatcttt ttacagcatg tcagaatatg atatgataca attcaaagga 1620 aagtttaaac tgttatgatt aggagtgttt gcatttatga agaagattgc aattgcggcg 1680 attacagcga caagcgtgct ggctctcagc gcatgcagcg ggggagattc tgaggttgtt 1740 gcggaaacaa aagctggaaa tattacaaaa gaagaccttt atcaaacatt aaaagacaat 1800 gccggagcgg acgcactgaa catgcttgtt cagcaaaaag tactcgatga taaatacgat 1860 gtctccgaca aagaaatcga caaaaagctg aacgagtaca aaaaatcaat gggtgaccag 1920 ctcaaccagc tcattgacca aaaaggcgaa gacttcgtca aagaacagat caaatacgaa 1980 cttctgatgc aaaaagccgc aaaggataac ataaaagtaa ccgatgatga cgtaaaagaa 2040 tattatgacg gcctgaaagg caaaatccac ttaagccaca ttcttgtgaa agaaaagaaa 2100 acggctgaag aagttgagaa aaagctgaaa aaaggcgaaa aattcgaaga ccttgcaaaa 2160 gagtattcaa ctgacggtac agccgaaaaa ggcggcgacc tcggctgggt cggcaaagac 2220 gataacatgg acaaggattt cgtcaaagcg gcatttgctt tgaaaaccgg cgaaatcagc 2280 ggacctgtga aatcccaatt cggctatcac atcattaaaa aagacgaaga acgcggcaaa 2340 tatgaagaca tgaaaaaaga gcttaaaaaa gaagtccaag aacaaaagca aaatgatcaa 2400 actgaactgc aatccgtcat tgacaaactt gtcaaagatg ctgatttaaa agtaaaagac 2460 aaagagttga aaaaacaagt cgaccagcgt caagctcaga caagcagcag cagctgaaag 2520 agcagagagg acggatttcc tgaaggaaat ccgttttttt atttttaaca tctctcactg 2580 ctgtgtgatt ttactcacgg catttggaac gccggctctc aacaaacttt ctgtagtgaa 2640 aatcatgaac caaacggatc gtcggcctga ttaaca 2676 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 107 aacctatatg acagccggag 20 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 108 ggcaaaatcc acttaagcca c 21 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 109 aacgagttgg aacggcttgc 20 <210> 110 <211> 686 <212> DNA <213> Bacillus licheniformis <400> 110 cctcctaaaa taaaaatcta tattttagga ggtaaaacat gaattttcaa acaatcgagc 60 ttgacacatg gtatagaaaa tcttattttg accattacat gaaggaagcg aaatgttctt 120 tcagcatcac ggcaaacgtc aatgtgacaa atttgctcgc cgtgctcaag aaaaagaagc 180 tcaagctgta tccggctttt atttatatcg tatcaagggt cattcattcg cgccctgagt 240 ttagaacaac gtttgatgac aaaggacagc tgggttattg ggaacaaatg catccgtgct 300 atgcgatttt tcatcaggac gaccaaacgt tttccgccct ctggacggaa tactcagacg 360 atttttcgca gttttatcat caatatcttc tggacgccga gcgctttgga gacaaaaggg 420 gcctttgggc taagccggac atcccgccca atacgttttc agtttcttct attccatggg 480 tgcgcttttc aaacttcaat ttaaaccttg ataacagcga acacttgctg ccgattatta 540 caaacgggaa atacttttca gaaggcaggg aaacattttt gcccgtttcc ttgcaagttc 600 accatgcagt gtgtgacggc tatcatgccg gcgcttttat aaacgagttg gaacggcttg 660 ccgccgattg tgaggagtgg cttgtg 686 <210> 111 <211> 4260 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 111 tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60 gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120 ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180 gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240 acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300 ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360 caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420 gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480 tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540 ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600 cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660 tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720 tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780 ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840 agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900 ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960 cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020 cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080 cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140 ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200 ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260 ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320 caatcgtgat ttgctgttca tatcttcacc ccgatctatg tcagtataac ctatatgaca 1380 gccggaggtg gagaggcgga gaacggcaca gcaagaagac aaagaagaag agagactgtt 1440 gcctggacct ccgaaacgcg ctacaattca tttacaacac aggatggggt gagaatattg 1500 ccggaatcag tgaagcaggt gacagaggaa aggccgatat gattcggcct tttttatatg 1560 tacttcttag cgggtctcta aaataaccaa aaagcaagga ctgctgaaag ggctgacata 1620 agccttttgc cggcggtcct tttttaattc tgatttttca aacttagccc cctcgagaaa 1680 accgcttgag tatcctccgc tcatgttatt gacctccttt tcttgatcaa tatatttgta 1740 tgagcggaaa gaaaatttga ctagacggat gcccctctgt tgaaaatctt tttacagcat 1800 gtcagaatat gatatgatac aattcaaagg aaagtttaaa ctgttatgat taggagtgtt 1860 tgcatttatg aagaagattg caattgcggc gattacagcg acaagcgtgc tggctctcag 1920 cgcatgcagc gggggagatt ctgaggttgt tgcggaaaca aaagctggaa atattacaaa 1980 agaagacctt tatcaaacat taaaagacaa tgccggagcg gacgcactga acatgcttgt 2040 tcagcaaaaa gtactcgatg ataaatacga tgtctccgac aaagaaatcg acaaaaagct 2100 gaacgagtac aaaaaatcaa tgggtgacca gctcaaccag ctcattgacc aaaaaggcga 2160 agacttcgtc aaagaacaga tcaaatacga acttctgatg caaaaagccg caaaggataa 2220 cataaaagta accgatgatg acgtaaaaga atattatgac ggcctgaaag gcaaaatcca 2280 cttaagccac attcttgtga aagaaaagaa aacggctgaa gaagttgaga aaaagctgaa 2340 aaaaggcgaa aaattcgaag accttgcaaa agagtattca actgacggta cagccgaaaa 2400 aggcggcgac ctcggctggg tcggcaaaga cgataacatg gacaaggatt tcgtcaaagc 2460 ggcatttgct ttgaaaaccg gcgaaatcag cggacctgtg aaatcccaat tcggctatca 2520 catcattaaa aaagacgaag aacgcggcaa atatgaagac atgaaaaaag agcttaaaaa 2580 agaagtccaa gaacaaaagc aaaatgatca aactgaactg caatccgtca ttgacaaact 2640 tgtcaaagat gctgatttaa aagtaaaaga caaagagttg aaaaaacaag tcgaccagcg 2700 tcaagctcag acaagcagca gcagctgaaa gagcagagag gacggatttc ctgaaggaaa 2760 tccgtttttt tatttttaac atctctcact gctgtgtgat tttactcacg gcatttggaa 2820 cgccggctct caacaaactt tctgtagtga aaatcatgaa ccaaacggat cgtcggcctg 2880 attaacagct gaaagctgcc gatcacaaac atccatagtc ccgccggctt cagttcctcg 2940 gagaaaaagc agaagctccc gacaaggaat aaaaggccga tgagaaaatc gtttaatgta 3000 tgtagaactt tgtatctttt tttgaaaaag agttcatatc gattgttatt gttttgcggc 3060 attgcttgat cactccaatc cttttattta ccctgccgga agccggagtg aaacgccggt 3120 atacatagga tttatgaatt aggaaaacat atggggaaat aaaccatcca ggagtgaaaa 3180 atatgcggtt attcatatgt gcatcgtgcc tgttcggctt gattgttccg tcatttgaaa 3240 cgaaagcgct gacgtttgaa gaattgccgg ttaaacaagc ttcaaaacaa tgggaagttc 3300 aaatcggtaa agccgaagcc ggaaacggaa tggcgaaacc ggaaaaagga gcgtttcata 3360 cttatgctgt cgaaatcaaa aacattggac acgatgtggc ttcggcggaa atttttgtct 3420 atcggaacga gcctaattct tcaacgaaat tttcgctttg gaacattcct cacgaaaatc 3480 cggtttcttt agccaaaagc ttaaatcacg gaagctctgt caagcaccgc aatctgctta 3540 tggcagagaa tgcgaccgaa ttggaagtgg acatgatttg gacggaaaaa ggaagcgaag 3600 gcagactttt aaaggaaacg ttcattttca agggagatga atcatgaaga aaaaatggcc 3660 gttcatcgtc aacggtcttt ttttaatgac ttaggcagcc gatcgttcgg ccatacgata 3720 tcgaagcgac ctcgaaccag cagagctcgt cacaaaacat ttgcatttaa agaaaaatac 3780 aggatgtttt caccaatatt tttctcaatg atgatacact attgacaagc tgctactttg 3840 ggagggtgtt tccatagatg ccgatgaagc aaaaacacca aatgtgtcat gagagctctc 3900 tctaatcgat ataaaagtag ggtgaaccgg ggttgtcaat ctgtaaaaga tcttttttta 3960 tcccgtgata cgcttttgga attctgaatc ttcaagaaag tccccagcct tttgctgatc 4020 aatcgagaac aaaggatgat acatatgaaa agaatagata aaatctacca tcagctgctg 4080 gataattttc gcgaaaagaa tatcaatcag cttttaaaga tacaagggaa ttcggctaaa 4140 gaaatcgccg ggcagctgca aatggagcgt tccaatgtca gctttgaatt aaacaatctc 4200 gttcgggcca aaaaggtgat caagattaaa acgttccccg tccgctacat cccggtggaa 4260 4260 <210> 112 <211> 1990 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 112 tcgttctgaa tgagcaagca aatcgaccgc tttctcaatc cttttctgca ggatgtattc 60 tgccggcgag acgcctttga ttcgtttaaa tgtccgctgc aggtgaaaag ggctgatatg 120 gcacctgtca gccaaagctt gcagagacag cggatcgcga taagattcct cgatgatttc 180 caccacacgc tgtgccagct cttcatccgg cagcagcgcc ccggccggat tgcagcgttt 240 gcaggggcgg tacccttctg ataaagcatc ttttgcattg aaaaagatct gcacattgtc 300 gatttgcgga actctcgatt tgcaggaagg gcggcaaaat atgccggtcg ttttgaccgc 360 gtaataaaaa actccgtcat aggcggaatc gttttccgta atcgcccgcc acatttcagg 420 cgtcaatcgt gatttgctgt tcatatcttc accccgatct atgtcagtat aacctatatg 480 acagccggag gtggagaggc ggagaacggc acagcaagaa gacaaagaag aagagagact 540 gttgcctgga cctccgaaac gcgctacaat tcatttacaa cacaggatgg ggtgagaata 600 ttgccggaat cagtgaagca ggtgacagag gaaaggccga tatgattcgg ccttttttat 660 atgtacttct tagcgggtct ctaaaataac caaaaagcaa ggactgctga aagggctgac 720 ataagccttt tgccggcggt ccttttttaa ttctgatttt tcaaacttag ccccctcgag 780 aaaaccgctt gagtatcctc cgctcatgtt attgacctcc ttttcttgat caatatattt 840 gtatgagcgg aaagaaaatt tgactagacg gatgcccctc tgttgaaaat ctttttacag 900 catgtcagaa tatgatatga tacaattcaa aggaaagttt aaactgttat gattaggagt 960 gtttgcattt atgaagaaga ttgcaattgc ggcgattaca gcgacaagcg tgctggctct 1020 cagcgcatgc agcgggggag attctgaggt tgttgcggaa acaaaagctg gaaatattac 1080 aaaagaagac ctttatcaaa cattaaaaga caatgccgga gcggacgcac tgaacatgct 1140 tgttcagcaa aaagtactcg atgataaata cgatgtctcc gacaaagaaa tcgacaaaaa 1200 gctgaacgag tacaaaaaat caatgggtga ccagctcaac cagctcattg accaaaaagg 1260 cgaagacttc gtcaaagaac agatcaaata cgaacttctg atgcaaaaag ccgcaaagga 1320 taacataaaa gtaaccgatg atgacgtaaa agaatattat gacggcctga aaggcaaaat 1380 ccacttaagc cacattcttg tgaaagaaaa gaaaacggct gaagaagttg agaaaaagct 1440 gaaaaaaggc gaaaaattcg aagaccttgc aaaagagtat tcaactgacg gtacagccga 1500 aaaaggcggc gacctcggct gggtcggcaa agacgataac atggacaagg atttcgtcaa 1560 agcggcattt gctttgaaaa ccggcgaaat cagcggacct gtgaaatccc aattcggcta 1620 tcacatcatt aaaaaagacg aagaacgcgg caaatatgaa gacatgaaaa aagagcttaa 1680 aaaagaagtc caagaacaaa agcaaaatga tcaaactgaa ctgcaatccg tcattgacaa 1740 acttgtcaaa gatgctgatt taaaagtaaa agacaaagag ttgaaaaaac aagtcgacca 1800 gcgtcaagct cagacaagca gcagcagctg aaagagcaga gaggacggat ttcctgaagg 1860 aaatccgttt ttttattttt aacatctctc actgctgtgt gattttactc acggcatttg 1920 gaacgccggc tctcaacaaa ctttctgtag tgaaaatcat gaaccaaacg gatcgtcggc 1980 ctgattaaca 1990 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 113 gggtacctcc atggtaaagt 20 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 114 acgtattaat gcagtagccg 20 <210> 115 <211> 2067 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 115 gggtacctcc atggtaaagt ttcgacttaa agcggagatc aaaaaatagc ctggtttacc 60 attttccaca tttttaaatt tatacccctt tcaaaagtca taaaactatc atattctgta 120 ataccacttt tcggaggtga gaatatgtca tactctaata gcttcgcttt gattgttgta 180 ttatttattt tgctgatcat tgtgggctcc gcttttgtaa agtattaatt cattcgcgca 240 cgaagccttc ttccgaaaaa ctgcaggttc atatcgaaag gcgctccgct tttcatatga 300 gcctgttttt ttgtaattta aaaagaattt atttccacaa taacaaaaaa tgtttataat 360 aggataggct ctgagctgac ggctgacggc gctcggaaat aaaaactctc ccacaaatga 420 aacttttata caacattttc gtcttatact gttgttaagg caattcaata acggaaagga 480 aaagatcaat gttaaataag ctaagaatgt tgtatgaaaa aacaacaatg aagtggctgc 540 tcaacacttc ctattacttt ctcattctgg tgctgctgtt tttaatttac ggattccata 600 cagcaaatac aggttcatat atttataatg acttttaatg gagaagaaaa caatgaaact 660 gattgaaaca attaaaaaat accacaaatg tgcttgatgg atccgtctta ttcggaagag 720 ctgcttccgg agctgagctt gtttatgttc tgcggagaaa cgcttcctgc gtcagtcgcc 780 agacagctta aagaaagatt tccaaaggct cgtgttttta acacatacgg cccgaccgaa 840 gcgaccgttg ccgtcacttc catcgaagta acagacgacg tattaaacaa gtattcttct 900 cttcccgtcg gttctgaaaa gcccgaaacc gaaatcgtaa tcatcaatga agacggaaaa 960 gccgtccaag acggggaaaa aggcgagatc ataattaccg gagcaagcgt cagcaaaggc 1020 tatttaggcg aaaaagcgct gacggaaaaa gcgtttttct cttacaacgg ctcccctgct 1080 taccgcaccg gtgacgcagg ttacaaagaa aacggccagc tcttcttcct cggaagactc 1140 gatttccaaa tcaaactgca cggctaccgg attgagcttg aagaaatcga atatcaaatc 1200 aatcagtccc gatatgtgca gtcggcagtc gttattccat tctaccgcga ggagaaaatc 1260 gagtatctga tcgccatgat tgtgcctgcc gaacacgatt tcgaaaagga ataccagtta 1320 accagcgcga ttaagaaaga tttgggcagc aagctgccgg cctatatgat tccgagaaaa 1380 ttcatgtatc aaaaagagat tccgatgaca gcaaacggta aaatcgaccg caagagatta 1440 aaagaagagg taaccgtatg acgccttatg gttcatttct tttcttcatt atattaggaa 1500 ttttactggc gccgaccatc attctcggat tgaacggaaa aagcttccgc ttatataata 1560 tggcggtttc cgttctggtt ctggcgctta ttttttcgaa cagcctgcac gggctgatca 1620 tgctgtgcct gtttacgctt tggcagacgg ttctgatcaa aggctatatc gcttaccgtc 1680 taaaagcgaa cagcggcatc gtattttgtc tggctgcagc agcttctatc ctgcctctgg 1740 cactgtcaaa gctgctgccg tttttcgccg ttgacaactg ggcaacattt ctcggaatct 1800 cgtatttaac ttttaaaggg gttcagctca tcattgaaac ccgcgacggt ctcattaaaa 1860 agcagctccc aatcagcaga ctgctttact ttattctctt ttttccaacc atctcgtcag 1920 gtccgatcga caggtaccgc cgttttgaaa aagacgatca gacggtttgg acaaaggagc 1980 aatacgaaga actgctttac aaaggaatca ataaaatttt tctcggcttt ttgtacaaat 2040 tcattatcgg ctactgcatt aatacgt 2067 <210> 116 <211> 2767 <212> DNA <213> Bacillus licheniformis <400> 116 gggtacctcc atggtaaagt ttcgacttaa agcggagatc aaaaaatagc ctggtttacc 60 attttccaca tttttaaatt tatacccctt tcaaaagtca taaaactatc atattctgta 120 ataccacttt tcggaggtga gaatatgtca tactctaata gcttcgcttt gattgttgta 180 ttatttattt tgctgatcat tgtgggctcc gcttttgtaa agtattaatt cattcgcgca 240 cgaagccttc ttccgaaaaa ctgcaggttc atatcgaaag gcgctccgct tttcatatga 300 gcctgttttt ttgtaattta aaaagaattt atttccacaa taacaaaaaa tgtttataat 360 aggataggct ctgagctgac ggctgacggc gctcggaaat aaaaactctc ccacaaatga 420 aacttttata caacattttc gtcttatact gttgttaagg caattcaata acggaaagga 480 aaagatcaat gttaaataag ctaagaatgt tgtatgaaaa aacaacaatg aagtggctgc 540 tcaacacttc ctattacttt ctcattctgg tgctgctgtt tttaatttac ggattccata 600 cagcaaatac aggttcatat atttataatg acttttaatg gagaagaaaa caatgaaact 660 gattgaaaca attaaaaaat acgcgcaaac acaacccgat acccttgctt ttgtgaatga 720 agaagaaaag ctgacatacg gagagctttg gtcacaatct gagcgccttg ccgcaaggat 780 tcaaagcgaa gctttaacag atgcttctcc gatcattgtc tacggacata tgaaaccggt 840 tatggcggtt tccttcctgg cttgtgtaaa agccgggcat ccgtacattc cagttgacgt 900 atcgattccg gcagaccgga ttctgaaaat catcaacagt tcaaaagccg agcttctgct 960 caataattca ggcacttcgg ttgacacggg agatgccctc atttccgtag tggaaccggg 1020 cgttcttgaa ggagacggga tgccggagac agatcccgga cgctgggtac atggggaaga 1080 tactttttac attatctaca catccggaag cacgggaaat ccaaaaggcg tgcaaatctc 1140 agccgataac cttcagagct tcacagattg gatcacgaat gactttccgg tggaaagcgg 1200 ccaagtgttc ttaaatcaag ccccgttttc ctttgattta tcggtaatgg acctttatcc 1260 gtgcctgcag tccggaggca ccttatggac ggttacgaaa gacatgatta atcggccgaa 1320 actattgttt gaagcactga aacagtccaa cgtcaacgtc tggacatcga cgccttcatt 1380 cgcacaaatg tgcttgatgg atccgtctta ttcggaagag ctgcttccgg agctgagctt 1440 gtttatgttc tgcggagaaa cgcttcctgc gtcagtcgcc agacagctta aagaaagatt 1500 tccaaaggct cgtgttttta acacatacgg cccgaccgaa gcgaccgttg ccgtcacttc 1560 catcgaagta acagacgacg tattaaacaa gtattcttct cttcccgtcg gttctgaaaa 1620 gcccgaaacc gaaatcgtaa tcatcaatga agacggaaaa gccgtccaag acggggaaaa 1680 aggcgagatc ataattaccg gagcaagcgt cagcaaaggc tatttaggcg aaaaagcgct 1740 gacggaaaaa gcgtttttct cttacaacgg ctcccctgct taccgcaccg gtgacgcagg 1800 ttacaaagaa aacggccagc tcttcttcct cggaagactc gatttccaaa tcaaactgca 1860 cggctaccgg attgagcttg aagaaatcga atatcaaatc aatcagtccc gatatgtgca 1920 gtcggcagtc gttattccat tctaccgcga ggagaaaatc gagtatctga tcgccatgat 1980 tgtgcctgcc gaacacgatt tcgaaaagga ataccagtta accagcgcga ttaagaaaga 2040 tttgggcagc aagctgccgg cctatatgat tccgagaaaa ttcatgtatc aaaaagagat 2100 tccgatgaca gcaaacggta aaatcgaccg caagagatta aaagaagagg taaccgtatg 2160 acgccttatg gttcatttct tttcttcatt atattaggaa ttttactggc gccgaccatc 2220 attctcggat tgaacggaaa aagcttccgc ttatataata tggcggtttc cgttctggtt 2280 ctggcgctta ttttttcgaa cagcctgcac gggctgatca tgctgtgcct gtttacgctt 2340 tggcagacgg ttctgatcaa aggctatatc gcttaccgtc taaaagcgaa cagcggcatc 2400 gtattttgtc tggctgcagc agcttctatc ctgcctctgg cactgtcaaa gctgctgccg 2460 tttttcgccg ttgacaactg ggcaacattt ctcggaatct cgtatttaac ttttaaaggg 2520 gttcagctca tcattgaaac ccgcgacggt ctcattaaaa agcagctccc aatcagcaga 2580 ctgctttact ttattctctt ttttccaacc atctcgtcag gtccgatcga caggtaccgc 2640 cgttttgaaa aagacgatca gacggtttgg acaaaggagc aatacgaaga actgctttac 2700 aaaggaatca ataaaatttt tctcggcttt ttgtacaaat tcattatcgg ctactgcatt 2760 aatacgt 2767 <210> 117 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 117 ggatacgccg atttcaatgg c 21 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 118 ggctatgtgc tgggggaatt 20 <210> 119 <211> 1523 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 119 ggatacgccg atttcaatgg caagctgatt taaggagaga ttgtgttcaa tcatgtactg 60 gagaacaaaa tctcttttga tatgaatctt ttttaccatg attactcccc tttctaatct 120 cttatgtttc tttttatcta cattgaacat atacgatttg ttaacttttg tcaatacttt 180 taccatccat atgtttccta taggcaatat tcgtactaaa atattttata ataagagatt 240 gcgaggtttt ggccatgacg aactttggac accatttacg acaattaagg gaacggaaaa 300 aactgaccgt caatcaactg gcgatgtatt ccggcgtcag ttcggcaggc atttcgcgaa 360 tcgaaaacgg aaagcgcggc gtgccgaagc cggcgacgat cagaaaactg gcggacgctt 420 tgaaagtccc gtatgaggaa ctgatggcat ctgcaggcta tatcagcgcg tctacagtcc 480 aggaagcaag aagcagctat gattccattt acgacatcgt gtcacagtac gatttagagg 540 acctttctct gtttgacagc gaaaagtgga aggtgctttc aaaaaaagac atcgaaaacc 600 tggacaaata tttcgacttt ctcgtgcagg aagcaagcag ccgaaacaaa aactgaatac 660 ttctccgcgg cacactctcc tctctatcat tttcgtctgt ttacgatcct gctgttattt 720 tatcccttat gttaactttt gtcaatattt ttcctgtcta agtatttcct atagtcaaca 780 tttgtattaa aatgttcata tcatgaattt gcggggggga tggcgatgac aaggcaatca 840 taaaaagccg aatttccctt ttaggagaag ttcggctttt ttcggctgcc ttaagcggca 900 tccggattcg gcgtcttgcc tttatgatgc ttaacggggc tcagcgcacg ctcgagccat 960 cccatgaaca gatcggcgat gatcgccatc agcgccgtcg ggatcgcgcc tgctagaatg 1020 atcgctgttc cgttggtcgc gtttgatccc ctgacaatga tatccccgag gccgcctgcg 1080 ccgacaaacg tgccgatggc cgtaatgccg atcgcgatga cgagcgcggt tctgagcccc 1140 gccataatga ccgacaaggc gaggggaagc tccaccatcc ggagcacttg aaatttcgtc 1200 atgcccatcg ccttccctga ttcaagatag gcatgctcga tgctggcgat tcccgtatat 1260 gtgtttcgaa tgatcggcaa cagcgaatac aaaaacaatg aaagaatcac cgtgtttgcg 1320 ccgagcccca tgacaagcat caagacggcg agcatcgcca gcgccggaac cgtttgaatg 1380 acattagtga tggaaaagac ccatttgctg attttacggt atctggcgat gaaaatgccg 1440 gccgggatgc cgacgacggc ggcgaacaat acgccgtatg ccgacattaa aaagtggcgg 1500 taaaattccc ccagcacata gcc 1523 <210> 120 <211> 1922 <212> DNA <213> Bacillus licheniformis <400> 120 ggatacgccg atttcaatgg caagctgatt taaggagaga ttgtgttcaa tcatgtactg 60 gagaacaaaa tctcttttga tatgaatctt ttttaccatg attactcccc tttctaatct 120 cttatgtttc tttttatcta cattgaacat atacgatttg ttaacttttg tcaatacttt 180 taccatccat atgtttccta taggcaatat tcgtactaaa atattttata ataagagatt 240 gcgaggtttt ggccatgacg aactttggac accatttacg acaattaagg gaacggaaaa 300 aactgaccgt caatcaactg gcgatgtatt ccggcgtcag ttcggcaggc atttcgcgaa 360 tcgaaaacgg aaagcgcggc gtgccgaagc cggcgacgat cagaaaactg gcggacgctt 420 tgaaagtccc gtatgaggaa ctgatggcat ctgcaggcta tatcagcgcg tctacagtcc 480 aggaagcaag aagcagctat gattccattt acgacatcgt gtcacagtac gatttagagg 540 acctttctct gtttgacagc gaaaagtgga aggtgctttc aaaaaaagac atcgaaaacc 600 tggacaaata tttcgacttt ctcgtgcagg aagcaagcag ccgaaacaaa aactgaatac 660 ttctccgcgg cacactctcc tctctatcat tttcgtctgt ttacgatcct gctgttattt 720 tatcccttat gttaactttt gtcaatattt ttcctgtcta agtatttcct atagtcaaca 780 tttgtattaa aatgttcata tcatgaattt gcggggggga tggcgatgac aaggttcggc 840 gagcggctca aagagctgag ggaacaaaga agcctgtcgg ttaatcagct tgccatgtat 900 gccggtgtga gcgccgcagc catttccaga gccgcagcca tttccagaat cgaaaacggc 960 caccgcggcg ttcccaagcc cgcgacgatc agaaaattgg ccgaggctct gaaaatgccg 1020 tacgagcagc tcatggatat tgccggttat atgagagctg acgagattcg cgaacagccg 1080 cgcggctatg tcacgatgca ggagatcgcg gccaagcacg gcgtcgaaga cctgtggctg 1140 tttaaacccg agaaatggga ctgtttgtcc cgcgaagacc tgctcaacct cgaacagtat 1200 tttcattttt tggttaatga agcgaagaag cgccaatcat aaaaagccga atttcccttt 1260 taggagaagt tcggcttttt tcggctgcct taagcggcat ccggattcgg cgtcttgcct 1320 ttatgatgct taacggggct cagcgcacgc tcgagccatc ccatgaacag atcggcgatg 1380 atcgccatca gcgccgtcgg gatcgcgcct gctagaatga tcgctgttcc gttggtcgcg 1440 tttgatcccc tgacaatgat atccccgagg ccgcctgcgc cgacaaacgt gccgatggcc 1500 gtaatgccga tcgcgatgac gagcgcggtt ctgagccccg ccataatgac cgacaaggcg 1560 aggggaagct ccaccatccg gagcacttga aatttcgtca tgcccatcgc cttccctgat 1620 tcaagatagg catgctcgat gctggcgatt cccgtatatg tgtttcgaat gatcggcaac 1680 agcgaataca aaaacaatga aagaatcacc gtgtttgcgc cgagccccat gacaagcatc 1740 aagacggcga gcatcgccag cgccggaacc gtttgaatga cattagtgat ggaaaagacc 1800 catttgctga ttttacggta tctggcgatg aaaatgccgg ccgggatgcc gacgacggcg 1860 gcgaacaata cgccgtatgc cgacattaaa aagtggcggt aaaattcccc cagcacatag 1920 cc 1922 <210> 121 <211> 1413 <212> DNA <213> Bacillus licheniformis <400> 121 cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag cgcggcgtgc cgaagccggc 60 gacgatcaga aaactggcgg acgctttgaa agtcccgtat gaggaactga tggcatctgc 120 aggctatatc agcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 180 catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 240 gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 300 aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 360 gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 420 tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 480 gggggatggc gatgacaagg ttcggcgagc ggctcaaaga gctgagggaa caaagaagcc 540 tgtcggttaa tcagcttgcc atgtatgccg gtgtgagcgc cgcagccatt tccagagccg 600 cagccatttc cagaatcgaa aacggccacc gcggcgttcc caagcccgcg acgatcagaa 660 aattggccga ggctctgaaa atgccgtacg agcagctcat ggatattgcc ggttatatga 720 gagctgacga gattcgcgaa cagccgcgcg gctatgtcac gatgcaggag atcgcggcca 780 agcacggcgt cgaagacctg tggctgttta aacccgagaa atgggactgt ttgtcccgcg 840 aagacctgct caacctcgaa cagtattttc attttttggt taatgaagcg aagaagcgcc 900 aatcataaaa agccgaattt cccttttagg agaagttcgg cttttttcgg ctgccttaag 960 cggcatccgg attcggcgtc ttgcctttat gatgcttaac ggggctcagc gcacgctcga 1020 gccatcccat gaacagatcg gcgatgatcg ccatcagcgc cgtcgggatc gcgcctgcta 1080 gaatgatcgc tgttccgttg gtcgcgtttg atcccctgac aatgatatcc ccgaggccgc 1140 ctgcgccgac aaacgtgccg atggccgtaa tgccgatcgc gatgacgagc gcggttctga 1200 gccccgccat aatgaccgac aaggcgaggg gaagctccac catccggagc acttgaaatt 1260 tcgtcatgcc catcgccttc cctgattcaa gataggcatg ctcgatgctg gcgattcccg 1320 tatatgtgtt tcgaatgatc ggcaacagcg aatacaaaaa caatgaaaga atcaccgtgt 1380 ttgcgccgag ccccatgaca agcatcaaga cgg 1413 <210> 122 <211> 2009 <212> DNA <213> Bacillus licheniformis <400> 122 ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60 ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120 atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180 ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240 tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300 tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360 tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420 ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480 ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac gcgcaaacac 540 aacccgatac ccttgctttt gtgaatgaag aagaaaagct gacatacgga gagctttggt 600 cacaatctga gcgccttgcc gcaaggattc aaagcgaagc tttaacagat gcttctccga 660 tcattgtcta cggacatatg aaaccggtta tggcggtttc cttcctggct tgtgtaaaag 720 ccgggcatcc gtacattcca gttgacgtat cgattccggc agaccggatt ctgaaaatca 780 tcaacagttc aaaagccgag cttctgctca ataattcagg cacttcggtt gacacgggag 840 atgccctcat ttccgtagtg gaaccgggcg ttcttgaagg agacgggatg ccggagacag 900 atcccggacg ctgggtacat ggggaagata ctttttacat tatctacaca tccggaagca 960 cgggaaatcc aaaaggcgtg caaatctcag ccgataacct tcagagcttc acagattgga 1020 tcacgaatga ctttccggtg gaaagcggcc aagtgttctt aaatcaagcc ccgttttcct 1080 ttgatttatc ggtaatggac ctttatccgt gcctgcagtc cggaggcacc ttatggacgg 1140 ttacgaaaga catgattaat cggccgaaac tattgtttga agcactgaaa cagtccaacg 1200 tcaacgtctg gacatcgacg ccttcattcg cacaaatgtg cttgatggat ccgtcttatt 1260 cggaagagct gcttccggag ctgagcttgt ttatgttctg cggagaaacg cttcctgcgt 1320 cagtcgccag acagcttaaa gaaagatttc caaaggctcg tgtttttaac acatacggcc 1380 cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac agacgacgta ttaaacaagt 1440 attcttctct tcccgtcggt tctgaaaagc ccgaaaccga aatcgtaatc atcaatgaag 1500 acggaaaagc cgtccaagac ggggaaaaag gcgagatcat aattaccgga gcaagcgtca 1560 gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc gtttttctct tacaacggct 1620 cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa cggccagctc ttcttcctcg 1680 gaagactcga tttccaaatc aaactgcacg gctaccggat tgagcttgaa gaaatcgaat 1740 atcaaatcaa tcagtcccga tatgtgcagt cggcagtcgt tattccattc taccgcgagg 1800 agaaaatcga gtatctgatc gccatgattg tgcctgccga acacgatttc gaaaaggaat 1860 accagttaac cagcgcgatt aagaaagatt tgggcagcaa gctgccggcc tatatgattc 1920 cgagaaaatt catgtatcaa aaagagattc cgatgacagc aaacggtaaa atcgaccgca 1980 agagattaaa agaagaggta accgtatga 2009 <210> 123 <211> 1557 <212> DNA <213> Bacillus licheniformis <400> 123 ttaattgaat tgtgcggtta caccgccgga ctccatcatc atcagttctt ttttcatatc 60 caatccgccc cggtatcccg tgagctgccc gcttttaccg ataacccgat ggcaaggcac 120 caccattaac agcggatttg cgccgatcgc cgcgcctact gcccgcacag cggcctgctt 180 ttcaatatgc tcggcgatat cggaatagga gcaagtgctg ccgtaaggga tttcggagag 240 cgccttccac actgccagct gaaaaggcgt gccggcaagg tcgacaggaa agctgaaatg 300 agttcgcttg ccgttcaaat acgcctgcag ctgctcggcg tattctgcca atcctttgtc 360 atcccgaatg aaaactggct gtgtaaatct tttttcagcc caagcggcca aatcctcgaa 420 gccttgattc catccccctg taaaacagag cccgcgggca gtcgccccaa tgtgaatctg 480 ccaacctcgg caaataagcg tacgccagta tacgatttga tcgtccatat gtttacctcc 540 gtttcatttg ccggtacgac gtcggcgatt gcccagtctt ctttttaaac aaagaggcaa 600 aatattccgc attcgcaatg cctaccattg aagcgatttc tgcgatcgat cgttctgaat 660 gagcaagcaa atcgaccgct ttctcaatcc ttttctgcag gatgtattct gccggcgaga 720 cgcctttgat tcgtttaaat gtccgctgca ggtgaaaagg gctgatatgg cacctgtcag 780 ccaaagcttg cagagacagc ggatcgcgat aagattcctc gatgatttcc accacacgct 840 gtgccagctc ttcatccggc agcagcgccc cggccggatt gcagcgtttg caggggcggt 900 acccttctga taaagcatct tttgcattga aaaagatctg cacattgtcg atttgcggaa 960 ctctcgattt gcaggaaggg cggcaaaata tgccggtcgt tttgaccgcg taataaaaaa 1020 ctccgtcata ggcggaatcg ttttccgtaa tcgcccgcca catttcaggc gtcaatcgtg 1080 atttgctgtt catatcttca ccccgatcta tgtcagtata acctatatga cagccggagg 1140 tggagaggcg gagaacggca cagcaagaag acaaagaaga agagagactg ttgcctggac 1200 ctccgaaacg cgctacaatt catttacaac acaggatggg gtgagaatat tgccggaatc 1260 agtgaagcag gtaacatctc tcactgctgt gtgattttac tcacggcatt tggaacgccg 1320 gctctcaaca aactttctgt agtgaaaatc atgaaccaaa cggatcgtcg gcctgattaa 1380 cagctgaaag ctgccgatca caaacatcca tagtcccgcc ggcttcagtt cctcggagaa 1440 aaagcagaag ctcccgacaa ggaataaaag gccgatgaga aaatcgttta atgtatgtag 1500 aactttgtat ctttttttga aaaagagttc atatcgattg ttattgtttt gcggcat 1557 <210> 124 <211> 2814 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 124 ttaattgaat tgtgcggtta caccgccgga ctccatcatc atcagttctt ttttcatatc 60 caatccgccc cggtatcccg tgagctgccc gcttttaccg ataacccgat ggcaaggcac 120 caccattaac agcggatttg cgccgatcgc cgcgcctact gcccgcacag cggcctgctt 180 ttcaatatgc tcggcgatat cggaatagga gcaagtgctg ccgtaaggga tttcggagag 240 cgccttccac actgccagct gaaaaggcgt gccggcaagg tcgacaggaa agctgaaatg 300 agttcgcttg ccgttcaaat acgcctgcag ctgctcggcg tattctgcca atcctttgtc 360 atcccgaatg aaaactggct gtgtaaatct tttttcagcc caagcggcca aatcctcgaa 420 gccttgattc catccccctg taaaacagag cccgcgggca gtcgccccaa tgtgaatctg 480 ccaacctcgg caaataagcg tacgccagta tacgatttga tcgtccatat gtttacctcc 540 gtttcatttg ccggtacgac gtcggcgatt gcccagtctt ctttttaaac aaagaggcaa 600 aatattccgc attcgcaatg cctaccattg aagcgatttc tgcgatcgat cgttctgaat 660 gagcaagcaa atcgaccgct ttctcaatcc ttttctgcag gatgtattct gccggcgaga 720 cgcctttgat tcgtttaaat gtccgctgca ggtgaaaagg gctgatatgg cacctgtcag 780 ccaaagcttg cagagacagc ggatcgcgat aagattcctc gatgatttcc accacacgct 840 gtgccagctc ttcatccggc agcagcgccc cggccggatt gcagcgtttg caggggcggt 900 acccttctga taaagcatct tttgcattga aaaagatctg cacattgtcg atttgcggaa 960 ctctcgattt gcaggaaggg cggcaaaata tgccggtcgt tttgaccgcg taataaaaaa 1020 ctccgtcata ggcggaatcg ttttccgtaa tcgcccgcca catttcaggc gtcaatcgtg 1080 atttgctgtt catatcttca ccccgatcta tgtcagtata acctatatga cagccggagg 1140 tggagaggcg gagaacggca cagcaagaag acaaagaaga agagagactg ttgcctggac 1200 ctccgaaacg cgctacaatt catttacaac acaggatggg gtgagaatat tgccggaatc 1260 agtgaagcag gtgacagagg aaaggccgat atgattcggc cttttttata tgtacttctt 1320 agcgggtctc taaaataacc aaaaagcaag gactgctgaa agggctgaca taagcctttt 1380 gccggcggtc cttttttaat tctgattttt caaacttagc cccctcgaga aaaccgcttg 1440 agtatcctcc gctcatgtta ttgacctcct tttcttgatc aatatatttg tatgagcgga 1500 aagaaaattt gactagacgg atgcccctct gttgaaaatc tttttacagc atgtcagaat 1560 atgatatgat acaattcaaa ggaaagttta aactgttatg attaggagtg tttgcattta 1620 tgaagaagat tgcaattgcg gcgattacag cgacaagcgt gctggctctc agcgcatgca 1680 gcgggggaga ttctgaggtt gttgcggaaa caaaagctgg aaatattaca aaagaagacc 1740 tttatcaaac attaaaagac aatgccggag cggacgcact gaacatgctt gttcagcaaa 1800 aagtactcga tgataaatac gatgtctccg acaaagaaat cgacaaaaag ctgaacgagt 1860 acaaaaaatc aatgggtgac cagctcaacc agctcattga ccaaaaaggc gaagacttcg 1920 tcaaagaaca gatcaaatac gaacttctga tgcaaaaagc cgcaaaggat aacataaaag 1980 taaccgatga tgacgtaaaa gaatattatg acggcctgaa aggcaaaatc cacttaagcc 2040 acattcttgt gaaagaaaag aaaacggctg aagaagttga gaaaaagctg aaaaaaggcg 2100 aaaaattcga agaccttgca aaagagtatt caactgacgg tacagccgaa aaaggcggcg 2160 acctcggctg ggtcggcaaa gacgataaca tggacaagga tttcgtcaaa gcggcatttg 2220 ctttgaaaac cggcgaaatc agcggacctg tgaaatccca attcggctat cacatcatta 2280 aaaaagacga agaacgcggc aaatatgaag acatgaaaaa agagcttaaa aaagaagtcc 2340 aagaacaaaa gcaaaatgat caaactgaac tgcaatccgt cattgacaaa cttgtcaaag 2400 atgctgattt aaaagtaaaa gacaaagagt tgaaaaaaca agtcgaccag cgtcaagctc 2460 agacaagcag cagcagctga aagagcagag aggacggatt tcctgaagga aatccgtttt 2520 tttattttta acatctctca ctgctgtgtg attttactca cggcatttgg aacgccggct 2580 ctcaacaaac tttctgtagt gaaaatcatg aaccaaacgg atcgtcggcc tgattaacag 2640 ctgaaagctg ccgatcacaa acatccatag tcccgccggc ttcagttcct cggagaaaaa 2700 gcagaagctc ccgacaagga ataaaaggcc gatgagaaaa tcgtttaatg tatgtagaac 2760 tttgtatctt tttttgaaaa agagttcata tcgattgtta ttgttttgcg gcat 2814 <210> 125 <211> 1309 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 125 ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60 ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120 atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180 ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240 tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300 tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360 tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420 ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480 ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac cacaaatgtg 540 cttgatggat ccgtcttatt cggaagagct gcttccggag ctgagcttgt ttatgttctg 600 cggagaaacg cttcctgcgt cagtcgccag acagcttaaa gaaagatttc caaaggctcg 660 tgtttttaac acatacggcc cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac 720 agacgacgta ttaaacaagt attcttctct tcccgtcggt tctgaaaagc ccgaaaccga 780 aatcgtaatc atcaatgaag acggaaaagc cgtccaagac ggggaaaaag gcgagatcat 840 aattaccgga gcaagcgtca gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc 900 gtttttctct tacaacggct cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa 960 cggccagctc ttcttcctcg gaagactcga tttccaaatc aaactgcacg gctaccggat 1020 tgagcttgaa gaaatcgaat atcaaatcaa tcagtcccga tatgtgcagt cggcagtcgt 1080 tattccattc taccgcgagg agaaaatcga gtatctgatc gccatgattg tgcctgccga 1140 acacgatttc gaaaaggaat accagttaac cagcgcgatt aagaaagatt tgggcagcaa 1200 gctgccggcc tatatgattc cgagaaaatt catgtatcaa aaagagattc cgatgacagc 1260 aaacggtaaa atcgaccgca agagattaaa agaagaggta accgtatga 1309 <210> 126 <211> 483 <212> PRT <213> Bacillus licheniformis <400> 126 Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro 1 5 10 15 Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu 20 25 30 Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly 35 40 45 Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu 50 55 60 Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys 65 70 75 80 Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn 85 90 95 Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr 100 105 110 Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val 115 120 125 Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro 130 135 140 Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe 145 150 155 160 Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys 165 170 175 Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn 180 185 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val 195 200 205 Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln 210 215 220 Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225 230 235 240 Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met 245 250 255 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn 260 265 270 Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu 275 280 285 His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met 290 295 300 Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser 305 310 315 320 Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu 325 330 335 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu 340 345 350 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly 355 360 365 Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile 370 375 380 Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His 385 390 395 400 Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp 405 410 415 Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr 435 440 445 Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser 450 455 460 Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr 465 470 475 480 Val Gln Arg <210> 127 <211> 9514 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 127 ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60 gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120 aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180 aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240 ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300 tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360 gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420 aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480 gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540 caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600 gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660 tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720 gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780 ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840 cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900 ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960 ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020 acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080 gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140 gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200 ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260 agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320 ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380 ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440 gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500 gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560 gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620 agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680 tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740 aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800 gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860 tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920 aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980 cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040 tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100 tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160 ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220 ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280 cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340 ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400 tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460 ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520 aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580 tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640 cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700 ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760 attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820 acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880 cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940 atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000 gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060 attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120 ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180 aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240 cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300 tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360 agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420 atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480 gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540 aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600 aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660 ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720 agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780 aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840 gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900 cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960 ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020 gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080 acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140 aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200 gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260 ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320 attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380 atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440 ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500 gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560 cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620 aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680 agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gatgaaacaa caaaaacggc 4740 tttacgcccg attgctgacg ctgttatttg cgctcatctt cttgctgcct cattctgcag 4800 ctagcgcagc aaatcttaat gggacgctga tgcagtattt tgaatggtac atgcccaatg 4860 acggccaaca ttggaagcgt ttgcaaaacg actcggcata tttggctgaa cacggtatta 4920 ctgccgtctg gattcccccg gcatataagg gaacgagcca agcggatgtg ggctacggtg 4980 cttacgacct ttatgattta ggggagtttc atcaaaaagg gacggttcgg acaaagtacg 5040 gcacaaaagg agagctgcaa tctgcgatca aaagtcttca ttcccgcgac attaacgttt 5100 acggggatgt ggtcatcaac cacaaaggcg gcgctgatgc gaccgaagat gtaaccgcgg 5160 ttgaagtcga tcccgctgac cgcaaccgcg taatttcagg agaacaccta attaaagcct 5220 ggacacattt tcattttccg gggcgcggca gcacatacag cgattttaaa tggcattggt 5280 accattttga cggaaccgat tgggacgagt cccgaaagct gaaccgcatc tataagtttc 5340 aaggaaaggc ttgggattgg gaagtttcca atgaaaacgg caactatgat tatttgatgt 5400 atgccgacat cgattatgac catcctgatg tcgcagcaga aattaagaga tggggcactt 5460 ggtatgccaa tgaactgcaa ttggacggtt tccgtcttga tgctgtcaaa cacattaaat 5520 tttctttttt gcgggattgg gttaatcatg tcagggaaaa aacggggaag gaaatgttta 5580 cggtagctga atattggcag aatgacttgg gcgcgctgga aaactatttg aacaaaacaa 5640 attttaatca ttcagtgttt gacgtgccgc ttcattatca gttccatgct gcatcgacac 5700 agggaggcgg ctatgatatg aggaaattgc tgaacggtac ggtcgtttcc aagcatccgt 5760 tgaaatcggt tacatttgtc gataaccatg atacacagcc ggggcaatcg cttgagtcga 5820 ctgtccaaac atggtttaag ccgcttgctt acgcttttat tctcacaagg gaatctggat 5880 accctcaggt tttctacggg gatatgtacg ggacgaaagg agactcccag cgcgaaattc 5940 ctgccttgaa acacaaaatt gaaccgatct taaaagcgag aaaacagtat gcgtacggag 6000 cacagcatga ttatttcgac caccatgaca ttgtcggctg gacaagggaa ggcgacagct 6060 cggttgcaaa ttcaggtttg gcggcattaa taacagacgg acccggtggg gcaaagcgaa 6120 tgtatgtcgg ccggcaaaac gccggtgaga catggcatga cattaccgga aaccgttcgg 6180 agccggttgt catcaattcg gaaggctggg gagagtttca cgtaaacggc gggtcggttt 6240 caatttatgt tcaaagatag aagcttctcg aggttaacag aggacggatt tcctgaagga 6300 aatccgtttt tttattttac agaagctgcg gaacctgaaa agaattcctt tcaggttccg 6360 ttttttttag gaattctccc tgatctcaag catctggcgg ggataaatcc gctctccttt 6420 caaatcgttc cattctttga ggcgctgtac agttacgccc attttttcgg cgatatgatg 6480 aagcgtatcc cctttccgca ctacatatgt accggtcttc gattcatcgt catgaaggcg 6540 gagtgtttgg ccggccttga gatttgaatg tttcaacccg tttattctca tgatctcctc 6600 gatggatata ccgctatcct tgctgattct ccagagcgtg tccccttttt gaacggtcac 6660 cgcaccgctc attgtcccgg cgttttgata aacgtggata gaattttgcc ggaacgcctc 6720 ctcacgaagc accgtcagcg gattgattgc atatctttta tcttcagtcc atgaaccgtg 6780 atgcatttca aaatgcaggt gggttccggt cgatattccc gtattgccga tgattccgat 6840 ttgctcgcct tttttcaccc gctccttttc ctttttcagg cgtttgctta agtgggcata 6900 aacggtttca tatccgttgt catgtttaat aaatatcact tggccgtagg agtcggattg 6960 atacgatttg cttatcgttc cgtctgcggc tgccgctact gcttcccctt cgggagcagc 7020 gatgtcaagc cccttatgct ttccgcctct cgtaccgaat tgatctgtga tctctccttt 7080 aatcggttca atccactctg aggcttccgc ccccggggca ttgacgaaaa gcgccaatcc 7140 cgaaagccat gcgatcgcga acaggaagtt ttgatgtctg agtttcttca aggttttcca 7200 tatcctccta ttacatgcat cttcggtaaa attgccccct attcggagac agcttagtat 7260 acttccaaat caatacaatt tatacattaa aaaaagactc cgcacaggga gtcttttagt 7320 tttctatcgt catcggattc ggtgcgtacg gaacctgtac agatttcgac aggtcatagg 7380 cgccgacctt ggttatggat gcgtttttaa atttcacttt tgtgaagccg aaatctttcg 7440 cggtcaatag aaggccttcc accatcaaga catcttcggg tttattttca atattcgcgg 7500 aggaagaaaa ttgaatgatc agttcttttc cattcttttg aatatcttca atcggcgtat 7560 catcggataa aatgggtttt aaatgagtgc cgctttcttc gtttttcatc atcttaatcg 7620 cttcctgcac cgattcgtaa gattcgcttg aaggtgcaag gaaccggcgc ccgtctgagc 7680 tttcatataa atagtagcat ttttgcgtct ggtgcataat cgccatatcg gcgagcattc 7740 cgaatgtttc aaattcaaca cccgatttat cattggaaat aaacagaaca gaatcatacg 7800 atccccattt aaaggtttcg ttgatcacat ttttcagccg ttcgaaatct tcgactgata 7860 gctccggtat tttctcatca acttgaatct tcagtttttt attgtttttc tgctctttga 7920 acttcacctt atcaaggtaa gctgtgtcaa atgatgtaaa ctggtccact ccaagccggc 7980 tgtaagcgtg aagcgcatct tcaagatttg tcatgccagt gcttttctcg aggcttaccg 8040 ggacaacgac agacttggac tcgtcaagga aagcgaaggt gatatagtcg tctttttgat 8100 tctgtgagac gacaaacgta tttgcaggtt cagacttggc agcatcagcc tccgtctgca 8160 ccaattttcc gtcagaagaa atgttggcgt cggcgctgtt ttgagatctg atctgttcga 8220 ttaactgggg agtgatcagc atcagaagaa agagaaccaa aactgtagca gcaaatgcgc 8280 cgacccgttt tttcggtgat ttacgctttg gtgcgagaat cagcttttga tagatctgat 8340 ttgccgaacg attatcctta accgttggaa gttggcttag taacgccttc agccgttctt 8400 cgttccattc tgacttcttc attctttgga tcctccttca aaagctccat ctgtttacga 8460 agcactttca gaccgcggtg ctgagtggtt tttaccttgc tttcggaaaa attcaaggct 8520 tttgctgttt cactgatcga atatccttga ataaaacgca agacgataac tgatctttgg 8580 tcaagcgtac acttgtctag ggcctcgaaa atttccttta ggttttcatt ttgcatcacg 8640 atgtcctcag gcagaggctt gcggtctttt acatcttgtt tctcccagtc aaacgtcccc 8700 aaaatccgct ggcggatcgt ctgctgcttt ctgaaccagt cgatcgcaac gtgccgcgca 8760 atcgaaagaa gccaggtttt ttcgctgctc ctgccttcaa atgtttcgta agaatgcagg 8820 acgcggatgt atacttcctg aactaagtct tccgcctgat ttttgtcttt taccatataa 8880 aataaaaact gaaataaatc ctgatgatac tgatcatata ttttctgaaa ggtttcttcc 8940 acctgaaacc cctccgttca atttattgtc gtttgtcaat cttaaaaggt tacattacaa 9000 ctattacaac tatattacga acatatgaaa atggaaaggg ggttttgcga aagttaagct 9060 taattttaac ttaacaagca caaaagcacc cgttctaaat gaacaggtgc caaggttata 9120 ggagcccaca ttttcactaa gctgtgccct tacaaggctt tcgttctcct gaccggagcg 9180 ttgcggatcc gctgaaatga actaatttca atccgtttat gactttaagt ccaattgttg 9240 gcgaagcttt ttggaaatct ccattctctt ttcgtcagtc actaggtgat accataagcc 9300 gtcaactttt ttgtcttcac cttcaatttc tacctgctta atatctttag cagcttcttt 9360 ataagaactt tgaatatcga tcatcttgtc cagtgttaag tttgttttga tgtttttttc 9420 taatgctgcc aaaatctctt gatagtttgt taatgatttt aattgtgcac cttcatgaat 9480 aatttcgttg ataatctcac gctgacgctc ttga 9514 <210> 128 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 128 gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 60 ttgacttaaa agaagctaaa tgttatagta ataaa 95 <210> 129 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 129 acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaag 57 <210> 130 <211> 87 <212> DNA <213> Bacillus licheniformis <400> 130 atgaaacaac aaaaacggct ttacgcccga ttgctgacgc tgttatttgc gctcatcttc 60 ttgctgcctc attctgcagc tagcgca 87 <210> 131 <211> 1452 <212> DNA <213> Bacillus licheniformis <400> 131 gcaaatctta atgggacgct gatgcagtat tttgaatggt acatgcccaa tgacggccaa 60 cattggaagc gtttgcaaaa cgactcggca tatttggctg aacacggtat tactgccgtc 120 tggattcccc cggcatataa gggaacgagc caagcggatg tgggctacgg tgcttacgac 180 ctttatgatt taggggagtt tcatcaaaaa gggacggttc ggacaaagta cggcacaaaa 240 ggagagctgc aatctgcgat caaaagtctt cattcccgcg acattaacgt ttacggggat 300 gtggtcatca accacaaagg cggcgctgat gcgaccgaag atgtaaccgc ggttgaagtc 360 gatcccgctg accgcaaccg cgtaatttca ggagaacacc taattaaagc ctggacacat 420 tttcattttc cggggcgcgg cagcacatac agcgatttta aatggcattg gtaccatttt 480 gacggaaccg attgggacga gtcccgaaag ctgaaccgca tctataagtt tcaaggaaag 540 gcttgggatt gggaagtttc caatgaaaac ggcaactatg attatttgat gtatgccgac 600 atcgattatg accatcctga tgtcgcagca gaaattaaga gatggggcac ttggtatgcc 660 aatgaactgc aattggacgg tttccgtctt gatgctgtca aacacattaa attttctttt 720 ttgcgggatt gggttaatca tgtcagggaa aaaacgggga aggaaatgtt tacggtagct 780 gaatattggc agaatgactt gggcgcgctg gaaaactatt tgaacaaaac aaattttaat 840 cattcagtgt ttgacgtgcc gcttcattat cagttccatg ctgcatcgac acagggaggc 900 ggctatgata tgaggaaatt gctgaacggt acggtcgttt ccaagcatcc gttgaaatcg 960 gttacatttg tcgataacca tgatacacag ccggggcaat cgcttgagtc gactgtccaa 1020 acatggttta agccgcttgc ttacgctttt attctcacaa gggaatctgg ataccctcag 1080 gttttctacg gggatatgta cgggacgaaa ggagactccc agcgcgaaat tcctgccttg 1140 aaacacaaaa ttgaaccgat cttaaaagcg agaaaacagt atgcgtacgg agcacagcat 1200 gattatttcg accaccatga cattgtcggc tggacaaggg aaggcgacag ctcggttgca 1260 aattcaggtt tggcggcatt aataacagac ggacccggtg gggcaaagcg aatgtatgtc 1320 ggccggcaaa acgccggtga gacatggcat gacattaccg gaaaccgttc ggagccggtt 1380 gtcatcaatt cggaaggctg gggagagttt cacgtaaacg gcgggtcggt ttcaatttat 1440 gttcaaagat ag 1452 <210> 132 <211> 6218 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 132 ggtagaggaa ttcctggtcg gccaaggcta caatccgttt ccgcttgtca ggtttacgga 60 aagggcagac gtagccgcaa gccatatttt agaggggcat gtcatcgtga tcgtcgatac 120 gtcgccaagc gtcatcatca caccgaccac tttgtttcac catgttcagc atgctgagga 180 atacagacag acgccggctg ttgggacgtt tttaaggtgg gtgcggtttt tcggtatttt 240 ggcctccacc tttttgctgc cgctttggct gctgtttgtc attcatccgt cgctcttgcc 300 tgataattta tcgtttatcg ggttgaataa agacacccat attccgatta tcatgcagat 360 tttcctggcg gatctcggcg tcgaattttt aagaatggcc gccattcata cgccgacggc 420 gctttcgact gcaatgggcc tgatcgccgc tgtattgatc ggcgatatcg cgatcaatgt 480 cggcttgttt tctcccgaag tcattttata cgtttccctc tcggcaatcg gagcctacac 540 gacaccaagc tacgagctga gcctggcgaa taaaatggtg aagctgttta tgctgatatt 600 ggtggcgctt tttaaagtgg agggatttgt catcggatta acgatcttaa ctatagtgat 660 gacttcgatc aggtcattgc gaacgcctta cttatggcct ctcctcccgt tcaatggaaa 720 agcgttttgg catgttctcg tgcgcacgtc cgttccaggg ggaaaagtca ggccgagcat 780 cgttcatccg agaaaccgct ccagacagcc gtgaagccgg cattcgaaga ggcttttccc 840 cggggaaaag cctctttttc aataatcgaa ttccggtctt tgagtaccga tgcctctgta 900 ttcattggca gagatcgcga ctgcccggag gctgcagatg ttgttctgtc ttctgatcgg 960 atagacgaca tacagcattt cgcggccgta cgggtcaatc gttgacgaat gaaggaaaac 1020 ctcagttcct ctccgccaaa atctcgtatt cgccggagct gtaataatct gcccttcata 1080 aggctcataa attctctgtt cataatgcgc agccggctga taaggggcgt atacatcttc 1140 aggtgcatag ccgggagcgg gggtgtaggg atagcgattt ggatacatat gataacctct 1200 ttcccacttc gttttttggt tttcatcttt aagattatat tcaggtaaat gcctatttgt 1260 atgggcgaaa atctcagctt ttcggctctt tttttattga atggacgttg tgtatgccta 1320 tttctatcaa gcgctgtttt ctgttattct ataatcaata gaatggatta gttgtttagg 1380 gaatcatttc ctttataaat caagaaaatt tggacaaatg gtggtttagt ttttaaaacg 1440 aaatgttata atacaacata agaatcgcac tatcatgaag ccggaagatg catcgggcag 1500 caaccggagc gccccttgca cctttgtcga tagagaaaga gggaatgaca attgttttta 1560 cacggtacta gcagacaaaa tgaaagaggg cacctcgaaa tcggcggtgt cgatgttcta 1620 tcattggcag aaagatacgg aacacctctt tatgtatacg atgtcgcgct gattagagag 1680 cgcgcccgaa aattccagaa ggcattcaag gaagccggtt taaaagcgca ggtagcgtat 1740 gcaagcaagg cgttttcatc ggttgccatg attcagcttg ccgaacaaga ggggctgtct 1800 ctggatgtgg tatcgggagg agagcttttc actgcgatca aagcagggtt cccagctgag 1860 cggattcatt ttcacggaaa caataagagc cctgaagaac tagccatggc gctggagcat 1920 caaatcggct gcatcgtgct cgataacttt cacgagatcg ccattacaga agatctttgc 1980 aagcgatcag gacaaactgt agacgttttg ctcagaatca ctccgggagt tgaagcgcac 2040 acgcacgatt atattacgac ggggcaggaa gattccaaat tcggttttga tctgcataat 2100 ggacaggtcg aacaagccat cgaacaagtc ctccgctcgt ctgcgtttaa gctcctcggc 2160 gtgcactgcc acatcggttc gcaaattttt gatacggcag gatttgtcct tgcagcagac 2220 aagattttcg agaagcttgc ggaatggcgg gagacttact ctttcattcc ggaagtgctc 2280 aatcttggcg ggggcttcgg catccgctat acaaaagacg acgagccgct tgcagctgat 2340 gtttatgttg aaaaaatcat cgaggcggtc aaagcaaatg ccgagcattt cggctttgac 2400 atccctgaga tttggatcga accaggccgg tctctcgtcg gtgatgcggg gactacgctg 2460 tacacgatcg gttctcaaaa agaggtgccg ggcattcgca aatatgtagc catcgacggc 2520 ggcatgagcg ataatatcag gccggcgctt tatgaggcaa aatatgaagc agccgtcgcc 2580 aacaggatga acgatgcttg tcatgatacc gcatcaatcg caggaaaatg ctgcgaaagc 2640 ggagatatgc tgatttggga tttggaaatc cccgaagttc gcgacggaga tgtgctcgcc 2700 gttttctgca ccggtgcgta cggctacagc atggccaaca actacaaccg cattccgcgc 2760 ccggccgtcg tctttgtcga ggacggggaa gcgcagctcg tcattcagag agagacgtat 2820 gaggatatcg tcaagctgga tctgccgctg aaatcgaaag tcaaacaata aaaaaatgga 2880 gattccctaa gaggggggtc tccattttta attcaagctg ataaacagct gacatcaact 2940 aaaagtttca ttaaatactt tgaaaaaagt tgttgactta aaagaagcta aatgttatag 3000 taattgtaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 3060 aaagaatgaa acaacaaaaa cggctttacg cccgattgct gacgctgtta tttgcgctca 3120 tcttcttgct gcctcattct gcagctagcg cagcaaatct taatgggacg ctgatgcagt 3180 attttgaatg gtacatgccc aatgacggcc aacattggaa gcgtttgcaa aacgactcgg 3240 catatttggc tgaacacggt attactgccg tctggattcc cccggcatat aagggaacga 3300 gccaagcgga tgtgggctac ggtgcttacg acctttatga tttaggggag tttcatcaaa 3360 aagggacggt tcggacaaag tacggcacaa aaggagagct gcaatctgcg atcaaaagtc 3420 ttcattcccg cgacattaac gtttacgggg atgtggtcat caaccacaaa ggcggcgctg 3480 atgcgaccga agatgtaacc gcggttgaag tcgatcccgc tgaccgcaac cgcgtaattt 3540 caggagaaca cctaattaaa gcctggacac attttcattt tccggggcgc ggcagcacat 3600 acagcgattt taaatggcat tggtaccatt ttgacggaac cgattgggac gagtcccgaa 3660 agctgaaccg catctataag tttcaaggaa aggcttggga ttgggaagtt tccaatgaaa 3720 acggcaacta tgattatttg atgtatgccg acatcgatta tgaccatcct gatgtcgcag 3780 cagaaattaa gagatggggc acttggtatg ccaatgaact gcaattggac ggtttccgtc 3840 ttgatgctgt caaacacatt aaattttctt ttttgcggga ttgggttaat catgtcaggg 3900 aaaaaacggg gaaggaaatg tttacggtag ctgaatattg gcagaatgac ttgggcgcgc 3960 tggaaaacta tttgaacaaa acaaatttta atcattcagt gtttgacgtg ccgcttcatt 4020 atcagttcca tgctgcatcg acacagggag gcggctatga tatgaggaaa ttgctgaacg 4080 gtacggtcgt ttccaagcat ccgttgaaat cggttacatt tgtcgataac catgatacac 4140 agccggggca atcgcttgag tcgactgtcc aaacatggtt taagccgctt gcttacgctt 4200 ttattctcac aagggaatct ggataccctc aggttttcta cggggatatg tacgggacga 4260 aaggagactc ccagcgcgaa attcctgcct tgaaacacaa aattgaaccg atcttaaaag 4320 cgagaaaaca gtatgcgtac ggagcacagc atgattattt cgaccaccat gacattgtcg 4380 gctggacaag ggaaggcgac agctcggttg caaattcagg tttggcggca ttaataacag 4440 acggacccgg tggggcaaag cgaatgtatg tcggccggca aaacgccggt gagacatggc 4500 atgacattac cggaaaccgt tcggagccgg ttgtcatcaa ttcggaaggc tggggagagt 4560 ttcacgtaaa cggcgggtcg gtttcaattt atgttcaaag atagaagctt ctcgaggtta 4620 acagaggacg gatttcctga aggaaatccg tttttttatt ttcaagcacg aaaaacactt 4680 cccggtgatc gggaggtgtt ttttgttaaa aagatcatga catgcataga acagcgaccg 4740 ggctaattgt atataatatt gtgaatttaa caaaaaattt acaaaggaga tgataaaggc 4800 aatgaccagg gtgaaaagga tgagatttgc tgatttgttg gatttagagg cggagtagat 4860 gaaaccggcc aaagtatccc tactccaccg attgctccag tgcctgaagc aatgtgttga 4920 ttgtaacaca gtaaatcgtt ttacagcaat aaacattttt gtgaatattt tattgatttc 4980 ggctgtgatc tcattcccat attctgctgc ggcccatggc gcaacacagt ccggcgatca 5040 atattcaagc tttgaagaat tggagcggaa tgaagatcca gcttcttacc gaattacgga 5100 gaagaacgca agagtgccga tgctcatcat ggccatccat ggaggcggca tcgaacccgg 5160 aacgagcgaa atcgccaatg aagtgtccaa aaactattcc ctgtacttgt ttgaagggct 5220 gaaatcatca ggcaatacgg accttcacat tacaagcacg cgttttgacg agccagcggc 5280 gctcgcaatt actgcaagcc accagtatgt catgtcgctc cacggctatt acagtgaaga 5340 ccgcgatatt aaagtaggcg gcacagaccg cgctaaaatc agaatattgg ttgatgagct 5400 gaaccgctcg gggtttgccg ctgaaatgct ggggacagat gacaagtatg ccggaaccca 5460 tccgaataac atcgccaaca agtcgctttc cgggctgagc attcagcttg aaatgagcac 5520 gggtttccgc aaatctttat tcgaccggtt tacactaaaa gacagggcgg cgacgcaaaa 5580 cgaaacgttt taccgattta caaagctgct gacagatttt attcatgaaa actatgaaga 5640 agacggaggg gatttcccct ctgcaaaaat aaaacacccc cttcaagtga aaaaggaggt 5700 gtttcggcgg ttgtgttaac cgttggactc tgaggtgccg ccgccggtga atacggaaac 5760 gatggcgttc cacagagaca caaagaagtc gatcagtttt tgaagaaagt tttgtccttc 5820 ttcagaatcc aagaatttcg tgattttatc ctttgctttg tcaagctggt ctccaacctg 5880 gttccagtcg atattaatat ttttcatgtt attaaataaa gatataagag agtttttctg 5940 atcttctgtg agtgtcacgc caagttcgga agcagccgaa tcaatcgttt tctccaattc 6000 ctcttttgac tcgggaactc cgtttttcga gatttcttcc ttgactttgg ccatcagcgc 6060 tgacgcgttt tcactgccga ttttctcgcc aagctctgaa gtggtgacaa gctcttcatt 6120 cgcgaccttt ttcacatctt cggaaatttt ttcgcccgaa gtcgtttcat acgctttcat 6180 caatccggtt aaagcggctg tgcctgacac ttcaaacg 6218 <210> 133 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 133 tcgttccggg ttcgatgccg cctccatgga tggccatgat gagcatcggc actcttgcgt 60 tcttctccgt aattcggtaa gaagctggat cttcattccg ctccaattct tcaaagcttg 120 aatattgatc gccggactgt gttgcgccat gggccgcagc agaatatggg aatgagatca 180 cagccgaaat caataaaata ttcacaaaaa tgtttattgc tgtaaaacga tttactgtgt 240 tacaatcaac acattgcttc aggcactgga gcaatcggtg gagtagggat actttggccg 300 gtttcatcta ctccgcctct aaatccaaca aatcagcaaa tctcatcctt ttcaccctgg 360 tcattgcctt tatcatctcc tttgtaaatt ttttgttaaa ttcacaatat tatatacaat 420 tagcccggtc gctgttctat gcatgtcatg atctttttaa caaaaaacac ctcccgatca 480 ccgggaagtg tttttcgtgc ttgtcattcc ctctttctct atcgacaaag gtgcaagggg 540 cgctccggtt gctgcccgat gcatcttccg gcttcatgat agtgcgattc ttatgttgta 600 ttataacatt tcgttttaaa aactaaacca ccatttgtcc aaattttctt gatttataaa 660 ggaaatgatt ccctaaacaa ctaatccatt ctattgatta tagaataaca gaaaacagcg 720 cttgatagaa ataggcatac acaacgtcca ttcaataaaa aaagagccga aaagctgaga 780 ttttcgccca tacaaatagg catttacctg aatataatct taaagatgaa aaccaaaaaa 840 cgaagtggga aagaggttat catatgtatc caaatcgcta tccctacacc cccgctcccg 900 gctatgcacc tgaagatgta tacgcccctt atcagccggc tgcgcattat gaacagagaa 960 tttatgagcc ttatgaaggg cagattatta cagctccggc 1000 <210> 134 <211> 1320 <212> DNA <213> Bacillus licheniformis <400> 134 ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60 gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120 attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180 gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240 gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300 ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360 ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420 gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480 gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540 ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600 ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660 gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720 gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780 gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840 ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900 actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960 atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020 gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080 tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140 gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200 attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260 gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320 1320 <210> 135 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 135 gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60 cttaaaagaa gctaaatgtt atagtaattg t 91 <210> 136 <211> 484 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 136 His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His 1 5 10 15 Leu Pro Asn Asp Gly Gln His Trp Asn Arg Leu Arg Asn Asp Ala Ala 20 25 30 Asn Leu Lys Asn Leu Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Ile Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Ser Gln Leu Gln Ser Ala Ile Ala Ser Leu Gln Asn Asn Gly 85 90 95 Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Gly Thr Glu Trp Val Gln Ala Val Glu Val Asn Pro Ser Asn Arg Asn 115 120 125 Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg 165 170 175 Ile Tyr Lys Phe Thr Gly Lys Gly Trp Asp Trp Glu Val Asp Thr Glu 180 185 190 Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His 195 200 205 Pro Glu Val Ile Asn Glu Leu Arg Arg Trp Gly Val Trp Tyr Thr Asn 210 215 220 Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys 225 230 235 240 Tyr Ser Phe Thr Arg Asp Trp Leu Asn His Val Arg Ser Thr Thr Gly 245 250 255 Lys Asn Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly 260 265 270 Ala Ile Glu Asn Tyr Leu His Lys Thr Asn Trp Asn His Ser Val Phe 275 280 285 Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly Gly 290 295 300 Asn Tyr Asp Met Arg Gln Ile Leu Asn Gly Thr Val Val Ser Lys His 305 310 315 320 Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Ala 325 330 335 Glu Ala Leu Glu Ser Phe Val Glu Ala Trp Phe Lys Pro Leu Ala Tyr 340 345 350 Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly 355 360 365 Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Ala Ala Met Lys Gly Lys 370 375 380 Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Thr Gln 385 390 395 400 His Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly 405 410 415 Asn Ser Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly 420 425 430 Pro Gly Gly Ser Lys Trp Met Tyr Val Gly Arg His Lys Ala Gly Gln 435 440 445 Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile Asn 450 455 460 Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile 465 470 475 480 Trp Val Asn Lys <210> 137 <211> 9545 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 137 ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60 gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120 aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180 aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240 ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300 tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360 gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420 aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480 gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540 caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600 gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660 tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720 gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780 ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840 cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900 ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960 ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020 acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080 gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140 gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200 ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260 agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320 ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380 ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440 gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500 gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560 gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620 agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680 tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740 aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800 gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860 tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920 aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980 cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040 tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100 tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160 ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220 ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280 cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340 ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400 tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460 ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520 aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580 tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640 cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700 ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760 attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820 acatcctgca cgatatttcg gtaaactcac tttttccgag ctctcgctga taaacagctg 2880 acatcaacta aaagcttcat taaatacttt gaaaaaagtt gttgacttaa aagaagctaa 2940 atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3000 ggagagggta aagaatgaaa caacaaaaac ggctttacgc ccgattgctg acgctgttat 3060 ttgcgctcat cttcttgctg cctcattctg cagctagcgc acaccacaac ggaacaaacg 3120 gcacaatgat gcagtatttt gaatggcacc tgccgaatga tggacagcat tggaatagac 3180 tgagaaacga cgcagcgaac ctgaagaacc ttggcatcac ggcagtctgg attccgcctg 3240 cgtggaaagg cacatcacaa aatgatgtcg gctatggcgc atatgacctg tacgacctgg 3300 gagagttcaa ccagaaggga acaatcagaa cgaaatatgg aacaagatca caactgcaaa 3360 gcgctatcgc gagcctgcaa aataatggca tccaagttta tggcgacgtg gtcatgaacc 3420 acaaaggcgg agcagacgga acggaatggg ttcaagcggt cgaggtgaat ccgagcaaca 3480 gaaaccaaga ggttacgggc gaatacacga tcgaagcctg gacaaagttc gactttccgg 3540 gcagaggcaa tacacactca agcttcaagt ggagatggta tcactttgac ggcacggact 3600 gggatcaaag cagacgtctg aataacagaa tctataagtt tacaggcaaa ggttgggatt 3660 gggaggtgga cacagaaaac ggaaactatg actatctgat gtatgctgac gtcgacatgg 3720 atcatccgga ggtcatcaat gagctgagaa gatggggcgt ttggtacacg aacacactga 3780 acctggatgg attcagaatt gacgcagtca aacacatcaa gtactcattt acaagagact 3840 ggcttaacca cgtgagatca acaacgggaa agaacaatat gttcgccgtt gcggagtttt 3900 ggaagaatga tctgggcgca atcgagaact atcttcacaa gacgaactgg aatcatagcg 3960 tcttcgatgt cccgctgcac tacaatctgt ataatgcatc aaagtcaggc ggcaactacg 4020 atatgagaca aatcctgaat ggaacggtcg tctcaaaaca cccgatgcac gccgtcacgt 4080 ttgtcgataa tcacgattca caaccggcag aagcccttga gagctttgtt gaggcatggt 4140 tcaaaccgct ggcctatgct ctgatcctga caagagagca aggctatccg tcagtgtttt 4200 acggcgatta ctacggcatt ccgacacatg gcgtcgcagc catgaaagga aagattgatc 4260 cgattctgga ggctagacag aaatacgcct acggaacgca acacgattac cttgatcacc 4320 ataacatcat cggatggacg agagagggaa actcagcaca tcctaactca ggccttgcaa 4380 caattatgtc agatggaccg ggaggcagca aatggatgta cgttggcaga cacaaggcag 4440 gacaggtttg gagagatatc acgggcaata gaacaggaac agttacaatc aacgctgacg 4500 gctggggcaa ttttagcgtt aatggcggct cagttagcat ctgggtgaat aaatgaaaga 4560 gcagagagga cggatttcct gaaggaaatc cgttttttta ttttgcggcc gcatattccg 4620 cattcgcaat gcctaccgca tactaaaaac cgcacattca cagttatttc atttttaatt 4680 ttcgtctttc cgcgtgaaac tcattgacac tctttatgga atatggtaaa ttatcagata 4740 tttatgacgc ttatttagga ggaaatctta catgtttcga gtattggtct cagataaaat 4800 gtccagcgac ggcctcaaac cattaatgga agcagatttt attgaaattg tagaaaagaa 4860 tgttgcggaa gcggaagacg agcttcatac gtttgacgcg ctcttggtgc ggagcgccac 4920 gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg aaaatcgtcg ccagagcagg 4980 tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa cacggtgtta tcgtcgtaaa 5040 cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc tttgcaatgt tttcagcgtt 5100 aatgagacat attccgcagg caaacatctc cgtgaaatca agggagtgga atcgttcggc 5160 ttacgtcggt tcagagcttt acggaaaaac gctcggcatc atcggaatgg gccgcatcgg 5220 aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc gttcatgtat ttgacccgtt 5280 cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg aacagctttg aagaagttct 5340 ggcatgcgcc gacatcatta cggttcatac cccgctcacg aaagaaacga agggactttt 5400 gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt ctcgttaact gtgcaagagg 5460 cggcatcatc gatgaagcag cgcttttgga agctctggaa agcggacatg tcgctggcgc 5520 tgccttggat gtattcgaag tcgagcctcc ggtcgattca aaactgatcg atcatccgct 5580 tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa gcccagctga atgtcgctgc 5640 acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac cctgtgatgt ccgcgatcaa 5700 ccttccggcc atgacaaagg attcattcga aaaaatccag ccttatcatc agtttgccaa 5760 tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct gttcaagatg tagccatcca 5820 atatgaaggc tccatcgcca aacttgaaac gtcatttatt acgaaaagcc ttttggccgg 5880 atttctgaag ccgagggtcg cggctaccgt taacgaagtg aatgccggca ccgttgcgaa 5940 agagcgcggc atcagcttca gcgaaaaaat ttcttccaat gagtcaggct atgaaaactg 6000 catctctgtg actgtcacgg gagatgtaac aacattctct ttaagagcga cgtacattcc 6060 gcacttcggc ggacgcatcg ttgccttaaa cggctttgat attgattttt atccggctgg 6120 acaccttgtc tacattcacc accaggataa accaggggct atcggccatg tcggacgaat 6180 tttaggagac catgacatca atatcgccac tatgcaggta ggccgaaaag aaaaaggcgg 6240 agaagcgatc atgatgcttt cctttgaccg ccaccttgag gacgatattt tagctgagct 6300 gaaaaacatc ccggatatcg tgtctgttaa agccatcgac cttccttaaa cagaagctgc 6360 ggaacctgaa aagaattcct ttcaggttcc gtttttttta ggaattctcc ctgatctcaa 6420 gcatctggcg gggataaatc cgctctcctt tcaaatcgtt ccattctttg aggcgctgta 6480 cagttacgcc cattttttcg gcgatatgat gaagcgtatc ccctttccgc actacatatg 6540 taccggtctt cgattcatcg tcatgaaggc ggagtgtttg gccggccttg agatttgaat 6600 gtttcaaccc gtttattctc atgatctcct cgatggatat accgctatcc ttgctgattc 6660 tccagagcgt gtcccctttt tgaacggtca ccgcaccgct cattgtcccg gcgttttgat 6720 aaacgtggat agaattttgc cggaacgcct cctcacgaag caccgtcagc ggattgattg 6780 catatctttt atcttcagtc catgaaccgt gatgcatttc aaaatgcagg tgggttccgg 6840 tcgatattcc cgtattgccg atgattccga tttgctcgcc ttttttcacc cgctcctttt 6900 cctttttcag gcgtttgctt aagtgggcat aaacggtttc atatccgttg tcatgtttaa 6960 taaatatcac ttggccgtag gagtcggatt gatacgattt gcttatcgtt ccgtctgcgg 7020 ctgccgctac tgcttcccct tcgggagcag cgatgtcaag ccccttatgc tttccgcctc 7080 tcgtaccgaa ttgatctgtg atctctcctt taatcggttc aatccactct gaggcttccg 7140 cccccggggc attgacgaaa agcgccaatc ccgaaagcca tgcgatcgcg aacaggaagt 7200 tttgatgtct gagtttcttc aaggttttcc atatcctcct attacatgca tcttcggtaa 7260 aattgccccc tattcggaga cagcttagta tacttccaaa tcaatacaat ttatacatta 7320 aaaaaagact ccgcacaggg agtcttttag ttttctatcg tcatcggatt cggtgcgtac 7380 ggaacctgta cagatttcga caggtcatag gcgccgacct tggttatgga tgcgttttta 7440 aatttcactt ttgtgaagcc gaaatctttc gcggtcaata gaaggccttc caccatcaag 7500 acatcttcgg gtttattttc aatattcgcg gaggaagaaa attgaatgat cagttctttt 7560 ccattctttt gaatatcttc aatcggcgta tcatcggata aaatgggttt taaatgagtg 7620 ccgctttctt cgtttttcat catcttaatc gcttcctgca ccgattcgta agattcgctt 7680 gaaggtgcaa ggaaccggcg cccgtctgag ctttcatata aatagtagca tttttgcgtc 7740 tggtgcataa tcgccatatc ggcgagcatt ccgaatgttt caaattcaac acccgattta 7800 tcattggaaa taaacagaac agaatcatac gatccccatt taaaggtttc gttgatcaca 7860 tttttcagcc gttcgaaatc ttcgactgat agctccggta ttttctcatc aacttgaatc 7920 ttcagttttt tattgttttt ctgctctttg aacttcacct tatcaaggta agctgtgtca 7980 aatgatgtaa actggtccac tccaagccgg ctgtaagcgt gaagcgcatc ttcaagattt 8040 gtcatgccag tgcttttctc gaggcttacc gggacaacga cagacttgga ctcgtcaagg 8100 aaagcgaagg tgatatagtc gtctttttga ttctgtgaga cgacaaacgt atttgcaggt 8160 tcagacttgg cagcatcagc ctccgtctgc accaattttc cgtcagaaga aatgttggcg 8220 tcggcgctgt tttgagatct gatctgttcg attaactggg gagtgatcag catcagaaga 8280 aagagaacca aaactgtagc agcaaatgcg ccgacccgtt ttttcggtga tttacgcttt 8340 ggtgcgagaa tcagcttttg atagatctga tttgccgaac gattatcctt aaccgttgga 8400 agttggctta gtaacgcctt cagccgttct tcgttccatt ctgacttctt cattctttgg 8460 atcctccttc aaaagctcca tctgtttacg aagcactttc agaccgcggt gctgagtggt 8520 ttttaccttg ctttcggaaa aattcaaggc ttttgctgtt tcactgatcg aatatccttg 8580 aataaaacgc aagacgataa ctgatctttg gtcaagcgta cacttgtcta gggcctcgaa 8640 aatttccttt aggttttcat tttgcatcac gatgtcctca ggcagaggct tgcggtcttt 8700 tacatcttgt ttctcccagt caaacgtccc caaaatccgc tggcggatcg tctgctgctt 8760 tctgaaccag tcgatcgcaa cgtgccgcgc aatcgaaaga agccaggttt tttcgctgct 8820 cctgccttca aatgtttcgt aagaatgcag gacgcggatg tatacttcct gaactaagtc 8880 ttccgcctga tttttgtctt ttaccatata aaataaaaac tgaaataaat cctgatgata 8940 ctgatcatat attttctgaa aggtttcttc cacctgaaac ccctccgttc aatttattgt 9000 cgtttgtcaa tcttaaaagg ttacattaca actattacaa ctatattacg aacatatgaa 9060 aatggaaagg gggttttgcg aaagttaagc ttaattttaa cttaacaagc acaaaagcac 9120 ccgttctaaa tgaacaggtg ccaaggttat aggagcccac attttcacta agctgtgccc 9180 ttacaaggct ttcgttctcc tgaccggagc gttgcggatc cgctgaaatg aactaatttc 9240 aatccgttta tgactttaag tccaattgtt ggcgaagctt tttggaaatc tccattctct 9300 tttcgtcagt cactaggtga taccataagc cgtcaacttt tttgtcttca ccttcaattt 9360 ctacctgctt aatatcttta gcagcttctt tataagaact ttgaatatcg atcatcttgt 9420 ccagtgttaa gtttgttttg atgttttttt ctaatgctgc caaaatctct tgatagtttg 9480 ttaatgattt taattgtgca ccttcatgaa taatttcgtt gataatctca cgctgacgct 9540 cttga 9545 <210> 138 <211> 93 <212> DNA <213> Bacillus subtilis <400> 138 tcgctgataa acagctgaca tcaactaaaa gcttcattaa atactttgaa aaaagttgtt 60 gacttaaaag aagctaaatg ttatagtaat aaa 93 <210> 139 <211> 58 <212> DNA <213> Bacillus subtilis <400> 139 acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaaga 58 <210> 140 <211> 1455 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 140 caccacaacg gaacaaacgg cacaatgatg cagtattttg aatggcacct gccgaatgat 60 ggacagcatt ggaatagact gagaaacgac gcagcgaacc tgaagaacct tggcatcacg 120 gcagtctgga ttccgcctgc gtggaaaggc acatcacaaa atgatgtcgg ctatggcgca 180 tatgacctgt acgacctggg agagttcaac cagaagggaa caatcagaac gaaatatgga 240 acaagatcac aactgcaaag cgctatcgcg agcctgcaaa ataatggcat ccaagtttat 300 ggcgacgtgg tcatgaacca caaaggcgga gcagacggaa cggaatgggt tcaagcggtc 360 gaggtgaatc cgagcaacag aaaccaagag gttacgggcg aatacacgat cgaagcctgg 420 acaaagttcg actttccggg cagaggcaat acacactcaa gcttcaagtg gagatggtat 480 cactttgacg gcacggactg ggatcaaagc agacgtctga ataacagaat ctataagttt 540 acaggcaaag gttgggattg ggaggtggac acagaaaacg gaaactatga ctatctgatg 600 tatgctgacg tcgacatgga tcatccggag gtcatcaatg agctgagaag atggggcgtt 660 tggtacacga acacactgaa cctggatgga ttcagaattg acgcagtcaa acacatcaag 720 tactcattta caagagactg gcttaaccac gtgagatcaa caacgggaaa gaacaatatg 780 ttcgccgttg cggagttttg gaagaatgat ctgggcgcaa tcgagaacta tcttcacaag 840 acgaactgga atcatagcgt cttcgatgtc ccgctgcact acaatctgta taatgcatca 900 aagtcaggcg gcaactacga tatgagacaa atcctgaatg gaacggtcgt ctcaaaacac 960 ccgatgcacg ccgtcacgtt tgtcgataat cacgattcac aaccggcaga agcccttgag 1020 agctttgttg aggcatggtt caaaccgctg gcctatgctc tgatcctgac aagagagcaa 1080 ggctatccgt cagtgtttta cggcgattac tacggcattc cgacacatgg cgtcgcagcc 1140 atgaaaggaa agattgatcc gattctggag gctagacaga aatacgccta cggaacgcaa 1200 cacgattacc ttgatcacca taacatcatc ggatggacga gagagggaaa ctcagcacat 1260 cctaactcag gccttgcaac aattatgtca gatggaccgg gaggcagcaa atggatgtac 1320 gttggcagac acaaggcagg acaggtttgg agagatatca cgggcaatag aacaggaaca 1380 gttacaatca acgctgacgg ctggggcaat tttagcgtta atggcggctc agttagcatc 1440 tgggtgaata aatga 1455 <210> 141 <211> 3113 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 141 ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60 gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120 attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180 gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240 gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300 ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360 ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420 gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480 gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540 ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600 ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660 gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720 gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780 gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840 ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900 actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960 atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020 gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080 tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140 gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200 attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260 gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320 aaaaatggag attccctaag aggggggtct ccatttttaa ttcagagctc gtcgctgata 1380 aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg ttgacttaaa 1440 agaagctaaa tgttatagta ataaaacaga atagtctttt aagtaagtct actctgaatt 1500 tttttaaaag gagagggtaa agaatgaaac aacaaaaacg gctttacgcc cgattgctga 1560 cgctgttatt tgcgctcatc ttcttgctgc ctcattctgc agctagcgca caccacaacg 1620 gaacaaacgg cacaatgatg cagtattttg aatggcacct gccgaatgat ggacagcatt 1680 ggaatagact gagaaacgac gcagcgaacc tgaagaacct tggcatcacg gcagtctgga 1740 ttccgcctgc gtggaaaggc acatcacaaa atgatgtcgg ctatggcgca tatgacctgt 1800 acgacctggg agagttcaac cagaagggaa caatcagaac gaaatatgga acaagatcac 1860 aactgcaaag cgctatcgcg agcctgcaaa ataatggcat ccaagtttat ggcgacgtgg 1920 tcatgaacca caaaggcgga gcagacggaa cggaatgggt tcaagcggtc gaggtgaatc 1980 cgagcaacag aaaccaagag gttacgggcg aatacacgat cgaagcctgg acaaagttcg 2040 actttccggg cagaggcaat acacactcaa gcttcaagtg gagatggtat cactttgacg 2100 gcacggactg ggatcaaagc agacgtctga ataacagaat ctataagttt acaggcaaag 2160 gttgggattg ggaggtggac acagaaaacg gaaactatga ctatctgatg tatgctgacg 2220 tcgacatgga tcatccggag gtcatcaatg agctgagaag atggggcgtt tggtacacga 2280 acacactgaa cctggatgga ttcagaattg acgcagtcaa acacatcaag tactcattta 2340 caagagactg gcttaaccac gtgagatcaa caacgggaaa gaacaatatg ttcgccgttg 2400 cggagttttg gaagaatgat ctgggcgcaa tcgagaacta tcttcacaag acgaactgga 2460 atcatagcgt cttcgatgtc ccgctgcact acaatctgta taatgcatca aagtcaggcg 2520 gcaactacga tatgagacaa atcctgaatg gaacggtcgt ctcaaaacac ccgatgcacg 2580 ccgtcacgtt tgtcgataat cacgattcac aaccggcaga agcccttgag agctttgttg 2640 aggcatggtt caaaccgctg gcctatgctc tgatcctgac aagagagcaa ggctatccgt 2700 cagtgtttta cggcgattac tacggcattc cgacacatgg cgtcgcagcc atgaaaggaa 2760 agattgatcc gattctggag gctagacaga aatacgccta cggaacgcaa cacgattacc 2820 ttgatcacca taacatcatc ggatggacga gagagggaaa ctcagcacat cctaactcag 2880 gccttgcaac aattatgtca gatggaccgg gaggcagcaa atggatgtac gttggcagac 2940 acaaggcagg acaggtttgg agagatatca cgggcaatag aacaggaaca gttacaatca 3000 acgctgacgg ctggggcaat tttagcgtta atggcggctc agttagcatc tgggtgaata 3060 aatgaaagag cagagaggac ggatttcctg aaggaaatcc gtttttttat ttt 3113 <210> 142 <211> 2231 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 142 gtgttgtgct gaatcaatac atagaggccg gcggcgtatc gggtacaaca tctgtcaaga 60 cgtttaacgc tgatttaaag cagaaaaagc tgctgtccct tcaagatctg tttgaagaga 120 attcagattt tctgaacagg atttcaagca ttgcctatca ggaattgaaa aatcggaatc 180 cgtctgctga catggctttt ttaaaagaag ggacgagccc tcaggaagaa catttcagcc 240 gctttgcgct tcttgaaaac gaggtggaat tttattttga gaaaaaacaa gccggtcttg 300 aacagtttgt aaaaataaaa aaagaatggg taaaagatat tttaaaagac cgatatcagg 360 atatgaaaaa gaatcgtctt caggccaaac ctgatcagga gcctgttccg cttccgaagc 420 aagcgaaaat taatcccgat gaaaaagtga ttgccctcac atttgatgac ggtccgaatc 480 ccgctacaac gaataaaata ttaaacgctt tacagaagca tgaagggcat gcgaccttct 540 ttgtgcttgg aagcagagcc caatattatc ccgaaacgat aaaacggatg ctgaaggaag 600 gaaacgaagt cggcaaccat tcctgggacc atccgttatt gacaaggctg tcaaacgaaa 660 aagcgtatca ggagattaac gacacgcaag aaatgatcga aaaaatcagc ggacacctgc 720 ctgtacactt gcgtcctcca tacggcggga tcaatgattc cgtccgctcg ctttccaatc 780 tgaaggtttc attgtgggat gttgatccgg aagattggaa gtacaaaaat aagcaaaaga 840 ttgtcaatca tgtcatgagc catgcgggag acggaaaaat cgtcttaatg cacgatattt 900 atgcaacgtc cgcagatgct gctgaagaga ttattaaaaa gctgaaagca aaaggctatc 960 aattggtaac tgtatctcag cttgaagaag tgaagaagca gagaggctat tgaataaatg 1020 agtagaaagc gccatatcgg cgcttttctt ttggaagaaa atatagggaa aatggtactt 1080 gttaaaaatt cggaatattt atacaatatc atatgtttca cattgaaagg ggaggagaat 1140 catgaaacaa caaaaacggc tttacgcccg attgctgacg ctgttaggat cccacgtaaa 1200 cggcgggtcg gtttcaattt atgttcaaag atagaagagc aggctgacag tttgaatcgc 1260 ataggtaagg cggggatgaa atggcaacgt tatctgatgt agcaaagaaa gcaaatgtgt 1320 cgaaaatgac ggtatcgcgg gtgatcaatc atcctgagac tgtgacggat gaattgaaaa 1380 agcttgttca ttccgcaatg aaggagctca attatatacc gaactatgca gcaagagcgc 1440 tcgttcaaaa cagaacacag gtcgtcaagc tgctcatact ggaagaaatg gatacaacag 1500 aaccttatta tatgaatctg ttaacgggaa tcagccgcga gctggaccgt catcattatg 1560 ctttgcagct tgtcacaagg aaatctctca atatcggcca gtgcgacggc attattgcga 1620 cggggttgag aaaagccgat tttgaagggc tcatcaaggt ttttgaaaag cctgtcgttg 1680 tattcgggca aaatgaaatg ggctacgatt ttattgatgt taacaatgaa aaaggaacct 1740 atatggcaac acgtcacgtc attggtctgg gcgtccgcaa tgtcgtcttt tttgggatcg 1800 atttggatga gccctttgaa cgctcaaggg aaaaaggcta tcttcaggcg atggaaggca 1860 gtctgaaaaa agcagcgatt ttccggatgg aaaacagttc aaaaaaaagt gaagcacgcg 1920 cgcgggaagt gcttgcatcc tttgacgcac ctgcagcggt tgtttgcgct tcggaccgaa 1980 tcgcgctcgg ggttatccgc gcggtgcaat cgcttggtaa aagaattccg gaagatgtcg 2040 cggtcaccgg ctatgacggg gtgtttctcg accggatcgc ttcgcctcgc ctgacaaccg 2100 tcagacagcc tgttgttgaa atgggagagg cttgcgcgag aatcctgctg aaaaaaatca 2160 atgaagacgg agcgccgcaa ggcaatcaat tttttgagcc ggagcttatt gtccgcgaat 2220 cgactttgta g 2231 <210> 143 <211> 483 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 143 Ala Ala Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Val Pro 1 5 10 15 Asn Asp Gly Gln Gln Trp Asn Arg Leu Arg Thr Asp Ala Pro Tyr Leu 20 25 30 Ser Ser Val Gly Ile Thr Ala Val Trp Thr Pro Pro Ala Tyr Lys Gly 35 40 45 Thr Ser Gln Ala Asp Val Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu 50 55 60 Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys 65 70 75 80 Gly Glu Leu Lys Ser Ala Val Asn Thr Leu His Ser Asn Gly Ile Gln 85 90 95 Val Tyr Gly Asp Val Val Met Asn His Lys Ala Gly Ala Asp Tyr Thr 100 105 110 Glu Asn Val Thr Ala Val Glu Val Asn Pro Ser Asn Arg Tyr Gln Glu 115 120 125 Thr Ser Gly Glu Tyr Asn Ile Gln Ala Trp Thr Gly Phe Asn Phe Pro 130 135 140 Gly Arg Gly Thr Thr Tyr Ser Asn Trp Lys Trp Gln Trp Phe His Phe 145 150 155 160 Asp Gly Thr Asp Trp Asp Gln Ser Arg Ser Leu Ser Arg Ile Phe Lys 165 170 175 Phe His Gly Lys Ala Trp Asp Trp Pro Val Ser Ser Glu Asn Gly Asn 180 185 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Tyr Asp Tyr Asp His Pro Asp Val 195 200 205 Val Asn Glu Met Lys Lys Trp Gly Val Trp Tyr Ala Asn Glu Val Gly 210 215 220 Leu Asp Gly Tyr Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225 230 235 240 Leu Lys Asp Trp Val Asp Asn Ala Arg Ala Ala Thr Gly Lys Glu Met 245 250 255 Phe Thr Val Gly Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Asn Asn 260 265 270 Tyr Leu Ala Lys Val Asn Tyr Asn Gln Ser Leu Phe Asp Ala Pro Leu 275 280 285 His Tyr Asn Phe Tyr Ala Ala Ser Thr Gly Gly Gly Ala Tyr Asp Met 290 295 300 Arg Asn Ile Leu Asn Asn Thr Leu Val Ala Ser Asn Pro Thr Lys Ala 305 310 315 320 Val Thr Leu Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu 325 330 335 Ser Thr Val Gln Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu 340 345 350 Thr Arg Ser Gly Gly Tyr Pro Ala Val Phe Tyr Gly Asp Met Tyr Gly 355 360 365 Thr Lys Gly Thr Thr Thr Tyr Glu Ile Pro Ala Leu Lys Ser Lys Ile 370 375 380 Glu Pro Leu Leu Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Thr Gln Arg 385 390 395 400 Asp Tyr Ile Asp Asn Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp 405 410 415 Ser Thr Lys Ala Lys Ser Gly Leu Ala Thr Val Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ser Lys Arg Met Tyr Val Gly Thr Ser Asn Ala Gly Glu Ile 435 440 445 Trp Tyr Asp Leu Thr Gly Asn Arg Thr Asp Lys Ile Thr Ile Gly Ser 450 455 460 Asp Gly Tyr Ala Thr Phe Pro Val Asn Gly Gly Ser Val Ser Val Trp 465 470 475 480 Val Gln Gln <210> 144 <211> 9515 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 144 ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60 gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120 aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180 aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240 ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300 tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360 gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420 aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480 gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540 caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600 gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660 tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720 gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780 ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840 cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900 ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960 ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020 acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080 gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140 gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200 ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260 agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320 ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380 ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440 gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500 gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560 gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620 agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680 tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740 aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800 gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860 tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920 aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980 cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040 tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100 tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160 ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220 ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280 cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340 ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400 tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460 ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520 aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580 tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640 cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700 ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760 attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820 acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880 cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940 atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000 gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060 attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120 ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180 aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240 cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300 tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360 agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420 atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480 gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540 aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600 aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660 ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720 agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780 aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840 gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900 cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960 ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020 gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080 acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140 aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200 gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260 ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320 attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380 atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440 ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500 gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560 cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620 aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680 agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gatgaaacaa caaaaacggc 4740 tttacgcccg attgctgacg ctgttatttg cgctcatctt cttgctgcct cattctgcag 4800 ctagcgcagc agcgacaaac ggaacaatga tgcagtattt cgagtggtat gtacctaacg 4860 acggccagca atggaacaga ctgagaacag atgcccctta cttgtcatct gttggtatta 4920 cagcagtatg gacaccgccg gcttataagg gcacgtctca agcagatgtg gggtacggcc 4980 cgtacgatct gtatgattta ggcgagttta atcaaaaagg tacagtcaga acgaagtatg 5040 gcacaaaagg agaacttaaa tctgctgtca acacgctgca ttcaaatgga atccaagtgt 5100 atggtgatgt cgtgatgaat cataaagcag gtgctgatta tacagaaaac gtaacggcgg 5160 tggaggtgaa tccgtctaat agatatcagg aaacgagcgg cgaatataat attcaggcat 5220 ggacaggctt caactttccg ggcagaggaa caacgtattc taactggaaa tggcagtggt 5280 tccattttga tggaacggat tgggaccaga gcagaagcct ctctagaatc ttcaaattcc 5340 atggaaaggc gtgggactgg ccggtttctt cagaaaacgg aaattatgac tatctgatgt 5400 acgcggacta tgattatgac catccggatg tcgtgaatga aatgaaaaag tggggcgtct 5460 ggtatgccaa cgaagttggg ttagatggat acagacttga cgcggtcaaa catattaaat 5520 ttagctttct caaagactgg gtggataacg caagagcagc gacgggaaaa gaaatgttta 5580 cggttggcga atattggcaa aatgatttag gggccctgaa taactacctg gcaaaggtaa 5640 attacaacca atctcttttt gatgcgccgt tgcattacaa cttttacgct gcctcaacag 5700 ggggtggagc gtacgatatg agaaatattc ttaataacac gttagtcgca agcaatccga 5760 caaaggctgt tacgttagtt gagaatcatg acacacagcc tggacaatca ctggaatcaa 5820 cagtccaacc gtggtttaaa ccgttagcct acgcgtttat tctcacgaga agcggaggct 5880 atcctgcggt attttatgga gatatgtacg gtacaaaagg aacgacaaca tatgagatcc 5940 ctgctcttaa atctaaaatc gaacctttgc ttaaggctag aaaagactat gcttatggaa 6000 cacagagaga ctatattgat aacccggatg tcattggctg gacgagagaa ggggactcaa 6060 cgaaagccaa gagcggtctg gccacagtga ttacagatgg gccgggcggt tcaaaaagaa 6120 tgtatgttgg cacgagcaat gcgggtgaaa tctggtatga tttgacaggg aatagaacag 6180 ataaaatcac gattggaagc gatggctatg caacatttcc tgtcaatggg ggctcagttt 6240 cagtatgggt gcagcaatga aagcttctcg aggttaacag aggacggatt tcctgaagga 6300 aatccgtttt tttattttac agaagctgcg gaacctgaaa agaattcctt tcaggttccg 6360 ttttttttag gaattctccc tgatctcaag catctggcgg ggataaatcc gctctccttt 6420 caaatcgttc cattctttga ggcgctgtac agttacgccc attttttcgg cgatatgatg 6480 aagcgtatcc cctttccgca ctacatatgt accggtcttc gattcatcgt catgaaggcg 6540 gagtgtttgg ccggccttga gatttgaatg tttcaacccg tttattctca tgatctcctc 6600 gatggatata ccgctatcct tgctgattct ccagagcgtg tccccttttt gaacggtcac 6660 cgcaccgctc attgtcccgg cgttttgata aacgtggata gaattttgcc ggaacgcctc 6720 ctcacgaagc accgtcagcg gattgattgc atatctttta tcttcagtcc atgaaccgtg 6780 atgcatttca aaatgcaggt gggttccggt cgatattccc gtattgccga tgattccgat 6840 ttgctcgcct tttttcaccc gctccttttc ctttttcagg cgtttgctta agtgggcata 6900 aacggtttca tatccgttgt catgtttaat aaatatcact tggccgtagg agtcggattg 6960 atacgatttg cttatcgttc cgtctgcggc tgccgctact gcttcccctt cgggagcagc 7020 gatgtcaagc cccttatgct ttccgcctct cgtaccgaat tgatctgtga tctctccttt 7080 aatcggttca atccactctg aggcttccgc ccccggggca ttgacgaaaa gcgccaatcc 7140 cgaaagccat gcgatcgcga acaggaagtt ttgatgtctg agtttcttca aggttttcca 7200 tatcctccta ttacatgcat cttcggtaaa attgccccct attcggagac agcttagtat 7260 acttccaaat caatacaatt tatacattaa aaaaagactc cgcacaggga gtcttttagt 7320 tttctatcgt catcggattc ggtgcgtacg gaacctgtac agatttcgac aggtcatagg 7380 cgccgacctt ggttatggat gcgtttttaa atttcacttt tgtgaagccg aaatctttcg 7440 cggtcaatag aaggccttcc accatcaaga catcttcggg tttattttca atattcgcgg 7500 aggaagaaaa ttgaatgatc agttcttttc cattcttttg aatatcttca atcggcgtat 7560 catcggataa aatgggtttt aaatgagtgc cgctttcttc gtttttcatc atcttaatcg 7620 cttcctgcac cgattcgtaa gattcgcttg aaggtgcaag gaaccggcgc ccgtctgagc 7680 tttcatataa atagtagcat ttttgcgtct ggtgcataat cgccatatcg gcgagcattc 7740 cgaatgtttc aaattcaaca cccgatttat cattggaaat aaacagaaca gaatcatacg 7800 atccccattt aaaggtttcg ttgatcacat ttttcagccg ttcgaaatct tcgactgata 7860 gctccggtat tttctcatca acttgaatct tcagtttttt attgtttttc tgctctttga 7920 acttcacctt atcaaggtaa gctgtgtcaa atgatgtaaa ctggtccact ccaagccggc 7980 tgtaagcgtg aagcgcatct tcaagatttg tcatgccagt gcttttctcg aggcttaccg 8040 ggacaacgac agacttggac tcgtcaagga aagcgaaggt gatatagtcg tctttttgat 8100 tctgtgagac gacaaacgta tttgcaggtt cagacttggc agcatcagcc tccgtctgca 8160 ccaattttcc gtcagaagaa atgttggcgt cggcgctgtt ttgagatctg atctgttcga 8220 ttaactgggg agtgatcagc atcagaagaa agagaaccaa aactgtagca gcaaatgcgc 8280 cgacccgttt tttcggtgat ttacgctttg gtgcgagaat cagcttttga tagatctgat 8340 ttgccgaacg attatcctta accgttggaa gttggcttag taacgccttc agccgttctt 8400 cgttccattc tgacttcttc attctttgga tcctccttca aaagctccat ctgtttacga 8460 agcactttca gaccgcggtg ctgagtggtt tttaccttgc tttcggaaaa attcaaggct 8520 tttgctgttt cactgatcga atatccttga ataaaacgca agacgataac tgatctttgg 8580 tcaagcgtac acttgtctag ggcctcgaaa atttccttta ggttttcatt ttgcatcacg 8640 atgtcctcag gcagaggctt gcggtctttt acatcttgtt tctcccagtc aaacgtcccc 8700 aaaatccgct ggcggatcgt ctgctgcttt ctgaaccagt cgatcgcaac gtgccgcgca 8760 atcgaaagaa gccaggtttt ttcgctgctc ctgccttcaa atgtttcgta agaatgcagg 8820 acgcggatgt atacttcctg aactaagtct tccgcctgat ttttgtcttt taccatataa 8880 aataaaaact gaaataaatc ctgatgatac tgatcatata ttttctgaaa ggtttcttcc 8940 acctgaaacc cctccgttca atttattgtc gtttgtcaat cttaaaaggt tacattacaa 9000 ctattacaac tatattacga acatatgaaa atggaaaggg ggttttgcga aagttaagct 9060 taattttaac ttaacaagca caaaagcacc cgttctaaat gaacaggtgc caaggttata 9120 ggagcccaca ttttcactaa gctgtgccct tacaaggctt tcgttctcct gaccggagcg 9180 ttgcggatcc gctgaaatga actaatttca atccgtttat gactttaagt ccaattgttg 9240 gcgaagcttt ttggaaatct ccattctctt ttcgtcagtc actaggtgat accataagcc 9300 gtcaactttt ttgtcttcac cttcaatttc tacctgctta atatctttag cagcttcttt 9360 ataagaactt tgaatatcga tcatcttgtc cagtgttaag tttgttttga tgtttttttc 9420 taatgctgcc aaaatctctt gatagtttgt taatgatttt aattgtgcac cttcatgaat 9480 aatttcgttg ataatctcac gctgacgctc ttgac 9515 <210> 145 <211> 1452 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 145 gcagcgacaa acggaacaat gatgcagtat ttcgagtggt atgtacctaa cgacggccag 60 caatggaaca gactgagaac agatgcccct tacttgtcat ctgttggtat tacagcagta 120 tggacaccgc cggcttataa gggcacgtct caagcagatg tggggtacgg cccgtacgat 180 ctgtatgatt taggcgagtt taatcaaaaa ggtacagtca gaacgaagta tggcacaaaa 240 ggagaactta aatctgctgt caacacgctg cattcaaatg gaatccaagt gtatggtgat 300 gtcgtgatga atcataaagc aggtgctgat tatacagaaa acgtaacggc ggtggaggtg 360 aatccgtcta atagatatca ggaaacgagc ggcgaatata atattcaggc atggacaggc 420 ttcaactttc cgggcagagg aacaacgtat tctaactgga aatggcagtg gttccatttt 480 gatggaacgg attgggacca gagcagaagc ctctctagaa tcttcaaatt ccatggaaag 540 gcgtgggact ggccggtttc ttcagaaaac ggaaattatg actatctgat gtacgcggac 600 tatgattatg accatccgga tgtcgtgaat gaaatgaaaa agtggggcgt ctggtatgcc 660 aacgaagttg ggttagatgg atacagactt gacgcggtca aacatattaa atttagcttt 720 ctcaaagact gggtggataa cgcaagagca gcgacgggaa aagaaatgtt tacggttggc 780 gaatattggc aaaatgattt aggggccctg aataactacc tggcaaaggt aaattacaac 840 caatctcttt ttgatgcgcc gttgcattac aacttttacg ctgcctcaac agggggtgga 900 gcgtacgata tgagaaatat tcttaataac acgttagtcg caagcaatcc gacaaaggct 960 gttacgttag ttgagaatca tgacacacag cctggacaat cactggaatc aacagtccaa 1020 ccgtggttta aaccgttagc ctacgcgttt attctcacga gaagcggagg ctatcctgcg 1080 gtattttatg gagatatgta cggtacaaaa ggaacgacaa catatgagat ccctgctctt 1140 aaatctaaaa tcgaaccttt gcttaaggct agaaaagact atgcttatgg aacacagaga 1200 gactatattg ataacccgga tgtcattggc tggacgagag aaggggactc aacgaaagcc 1260 aagagcggtc tggccacagt gattacagat gggccgggcg gttcaaaaag aatgtatgtt 1320 ggcacgagca atgcgggtga aatctggtat gatttgacag ggaatagaac agataaaatc 1380 acgattggaa gcgatggcta tgcaacattt cctgtcaatg ggggctcagt ttcagtatgg 1440 gtgcagcaat ga 1452 <210> 146 <211> 9214 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 146 catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60 tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120 cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180 gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240 tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300 aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360 cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420 ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480 tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540 gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600 cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660 cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720 gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780 tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840 agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900 cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960 gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020 attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080 atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140 tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200 gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260 acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320 gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380 gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440 atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500 tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560 gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620 ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680 ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740 cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800 ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860 ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920 ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980 ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040 tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100 cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160 ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220 cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280 cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340 agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400 cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460 ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520 cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580 tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640 gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700 agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760 ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820 tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880 ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940 aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000 gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060 tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120 agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180 tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240 caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300 catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360 tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420 gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480 ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540 tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600 ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660 agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720 ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780 gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840 ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900 ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960 ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020 gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080 gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140 taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200 aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260 cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320 ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380 gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440 tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500 aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560 aagtctactc tgaatttttt taaaaggaga gggtaaagat gaaacaacaa aaacggcttt 4620 acgcccgatt gctgacgctg ttatttgcgc tcatcttctt gctgcctcat tctgcagcta 4680 gcgcagcagc gacaaacgga acaatgatgc agtatttcga gtggtatgta cctaacgacg 4740 gccagcaatg gaacagactg agaacagatg ccccttactt gtcatctgtt ggtattacag 4800 cagtatggac accgccggct tataagggca cgtctcaagc agatgtgggg tacggcccgt 4860 acgatctgta tgatttaggc gagtttaatc aaaaaggtac agtcagaacg aagtatggca 4920 caaaaggaga acttaaatct gctgtcaaca cgctgcattc aaatggaatc caagtgtatg 4980 gtgatgtcgt gatgaatcat aaagcaggtg ctgattatac agaaaacgta acggcggtgg 5040 aggtgaatcc gtctaataga tatcaggaaa cgagcggcga atataatatt caggcatgga 5100 caggcttcaa ctttccgggc agaggaacaa cgtattctaa ctggaaatgg cagtggttcc 5160 attttgatgg aacggattgg gaccagagca gaagcctctc tagaatcttc aaattccatg 5220 gaaaggcgtg ggactggccg gtttcttcag aaaacggaaa ttatgactat ctgatgtacg 5280 cggactatga ttatgaccat ccggatgtcg tgaatgaaat gaaaaagtgg ggcgtctggt 5340 atgccaacga agttgggtta gatggataca gacttgacgc ggtcaaacat attaaattta 5400 gctttctcaa agactgggtg gataacgcaa gagcagcgac gggaaaagaa atgtttacgg 5460 ttggcgaata ttggcaaaat gatttagggg ccctgaataa ctacctggca aaggtaaatt 5520 acaaccaatc tctttttgat gcgccgttgc attacaactt ttacgctgcc tcaacagggg 5580 gtggagcgta cgatatgaga aatattctta ataacacgtt agtcgcaagc aatccgacaa 5640 aggctgttac gttagttgag aatcatgaca cacagcctgg acaatcactg gaatcaacag 5700 tccaaccgtg gtttaaaccg ttagcctacg cgtttattct cacgagaagc ggaggctatc 5760 ctgcggtatt ttatggagat atgtacggta caaaaggaac gacaacatat gagatccctg 5820 ctcttaaatc taaaatcgaa cctttgctta aggctagaaa agactatgct tatggaacac 5880 agagagacta tattgataac ccggatgtca ttggctggac gagagaaggg gactcaacga 5940 aagccaagag cggtctggcc acagtgatta cagatgggcc gggcggttca aaaagaatgt 6000 atgttggcac gagcaatgcg ggtgaaatct ggtatgattt gacagggaat agaacagata 6060 aaatcacgat tggaagcgat ggctatgcaa catttcctgt caatgggggc tcagtttcag 6120 tatgggtgca gcaatgaaag cttctcgagg ttaacagagg acggatttcc tgaaggaaat 6180 ccgttttttt attttcaagc acgaaaaaca cttcccggtg atcgggaggt gttttttgtt 6240 aaaaagatca tgacatgcat agaacagcga ccgggctaat tgtatataat attgtgaatt 6300 taacaaaaaa tttacaaagg agatgataaa ggcaatgacc agggtgaaaa ggatgagatt 6360 tgctgatttg ttggatttag aggcggagta gatgaaaccg gccaaagtat ccctactcca 6420 ccgattgctc cagtgcctga agcaatgtgt tgattgtaac acagtaaatc gttttacagc 6480 aataaacatt tttgtgaata ttttattgat ttcggctgtg atctcattcc catattctgc 6540 tgcggcccat ggcgcaacac agtccggcga tcaatattca agctttgaag aattggagcg 6600 gaatgaagat ccagcttctt accgaattac ggagaagaac gcaagagtgc cgatgctcat 6660 catggccatc catggaggcg gcatcgaacc cggaacgagc gaaatcgcca atgaagtgtc 6720 caaaaactat tccctgtact tgtttgaagg gctgaaatca tcaggcaata cggaccttca 6780 cattacaagc acgcgttttg acgagccagc ggcgctcgca attactgcaa gccaccagta 6840 tgtcatgtcg ctccacggct attacagtga agaccgcgat attaaagtag gcggcacaga 6900 ccgcgctaaa atcagaatat tggttgatga gctgaaccgc tcggggtttg ccgctgaaat 6960 gctggggaca gatgacaagt atgccggaac ccatccgaat aacatcgcca acaagtcgct 7020 ttccgggctg agcattcagc ttgaaatgag cacgggtttc cgcaaatctt tattcgaccg 7080 gtttacacta aaagacaggg cggcgacgca aaacgaaacg ttttaccgat ttacaaagct 7140 gctgacagat tttattcatg aaaactatga agaagacgga ggggatttcc cctctgcaaa 7200 aataaaacac ccccttcaag tgaaaaagga ggtgtttcgg cggttgtgtt aaccgttgga 7260 ctctgaggtg ccgccgccgg tgaatacgga aacgatggcg ttccacagag acacaaagaa 7320 gtcgatcagt ttttgaagaa agttttgtcc ttcttcagaa tccaagaatt tcgtgatttt 7380 atcctttgct ttgtcaagct ggtctccaac ctggttccag tcgatattaa tatttttcat 7440 gttattaaat aaagatataa gagagttttt ctgatcttct gtgagtgtca cgccaagttc 7500 ggaagcagcc gaatcaatcg ttttctccaa ttcctctttt gactcgggaa ctccgttttt 7560 cgagatttct tccttgactt tggccatcag cgctgacgcg ttttcactgc cgattttctc 7620 gccaagctct gaagtggtga caagctcttc attcgcgacc tttttcacat cttcggaaat 7680 tttttcgccc gaagtcgttt catacgcttt catcaatccg gttaaagcgg ctgtgcctga 7740 cacttcaaac ggagcggtga catagacttt ggcgtctttt acaccggccg tcatcagcgc 7800 gttcaaatac atctcatctg taattctgct gatattgtgt gtctgaactt ccaaaccggt 7860 gccttttttc gctacggtaa ttgaagaaga agaaatcgct cttgttccga tttgtgcttt 7920 cggtatataa tcccctaaat atttatgctc ctcatcattt gtcacctcga tgatggtcgc 7980 attttcaggc gcattcattt cttttaatac tttttgtctg tcctggcttg acaagtcttt 8040 ccccagcgtg acgatgacat cacccactgc ggcgtcagcg aagctgacct gcgggaaaat 8100 gagcagacac aatgctgtaa agattcctag tatcgatttt ttcaagctca atgccctcct 8160 taaaaatgca ggcttcaggc agaattgctg tacttttaaa gaagcctgcc ggaacggaaa 8220 taatgcgttc cgaaatatag acggatgaaa gatgagtgag gtttcaaaga aaaaaagaga 8280 gaattttctc ttcaagtcaa atgccctccc ggcatcgtat ctcgccgctc ttttatcatt 8340 catgattttc acaggcgatt caaccttttt ttaaaatttt ttacaaaaac gatacaagag 8400 cggcgtttat ttcggtcgat tggctctctg cttcttcaat atgatataat gacccttgtg 8460 aaatgaaagg agagaatcaa gatggctaaa aaaggataca tacaactgac aaacggcaaa 8520 aaaatcgagt ttgaactata tccggatgcg gcgccgggaa ctgtcgccaa ctttgaaaaa 8580 cttgcaaacg aagggttcta tgacgggctg aagttccacc gcgtcatccc gggcttcgtc 8640 agccagggag gctgcccgca cggcaccgga acaggcggac ctggatatac gattaaatgc 8700 gagacagaag ggaatccgca caaacacgaa gccggttctc tctcaatggc tcacgcagga 8760 aaagataccg gaggcagcca attttttatc gtccatgagc ctcagccgca cttgaacggc 8820 gttcacaccg ttttcggaaa ggtcacatca ggccttgatg ccgtcacttc aatggagcag 8880 ggacaaggca tggaaaaagt cgaagtattt gatgcataat cagagagcgc aaaaaacagc 8940 ccgcttagcc gggctgtttt tttgtctgta acggtgttta ttttccaggt gcaacaggac 9000 ttgaggccga ttcttcgtcc acatcctgat aggaaataac gatgctaata aataaaataa 9060 ttgtgaaaaa atgacccttt atgtaaaata tattcaagtg aagagctaga tagagaacgc 9120 aatctgtaaa aaaggaaggg gcgtaagggg tgagcgtaaa aatcccatcg acggcagtcg 9180 gcgtaaaaat taatgactgg tataacgcga tacg 9214 <210> 147 <211> 483 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 147 Ala Ala Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Val Pro 1 5 10 15 Asn Asp Gly Gln Gln Trp Asn Arg Leu Arg Thr Asp Ala Pro Tyr Leu 20 25 30 Ser Ser Val Gly Ile Thr Ala Val Trp Thr Pro Pro Ala Tyr Lys Gly 35 40 45 Thr Ser Gln Ala Asp Val Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu 50 55 60 Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys 65 70 75 80 Gly Glu Leu Lys Ser Ala Val Asn Thr Leu His Ser Asn Gly Ile Gln 85 90 95 Val Tyr Gly Asp Val Val Met Asn His Lys Ala Gly Ala Asp Tyr Thr 100 105 110 Glu Asn Val Thr Ala Val Glu Val Asn Pro Ser Asn Arg Asn Gln Glu 115 120 125 Thr Ser Gly Glu Tyr Asn Ile Gln Ala Trp Thr Gly Phe Asn Phe Pro 130 135 140 Gly Arg Gly Thr Thr Tyr Ser Asn Phe Lys Trp Gln Trp Phe His Phe 145 150 155 160 Asp Gly Thr Asp Trp Asp Gln Ser Arg Ser Leu Ser Arg Ile Phe Lys 165 170 175 Phe Thr Gly Lys Ala Trp Asp Trp Pro Val Ser Ser Glu Asn Gly Asn 180 185 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Tyr Asp Tyr Asp His Pro Asp Val 195 200 205 Val Asn Glu Met Lys Lys Trp Gly Val Trp Tyr Ala Asn Glu Val Gly 210 215 220 Leu Asp Gly Tyr Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225 230 235 240 Leu Lys Asp Trp Val Asp Asn Ala Arg Ala Ala Thr Gly Lys Glu Met 245 250 255 Phe Thr Val Gly Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Asn Asn 260 265 270 Tyr Leu Ala Lys Val Asn Tyr Asn Gln Ser Leu Phe Asp Ala Pro Leu 275 280 285 His Tyr Asn Phe Tyr Ala Ala Ser Thr Gly Gly Gly Tyr Tyr Asp Met 290 295 300 Arg Asn Ile Leu Asn Asn Thr Leu Val Ala Ser Asn Pro Thr Lys Ala 305 310 315 320 Val Thr Leu Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu 325 330 335 Ser Thr Val Gln Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu 340 345 350 Thr Arg Ser Gly Gly Tyr Pro Ser Val Phe Tyr Gly Asp Met Tyr Gly 355 360 365 Thr Lys Gly Thr Thr Thr Arg Glu Ile Pro Ala Leu Lys Ser Lys Ile 370 375 380 Glu Pro Leu Leu Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Thr Gln Arg 385 390 395 400 Asp Tyr Ile Asp Asn Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp 405 410 415 Ser Thr Lys Ala Lys Ser Gly Leu Ala Thr Val Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ser Lys Arg Met Tyr Val Gly Thr Ser Asn Ala Gly Glu Ile 435 440 445 Trp Tyr Asp Leu Thr Gly Asn Asn Ser Thr Lys Ile Thr Ile Gly Ser 450 455 460 Asp Gly Tyr Ala Thr Phe Pro Val Asn Lys Gly Ser Val Ser Val Trp 465 470 475 480 Val Gln Gln <210> 148 <211> 9516 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 148 ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60 gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120 aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180 aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240 ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300 tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360 gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420 aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480 gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540 caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600 gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660 tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720 gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780 ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840 cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900 ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960 ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020 acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080 gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140 gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200 ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260 agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320 ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380 ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440 gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500 gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560 gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620 agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680 tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740 aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800 gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860 tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920 aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980 cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040 tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100 tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160 ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220 ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280 cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340 ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400 tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460 ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520 aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580 tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640 cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700 ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760 attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820 acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880 cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940 atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000 gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060 attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120 ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180 aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240 cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300 tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360 agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420 atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480 gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540 aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600 aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660 ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720 agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780 aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840 gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900 cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960 ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020 gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080 acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140 aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200 gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260 ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320 attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380 atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440 ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500 gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560 cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620 aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680 agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gaatgaaaca acaaaaacgg 4740 ctttacgccc gattgctgac gctgttattt gcgctcatct tcttgctgcc tcattctgca 4800 gctagcgcag cagcgacaaa cggaacaatg atgcagtatt tcgagtggta tgtacctaac 4860 gacggccagc aatggaacag actgagaaca gatgcccctt acttgtcatc tgttggtatt 4920 acagcagtat ggacaccgcc ggcttataag ggcacgtctc aagcagatgt ggggtacggc 4980 ccgtacgatc tgtatgattt aggcgagttt aatcaaaaag gtacagtcag aacgaagtat 5040 ggcacaaaag gagaacttaa atctgctgtc aacacgctgc attcaaatgg aatccaagtg 5100 tatggtgatg tcgtgatgaa tcataaagca ggtgctgatt atacagaaaa cgtaacggcg 5160 gtggaggtga atccgtctaa tagaaatcag gaaacgagcg gcgaatataa tattcaggca 5220 tggacaggct tcaactttcc gggcagagga acaacgtatt ctaacttcaa atggcagtgg 5280 ttccattttg atggaacgga ttgggaccag agcagaagcc tctctagaat cttcaaattc 5340 acgggaaagg cgtgggactg gccggtttct tcagaaaacg gaaattatga ctatctgatg 5400 tacgcggact acgattatga ccatccggat gtcgtgaatg aaatgaaaaa gtggggcgtc 5460 tggtatgcca acgaagttgg gttagatgga tacagacttg acgcggtcaa acatattaaa 5520 tttagctttc tcaaagactg ggtggataac gcaagagcag cgacgggaaa agaaatgttt 5580 acggttggcg aatattggca aaatgattta ggggccctga ataactacct ggcaaaggta 5640 aattacaacc aatctctttt tgatgcgccg ttgcattaca acttttacgc tgcctcaaca 5700 gggggtggat attacgatat gagaaatatt cttaataaca cgttagtcgc aagcaatccg 5760 acaaaggctg ttacgttagt tgagaatcat gacacacagc ctggacaatc actggaatca 5820 acagtccaac cgtggtttaa accgttagcc tacgcgttta ttctcacgag aagcggaggc 5880 tatccttctg tattttatgg agatatgtac ggtacaaaag gaacgacaac aagagagatc 5940 cctgctctta aatctaaaat cgaacctttg cttaaggcta gaaaagacta tgcttatgga 6000 acacagagag actatattga taacccggat gtcattggct ggacgagaga aggggactca 6060 acgaaagcca agagcggtct ggccacagtg attacagatg ggccgggcgg ttcaaaaaga 6120 atgtatgttg gcacgagcaa tgcgggtgaa atctggtatg atttgacagg gaataactca 6180 acaaaaatca cgattggaag cgatggctat gcaacatttc ctgtcaataa aggctcagtt 6240 tcagtatggg tgcagcaata gaagcttctc gaggttaaca gaggacggat ttcctgaagg 6300 aaatccgttt ttttatttta cagaagctgc ggaacctgaa aagaattcct ttcaggttcc 6360 gtttttttta ggaattctcc ctgatctcaa gcatctggcg gggataaatc cgctctcctt 6420 tcaaatcgtt ccattctttg aggcgctgta cagttacgcc cattttttcg gcgatatgat 6480 gaagcgtatc ccctttccgc actacatatg taccggtctt cgattcatcg tcatgaaggc 6540 ggagtgtttg gccggccttg agatttgaat gtttcaaccc gtttattctc atgatctcct 6600 cgatggatat accgctatcc ttgctgattc tccagagcgt gtcccctttt tgaacggtca 6660 ccgcaccgct cattgtcccg gcgttttgat aaacgtggat agaattttgc cggaacgcct 6720 cctcacgaag caccgtcagc ggattgattg catatctttt atcttcagtc catgaaccgt 6780 gatgcatttc aaaatgcagg tgggttccgg tcgatattcc cgtattgccg atgattccga 6840 tttgctcgcc ttttttcacc cgctcctttt cctttttcag gcgtttgctt aagtgggcat 6900 aaacggtttc atatccgttg tcatgtttaa taaatatcac ttggccgtag gagtcggatt 6960 gatacgattt gcttatcgtt ccgtctgcgg ctgccgctac tgcttcccct tcgggagcag 7020 cgatgtcaag ccccttatgc tttccgcctc tcgtaccgaa ttgatctgtg atctctcctt 7080 taatcggttc aatccactct gaggcttccg cccccggggc attgacgaaa agcgccaatc 7140 ccgaaagcca tgcgatcgcg aacaggaagt tttgatgtct gagtttcttc aaggttttcc 7200 atatcctcct attacatgca tcttcggtaa aattgccccc tattcggaga cagcttagta 7260 tacttccaaa tcaatacaat ttatacatta aaaaaagact ccgcacaggg agtcttttag 7320 ttttctatcg tcatcggatt cggtgcgtac ggaacctgta cagatttcga caggtcatag 7380 gcgccgacct tggttatgga tgcgttttta aatttcactt ttgtgaagcc gaaatctttc 7440 gcggtcaata gaaggccttc caccatcaag acatcttcgg gtttattttc aatattcgcg 7500 gaggaagaaa attgaatgat cagttctttt ccattctttt gaatatcttc aatcggcgta 7560 tcatcggata aaatgggttt taaatgagtg ccgctttctt cgtttttcat catcttaatc 7620 gcttcctgca ccgattcgta agattcgctt gaaggtgcaa ggaaccggcg cccgtctgag 7680 ctttcatata aatagtagca tttttgcgtc tggtgcataa tcgccatatc ggcgagcatt 7740 ccgaatgttt caaattcaac acccgattta tcattggaaa taaacagaac agaatcatac 7800 gatccccatt taaaggtttc gttgatcaca tttttcagcc gttcgaaatc ttcgactgat 7860 agctccggta ttttctcatc aacttgaatc ttcagttttt tattgttttt ctgctctttg 7920 aacttcacct tatcaaggta agctgtgtca aatgatgtaa actggtccac tccaagccgg 7980 ctgtaagcgt gaagcgcatc ttcaagattt gtcatgccag tgcttttctc gaggcttacc 8040 gggacaacga cagacttgga ctcgtcaagg aaagcgaagg tgatatagtc gtctttttga 8100 ttctgtgaga cgacaaacgt atttgcaggt tcagacttgg cagcatcagc ctccgtctgc 8160 accaattttc cgtcagaaga aatgttggcg tcggcgctgt tttgagatct gatctgttcg 8220 attaactggg gagtgatcag catcagaaga aagagaacca aaactgtagc agcaaatgcg 8280 ccgacccgtt ttttcggtga tttacgcttt ggtgcgagaa tcagcttttg atagatctga 8340 tttgccgaac gattatcctt aaccgttgga agttggctta gtaacgcctt cagccgttct 8400 tcgttccatt ctgacttctt cattctttgg atcctccttc aaaagctcca tctgtttacg 8460 aagcactttc agaccgcggt gctgagtggt ttttaccttg ctttcggaaa aattcaaggc 8520 ttttgctgtt tcactgatcg aatatccttg aataaaacgc aagacgataa ctgatctttg 8580 gtcaagcgta cacttgtcta gggcctcgaa aatttccttt aggttttcat tttgcatcac 8640 gatgtcctca ggcagaggct tgcggtcttt tacatcttgt ttctcccagt caaacgtccc 8700 caaaatccgc tggcggatcg tctgctgctt tctgaaccag tcgatcgcaa cgtgccgcgc 8760 aatcgaaaga agccaggttt tttcgctgct cctgccttca aatgtttcgt aagaatgcag 8820 gacgcggatg tatacttcct gaactaagtc ttccgcctga tttttgtctt ttaccatata 8880 aaataaaaac tgaaataaat cctgatgata ctgatcatat attttctgaa aggtttcttc 8940 cacctgaaac ccctccgttc aatttattgt cgtttgtcaa tcttaaaagg ttacattaca 9000 actattacaa ctatattacg aacatatgaa aatggaaagg gggttttgcg aaagttaagc 9060 ttaattttaa cttaacaagc acaaaagcac ccgttctaaa tgaacaggtg ccaaggttat 9120 aggagcccac attttcacta agctgtgccc ttacaaggct ttcgttctcc tgaccggagc 9180 gttgcggatc cgctgaaatg aactaatttc aatccgttta tgactttaag tccaattgtt 9240 ggcgaagctt tttggaaatc tccattctct tttcgtcagt cactaggtga taccataagc 9300 cgtcaacttt tttgtcttca ccttcaattt ctacctgctt aatatcttta gcagcttctt 9360 tataagaact ttgaatatcg atcatcttgt ccagtgttaa gtttgttttg atgttttttt 9420 ctaatgctgc caaaatctct tgatagtttg ttaatgattt taattgtgca ccttcatgaa 9480 taatttcgtt gataatctca cgctgacgct cttgac 9516 <210> 149 <211> 1452 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 149 gcagcgacaa acggaacaat gatgcagtat ttcgagtggt atgtacctaa cgacggccag 60 caatggaaca gactgagaac agatgcccct tacttgtcat ctgttggtat tacagcagta 120 tggacaccgc cggcttataa gggcacgtct caagcagatg tggggtacgg cccgtacgat 180 ctgtatgatt taggcgagtt taatcaaaaa ggtacagtca gaacgaagta tggcacaaaa 240 ggagaactta aatctgctgt caacacgctg cattcaaatg gaatccaagt gtatggtgat 300 gtcgtgatga atcataaagc aggtgctgat tatacagaaa acgtaacggc ggtggaggtg 360 aatccgtcta atagaaatca ggaaacgagc ggcgaatata atattcaggc atggacaggc 420 ttcaactttc cgggcagagg aacaacgtat tctaacttca aatggcagtg gttccatttt 480 gatggaacgg attgggacca gagcagaagc ctctctagaa tcttcaaatt cacgggaaag 540 gcgtgggact ggccggtttc ttcagaaaac ggaaattatg actatctgat gtacgcggac 600 tacgattatg accatccgga tgtcgtgaat gaaatgaaaa agtggggcgt ctggtatgcc 660 aacgaagttg ggttagatgg atacagactt gacgcggtca aacatattaa atttagcttt 720 ctcaaagact gggtggataa cgcaagagca gcgacgggaa aagaaatgtt tacggttggc 780 gaatattggc aaaatgattt aggggccctg aataactacc tggcaaaggt aaattacaac 840 caatctcttt ttgatgcgcc gttgcattac aacttttacg ctgcctcaac agggggtgga 900 tattacgata tgagaaatat tcttaataac acgttagtcg caagcaatcc gacaaaggct 960 gttacgttag ttgagaatca tgacacacag cctggacaat cactggaatc aacagtccaa 1020 ccgtggttta aaccgttagc ctacgcgttt attctcacga gaagcggagg ctatccttct 1080 gtattttatg gagatatgta cggtacaaaa ggaacgacaa caagagagat ccctgctctt 1140 aaatctaaaa tcgaaccttt gcttaaggct agaaaagact atgcttatgg aacacagaga 1200 gactatattg ataacccgga tgtcattggc tggacgagag aaggggactc aacgaaagcc 1260 aagagcggtc tggccacagt gattacagat gggccgggcg gttcaaaaag aatgtatgtt 1320 ggcacgagca atgcgggtga aatctggtat gatttgacag ggaataactc aacaaaaatc 1380 acgattggaa gcgatggcta tgcaacattt cctgtcaata aaggctcagt ttcagtatgg 1440 gtgcagcaat ag 1452 <210> 150 <211> 9215 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 150 catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60 tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120 cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180 gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240 tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300 aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360 cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420 ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480 tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540 gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600 cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660 cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720 gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780 tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840 agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900 cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960 gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020 attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080 atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140 tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200 gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260 acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320 gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380 gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440 atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500 tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560 gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620 ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680 ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740 cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800 ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860 ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920 ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980 ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040 tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100 cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160 ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220 cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280 cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340 agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400 cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460 ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520 cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580 tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640 gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700 agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760 ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820 tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880 ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940 aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000 gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060 tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120 agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180 tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240 caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300 catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360 tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420 gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480 ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540 tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600 ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660 agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720 ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780 gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840 ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900 ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960 ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020 gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080 gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140 taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200 aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260 cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320 ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380 gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440 tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500 aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560 aagtctactc tgaatttttt taaaaggaga gggtaaagaa tgaaacaaca aaaacggctt 4620 tacgcccgat tgctgacgct gttatttgcg ctcatcttct tgctgcctca ttctgcagct 4680 agcgcagcag cgacaaacgg aacaatgatg cagtatttcg agtggtatgt acctaacgac 4740 ggccagcaat ggaacagact gagaacagat gccccttact tgtcatctgt tggtattaca 4800 gcagtatgga caccgccggc ttataagggc acgtctcaag cagatgtggg gtacggcccg 4860 tacgatctgt atgatttagg cgagtttaat caaaaaggta cagtcagaac gaagtatggc 4920 acaaaaggag aacttaaatc tgctgtcaac acgctgcatt caaatggaat ccaagtgtat 4980 ggtgatgtcg tgatgaatca taaagcaggt gctgattata cagaaaacgt aacggcggtg 5040 gaggtgaatc cgtctaatag aaatcaggaa acgagcggcg aatataatat tcaggcatgg 5100 acaggcttca actttccggg cagaggaaca acgtattcta acttcaaatg gcagtggttc 5160 cattttgatg gaacggattg ggaccagagc agaagcctct ctagaatctt caaattcacg 5220 ggaaaggcgt gggactggcc ggtttcttca gaaaacggaa attatgacta tctgatgtac 5280 gcggactacg attatgacca tccggatgtc gtgaatgaaa tgaaaaagtg gggcgtctgg 5340 tatgccaacg aagttgggtt agatggatac agacttgacg cggtcaaaca tattaaattt 5400 agctttctca aagactgggt ggataacgca agagcagcga cgggaaaaga aatgtttacg 5460 gttggcgaat attggcaaaa tgatttaggg gccctgaata actacctggc aaaggtaaat 5520 tacaaccaat ctctttttga tgcgccgttg cattacaact tttacgctgc ctcaacaggg 5580 ggtggatatt acgatatgag aaatattctt aataacacgt tagtcgcaag caatccgaca 5640 aaggctgtta cgttagttga gaatcatgac acacagcctg gacaatcact ggaatcaaca 5700 gtccaaccgt ggtttaaacc gttagcctac gcgtttattc tcacgagaag cggaggctat 5760 ccttctgtat tttatggaga tatgtacggt acaaaaggaa cgacaacaag agagatccct 5820 gctcttaaat ctaaaatcga acctttgctt aaggctagaa aagactatgc ttatggaaca 5880 cagagagact atattgataa cccggatgtc attggctgga cgagagaagg ggactcaacg 5940 aaagccaaga gcggtctggc cacagtgatt acagatgggc cgggcggttc aaaaagaatg 6000 tatgttggca cgagcaatgc gggtgaaatc tggtatgatt tgacagggaa taactcaaca 6060 aaaatcacga ttggaagcga tggctatgca acatttcctg tcaataaagg ctcagtttca 6120 gtatgggtgc agcaatagaa gcttctcgag gttaacagag gacggatttc ctgaaggaaa 6180 tccgtttttt tattttcaag cacgaaaaac acttcccggt gatcgggagg tgttttttgt 6240 taaaaagatc atgacatgca tagaacagcg accgggctaa ttgtatataa tattgtgaat 6300 ttaacaaaaa atttacaaag gagatgataa aggcaatgac cagggtgaaa aggatgagat 6360 ttgctgattt gttggattta gaggcggagt agatgaaacc ggccaaagta tccctactcc 6420 accgattgct ccagtgcctg aagcaatgtg ttgattgtaa cacagtaaat cgttttacag 6480 caataaacat ttttgtgaat attttattga tttcggctgt gatctcattc ccatattctg 6540 ctgcggccca tggcgcaaca cagtccggcg atcaatattc aagctttgaa gaattggagc 6600 ggaatgaaga tccagcttct taccgaatta cggagaagaa cgcaagagtg ccgatgctca 6660 tcatggccat ccatggaggc ggcatcgaac ccggaacgag cgaaatcgcc aatgaagtgt 6720 ccaaaaacta ttccctgtac ttgtttgaag ggctgaaatc atcaggcaat acggaccttc 6780 acattacaag cacgcgtttt gacgagccag cggcgctcgc aattactgca agccaccagt 6840 atgtcatgtc gctccacggc tattacagtg aagaccgcga tattaaagta ggcggcacag 6900 accgcgctaa aatcagaata ttggttgatg agctgaaccg ctcggggttt gccgctgaaa 6960 tgctggggac agatgacaag tatgccggaa cccatccgaa taacatcgcc aacaagtcgc 7020 tttccgggct gagcattcag cttgaaatga gcacgggttt ccgcaaatct ttattcgacc 7080 ggtttacact aaaagacagg gcggcgacgc aaaacgaaac gttttaccga tttacaaagc 7140 tgctgacaga ttttattcat gaaaactatg aagaagacgg aggggatttc ccctctgcaa 7200 aaataaaaca cccccttcaa gtgaaaaagg aggtgtttcg gcggttgtgt taaccgttgg 7260 actctgaggt gccgccgccg gtgaatacgg aaacgatggc gttccacaga gacacaaaga 7320 agtcgatcag tttttgaaga aagttttgtc cttcttcaga atccaagaat ttcgtgattt 7380 tatcctttgc tttgtcaagc tggtctccaa cctggttcca gtcgatatta atatttttca 7440 tgttattaaa taaagatata agagagtttt tctgatcttc tgtgagtgtc acgccaagtt 7500 cggaagcagc cgaatcaatc gttttctcca attcctcttt tgactcggga actccgtttt 7560 tcgagatttc ttccttgact ttggccatca gcgctgacgc gttttcactg ccgattttct 7620 cgccaagctc tgaagtggtg acaagctctt cattcgcgac ctttttcaca tcttcggaaa 7680 ttttttcgcc cgaagtcgtt tcatacgctt tcatcaatcc ggttaaagcg gctgtgcctg 7740 acacttcaaa cggagcggtg acatagactt tggcgtcttt tacaccggcc gtcatcagcg 7800 cgttcaaata catctcatct gtaattctgc tgatattgtg tgtctgaact tccaaaccgg 7860 tgcctttttt cgctacggta attgaagaag aagaaatcgc tcttgttccg atttgtgctt 7920 tcggtatata atcccctaaa tatttatgct cctcatcatt tgtcacctcg atgatggtcg 7980 cattttcagg cgcattcatt tcttttaata ctttttgtct gtcctggctt gacaagtctt 8040 tccccagcgt gacgatgaca tcacccactg cggcgtcagc gaagctgacc tgcgggaaaa 8100 tgagcagaca caatgctgta aagattccta gtatcgattt tttcaagctc aatgccctcc 8160 ttaaaaatgc aggcttcagg cagaattgct gtacttttaa agaagcctgc cggaacggaa 8220 ataatgcgtt ccgaaatata gacggatgaa agatgagtga ggtttcaaag aaaaaaagag 8280 agaattttct cttcaagtca aatgccctcc cggcatcgta tctcgccgct cttttatcat 8340 tcatgatttt cacaggcgat tcaacctttt tttaaaattt tttacaaaaa cgatacaaga 8400 gcggcgttta tttcggtcga ttggctctct gcttcttcaa tatgatataa tgacccttgt 8460 gaaatgaaag gagagaatca agatggctaa aaaaggatac atacaactga caaacggcaa 8520 aaaaatcgag tttgaactat atccggatgc ggcgccggga actgtcgcca actttgaaaa 8580 acttgcaaac gaagggttct atgacgggct gaagttccac cgcgtcatcc cgggcttcgt 8640 cagccaggga ggctgcccgc acggcaccgg aacaggcgga cctggatata cgattaaatg 8700 cgagacagaa gggaatccgc acaaacacga agccggttct ctctcaatgg ctcacgcagg 8760 aaaagatacc ggaggcagcc aattttttat cgtccatgag cctcagccgc acttgaacgg 8820 cgttcacacc gttttcggaa aggtcacatc aggccttgat gccgtcactt caatggagca 8880 gggacaaggc atggaaaaag tcgaagtatt tgatgcataa tcagagagcg caaaaaacag 8940 cccgcttagc cgggctgttt ttttgtctgt aacggtgttt attttccagg tgcaacagga 9000 cttgaggccg attcttcgtc cacatcctga taggaaataa cgatgctaat aaataaaata 9060 attgtgaaaa aatgaccctt tatgtaaaat atattcaagt gaagagctag atagagaacg 9120 caatctgtaa aaaaggaagg ggcgtaaggg gtgagcgtaa aaatcccatc gacggcagtc 9180 ggcgtaaaaa ttaatgactg gtataacgcg atacg 9215 <210> 151 <211> 485 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 151 His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser 20 25 30 Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Ala Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Ser Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly 85 90 95 Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Ala Thr Glu Met Val Arg Ala Val Glu Val Asn Pro Asn Asn Arg Asn 115 120 125 Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Arg Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg 165 170 175 Ile Tyr Lys Phe Arg Gly His Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Leu Tyr Ala Asp Ile Asp Met 195 200 205 Asp His Pro Glu Val Val Asn Glu Leu Arg Asn Trp Gly Val Trp Tyr 210 215 220 Thr Asn Thr Leu Gly Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Ile Asn His Val Arg Ser Ala 245 250 255 Thr Gly Lys Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Ile Glu Asn Tyr Leu Gln Lys Thr Asn Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly 290 295 300 Gly Asn Tyr Asp Met Arg Asn Ile Phe Asn Gly Thr Val Val Gln Arg 305 310 315 320 His Pro Ser His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Glu Glu Ala Leu Glu Ser Phe Val Glu Glu Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Thr Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Arg Ser 370 375 380 Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Lys 385 390 395 400 Gln Asn Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Thr Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Ala Gly Gly Ser Lys Trp Met Phe Val Gly Arg Asn Lys Ala Gly 435 440 445 Gln Val Trp Ser Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Ile Trp Val Asn Lys 485 <210> 152 <211> 9522 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 152 ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60 gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120 aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180 aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240 ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300 tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360 gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420 aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480 gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540 caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600 gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660 tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720 gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780 ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840 cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900 ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960 ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020 acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080 gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140 gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200 ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260 agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320 ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380 ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440 gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500 gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560 gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620 agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680 tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740 aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800 gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860 tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920 aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980 cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040 tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100 tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160 ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220 ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280 cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340 ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400 tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460 ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520 aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580 tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640 cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700 ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760 attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820 acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880 cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940 atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000 gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060 attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120 ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180 aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240 cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300 tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360 agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420 atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480 gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540 aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600 aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660 ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720 agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780 aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840 gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900 cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960 ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020 gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080 acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140 aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200 gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260 ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320 attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380 atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440 ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500 gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560 cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620 aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680 agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gaatgaaaca acaaaaacgg 4740 ctttacgccc gattgctgac gctgttattt gcgctcatct tcttgctgcc tcattctgca 4800 gctagcgcac atcataacgg tacgaacggg acaatgatgc aatactttga atggtatcta 4860 cctaatgacg gaaatcattg gaatcgatta aactctgatg cgagtaacct taaaagcaaa 4920 gggattacag cggtgtggat tcctccagca tggaagggcg cttctcaaaa tgacgtagga 4980 tacggagcct atgacctgta tgatctggga gaatttaatc aaaaaggtac cgtccgtaca 5040 aaatatggaa cacgtagtca gttacaagct gcggtaacct ccttaaaaaa taatggaatt 5100 caagtatatg gtgacgttgt tatgaatcac aaaggtggcg cagacgctac tgaaatggta 5160 agggccgttg aagtgaatcc caataaccgt aaccaagaag tgactggtga atataccatt 5220 gaagcttgga ctagatttga ttttccaggg cgaggaaata ctcattctag ctttaaatgg 5280 agatggtatc attttgatgg tgtggattgg gatcagtcac gtagactgaa caatcgcatc 5340 tataaattta gaggtcatgg caaagcttgg gattgggaag ttgatacgga aaatggtaat 5400 tatgattatt tactatacgc tgatattgat atggatcacc cagaagtagt aaatgaatta 5460 agaaattggg gtgtttggta cacaaacaca ttaggactcg atggatttag aatagatgcg 5520 gttaaacata taaagtatag ctttacgcgc gattggatta atcacgttag aagtgcaaca 5580 ggtaaaaata tgtttgcggt tgctgagttt tggaagaatg atttaggtgc aattgaaaac 5640 tatctgcaga aaacaaactg gaaccattca gtctttgatg tgccgttaca ttataatctt 5700 tataatgcat caaaaagcgg agggaactat gatatgcgaa acatatttaa tggaacggtt 5760 gttcaacgac atccaagtca tgctgtaaca tttgttgata atcatgattc gcagcctgaa 5820 gaagcattag aatcttttgt tgaagaatgg tttaaaccat tagcgtatgc gcttacatta 5880 acgcgtgaac aaggataccc ttctgtattt tacggagatt attatgggat tccaacacat 5940 ggagtgccag caatgagatc aaaaatcgat ccgattttag aagcacgtca aaagtatgca 6000 tacggaaaac aaaatgatta cttagaccat cataatatca ttggttggac gcgtgaaggg 6060 aatacagcac accccaattc aggtctagct accatcatgt ctgatggagc gggtggaagt 6120 aagtggatgt ttgttgggcg taataaggct ggtcaagtat ggagtgatat tacaggaaac 6180 cgtacaggta cggttacaat caatgcagac ggttggggca atttctctgt gaatggaggg 6240 tcagtttcta tttgggtcaa caaataaaag cttctcgagg ttaacagagg acggatttcc 6300 tgaaggaaat ccgttttttt attttacaga agctgcggaa cctgaaaaga attcctttca 6360 ggttccgttt tttttaggaa ttctccctga tctcaagcat ctggcgggga taaatccgct 6420 ctcctttcaa atcgttccat tctttgaggc gctgtacagt tacgcccatt ttttcggcga 6480 tatgatgaag cgtatcccct ttccgcacta catatgtacc ggtcttcgat tcatcgtcat 6540 gaaggcggag tgtttggccg gccttgagat ttgaatgttt caacccgttt attctcatga 6600 tctcctcgat ggatataccg ctatccttgc tgattctcca gagcgtgtcc cctttttgaa 6660 cggtcaccgc accgctcatt gtcccggcgt tttgataaac gtggatagaa ttttgccgga 6720 acgcctcctc acgaagcacc gtcagcggat tgattgcata tcttttatct tcagtccatg 6780 aaccgtgatg catttcaaaa tgcaggtggg ttccggtcga tattcccgta ttgccgatga 6840 ttccgatttg ctcgcctttt ttcacccgct ccttttcctt tttcaggcgt ttgcttaagt 6900 gggcataaac ggtttcatat ccgttgtcat gtttaataaa tatcacttgg ccgtaggagt 6960 cggattgata cgatttgctt atcgttccgt ctgcggctgc cgctactgct tccccttcgg 7020 gagcagcgat gtcaagcccc ttatgctttc cgcctctcgt accgaattga tctgtgatct 7080 ctcctttaat cggttcaatc cactctgagg cttccgcccc cggggcattg acgaaaagcg 7140 ccaatcccga aagccatgcg atcgcgaaca ggaagttttg atgtctgagt ttcttcaagg 7200 ttttccatat cctcctatta catgcatctt cggtaaaatt gccccctatt cggagacagc 7260 ttagtatact tccaaatcaa tacaatttat acattaaaaa aagactccgc acagggagtc 7320 ttttagtttt ctatcgtcat cggattcggt gcgtacggaa cctgtacaga tttcgacagg 7380 tcataggcgc cgaccttggt tatggatgcg tttttaaatt tcacttttgt gaagccgaaa 7440 tctttcgcgg tcaatagaag gccttccacc atcaagacat cttcgggttt attttcaata 7500 ttcgcggagg aagaaaattg aatgatcagt tcttttccat tcttttgaat atcttcaatc 7560 ggcgtatcat cggataaaat gggttttaaa tgagtgccgc tttcttcgtt tttcatcatc 7620 ttaatcgctt cctgcaccga ttcgtaagat tcgcttgaag gtgcaaggaa ccggcgcccg 7680 tctgagcttt catataaata gtagcatttt tgcgtctggt gcataatcgc catatcggcg 7740 agcattccga atgtttcaaa ttcaacaccc gatttatcat tggaaataaa cagaacagaa 7800 tcatacgatc cccatttaaa ggtttcgttg atcacatttt tcagccgttc gaaatcttcg 7860 actgatagct ccggtatttt ctcatcaact tgaatcttca gttttttatt gtttttctgc 7920 tctttgaact tcaccttatc aaggtaagct gtgtcaaatg atgtaaactg gtccactcca 7980 agccggctgt aagcgtgaag cgcatcttca agatttgtca tgccagtgct tttctcgagg 8040 cttaccggga caacgacaga cttggactcg tcaaggaaag cgaaggtgat atagtcgtct 8100 ttttgattct gtgagacgac aaacgtattt gcaggttcag acttggcagc atcagcctcc 8160 gtctgcacca attttccgtc agaagaaatg ttggcgtcgg cgctgttttg agatctgatc 8220 tgttcgatta actggggagt gatcagcatc agaagaaaga gaaccaaaac tgtagcagca 8280 aatgcgccga cccgtttttt cggtgattta cgctttggtg cgagaatcag cttttgatag 8340 atctgatttg ccgaacgatt atccttaacc gttggaagtt ggcttagtaa cgccttcagc 8400 cgttcttcgt tccattctga cttcttcatt ctttggatcc tccttcaaaa gctccatctg 8460 tttacgaagc actttcagac cgcggtgctg agtggttttt accttgcttt cggaaaaatt 8520 caaggctttt gctgtttcac tgatcgaata tccttgaata aaacgcaaga cgataactga 8580 tctttggtca agcgtacact tgtctagggc ctcgaaaatt tcctttaggt tttcattttg 8640 catcacgatg tcctcaggca gaggcttgcg gtcttttaca tcttgtttct cccagtcaaa 8700 cgtccccaaa atccgctggc ggatcgtctg ctgctttctg aaccagtcga tcgcaacgtg 8760 ccgcgcaatc gaaagaagcc aggttttttc gctgctcctg ccttcaaatg tttcgtaaga 8820 atgcaggacg cggatgtata cttcctgaac taagtcttcc gcctgatttt tgtcttttac 8880 catataaaat aaaaactgaa ataaatcctg atgatactga tcatatattt tctgaaaggt 8940 ttcttccacc tgaaacccct ccgttcaatt tattgtcgtt tgtcaatctt aaaaggttac 9000 attacaacta ttacaactat attacgaaca tatgaaaatg gaaagggggt tttgcgaaag 9060 ttaagcttaa ttttaactta acaagcacaa aagcacccgt tctaaatgaa caggtgccaa 9120 ggttatagga gcccacattt tcactaagct gtgcccttac aaggctttcg ttctcctgac 9180 cggagcgttg cggatccgct gaaatgaact aatttcaatc cgtttatgac tttaagtcca 9240 attgttggcg aagctttttg gaaatctcca ttctcttttc gtcagtcact aggtgatacc 9300 ataagccgtc aacttttttg tcttcacctt caatttctac ctgcttaata tctttagcag 9360 cttctttata agaactttga atatcgatca tcttgtccag tgttaagttt gttttgatgt 9420 ttttttctaa tgctgccaaa atctcttgat agtttgttaa tgattttaat tgtgcacctt 9480 catgaataat ttcgttgata atctcacgct gacgctcttg ac 9522 <210> 153 <211> 1458 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 153 catcataacg gtacgaacgg gacaatgatg caatactttg aatggtatct acctaatgac 60 ggaaatcatt ggaatcgatt aaactctgat gcgagtaacc ttaaaagcaa agggattaca 120 gcggtgtgga ttcctccagc atggaagggc gcttctcaaa atgacgtagg atacggagcc 180 tatgacctgt atgatctggg agaatttaat caaaaaggta ccgtccgtac aaaatatgga 240 acacgtagtc agttacaagc tgcggtaacc tccttaaaaa ataatggaat tcaagtatat 300 ggtgacgttg ttatgaatca caaaggtggc gcagacgcta ctgaaatggt aagggccgtt 360 gaagtgaatc ccaataaccg taaccaagaa gtgactggtg aatataccat tgaagcttgg 420 actagatttg attttccagg gcgaggaaat actcattcta gctttaaatg gagatggtat 480 cattttgatg gtgtggattg ggatcagtca cgtagactga acaatcgcat ctataaattt 540 agaggtcatg gcaaagcttg ggattgggaa gttgatacgg aaaatggtaa ttatgattat 600 ttactatacg ctgatattga tatggatcac ccagaagtag taaatgaatt aagaaattgg 660 ggtgtttggt acacaaacac attaggactc gatggattta gaatagatgc ggttaaacat 720 ataaagtata gctttacgcg cgattggatt aatcacgtta gaagtgcaac aggtaaaaat 780 atgtttgcgg ttgctgagtt ttggaagaat gatttaggtg caattgaaaa ctatctgcag 840 aaaacaaact ggaaccattc agtctttgat gtgccgttac attataatct ttataatgca 900 tcaaaaagcg gagggaacta tgatatgcga aacatattta atggaacggt tgttcaacga 960 catccaagtc atgctgtaac atttgttgat aatcatgatt cgcagcctga agaagcatta 1020 gaatcttttg ttgaagaatg gtttaaacca ttagcgtatg cgcttacatt aacgcgtgaa 1080 caaggatacc cttctgtatt ttacggagat tattatggga ttccaacaca tggagtgcca 1140 gcaatgagat caaaaatcga tccgatttta gaagcacgtc aaaagtatgc atacggaaaa 1200 caaaatgatt acttagacca tcataatatc attggttgga cgcgtgaagg gaatacagca 1260 caccccaatt caggtctagc taccatcatg tctgatggag cgggtggaag taagtggatg 1320 tttgttgggc gtaataaggc tggtcaagta tggagtgata ttacaggaaa ccgtacaggt 1380 acggttacaa tcaatgcaga cggttggggc aatttctctg tgaatggagg gtcagtttct 1440 atttgggtca acaaataa 1458 <210> 154 <211> 9219 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 154 catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60 tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120 cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180 gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240 tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300 aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360 cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420 ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480 tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540 gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600 cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660 cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720 gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780 tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840 agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900 cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960 gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020 attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080 atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140 tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200 gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260 acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320 gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380 gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440 atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500 tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560 gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620 ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680 ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740 cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800 ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860 ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920 ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980 ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040 tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100 cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160 ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220 cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280 cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340 agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400 cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460 ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520 cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580 tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640 gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700 agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760 ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820 tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880 ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940 aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000 gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060 tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120 agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180 tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240 caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300 catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360 tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420 gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480 ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540 tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600 ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660 agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720 ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780 gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840 ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900 ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960 ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020 gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080 gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140 taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200 aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260 cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320 ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380 gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440 tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500 aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560 aagtctactc tgaatttttt taaaaggaga gggtaaagaa tgaaacaaca aaaacggctt 4620 tacgcccgat tgctgacgct gttatttgcg ctcatcttct tgctgcctca ttctgcagct 4680 agcgcacatc ataacggtac gaacgggaca atgatgcaat actttgaatg gtatctacct 4740 aatgacggaa atcattggaa tcgattaaac tctgatgcga gtaaccttaa aagcaaaggg 4800 attacagcgg tgtggattcc tccagcatgg aagggcgctt ctcaaaatga cgtaggatac 4860 ggagcctatg acctgtatga tctgggagaa tttaatcaaa aaggtaccgt ccgtacaaaa 4920 tatggaacac gtagtcagtt acaagctgcg gtaacctcct taaaaaataa tggaattcaa 4980 gtatatggtg acgttgttat gaatcacaaa ggtggcgcag acgctactga aatggtaagg 5040 gccgttgaag tgaatcccaa taaccgtaac caagaagtga ctggtgaata taccattgaa 5100 gcttggacta gatttgattt tccagggcga ggaaatactc attctagctt taaatggaga 5160 tggtatcatt ttgatggtgt ggattgggat cagtcacgta gactgaacaa tcgcatctat 5220 aaatttagag gtcatggcaa agcttgggat tgggaagttg atacggaaaa tggtaattat 5280 gattatttac tatacgctga tattgatatg gatcacccag aagtagtaaa tgaattaaga 5340 aattggggtg tttggtacac aaacacatta ggactcgatg gatttagaat agatgcggtt 5400 aaacatataa agtatagctt tacgcgcgat tggattaatc acgttagaag tgcaacaggt 5460 aaaaatatgt ttgcggttgc tgagttttgg aagaatgatt taggtgcaat tgaaaactat 5520 ctgcagaaaa caaactggaa ccattcagtc tttgatgtgc cgttacatta taatctttat 5580 aatgcatcaa aaagcggagg gaactatgat atgcgaaaca tatttaatgg aacggttgtt 5640 caacgacatc caagtcatgc tgtaacattt gttgataatc atgattcgca gcctgaagaa 5700 gcattagaat cttttgttga agaatggttt aaaccattag cgtatgcgct tacattaacg 5760 cgtgaacaag gatacccttc tgtattttac ggagattatt atgggattcc aacacatgga 5820 gtgccagcaa tgagatcaaa aatcgatccg attttagaag cacgtcaaaa gtatgcatac 5880 ggaaaacaaa atgattactt agaccatcat aatatcattg gttggacgcg tgaagggaat 5940 acagcacacc ccaattcagg tctagctacc atcatgtctg atggagcggg tggaagtaag 6000 tggatgtttg ttgggcgtaa taaggctggt caagtatgga gtgatattac aggaaaccgt 6060 acaggtacgg ttacaatcaa tgcagacggt tggggcaatt tctctgtgaa tggagggtca 6120 gtttctattt gggtcaacaa ataaaagctt ctcgaggtta acagaggacg gatttcctga 6180 aggaaatccg tttttttatt ttagcacgaa aaacacttcc cggtgatcgg gaggtgtttt 6240 ttgttaaaaa gatcatgaca tgcatagaac agcgaccggg ctaattgtat ataatattgt 6300 gaatttaaca aaaaatttac aaaggagatg ataaaggcaa tgaccagggt gaaaaggatg 6360 agatttgctg atttgttgga tttagaggcg gagtagatga aaccggccaa agtatcccta 6420 ctccaccgat tgctccagtg cctgaagcaa tgtgttgatt gtaacacagt aaatcgtttt 6480 acagcaataa acatttttgt gaatatttta ttgatttcgg ctgtgatctc attcccatat 6540 tctgctgcgg cccatggcgc aacacagtcc ggcgatcaat attcaagctt tgaagaattg 6600 gagcggaatg aagatccagc ttcttaccga attacggaga agaacgcaag agtgccgatg 6660 ctcatcatgg ccatccatgg aggcggcatc gaacccggaa cgagcgaaat cgccaatgaa 6720 gtgtccaaaa actattccct gtacttgttt gaagggctga aatcatcagg caatacggac 6780 cttcacatta caagcacgcg ttttgacgag ccagcggcgc tcgcaattac tgcaagccac 6840 cagtatgtca tgtcgctcca cggctattac agtgaagacc gcgatattaa agtaggcggc 6900 acagaccgcg ctaaaatcag aatattggtt gatgagctga accgctcggg gtttgccgct 6960 gaaatgctgg ggacagatga caagtatgcc ggaacccatc cgaataacat cgccaacaag 7020 tcgctttccg ggctgagcat tcagcttgaa atgagcacgg gtttccgcaa atctttattc 7080 gaccggttta cactaaaaga cagggcggcg acgcaaaacg aaacgtttta ccgatttaca 7140 aagctgctga cagattttat tcatgaaaac tatgaagaag acggagggga tttcccctct 7200 gcaaaaataa aacaccccct tcaagtgaaa aaggaggtgt ttcggcggtt gtgttaaccg 7260 ttggactctg aggtgccgcc gccggtgaat acggaaacga tggcgttcca cagagacaca 7320 aagaagtcga tcagtttttg aagaaagttt tgtccttctt cagaatccaa gaatttcgtg 7380 attttatcct ttgctttgtc aagctggtct ccaacctggt tccagtcgat attaatattt 7440 ttcatgttat taaataaaga tataagagag tttttctgat cttctgtgag tgtcacgcca 7500 agttcggaag cagccgaatc aatcgttttc tccaattcct cttttgactc gggaactccg 7560 tttttcgaga tttcttcctt gactttggcc atcagcgctg acgcgttttc actgccgatt 7620 ttctcgccaa gctctgaagt ggtgacaagc tcttcattcg cgaccttttt cacatcttcg 7680 gaaatttttt cgcccgaagt cgtttcatac gctttcatca atccggttaa agcggctgtg 7740 cctgacactt caaacggagc ggtgacatag actttggcgt cttttacacc ggccgtcatc 7800 agcgcgttca aatacatctc atctgtaatt ctgctgatat tgtgtgtctg aacttccaaa 7860 ccggtgcctt ttttcgctac ggtaattgaa gaagaagaaa tcgctcttgt tccgatttgt 7920 gctttcggta tataatcccc taaatattta tgctcctcat catttgtcac ctcgatgatg 7980 gtcgcatttt caggcgcatt catttctttt aatacttttt gtctgtcctg gcttgacaag 8040 tctttcccca gcgtgacgat gacatcaccc actgcggcgt cagcgaagct gacctgcggg 8100 aaaatgagca gacacaatgc tgtaaagatt cctagtatcg attttttcaa gctcaatgcc 8160 ctccttaaaa atgcaggctt caggcagaat tgctgtactt ttaaagaagc ctgccggaac 8220 ggaaataatg cgttccgaaa tatagacgga tgaaagatga gtgaggtttc aaagaaaaaa 8280 agagagaatt ttctcttcaa gtcaaatgcc ctcccggcat cgtatctcgc cgctctttta 8340 tcattcatga ttttcacagg cgattcaacc tttttttaaa attttttaca aaaacgatac 8400 aagagcggcg tttatttcgg tcgattggct ctctgcttct tcaatatgat ataatgaccc 8460 ttgtgaaatg aaaggagaga atcaagatgg ctaaaaaagg atacatacaa ctgacaaacg 8520 gcaaaaaaat cgagtttgaa ctatatccgg atgcggcgcc gggaactgtc gccaactttg 8580 aaaaacttgc aaacgaaggg ttctatgacg ggctgaagtt ccaccgcgtc atcccgggct 8640 tcgtcagcca gggaggctgc ccgcacggca ccggaacagg cggacctgga tatacgatta 8700 aatgcgagac agaagggaat ccgcacaaac acgaagccgg ttctctctca atggctcacg 8760 caggaaaaga taccggaggc agccaatttt ttatcgtcca tgagcctcag ccgcacttga 8820 acggcgttca caccgttttc ggaaaggtca catcaggcct tgatgccgtc acttcaatgg 8880 agcagggaca aggcatggaa aaagtcgaag tatttgatgc ataatcagag agcgcaaaaa 8940 acagcccgct tagccgggct gtttttttgt ctgtaacggt gtttattttc caggtgcaac 9000 aggacttgag gccgattctt cgtccacatc ctgataggaa ataacgatgc taataaataa 9060 aataattgtg aaaaaatgac cctttatgta aaatatattc aagtgaagag ctagatagag 9120 aacgcaatct gtaaaaaagg aaggggcgta aggggtgagc gtaaaaatcc catcgacggc 9180 agtcggcgta aaaattaatg actggtataa cgcgatacg 9219 <210> 155 <211> 286 <212> PRT <213> Bacillus licheniformis <400> 155 Met Lys Lys Ile Ala Ile Ala Ala Ile Thr Ala Thr Ser Val Leu Ala 1 5 10 15 Leu Ser Ala Cys Ser Gly Gly Asp Ser Glu Val Val Ala Glu Thr Lys 20 25 30 Ala Gly Asn Ile Thr Lys Glu Asp Leu Tyr Gln Thr Leu Lys Asp Asn 35 40 45 Ala Gly Ala Asp Ala Leu Asn Met Leu Val Gln Gln Lys Val Leu Asp 50 55 60 Asp Lys Tyr Asp Val Ser Asp Lys Glu Ile Asp Lys Lys Leu Asn Glu 65 70 75 80 Tyr Lys Lys Ser Met Gly Asp Gln Leu Asn Gln Leu Ile Asp Gln Lys 85 90 95 Gly Glu Asp Phe Val Lys Glu Gln Ile Lys Tyr Glu Leu Leu Met Gln 100 105 110 Lys Ala Ala Lys Asp Asn Ile Lys Val Thr Asp Asp Asp Val Lys Glu 115 120 125 Tyr Tyr Asp Gly Leu Lys Gly Lys Ile His Leu Ser His Ile Leu Val 130 135 140 Lys Glu Lys Lys Thr Ala Glu Glu Val Glu Lys Lys Leu Lys Lys Gly 145 150 155 160 Glu Lys Phe Glu Asp Leu Ala Lys Glu Tyr Ser Thr Asp Gly Thr Ala 165 170 175 Glu Lys Gly Gly Asp Leu Gly Trp Val Gly Lys Asp Asp Asn Met Asp 180 185 190 Lys Asp Phe Val Lys Ala Ala Phe Ala Leu Lys Thr Gly Glu Ile Ser 195 200 205 Gly Pro Val Lys Ser Gln Phe Gly Tyr His Ile Ile Lys Lys Asp Glu 210 215 220 Glu Arg Gly Lys Tyr Glu Asp Met Lys Lys Glu Leu Lys Lys Glu Val 225 230 235 240 Gln Glu Gln Lys Gln Asn Asp Gln Thr Glu Leu Gln Ser Val Ile Asp 245 250 255 Lys Leu Val Lys Asp Ala Asp Leu Lys Val Lys Asp Lys Glu Leu Lys 260 265 270 Lys Gln Val Asp Gln Arg Gln Ala Gln Thr Ser Ser Ser Ser 275 280 285 <210> 156 <211> 134 <212> PRT <213> Bacillus licheniformis <400> 156 Met Ala Met Thr Arg Phe Gly Glu Arg Leu Lys Glu Leu Arg Glu Gln 1 5 10 15 Arg Ser Leu Ser Val Asn Gln Leu Ala Met Tyr Ala Gly Val Ser Ala 20 25 30 Ala Ala Ile Ser Arg Ile Glu Asn Gly His Arg Gly Val Pro Lys Pro 35 40 45 Ala Thr Ile Arg Lys Leu Ala Glu Ala Leu Lys Met Pro Tyr Glu Gln 50 55 60 Leu Met Asp Ile Ala Gly Tyr Met Arg Ala Asp Glu Ile Arg Glu Gln 65 70 75 80 Pro Arg Gly Tyr Val Thr Met Gln Glu Ile Ala Ala Lys His Gly Val 85 90 95 Glu Asp Leu Trp Leu Phe Lys Pro Glu Lys Trp Asp Cys Leu Ser Arg 100 105 110 Glu Asp Leu Leu Asn Leu Glu Gln Tyr Phe His Phe Leu Val Asn Glu 115 120 125 Ala Lys Lys Arg Gln Ser 130 <210> 157 <211> 140 <212> PRT <213> Bacillus licheniformis <400> 157 Met Ala Met Thr Arg Phe Gly Glu Arg Leu Lys Glu Leu Arg Glu Gln 1 5 10 15 Arg Ser Leu Ser Val Asn Gln Leu Ala Met Tyr Ala Gly Val Ser Ala 20 25 30 Ala Ala Ile Ser Arg Ala Ala Ala Ile Ser Arg Ile Glu Asn Gly His 35 40 45 Arg Gly Val Pro Lys Pro Ala Thr Ile Arg Lys Leu Ala Glu Ala Leu 50 55 60 Lys Met Pro Tyr Glu Gln Leu Met Asp Ile Ala Gly Tyr Met Arg Ala 65 70 75 80 Asp Glu Ile Arg Glu Gln Pro Arg Gly Tyr Val Thr Met Gln Glu Ile 85 90 95 Ala Ala Lys His Gly Val Glu Asp Leu Trp Leu Phe Lys Pro Glu Lys 100 105 110 Trp Asp Cys Leu Ser Arg Glu Asp Leu Leu Asn Leu Glu Gln Tyr Phe 115 120 125 His Phe Leu Val Asn Glu Ala Lys Lys Arg Gln Ser 130 135 140 <210> 158 <211> 423 <212> DNA <213> Bacillus licheniformis <400> 158 atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag aagcctgtcg 60 gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag agccgcagcc 120 atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat cagaaaattg 180 gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta tatgagagct 240 gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc ggccaagcac 300 ggcgtcgaag acctgtggct gtttaaaccc gagaaatggg actgtttgtc ccgcgaagac 360 ctgctcaacc tcgaacagta ttttcatttt ttggttaatg aagcgaagaa gcgccaatca 420 taa 423

Claims (16)

  1. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서,
    (a) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및
    (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고,
    변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
  2. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서,
    (a) (i) POI를 암호화하는 발현 카세트, 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 모체 B. 리체니포르미스 세포에 도입하는 단계, 및
    (b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고,
    변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
  3. 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터 서열을 포함하는, 방법.
  4. 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF 서열을 포함하는, 방법.
  5. 제1항 또는 제2항에 있어서, 모세포는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는, 방법.
  6. 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 변형된 세포의 게놈에 통합되는, 방법.
  7. 제1항 또는 제2항에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
  8. 제1항 또는 제2항에 있어서, POI는 효소인, 방법.
  9. 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
  10. 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함하는, 변형된 세포.
  11. 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 변형된 세포.
  12. 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 변형된 세포.
  13. 제9항에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
  14. 제9항에 있어서, 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 구성체를 포함하는 변형된 세포.
  15. 제14항에 있어서, POI는 효소인, 변형된 세포.
  16. 제14항의 변형된 세포에 의해 생산된 관심 단백질.
KR1020227026692A 2020-01-15 2021-01-14 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 KR20220127844A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062961234P 2020-01-15 2020-01-15
US62/961,234 2020-01-15
PCT/US2021/013420 WO2021146411A1 (en) 2020-01-15 2021-01-14 Compositions and methods for enhanced protein production in bacillus licheniformis

Publications (1)

Publication Number Publication Date
KR20220127844A true KR20220127844A (ko) 2022-09-20

Family

ID=74592750

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227026692A KR20220127844A (ko) 2020-01-15 2021-01-14 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법

Country Status (6)

Country Link
US (1) US20230340442A1 (ko)
EP (1) EP4090738A1 (ko)
JP (1) JP2023524334A (ko)
KR (1) KR20220127844A (ko)
CN (1) CN114945665A (ko)
WO (1) WO2021146411A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117836315A (zh) * 2021-08-20 2024-04-05 丹尼斯科美国公司 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
WO2023091878A1 (en) 2021-11-16 2023-05-25 Danisco Us Inc. Compositions and methods for enhanced protein production in bacillus cells
WO2023091631A2 (en) * 2021-11-18 2023-05-25 Dansico Us Inc. High performance alphα-amylases for starch liquefaction
WO2024050343A1 (en) 2022-09-02 2024-03-07 Danisco Us Inc. Subtilisin variants and methods related thereto

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4760025A (en) 1984-05-29 1988-07-26 Genencor, Inc. Modified enzymes and methods for making same
US5310675A (en) 1983-06-24 1994-05-10 Genencor, Inc. Procaryotic carbonyl hydrolases
US5801038A (en) 1984-05-29 1998-09-01 Genencor International Inc. Modified subtilisins having amino acid alterations
WO1987004461A1 (en) 1986-01-15 1987-07-30 Amgen THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS AND METHOD FOR PRODUCTION THEREOF
US4980288A (en) 1986-02-12 1990-12-25 Genex Corporation Subtilisin with increased thermal stability
US4914031A (en) 1987-04-10 1990-04-03 Amgen, Inc. Subtilisin analogs
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
PT89702B (pt) 1988-02-11 1994-04-29 Gist Brocades Nv Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem
DE3909096A1 (de) 1989-03-20 1990-09-27 Garabed Antranikian Alpha-amylase
US5665587A (en) 1989-06-26 1997-09-09 Novo Nordisk A/S Modified subtilisins and detergent compositions containing same
DK97190D0 (da) 1990-04-19 1990-04-19 Novo Nordisk As Oxidationsstabile detergentenzymer
US5482849A (en) 1990-12-21 1996-01-09 Novo Nordisk A/S Subtilisin mutants
EP0583339B1 (en) 1991-05-01 1998-07-08 Novo Nordisk A/S Stabilized enzymes and detergent compositions
KR100322793B1 (ko) 1993-02-11 2002-06-20 마가렛 에이.혼 산화안정성알파-아밀라아제
DE4411223A1 (de) 1994-03-31 1995-10-05 Solvay Enzymes Gmbh & Co Kg Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren
EP2206768B1 (en) 1997-10-13 2015-04-01 Novozymes A/S Alpha-amylase mutants
MA24811A1 (fr) 1997-10-23 1999-12-31 Procter & Gamble Compositions de lavage contenant des variantes de proteases multisubstituees
WO1999043794A1 (en) 1998-02-27 1999-09-02 Novo Nordisk A/S Maltogenic alpha-amylase variants
US6835550B1 (en) 1998-04-15 2004-12-28 Genencor International, Inc. Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins
US6197565B1 (en) 1998-11-16 2001-03-06 Novo-Nordisk A/S α-Amylase variants
ES2496568T3 (es) 1999-03-30 2014-09-19 Novozymes A/S Variantes de alfa-amilasa
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
WO2002014490A2 (en) 2000-08-11 2002-02-21 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
AU2003228393A1 (en) 2002-03-29 2003-10-13 Genencor International, Inc. Ehanced protein expression in bacillus
CA2483006C (en) 2002-04-22 2013-10-29 Genencor International, Inc. Methods of creating modified promoters resulting in varying levels of gene expression
DE102004047776B4 (de) 2004-10-01 2018-05-09 Basf Se Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung
DE102004047777B4 (de) 2004-10-01 2018-05-09 Basf Se Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung
CA2597980C (en) 2005-02-18 2016-01-05 Genencor International, Inc. Polypeptides having alpha-amylase and granular starch hydrolyzing activity
JP5226958B2 (ja) * 2007-02-22 2013-07-03 花王株式会社 組換え微生物
EP2428572A3 (en) 2007-03-09 2012-12-12 Danisco US, Inc., Genencor Division Alkaliphilic Bacillus species alpha-amylase variants, compositions comprising alpha-amylase variants, and methods of use
RU2009149405A (ru) 2007-05-30 2011-07-10 ДАНИСКО ЮЭс, ИНК., ДЖЕНЕНКОР ДИВИЖН (US) Улучшенные варианты альфа-амилазы bacillus licheniformis
CA2689635C (en) 2007-05-30 2016-07-12 Danisco Us Inc. Variants of an alpha-amylase with improved production levels in fermentation processes
JP5687566B2 (ja) 2011-06-01 2015-03-18 日東電工株式会社 防水通音部材
JP6378089B2 (ja) 2011-12-09 2018-08-22 ダニスコ・ユーエス・インク 微生物におけるタンパク質産生のための、B.ズブチリス(B.subtilis)からのリボソームプロモーター
FR2992915B1 (fr) 2012-07-03 2015-08-07 Renault Sa "ensemble de verrouillage pour une ceinture de securite de vehicule automobile"
CN105229147B (zh) 2013-03-11 2020-08-11 丹尼斯科美国公司 α-淀粉酶组合变体
EP3585910B1 (en) 2017-02-24 2024-03-20 Danisco US Inc. Compositions and methods for increased protein production in bacillus licheniformis
CA3057713A1 (en) 2017-03-31 2018-10-04 Danisco Us Inc Alpha-amylase combinatorial variants
US11879127B2 (en) 2017-08-23 2024-01-23 Danisco Us Inc. Methods and compositions for efficient genetic modifications of Bacillus licheniformis strains
JP7218985B2 (ja) 2017-09-13 2023-02-07 ダニスコ・ユーエス・インク バチルス属(Bacillus)におけるタンパク質産生の増加のための改変5’-非翻訳領域(UTR)配列
US11781125B2 (en) 2017-12-15 2023-10-10 Danisco Us Inc. Cas9 variants and methods of use

Also Published As

Publication number Publication date
WO2021146411A1 (en) 2021-07-22
EP4090738A1 (en) 2022-11-23
JP2023524334A (ja) 2023-06-12
US20230340442A1 (en) 2023-10-26
CN114945665A (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
KR20220127844A (ko) 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법
AU2023270322A1 (en) Compositions and methods for modifying genomes
CN107278227B (zh) 用于体外病毒基因组工程的组合物和方法
KR20210096629A (ko) 바실러스 세포에서의 향상된 단백질 생산을 위한 신규 프로모터 서열 및 이의 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20200105879A (ko) 증가된 단백질 생산을 위한 돌연변이체 및 유전자 변형된 바실러스 세포 및 이의 방법
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
KR20180043297A (ko) 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산
CN108431221A (zh) 用于转化梭状芽胞杆菌属细菌的遗传工具
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
CN110551713A (zh) 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
KR20210148269A (ko) 선형 재조합 dna 작제물 및 이의 조성물을 이용하여 공여 dna 서열을 바실러스 게놈 내에 통합시키기 위한 방법
KR20210148270A (ko) 이중 원형 재조합 dna 작제물 및 이의 조성물을 이용하여 바실러스의 게놈 내로의 폴리뉴클레오타이드를 통합하기 위한 방법
KR20220121844A (ko) 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법
KR20180084135A (ko) 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
CN115927299A (zh) 增加双链rna产生的方法和组合物
KR20170088866A (ko) 공발현 플라스미드
KR20210110826A (ko) 하나 이상의 비-고유 꼬리 섬유를 가지는 비-복제성 형질도입 입자 및 형질도입 입자-기반 리포터 시스템