KR20220127844A - 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 - Google Patents
바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20220127844A KR20220127844A KR1020227026692A KR20227026692A KR20220127844A KR 20220127844 A KR20220127844 A KR 20220127844A KR 1020227026692 A KR1020227026692 A KR 1020227026692A KR 20227026692 A KR20227026692 A KR 20227026692A KR 20220127844 A KR20220127844 A KR 20220127844A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- lys
- cell
- leu
- sequence
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2414—Alpha-amylase (3.2.1.1.)
- C12N9/2417—Alpha-amylase (3.2.1.1.) from microbiological source
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1235—Diphosphotransferases (2.7.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01001—Alpha-amylase (3.2.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y502/00—Cis-trans-isomerases (5.2)
- C12Y502/01—Cis-trans-Isomerases (5.2.1)
- C12Y502/01008—Peptidylprolyl isomerase (5.2.1.8), i.e. cyclophilin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/07—Bacillus
- C12R2001/10—Bacillus licheniformis
Abstract
본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 구성 및/또는 획득하기 위한 조성물 및 방법에 관한 것이다. 따라서, 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 모체 바실러스 리체니포르미스 균주로부터 유래된 유전자 변형 바실러스 리체니포르미스 균주에 관한 것이다.
Description
본 발명은 일반적으로 세균학, 미생물학, 유전학, 분자 생물학, 효소학, 및 산업 단백질 생산 등의 분야에 관한 것이다. 따라서, 본 발명의 특정 구현예는 단백질 생산 표현형이 향상된 바실러스 리체니포르미스(Bacillus licheniformis) 세포/균주를 구성하기 위한 조성물 및 방법에 관한 것이다.
관련 출원에 대한 상호 참조
본 출원은 2020년 1월 15일에 출원된 미국 가출원 62/961,234호의 이익을 주장하며, 그 전문은 본원에 참조로 포함된다.
서열 목록에 대한 참조
"NB41684-WO-PCT_SequenceListing.txt"라는 파일명의 서열 목록 텍스트 파일의 전자 제출 내용은 2021년 1월 7일에 생성되었으며 크기는 425 KB이고, 전체가 본원에 참조로 포함된다.
바실러스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 및 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens)와 같은 그람 양성 박테리아는 우수한 발효 특성 및 높은 수율(예를 들어, 배양액 1 리터당 최대 25 그램; 문헌[Van Dijl and Hecker, 2013])로 인해 산업 관련 단백질의 생산을 위한 미생물 공장으로 자주 사용된다. 예를 들어, B. 서브틸리스는 식품, 직물, 세탁, 의료 기기 세척, 제약 산업 등에 필요한 α-아밀라제(문헌[Jensen et al., 2000; Raul et al., 2014]) 및 프로테아제(문헌[Brode et al., 1996])를 생성하는 것으로 잘 알려져 있다(문헌[Westers et al., 2004]). 이러한 비병원성 그람 양성 박테리아의 경우 독성 부산물(예를 들어, 내독소로도 알려진 리포다당류; LPS)이 전혀 없는 단백질이 생산되기 때문에 유럽 식품 안전청(European Food Safety Authority)의 "공인된 안전성 추정"(QPS) 등급을 획득했으며, 많은 제품이 미국 식품의약국의 "GRAS(Generally Recognized As Safe)" 등급을 받았다(문헌[Olempska-Beer et al., 2006; Earl et al., 2008; Caspers et al., 2010]).
따라서, 미생물 숙주 세포에서 단백질(예를 들어, 효소, 항체, 수용체 등)을 생산하는 것은 생명공학 분야에서 특히 관심 대상이다. 마찬가지로, 하나 이상의 관심 단백질의 생산 및 분비에 대한 바실러스 숙주 세포의 최적화는 특히 산업 생명공학 환경에서 관련성이 높으며, 단백질 수율의 작은 개선은 단백질을 대규모의 산업적인 양으로 생산할 때 매우 중요하다. 보다 구체적으로, B. 리체니포르미스는 산업적으로 매우 중요한 바실러스 종 숙주 세포이므로, 단백질 발현/생산을 향상/증가시키기 위해 B. 리체니포르미스 숙주 세포를 변형 및 조작할 수 있음은 새로운 개선된 B. 리체니포르미스 생산 균주의 구성에 매우 바람직하다. 따라서, 본 발명은 단백질 생산 능력이 향상된 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주 세포)를 획득하고 구성하기 위한 매우 바람직한 충족되지 않은 요구에 관한 것이다.
본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 획득하기 위한 조성물 및 방법에 관한 것이다. 따라서, 본 발명의 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 이러한 변형된 B. 리체니포르미스 세포/균주를 구성하는 방법에 관한 것이다.
따라서, 본 발명의 특정 구현예는 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서, (a) POI를 발현하는 모체 B. 리체니포르미스 세포를 수득하고, 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써 모세포를 변형시키는 단계, 및 (b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 상기 방법의 특정 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 상기 방법의 다른 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 바람직한 특정 구현예에서, 모세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하고, 이에 따라 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질의 제2 카피를 암호화한다. 다른 구현예에서, 단계 (a)의 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 상기 방법의 또 다른 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
다른 특정 구현예에서, 본 발명은 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서, (a) (i) POI를 암호화하는 발현 카세트 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 모체 B. 리체니포르미스 세포에 도입하는 단계, 및 (b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 상기 방법의 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 다른 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 상기 방법의 또 다른 구현예에서, 내인성 prsA 유전자는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 특정 구현예에서, 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 바람직한 특정 구현예에서, 모세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하고, 이에 따라 단계 (a)(ii)의 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질의 제2 카피를 암호화한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 바람직한 특정 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
본 발명의 다른 구현예는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스 세포/균주로부터 유래된 변형된 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함한다. 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함한다. 또 다른 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 특정 구현예에서, 천연 prsA 단백질을 암호화하는 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합된다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 바람직한 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 변형된 세포는 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 구성체를 포함한다. 다른 구현예에서, 이종성 POI는 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 특정 구현예는 본 발명의 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
따라서, 본 발명의 다른 특정 구현예는 변형이 유래된 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것이다. 따라서, 특정 구현예에서, 본 발명은 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것으로, 변형된 세포는 POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고, 변형된 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산한다. 다른 구현예에서, 변형된 바실러스 리체니포르미스 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함한다. 또 다른 구현예에서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함한다. 다른 특정 구현예에서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함한다. 다른 구현예에서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 다른 특정 구현예는 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
다른 구현예에서, 본 발명은 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포에 관한 것으로, 변형된 세포는 POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고, 변형된 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산한다. 다른 구현예에서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함한다. 또 다른 구현예에서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함한다. 다른 특정 구현예에서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함한다. 다른 구현예에서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, 관심 단백질(POI)은 프로테아제 또는 아밀라제이다. 따라서, 본 발명의 다른 특정 구현예는 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
생물학적 서열의 간단한 설명
서열번호 1은 천연 S. 피오게네스 Cas9 단백질을 암호화하는 아미노산 서열이다.
서열번호 2는 서열번호 1의 Cas9 단백질을 암호화하는 핵산 서열로서, 바실러스 종 세포에서의 발현에 대해 코돈 최적화된 핵산 서열이다.
서열번호 3은 합성 N-말단 핵 국재화 신호(NLS)의 아미노산 서열이다.
서열번호 4는 합성 C-말단 핵 국재화 신호(NLS)의 아미노산 서열이다.
서열번호 5는 합성 데카-히스티딘 태그의 아미노산 서열이다.
서열번호 6은 B. 서브틸리스 aprE 프로모터 서열이다.
서열번호 7은 합성 종결자 핵산 서열이다.
서열번호 8은 정방향 프라이머 핵산 서열이다.
서열번호 9는 역방향 프라이머 핵산 서열이다.
서열번호 10은 합성 pKB320 백본 핵산 서열이다.
서열번호 11은 합성 pKB320 핵산 서열이다.
서열번호 12는 프라이머 핵산 서열이다.
서열번호 13은 프라이머 핵산 서열이다.
서열번호 14는 프라이머 핵산 서열이다.
서열번호 15는 프라이머 핵산 서열이다.
서열번호 16은 프라이머 핵산 서열이다.
서열번호 17은 프라이머 핵산 서열이다.
서열번호 18은 프라이머 핵산 서열이다.
서열번호 19는 프라이머 핵산 서열이다.
서열번호 20은 프라이머 핵산 서열이다.
서열번호 21은 프라이머 핵산 서열이다.
서열번호 22는 프라이머 핵산 서열이다.
서열번호 23은 프라이머 핵산 서열이다.
서열번호 24는 프라이머 핵산 서열이다.
서열번호 25는 합성 pRF694 핵산 서열이다.
서열번호 26은 합성 pRF801 핵산 서열이다.
서열번호 27은 합성 pRF806 핵산 서열이다.
서열번호 28은 B. 리체니포르미스 표적 부위 1(TS1) 핵산 서열이다.
서열번호 29는 B. 리체니포르미스 표적 부위 2(TS2) 핵산 서열이다.
서열번호 30은 B. 리체니포르미스 serA1 오픈 리딩 프레임(ORF) 서열이다.
서열번호 31은 뉴클레오티드 "AGG"를 포함하는 표적 부위 1 PAM 서열이다.
서열번호 32는 가변 표적화 (VT) 부위 1을 암호화하는 핵산 서열이다.
서열번호 33은 CER 도메인을 암호화하는 합성 핵산 서열이다.
서열번호 34는 부위 1을 표적화하는 합성 가이드 RNA(gRNA) 서열이다.
서열번호 35는 합성 spac 프로모터 핵산 서열이다.
서열번호 36은 합성 t0 종결자 핵산 서열이다.
서열번호 37은 B. 리체니포르미스 serA1 상동성 아암 1 핵산 서열이다.
서열번호 38은 합성 serA1 상동성 아암 1 정방향 프라이머 서열이다.
서열번호 39는 합성 serA1 상동성 아암 1 역방향 프라이머 서열이다.
서열번호 40은 B. 리체니포르미스 serA1 상동성 아암 2 핵산 서열이다.
서열번호 41은 합성 serA1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 42는 합성 serA1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 43은 표적 부위 1(TS1) gRNA를 암호화하는 발현 카세트이다.
서열번호 44는 합성 serA1 결실 편집 주형이다.
서열번호 45는 B. 리체니포르미스 rghR1 오픈 리딩 프레임(ORF) 서열이다.
서열번호 46은 뉴클레오티드 "CGG"를 포함하는 표적 부위 2 PAM 서열이다.
서열번호 47은 부위 2를 표적화하는 합성 가이드 RNA(gRNA) 서열이다.
서열번호 48은 B. 리체니포르미스 rghR1 상동성 아암 1 핵산 서열이다.
서열번호 49는 합성 rghR1 상동성 아암 1 정방향 프라이머 서열이다.
서열번호 50은 합성 rghR1 상동성 아암 1 역방향 프라이머 서열이다.
서열번호 51은 B. 리체니포르미스 rghR1 상동성 아암 2 핵산 서열이다.
서열번호 52는 합성 rghR1 상동성 아암 2 정방향 프라이머 서열이다.
서열번호 53은 합성 rghR1 상동성 아암 2 역방향 프라이머 서열이다.
서열번호 54는 표적 부위 2(TS2) gRNA를 암호화하는 발현 카세트이다.
서열번호 55는 합성 rghR1 결실 편집 주형이다.
서열번호 56은 Cas9(Y155H) 변이 단백질을 암호화하는 아미노산 서열이다.
서열번호 57은 합성 Y155H 정방향 프라이머 서열이다.
서열번호 58은 합성 Y155H 역방향 프라이머 서열이다.
서열번호 59는 합성 pRF827 핵산 서열이다.
서열번호 60은 서열번호 56의 변이 Cas9(Y155H) 단백질을 암호화하는 발현 카세트이다.
서열번호 61은 합성 pRF856 핵산 서열이다.
서열번호 62는 합성 pRF862 핵산 서열이다.
서열번호 63은 합성 Y155H 단편 서열이다.
서열번호 64는 합성 Y155H 단편 정방향 프라이머 서열이다.
서열번호 65는 합성 Y155H 단편 역방향 프라이머 서열이다.
서열번호 66은 합성 pRF694 단편 서열이다.
서열번호 67은 합성 pRF694 단편 정방향 프라이머 서열이다.
서열번호 68은 합성 pRF694 단편 역방향 프라이머 서열이다.
서열번호 69는 합성 pRF869 핵산 서열이다.
서열번호 70은 B. 리체니포르미스 rghR2 오픈 리딩 프레임(ORF) 서열이다.
서열번호 71은 합성 rghR2 stop 단편이다.
서열번호 72는 합성 rghR2 stop 편집 주형이다.
서열번호 73은 rghR2 gRNA를 암호화하는 발현 카세트이다.
서열번호 74는 합성 단편 정방향 프라이머이다.
서열번호 75는 합성 단편 역방향 프라이머이다.
서열번호 76은 합성 pRF862 백본 정방향 프라이머이다.
서열번호 77은 합성 pRF862 백본 역방향 프라이머이다.
서열번호 78은 합성 pRF879 핵산 서열이다.
서열번호 79는 B. 리체니포르미스 pRF879 표적 부위 및 PAM 핵산 서열이다.
서열번호 80은 합성 pRF879 편집 주형 서열이다.
서열번호 81은 합성 pRF946 핵산 서열이다.
서열번호 82는 B. 리체니포르미스 pR946 표적 부위 및 PAM 핵산 서열이다.
서열번호 83은 합성 pR946 편집 주형 서열이다.
서열번호 84는 합성 pZM221 핵산 서열이다.
서열번호 85는 합성 pZM221 표적 부위 및 PAM 핵산 서열이다.
서열번호 86은 합성 pZM221 편집 주형 서열이다.
서열번호 87은 B. 리체니포르미스 lysA 오픈 리딩 프레임(ORF) 서열이다.
서열번호 88은 합성 pBl.comK 핵산 서열이다.
서열번호 89는 합성 스펙티노마이신 마커 핵산 서열이다.
서열번호 90은 B. 서브틸리스 xylR 핵산 서열이다.
서열번호 91은 B. 서브틸리스 xylAp 핵산 서열이다.
서열번호 92는 합성 comK 핵산 서열이다.
서열번호 93은 합성 cat_prsA 핵산 서열이다.
서열번호 94는 B. 리체니포르미스 cat 업스트림 핵산 서열이다.
서열번호 95는 B. 리체니포르미스 cat 프로모터 핵산 서열이다.
서열번호 96은 B. 리체니포르미스 catH 핵산 서열이다.
서열번호 97은 합성 이중 종결자 핵산 서열이다.
서열번호 98은 B. 리체니포르미스 catH 종결자 핵산 서열이다.
서열번호 99는 B. 서브틸리스 spoVG 종결자 핵산 서열이다.
서열번호 100은 B. 리체니포르미스 prsA 프로모터 핵산 서열이다.
서열번호 101은 B. 리체니포르미스 prsA 오픈 리딩 프레임(ORF) 서열이다.
서열번호 102는 B. 리체니포르미스 amyL 종결자 핵산 서열이다.
서열번호 103은 B. 리체니포르미스 cat 다운스트림 핵산 서열이다.
서열번호 104는 합성 정방향 프라이머 핵산 서열이다.
서열번호 105는 합성 역방향 프라이머 핵산 서열이다.
서열번호 106은 합성 prsA(제2 카피) 검증 핵산 서열이다.
서열번호 107은 합성 프라이머 서열이다.
서열번호 108은 합성 프라이머 서열이다.
서열번호 109는 합성 프라이머 서열이다.
서열번호 110은 B. 리체니포르미스 결실 catHP 및 catH 암호화 핵산 서열이다.
서열번호 111은 cat catH 결실에서의 합성 prsA(제2 카피) 발현 카세트이다.
서열번호 112는 합성 catH(제2 카피) 결실 검증 PCR 산물이다.
서열번호 113은 합성 정방향 프라이머 서열이다.
서열번호 114는 합성 역방향 프라이머 서열이다.
서열번호 115는 합성 dltA-2 검증 PCR 산물이다.
서열번호 116은 합성 dltA-2 모체 검증 PCR 산물이다.
서열번호 117은 합성 정방향 프라이머 서열이다.
서열번호 118은 합성 역방향 프라이머 서열이다.
서열번호 119는 합성 rghR2 결실 검증 PCR 산물이다.
서열번호 120은 B. 리체니포르미스 모체 rghR2 결실 검증 PCR 산물이다.
서열번호 121은 B. 리체니포르미스 모체 rghR2 유전자좌이다.
서열번호 122는 B. 리체니포르미스 모체 dltA 유전자좌이다.
서열번호 123은 B. 리체니포르미스 모체 cat 유전자좌이다.
서열번호 124는 합성 cat 2x prsA 유전자좌이다.
서열번호 125는 합성 dltA-2 유전자좌이다.
서열번호 126은 B. 리체니포르미스 아밀라제 1 단백질의 아미노산 서열이다.
서열번호 127은 합성 serA1 아밀라제 1 카세트이다.
서열번호 128은 합성 p3 프로모터 서열이다.
서열번호 129는 합성 변형된 aprE 5'-UTR 서열이다.
서열번호 130은 amyL 신호 서열을 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 131은 서열번호 126의 아밀라제 1 단백질을 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 132는 합성 lysA 아밀라제 1 카세트이다.
서열번호 133은 합성 lysA 모체 유전자좌 핵산 서열이다.
서열번호 134는 lysA를 암호화하는 B. 리체니포르미스 핵산 서열이다.
서열번호 135는 합성 p2 프로모터 서열이다.
서열번호 136은 아밀라제 2 단백질의 아미노산 서열이다.
서열번호 137은 합성 serA1 아밀라제 2 카세트이다.
서열번호 138은 B. 서브틸리스 rrnI 프로모터 서열이다.
서열번호 139는 B. 서브틸리스 aprE 5'-UTR 서열이다.
서열번호 140은 서열번호 136의 아밀라제 2 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 141은 합성 amyL 또는 lysA 아밀라제 2 카세트이다.
서열번호 142는 합성 amyL 모체 유전자좌이다.
서열번호 143은 아밀라제 3 단백질의 아미노산 서열이다.
서열번호 144는 합성 serA1 아밀라제 3 카세트이다.
서열번호 145는 서열번호 143의 아밀라제 3 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 146은 합성 lysA 아밀라제 3 카세트이다.
서열번호 147은 아밀라제 4 단백질의 아미노산 서열이다.
서열번호 148은 합성 serA1 아밀라제 4 카세트이다.
서열번호 149는 서열번호 147의 아밀라제 4 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 150은 합성 lysA Amylase 4 카세트이다.
서열번호 151은 아밀라제 5 단백질의 아미노산 서열이다.
서열번호 152는 합성 serA1 아밀라제 5 카세트이다.
서열번호 153은 서열번호 151의 아밀라제 5 단백질을 암호화하는 합성 핵산 서열이다.
서열번호 154는 합성 lysA 아밀라제 5 카세트이다.
서열번호 155는 천연 B. 리체니포르미스 prsA 단백질의 아미노산 서열이다.
서열번호 156은 천연 B. 리체니포르미스 RghR2 단백질의 아미노산 서열이다.
서열번호 157은 변이 B. 리체니포르미스 RghR2 단백질의 아미노산 서열이다.
서열번호 158은 서열번호 157의 변이 RghR2 단백질을 암호화하는 변이 B. 리체니포르미스 rghR2 유전자의 핵산 서열이다.
본 발명은 일반적으로, 향상된 단백질 생산 능력을 포함하는 B. 리체니포르미스 세포(예를 들어, 단백질 생산 숙주)를 획득하기 위한 조성물 및 방법에 관한 것이다. 본 발명의 특정 구현예는 모체 B. 리체니포르미스 세포/균주로부터 유래된 유전자 변형 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 본 발명의 다른 특정 구현예는 증가된 양의 하나 이상의 관심 단백질을 생산하는 이러한 변형된 B. 리체니포르미스 세포/균주를 구성하는 방법에 관한 것이다.
예를 들어, 본 발명의 특정 구현예는 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법에 관한 것이다. 특정 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함한다. 특정 구현예에서, 관심 단백질(POI)은 효소이다. 특정 구현예에서, 효소는 프로테아제 또는 아밀라제이다.
본 발명의 다른 구현예는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스 세포/균주로부터 유래된 변형된 바실러스 리체니포르미스 세포/균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화한다. 다른 구현예에서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함한다.
따라서, 본 발명의 특정 구현예는 본 발명의 변형된 B. 리체니포르미스 세포에 의해 생산된 관심 단백질의 수득, 단리, 정제 등에 관한 것이다.
I. 정의
본 발명의 변형된 B. 리체니포르미스 세포 및 본원에 기재된 이의 방법과 관련하여, 다음의 용어 및 어구가 정의된다. 본원에 정의되지 않은 용어는 당업계에서 사용되는 통상적인 의미를 따른다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 조성물 및 방법의 실시 또는 시험에 사용될 수도 있지만, 대표적인 예시적 방법 및 재료가 이제 기술된다. 본원에 인용된 모든 간행물 및 특허는 그 전체가 참조로 포함된다.
또한, 임의의 선택적 요소를 제외하도록 청구범위가 작성될 수 있음에 유의한다. 따라서, 이러한 서술은 청구 요소의 설명과 관련하여 "전적으로", "단지", "~를 제외한", "~를 포함하지 않는" 등과 같은 배타적 용어를 사용하거나, "부정적" 제한이나 그 단서를 사용하기 위한 선행 근거로서의 역할을 하기 위한 것이다.
본원에 기재되고 예시된 개별 구현예 각각은 본원에 기재된 본 발명의 조성물 및 방법의 범위 또는 사상을 벗어나지 않으면서 임의의 다른 여러 구현예의 특징과 쉽게 분리되거나 조합될 수 있는 별개의 구성요소 및 특징을 가지며, 이는 본 개시내용을 읽을 때 당업자에게 명백할 것이다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원에서 사용되는 바와 같이, "바실러스 속"은 B. 서브틸리스(subtilis), B. 리체니포르미스(licheniformis), B. 렌투스(lentus), B. 브레비스(brevis), B. 스테아로써모필루스(stearothermophilus), B. 알칼로필루스(alkalophilus), B. 아밀로리퀘파시엔스(amyloliquefaciens), B. 클라우시(clausii), B. 할로두란스(halodurans), B. 메가테리움(megaterium), B. 코아굴란스(coagulans), B. 서큘란스(circulans), B. 라우투스(lautus), 및 B. 투링기엔시스(thuringiensis)를 비롯해(이에 한정되지 않음), 당업계에 알려진 "바실러스" 속 내의 모든 종을 포함한다. 바실러스 속은 계속해서 분류학적 재편성을 거치는 것으로 알려져 있다. 따라서, 상기 속은 현재 "지오바실러스 스테아로써모필루스(Geobacillus stearothermophilus)"로 명명된 B. 스테아로써모필루스와 같은 유기체를 비롯한(이에 한정되지 않음) 재분류된 종을 포함한다.
본원에서 사용되는 바와 같이, "모세포"는 "변형되지 않은 세포"(예를 들어, 변형되지 않은 B. 리체니포르미스 모세포와 같은 세포)를 의미한다.
본원에서 사용되는 바와 같이, "변형된 세포" 또는 "딸세포"는 변형된("딸") 세포가 유래된 "모세포"에 존재하지 않는 적어도 하나의 유전자 변형을 포함하는 재조합 B. 리체니포르미스 세포를 의미한다.
특정 구현예에서, "변형되지 않은" B. 리체니포르미스(모) 세포는, 특히 "변형된" B. 리체니포르미스(딸) 세포와 비교할 때 또는 이에 대해 상대적으로 "대조 세포"로 지칭될 수 있다.
본원에서 사용되는 바와 같이, "변형되지 않은"(모) 세포에서의 관심 단백질(POI)의 발현 및/또는 생산이 "변형된"(딸) 세포에서의 동일한 POI의 발현 및/또는 생산과 비교될 때, "변형된" 세포와 "변형되지 않은" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등이 동일한 조건)하에 성장/배양/발효된다는 것은 이해될 것이다.
본원에서 사용되는 바와 같이, "숙주 세포"는 새로 도입된 DNA 서열에 대한 숙주 또는 발현 비히클로서 작용하는 능력을 갖는 세포를 의미한다. 본 발명의 특정 구현예에서, 숙주 세포는 바실러스 종 또는 E. 콜라이(coli) 세포이다.
본원에서 사용되는 바와 같이, 본 발명의 "천연 B. 리체니포르미스 prsA 프로모터"는 서열번호 100에 대해 약 95%의 서열 동일성을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA 프로모터는 서열번호 100에 대해 약 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
본원에서 사용되는 바와 같이, "천연 B. 리체니포르미스 prsA 오픈 리딩 프레임(ORF)"은 서열번호 101에 대해 약 90% 이상의 서열 동일성을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA ORF는 서열번호 101에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
바실러스 서브틸리스의 prsA 유전자는 문헌[Kontinen and Sarvas (1993) 및 PCT 공개 WO1994/019471호]에 설명된 바 있으며, 해당 문헌에서는 prsA 유전자가 단백질 분비에 관여(즉, 세포 분비 기구의 구성요소를 암호화)하고, prsA 유전자 산물이 막관련 지단백질이라는 것이 제시되어 있다.
본원에서 사용되는 바와 같이, "천연 B. 리체니포르미스 prsA 단백질"은 서열번호 155에 대해 약 90% 이상의 서열 동일성을 포함하고 펩티딜-프롤릴-시스-트랜스-이소머라제 활성(EC 5.2.1.8)을 포함한다. 특정 구현예에서, 천연 B. 리체니포르미스 prsA 단백질은 서열번호 155에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
본원에서 사용되는 바와 같이, "모체 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 내인성(야생형) prsA 유전자를 포함하며", 따라서, 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질을 암호화하는 폴리뉴클레오티드가 본 발명의 변형된 B. 리체니포르미스 세포에 도입되는 경우, 도입된 폴리뉴클레오티드는 본원에서 제2 prsA 카피로 지칭될 수 있다. 예를 들어, 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 prsA 단백질을 암호화하는 도입된 폴리뉴클레오티드를 포함하는 본 발명의 변형된 B. 리체니포르미스 세포는 본원에서, 천연 prsA 단백질을 암호화하는 제1 내인성(야생형) prsA 유전자, 및 prsA 단백질을 암호화하는 제2 도입된 폴리뉴클레오티드를 포함하는 2개의 카피 prsA(변형된) B. 리체니포르미스 세포로 지칭될 수 있다.
B. 서브틸리스에서, dlt 오페론은 DltA, DltB, DltC, DltD, 및 DltE로 각각 명명된 단백질을 암호화하는 5개의 ORF(dltA, dltB, dltC, dltD, 및 dltE)를 포함한다(문헌[May et al., 2005]). 예를 들어, 문헌[May et al. (2005)]에 기재된 바와 같이, DltA 단백질은 D-Ala를 세포벽의 리포테이코산으로 통합하는 데 관여하는 D-알라닌:D-알라닐 운반 단백질 리가제이다.
본원에서 사용되는 바와 같이, "dltA 유전자"는 서열번호 122에 대해 약 90%의 서열 동일성을 포함한다. 특정 구현예에서, dltA 유전자는 서열번호 155에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 포함한다.
B. 서브틸리스 rghR 유전자는 당해 분야에서 rapG, rapH의 억제인자로서 기술된 RghR이라는 전사 조절 단백질을 암호화한다(문헌[Ogura and Fujita, 2007]). 대조적으로, 최근 PCT 공개 WO2018/156705호에 기재된 바와 같이, B. 리체니포르미스는 RghR1 및 RghR2라는 2개의 RghR 전사 조절 단백질 상동체를 암호화한다. 이후에 설명되는 바와 같이, 본 발명의 특정 구현예는 변형된(예를 들어, 결실 또는 파괴된) rghr2 유전자를 포함하는 B. 리체니포르미스 세포에 관한 것이다.
본원에서 사용되는 바와 같이, 본원에 기재된 유전자 변형에 적합한 "B. 리체니포르미스 rghR2 유전자"는 서열번호 156에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 156에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하는 천연 RhgR2 단백질을 암호화하는 야생형 B. 리체니포르미스 rghR2 유전자(서열번호 121)일 수 있거나, 서열번호 157에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 156에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하는 변이 RhgR2 단백질을 암호화하는 변이 B. 리체니포르미스 rghR2 유전자(서열번호 158)일 수 있다. 예를 들어, 서열번호 157에 제시된 바와 같이, 변이 RhgR2 단백질은 서열번호 157의 아미노산 잔기 36~41에 "Ala-Ala-Ala-Ile-Ser-Arg"의 6개의 아미노산 잔기 반복을 포함하며, 이 6개의 아미노산 반복은 천연 RghR2 단백질(즉, 서열번호 156의 아미노산 잔기 1~134)에는 존재하지 않는다.
따라서, 다른 특정 구현예에서, rghR2 유전자, 또는 이의 오픈 리딩 프레임은 천연 rghR2 유전자에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 121에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함하거나; 변이 rghR2 유전자에 대해 약 90%의 서열 동일성(예를 들어, 서열번호 158에 대해 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성)을 포함한다.
본원에서 사용되는 바와 같이, "BF140" 또는 "BF140(ΔserA_ΔlysA)"로 명명된 모체 B. 리체니포르미스 균주는 serA 유전자 결실(ΔserA) 및 lysA 유전자 결실(ΔlysA)을 포함한다.
본원에서 사용되는 바와 같이, "BF561" 또는 "BF561(제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 모균주 BF140으로부터 유래되었고, 변형된 BF561 균주는 천연 prsA 단백질을 암호화하는 야생형 B. 리체니포르미스 prsA 유전자의 도입된 제2 카피를 포함한다.
본원에서 사용되는 바와 같이, "BF598" 또는 "BF598(ΔdltA_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF561 균주로부터 유래되었고, 변형된 BF598은 B. 리체니포르미스 dltA 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "BF602" 또는 "BF602(ΔrghR2_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF561 균주로부터 유래되었고, 변형된 BF602는 B. 리체니포르미스 rghR2 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "BF613" 또는 "BF613(ΔrghR2_ΔdltA_제2 카피 prsA)"로 명명된 변형된 B. 리체니포르미스 균주는 BF598(ΔdltA_제2 카피 prsA) 균주로부터 유래되었고, 변형된 BF613은 B. 리체니포르미스 rghR2 유전자의 결실을 추가로 포함한다.
본원에서 사용되는 바와 같이, "아밀라제 1"은 당업계에서 일반적으로 AmyL로 지칭되는 천연 B. 리체니포르미스 α-아밀라제이며, 서열번호 126의 아미노산 서열을 포함한다.
본원에서 사용되는 바와 같이, "아밀라제 2"는 국제 PCT 공개 WO2018/184004호(전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 136을 포함하는 변이 바실러스 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 3"은 국제 PCT 공개 WO2014/164777호, WO2012/164800호, 및 WO2014/164834호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 143을 포함하는 변이 사이토파가(Cytophaga) 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 4"는 국제 PCT 공개 WO2014/164777호, WO2012/164800호, 및 WO2014/164834호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 147을 포함하는 변이 사이토파가 종 α-아밀라제이다.
본원에서 사용되는 바와 같이, "아밀라제 5"는 국제 PCT 공개 WO2008/153805호 및 US 특허공개 US2014/0057324호(각각은 전체가 본원에 참조로 포함됨)에 일반적으로 기재된 바와 같은, 서열번호 151을 포함하는 변이 바실러스 종 707 알칼리성 α-아밀라제이다.
본원에서 사용되는 바와 같이, "Cas9 Y155H"로 명명된 본원의 변이 Cas9 단백질은 PCT 공개 WO2019/118463호(전체가 본원에 참조로 포함됨)에 기재되어 있다.
본원에서 사용되는 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, 다음을 포함한다: (a) 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자 또는 이의 ORF의 전사 또는 번역에 필요한 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자의 하향조절, (f) 특이적 돌연변이유발, 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 무작위 돌연변이유발.
본원에서 사용되는 바와 같이, "변형된 숙주 세포는 (변형되지 않은) 모체 숙주 세포에 비해 하나 이상의 관심 단백질의 '증가된 양을 발현/생산한다"와 같은 어구에서 사용될 때, "증가된 양"은 특히, 변형된 숙주 세포에서 발현/생산된 임의의 관심 단백질(POI)의 "증가된 양"을 나타내며, "증가된 양"은 항상, 동일한 POI를 발현/생산하는 (변형되지 않은) 모체 B. 리체니포르미스 세포에 대해 상대적인 것이고, 여기서 변형된 세포와 변형되지 않은 세포는 동일한 조건(예를 들어, 배지, 온도, pH 등이 동일한 조건)하에 성장/배양/발효된다. 예를 들어, 증가된 양의 POI는 내인성 바실러스 종 POI, 또는 본 발명의 변형된 바실러스 종 세포에서 발현된 이종성 POI일 수 있다.
본원에서 사용되는 바와 같이, 단백질 생산의 "증가" 또는 "증가된" 단백질 생산은 증가된 양의 생산된 단백질(예를 들어, 관심 단백질)을 의미한다. 단백질은 숙주 세포 내에서 생산되거나, 배양 배지 내로 분비(또는 수송)될 수 있다. 특정 구현예에서, 관심 단백질은 배양 배지 내로 생산(분비)된다. 예를 들어, 단백질 생산의 증가는 예를 들어 모체 숙주 세포와 비교하여 더 높은 최대 수준의 단백질 또는 효소 활성(예를 들어, 프로테아제 활성, 아밀라제 활성, 셀룰라제 활성, 헤미셀룰라제 활성 등), 또는 생산된 총 세포외 단백질로서 검출될 수 있다.
본원에서 사용되는 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정적 축적을 나타낸다. 발현은 또한 mRNA의 폴리펩티드로의 번역을 나타낼 수 있다. 따라서, 용어 "발현"은 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는(이에 한정되지 않음), 폴리펩티드의 생산에 관여된 임의의 단계를 포함한다.
본원에서 사용되는 바와 같이, "핵산"은 뉴클레오티드 서열 또는 폴리뉴클레오티드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중가닥 또는 단일가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA, 및 RNA를 지칭한다. 유전 암호의 축퇴로 인해 다수의 뉴클레오티드 서열이 주어진 단백질을 암호화할 수 있다는 것을 이해할 수 있을 것이다.
본원에 기술된 폴리뉴클레오티드(또는 핵산 분자)는 "유전자", "벡터", 및 "플라스미드"를 포함하는 것이 이해된다.
따라서, 용어 "유전자"는 단백질 암호화 서열의 전부 또는 일부를 포함하는 아미노산의 특정 서열을 암호화하는 폴리뉴클레오티드를 나타내며, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 서열과 같은 조절(비전사) DNA 서열을 포함할 수 있다. 유전자의 전사 영역은 인트론, 5'-비번역 영역(UTR), 및 3'-UTR을 포함하는 비번역 영역(UTR)뿐만 아니라 암호화 서열도 포함할 수 있다.
본원에서 사용되는 바와 같이, 용어 "암호화 서열"은 (암호화된) 단백질 산물의 아미노산 서열을 직접 특정하는 뉴클레오티드 서열을 나타낸다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임(이하, "ORF")에 의해 결정되며, 이는 대개 ATG 시작 코돈으로 시작된다. 암호화 서열은 일반적으로 DNA, cDNA, 및 재조합 뉴클레오티드 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(다운스트림)에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서, 또는 상이한 발달 단계에서, 또는 상이한 환경 조건 또는 생리적 조건에 응답하여 유전자의 발현을 지시할 수 있음이 당업자에 의해 이해된다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터를 일반적으로 "항시성 프로모터"라고 한다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 길이가 다른 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 인정된다.
본원에서 사용되는 바와 같이, "작동가능하게 연결된"이라는 용어는 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 결합된 것을 나타낸다. 예를 들어, 프로모터가 암호화 서열(예를 들어, ORF)의 발현에 영향을 미칠 수 있는 경우(즉, 암호화 서열이 프로모터의 전사 제어하에 있는 경우) 해당 암호화 서열과 작동가능하게 연결된 것이다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동가능하게 연결될 수 있다.
핵산이 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동가능하게 연결된" 것이다. 예를 들어, 분비 리더(즉, 신호 펩티드)를 암호화하는 DNA가 폴리펩티드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우에 해당 폴리펩티드에 대한 DNA에 작동가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 해당 서열에 작동가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 암호화 서열에 작동가능하게 연결된다. 일반적으로 "작동가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
본원에서 사용되는 바와 같이, "관심 유전자의 단백질 암호화 서열에 연결된 관심 유전자(또는 이의 오픈 리딩 프레임)의 발현을 제어하는 기능적 프로모터 서열"은, 바실러스에서 암호화 서열의 전사 및 번역을 제어하는 프로모터 서열을 지칭한다. 예를 들어, 특정 구현예에서, 본 발명은 5' 프로모터(또는 5' 프로모터 영역 또는 탠덤 5' 프로모터 등)를 포함하는 폴리뉴클레오티드에 관한 것이며, 프로모터 영역은 관심 단백질을 암호화하는 핵산 서열(예를 들어, ORF)에 작동가능하게 연결된다.
본원에서 사용되는 바와 같이, "적합한 조절 서열"은 암호화 서열의 업스트림(5' 비암호화 서열), 암호화 서열 내, 또는 암호화 서열의 다운스트림(3' 비암호화 서열)에 위치하며 관련 암호화 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 및 스템-루프 구조를 포함할 수 있다.
본원에서 사용되는 바와 같이, 적어도 하나의 폴리뉴클레오티드 오픈 리딩 프레임(ORF), 또는 이의 유전자, 또는 이의 벡터를 "박테리아 세포 내로 도입" 또는 "B. 리체니포르미스 세포 내로 도입"과 같은 어구에서 사용되는 용어 "도입"은 원형질체 융합, 천연 또는 인공 형질전환(예: 염화칼슘, 전기천공), 형질도입, 형질감염, 접합 등을 포함하여(이에 한정되지 않음), 폴리뉴클레오티드를 세포에 도입하기 위한 당업계에 알려진 방법을 포함한다(예를 들어, 문헌[Ferrari et al., 1989]참조).
본원에서 사용되는 바와 같이, "형질전환"은 재조합 DNA 기술을 사용하여 세포가 형질전환되었음을 의미한다. 형질전환은 일반적으로 하나 이상의 뉴클레오티드 서열(예를 들어, 폴리뉴클레오티드, ORF, 또는 유전자)을 세포에 삽입함으로써 일어난다. 삽입된 뉴클레오티드 서열은 이종성 뉴클레오티드 서열(즉, 형질전환될 세포에서 자연적으로 발생하지 않는 서열)일 수 있다. 따라서, 형질전환은 일반적으로 외인성 DNA를 숙주 세포에 도입하여 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 하는 것을 의미한다.
본원에서 사용되는 바와 같이, "형질전환 DNA", "형질전환 서열", 및 "DNA 구성체"는 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA를 지칭한다. 형질전환 DNA는 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA이다. 이러한 DNA는 PCR 또는 임의의 다른 적합한 기술에 의해 시험관내에서 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 구현예에서는 상동성 박스에 의해 플랭킹된 유입 서열을 추가로 포함한다. 또 다른 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터 내 삽입과 같이 닫힌 원을 형성하도록 닫힐 수 있다.
본원에서 사용되는 바와 같이, "유전자의 파괴" 또는 "유전자 파괴"는 상호교환적으로 사용되며, 숙주 세포가 기능적 유전자 산물(예를 들어, 단백질)을 생산하는 것을 실질적으로 방지하는 임의의 유전자 변형을 광범위하게 지칭한다. 따라서, 본원에서 사용되는 바와 같이, 유전자 파괴는 프레임시프트 돌연변이, 조기 정지 코돈(즉, 기능적 단백질이 만들어지지 않음), 단백질의 활성을 제거하거나 감소시키는 치환, 내부 결실(즉, 기능적 단백질이 만들어지지 않음), 암호화 서열을 파괴하는 삽입, 전사에 필요한 천연 프로모터와 오픈 리딩 프레임 사이의 작동가능한 연결을 제거하는 돌연변이 등을 포함하나 이에 한정되지 않는다.
본원에서 사용되는 바와 같이, "유입 서열"은 바실러스 종 염색체 내로 도입되는 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 구성체의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환될 세포의 게놈에 이미 존재할 수 있거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유전자의 기능을 파괴하기 위해 비기능적 서열이 유전자에 삽입될 수 있다. 다른 구현예에서, 유입 서열은 선택 마커를 포함한다. 추가 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에서 사용되는 바와 같이, "상동성 박스"는 바실러스 염색체 내의 서열에 대해 상동성인 핵산 서열을 지칭한다. 보다 구체적으로, 상동성 박스는 본 발명에 따라 결실, 파괴, 비활성화, 하향조절 등이 될 유전자 또는 유전자의 일부의 인접 플랭킹 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 업스트림 또는 다운스트림 영역이다. 이러한 서열은 DNA 구성체가 바실러스 염색체에서 어느 위치에 통합되는지를 지시하고, 바실러스 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1 염기쌍(bp) 내지 200 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb, 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택 마커의 5' 및 3' 말단은 상동성 박스에 의해 플랭킹되고, 상동성 박스는 유전자의 암호화 영역을 바로 플랭킹하는 핵산 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "선별 마커 암호화 뉴클레오티드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 결핍 하에 성장할 수 있는 능력을 부여하는 뉴클레오티드 서열을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "선별 마커" 및 "선택 마커"는 숙주 세포에서 발현이 가능한 핵산(예를 들어, 유전자)으로서, 벡터를 함유하는 숙주의 선택을 용이하게 하는 핵산을 지칭한다. 이러한 선별 마커의 예는 항미생물제를 포함하나 이에 한정되지 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 의미한다. 일반적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 외인성 서열을 받지 않은 세포와 구별될 수 있도록 숙주 세포에 항균성 내성 또는 대사 이점을 부여하는 유전자이다.
"상주 선별 마커(residing selectable marker)"는 형질전환될 미생물의 염색체 상에 위치하는 것이다. 상주 선별 마커는 형질전환 DNA 구성체 상의 선별 마커와 상이한 유전자를 암호화한다. 선택 마커는 당업자에게 잘 알려져 있다. 위에서 나타낸 바와 같이, 마커는 항균성 내성 마커(예를 들어, ampR, phleoR, specR, kanR, eryR, tetR, cmpR, 및 neoR)일 수 있다(예를 들어, 문헌[Guerot-Fleury, 1995; Palmeros et al., 2000; 및 Trieu-Cuot et al., 1983] 참조). 일부 구현예에서, 본 발명은 클로람페니콜 내성 유전자(예를 들어, pC194에 존재하는 유전자, 및 바실러스 리체니포르미스 게놈에 존재하는 내성 유전자)를 제공한다. 이러한 내성 유전자는 본 발명에서, 뿐만 아니라 염색체 통합 카세트 및 통합형 플라스미드의 염색체 증폭과 관련된 구현예에서도 특히 유용하다(예를 들어, 문헌[Albertini and Galizzi, 1985; Stahl and Ferrari, 1984] 참조). 본 발명에 따른 유용한 다른 마커는 세린, 리신, 트립토판과 같은 영양요구성 마커; 및 β-갈락토시다제와 같은 검출 마커를 포함하나 이에 한정되지 않는다.
본원에서 정의되는 바와 같이, 숙주 세포 "게놈", 박테리아 (숙주) 세포 "게놈", 또는 바실러스 종 (숙주) 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "플라스미드", "벡터", 및 "카세트"는, 일반적으로 세포의 중심 대사의 일부가 아닌 보통 원형 이중가닥 DNA 분자의 형태인 대개 유전자를 운반하는 염색체외 요소를 지칭한다. 이러한 요소는 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 구성체로 다수의 뉴클레오티드 서열이 연결되거나 재조합된, 임의의 공급원 유래의 단일가닥 또는 이중가닥 DNA 또는 RNA의 선형 또는 원형, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있다.
본원에서 사용되는 바와 같이, 용어 "플라스미드"는 클로닝 벡터로서 사용되며 많은 박테리아 및 일부 진핵 생물에서 염색체외 자가 복제성 유전 요소를 형성하는 원형 이중가닥(ds) DNA 구성체를 지칭한다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈에 통합된다. 일부 구현예에서, 플라스미드는 모세포에 존재하고 딸세포에서 소실된다.
본원에서 사용되는 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 외래 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특정 벡터를 나타낸다.
본원에서 사용되는 바와 같이, "벡터"라는 용어는 세포에서 복제(증식)될 수 있고 새로운 유전자 또는 DNA 절편을 세포 내로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 구성체를 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스(pro-virus), 플라스미드, 파지미드(phagemid), 트랜스포존(transposon), 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"이다(즉, 자율적으로 복제되거나 숙주 생물의 염색체 내에 통합될 수 있음).
"발현 벡터"는 세포에서 이종성 DNA를 통합하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용가능하고 당업자에게 알려져 있다. 적절한 발현 벡터를 선택하는 것은 당업자가 알고 있다.
본원에서 사용되는 바와 같이, 용어 "발현 카세트" 또는 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 가능케 하는 일련의 명시된 핵산 요소(즉, 전술한 바와 같은 벡터 또는 벡터 요소)를 사용해 재조합적으로 또는 합성에 의해 생성된 핵산 구성체를 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스, 또는 핵산 단편에 통합될 수 있다. 일반적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 특히, 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 구성체는 표적 세포에서 특정 핵산의 전사를 가능하게 하는 일련의 명시된 핵산 요소를 또한 포함한다. 특정 구현예에서, 본 발명의 DNA 구성체는 본원에 정의된 바와 같은 선택 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에서 사용되는 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오티드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체에 돌연변이를 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭킹 서열)을 포함한다. 말단은 표적화 벡터가 예를 들어 벡터 내 삽입과 같이 닫힌 원을 형성하도록 닫힐 수 있다. 예를 들어, 특정 구현예에서, 모체 B. 리체니포르미스 (숙주) 세포는 하나 이상의 "표적화 벡터"를 도입함으로써 변형(예를 들어, 형질전환)된다.
본원에서 사용되는 바와 같이, 용어 "관심 단백질" 또는 "POI"는 변형된 B. 리체니포르미스(딸) 숙주 세포에서 발현되기를 원하는 관심 폴리펩티드를 지칭하며, POI는 바람직하게는 증가된(즉, "변형되지 않은"(모) 세포에 비해 증가된) 수준으로 발현된다. 따라서, 본원에서 사용되는 바와 같이, POI는 효소, 기질-결합 단백질, 표면-활성 단백질, 구조 단백질, 수용체 단백질 등일 수 있다. 특정 구현예에서, 본 발명의 변형된 세포는 모세포에 비해 증가된 양의 이종성 관심 단백질 또는 내인성 관심 단백질을 생산한다. 특정 구현예에서, 본 발명의 변형된 세포에 의해 생산된 관심 단백질의 증가된 양은 모세포에 비해 0.5% 이상의 증가, 1.0% 이상의 증가, 5.0% 이상의 증가, 또는 5.0% 초과의 증가이다.
유사하게, 본원에서 정의되는 바와 같이, "관심 유전자" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예를 들어, 폴리뉴클레오티드, 유전자, 또는 ORF)을 지칭한다. "관심 단백질"을 암호화하는 "관심 유전자"는 자연 발생적 유전자, 돌연변이 유전자, 또는 합성 유전자일 수 있다.
본원에서 사용되는 바와 같이, 용어 "폴리펩티드" 및 "단백질"은 상호교환적으로 사용되며, 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭한다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에서 사용된다. 폴리펩티드는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있으며, 비아미노산이 개재될 수 있다. 폴리펩티드라는 용어는 자연적으로 변형되었거나, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 임의의 다른 조작 또는 변형, 예컨대, 표지 성분과의 접합과 같은 개입에 의해 변형된 아미노산 중합체를 또한 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예컨대, 비천연 아미노산 등을 포함함)뿐만 아니라 당업계에 알려진 다른 변형을 포함하는 폴리펩티드도 정의에 포함된다.
특정 구현예에서, 본 발명의 유전자는 상업적으로 관련된 산업적 관심 단백질, 예컨대 효소(예를 들어, 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나제, 아라비노푸라노시다제, 탄산무수화효소, 카복시펩티다제, 카탈라제, 셀룰라제, 키티나제, 키모신, 큐티나제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나제, 글루칸 라이사제, 엔도-β-글루카나제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 하이드롤라제, 인버타제, 이소머라제, 라카제, 리파제, 리아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴 분해 효소, 퍼하이드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 헥소스 옥시다제, 및 이들의 조합)를 암호화한다.
본원에서 사용되는 바와 같이, "변이체" 폴리펩티드는, 일반적으로 재조합 DNA 기술에 의한 하나 이상의 아미노산의 치환, 추가, 또는 결실에 의해 모체(또는 기준) 폴리펩티드로부터 유래되는 폴리펩티드를 지칭한다. 변이체 폴리펩티드는 적은 수의 아미노산 잔기만큼 모체 폴리펩티드와 상이할 수 있으며, 모체(기준) 폴리펩티드와의 일차 아미노산 서열 상동성/동일성 수준에 의해 정의될 수 있다.
바람직하게는, 변이체 폴리펩티드는 모체(기준) 폴리펩티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 아미노산 서열 동일성을 갖는다. 본원에서 사용되는 바와 같이, "변이체" 폴리뉴클레오티드는 변이체 폴리펩티드를 암호화하는 폴리뉴클레오티드를 지칭하며, "변이체 폴리뉴클레오티드"는 모체 폴리뉴클레오티드와 명시된 정도의 서열 상동성/동일성을 갖거나, 엄격한 혼성화 조건하에 모체 폴리뉴클레오티드(또는 이의 상보체)와 혼성화된다. 바람직하게는, 변이체 폴리뉴클레오티드는 모체(기준) 폴리뉴클레오티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 뉴클레오티드 서열 동일성을 갖는다.
본원에서 사용되는 바와 같이, "돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 나타낸다. 점 돌연변이, 결실 돌연변이, 침묵 돌연변이, 프레임 시프트 돌연변이, 스플라이싱 돌연변이 등을 포함하는 여러 가지 유형의 돌연변이가 존재한다. 돌연변이는 특이적으로(예를 들어, 부위 지정 돌연변이유발을 통해) 또는 무작위로(예를 들어, 화학작용제, 복구 결핍된 박테리아 균주를 통한 계대배양을 통해) 수행될 수 있다.
본원에서 사용되는 바와 같이, 폴리펩티드 또는 이의 서열의 맥락에서, 용어 "치환"은 하나의 아미노산을 또 다른 아미노산으로 대체(즉, 치환)하는 것을 의미한다.
본원에서 정의되는 바와 같이, "내인성 유전자"는 유기체의 게놈 내의 자연적 위치에 있는 유전자를 지칭한다.
본원에서 정의되는 바와 같이, "이종성" 유전자, "비내인성" 유전자, 또는 "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않고 유전자 전달에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "외래" 유전자(들)는 비천연 유기체 내로 삽입된 천연 유전자(또는 ORF) 및/또는 천연 또는 비천연 유기체 내로 삽입된 키메라 유전자를 포함한다.
본원에서 정의되는 바와 같이, "이종성 제어 서열"은 자연에서는 관심 유전자의 발현을 조절하는(제어하는) 기능을 하지 않는 유전자 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 나타낸다. 일반적으로, 이종성 핵산 서열은 이들이 존재하는 세포 또는 게놈의 일부에 대해 내인성이 아니며(천연이 아니며), 감염, 전달감염, 형질전환, 미세주입, 전기천공 등에 의해 세포에 부가되었다. "이종성" 핵산 구성체는 천연 숙주 세포에서 발견되는 조절 서열/DNA 암호화 서열의 조합과 동일하거나 이와는 상이한 조절 서열/DNA 암호화(ORF) 서열의 조합을 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "신호 서열" 및 "신호 펩티드"는 성숙한 단백질 또는 전구체 형태의 단백질의 분비 또는 직접 수송에 참여할 수 있는 아미노산 잔기의 서열을 지칭한다. 신호 서열은 일반적으로 전구체 또는 성숙 단백질 서열의 N-말단에 위치한다. 신호 서열은 내인성 또는 외인성일 수 있다. 신호 서열은 일반적으로 성숙 단백질에 존재하지 않는다. 신호 서열은 일반적으로 단백질이 수송된 후 신호 펩티다제에 의해 단백질로부터 절단된다.
용어 "유래된"은 용어 "기인된", "수득된", "수득 가능한" 및 "생성된"을 포함하며, 일반적으로 하나의 명시된 물질 또는 조성물의 기원이 또 다른 명시된 물질 또는 조성물에서 발견되거나, 또 다른 명시된 물질 또는 조성물을 참조하여 기술될 수 있는 특징을 가진다는 것을 나타낸다.
본원에서 사용되는 바와 같이, 용어 "상동성"은 상동 폴리뉴클레오티드 또는 폴리펩티드와 관련된다. 둘 이상의 폴리뉴클레오티드 또는 둘 이상의 폴리펩티드가 상동성일 경우, 이는 상동 폴리뉴클레오티드 또는 폴리펩티드가 적어도 60%, 더 바람직하게는 적어도 70%, 한층 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 95%, 및 가장 바람직하게는 적어도 98%의 "동일성 정도"를 갖는 것을 의미한다. 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열이 본원에서 정의된 바와 같이 상동성이 되기에 충분히 높은 정도의 동일성을 갖는지 여부는 본 기술 분야에 공지된 컴퓨터 프로그램, 예를 들어 GCG 프로그램 패키지로 제공되는 "GAP"(Program Manual for the Wisconsin Package, 버전 8, 1994년 8월, [53711] 미국 위스콘신주 매디슨 사이언스 드라이브 575 소재의 제네틱스 컴퓨터 그룹(Genetics Computer Group))을 사용하여 두 서열을 정렬함으로써 적절히 조사할 수 있다(문헌[Needleman and Wunsch, (1970)]). DNA 서열 비교를 위하여 하기 설정을 갖는 GAP를 사용한다: 5.0의 GAP 생성 페널티 및 0.3의 GAP 연장 페널티.
본원에서 사용되는 바와 같이, 용어 "동일성 백분율(%)"은, 폴리펩티드를 암호화하는 핵산 서열들 또는 폴리펩티드의 아미노산 서열들을 서열 정렬 프로그램을 사용하여 정렬할 때, 이들 사이의 핵산 서열 또는 아미노산 서열의 동일성 수준을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "비생산성(specific productivity)"은 주어진 기간에 걸쳐 시간당 세포당 생산된 단백질의 총량이다.
본원에서 정의되는 바와 같이, "정제된", "단리된" 또는 "풍부화된"이라는 용어는, 생체분자(예를 들어, 폴리펩티드 또는 폴리뉴클레오티드)가 자연에서 이들과 결합되어 있는 자연 발생 구성 성분 중 일부 또는 전부로부터 분리됨으로써 이의 자연 상태로부터 변경되는 것을 의미한다. 이러한 단리 또는 정제는 최종 조성물에서 바람직하지 않은 전체 세포, 세포 잔여물, 불순물, 외부 단백질, 또는 효소를 제거하기 위한 이온 교환 크로마토그래피, 친화성 크로마토그래피, 소수성 분리, 투석, 프로테아제 처리, 황산암모늄 침전 또는 기타 단백질 염 침전, 원심분리, 크기 배제 크로마토그래피, 여과, 미세여과, 겔 전기영동 또는 구배에 의한 분리와 같은 본 기술 분야에서 인정된 분리 기술에 의해 달성될 수 있다. 이후, 추가 이득을 제공하는 구성 성분, 예를 들어 활성화제, 항저해제, 바람직한 이온, pH를 제어하기 위한 화합물 또는 기타 효소 또는 화학물질을 정제되거나 단리된 생체분자 조성물에 첨가하는 것이 추가로 가능하다.
본원에서 사용되는 바와 같이, 용어 "ComK 폴리펩티드"는, 재조합에서 DNA-결합과 흡수에 관여하는 후기 유능성 유전자(late competence gene)의 발현 활성화와 관련하여, 유능성 발생 이전에 최종 자동-조절 제어 스위치로서 작용하는 전사 인자인 comK 유전자의 산물로서 정의된다(문헌[Liu and Zuber, 1998, Hamoen et al., 1998]). 예시적인 ComK 핵산은 서열번호 92에 제시되어 있다.
본원에서 사용되는 바와 같이, "재조합"은 이종성 핵산 서열의 도입에 의해 변형되었거나, 그렇게 변형된 세포로부터 세포가 유래되는, 세포 또는 벡터에 대한 언급을 포함한다. 따라서, 예를 들어, 재조합 세포는 세포의 천연(비재조합) 형태 내에서는 동일한 형태로 발견되지 않는 유전자를 발현하거나, 의도적인 인간의 개입으로 인해 달리 비정상적으로 발현되었거나, 덜 발현되었거나, 전혀 발현되지 않은 천연 유전자를 발현한다. "재조합" 또는 "재조합된" 핵산을 생성하는 것은 일반적으로 2개 이상의 핵산 단편을 조립하는 것이며, 조립을 통해 키메라 유전자가 생성된다.
본원에서 사용되는 바와 같이, "플랭킹 서열"은 논의 중인 서열의 업스트림 또는 다운스트림에 있는 임의의 서열을 지칭한다(예를 들어, 유전자 A-B-C의 경우, 유전자 B는 A 및 C 유전자 서열에 의해 플랭킹됨). 특정 구현예에서, 유입 서열은 각 측의 상동성 박스에 의해 플랭킹된다. 다른 구현예에서, 유입 서열 및 상동성 박스는 각 측의 스터퍼 서열에 의해 플랭킹되는 단위를 포함한다. 일부 구현예에서, 플랭킹 서열은 일 측(3' 또는 5')에만 존재하지만, 바람직한 구현예에서는, 플랭킹되는 서열의 각 측에 존재한다. 각각의 상동성 박스의 서열은 바실러스 염색체 내의 서열에 대해 상동성이다. 이러한 서열은 새로운 구성체가 바실러스 염색체에서 어느 위치에 통합되는지를 지시하고, 바실러스 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 다른 구현예에서, 선택 마커의 5' 및 3' 말단은 비활성화 염색체 절편의 섹션을 포함하는 폴리뉴클레오티드 서열에 의해 플랭킹된다. 일부 구현예에서, 플랭킹 서열은 일 측(3' 또는 5')에만 존재하는 반면, 다른 구현예에서는, 플랭킹되는 서열의 각 측에 존재한다.
II. 향상된 단백질 생산 표현형을 포함하는 변형된
바실러스 리체니포르미스
세포
하기 실시예 섹션에 일반적으로 기술된 바와 같이, 본 출원인은 일련의 숙주 변형을 구성하여 모체 B. 리체니포르미스 균주에 도입하였다. 보다 구체적으로, 하기 실시예에 제시된 바와 같이(예를 들어, 표 18 참조), 본 실시예에 사용된 모체 B. 리체니포르미스 균주는 serA1 유전자(서열번호 30) 및 lysA 유전자(서열번호 87)의 결실을 포함하고, BF140(ΔserA_ΔlysA)로 명명되었다. 본 출원인은 후속적으로 (1) 천연 prsA 단백질을 암호화하는 야생형 B. 리체니포르미스 prsA 유전자의 제2 카피의 도입(BF561로 명명; 제2 카피 prsA), (2) B. 리체니포르미스 dltA 유전자의 결실(BF598로 명명; ΔdltA_제2 카피 prsA), (3) B. 리체니포르미스 rghR2 유전자의 결실(BF602로 명명; ΔrghR2_제2 카피 prsA), 및 (4) B. 리체니포르미스 rghR2 유전자 및 dltA 유전자의 조합된 결실(BF613로 명명; ΔrghR2_ΔdltA_제2 카피 prsA)을 비롯한 특정 유전자 변형을 모체 B. 리체니포르미스 균주(BF140)에 도입하였다.
상기 변형된 균주의 구성 후, 일련의 α-아밀라제 발현 카세트를 변형된 B. 리체니포르미스 균주(BF561, BF598, BF602, 및 BF613) 및 모체 B. 리체니포르미스 균주(BF140)에 도입하였다. 보다 구체적으로, 하기 실시예 4에 제시된 바와 같이, 5개의 상이한 α-아밀라제 발현 카세트(즉, "아밀라제 1", "아밀라제 2", "아밀라제 3", "아밀라제 4", 및 "아밀라제 5")의 2개의 카피를 B. 리체니포르미스 균주에 도입하였다.
하기 실시예 5에서 추가로 설명되는 바와 같이, 아밀라제 1~5에 대한 발현 카세트의 2개의 카피를 포함하는 모체(BF140) 및 변형된(BF561, BF598, BF602, 및 BF613) B. 리체니포르미스 균주를 아밀라제의 생성에 대해 분석하였다(예를 들어, 표 19 참조). 예를 들어, 다양한 α-아밀라제 그룹에서 시험된 5가지 아밀라제 모두는 변형되지 않은 모체 숙주 BF140과 비교하여, 결실된 dltA-2(ΔdltA-2) 대립유전자(서열번호 125), 결실된 rghR2(ΔrghR2) 대립유전자(서열번호 80), 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)의 삽입을 포함하는 BF613 변형 백그라운드(ΔrghR2_ ΔdltA_제2 카피 prsA)에서 α-아밀라제 생성의 개선을 보여준다. 아밀라제 2 및 아밀라제 3의 경우, 결실된 rghR2(ΔrghR2) 대립유전자(서열번호 80) 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)를 포함하는 BF602 변형 백그라운드(ΔrghR2_제2 카피 prsA)에서 α-아밀라제 생성의 개선은 BF613 변형 숙주에서 관찰되는 생산성 개선과 거의 같은 정도로 우수하다. 이러한 관찰은 일부 아밀라제의 경우 생산성 개선이 이러한 2개의 대립유전자(즉, ΔrghR2_제2 카피 prsA)의 존재만을 필요로 하며 ΔdltA-2 대립유전자의 존재가 이러한 개선에 해롭지 않음을 시사한다.
III. 분자 생물학
상기에 일반적으로 기재된 바와 같이, 본 발명의 특정 구현예는 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스(딸) 세포에 관한 것이다. 보다 구체적으로는, 본 발명의 특정 구현예는 증가된 단백질 생산 능력, 증가된 2차 대사산물 생산 능력 등을 갖는 변형된 바실러스(숙주) 세포(예를 들어, 단백질 생산 숙주 세포, 세포 공장)를 생산하고 구성하기 위한 변형된 바실러스(딸) 세포 및 이의 방법에 관한 것이다.
특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 dltA 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피 및 결실된 dltA 유전자를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피 및 결실된 rghR2 유전자를 포함한다. 다른 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 결실된 dltA 유전자 및 결실된 rghR2 유전자를 포함한다. 다른 특정 구현예에서, 본 발명의 변형된 B. 리체니포르미스 세포는 천연 prsA 단백질을 암호화하는 유전자 또는 ORF의 도입된 제2 카피, 결실된 dltA 유전자, 및 결실된 rghR2 유전자를 포함한다.
따라서, 본 발명의 특정 구현예는 본 발명의 모체 바실러스 세포를 유전자 변형(변경)시켜 이의 변형된 바실러스 세포, 보다 구체적으로는 (변형되지 않은) 모체 B. 리체니포르미스 세포에 비해 증가된 양의 내인성 및/또는 이종성 관심 단백질을 생산하는 변형된 바실러스 세포를 생성하기 위한 조성물 및 방법을 제공한다.
따라서, 본 발명의 특정 구현예는 바실러스 세포를 유전자 변형시키는 방법에 관한 것이며, 변형은 (a) 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자 또는 이의 ORF의 전사 또는 번역에 필요한 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 부위특이적 돌연변이유발, 및/또는 (g) 무작위 돌연변이유발을 포함한다.
특정 구현예에서, 본 발명의 변형된 바실러스 세포는 상기 제시된 유전자의 발현을 당업계에 잘 알려진 방법(예를 들어, 삽입, 파괴, 대체, 또는 결실)을 사용하여 감소시키거나 제거함으로써 구성된다. 변형 또는 비활성화 대상인 유전자 부분은 예를 들어 암호화 영역이거나 암호화 영역의 발현에 필요한 조절 요소일 수 있다.
이러한 조절 또는 제어 서열의 예는 프로모터 서열 또는 이의 기능적 부분(즉, 핵산 서열의 발현에 영향을 미치기에 충분한 부분)일 수 있다. 변형을 위한 다른 제어 서열은 리더 서열, 프로-펩티드 서열, 신호 서열, 전사 종결자, 전사 활성자 등을 포함하나 이에 한정되지 않는다.
다른 특정 구현예에서, 변형된 바실러스 세포는 본 발명의 상기 언급된 유전자 중 적어도 하나의 발현을 제거하거나 감소시키기 위한 유전자 결실에 의해 구성된다. 유전자 결실 기술은 유전자(들)를 부분적으로 또는 완전하게 제거하여, 이들의 발현이 제거되거나 비기능적(또는 활성이 감소된) 단백질 산물이 발현되도록 할 수 있다. 이러한 방법에서, 유전자(들)의 결실은 유전자를 플랭킹하는 5' 및 3' 영역을 인접하여 포함하도록 구성된 플라스미드를 사용하는 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은 예를 들어 pE194와 같은 온도 감수성 플라스미드 상에서, 플라스미드가 세포에서 확립될 수 있게 하는 허용 온도에서 제2 선별 마커와 함께 바실러스 세포에 도입될 수 있다. 그런 다음, 플라스미드를 상동성 플랭킹 영역 중 하나에서 염색체에 통합시키는 세포를 선택하기 위해 허용되지 않는 온도로 세포를 이동시킨다. 플라스미드의 통합에 대한 선택은 제2 선별 마커에 대한 선택에 의해 수행된다. 통합 후, 선택 없이 여러 세대 동안 허용 온도로 세포를 이동시킴으로써 제2 상동성 플랭킹 영역에서의 재조합 이벤트가 자극된다. 세포를 플레이팅하여 단일 콜로니를 수득하고, 두 선별 마커의 손실에 대해 콜로니를 검사한다(예를 들어, 문헌[Perego, 1993] 참조). 따라서, 당업자는 전체 또는 부분 결실에 적합한 유전자의 암호화 서열 및/또는 유전자의 비암호화 서열의 뉴클레오티드 영역을 쉽게 확인할 수 있다.
다른 구현예에서, 본 발명의 변형된 바실러스 세포는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거에 의해 구성된다. 예를 들어, 정지 코돈의 도입, 시작 코돈의 제거, 또는 오픈 리딩 프레임의 프레임 이동을 일으키도록 뉴클레오티드를 삽입하거나 제거할 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR 생성 돌연변이유발에 의해 달성될 수 있다(예를 들어, 문헌[Botstein and Shortle, 1985; Lo et al., 1985; Higuchi et al., 1988; Shimada, 1996; Ho et al., 1989; Horton et al., 1989; 및 Sarkar and Sommer, 1990] 참조). 따라서, 특정 구현예에서, 본 발명의 유전자는 완전 또는 부분 결실에 의해 비활성화된다.
다른 구현예에서, 변형된 바실러스 세포는 유전자 전환의 프로세스에 의해 구성된다(예를 들어, 문헌[Iglesias and Trautner, 1983] 참조). 예를 들어, 유전자 전환 방법에서, 유전자(들)에 상응하는 핵산 서열을 시험관내 돌연변이화하여 결함 있는 핵산 서열을 생성한 후, 이를 모체 바실러스 세포로 형질전환시켜 결함 있는 유전자를 생성한다. 상동성 재조합에 의해, 결함 있는 핵산 서열이 내인성 유전자를 대체한다. 결함 있는 유전자 또는 유전자 단편이 결함 있는 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커를 또한 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 있는 유전자는 선별 마커와 함께 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건하에 마커에 대한 선택에 의해 수행된다. 유전자 대체로 이어지는 제2 재조합 이벤트에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 수행된다(문헌[Perego, 1993]). 대안적으로, 결함 있는 핵산 서열은 후술하는 바와 같이, 유전자의 하나 이상의 뉴클레오티드의 삽입, 치환, 또는 결실을 포함할 수 있다.
다른 구현예에서, 변형된 바실러스 세포는 유전자의 핵산 서열에 상보적인 뉴클레오티드 서열을 사용하는 확립된 안티센스 기술에 의해 구성된다(문헌[Parish and Stoker, 1997]). 보다 구체적으로, 바실러스 세포에 의한 유전자의 발현은 세포에서 전사될 수 있고 세포에서 생성된 mRNA에 혼성화될 수 있는, 유전자의 핵산 서열에 상보적인 뉴클레오티드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보적인 안티센스 뉴클레오티드 서열이 mRNA에 혼성화될 수 있는 조건하에서, 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오티드 등을 포함하나 이에 한정되지 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 변형된 바실러스 세포는 CRISPR-Cas9 편집을 통해 생산/구성된다. 예를 들어, 관심 단백질을 암호화하는 유전자는, DNA 상의 표적 서열에 엔도뉴클레아제를 보충하는 가이드 RNA(예: Cas9) 및 Cpf1 또는 가이드 DNA(예: NgAgo)에 결합함으로써 표적 DNA를 찾아내는 핵산 가이드된 엔도뉴클레아제에 의해 편집 또는 파괴(또는 결실 또는 하향조절)될 수 있고, 엔도뉴클레아제는 DNA에서 단일가닥 또는 이중가닥 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되며, 제공된 편집 주형과 재조합하여 유전자를 파괴하거나 결실시킬 수 있다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(이 목적의 경우, S. 피오게네스로부터의 Cas9) 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자는 바실러스 세포에서 활성이 있는 프로모터 및 바실러스 세포에서 활성이 있는 종결자에 작동가능하게 연결됨으로써, 바실러스 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다. 예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 구성체를 구성하기 위해, 가변 표적화 도메인(VT)은 프로토-스페이서 인접 모티프(PAM)의 5'인 표적 부위의 뉴클레오티드(TGG)를 포함할 것이며, 이 뉴클레오티드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합은 이에 따라 gRNA를 암호화하는 DNA를 생성한다. 따라서, gRNA를 암호화하는 DNA를 바실러스 세포에서 활성이 있는 프로모터 및 바실러스 세포에서 활성이 있는 종결자에 작동가능하게 연결함으로써 gRNA에 대한 바실러스 발현 카세트가 생성된다.
특정 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정확하게 복구하기 위해, 세포의 DNA 복구 기구가 편집 주형을 이용할 수 있도록 뉴클레오티드 편집 주형이 제공된다. 예를 들어, 표적화된 유전자의 5’에 있는 약 500 bp가 표적화된 유전자의 3’에 있는 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 바실러스 숙주의 기구에 의해 사용되어 RGEN에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트, 및 편집 주형은 다양한 방법(예를 들어, 원형질체 융합, 전기천공, 자연적 능력, 또는 유도된 능력)을 사용하여 사상 진균 세포에 공동으로 전달될 수 있다. 형질전환된 세포는 정방향 및 역방향 프라이머로 유전자좌를 증폭시켜 표적 유전자좌를 PCR 증폭함으로써 스크리닝된다. 이러한 프라이머는 야생형 유전자좌 또는 RGEN에 의해 편집된 변형된 유전자좌를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여, 편집된 콜로니를 식별한다.
또 다른 구현예에서, 변형된 바실러스 세포는 당업계에 잘 알려진 방법(화학적 돌연변이유발(예를 들어, 문헌[Hopwood, 1970] 참조) 및 전위(예를 들어, 문헌[Youngman et al., 1983] 참조)를 포함하나 이에 한정되지 않음)을 사용하여 무작위 또는 특이적 돌연변이유발에 의해 구성된다. 유전자의 변형은 모세포에 대한 돌연변이유발 및 유전자의 발현이 감소 또는 제거된 돌연변이 세포에 대한 스크리닝에 의해 수행될 수 있다. 특이적 또는 무작위적일 수 있는 돌연변이유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제의 사용, 적합한 올리고뉴클레오티드의 사용, 또는 DNA 서열에 대한 PCR 생성 돌연변이유발에 의해 수행될 수 있다. 또한, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용하여 수행될 수 있다.
본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 하이드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산, 및 뉴클레오티드 유사체를 포함한다. 이러한 제제가 사용되는 경우, 돌연변이 유발은 일반적으로, 돌연변이 대상 모세포를 적합한 조건에서 선택 돌연변이 유발제의 존재하에 인큐베이션하고, 유전자의 발현이 감소되거나 나타나지 않는 돌연변이 세포를 선택함으로써 수행된다.
다른 특정 구현예에서, 변형된 바실러스 세포는 내인성 유전자의 결실을 포함한다. 다른 구현예에서, 변형된 바실러스 세포는 내인성 유전자의 파괴를 포함한다. 특정 구현예에서, 본 발명의 폴리뉴클레오티드 파괴 카세트는 마커 유전자를 포함한다.
다른 구현예에서, 변형된 바실러스 세포는 하향조절된 내인성 유전자를 포함한다. 예를 들어, 특정 구현예에서, 상기 제시된 하나 이상의 유전자의 하향조절은 유전자의 업스트림 또는 다운스트림 조절 요소의 결실 또는 파괴를 포함한다.
PCT 공개 WO2003/083125호는 E. 콜라이를 우회하는 PCR 융합을 사용한 바실러스 결실 균주 및 DNA 구성체의 생성과 같은 바실러스 세포의 변형 방법을 개시한다.
PCT 공개 WO2002/14490호는 (1) 통합 플라스미드(pComK)의 구성 및 형질전환, (2) 암호화 서열, 신호 서열, 및 프로펩티드 서열의 무작위 돌연변이유발, (3) 상동성 재조합, (4) 형질전환 DNA에 대한 비상동성 플랭크의 추가에 의한 형질전환 효율 증대, (5) 이중 교차(cross-over) 통합의 최적화, (6) 부위 지정 돌연변이유발, 및 (7) 마커가 없는(marker-less) 결실을 포함하는, 바실러스 세포의 변형 방법을 개시한다.
당업자는 폴리뉴클레오티드 서열을 박테리아 세포(예를 들어, E. 콜라이 및 바실러스 종)에 도입하기 위한 적합한 방법을 잘 알고 있다(예를 들어, 문헌[Ferrari et al., 1989; Saunders et al., 1984; Hoch et al., 1967; Mann et al., 1986; Holubova, 1985; Chang et al., 1979; Vorobjeva et al., 1980; Smith et al., 1986; Fisher et. al., 1981; 및 McDonald, 1984]). 실제로, 원형질체 형질전환과 응축(congression)을 포함하는 형질전환, 형질도입, 및 원형질체 융합과 같은 방법이 알려져 있으며 본 발명에서 사용하기에 적합하다. 본 발명의 DNA 구성체를 숙주 세포에 도입하는 데 형질전환 방법이 특히 바람직하다.
일반적으로 사용되는 방법에 추가적으로, 일부 구현예에서, 숙주 세포는 직접 형질전환된다(즉, 숙주 세포에 도입되기 전에 DNA 구성체의 증폭 또는 다른 처리를 위해 중간 세포가 사용되지 않음). DNA 구성체를 숙주 세포에 도입하는 것은 DNA를 플라스미드 또는 벡터 내 삽입 없이 숙주 세포에 도입하기 위한, 당업계에 알려진 물리적 및 화학적 방법을 포함한다. 이러한 방법은 염화칼슘 침전, 전기천공, 네이키드 DNA, 리포솜 등을 포함하나 이에 한정되지 않는다. 추가 구현예에서, DNA 구성체는 플라스미드 내 삽입 없이 플라스미드와 공동으로 형질전환된다. 다른 구현예에서, 변형된 바실러스 균주로부터 선별 마커가 당업계에 알려진 방법에 의해 결실되거나 실질적으로 절단된다(예를 들어, 문헌[Stahl et al., 1984 및 Palmeros et al., 2000]). 일부 구현예에서, 숙주 염색체로부터 벡터를 분해하면 고유 염색체 영역이 제거되면서 염색체에 플랭킹 영역을 남긴다.
바실러스 세포에서 유전자, 이의 오픈 리딩 프레임(ORF), 및/또는 이의 변이체 서열의 발현에 사용하기 위한 프로모터 및 프로모터 서열 영역은 일반적으로 당업자에게 알려져 있다. 본 발명의 프로모터 서열은 일반적으로 바실러스 세포(예를 들어, B. 리체니포르미스 세포, B. 서브틸리스 세포 등)에서 기능하도록 선택된다. 특정 예시적인 바실러스 프로모터 서열은 표 6에 제시되어 있다. 마찬가지로, 바실러스 세포에서 유전자 발현을 유도하는 데 유용한 프로모터는 B. 서브틸리스 알칼리성 프로테아제(aprE) 프로모터(Stahl et al., 1984), B. 서브틸리스의 α-아밀라제 프로모터(Yang et al., 1983), B. 아밀로리퀘파시엔스의 α-아밀라제 프로모터(Tarkinen et al., 1983), B. 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(Yang et al., 1984), 돌연변이 aprE 프로모터(PCT 공개 WO2001/51643호), 또는 B 리체니포르미스 또는 기타 관련 바실러스로부터의 임의의 다른 프로모터를 포함하나 이에 한정되지 않는다. 다른 특정 구현예에서, 프로모터는 미국 특허 공개 2014/0329309호에 개시된 리보솜 단백질 프로모터 또는 리보솜 RNA 프로모터(예: rrnI 프로모터)이다. 바실러스 세포에서 다양한 활성(프로모터 강도)을 갖는 프로모터 라이브러리를 스크리닝하고 생성하는 방법은 PCT 공개 WO2003/089604호에 기재되어 있다.
IV. 관심 단백질의 생산을 위한
바실러스
세포의 배양
다른 구현예에서, 본 발명은 변형되지 않은 (모) 세포와 비교하여(즉, 이에 비해) 변형된 박테리아 세포의 단백질 생산성을 증가시키는 방법을 제공한다. 특정 구현예에서, 본 발명은 관심 단백질(POI)의 생산 방법으로서, 변형된 박테리아 세포를 발효/배양하는 단계를 포함하고, 변형된 세포는 POI를 배양 배지 내로 분비하는, 방법에 관한 것이다. 당업계에 잘 알려진 발효 방법을 적용하여 본 발명의 변형된 바실러스 세포 및 변형되지 않은 바실러스 세포를 발효시킬 수 있다.
일부 구현예에서, 세포는 회분식 또는 연속식 발효 조건하에 배양된다. 전형적인 회분식 발효는 배지의 조성이 발효 시작시 설정되어 발효 중에 변경되지 않는 폐쇄 시스템이다. 발효 시작시, 배지에 목적하는 유기체(들)를 접종한다. 이 방법에서는, 시스템에 어떤 구성요소도 첨가하지 않고 발효가 일어날 수 있다. 일반적으로, 회분식 발효는 탄소원의 추가와 관련하여 "회분식"으로 간주되며, pH 및 산소 농도와 같은 인자를 제어하려는 시도가 종종 이루어진다. 회분식 시스템의 대사산물 및 바이오매스의 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 일반적인 회분식 배양물 내에서, 세포는 정적 지체기를 거쳐 고성장 대수기로 진행하고, 최종적으로 성장 속도가 감소하거나 성장이 멈추는 정지기로 진행할 수 있다. 정지기의 세포는 처치되지 않으면 결국 사멸한다. 일반적으로, 대수기의 세포가 대부분의 제품 생산을 담당한다.
표준 회분식 시스템에 대한 적절한 변형은 "유가식 발효(fed-batch fermentation)" 시스템이다. 일반적인 회분식 시스템의 이러한 변형에서는, 발효가 진행됨에 따라 기질이 증분으로 추가된다. 유가식 시스템은 이화대사물 억제가 세포의 대사를 억제할 가능성이 있는 경우 및 배지에 제한된 양의 기질이 있는 것이 바람직한 경우에 유용하다. 유가식 시스템에서 실제 기질 농도는 측정이 어렵기 때문에, pH, 용존 산소량, 및 CO2와 같은 폐가스의 분압과 같은 측정가능한 인자의 변화에 기초하여 추정된다. 회분식 및 유가식 발효는 일반적이며 당업계에 알려져 있다.
연속식 발효는 규정 발효 배지가 생물 반응기에 연속적으로 첨가되고 동량의 조정된(conditioned) 배지가 프로세싱을 위해 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로, 세포가 주로 대수기 성장 중인 배양물을 일정한 고밀도로 유지한다. 연속식 발효는 세포 성장 및/또는 생성물 농도에 영향을 미치는 하나 이상의 인자의 조절이 가능하다. 예를 들어, 일 구현예에서, 탄소원 또는 질소원과 같은 제한 영양소가 고정 비율로 유지되고 다른 모든 파라미터는 조절될 수 있다. 다른 시스템에서, 배지 탁도에 의해 측정되는 세포 농도가 일정하게 유지되는 반면, 성장에 영향을 미치는 여러 인자는 계속 변경될 수 있다. 연속식 시스템은 정상 상태 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서의 세포 성장 속도와 균형을 이루어야 한다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 생성물 형성 속도를 최대화하는 기술은 산업 미생물학 분야에 잘 알려져 있다.
따라서, 특정 구현예에서, 형질전환된(변형된) 숙주 세포에 의해 생산된 POI는 원심분리 또는 여과에 의해 배지로부터 숙주 세포를 분리하는 것, 또는 필요한 경우 세포를 파괴하는 것, 및 세포 분획 및 잔사로부터 상청액을 제거하는 것을 포함하는 통상적인 절차에 의해 배양 배지로부터 회수할 수 있다. 일반적으로, 청징 후, 상청액 또는 여과액의 단백질 성분은 염(예: 황산암모늄)에 의해 침천된다. 침전된 단백질은 이후 가용화되고 다양한 크로마토그래피 절차, 예를 들어 이온 교환 크로마토그래피, 겔 여과에 의해 정제될 수 있다.
V.
변형된 (숙주) 세포에 의해 생산된 관심 단백질
본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 브리지를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이다. 즉, 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 또는 동일하지 않은(이종성) 서브유닛으로 구성되고, POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
예를 들어, 하기 실시예에 기재된 바와 같이, 본 발명의 변형된 바실러스 세포는 증가된 양의 내인성 및/또는 이종성 관심 단백질을 생산한다. 따라서, 특정 구현예에서, 본 발명의 변형된 세포는 내인성 POI, 이종성 POI, 또는 하나 이상의 이러한 POI의 조합을 발현한다. 예를 들어, 특정 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스 세포에 비해 증가된 양의 내인성 POI를 생산한다. 다른 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스 세포에 비해 증가된 양의 이종성 POI를 생산한다.
따라서, 특정 구현예에서, 본 발명의 변형된 바실러스(딸) 세포는 모체 바실러스(대조군) 세포에 비해 증가된 양의 POI를 생산하고, POI의 증가된 양은 적어도 약 0.01%의 증가, 적어도 약 0.10%의 증가, 적어도 약 0.50%의 증가, 적어도 약 1.0%의 증가, 적어도 약 2.0%의 증가, 적어도 약 3.0%의 증가, 적어도 약 4.0%의 증가, 적어도 약 5.0%의 증가, 또는 5.0% 초과의 증가이다. 특정 구현예에서, POI의 증가된 양은 효소 활성 분석 및/또는 이의 비생산성(Qp) 분석/정량화에 의해 결정된다. 마찬가지로, 당업자는 하나 이상의 관심 단백질의 발현 또는 생산의 검출, 분석, 측정 등을 위한 당업계에 알려진 다른 통상적인 방법 및 기술을 이용할 수 있다.
특정 구현예에서, 본 발명의 변형된 바실러스 세포는 (변형되지 않은) 모체 바실러스 세포에 비해 증가된 POI 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산을 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간(h)으로서, 생산 시간과 성장 시간이 포함된다.
따라서, 다른 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 변형되지 않은 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.
특정 구현예에서, POI 또는 이의 변이체 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나제, 아라비노푸라노시다제, 탄산무수화효소, 카복시펩티다제, 카탈라제, 셀룰라제, 키티나제, 키모신, 큐티나제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나제, 글루칸 라이사제, 엔도-β-글루카나제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 하이드롤라제, 인버타제, 이소머라제, 라카제, 리가제, 리파제, 리아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 해중합효소, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼하이드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 헥소스 옥시다제, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
따라서, 특정 구현예에서, POI 또는 이의 변이체 POI는 효소 위원회(EC) 번호 EC 1, EC 2, EC 3, EC 4, EC 5, 또는 EC 6으로부터 선택된 효소이다.
예를 들어, 특정 구현예에서, POI는 EC 1.10.3.2(예: 라카제), EC 1.10.3.3(예: L-아스코르브산 옥시다제), EC 1.1.1.1(예: 알코올 탈수소효소), EC 1.11.1.10(예: 클로라이드 퍼옥시다제), EC 1.11.1.17(예: 퍼옥시다제), EC 1.1.1.27(예: L-락테이트 탈수소효소), EC 1.1.1.47(예: 글루코스 1-탈수소효소), EC 1.1.3.X(예: 글루코스 옥시다제), EC 1.1.3.10(예: 피라노스 옥시다제), EC 1.13.11.X(예: 이산소화효소), EC 1.13.11.12(예: 리네올레이트 13S-리폭시게나제), EC 1.1.3.13(예: 알코올 옥시다제), EC 1.14.14.1(예: 일산소화효소), EC 1.14.18.1(예: 모노페놀 일산소화효소) EC 1.15.1.1(예: 수퍼옥사이드 디스무타제), EC 1.1.5.9 (이전 명칭 EC 1.1.99.10, 예: 글루코스 탈수소효소), EC 1.1.99.18(예: 셀로비오스 탈수소효소), EC 1.1.99.29(예: 피라노스 탈수소효소), EC 1.2.1.X(예: 지방산 환원효소), EC 1.2.1.10(예: 아세트알데히드 탈수소효소), EC 1.5.3.X(예: 프룩토실 아민 환원효소), EC 1.8.1.X(예: 디설파이드 환원효소), 및 EC 1.8.3.2(예: 티올 옥시다제)로부터 선택된 EC 1(옥시도리덕타제) 효소를 포함하는(이에 한정되지 않음) 옥시도리덕타제 효소이다.
특정 구현예에서, POI는 EC 2.3.2.13(예: 트랜스글루타미나제), EC 2.4.1.X(예: 헥소실트랜스퍼라제), EC 2.4.1.40(예: 알터나수크라제), EC 2.4.1.18(예: 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예: 시클로말토덱스트린 글루카노트랜스퍼라제), EC 2.4.1.2(예: 덱스트린 덱스트라나제), EC 2.4.1.20(예: 셀로비오스 포스포릴라제), EC 2.4.1.25(예: 4-알파-글루카노트랜스퍼라제), EC 2.4.1.333(예: 1,2-베타-올리고글루칸 포스포 트랜스퍼라제), EC 2.4.1.4(예: 아밀로수크라제), EC 2.4.1.5(예: 덱스트란수크라제), EC 2.4.1.69(예: 갈락토시드 2-알파-L-푸코실 트랜스퍼라제), EC 2.4.1.9(예: 이눌로수크라제), EC 2.7.1.17(예: 자일룰로키나제), EC 2.7.7.89 (이전 명칭 EC 3.1.4.15, 예: [글루타민 합성효소]-아데닐릴-L-티로신 포스포릴라제), EC 2.7.9.4(예: 알파 글루칸 키나제), 및 EC 2.7.9.5(예: 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라제) 효소를 포함하는(이에 한정되지 않음) 트랜스퍼라제 효소이다.
다른 구현예에서, POI는 EC 3.1.X.X(예: 에스테라제), EC 3.1.1.1(예: 펙티나제), EC 3.1.1.14(예: 클로로필라제), EC 3.1.1.20(예: 탄나제), EC 3.1.1.23(예: 글리세롤-에스테르 아실하이드롤라제), EC 3.1.1.26(예: 갈락토리파제), EC 3.1.1.32(예: 포스포리파제 A1), EC 3.1.1.4(예: 포스포리파제 A2), EC 3.1.1.6(예: 아세틸에스테라제), EC 3.1.1.72(예: 아세틸자일란 에스테라제), EC 3.1.1.73(예: 페룰로일 에스테라제), EC 3.1.1.74(예: 큐티나제), EC 3.1.1.86(예: 람노갈락투로난 아세틸에스테라제), EC 3.1.1.87(예: 푸모신 B1 에스테라제), EC 3.1.26.5(예: 리보뉴클레아제 P), EC 3.1.3.X(예: 인산 모노에스테르 하이드롤라제), EC 3.1.30.1(예: 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예: 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예: 알칼리성 포스파타제), EC 3.1.3.2(예: 산 포스파타제), EC 3.1.3.8(예: 3-피타제), EC 3.1.4.1(예: 포스포디에스테라제 I), EC 3.1.4.11(예: 포스포이노시티드 포스포리파제 C), EC 3.1.4.3(예: 포스포리파제 C), EC 3.1.4.4(예: 포스포리파제 D), EC 3.1.6.1(예: 아릴수파타제), EC 3.1.8.2(예: 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예: 올리고-1,6-글루코시다제), EC 3.2.1.101(예: 만난 엔도-1,6-알파-만노시다제), EC 3.2.1.11(예: 알파-1,6-글루칸-6-글루카노하이드롤라제), EC 3.2.1.131(예: 자일란 알파-1,2-글루쿠로노시다제), EC 3.2.1.132(예: 키토산 N-아세틸글루코사미노하이드롤라제), EC 3.2.1.139(예: 알파-글루쿠로니다제), EC 3.2.1.14(예: 키티나제), EC 3.2.1.151(예: 자일로글루칸-특이적 엔도-베타-1,4-글루카나제), EC 3.2.1.155(예: 자일로글루칸-특이적 엑소-베타-1,4-글루카나제), EC 3.2.1.164(예: 갈락탄 엔도-1,6-베타-갈락토시다제), EC 3.2.1.17(예: 리소자임), EC 3.2.1.171(예: 람노갈락투로난 하이드롤라제), EC 3.2.1.174(예: 람노갈락투로난 람노하이드롤라제), EC 3.2.1.2(예: 베타-아밀라제), EC 3.2.1.20(예: 알파-글루코시다제), EC 3.2.1.22(예: 알파-갈락토시다제), EC 3.2.1.25(예: 베타-만노시다제), EC 3.2.1.26(예: 베타-프룩토푸라노시다제), EC 3.2.1.37(예: 자일란 1,4-베타-자일로시다제), EC 3.2.1.39(예: 글루칸 엔도-1,3-베타-D-글루코시다제), EC 3.2.1.40(예: 알파-L-람노시다제), EC 3.2.1.51(예: 알파-L-푸코시다제), EC 3.2.1.52(예: 베타-N-아세틸헥소스아미니다제), EC 3.2.1.55(예: 알파-N-아라비노푸라노시다제), EC 3.2.1.58(예: 글루칸 1,3-베타-글루코시다제), EC 3.2.1.59(예: 글루칸 엔도-1,3-알파-글루코시다제), EC 3.2.1.67(예: 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예: 이소아밀라제), EC 3.2.1.7(예: 1-베타-D-프룩탄 프룩타노하이드롤라제), EC 3.2.1.74(예: 글루칸 1,4-β-글루코시다제), EC 3.2.1.75(예: 글루칸 엔도-1,6-베타-글루코시다제), EC 3.2.1.77(예: 만난 1,2-(1,3)-알파-만노시다제), EC 3.2.1.80(예: 프룩탄 베타-프룩토시다제), EC 3.2.1.82(예: 엑소-폴리-알파-갈락투로노시다제), EC 3.2.1.83(예: 카파-카라기나제), EC 3.2.1.89(예: 아라비노갈락탄 엔도-1,4-베타-갈락토시다제), EC 3.2.1.91(예: 셀룰로스 1,4-베타-셀룰로비오시다제), EC 3.2.1.96(예: 만노실-당단백질 엔도-베타-N-아세틸글루코사미니다제), EC 3.2.1.99(예: 아라비난 엔도-1,5-알파-L-아라비나나제), EC 3.4.X.X(예: 펩티다제), EC 3.4.11.X(예: 아미노펩티다제), EC 3.4.11.1(예: 류실 아미노펩티다제), EC 3.4.11.18(예: 메티오닐 아미노펩티다제), EC 3.4.13.9(예: Xaa-Pro 디펩티다제), EC 3.4.14.5(예: 디펩티딜-펩티다제 IV), EC 3.4.16.X(예: 세린-타입 카복시펩티다제), EC 3.4.16.5(예: 카복시펩티다제 C), EC 3.4.19.3(예: 피로글루타밀-펩티다제 I), EC 3.4.21.X(예: 세린 엔도펩티다제), EC 3.4.21.1(예: 키모트립신), EC 3.4.21.19(예: 글루타밀 엔도펩티다제), EC 3.4.21.26(예: 프로릴 올리고펩티다제), EC 3.4.21.4(예: 트립신), EC 3.4.21.5(예: 트롬빈), EC 3.4.21.63(예: 오리진), EC 3.4.21.65(예: 써모마이콜린), EC 3.4.21.80(예: 스트렙토그리신 A), EC 3.4.22.X(예: 시스테인 엔도펩티다제), EC 3.4.22.14(예: 악티니다인), EC 3.4.22.2(예: 파파인), EC 3.4.22.3(예: 피카인), EC 3.4.22.32(예: 줄기 브로멜라인), EC 3.4.22.33(예: 과일 브로멜라인), EC 3.4.22.6(예: 키모파파인), EC 3.4.23.1(예: 펩신 A), EC 3.4.23.2(예: 펩신 B), EC 3.4.23.22(예: 엔도티아펩신), EC 3.4.23.23(예: 무코펩신), EC 3.4.23.3(예: 가스트릭신), EC 3.4.24.X(예: 메탈로엔도펩티다제), EC 3.4.24.39(예: 듀테로리신), EC 3.4.24.40(예: 세랄리신), EC 3.5.1.1(예: 아스파라기나제), EC 3.5.1.11(예: 페니실린 아미다제), EC 3.5.1.14(예: N-아실-알리파트-L아미노산 아미도하이드롤라제), EC 3.5.1.2(예: L-글루타민 아미도하이드롤라제), EC 3.5.1.28(예: N-아세틸무라모일-L-알라닌 아미다제), EC 3.5.1.4(예: 아미다제), EC 3.5.1.44(예: 단백질-L-글루타민 아미도하이드롤라제), EC 3.5.1.5(예: 우레아제), EC 3.5.1.52(예: 펩티드-N(4)-(N-아세틸-베타-글루코사미닐)아스파라긴 아미다제), EC 3.5.1.81(예: N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예: AMP 데아미나제), 및 EC 3.5.5.1(예: 니트릴라제)로부터 선택되는 EC 3(하이드롤라제) 효소를 포함하는(이에 한정되지 않음) 하이드롤라제 효소이다.
다른 구현예에서, POI는 EC 4.1.2.10(예: 만델로니트릴 리아제), EC 4.1.3.3(예: N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예: 탄산탈수효소), EC 4.2.2.-(예: 람노갈락투로난 리아제), EC 4.2.2.10(예: 펙틴 리아제), EC 4.2.2.22(예: 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예: 람노갈락투로난 엔도리아제), 및 EC 4.2.2.3(예: 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는(이에 한정되지 않음) 리아제 효소이다.
다른 특정 구현예에서, POI는 EC 5.1.3.3(예: 알도스 1-에피머라제), EC 5.1.3.30(예: D-사이코스 3-에피머라제), EC 5.4.99.11(예: 이소말툴로스 신타제), 및 EC 5.4.99.15(예: (1→4)-α-D-글루칸 1-α-D-글로코실무타제)로부터 선택된 EC 5(이소머라제) 효소를 포함하는(이에 한정되지 않음) 이소머라제 효소이다.
또 다른 구현예에서, POI는 EC 6.2.1.12(예: 4-쿠마레이트:코엔자임 A 리가제) 및 EC 6.3.2.28(예: L-아미노산 알파-리가제)로부터 선택된 EC 6(리가제) 효소를 포함하는(이에 한정되지 않음) 리가제 효소이다.
따라서, 특정 구현예에서, 산업용 프로테아제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다. 마찬가지로, 다른 특정 구현예에서, 산업용 아밀라제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다.
예를 들어, 일반적으로 바실러스 종에 의해 분비되는 2가지 일반적인 유형의 프로테아제, 즉 중성(또는 "메탈로프로테아제") 및 알칼리성(또는 "세린") 프로테아제가 있다. 예를 들어, 바실러스 서브틸리신 단백질(효소)은 본 발명에 사용하기 위한 예시적인 세린 프로테아제이다. 서브틸리신 168, 서브틸리신 BPN', 서브틸리신 칼스버그, 서브틸리신 DY, 서브틸리신 147, 및 서브틸리신 309와 같은 매우 다양한 바실러스 서브틸리신이 확인되었고 시퀀싱되었다(예를 들어, WO 1989/06279 및 문헌[Stahl et al., 1984]). 본 발명의 일부 구현예에서, 변형된 바실러스 세포는 돌연변이(즉, 변이체) 프로테아제를 생산한다. PCT 공개 번호 WO1999/20770; WO1999/20726; WO1999/20769; WO1989/06279; US RE34,606; US Patent Nos. 4,914,031; 4,980,288; 5,208,158; 5,310,675; 5,336,611; 5,399,283; 5,441,882; 5,482,849; 5,631,217; 5,665,587; 5,700,676; 5,741 ,694; 5,858,757; 5,880,080; 6,197,567; 및 6,218,165와 같은 많은 참고문헌에서 변이체 프로테아제의 예를 제공한다. 따라서, 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 프로테아제를 암호화하는 발현 구성체를 포함한다.
다른 특정 구현예에서, 본 발명의 변형된 바실러스 세포는 아밀라제를 암호화하는 발현 구성체를 포함한다. 매우 다양한 아밀라제 효소 및 이의 변이체가 당업자에게 알려져 있다. 예를 들어, PCT 공개 번호 WO2006/037484 및 WO 2006/037483에는 용매 안정성이 개선된 변이체 α-아밀라제가 기재되어 있고, 공개 번호 WO1994/18314에는 산화 안정성 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1999/19467, WO2000/29560, 및 WO2000/60059에는 터마밀 유사 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO2008/112459에는 바실러스 종 707번으로부터 유래된 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1999/43794에는 말토겐 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO1990/11352에는 초내열성 α-아밀라제 변이체가 개시되어 있고, 공개 번호 WO2006/089107에는 과립 전분 가수분해 활성을 갖는 α-아밀라제 변이체가 개시되어 있다.
다른 구현예에서, 본 발명의 변형된 세포에서 발현되고 생산된 POI 또는 변이체 POI는 펩티드, 펩티드 호르몬, 성장 인자, 응고 인자, 케모카인, 사이토카인, 림포카인, 항체, 수용체, 부착 분자, 미생물 항원(예를 들어, HBV 표면 항원, HPV E7 등), 이들의 변이체, 이들의 단편 등이다. 다른 유형의 관심 단백질(또는 이의 변이체)은 식품 또는 작물에 영양가를 제공할 수 있는 것일 수 있다. 비제한적인 예는 항영양 인자의 형성을 억제할 수 있는 식물성 단백질, 및 더 바람직한 아미노산 조성(예를 들어, 비형질전환 식물보다 높은 라이신 함량)을 갖는 식물성 단백질을 포함한다.
세포내 및 세포외 발현 단백질의 활성을 검출하고 측정하기 위한 다양한 분석법이 당업자에 알려져 있다. 특히, 프로테아제의 경우, Folin 방법을 사용하여 280 nm에서의 흡광도 또는 비색법으로 측정되는 카제인 또는 헤모글로빈으로부터 산-가용성 펩티드의 방출에 기초한 분석법이 있다(예를 들어, 문헌[Bergmeyer et al., 1984]). 다른 분석법은 발색 기질의 가용화를 포함한다(예를 들어, 문헌[Ward, 1983] 참조). 다른 예시적인 분석법은 숙시닐-Ala-Ala-Pro-Phe-파라-니트로아닐리드 분석법(SAAPFpNA) 및 2,4,6-트리니트로벤젠 설포네이트 나트륨 염 분석법(TNBS 분석법)을 포함한다. 당업자에게 알려진 많은 추가 참고문헌은 적합한 방법을 제공한다(예를 들어, 문헌[Wells et al., 1983; Christianson et al., 1994; 및 Hsia et al., 1999] 참조).
국제 PCT 공개 WO2014/164777호에는 본원에 기재된 아밀라제 활성에 유용한 Ceralpha α-아밀라제 활성 분석법이 개시되어 있다.
숙주 세포 내 관심 단백질의 분비 수준의 결정 수단 및 발현된 단백질의 검출 수단은 단백질에 특이적인 다클론 또는 단클론 항체를 이용한 면역분석법의 사용을 포함한다. 예는 효소 결합 면역흡착 분석법(ELISA), 방사면역분석법(RIA), 형광 면역분석법(FIA), 및 형광 활성화 세포 분류법(FACS)을 포함한다.
VI.
예시적 구현예
본 발명의 비제한적 구현예는 다음을 포함하나 이에 한정되지 않는다.
1. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
2. 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서, (a) (i) POI를 암호화하는 발현 카세트 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 폴리뉴클레오티드를 도입함으로써, 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및 (b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고, 변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법.
3. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터 서열을 포함하는, 방법.
4. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 방법.
5. 구현예 1 또는 구현예 2에 있어서, 모세포는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는, 방법.
6. 구현예 5에 있어서, 내인성 prsA 유전자는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 방법.
7. 구현예 1 또는 구현예 2에 있어서, 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합되는, 방법.
8. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 추가로 포함하는, 방법.
9. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
10. 구현예 1 또는 구현예 2에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
11. 구현예 1 또는 구현예 2에 있어서, POI는 효소인, 방법.
12. 구현예 11에 있어서, 효소는 프로테아제 또는 아밀라제인, 방법.
13. 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
14. 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는 모체 B. 리체니포르미스로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
15. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함하는, 변형된 세포.
16. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 변형된 세포.
17. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 변형된 세포.
18. 구현예 13 또는 구현예 14에 있어서, 도입된 폴리뉴클레오티드는 변형된 B. 리체니포르미스 세포의 게놈에 통합되는, 변형된 세포.
19. 구현예 13 또는 구현예 14에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하는 변형된 세포.
20. 구현예 13 또는 구현예 14에 있어서, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
21. 구현예 13 또는 구현예 14에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
22. 구현예 13 또는 구현예 14에 있어서, 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 카세트를 포함하는 변형된 세포.
23. 구현예 22에 있어서, POI는 효소인, 변형된 세포.
24. 구현예 13 또는 구현예 14에 있어서, 모세포는 내인성 POI를 발현하는, 변형된 세포.
25. 구현예 22 또는 구현예 24의 변형된 세포에 의해 생산된 관심 단백질.
26. 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포로서, POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고; 천연 prsA 오픈 리딩 프레임(ORF) 서열에 작동가능하게 연결된 천연 prsA 프로모터 서열을 포함하는 도입된 폴리뉴클레오티드를 포함하고; 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하고; 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산하는 변형된 세포.
27. 구현예 26에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 추가로 포함하는 변형된 세포.
28. 모체 B. 리체니포르미스 세포에 비해 증가된 양의 관심 단백질(POI)을 생산하는 변형된 바실러스 리체니포르미스 세포로서, POI를 발현하는 모체 B. 리체니포르미스 세포로부터 유래되고; 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하고; 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자를 포함하고; 동일한 조건하에 발효될 때 모균주에 비해 증가된 양의 POI를 생산하는 변형된 세포.
29. 구현예 28에 있어서, 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는 변형된 세포.
30. 구현예 26 또는 구현예 28에 있어서, 천연 prsA 프로모터는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는, 변형된 세포.
31. 구현예 26 또는 구현예 28에 있어서, 천연 prsA ORF는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는, 변형된 세포.
32. 구현예 26 또는 구현예 28에 있어서, 천연 prsA 단백질은 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는, 변형된 세포.
33. 구현예 26 또는 구현예 28에 있어서, POI는 효소인, 변형된 세포.
34. 구현예 33에 있어서, 효소는 프로테아제 또는 아밀라제인, 변형된 세포.
35. 구현예 26 또는 구현예 28의 변형된 세포에 의해 생산된 관심 단백질.
실시예
본 발명의 특정 양태는 하기 실시예를 고려하여 추가로 이해될 수 있으며, 이는 제한적인 것으로 해석되어서는 안 된다. 재료 및 방법의 변형은 당업자에게 명백할 것이다.
실시예 1
RGHR2 경로 유전자를 표적화하는 CAS9 벡터의 구성
S. 피오게네스로부터의 Cas9 단백질(서열번호 1)을 N-말단 핵 국재화 서열(NLS; "APKKKRKV"; 서열번호 3), C-말단 NLS("KKKKLK"; 서열번호 4), deca-히스티딘 태그("HHHHHHHHHH"; 서열번호 5), B. 서브틸리스로부터의 aprE 프로모터(서열번호 6), 및 종결자 서열(서열번호 7)을 첨가하여 바실러스에 대해 코돈 최적화하고(서열번호 2), 아래 표 1에 기재된 정방향(서열번호 8) 및 역방향(서열번호 9) 프라이머 쌍을 이용해 제조사의 지침에 따라 Q5 DNA 중합효소(NEB)를 사용하여 증폭시켰다.
플라스미드 pKB320(서열번호 11)의 백본(서열번호 10)을 아래 표 2에 기재된 정방향(서열번호 12) 및 역방향(서열번호 13) 프라이머 쌍을 이용해 제조사의 지침에 따라 Q5 DNA 중합효소(NEB)를 사용하여 증폭시켰다.
제조사의 지침에 따라 Zymo clean and concentrate 5 컬럼을 사용하여 PCR 산물을 정제하였다. 이후, Q5 중합효소(NEB)로 2개의 단편을 등몰비로 혼합하며 연장된 중첩 확장 PCR(POE-PCR)을 사용하여 PCR 산물을 조립하였다. POE-PCR 반응을 다음과 같이 사이클링하였다: 30회 사이클에 대해 5초 동안 98℃, 10초 동안 64℃, 4분 15초 동안 72℃. 제조사의 지침에 따라 5 μl의 POE-PCR(DNA)을 Top10 E. coli (Invitrogen)로 형질전환시키고, 50 μg/ml의 카나마이신 설페이트를 함유하는 용원성(L) 배양액(Miller 레시피; 1%(w/v) 트립톤, 0.5% 효모 추출물(w/v), 1% NaCl(w/v)) 상에서 선택하고 1.5% 한천으로 고화시켰다. 콜로니를 37℃에서 18시간 동안 성장시켰다. 콜로니를 선별하고, 제조사의 지침에 따라 Qiaprep DNA miniprep 키트를 사용하여 플라스미드 DNA를 제조하고, 55 μl의 ddH2O에 용리시켰다. 정확한 조립을 검증하기 위해 아래 표 3에 기재된 시퀀싱 프라이머를 사용하여 플라스미드 DNA의 Sanger 시퀀싱을 수행하였다.
정확히 조립된 플라스미드, pRF694(서열번호 25)를 사용하여 하기 기재된 바와 같은 표적 부위 1(TS1; 서열번호 28) 및 표적 부위 2(TS2; 서열번호 29)에서 B. 리체니포르미스 게놈을 편집하기 위한 플라스미드 pRF801(서열번호 26) 및 pRF806(서열번호 27)을 구성하였다.
B. 리체니포르미스의 serA1 오픈 리딩 프레임(서열번호 30)은 고유한 표적 부위, 표적 부위 1(TS1; 서열번호 28)을 역방향으로 포함한다. 표적 부위는 프로토스페이서 인접 모티프(서열번호 31)에 역방향으로 인접해 있다. 표적 부위는 가변 표적화 도메인을 암호화하는 DNA(서열번호 32)로 전환될 수 있다.
VT 도메인을 암호화하는 DNA 서열(서열번호 32)은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 1을 표적화하는 기능적 gRNA(서열번호 34)를 생성하도록, Cas9 엔도뉴클레아제 인식 도메인을 암호화하는 DNA 서열(CER, 서열번호 33)에 작동가능하게 융합된다. gRNA를 암호화하는 DNA를, 바실러스 종 세포에서 작동가능한 프로모터(예를 들어, spac 프로모터; 서열번호 35) 및 바실러스 종 세포에서 작동가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열번호 36)에, gRNA를 암호화하는 DNA(서열번호 33)의 업스트림(5')에 프로모터가 위치하고 gRNA를 암호화하는 DNA(서열번호 33)의 다운스트림(3')에 종결자가 위치하도록, 작동가능하게 연결하였다.
Cas9/gRNA 절단에 반응하여 serA1 유전자를 결실시키는 편집 주형을 B. 리체니포르미스 게놈 DNA(gDNA)의 2개의 상동성 아암의 증폭을 통해 생성하였다. 제1 단편은 serA1 오픈 리딩 프레임의 바로 업스트림에 있는 500 bp에 해당한다(서열번호 37). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 4에 기재된 정방향(서열번호 38) 및 역방향(서열번호 39) 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에 상동성인 18 bp를 제1 단편의 3' 말단에 도입하고 pRF694에 상동성인 20 bp를 제1 단편의 5' 말단에 도입한다.
제2 단편은 serA1 오픈 리딩 프레임의 3' 말단의 바로 다운스트림에 있는 500 bp에 해당한다(서열번호 40). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 5에 기재된 정방향(서열번호 41) 및 역방향(서열번호 42) 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에 상동성인 28 bp를 제2 단편의 5' 말단에 도입하고 pRF694에 상동성인 21 bp를 제2 단편의 3' 말단에 도입한다.
Cas9 발현 카세트(서열번호 2), serA1 오픈 리딩 프레임 내 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 43), 및 제1 상동성 아암(서열번호 37)과 제2 상동성 아암(서열번호 40)으로 구성된 편집 주형(서열번호 44)을 함유하는 E. 콜라이-B. 리체니포르미스 셔틀 플라스미드, pRF801(서열번호 26)을 생성하는 표준 분자 생물학 기술을 사용하여, 표적 부위 1 gRNA을 암호화하는 DNA 발현 카세트(서열번호 43), 제1 상동성 아암(서열번호 37), 및 제2 상동성 아암(서열번호 40)을 pRF694(서열번호 25)로 조립하였다. 표 3에 기재된 올리고를 사용하여 Sanger 시퀀싱에 의해 플라스미드를 검증하였다.
B. 리체니포르미스의 rghR1 오픈 리딩 프레임(서열번호 45)은 역 가닥 상의 고유한 표적 부위, 표적 부위 2(TS2; 서열번호 29)를 함유한다. 표적 부위는 역 가당 상의 프로토스페이서 인접 모티프(서열번호 46)에 인접해 있다. 표적 부위(서열번호 29)를 암호화하는 DNA 서열은 박테리아 세포의 RNA 중합효소에 의해 전사될 때 표적 부위 2를 표적화하는 기능적 gRNA(서열번호 47)를 생성하도록, Cas9 엔도뉴클레아제 인식 도메인을 암호화하는 DNA 서열(CER, 서열번호 33)에 작동가능하게 융합된다. gRNA를 암호화하는 DNA를, 바실러스 종 세포에서 작동가능한 프로모터(예를 들어, B. 서브틸리스로부터의 spac 프로모터; 서열번호 35) 및 바실러스 종 세포에서 작동가능한 종결자(예를 들어, 파지 람다의 t0 종결자; 서열번호 36)에, gRNA를 암호화하는 DNA(서열번호 47)의 5'에 프로모터가 위치하고 gRNA를 암호화하는 DNA(서열번호 47)의 3'에 종결자가 위치하도록, 작동가능하게 연결하였다.
Cas9/gRNA 절단에 반응하여 rghR1 유전자를 변형시키는 편집 주형을 B. 리체니포르미스 게놈 DNA(gDNA)의 2개의 상동성 아암의 증폭을 통해 생성하였다. 제1 단편은 rghR1 오픈 리딩 프레임의 바로 업스트림에 있는 500 bp에 해당한다(서열번호 48). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 6에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제2 단편의 5' 말단에 상동성인 23 bp를 제1 단편의 3' 말단에 도입하고 pRF694에 상동성인 20 bp를 제1 단편의 5' 말단에 도입한다.
제2 단편은 rghR1 오픈 리딩 프레임의 3' 말단의 바로 다운스트림에 있는 500 bp에 해당한다(서열번호 51). 제조사의 지침에 따른 Q5 DNA 중합효소 및 아래 표 7에 기재된 프라이머를 사용하여 이 단편을 증폭시켰다. 프라이머는 제1 단편의 3' 말단에 상동성인 20 bp를 제2 단편의 5' 말단에 도입하고 pRF694에 상동성인 21 bp를 제2 단편의 3' 말단에 도입한다.
Cas9 발현 카세트(서열번호 2), rghR1 오픈 리딩 프레임 내 표적 부위 2를 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 54), 및 제1 상동성 아암(서열번호 48)과 제2 상동성 아암(서열번호 51)으로 구성된 편집 주형(서열번호 55)을 함유하는 E. 콜라이-B. 리체니포르미스 셔틀 플라스미드, pRF806(서열번호 27)을 생성하는 표준 분자 생물학 기술을 사용하여, 표적 부위 2 gRNA를 암호화하는 DNA 발현 카세트(서열번호 54), 제1 상동성 아암(서열번호 48), 및 제2 상동성 아암(서열번호 51)을 pRF694(서열번호 25)로 조립하였다. 표 3에 기재된 올리고를 사용하여 Sanger 서열로 플라스미드를 검증하였다.
실시예 2
CAS9 Y155H 변이체 및 관련 표적화 플라스미드의 구성
본 실시예에서는, pRF801(서열번호 26) 및 pRF806 플라스미드(서열번호 27)에서 S. 피오게네스 Cas9의 Y155H 변이체(서열번호 56)를 구성한다. pRF801 플라스미드(서열번호 26) 또는 pRF806 플라스미드(서열번호 27)에서 Y155H 변이체를 도입하기 위해, 주형 DNA로서 pRF801(서열번호 26) 또는 pRF806(서열번호 27)을 사용하고 제조사의 지침에 따른 Quikchange 돌연변이유발 키트 및 아래 표 8의 올리고를 사용하여 부위 지정 돌연변이유발을 수행하였다.
반응의 생성 산물인, pRF827(서열번호 59)은 Cas9 Y155H 변이체 발현 카세트(서열번호 60), serA1 오픈 리딩 프레임 내 표적 부위 1을 표적화하는 gRNA를 암호화하는 gRNA 발현 카세트(서열번호 43), 및 제1 상동성 아암(서열번호 37)과 제2 상동성 아암(서열번호 40)으로 구성된 편집 주형(서열번호 44)을 함유하거나, pRF856(서열번호 61)은 Cas9 Y155H 변이체 발현 카세트(서열번호 60), rghR1 오픈 리딩 프레임 내 표적 부위 2를 표적화하는 gRNA 발현 카세트(서열번호 54), 및 제1 상동성 아암(서열번호 48)과 제2 상동성 아암(서열번호 51)으로 구성된 편집 주형(서열번호 55)을 함유하였다. 정확한 조립을 검증하기 위해 표 3에 기재된 시퀀싱 프라이머를 사용하여 플라스미드 DNA의 Sanger 시퀀싱을 수행하였다.
플라스미드 pRF862의 구성
pRF827(서열번호 59)로부터 Y155H 치환을 함유하는 Cas9 오픈 리딩 프레임의 단편(서열번호 63)을 이동시켜 플라스미드 pRF862(서열번호 62)를 구성하고, 표 9에 기재된 프라이머를 사용하여 증폭시켰다.
상기 pRF827 단편(서열번호 63)에 포함된 단편을 제외한 전체 플라스미드를 포함하도록 pRF694(서열번호 25)로부터 제2 단편(서열번호 66)을 증폭시켰다. 이 단편은 조립을 위해 pRF827 단편(서열번호 60)의 5' 및 3' 말단과 상동성을 공유했고, 표 10에 기재된 프라이머를 사용하여 증폭되었다.
제조사의 지침에 따라 NEBuilder를 사용하여 2개의 단편을 조립하고 E. 콜라이 적격 세포로 형질전환시켰다. 표 3에 기재된 바와 같이 Sanger 방법에 의해 플라스미드 서열을 검증하였다. 서열 검증된 단리물은 플라스미드 pRF862(서열번호 62)로 저장되었다.
rghR2 ORF(서열번호 70)를 표적화하고 3개의 인-프레임 정지 코돈을 삽입하는 플라스미드, pRF869(서열번호 69)를 2개의 부분을 사용하여 구성하였다. rghR2 ORF(서열번호 70)를 변형하기 위한 편집 주형(서열번호 72), 및 rghR2 ORF(서열번호 70)를 표적화하는 gRNA 발현 카세트(서열번호 73)를 함유하는 제1 부분(서열번호 71)을 IDT에 의해 합성하고, 표 11에 기재된 프라이머를 사용하여 조립을 위해 증폭시켰다.
표 12에 기재된 프라이머를 사용하여 pRF862를 증폭시켜 합성 단편을 pRF862(서열번호 62)에 삽입하였다.
제조사의 지침에 따라 NEBuilder를 사용하여 2개의 부분을 조립하고 E. 콜라이로 형질전환시켰다. 표 3에 기재된 바와 같이 Sanger 방법에 의해 플라스미드 서열을 검증하였다. 서열 검증된 단리물은 pRF869(서열번호 69)로 저장되었다.
몇몇 추가 Cas9 플라스미드를 실시예 1 및 2에서 전술한 바와 같이 조립하였다. 이들 플라스미드는 표적 부위 서열 및 편집 주형 효과와 함께 표 13에 기재되어 있다.
모든 플라스미드에 대해, RCA(롤링-서클 증폭)를 사용하여 플라스미드를 증폭시키고, TruPrime RCA 키트(Sygnis)를 사용하여 형질전환에 적합한 기질로 만들었다.
실시예 3
변형된 숙주 균주의 구성
본 실시예에서는, 일련의 숙주 변형을 모체 B. 리체니포르미스 균주에 도입하였다. 모체 B. 리체니포르미스 균주는 serA1(서열번호 30) 및 lysA 유전자(서열번호 87)의 결실을 포함하며 BF140으로 명명된다.
스펙티노마이신 마커(서열번호 89), XylR 억제인자를 암호화하는 DNA(서열번호 90), 및 B. 리체니포르미스 ComK 단백질을 암호화하는 DNA(서열번호 92)에 작동가능하게 연결된 B. 서브틸리스의 xylA 프로모터(서열번호 91)를 함유하는 pBl.comK 플라스미드(서열번호 88)를 포함하는 BF140의 버전(문헌[Liu and Zuber, 1998, Hamoen et al., 1998])을 B. 리체니포르미스의 prsA 유전자의 제2 카피(서열번호 93)의 통합을 위해 catH 유전자좌를 표적화하는 선형 PCR 산물로 형질전환시켰다. 구성체는 catH 프로모터(서열번호 95)에 작동가능하게 연결된 catH 유전자좌에 대한 업스트림 상동성 아암(서열번호 94), B. 서브틸리스의 spoVG 종결자(서열번호 99)에 작동가능하게 연결된 catH 종결자(서열번호 98)로 구성된 이중 종결자(서열번호 97)에 작동가능하게 연결된 CatH 단백질을 암호화하는 DNA(서열번호 96)를 함유한다.
이어서, 구성체는 catH 유전자좌에 대한 다운스트림 상동성 아암(서열번호 103)에 작동가능하게 연결된 B. 리체니포르미스의 amyL 유전자의 종결자(서열번호 102)에 작동가능하게 연결된 prsA 암호화 서열(서열번호 101)에 작동가능하게 연결된 B. 리체니포르미스의 prsA 프로모터(서열번호 100)를 함유한다. 요컨대, BF140/pBl.comK 적격 세포가 생성되었다. BF140/pBl.comK 균주를 100 ppm의 스펙티노마이신을 함유하는 37℃의 L 배양액에서 250 RPM으로 진탕하면서 밤새 성장시켰다. 다음 날 배양물을 100 ppm의 스펙티노마이신을 함유하는 신선한 L 배양액(OD600=0.7)으로 희석하였다. 이 새로운 배양물을 37℃에서 250 RPM으로 진탕하면서 1시간 동안 성장시켰다. D-자일로스를 0.1% w·v-1로 첨가하였다. 배양물을 37℃에서 250 RPM으로 진탕하면서 추가로 4시간 동안 성장시켰다. 1700 g로 7분 동안 세포를 채취하였다. 10%v·v-1 DMSO를 함유하는 사용된 배양 배지의 1/4 부피에 세포를 재현탁시켰다. 100 μl의 세포를 10 μl의 catH::[catH prsAp-prsA] 통합 단편(서열번호 94)과 혼합하였다. 세포/DNA 혼합물을 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 이어서, 혼합물을 10 ppm의 클로람페니콜을 함유하는 L 한천 플레이트에 플레이팅하였다. 접종된 플레이트를 37℃에서 48시간 동안 인큐베이션하였다.
10 ppm의 클로람페니콜을 함유하는 L 한천에서 형성된 콜로니를 콜로니 PCR을 사용해 스크리닝하여 표 14에 기재된 프라이머 및 표준 PCR 기술을 사용해 catH 유전자좌의 변형을 확인하였다.
이 PCR 산물, 2676 bp 단편(서열번호 106)을 Sanger 방법 및 표 15에 기재된 프라이머를 사용하여 시퀀싱하였다.
정확한 catH::[catH prsAp-prsA] 통합(서열번호 93)이 있는 단리물은 균주 BF547로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF547의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pRF946(서열번호 81) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드 형질전환을 위한 선택을 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다. 플레이트를 37℃에서 48시간 동안 인큐베이션하였다.
20 ppm의 카나마이신을 함유하는 L 한천에서 형성된 콜로니를 콜로니 PCR에 대해 스크리닝하여, 표준 PCR 기술 및 표 14에 기재된 프라이머를 사용하여 catH::[prsAp-prsA] 카세트(서열번호 111)를 유지하면서, catH 프로모터의 3' 말단을 암호화하는 DNA 및 CatH 단백질을 암호화하는 DNA(서열번호 110)의 결실을 확인하였다.
2676 bp 길이의 PCR 산물(서열번호 106)을 생성한 catH::[catH prsAp-prsA] 카세트(서열번호 93)를 함유하는 모체 콜로니와 대조적으로, catH::[prsAp-prsA] 카세트(서열번호 111)를 함유하는 정확한 콜로니는 1990 bp의 PCR 산물(서열번호 112)을 생성하였다. 표준 겔 전기영동 기술을 사용하여 차이를 시각적으로 평가하였다. 정확한 크기의 PCR 산물이 있는 단리물을 상기 표 15의 프라이머 1915(서열번호 107) 및 프라이머 1916(서열번호 108)을 사용하여 시퀀싱하였다.
catH::[prsAp-prsA] 카세트(서열번호 111)를 함유한 서열 검증된 단리물은 클로람페니콜(10 ppm)에 표현형적으로 민감하였고 BF561로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF561의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pZM221(서열번호 84) 또는 pRF879(서열번호 78) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드로 형질전환된 세포를 선택하기 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pZM221(서열번호 84)로 형질전환된 세포의 경우, 표준 PCR 기술 및 표 16의 프라이머를 사용하여 ΔdltA-2 대립유전자(서열번호 86), dltA 암호화 서열의 700 bp의 결실에 대해 스크리닝하였다.
ΔdltA-2 대립유전자를 갖는 콜로니는 표 16의 프라이머를 사용하여 2067 bp의 PCR 산물(서열번호 115)을 생성하는 반면, 온전한 dltA 유전자를 함유하는 모세포는 2767 bp의 PCR 산물(서열번호 116)을 생성한다. 이는 표준 전기영동 기술을 사용하여 구별할 수 있다. dltA의 700 bp 내부 결실(서열번호 86)을 함유하는 콜로니는 BF598로 저장되었다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pRF879(서열번호 78)로 형질전환된 세포의 경우, 표준 PCR 기술 및 아래 표 17의 프라이머를 사용하여, ΔrghR2 대립유전자(서열번호 80), 처음 9 bp 및 마지막 9 bp를 제외한 rghR2 암호화 서열의 결실에 대해 스크리닝하였다.
ΔrghR2 대립유전자(서열번호 80)를 갖는 콜로니는 표 17의 프라이머를 사용하여 1523 bp의 PCR 산물(서열번호 119)을 생성하는 반면, 온전한 rghR2 유전자를 함유하는 모세포는 1922 bp의 PCR 산물(서열번호 120)을 생성한다. 이들 두 산물 간의 차이는 표준 전기영동 기술을 사용하여 구별할 수 있다. rghR2 유전자의 결실(서열번호 84)을 함유하는 콜로니는 BF602로 저장되었다.
pBl.comK 플라스미드(서열번호 88)를 함유하는 BF598의 버전을 전술한 바와 같이 적격으로 만들었다. 100 μl의 적격 세포를 5 μl의 pRF879(서열번호 78) RCA와 혼합하고, 37℃에서 1400 RPM으로 1.5시간 동안 인큐베이션하였다. 플라스미드로 형질전환된 세포를 선택하기 위해 혼합물을 20 ppm의 카나마이신을 함유하는 L 한천 플레이트에 플레이팅하였다.
20 ppm의 카나마이신을 함유하는 L 한천 플레이트에서 콜로니를 형성한 pRF879(서열번호 78)로 형질전환된 세포의 경우, 표준 PCR 기술 및 상기 표 17의 프라이머를 사용하여, ΔrghR2 대립유전자(서열번호 80), 처음 9 bp 및 마지막 9 bp를 제외한 rghR2 암호화 서열의 결실에 대해 스크리닝하였다.
ΔrghR2 대립유전자(서열번호 80)를 갖는 콜로니는 표 17의 프라이머를 사용하여 1523 bp의 PCR 산물(서열번호 119)을 생성하는 반면, 온전한 rghR2 유전자를 함유하는 모세포는 1922 bp의 PCR 산물(서열번호 120)을 생성한다. 이들 두 산물 간의 차이는 표준 전기영동 기술을 사용하여 구별할 수 있다. rghR2 유전자의 결실(서열번호 80)을 함유하는 콜로니는 BF613로 저장되었다. 표 18은 본 실시예에서 생성된 변형된 숙주 균주를 실시예의 3개의 변형된 유전자좌에 대한 서열번호와 함께 나타낸다.
실시예 4
변형된 숙주 균주에서 아밀라제 발현 균주의 구성
본 실시예에서는, 일련의 아밀라제 및 아밀라제 변이체 발현 카세트를 실시예 2, 상기 표 18에 기재된 균주 계통에 도입하였다.
아밀라제 1
아밀라제 1(서열번호 126)은 B. 리체니포르미스의 천연 알파 아밀라제로서, 일반적으로 AmyL이라고 한다. 아밀라제 1의 제1 카세트(서열번호 127)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 1을 암호화하는 DNA(서열번호 131)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 1의 제2 카세트(서열번호 132)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 1을 암호화하는 DNA(서열번호 131)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 2
아밀라제 2(서열번호 136)는 PCT 공개 WO2018/184004호(전체가 본원에 참조로 포함됨)에 기재된 변이체 바실러스 종 α-아밀라제이다. 아밀라제 2의 제1 카세트(서열번호 137)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 2를 암호화하는 DNA(서열번호 140)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 B. 서브틸리스 rrnI 프로모터(서열번호 138) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133) 또는 amyL 유전자좌(서열번호 142)에 통합된 아밀라제 2의 제2 카세트(서열번호 141)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 2를 암호화하는 DNA(서열번호 140)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 3
아밀라제 3(서열번호 143)은 변이체 사이토파가 종α-아밀라제이다(예를 들어, PCT 공개 WO2014/164777호; WO2012/164800호; 및 WO2014/16483호 참조, 각각은 전체가 본원에 참조로 포함됨). 아밀라제 3의 제1 카세트(서열번호 144)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 3을 암호화하는 DNA(서열번호 145)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 3의 제2 카세트(서열번호 146)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 3을 암호화하는 DNA(서열번호 145)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 변형된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 129)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 4
아밀라제 4(서열번호 147)는 변이체 사이토파가 종α-아밀라제이다(예를 들어, PCT 공개 WO2014/164777호; WO2012/164800호; 및 WO2014/16483호 참조, 각각은 전체가 본원에 참조로 포함됨). 아밀라제 4의 제1 카세트(서열번호 148)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 129)에 작동가능하게 연결된 아밀라제 4를 암호화하는 DNA(서열번호 149)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 4의 제2 카세트(서열번호 150)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 4를 암호화하는 DNA(서열번호 149)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
아밀라제 5
아밀라제 5(서열번호 151)는 변이체 바실러스 종 707 α-아밀라제이다(PCT 공개 WO2008/153805호 및 미국 특허 공개 US2014/0057324호 참조). 아밀라제 5의 제1 카세트(서열번호 152)는 serA1 유전자좌(서열번호 44)에 통합되었고, B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 5를 암호화하는 DNA(서열번호 153)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p3 프로모터(서열번호 128) 및 serA1 ORF(서열번호 30)를 함유한다. lysA 유전자좌(서열번호 133)에 통합된 아밀라제 5의 제2 카세트(서열번호 154)는 B. 리체니포르미스 amyL 전사 종결자(서열번호 102)에 작동가능하게 연결된 아밀라제 5를 암호화하는 DNA(서열번호 153)에 작동가능하게 연결된 B. 리체니포르미스 AmyL 신호 서열을 암호화하는 DNA(서열번호 130)에 작동가능하게 연결된 B. 서브틸리스 aprE 5' UTR을 암호화하는 DNA(서열번호 139)에 작동가능하게 연결된 합성 p2 프로모터(서열번호 135) 및 LysA를 암호화하는 DNA(서열번호 134)를 함유한다.
PCT 공개 WO2019/040412호(전체가 본원에 참조로 포함됨)에 기재된 방법을 사용하여 모든 아밀라제 발현 카세트를 변형된 숙주 균주로 형질전환시켰다.
실시예 5
아밀라제 생성에 대한 변형된 숙주 백그라운드의 영향
본 실시예에서는, 아밀라제 1 내지 5(실시예 4)에 대한 발현 카세트의 2개 카피를 함유하는 변형된 숙주 균주(즉, 표 19; BF140, BF561, BF598, BF602, 및 BF613)를 표준 소규모 또는 실험실 규모 발효 조건을 사용하여 α-아밀라제 생성에 대해 분석하였다(PCT 공개 WO2018/156705호 및 WO2019/055261호에 기재된 바와 같고, 각각은 본원에 참조로 포함됨). Bradford 또는 Ceralpha 분석법을 사용하여 알파-아밀라제 생성을 정량화했다. 아밀라제 생성의 상대적 개선은 하기 표 19에 제시된 동일한 α-아밀라제 발현 카세트를 포함하는 변형되지 않은 숙주와 비교된다.
따라서, 다양한 α-아밀라제 그룹에서 시험된 5가지 아밀라제 모두는 변형되지 않은 숙주 BF140과 비교하여, 결실된 dltA-2(ΔdltA-2) 대립유전자(서열번호 125), 결실된 rghR2 (ΔrghR2) 대립유전자(서열번호 80), 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)의 삽입을 포함하는 BF613 변형 백그라운드에서 α-아밀라제 생성의 개선을 보여준다.
아밀라제 2 및 아밀라제 3의 경우, 결실된 rghR2(ΔrghR2) 대립유전자(서열번호 80) 및 천연 prsA 프로모터에 의해 제어되는 천연 prsA 유전자의 제2 카피(서열번호 124)를 포함하는 BF602 변형 백그라운드에서 α-아밀라제 생성의 개선은 BF613 변형 숙주에서 관찰되는 개선과 거의 같은 정도로 우수하며, 이는 일부 아밀라제의 경우 개선이 이러한 2개의 대립유전자의 존재만을 필요로 할 뿐만 아니라 ΔdltA-2 대립유전자의 존재가 이러한 개선에 해롭지 않음을 시사한다.
참고문헌
PCT 공개 WO1989/06279호
PCT 공개 WO1990/11352호
PCT 공개 WO1994/18314호
PCT 공개 WO1999/19467호
PCT 공개 WO1999/20726호
PCT 공개 WO1999/20769호
PCT 공개 WO1999/20770호
PCT 공개 WO1999/43794호
PCT 공개 WO2000/29560호
PCT 공개 WO2000/60059호
PCT 공개 WO2001/51643호
PCT 공개 WO2002/14490호
PCT 공개 WO2003/083125호
PCT 공개 WO2003/089604호
PCT 공개 WO2006/037483호
PCT 공개 WO2006/037484호
PCT 공개 WO2006/089107호
PCT 공개 WO2008/112459호
PCT 공개 WO2014/164777호
PCT 공개 WO2019/040412호
PCT 공개 WO2018/156705호
PCT 공개 WO2019/055261호
U.S. 공개 US2014/0329309호
US 특허 4,914,031호
US 특허 4,980,288호
US 특허 5,208,158호
US 특허 5,310,675호
US 특허 5,336,611호
US 특허 5,399,283호
US 특허 5,441,882호
US 특허 5,482,849호
US 특허 5,665,587호
US 특허 5,700,676호
US 특허 5,741 ,694호
US 특허 5,858,757호
US 특허 5,880,080호
US 특허 6,197,567호
US 특허 6,218,165호
US RE34,606
<110> DANISCO US INC.
<120> COMPOSITIONS AND METHODS FOR ENHANCED PROTEIN PRODUCTION IN
BACILLUS LICHENIFORMIS
<130> NB41684-WO-PCT
<160> 158
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 4188
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 2
gtggccccaa aaaagaaacg caaggttatg gataaaaaat acagcattgg tctggatatc 60
ggaaccaaca gcgttgggtg ggcagtaata acagatgaat acaaagtgcc gtcaaaaaaa 120
tttaaggttc tggggaatac agatcgccac agcataaaaa agaatctgat tggggcattg 180
ctgtttgatt cgggtgagac agctgaggcc acgcgtctga aacgtacagc aagaagacgt 240
tacacacgtc gtaaaaatcg tatttgctac ttacaggaaa ttttttctaa cgaaatggcc 300
aaggtagatg atagtttctt ccatcgtctc gaagaatctt ttctggttga ggaagataaa 360
aaacacgaac gtcaccctat ctttggcaat atcgtggatg aagtggccta tcatgaaaaa 420
taccctacga tttatcatct tcgcaagaag ttggttgata gtacggacaa agcggatctg 480
cgtttaatct atcttgcgtt agcgcacatg atcaaatttc gtggtcattt cttaattgaa 540
ggtgatctga atcctgataa ctctgatgtg gacaaattgt ttatacaatt agtgcaaacc 600
tataatcagc tgttcgagga aaaccccatt aatgcctctg gagttgatgc caaagcgatt 660
ttaagcgcga gactttctaa gtcccggcgt ctggagaatc tgatcgccca gttaccaggg 720
gaaaagaaaa atggtctgtt tggtaatctg attgccctca gtctggggct taccccgaac 780
ttcaaatcca attttgacct ggctgaggac gcaaagctgc agctgagcaa agatacttat 840
gatgatgacc tcgacaatct gctcgcccag attggtgacc aatatgcgga tctgtttctg 900
gcagcgaaga atctttcgga tgctatcttg ctgtcggata ttctgcgtgt taataccgaa 960
atcaccaaag cgcctctgtc tgcaagtatg atcaagagat acgacgagca ccaccaggac 1020
ctgactcttc ttaaggcact ggtacgccaa cagcttccgg agaaatacaa agaaatattc 1080
ttcgaccagt ccaagaatgg ttacgcgggc tacatcgatg gtggtgcatc acaggaagag 1140
ttctataaat ttattaaacc aatccttgag aaaatggatg gcacggaaga gttacttgtt 1200
aaacttaacc gcgaagactt gcttagaaag caacgtacat tcgacaacgg ctccatccca 1260
caccagattc atttaggtga acttcacgcc atcttgcgca gacaagaaga tttctatccc 1320
ttcttaaaag acaatcggga gaaaatcgag aagatcctga cgttccgcat tccctattat 1380
gtcggtcccc tggcacgtgg taattctcgg tttgcctgga tgacgcgcaa aagtgaggaa 1440
accatcaccc cttggaactt tgaagaagtc gtggataaag gtgctagcgc gcagtctttt 1500
atagaaagaa tgacgaactt cgataaaaac ttgcccaacg aaaaagtcct gcccaagcac 1560
tctcttttat atgagtactt tactgtgtac aacgaactga ctaaagtgaa atacgttacg 1620
gaaggtatgc gcaaacctgc ctttcttagt ggcgagcaga aaaaagcaat tgtcgatctt 1680
ctctttaaaa cgaatcgcaa ggtaactgta aaacagctga aggaagatta tttcaaaaag 1740
atcgaatgct ttgattctgt cgagatctcg ggtgtcgaag atcgtttcaa cgcttcctta 1800
gggacctatc atgatttgct gaagataata aaagacaaag actttctcga caatgaagaa 1860
aatgaagata ttctggagga tattgttttg accttgacct tattcgaaga tagagagatg 1920
atcgaggagc gcttaaaaac ctatgcccac ctgtttgatg acaaagtcat gaagcaatta 1980
aagcgccgca gatatacggg gtggggccgc ttgagccgca agttgattaa cggtattaga 2040
gacaagcaga gcggaaaaac tatcctggat ttcctcaaat ctgacggatt tgcgaaccgc 2100
aattttatgc agcttataca tgatgattcg cttacattca aagaggatat tcagaaggct 2160
caggtgtctg ggcaaggtga ttcactccac gaacatatag caaatttggc cggctctcct 2220
gcgattaaga aggggatcct gcaaacagtt aaagttgtgg atgaacttgt aaaagtaatg 2280
ggccgccaca agccggagaa tatcgtgata gaaatggcgc gcgagaatca aacgacacaa 2340
aaaggtcaaa agaactcaag agagagaatg aagcgcattg aggaggggat aaaggaactt 2400
ggatctcaaa ttctgaaaga acatccagtt gaaaacactc agctgcaaaa tgaaaaattg 2460
tacctgtact acctgcagaa tggaagagac atgtacgtgg atcaggaatt ggatatcaat 2520
agactctcgg actatgacgt agatcacatt gtccctcaga gcttcctcaa ggatgattct 2580
atagataata aagtacttac gagatcggac aaaaatcgcg gtaaatcgga taacgtccca 2640
tcggaggaag tcgttaaaaa gatgaaaaac tattggcgtc aactgctgaa cgccaagctg 2700
atcacacagc gtaagtttga taatctgact aaagccgaac gcggtggtct tagtgaactc 2760
gataaagcag gatttataaa acggcagtta gtagaaacgc gccaaattac gaaacacgtg 2820
gctcagatcc tcgattctag aatgaataca aagtacgatg aaaacgataa actgatccgt 2880
gaagtaaaag tcattacctt aaaatctaaa cttgtgtccg atttccgcaa agattttcag 2940
ttttacaagg tccgggaaat caataactat caccatgcac atgatgcata tttaaatgcg 3000
gttgtaggca cggcccttat taagaaatac cctaaactcg aaagtgagtt tgtttatggg 3060
gattataaag tgtatgacgt tcgcaaaatg atcgcgaaat cagaacagga aatcggtaag 3120
gctaccgcta aatacttttt ttattccaac attatgaatt tttttaagac cgaaataact 3180
ctcgcgaatg gtgaaatccg taaacggcct cttatagaaa ccaatggtga aacgggagaa 3240
atcgtttggg ataaaggtcg tgactttgcc accgttcgta aagtcctctc aatgccgcaa 3300
gttaacattg tcaagaagac ggaagttcaa acagggggat tctccaaaga atctatcctg 3360
ccgaagcgta acagtgataa acttattgcc agaaaaaaag attgggatcc aaaaaaatac 3420
ggaggctttg attcccctac cgtcgcgtat agtgtgctgg tggttgctaa agtcgagaaa 3480
gggaaaagca agaaattgaa atcagttaaa gaactgctgg gtattacaat tatggaaaga 3540
tcgtcctttg agaaaaatcc gatcgacttt ttagaggcca aggggtataa ggaagtgaaa 3600
aaagatctca tcatcaaatt accgaagtat agtctttttg agctggaaaa cggcagaaaa 3660
agaatgctgg cctccgcggg cgagttacag aagggaaatg agctggcgct gccttccaaa 3720
tatgttaatt ttctgtacct tgccagtcat tatgagaaac tgaagggcag ccccgaagat 3780
aacgaacaga aacaattatt cgtggaacag cataagcact atttagatga aattatagag 3840
caaattagtg aattttctaa gcgcgttatc ctcgcggatg ctaatttaga caaagtactg 3900
tcagcttata ataaacatcg ggataagccg attagagaac aggccgaaaa tatcattcat 3960
ttgtttacct taaccaacct tggagcacca gctgccttca aatatttcga taccacaatt 4020
gatcgtaaac ggtatacaag tacaaaagaa gtcttggacg caaccctcat tcatcaatct 4080
attactggat tatatgagac acgcattgat ctttcacagc tgggcggaga caagaagaaa 4140
aaactgaaac tgcaccatca tcaccatcat catcaccatc attgataa 4188
<210> 3
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 3
Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 4
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 4
Lys Lys Lys Lys Leu Lys
1 5
<210> 5
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 5
His His His His His His His His His His
1 5 10
<210> 6
<211> 607
<212> DNA
<213> Bacillus subtilis
<400> 6
attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60
aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120
aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180
cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240
atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300
cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360
taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420
ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480
aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540
aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600
gtaacta 607
<210> 7
<211> 247
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 7
acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct ccgcatgttc 60
aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa acggcgggtt 120
gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg cttcccggtt 180
tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg agacggcatt 240
cgtaatc 247
<210> 8
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 8
atatatgagt aaacttggtc tgacagaatt cctccatttt cttctgctat 50
<210> 9
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 9
tgcggccgcg aattcgatta cgaatgccgt ctccc 35
<210> 10
<211> 3290
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 10
gaattcgcgg ccgcacgcgt ccatggggat ccccgcgggt cgacctcgag agttacgcta 60
gggataacag ggtaatatag gagctccagt cggcttaaac cagttttcgc tggtgcgaaa 120
aaagagtgtc ttgtgacacc taaattcaaa atctatcggt cagatttata ccgatttgat 180
tttatatatt cttgaataac atacgccgag ttatcacata aaagcgggaa ccaatcataa 240
aatttaaact tcattgcata atccattaaa ctcttaaatt ctacgattcc ttgttcatca 300
ataaactcaa tcatttcttt aattaattta tatctatctg ttgttgtttt ctttaataat 360
tcattaacat ctacaccgcc ataaactatc atatcttctt tttgatattt aaatttatta 420
ggatcgtcca tgtgaagcat atatctcaca agacctttca cacttcctgc aatctgcgga 480
atagtcgcat tcaattcttc tgttaattat ttttatctgt tcataagatt tattaccctc 540
atacatcact agaatatgat aatgctcttt tttcatccta ccttctgtat cagtatccct 600
atcatgtaat ggagacacta caaattgaat gtgtaactct tttaaatact ctaaccactc 660
ggcttttgct gattctggat ataaaacaaa tgtccaatta cgtcctcttg aatttttctt 720
gttttcagtt tcttttatta cattttcgct catgatataa taacggtgct aatacactta 780
acaaaattta gtcatagata ggcagcatgc cagtgctgtc tatctttttt tgtttaaaat 840
gcaccgtatt cctcctttgc atattttttt attagaatac cggttgcatc tgatttgcta 900
atattatatt tttctttgat tctatttaat atctcatttt cttctgttgt aagtcttaaa 960
gtaacagcaa cttttttctc ttcttttcta tctacaacta tcactgtacc tcccaacatc 1020
tgtttttttc actttaacat aaaaaacaac cttttaacat taaaaaccca atatttattt 1080
atttgtttgg acaatggaca ctggacacct aggggggagg tcgtagtacc cccctatgtt 1140
ttctccccta aataacccca aaaatctaag aaaaaaagac ctcaaaaagg tctttaatta 1200
acatctcaaa tttcgcattt attccaattt cctttttgcg tgtgatgcga gctcatcggc 1260
tccgtcgata ctatgttata cgccaacttt caaaacaact ttgaaaaagc tgttttctgg 1320
tatttaaggt tttagaatgc aaggaacagt gaattggagt tcgtcttgtt ataattagct 1380
tcttggggta tctttaaata ctgtagaaaa gaggaaggaa ataataaatg gctaaaatga 1440
gaatatcacc ggaattgaaa aaactgatcg aaaaataccg ctgcgtaaaa gatacggaag 1500
gaatgtctcc tgctaaggta tataagctgg tgggagaaaa tgaaaaccta tatttaaaaa 1560
tgacggacag ccggtataaa gggaccacct atgatgtgga acgggaaaag gacatgatgc 1620
tatggctgga aggaaagctg cctgttccaa aggtcctgca ctttgaacgg catgatggct 1680
ggagcaatct gctcatgagt gaggccgatg gcgtcctttg ctcggaagag tatgaagatg 1740
aacaaagccc tgaaaagatt atcgagctgt atgcggagtg catcaggctc tttcactcca 1800
tcgacatatc ggattgtccc tatacgaata gcttagacag ccgcttagcc gaattggatt 1860
acttactgaa taacgatctg gccgatgtgg attgcgaaaa ctgggaagaa gacactccat 1920
ttaaagatcc gcgcgagctg tatgattttt taaagacgga aaagcccgaa gaggaacttg 1980
tcttttccca cggcgacctg ggagacagca acatctttgt gaaagatggc aaagtaagtg 2040
gctttattga tcttgggaga agcggcaggg cggacaagtg gtatgacatt gccttctgcg 2100
tccggtcgat cagggaggat atcggggaag aacagtatgt cgagctattt tttgacttac 2160
tggggatcaa gcctgattgg gagaaaataa aatattatat tttactggat gaattgtttt 2220
agtgactgca gtgagatctg gtaatgactc tctagcttga ggcatcaaat aaaacgaaag 2280
gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 2340
agtaggacaa atccgccgct ctagctaagc agaaggccat cctgacggat ggcctttttg 2400
cgtttctaca aactcttgtt aactctagag ctgcctgccg cgtttcggtg atgaagatct 2460
tcccgatgat taattaattc agaacgctcg gttgccgccg ggcgtttttt atgaagcttc 2520
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2580
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2640
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2700
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2760
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2820
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2880
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 2940
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 3000
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3060
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3120
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3180
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3240
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3290
<210> 11
<211> 4204
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 11
gcggccgcac gcgtccatgg ggatccccgc gggtcgacct cgagagttac gctagggata 60
acagggtaat ataggagctc cagtcggctt aaaccagttt tcgctggtgc gaaaaaagag 120
tgtcttgtga cacctaaatt caaaatctat cggtcagatt tataccgatt tgattttata 180
tattcttgaa taacatacgc cgagttatca cataaaagcg ggaaccaatc ataaaattta 240
aacttcattg cataatccat taaactctta aattctacga ttccttgttc atcaataaac 300
tcaatcattt ctttaattaa tttatatcta tctgttgttg ttttctttaa taattcatta 360
acatctacac cgccataaac tatcatatct tctttttgat atttaaattt attaggatcg 420
tccatgtgaa gcatatatct cacaagacct ttcacacttc ctgcaatctg cggaatagtc 480
gcattcaatt cttctgttaa ttatttttat ctgttcataa gatttattac cctcatacat 540
cactagaata tgataatgct cttttttcat cctaccttct gtatcagtat ccctatcatg 600
taatggagac actacaaatt gaatgtgtaa ctcttttaaa tactctaacc actcggcttt 660
tgctgattct ggatataaaa caaatgtcca attacgtcct cttgaatttt tcttgttttc 720
agtttctttt attacatttt cgctcatgat ataataacgg tgctaataca cttaacaaaa 780
tttagtcata gataggcagc atgccagtgc tgtctatctt tttttgttta aaatgcaccg 840
tattcctcct ttgcatattt ttttattaga ataccggttg catctgattt gctaatatta 900
tatttttctt tgattctatt taatatctca ttttcttctg ttgtaagtct taaagtaaca 960
gcaacttttt tctcttcttt tctatctaca actatcactg tacctcccaa catctgtttt 1020
tttcacttta acataaaaaa caacctttta acattaaaaa cccaatattt atttatttgt 1080
ttggacaatg gacactggac acctaggggg gaggtcgtag taccccccta tgttttctcc 1140
cctaaataac cccaaaaatc taagaaaaaa agacctcaaa aaggtcttta attaacatct 1200
caaatttcgc atttattcca atttcctttt tgcgtgtgat gcgagctcat cggctccgtc 1260
gatactatgt tatacgccaa ctttcaaaac aactttgaaa aagctgtttt ctggtattta 1320
aggttttaga atgcaaggaa cagtgaattg gagttcgtct tgttataatt agcttcttgg 1380
ggtatcttta aatactgtag aaaagaggaa ggaaataata aatggctaaa atgagaatat 1440
caccggaatt gaaaaaactg atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt 1500
ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa cctatattta aaaatgacgg 1560
acagccggta taaagggacc acctatgatg tggaacggga aaaggacatg atgctatggc 1620
tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga acggcatgat ggctggagca 1680
atctgctcat gagtgaggcc gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa 1740
gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag gctctttcac tccatcgaca 1800
tatcggattg tccctatacg aatagcttag acagccgctt agccgaattg gattacttac 1860
tgaataacga tctggccgat gtggattgcg aaaactggga agaagacact ccatttaaag 1920
atccgcgcga gctgtatgat tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt 1980
cccacggcga cctgggagac agcaacatct ttgtgaaaga tggcaaagta agtggcttta 2040
ttgatcttgg gagaagcggc agggcggaca agtggtatga cattgccttc tgcgtccggt 2100
cgatcaggga ggatatcggg gaagaacagt atgtcgagct attttttgac ttactgggga 2160
tcaagcctga ttgggagaaa ataaaatatt atattttact ggatgaattg ttttagtgac 2220
tgcagtgaga tctggtaatg actctctagc ttgaggcatc aaataaaacg aaaggctcag 2280
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2340
acaaatccgc cgctctagct aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 2400
tacaaactct tgttaactct agagctgcct gccgcgtttc ggtgatgaag atcttcccga 2460
tgattaatta attcagaacg ctcggttgcc gccgggcgtt ttttatgaag cttcgttgct 2520
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2580
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2640
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2700
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2760
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2820
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2880
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2940
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3000
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3060
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3120
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3180
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 3240
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 3300
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 3360
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 3420
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 3480
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 3540
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 3600
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 3660
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 3720
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 3780
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 3840
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 3900
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 3960
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 4020
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 4080
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 4140
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgga 4200
attc 4204
<210> 12
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 12
gggagacggc attcgtaatc gaattcgcgg ccgca 35
<210> 13
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 13
atagcagaag aaaatggagg aattctgtca gaccaagttt actcatatat 50
<210> 14
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 14
ccgactggag ctcctatatt acc 23
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 15
gctgtggcga tctgtattcc 20
<210> 16
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 16
gtcttttaag taagtctact ct 22
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 17
ccaaagcgat tttaagcgcg 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 18
cctggcacgt ggtaattctc 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 19
ggatttcctc aaatctgacg 20
<210> 20
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 20
gtagaaacgc gccaaattac g 21
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 21
gctggtggtt gctaaagtcg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 22
ggacgcaacc ctcattcatc 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 23
caggcatccg atttgcaagg 20
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 24
gcaagcagca gattacgcg 19
<210> 25
<211> 8347
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 25
gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60
tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120
taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180
ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240
gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300
agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360
tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420
tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480
ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540
acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600
gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660
ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720
tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780
ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840
agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900
gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960
gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020
catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080
gcggatctgc gtttaatcta tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140
ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200
gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260
aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320
ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380
accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440
gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500
ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560
aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620
caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680
gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740
caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800
ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860
tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920
ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980
ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040
agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100
cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160
cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220
tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280
gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340
ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400
gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460
aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520
agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580
aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640
ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700
gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760
cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820
ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880
aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940
acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000
aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060
gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120
gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180
gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240
aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300
gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360
agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420
aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480
ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540
gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600
ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660
gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720
atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780
gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840
acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900
atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960
tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020
aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080
gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140
atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200
gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260
ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320
ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380
cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440
attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500
aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560
atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620
accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680
catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740
aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800
gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040
agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 5220
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 5280
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 5340
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 5400
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 5460
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 5520
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 5580
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 5640
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 5700
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 5760
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 5820
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 5880
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 5940
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 6000
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 6060
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 6120
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 6180
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 6240
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 6300
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 6360
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 6420
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 6480
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 6540
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 6600
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 6660
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 6720
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 6780
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 6840
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 6900
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 6960
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 7020
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 7080
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 7140
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 7200
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 7260
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 7320
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 7380
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 7440
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 7500
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 7560
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 8040
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340
tctgaca 8347
<210> 26
<211> 9724
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 26
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720
gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780
ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840
taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900
ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960
aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020
actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080
tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140
tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200
caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260
ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320
gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380
atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440
gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500
aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560
gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620
tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 27
<211> 9724
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 27
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720
atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780
tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840
actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900
tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960
caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020
ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080
ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140
ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200
ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260
tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320
tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380
aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440
agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500
cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560
tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620
ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatctatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 28
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 28
ctcgacttcg aatacatcca 20
<210> 29
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 29
gatgccatca gttcctcata 20
<210> 30
<211> 1578
<212> DNA
<213> Bacillus licheniformis
<400> 30
atgtttcgag tattggtctc agataaaatg tccagcgacg gcctcaaacc attaatggaa 60
gcagatttta ttgaaattgt agaaaagaat gttgcggaag cggaagacga gcttcatacg 120
tttgacgcgc tcttggtgcg gagcgccacg aaggtaaccg aagagctgtt taaaaagatg 180
acttcgctga aaatcgtcgc cagagcaggt gtcggcgtcg acaatatcga tattgacgag 240
gcgacaaaac acggtgttat cgtcgtaaac gcgccaaacg ggaatacaat ttcaaccgct 300
gaacatacct ttgcaatgtt ttcagcgtta atgagacata ttccgcaggc aaacatctcc 360
gtgaaatcaa gggagtggaa tcgttcggct tacgtcggtt cagagcttta cggaaaaacg 420
ctcggcatca tcggaatggg ccgcatcgga agcgaaatcg cgagccgcgc aaaagcattc 480
ggtatgaccg ttcatgtatt tgacccgttc ctgacccaag aaagggcaag caagctcggc 540
gttaacgcga acagctttga agaagttctg gcatgcgccg acatcattac ggttcatacc 600
ccgctcacga aagaaacgaa gggacttttg aacaaagaaa ccatcgcaaa aacgaaaaaa 660
ggcgttcgtc tcgttaactg tgcaagaggc ggcatcatcg atgaagcagc gcttttggaa 720
gctctggaaa gcggacatgt cgctggcgct gccttggatg tattcgaagt cgagcctccg 780
gtcgattcaa aactgatcga tcatccgctt gtagtcgcga ctcctcactt gggcgcctca 840
acaaaagaag cccagctgaa tgtcgctgca caagtgtccg aagaagtcct tcagtatgcg 900
caaggaaacc ctgtgatgtc cgcgatcaac cttccggcca tgacaaagga ttcattcgaa 960
aaaatccagc cttatcatca gtttgccaat acgatcggaa accttgtgtc tcagtgcatg 1020
aatgagcctg ttcaagatgt agccatccaa tatgaaggct ccatcgccaa acttgaaacg 1080
tcatttatta cgaaaagcct tttggccgga tttctgaagc cgagggtcgc ggctaccgtt 1140
aacgaagtga atgccggcac cgttgcgaaa gagcgcggca tcagcttcag cgaaaaaatt 1200
tcttccaatg agtcaggcta tgaaaactgc atctctgtga ctgtcacggg agatgtaaca 1260
acattctctt taagagcgac gtacattccg cacttcggcg gacgcatcgt tgccttaaac 1320
ggctttgata ttgattttta tccggctgga caccttgtct acattcacca ccaggataaa 1380
ccaggggcta tcggccatgt cggacgaatt ttaggagacc atgacatcaa tatcgccact 1440
atgcaggtag gccgaaaaga aaaaggcgga gaagcgatca tgatgctttc ctttgaccgc 1500
caccttgagg acgatatttt agctgagctg aaaaacatcc cggatatcgt gtctgttaaa 1560
gccatcgacc ttccttaa 1578
<210> 31
<211> 3
<212> DNA
<213> Bacillus licheniformis
<400> 31
agg 3
<210> 32
<211> 20
<212> DNA
<213> Bacillus licheniformis
<400> 32
ctcgacttcg aatacatcca 20
<210> 33
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 33
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 34
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 34
cucgacuucg aauacaucca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 35
<211> 224
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 35
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tgga 224
<210> 36
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 36
gactcctgtt gatagatcca gtaatgacct cagaactcca tctggatttg ttcagaacgc 60
tcggttgccg ccgggcgttt tttattggtg agaat 95
<210> 37
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 37
aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60
tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120
ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180
gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240
gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300
aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360
ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420
gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480
tatttaggag gaaatcttac 500
<210> 38
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 38
tgagtaaact tggtctgaca aatggttctt tcccctgtcc 40
<210> 39
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 39
aggttccgca gcttctgtgt aagatttcct cctaaataag cgtcat 46
<210> 40
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 40
acagaagctg cggaacctga aaagaattcc tttcaggttc cgtttttttt aggaattctc 60
cctgatctca agcatctggc ggggataaat ccgctctcct ttcaaatcgt tccattcttt 120
gaggcgctgt acagttacgc ccattttttc ggcgatatga tgaagcgtat cccctttccg 180
cactacatat gtaccggtct tcgattcatc gtcatgaagg cggagtgttt ggccggcctt 240
gagatttgaa tgtttcaacc cgtttattct catgatctcc tcgatggata taccgctatc 300
cttgctgatt ctccagagcg tgtccccttt ttgaacggtc accgcaccgc tcattgtccc 360
ggcgttttga taaacgtgga tagaattttg ccggaacgcc tcctcacgaa gcaccgtcag 420
cggattgatt gcatatcttt tatcttcagt ccatgaaccg tgatgcattt caaaatgcag 480
gtgggttccg gtcgatattc 500
<210> 41
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 41
atgacgctta tttaggagga aatcttacac agaagctgcg gaacct 46
<210> 42
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 42
cagaagaaaa tggaggaatt cgaatatcga ccggaaccca c 41
<210> 43
<211> 415
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 43
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415
<210> 44
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 44
aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60
tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120
ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180
gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240
gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300
aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360
ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420
gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480
tatttaggag gaaatcttac acagaagctg cggaacctga aaagaattcc tttcaggttc 540
cgtttttttt aggaattctc cctgatctca agcatctggc ggggataaat ccgctctcct 600
ttcaaatcgt tccattcttt gaggcgctgt acagttacgc ccattttttc ggcgatatga 660
tgaagcgtat cccctttccg cactacatat gtaccggtct tcgattcatc gtcatgaagg 720
cggagtgttt ggccggcctt gagatttgaa tgtttcaacc cgtttattct catgatctcc 780
tcgatggata taccgctatc cttgctgatt ctccagagcg tgtccccttt ttgaacggtc 840
accgcaccgc tcattgtccc ggcgttttga taaacgtgga tagaattttg ccggaacgcc 900
tcctcacgaa gcaccgtcag cggattgatt gcatatcttt tatcttcagt ccatgaaccg 960
tgatgcattt caaaatgcag gtgggttccg gtcgatattc 1000
<210> 45
<211> 402
<212> DNA
<213> Bacillus licheniformis
<400> 45
atgacgaact ttggacacca tttacgacaa ttaagggaac ggaaaaaact gaccgtcaat 60
caactggcga tgtattccgg cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag 120
cgcggcgtgc cgaagccggc gacgatcaga aaactggcgg acgctttgaa agtcccgtat 180
gaggaactga tggcatctgc aggctatatc agcgcgtcta cagtccagga agcaagaagc 240
agctatgatt ccatttacga catcgtgtca cagtacgatt tagaggacct ttctctgttt 300
gacagcgaaa agtggaaggt gctttcaaaa aaagacatcg aaaacctgga caaatatttc 360
gactttctcg tgcaggaagc aagcagccga aacaaaaact ga 402
<210> 46
<211> 3
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 46
cgg 3
<210> 47
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 47
gaugccauca guuccucaua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 48
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 48
ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60
ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120
acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180
catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240
cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300
gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360
taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420
tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480
gagattgcga ggttttggcc 500
<210> 49
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 49
tgagtaaact tggtctgaca ttgatattca gcaccctgcg 40
<210> 50
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 50
tgtgccgcgg agaagtatgg ccaaaacctc gcaatctc 38
<210> 51
<211> 500
<212> DNA
<213> Bacillus licheniformis
<400> 51
atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga tcctgctgtt 60
attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt tcctatagtc 120
aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga tgacaaggtt 180
cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc agcttgccat 240
gtatgccggt gtgagcgccg cagccatttc cagagccgca gccatttcca gaatcgaaaa 300
cggccaccgc ggcgttccca agcccgcgac gatcagaaaa ttggccgagg ctctgaaaat 360
gccgtacgag cagctcatgg atattgccgg ttatatgaga gctgacgaga ttcgcgaaca 420
gccgcgcggc tatgtcacga tgcaggagat cgcggccaag cacggcgtcg aagacctgtg 480
gctgtttaaa cccgagaaat 500
<210> 52
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 52
gagattgcga ggttttggcc atacttctcc gcggcaca 38
<210> 53
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 53
cagaagaaaa tggaggaatt catttctcgg gtttaaacag ccac 44
<210> 54
<211> 415
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 54
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415
<210> 55
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 55
ttgatattca gcaccctgcg catttcgacc gggagaacga ctctgccgag ctcatcgatt 60
ctccggacaa tcccggtatt tttcacgttt gaaaagcctc cttttctcct ttctttattg 120
acttttgtca acatctttat aataaaagag atcttcaaat tttttgttga aatactgaat 180
catctttccg atcacaagtt gtccgggcct cctttcgcca tttaaaactc tgctgagtgt 240
cgccggggat acgccgattt caatggcaag ctgatttaag gagagattgt gttcaatcat 300
gtactggaga acaaaatctc ttttgatatg aatctttttt accatgatta ctcccctttc 360
taatctctta tgtttctttt tatctacatt gaacatatac gatttgttaa cttttgtcaa 420
tacttttacc atccatatgt ttcctatagg caatattcgt actaaaatat tttataataa 480
gagattgcga ggttttggcc atacttctcc gcggcacact ctcctctcta tcattttcgt 540
ctgtttacga tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg 600
tctaagtatt tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg 660
gggatggcga tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg 720
tcggttaatc agcttgccat gtatgccggt gtgagcgccg cagccatttc cagagccgca 780
gccatttcca gaatcgaaaa cggccaccgc ggcgttccca agcccgcgac gatcagaaaa 840
ttggccgagg ctctgaaaat gccgtacgag cagctcatgg atattgccgg ttatatgaga 900
gctgacgaga ttcgcgaaca gccgcgcggc tatgtcacga tgcaggagat cgcggccaag 960
cacggcgtcg aagacctgtg gctgtttaaa cccgagaaat 1000
<210> 56
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 56
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile His Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 57
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 57
gatctgcgtt taatccatct tgcgttagcg cac 33
<210> 58
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 58
gtgcgctaac gcaagatgga ttaaacgcag atc 33
<210> 59
<211> 9724
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 59
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggactcgac ttcgaataca 240
tccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaaat ggttctttcc cctgtcctaa acaaaaaacc cgctttattg aaaaagcggg 3720
gctgttttac agacaggtca aataaacgtt tgaaaatgtt catttcaaaa cgcgcggaac 3780
ctccatcttc tcccatccag actatactgt cggcttcgga atcgcaccga atcctgccca 3840
taaaaaggct cgcgggctta gagcgcttgc tcatcaccgc cggtagggaa tttcaccctg 3900
ccccgaagat tgatcttatt tatttttaat actgatatta ttataaatta attgtgaaaa 3960
aatgtacagg tgcaaagctt attgcgctgt tttgggacat cctgcacgat atttcggtaa 4020
actcactttt tccgcatact aaaaaccgca cattcacagt tatttcattt ttaattttcg 4080
tctttccgcg tgaaactcat tgacactctt tatggaatat ggtaaattat cagatattta 4140
tgacgcttat ttaggaggaa atcttacaca gaagctgcgg aacctgaaaa gaattccttt 4200
caggttccgt tttttttagg aattctccct gatctcaagc atctggcggg gataaatccg 4260
ctctcctttc aaatcgttcc attctttgag gcgctgtaca gttacgccca ttttttcggc 4320
gatatgatga agcgtatccc ctttccgcac tacatatgta ccggtcttcg attcatcgtc 4380
atgaaggcgg agtgtttggc cggccttgag atttgaatgt ttcaacccgt ttattctcat 4440
gatctcctcg atggatatac cgctatcctt gctgattctc cagagcgtgt cccctttttg 4500
aacggtcacc gcaccgctca ttgtcccggc gttttgataa acgtggatag aattttgccg 4560
gaacgcctcc tcacgaagca ccgtcagcgg attgattgca tatcttttat cttcagtcca 4620
tgaaccgtga tgcatttcaa aatgcaggtg ggttccggtc gatattcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 60
<211> 5055
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 60
attcctccat tttcttctgc tatcaaaata acagactcgt gattttccaa acgagctttc 60
aaaaaagcct ctgccccttg caaatcggat gcctgtctat aaaattcccg atattggtta 120
aacagcggcg caatggcggc cgcatctgat gtctttgctt ggcgaatgtt catcttattt 180
cttcctccct ctcaataatt ttttcattct atcccttttc tgtaaagttt atttttcaga 240
atacttttat catcatgctt tgaaaaaata tcacgataat atccattgtt ctcacggaag 300
cacacgcagg tcatttgaac gaattttttc gacaggaatt tgccgggact caggagcatt 360
taacctaaaa aagcatgaca tttcagcata atgaacattt actcatgtct attttcgttc 420
ttttctgtat gaaaatagtt atttcgagtc tctacggaaa tagcgagaga tgatatacct 480
aaatagagat aaaatcatct caaaaaaatg ggtctactaa aatattattc catctattac 540
aataaattca cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg 600
gtaactagtg gccccaaaaa agaaacgcaa ggttatggat aaaaaataca gcattggtct 660
ggatatcgga accaacagcg ttgggtgggc agtaataaca gatgaataca aagtgccgtc 720
aaaaaaattt aaggttctgg ggaatacaga tcgccacagc ataaaaaaga atctgattgg 780
ggcattgctg tttgattcgg gtgagacagc tgaggccacg cgtctgaaac gtacagcaag 840
aagacgttac acacgtcgta aaaatcgtat ttgctactta caggaaattt tttctaacga 900
aatggccaag gtagatgata gtttcttcca tcgtctcgaa gaatcttttc tggttgagga 960
agataaaaaa cacgaacgtc accctatctt tggcaatatc gtggatgaag tggcctatca 1020
tgaaaaatac cctacgattt atcatcttcg caagaagttg gttgatagta cggacaaagc 1080
ggatctgcgt ttaatccatc ttgcgttagc gcacatgatc aaatttcgtg gtcatttctt 1140
aattgaaggt gatctgaatc ctgataactc tgatgtggac aaattgttta tacaattagt 1200
gcaaacctat aatcagctgt tcgaggaaaa ccccattaat gcctctggag ttgatgccaa 1260
agcgatttta agcgcgagac tttctaagtc ccggcgtctg gagaatctga tcgcccagtt 1320
accaggggaa aagaaaaatg gtctgtttgg taatctgatt gccctcagtc tggggcttac 1380
cccgaacttc aaatccaatt ttgacctggc tgaggacgca aagctgcagc tgagcaaaga 1440
tacttatgat gatgacctcg acaatctgct cgcccagatt ggtgaccaat atgcggatct 1500
gtttctggca gcgaagaatc tttcggatgc tatcttgctg tcggatattc tgcgtgttaa 1560
taccgaaatc accaaagcgc ctctgtctgc aagtatgatc aagagatacg acgagcacca 1620
ccaggacctg actcttctta aggcactggt acgccaacag cttccggaga aatacaaaga 1680
aatattcttc gaccagtcca agaatggtta cgcgggctac atcgatggtg gtgcatcaca 1740
ggaagagttc tataaattta ttaaaccaat ccttgagaaa atggatggca cggaagagtt 1800
acttgttaaa cttaaccgcg aagacttgct tagaaagcaa cgtacattcg acaacggctc 1860
catcccacac cagattcatt taggtgaact tcacgccatc ttgcgcagac aagaagattt 1920
ctatcccttc ttaaaagaca atcgggagaa aatcgagaag atcctgacgt tccgcattcc 1980
ctattatgtc ggtcccctgg cacgtggtaa ttctcggttt gcctggatga cgcgcaaaag 2040
tgaggaaacc atcacccctt ggaactttga agaagtcgtg gataaaggtg ctagcgcgca 2100
gtcttttata gaaagaatga cgaacttcga taaaaacttg cccaacgaaa aagtcctgcc 2160
caagcactct cttttatatg agtactttac tgtgtacaac gaactgacta aagtgaaata 2220
cgttacggaa ggtatgcgca aacctgcctt tcttagtggc gagcagaaaa aagcaattgt 2280
cgatcttctc tttaaaacga atcgcaaggt aactgtaaaa cagctgaagg aagattattt 2340
caaaaagatc gaatgctttg attctgtcga gatctcgggt gtcgaagatc gtttcaacgc 2400
ttccttaggg acctatcatg atttgctgaa gataataaaa gacaaagact ttctcgacaa 2460
tgaagaaaat gaagatattc tggaggatat tgttttgacc ttgaccttat tcgaagatag 2520
agagatgatc gaggagcgct taaaaaccta tgcccacctg tttgatgaca aagtcatgaa 2580
gcaattaaag cgccgcagat atacggggtg gggccgcttg agccgcaagt tgattaacgg 2640
tattagagac aagcagagcg gaaaaactat cctggatttc ctcaaatctg acggatttgc 2700
gaaccgcaat tttatgcagc ttatacatga tgattcgctt acattcaaag aggatattca 2760
gaaggctcag gtgtctgggc aaggtgattc actccacgaa catatagcaa atttggccgg 2820
ctctcctgcg attaagaagg ggatcctgca aacagttaaa gttgtggatg aacttgtaaa 2880
agtaatgggc cgccacaagc cggagaatat cgtgatagaa atggcgcgcg agaatcaaac 2940
gacacaaaaa ggtcaaaaga actcaagaga gagaatgaag cgcattgagg aggggataaa 3000
ggaacttgga tctcaaattc tgaaagaaca tccagttgaa aacactcagc tgcaaaatga 3060
aaaattgtac ctgtactacc tgcagaatgg aagagacatg tacgtggatc aggaattgga 3120
tatcaataga ctctcggact atgacgtaga tcacattgtc cctcagagct tcctcaagga 3180
tgattctata gataataaag tacttacgag atcggacaaa aatcgcggta aatcggataa 3240
cgtcccatcg gaggaagtcg ttaaaaagat gaaaaactat tggcgtcaac tgctgaacgc 3300
caagctgatc acacagcgta agtttgataa tctgactaaa gccgaacgcg gtggtcttag 3360
tgaactcgat aaagcaggat ttataaaacg gcagttagta gaaacgcgcc aaattacgaa 3420
acacgtggct cagatcctcg attctagaat gaatacaaag tacgatgaaa acgataaact 3480
gatccgtgaa gtaaaagtca ttaccttaaa atctaaactt gtgtccgatt tccgcaaaga 3540
ttttcagttt tacaaggtcc gggaaatcaa taactatcac catgcacatg atgcatattt 3600
aaatgcggtt gtaggcacgg cccttattaa gaaataccct aaactcgaaa gtgagtttgt 3660
ttatggggat tataaagtgt atgacgttcg caaaatgatc gcgaaatcag aacaggaaat 3720
cggtaaggct accgctaaat acttttttta ttccaacatt atgaattttt ttaagaccga 3780
aataactctc gcgaatggtg aaatccgtaa acggcctctt atagaaacca atggtgaaac 3840
gggagaaatc gtttgggata aaggtcgtga ctttgccacc gttcgtaaag tcctctcaat 3900
gccgcaagtt aacattgtca agaagacgga agttcaaaca gggggattct ccaaagaatc 3960
tatcctgccg aagcgtaaca gtgataaact tattgccaga aaaaaagatt gggatccaaa 4020
aaaatacgga ggctttgatt cccctaccgt cgcgtatagt gtgctggtgg ttgctaaagt 4080
cgagaaaggg aaaagcaaga aattgaaatc agttaaagaa ctgctgggta ttacaattat 4140
ggaaagatcg tcctttgaga aaaatccgat cgacttttta gaggccaagg ggtataagga 4200
agtgaaaaaa gatctcatca tcaaattacc gaagtatagt ctttttgagc tggaaaacgg 4260
cagaaaaaga atgctggcct ccgcgggcga gttacagaag ggaaatgagc tggcgctgcc 4320
ttccaaatat gttaattttc tgtaccttgc cagtcattat gagaaactga agggcagccc 4380
cgaagataac gaacagaaac aattattcgt ggaacagcat aagcactatt tagatgaaat 4440
tatagagcaa attagtgaat tttctaagcg cgttatcctc gcggatgcta atttagacaa 4500
agtactgtca gcttataata aacatcggga taagccgatt agagaacagg ccgaaaatat 4560
cattcatttg tttaccttaa ccaaccttgg agcaccagct gccttcaaat atttcgatac 4620
cacaattgat cgtaaacggt atacaagtac aaaagaagtc ttggacgcaa ccctcattca 4680
tcaatctatt actggattat atgagacacg cattgatctt tcacagctgg gcggagacaa 4740
gaagaaaaaa ctgaaactgc accatcatca ccatcatcat caccatcatt gataactcga 4800
gaaagcttac ataaaaaacc ggccttggcc ccgccggttt tttattattt ttcttcctcc 4860
gcatgttcaa tccgctccat aatcgacgga tggctccctc tgaaaatttt aacgagaaac 4920
ggcgggttga cccggctcag tcccgtaacg gccaagtcct gaaacgtctc aatcgccgct 4980
tcccggtttc cggtcagctc aatgccgtaa cggtcggcgg cgttttcctg ataccgggag 5040
acggcattcg taatc 5055
<210> 61
<211> 9724
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 61
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagatgcc atcagttcct 240
catagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacattg atattcagca ccctgcgcat ttcgaccggg agaacgactc tgccgagctc 3720
atcgattctc cggacaatcc cggtattttt cacgtttgaa aagcctcctt ttctcctttc 3780
tttattgact tttgtcaaca tctttataat aaaagagatc ttcaaatttt ttgttgaaat 3840
actgaatcat ctttccgatc acaagttgtc cgggcctcct ttcgccattt aaaactctgc 3900
tgagtgtcgc cggggatacg ccgatttcaa tggcaagctg atttaaggag agattgtgtt 3960
caatcatgta ctggagaaca aaatctcttt tgatatgaat cttttttacc atgattactc 4020
ccctttctaa tctcttatgt ttctttttat ctacattgaa catatacgat ttgttaactt 4080
ttgtcaatac ttttaccatc catatgtttc ctataggcaa tattcgtact aaaatatttt 4140
ataataagag attgcgaggt tttggccata cttctccgcg gcacactctc ctctctatca 4200
ttttcgtctg tttacgatcc tgctgttatt ttatccctta tgttaacttt tgtcaatatt 4260
tttcctgtct aagtatttcc tatagtcaac atttgtatta aaatgttcat atcatgaatt 4320
tgcggggggg atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag 4380
aagcctgtcg gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag 4440
agccgcagcc atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat 4500
cagaaaattg gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta 4560
tatgagagct gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc 4620
ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc gagaaatgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 62
<211> 8352
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 62
gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60
tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120
taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180
ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240
gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300
agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360
tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420
tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480
ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540
acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600
gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660
ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720
tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780
ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840
agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900
gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960
gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020
catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080
gcggatctgc gtttaatcca tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140
ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200
gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260
aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320
ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380
accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440
gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500
ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560
aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620
caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680
gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740
caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800
ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860
tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920
ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980
ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040
agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100
cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160
cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220
tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280
gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340
ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400
gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460
aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520
agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580
aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640
ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700
gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760
cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820
ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880
aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940
acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000
aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060
gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120
gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180
gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240
aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300
gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360
agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420
aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480
ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540
gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600
ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660
gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720
atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780
gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840
acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900
atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960
tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020
aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080
gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140
atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200
gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260
ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320
ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380
cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440
attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500
aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560
atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620
accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680
catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740
aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800
gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040
agacggcatt cgtaatcgaa ttcgcggccg cacgcgtcca tggggatccc cgcgggtcga 5100
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 5160
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacactctt aaattcaaaa tctatcggtc 5220
agatttatac cgatttgatt ttatatattc ttgaataaca tacgccgagt tatcacataa 5280
aagcgggaac caatcataaa atttaaactt cattgcataa tccattaaac tcttaaattc 5340
tacgattcct tgttcatcaa taaactcaat catttcttta attaatttat atctatctgt 5400
tgttgttttc tttaataatt cattaacatc tacaccgcca taaactatca tatcttcttt 5460
ttgatattta aatttattag gatcgtccat gtgaagcata tatctcacaa gacctttcac 5520
acttcctgca atctgcggaa tagtcgcatt caattcttct gtaattattt ttatctgttc 5580
ataagattta ttaccctcat acatcactag aatatgataa tgctcttttt tcatcctacc 5640
ttctgtatca gtatccctat catgtaatgg agacactaca aattgaatgt gtaactcttt 5700
taaatactct aaccactcgg cttttgctga ttctggatat aaaacaaatg tccaattacg 5760
tcctcttgaa tttttcttgt tttcagtttc ttttattaca ttttcgctca tgatataata 5820
acggtgctaa tacacttaac aaaatttagt catagatagg cagcatgcca gtgctgtcta 5880
tctttttttg tttaaaatgc accgtattcc tcctttgcat atttttttat tagaataccg 5940
gttgcatctg atttgctaat attatatttt tctttgattc tatttaatat ctcattttct 6000
tctgttgtaa gtcttaaagt aacagcaact tttttctctt cttttctatc tacaactatc 6060
actgtacctc ccaacatctg tttttttcac tttaacataa aaaacaacct tttaacatta 6120
aaaacccaat atttatttat ttgtttggac aatggacact ggacacctag gggggaggtc 6180
gtagtacccc cctatgtttt ctcccctaaa taaccccaaa aatctaagaa aaaaagacct 6240
caaaaaggtc tttaattaac atctcaaatt tcgcatttat tccaatttcc tttttgcgtg 6300
tgatgcgagc tcatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 6360
gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 6420
gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 6480
aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 6540
gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 6600
aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 6660
gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 6720
ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 6780
cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 6840
tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 6900
gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 6960
gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 7020
agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 7080
aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt 7140
atgacattgc cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg 7200
agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 7260
tactggatga attgttttag tgactgcagt cgggaagatc tggtaatgac tctctagctt 7320
gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg 7380
tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ctctagctaa gcagaaggcc 7440
atcctgacgg atggcctttt tgcgtttcta caaactcttg ttaactctag agctgcctgc 7500
cgcgtttcgg tgatgaagat cttcccgatg attaattaat tcagaacgct cggttgccgc 7560
cgggcgtttt ttatgaagct tcgttgctgg cgtttttcca taggctccgc ccccctgacg 7620
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7680
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7740
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7800
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaccccc 7860
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7920
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7980
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 8040
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 8100
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 8160
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 8220
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 8280
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 8340
cttggtctga ca 8352
<210> 63
<211> 498
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 63
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 60
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 120
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 180
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 240
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 300
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 360
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 420
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 480
agaaaaatgg tctgtttg 498
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 64
cacgtcgtaa aaatcgtatt 20
<210> 65
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 65
caaacagacc atttttcttt 20
<210> 66
<211> 7888
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 66
aaagaaaaat ggtctgtttg gtaatctgat tgccctcagt ctggggctta ccccgaactt 60
caaatccaat tttgacctgg ctgaggacgc aaagctgcag ctgagcaaag atacttatga 120
tgatgacctc gacaatctgc tcgcccagat tggtgaccaa tatgcggatc tgtttctggc 180
agcgaagaat ctttcggatg ctatcttgct gtcggatatt ctgcgtgtta ataccgaaat 240
caccaaagcg cctctgtctg caagtatgat caagagatac gacgagcacc accaggacct 300
gactcttctt aaggcactgg tacgccaaca gcttccggag aaatacaaag aaatattctt 360
cgaccagtcc aagaatggtt acgcgggcta catcgatggt ggtgcatcac aggaagagtt 420
ctataaattt attaaaccaa tccttgagaa aatggatggc acggaagagt tacttgttaa 480
acttaaccgc gaagacttgc ttagaaagca acgtacattc gacaacggct ccatcccaca 540
ccagattcat ttaggtgaac ttcacgccat cttgcgcaga caagaagatt tctatccctt 600
cttaaaagac aatcgggaga aaatcgagaa gatcctgacg ttccgcattc cctattatgt 660
cggtcccctg gcacgtggta attctcggtt tgcctggatg acgcgcaaaa gtgaggaaac 720
catcacccct tggaactttg aagaagtcgt ggataaaggt gctagcgcgc agtcttttat 780
agaaagaatg acgaacttcg ataaaaactt gcccaacgaa aaagtcctgc ccaagcactc 840
tcttttatat gagtacttta ctgtgtacaa cgaactgact aaagtgaaat acgttacgga 900
aggtatgcgc aaacctgcct ttcttagtgg cgagcagaaa aaagcaattg tcgatcttct 960
ctttaaaacg aatcgcaagg taactgtaaa acagctgaag gaagattatt tcaaaaagat 1020
cgaatgcttt gattctgtcg agatctcggg tgtcgaagat cgtttcaacg cttccttagg 1080
gacctatcat gatttgctga agataataaa agacaaagac tttctcgaca atgaagaaaa 1140
tgaagatatt ctggaggata ttgttttgac cttgacctta ttcgaagata gagagatgat 1200
cgaggagcgc ttaaaaacct atgcccacct gtttgatgac aaagtcatga agcaattaaa 1260
gcgccgcaga tatacggggt ggggccgctt gagccgcaag ttgattaacg gtattagaga 1320
caagcagagc ggaaaaacta tcctggattt cctcaaatct gacggatttg cgaaccgcaa 1380
ttttatgcag cttatacatg atgattcgct tacattcaaa gaggatattc agaaggctca 1440
ggtgtctggg caaggtgatt cactccacga acatatagca aatttggccg gctctcctgc 1500
gattaagaag gggatcctgc aaacagttaa agttgtggat gaacttgtaa aagtaatggg 1560
ccgccacaag ccggagaata tcgtgataga aatggcgcgc gagaatcaaa cgacacaaaa 1620
aggtcaaaag aactcaagag agagaatgaa gcgcattgag gaggggataa aggaacttgg 1680
atctcaaatt ctgaaagaac atccagttga aaacactcag ctgcaaaatg aaaaattgta 1740
cctgtactac ctgcagaatg gaagagacat gtacgtggat caggaattgg atatcaatag 1800
actctcggac tatgacgtag atcacattgt ccctcagagc ttcctcaagg atgattctat 1860
agataataaa gtacttacga gatcggacaa aaatcgcggt aaatcggata acgtcccatc 1920
ggaggaagtc gttaaaaaga tgaaaaacta ttggcgtcaa ctgctgaacg ccaagctgat 1980
cacacagcgt aagtttgata atctgactaa agccgaacgc ggtggtctta gtgaactcga 2040
taaagcagga tttataaaac ggcagttagt agaaacgcgc caaattacga aacacgtggc 2100
tcagatcctc gattctagaa tgaatacaaa gtacgatgaa aacgataaac tgatccgtga 2160
agtaaaagtc attaccttaa aatctaaact tgtgtccgat ttccgcaaag attttcagtt 2220
ttacaaggtc cgggaaatca ataactatca ccatgcacat gatgcatatt taaatgcggt 2280
tgtaggcacg gcccttatta agaaataccc taaactcgaa agtgagtttg tttatgggga 2340
ttataaagtg tatgacgttc gcaaaatgat cgcgaaatca gaacaggaaa tcggtaaggc 2400
taccgctaaa tacttttttt attccaacat tatgaatttt tttaagaccg aaataactct 2460
cgcgaatggt gaaatccgta aacggcctct tatagaaacc aatggtgaaa cgggagaaat 2520
cgtttgggat aaaggtcgtg actttgccac cgttcgtaaa gtcctctcaa tgccgcaagt 2580
taacattgtc aagaagacgg aagttcaaac agggggattc tccaaagaat ctatcctgcc 2640
gaagcgtaac agtgataaac ttattgccag aaaaaaagat tgggatccaa aaaaatacgg 2700
aggctttgat tcccctaccg tcgcgtatag tgtgctggtg gttgctaaag tcgagaaagg 2760
gaaaagcaag aaattgaaat cagttaaaga actgctgggt attacaatta tggaaagatc 2820
gtcctttgag aaaaatccga tcgacttttt agaggccaag gggtataagg aagtgaaaaa 2880
agatctcatc atcaaattac cgaagtatag tctttttgag ctggaaaacg gcagaaaaag 2940
aatgctggcc tccgcgggcg agttacagaa gggaaatgag ctggcgctgc cttccaaata 3000
tgttaatttt ctgtaccttg ccagtcatta tgagaaactg aagggcagcc ccgaagataa 3060
cgaacagaaa caattattcg tggaacagca taagcactat ttagatgaaa ttatagagca 3120
aattagtgaa ttttctaagc gcgttatcct cgcggatgct aatttagaca aagtactgtc 3180
agcttataat aaacatcggg ataagccgat tagagaacag gccgaaaata tcattcattt 3240
gtttacctta accaaccttg gagcaccagc tgccttcaaa tatttcgata ccacaattga 3300
tcgtaaacgg tatacaagta caaaagaagt cttggacgca accctcattc atcaatctat 3360
tactggatta tatgagacac gcattgatct ttcacagctg ggcggagaca agaagaaaaa 3420
actgaaactg caccatcatc accatcatca tcaccatcat tgataactcg agaaagctta 3480
cataaaaaac cggccttggc cccgccggtt ttttattatt tttcttcctc cgcatgttca 3540
atccgctcca taatcgacgg atggctccct ctgaaaattt taacgagaaa cggcgggttg 3600
acccggctca gtcccgtaac ggccaagtcc tgaaacgtct caatcgccgc ttcccggttt 3660
ccggtcagct caatgccgta acggtcggcg gcgttttcct gataccggga gacggcattc 3720
gtaatcgaat tcgcggccgc acgcgtccat ggggatcccc gcgggtcgac ctcgagagtt 3780
acgctaggga taacagggta atataggagc tccagtcggc ttaaaccagt tttcgctggt 3840
gcgaaaaaag agtgtcttgt gacacctaaa ttcaaaatct atcggtcaga tttataccga 3900
tttgatttta tatattcttg aataacatac gccgagttat cacataaaag cgggaaccaa 3960
tcataaaatt taaacttcat tgcataatcc attaaactct taaattctac gattccttgt 4020
tcatcaataa actcaatcat ttctttaatt aatttatatc tatctgttgt tgttttcttt 4080
aataattcat taacatctac accgccataa actatcatat cttctttttg atatttaaat 4140
ttattaggat cgtccatgtg aagcatatat ctcacaagac ctttcacact tcctgcaatc 4200
tgcggaatag tcgcattcaa ttcttctgtt aattattttt atctgttcat aagatttatt 4260
accctcatac atcactagaa tatgataatg ctcttttttc atcctacctt ctgtatcagt 4320
atccctatca tgtaatggag acactacaaa ttgaatgtgt aactctttta aatactctaa 4380
ccactcggct tttgctgatt ctggatataa aacaaatgtc caattacgtc ctcttgaatt 4440
tttcttgttt tcagtttctt ttattacatt ttcgctcatg atataataac ggtgctaata 4500
cacttaacaa aatttagtca tagataggca gcatgccagt gctgtctatc tttttttgtt 4560
taaaatgcac cgtattcctc ctttgcatat ttttttatta gaataccggt tgcatctgat 4620
ttgctaatat tatatttttc tttgattcta tttaatatct cattttcttc tgttgtaagt 4680
cttaaagtaa cagcaacttt tttctcttct tttctatcta caactatcac tgtacctccc 4740
aacatctgtt tttttcactt taacataaaa aacaaccttt taacattaaa aacccaatat 4800
ttatttattt gtttggacaa tggacactgg acacctaggg gggaggtcgt agtacccccc 4860
tatgttttct cccctaaata accccaaaaa tctaagaaaa aaagacctca aaaaggtctt 4920
taattaacat ctcaaatttc gcatttattc caatttcctt tttgcgtgtg atgcgagctc 4980
atcggctccg tcgatactat gttatacgcc aactttcaaa acaactttga aaaagctgtt 5040
ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt cttgttataa 5100
ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa taaatggcta 5160
aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc gtaaaagata 5220
cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa aacctatatt 5280
taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg gaaaaggaca 5340
tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt gaacggcatg 5400
atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg gaagagtatg 5460
aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc aggctctttc 5520
actccatcga catatcggat tgtccctata cgaatagctt agacagccgc ttagccgaat 5580
tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg gaagaagaca 5640
ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag cccgaagagg 5700
aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa gatggcaaag 5760
taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat gacattgcct 5820
tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag ctattttttg 5880
acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta ctggatgaat 5940
tgttttagtg actgcagtga gatctggtaa tgactctcta gcttgaggca tcaaataaaa 6000
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 6060
ctcctgagta ggacaaatcc gccgctctag ctaagcagaa ggccatcctg acggatggcc 6120
tttttgcgtt tctacaaact cttgttaact ctagagctgc ctgccgcgtt tcggtgatga 6180
agatcttccc gatgattaat taattcagaa cgctcggttg ccgccgggcg ttttttatga 6240
agcttcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 6300
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 6360
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 6420
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 6480
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 6540
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 6600
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 6660
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 6720
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 6780
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 6840
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 6900
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 6960
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagaat 7020
tcctccattt tcttctgcta tcaaaataac agactcgtga ttttccaaac gagctttcaa 7080
aaaagcctct gccccttgca aatcggatgc ctgtctataa aattcccgat attggttaaa 7140
cagcggcgca atggcggccg catctgatgt ctttgcttgg cgaatgttca tcttatttct 7200
tcctccctct caataatttt ttcattctat cccttttctg taaagtttat ttttcagaat 7260
acttttatca tcatgctttg aaaaaatatc acgataatat ccattgttct cacggaagca 7320
cacgcaggtc atttgaacga attttttcga caggaatttg ccgggactca ggagcattta 7380
acctaaaaaa gcatgacatt tcagcataat gaacatttac tcatgtctat tttcgttctt 7440
ttctgtatga aaatagttat ttcgagtctc tacggaaata gcgagagatg atatacctaa 7500
atagagataa aatcatctca aaaaaatggg tctactaaaa tattattcca tctattacaa 7560
taaattcaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 7620
aactagtggc cccaaaaaag aaacgcaagg ttatggataa aaaatacagc attggtctgg 7680
atatcggaac caacagcgtt gggtgggcag taataacaga tgaatacaaa gtgccgtcaa 7740
aaaaatttaa ggttctgggg aatacagatc gccacagcat aaaaaagaat ctgattgggg 7800
cattgctgtt tgattcgggt gagacagctg aggccacgcg tctgaaacgt acagcaagaa 7860
gacgttacac acgtcgtaaa aatcgtat 7888
<210> 67
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 67
aaagaaaaat ggtctgtttg 20
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 68
aatacgattt ttacgacgtg 20
<210> 69
<211> 9790
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 69
gaattcctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60
tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120
taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180
ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240
gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300
agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360
tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420
tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480
ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540
acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600
gggtaactag tggccccaaa aaagaaacgc aaggttatgg ataaaaaata cagcattggt 660
ctggatatcg gaaccaacag cgttgggtgg gcagtaataa cagatgaata caaagtgccg 720
tcaaaaaaat ttaaggttct ggggaataca gatcgccaca gcataaaaaa gaatctgatt 780
ggggcattgc tgtttgattc gggtgagaca gctgaggcca cgcgtctgaa acgtacagca 840
agaagacgtt acacacgtcg taaaaatcgt atttgctact tacaggaaat tttttctaac 900
gaaatggcca aggtagatga tagtttcttc catcgtctcg aagaatcttt tctggttgag 960
gaagataaaa aacacgaacg tcaccctatc tttggcaata tcgtggatga agtggcctat 1020
catgaaaaat accctacgat ttatcatctt cgcaagaagt tggttgatag tacggacaaa 1080
gcggatctgc gtttaatcca tcttgcgtta gcgcacatga tcaaatttcg tggtcatttc 1140
ttaattgaag gtgatctgaa tcctgataac tctgatgtgg acaaattgtt tatacaatta 1200
gtgcaaacct ataatcagct gttcgaggaa aaccccatta atgcctctgg agttgatgcc 1260
aaagcgattt taagcgcgag actttctaag tcccggcgtc tggagaatct gatcgcccag 1320
ttaccagggg aaaagaaaaa tggtctgttt ggtaatctga ttgccctcag tctggggctt 1380
accccgaact tcaaatccaa ttttgacctg gctgaggacg caaagctgca gctgagcaaa 1440
gatacttatg atgatgacct cgacaatctg ctcgcccaga ttggtgacca atatgcggat 1500
ctgtttctgg cagcgaagaa tctttcggat gctatcttgc tgtcggatat tctgcgtgtt 1560
aataccgaaa tcaccaaagc gcctctgtct gcaagtatga tcaagagata cgacgagcac 1620
caccaggacc tgactcttct taaggcactg gtacgccaac agcttccgga gaaatacaaa 1680
gaaatattct tcgaccagtc caagaatggt tacgcgggct acatcgatgg tggtgcatca 1740
caggaagagt tctataaatt tattaaacca atccttgaga aaatggatgg cacggaagag 1800
ttacttgtta aacttaaccg cgaagacttg cttagaaagc aacgtacatt cgacaacggc 1860
tccatcccac accagattca tttaggtgaa cttcacgcca tcttgcgcag acaagaagat 1920
ttctatccct tcttaaaaga caatcgggag aaaatcgaga agatcctgac gttccgcatt 1980
ccctattatg tcggtcccct ggcacgtggt aattctcggt ttgcctggat gacgcgcaaa 2040
agtgaggaaa ccatcacccc ttggaacttt gaagaagtcg tggataaagg tgctagcgcg 2100
cagtctttta tagaaagaat gacgaacttc gataaaaact tgcccaacga aaaagtcctg 2160
cccaagcact ctcttttata tgagtacttt actgtgtaca acgaactgac taaagtgaaa 2220
tacgttacgg aaggtatgcg caaacctgcc tttcttagtg gcgagcagaa aaaagcaatt 2280
gtcgatcttc tctttaaaac gaatcgcaag gtaactgtaa aacagctgaa ggaagattat 2340
ttcaaaaaga tcgaatgctt tgattctgtc gagatctcgg gtgtcgaaga tcgtttcaac 2400
gcttccttag ggacctatca tgatttgctg aagataataa aagacaaaga ctttctcgac 2460
aatgaagaaa atgaagatat tctggaggat attgttttga ccttgacctt attcgaagat 2520
agagagatga tcgaggagcg cttaaaaacc tatgcccacc tgtttgatga caaagtcatg 2580
aagcaattaa agcgccgcag atatacgggg tggggccgct tgagccgcaa gttgattaac 2640
ggtattagag acaagcagag cggaaaaact atcctggatt tcctcaaatc tgacggattt 2700
gcgaaccgca attttatgca gcttatacat gatgattcgc ttacattcaa agaggatatt 2760
cagaaggctc aggtgtctgg gcaaggtgat tcactccacg aacatatagc aaatttggcc 2820
ggctctcctg cgattaagaa ggggatcctg caaacagtta aagttgtgga tgaacttgta 2880
aaagtaatgg gccgccacaa gccggagaat atcgtgatag aaatggcgcg cgagaatcaa 2940
acgacacaaa aaggtcaaaa gaactcaaga gagagaatga agcgcattga ggaggggata 3000
aaggaacttg gatctcaaat tctgaaagaa catccagttg aaaacactca gctgcaaaat 3060
gaaaaattgt acctgtacta cctgcagaat ggaagagaca tgtacgtgga tcaggaattg 3120
gatatcaata gactctcgga ctatgacgta gatcacattg tccctcagag cttcctcaag 3180
gatgattcta tagataataa agtacttacg agatcggaca aaaatcgcgg taaatcggat 3240
aacgtcccat cggaggaagt cgttaaaaag atgaaaaact attggcgtca actgctgaac 3300
gccaagctga tcacacagcg taagtttgat aatctgacta aagccgaacg cggtggtctt 3360
agtgaactcg ataaagcagg atttataaaa cggcagttag tagaaacgcg ccaaattacg 3420
aaacacgtgg ctcagatcct cgattctaga atgaatacaa agtacgatga aaacgataaa 3480
ctgatccgtg aagtaaaagt cattacctta aaatctaaac ttgtgtccga tttccgcaaa 3540
gattttcagt tttacaaggt ccgggaaatc aataactatc accatgcaca tgatgcatat 3600
ttaaatgcgg ttgtaggcac ggcccttatt aagaaatacc ctaaactcga aagtgagttt 3660
gtttatgggg attataaagt gtatgacgtt cgcaaaatga tcgcgaaatc agaacaggaa 3720
atcggtaagg ctaccgctaa atactttttt tattccaaca ttatgaattt ttttaagacc 3780
gaaataactc tcgcgaatgg tgaaatccgt aaacggcctc ttatagaaac caatggtgaa 3840
acgggagaaa tcgtttggga taaaggtcgt gactttgcca ccgttcgtaa agtcctctca 3900
atgccgcaag ttaacattgt caagaagacg gaagttcaaa cagggggatt ctccaaagaa 3960
tctatcctgc cgaagcgtaa cagtgataaa cttattgcca gaaaaaaaga ttgggatcca 4020
aaaaaatacg gaggctttga ttcccctacc gtcgcgtata gtgtgctggt ggttgctaaa 4080
gtcgagaaag ggaaaagcaa gaaattgaaa tcagttaaag aactgctggg tattacaatt 4140
atggaaagat cgtcctttga gaaaaatccg atcgactttt tagaggccaa ggggtataag 4200
gaagtgaaaa aagatctcat catcaaatta ccgaagtata gtctttttga gctggaaaac 4260
ggcagaaaaa gaatgctggc ctccgcgggc gagttacaga agggaaatga gctggcgctg 4320
ccttccaaat atgttaattt tctgtacctt gccagtcatt atgagaaact gaagggcagc 4380
cccgaagata acgaacagaa acaattattc gtggaacagc ataagcacta tttagatgaa 4440
attatagagc aaattagtga attttctaag cgcgttatcc tcgcggatgc taatttagac 4500
aaagtactgt cagcttataa taaacatcgg gataagccga ttagagaaca ggccgaaaat 4560
atcattcatt tgtttacctt aaccaacctt ggagcaccag ctgccttcaa atatttcgat 4620
accacaattg atcgtaaacg gtatacaagt acaaaagaag tcttggacgc aaccctcatt 4680
catcaatcta ttactggatt atatgagaca cgcattgatc tttcacagct gggcggagac 4740
aagaagaaaa aactgaaact gcaccatcat caccatcatc atcaccatca ttgataactc 4800
gagaaagctt acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4860
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4920
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4980
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 5040
agacggcatt cgtaatcggg tgaagtggtc aagacctcac taggcacctt aaaaatagcg 5100
caccctgaag aagatttatt tgaggtagcc cttgcctacc tagcttccaa gaaagatatc 5160
ctaacagcac aagagcggaa agatgttttg ttctacatcc agaacaacct ctgctaaaat 5220
tcctgaaaaa ttttgcaaaa agttgttgac tttatctaca aggtgtggca taatgtgtgg 5280
aagaatcgaa aacggccacc ggttttagag ctagaaatag caagttaaaa taaggctagt 5340
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgac tcctgttgat agatccagta 5400
atgacctcag aactccatct ggatttgttc agaacgctcg gttgccgccg ggcgtttttt 5460
attggtgaga atcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 5520
catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 5580
gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 5640
aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 5700
gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 5760
tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 5820
gggggatggc gatgacaagg ttcggcgagc ggctcaaaga gctgagggaa caaagaagcc 5880
tgtcggttaa tcagcttgcc atgtatgccg gtgtgagcgc cgcagccatt tccagaatcg 5940
aaaacggcca ccgctaagtt cccaagcccg cgacgatcag aaaattggcc tgataactga 6000
aaatgccgta cgagcagctc atggatattg ccggttatat gagagctgac gagattcgcg 6060
aacagccgcg cggctatgtc acgatgcagg agatcgcggc caagcacggc gtcgaagacc 6120
tgtggctgtt taaacccgag aaatgggact gtttgtcccg cgaagacctg ctcaacctcg 6180
aacagtattt tcattttttg gttaatgaag cgaagaagcg ccaatcataa aaagccgaat 6240
ttccctttta ggagaagttc ggcttttttc ggctgcctta agcggcatcc ggattcggcg 6300
tcttgccttt atgatgctta acggggctca gcgcacgctc gagccatccc atgaacagat 6360
cggcgatgat cgccatcagc gccgtcggga tcgcgcctgc tagaatgatc gctgttccgt 6420
tggtcgcgtt tgatcccctg acaatgatat ccccgaggcc gcctgcgccg acaaacgtgc 6480
cgatggccgt aatgcgaatt cgcggccgca cgcgtccatg gggatccccg cgggtcgacc 6540
tcgagagtta cgctagggat aacagggtaa tataggagct ccagtcggct taaaccagtt 6600
ttcgctggtg cgaaaaaaga gtgtcttgtg acactcttaa attcaaaatc tatcggtcag 6660
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 6720
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 6780
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 6840
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 6900
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 6960
ttcctgcaat ctgcggaata gtcgcattca attcttctgt aattattttt atctgttcat 7020
aagatttatt accctcatac atcactagaa tatgataatg ctcttttttc atcctacctt 7080
ctgtatcagt atccctatca tgtaatggag acactacaaa ttgaatgtgt aactctttta 7140
aatactctaa ccactcggct tttgctgatt ctggatataa aacaaatgtc caattacgtc 7200
ctcttgaatt tttcttgttt tcagtttctt ttattacatt ttcgctcatg atataataac 7260
ggtgctaata cacttaacaa aatttagtca tagataggca gcatgccagt gctgtctatc 7320
tttttttgtt taaaatgcac cgtattcctc ctttgcatat ttttttatta gaataccggt 7380
tgcatctgat ttgctaatat tatatttttc tttgattcta tttaatatct cattttcttc 7440
tgttgtaagt cttaaagtaa cagcaacttt tttctcttct tttctatcta caactatcac 7500
tgtacctccc aacatctgtt tttttcactt taacataaaa aacaaccttt taacattaaa 7560
aacccaatat ttatttattt gtttggacaa tggacactgg acacctaggg gggaggtcgt 7620
agtacccccc tatgttttct cccctaaata accccaaaaa tctaagaaaa aaagacctca 7680
aaaaggtctt taattaacat ctcaaatttc gcatttattc caatttcctt tttgcgtgtg 7740
atgcgagctc atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 7800
aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 7860
cttgttataa ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa 7920
taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 7980
gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 8040
aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 8100
gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 8160
gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 8220
gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 8280
aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 8340
ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 8400
gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 8460
cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 8520
gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 8580
gacattgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 8640
ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 8700
ctggatgaat tgttttagtg actgcagtcg ggaagatctg gtaatgactc tctagcttga 8760
ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 8820
tgtcggtgaa cgctctcctg agtaggacaa atccgccgct ctagctaagc agaaggccat 8880
cctgacggat ggcctttttg cgtttctaca aactcttgtt aactctagag ctgcctgccg 8940
cgtttcggtg atgaagatct tcccgatgat taattaattc agaacgctcg gttgccgccg 9000
ggcgtttttt atgaagcttc gttgctggcg tttttccata ggctccgccc ccctgacgag 9060
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9120
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9180
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9240
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaccccccc 9300
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9360
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 9420
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 9480
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 9540
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 9600
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9660
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9720
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 9780
tggtctgaca 9790
<210> 70
<211> 399
<212> DNA
<213> Bacillus licheniformis
<400> 70
atgacaaggt tcggcgagcg gctcaaagag ctgagggaac aaagaagcct gtcggttaat 60
cagcttgcca tgtatgccgg tgtgagcgcc gcagccattt ccagaatcga aaacggccac 120
cgcggcgttc ccaagcccgc gacgatcaga aaattggccg aggctctgaa aatgccgtac 180
gagcagctca tggatattgc cggttatatg agagctgacg agattcgcga acagccgcgc 240
ggctatgtca cgatgcagga gatcgcggcc aagcacggcg tcgaagacct gtggctgttt 300
aaacccgaga aatgggactg tttgtcccgc gaagacctgc tcaacctcga acagtatttt 360
cattttttgg ttaatgaagc gaagaagcgc caatcataa 399
<210> 71
<211> 1438
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 71
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggaagaatc gaaaacggcc 240
accggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatcgcgt 420
ctacagtcca ggaagcaaga agcagctatg attccattta cgacatcgtg tcacagtacg 480
atttagagga cctttctctg tttgacagcg aaaagtggaa ggtgctttca aaaaaagaca 540
tcgaaaacct ggacaaatat ttcgactttc tcgtgcagga agcaagcagc cgaaacaaaa 600
actgaatact tctccgcggc acactctcct ctctatcatt ttcgtctgtt tacgatcctg 660
ctgttatttt atcccttatg ttaacttttg tcaatatttt tcctgtctaa gtatttccta 720
tagtcaacat ttgtattaaa atgttcatat catgaatttg cgggggggat ggcgatgaca 780
aggttcggcg agcggctcaa agagctgagg gaacaaagaa gcctgtcggt taatcagctt 840
gccatgtatg ccggtgtgag cgccgcagcc atttccagaa tcgaaaacgg ccaccgctaa 900
gttcccaagc ccgcgacgat cagaaaattg gcctgataac tgaaaatgcc gtacgagcag 960
ctcatggata ttgccggtta tatgagagct gacgagattc gcgaacagcc gcgcggctat 1020
gtcacgatgc aggagatcgc ggccaagcac ggcgtcgaag acctgtggct gtttaaaccc 1080
gagaaatggg actgtttgtc ccgcgaagac ctgctcaacc tcgaacagta ttttcatttt 1140
ttggttaatg aagcgaagaa gcgccaatca taaaaagccg aatttccctt ttaggagaag 1200
ttcggctttt ttcggctgcc ttaagcggca tccggattcg gcgtcttgcc tttatgatgc 1260
ttaacggggc tcagcgcacg ctcgagccat cccatgaaca gatcggcgat gatcgccatc 1320
agcgccgtcg ggatcgcgcc tgctagaatg atcgctgttc cgttggtcgc gtttgatccc 1380
ctgacaatga tatccccgag gccgcctgcg ccgacaaacg tgccgatggc cgtaatgc 1438
<210> 72
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 72
cgcgtctaca gtccaggaag caagaagcag ctatgattcc atttacgaca tcgtgtcaca 60
gtacgattta gaggaccttt ctctgtttga cagcgaaaag tggaaggtgc tttcaaaaaa 120
agacatcgaa aacctggaca aatatttcga ctttctcgtg caggaagcaa gcagccgaaa 180
caaaaactga atacttctcc gcggcacact ctcctctcta tcattttcgt ctgtttacga 240
tcctgctgtt attttatccc ttatgttaac ttttgtcaat atttttcctg tctaagtatt 300
tcctatagtc aacatttgta ttaaaatgtt catatcatga atttgcgggg gggatggcga 360
tgacaaggtt cggcgagcgg ctcaaagagc tgagggaaca aagaagcctg tcggttaatc 420
agcttgccat gtatgccggt gtgagcgccg cagccatttc cagaatcgaa aacggccacc 480
gctaagttcc caagcccgcg acgatcagaa aattggcctg ataactgaaa atgccgtacg 540
agcagctcat ggatattgcc ggttatatga gagctgacga gattcgcgaa cagccgcgcg 600
gctatgtcac gatgcaggag atcgcggcca agcacggcgt cgaagacctg tggctgttta 660
aacccgagaa atgggactgt ttgtcccgcg aagacctgct caacctcgaa cagtattttc 720
attttttggt taatgaagcg aagaagcgcc aatcataaaa agccgaattt cccttttagg 780
agaagttcgg cttttttcgg ctgccttaag cggcatccgg attcggcgtc ttgcctttat 840
gatgcttaac ggggctcagc gcacgctcga gccatcccat gaacagatcg gcgatgatcg 900
ccatcagcgc cgtcgggatc gcgcctgcta gaatgatcgc tgttccgttg gtcgcgtttg 960
atcccctgac aatgatatcc ccgaggccgc ctgcgccgac aaacgtgccg atggccgtaa 1020
tgc 1023
<210> 73
<211> 415
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 73
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggaagaatc gaaaacggcc 240
accggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaat 415
<210> 74
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 74
cgtgcggccg cgaattc 17
<210> 75
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 75
cctgataccg ggagacggca ttcgtaatc 29
<210> 76
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 76
gaattcgcgg ccgcacg 17
<210> 77
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 77
gattacgaat gccgtctccc ggtatcagg 29
<210> 78
<211> 9738
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 78
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagcgagc ggctcaaaga 240
gctggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacacgt cagttcggca ggcatttcgc gaatcgaaaa cggaaagcgc ggcgtgccga 3720
agccggcgac gatcagaaaa ctggcggacg ctttgaaagt cccgtatgag gaactgatgg 3780
catctgcagg ctatatcagc gcgtctacag tccaggaagc aagaagcagc tatgattcca 3840
tttacgacat cgtgtcacag tacgatttag aggacctttc tctgtttgac agcgaaaagt 3900
ggaaggtgct ttcaaaaaaa gacatcgaaa acctggacaa atatttcgac tttctcgtgc 3960
aggaagcaag cagccgaaac aaaaactgaa tacttctccg cggcacactc tcctctctat 4020
cattttcgtc tgtttacgat cctgctgtta ttttatccct tatgttaact tttgtcaata 4080
tttttcctgt ctaagtattt cctatagtca acatttgtat taaaatgttc atatcatgaa 4140
tttgcggggg ggatggcgat gacaaggcaa tcataaaaag ccgaatttcc cttttaggag 4200
aagttcggct tttttcggct gccttaagcg gcatccggat tcggcgtctt gcctttatga 4260
tgcttaacgg ggctcagcgc acgctcgagc catcccatga acagatcggc gatgatcgcc 4320
atcagcgccg tcgggatcgc gcctgctaga atgatcgctg ttccgttggt cgcgtttgat 4380
cccctgacaa tgatatcccc gaggccgcct gcgccgacaa acgtgccgat ggccgtaatg 4440
ccgatcgcga tgacgagcgc ggttctgagc cccgccataa tgaccgacaa ggcgagggga 4500
agctccacca tccggagcac ttgaaatttc gtcatgccca tcgccttccc tgattcaaga 4560
taggcatgct cgatgctggc gattcccgta tatgtgtttc gaatgatcgg caacagcgaa 4620
tacaaaaaca atgaaagaat caccgtgttt gcgccgagcc ccatgacaag catcaagacg 4680
ggaattcctc cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct 4740
ttcaaaaaag cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg 4800
ttaaacagcg gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta 4860
tttcttcctc cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc 4920
agaatacttt tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg 4980
aagcacacgc aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc 5040
atttaaccta aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg 5100
ttcttttctg tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata 5160
cctaaataga gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat 5220
tacaataaat tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag 5280
agggtaacta gtggccccaa aaaagaaacg caaggttatg gataaaaaat acagcattgg 5340
tctggatatc ggaaccaaca gcgttgggtg ggcagtaata acagatgaat acaaagtgcc 5400
gtcaaaaaaa tttaaggttc tggggaatac agatcgccac agcataaaaa agaatctgat 5460
tggggcattg ctgtttgatt cgggtgagac agctgaggcc acgcgtctga aacgtacagc 5520
aagaagacgt tacacacgtc gtaaaaatcg tatttgctac ttacaggaaa ttttttctaa 5580
cgaaatggcc aaggtagatg atagtttctt ccatcgtctc gaagaatctt ttctggttga 5640
ggaagataaa aaacacgaac gtcaccctat ctttggcaat atcgtggatg aagtggccta 5700
tcatgaaaaa taccctacga tttatcatct tcgcaagaag ttggttgata gtacggacaa 5760
agcggatctg cgtttaatcc atcttgcgtt agcgcacatg atcaaatttc gtggtcattt 5820
cttaattgaa ggtgatctga atcctgataa ctctgatgtg gacaaattgt ttatacaatt 5880
agtgcaaacc tataatcagc tgttcgagga aaaccccatt aatgcctctg gagttgatgc 5940
caaagcgatt ttaagcgcga gactttctaa gtcccggcgt ctggagaatc tgatcgccca 6000
gttaccaggg gaaaagaaaa atggtctgtt tggtaatctg attgccctca gtctggggct 6060
taccccgaac ttcaaatcca attttgacct ggctgaggac gcaaagctgc agctgagcaa 6120
agatacttat gatgatgacc tcgacaatct gctcgcccag attggtgacc aatatgcgga 6180
tctgtttctg gcagcgaaga atctttcgga tgctatcttg ctgtcggata ttctgcgtgt 6240
taataccgaa atcaccaaag cgcctctgtc tgcaagtatg atcaagagat acgacgagca 6300
ccaccaggac ctgactcttc ttaaggcact ggtacgccaa cagcttccgg agaaatacaa 6360
agaaatattc ttcgaccagt ccaagaatgg ttacgcgggc tacatcgatg gtggtgcatc 6420
acaggaagag ttctataaat ttattaaacc aatccttgag aaaatggatg gcacggaaga 6480
gttacttgtt aaacttaacc gcgaagactt gcttagaaag caacgtacat tcgacaacgg 6540
ctccatccca caccagattc atttaggtga acttcacgcc atcttgcgca gacaagaaga 6600
tttctatccc ttcttaaaag acaatcggga gaaaatcgag aagatcctga cgttccgcat 6660
tccctattat gtcggtcccc tggcacgtgg taattctcgg tttgcctgga tgacgcgcaa 6720
aagtgaggaa accatcaccc cttggaactt tgaagaagtc gtggataaag gtgctagcgc 6780
gcagtctttt atagaaagaa tgacgaactt cgataaaaac ttgcccaacg aaaaagtcct 6840
gcccaagcac tctcttttat atgagtactt tactgtgtac aacgaactga ctaaagtgaa 6900
atacgttacg gaaggtatgc gcaaacctgc ctttcttagt ggcgagcaga aaaaagcaat 6960
tgtcgatctt ctctttaaaa cgaatcgcaa ggtaactgta aaacagctga aggaagatta 7020
tttcaaaaag atcgaatgct ttgattctgt cgagatctcg ggtgtcgaag atcgtttcaa 7080
cgcttcctta gggacctatc atgatttgct gaagataata aaagacaaag actttctcga 7140
caatgaagaa aatgaagata ttctggagga tattgttttg accttgacct tattcgaaga 7200
tagagagatg atcgaggagc gcttaaaaac ctatgcccac ctgtttgatg acaaagtcat 7260
gaagcaatta aagcgccgca gatatacggg gtggggccgc ttgagccgca agttgattaa 7320
cggtattaga gacaagcaga gcggaaaaac tatcctggat ttcctcaaat ctgacggatt 7380
tgcgaaccgc aattttatgc agcttataca tgatgattcg cttacattca aagaggatat 7440
tcagaaggct caggtgtctg ggcaaggtga ttcactccac gaacatatag caaatttggc 7500
cggctctcct gcgattaaga aggggatcct gcaaacagtt aaagttgtgg atgaacttgt 7560
aaaagtaatg ggccgccaca agccggagaa tatcgtgata gaaatggcgc gcgagaatca 7620
aacgacacaa aaaggtcaaa agaactcaag agagagaatg aagcgcattg aggaggggat 7680
aaaggaactt ggatctcaaa ttctgaaaga acatccagtt gaaaacactc agctgcaaaa 7740
tgaaaaattg tacctgtact acctgcagaa tggaagagac atgtacgtgg atcaggaatt 7800
ggatatcaat agactctcgg actatgacgt agatcacatt gtccctcaga gcttcctcaa 7860
ggatgattct atagataata aagtacttac gagatcggac aaaaatcgcg gtaaatcgga 7920
taacgtccca tcggaggaag tcgttaaaaa gatgaaaaac tattggcgtc aactgctgaa 7980
cgccaagctg atcacacagc gtaagtttga taatctgact aaagccgaac gcggtggtct 8040
tagtgaactc gataaagcag gatttataaa acggcagtta gtagaaacgc gccaaattac 8100
gaaacacgtg gctcagatcc tcgattctag aatgaataca aagtacgatg aaaacgataa 8160
actgatccgt gaagtaaaag tcattacctt aaaatctaaa cttgtgtccg atttccgcaa 8220
agattttcag ttttacaagg tccgggaaat caataactat caccatgcac atgatgcata 8280
tttaaatgcg gttgtaggca cggcccttat taagaaatac cctaaactcg aaagtgagtt 8340
tgtttatggg gattataaag tgtatgacgt tcgcaaaatg atcgcgaaat cagaacagga 8400
aatcggtaag gctaccgcta aatacttttt ttattccaac attatgaatt tttttaagac 8460
cgaaataact ctcgcgaatg gtgaaatccg taaacggcct cttatagaaa ccaatggtga 8520
aacgggagaa atcgtttggg ataaaggtcg tgactttgcc accgttcgta aagtcctctc 8580
aatgccgcaa gttaacattg tcaagaagac ggaagttcaa acagggggat tctccaaaga 8640
atctatcctg ccgaagcgta acagtgataa acttattgcc agaaaaaaag attgggatcc 8700
aaaaaaatac ggaggctttg attcccctac cgtcgcgtat agtgtgctgg tggttgctaa 8760
agtcgagaaa gggaaaagca agaaattgaa atcagttaaa gaactgctgg gtattacaat 8820
tatggaaaga tcgtcctttg agaaaaatcc gatcgacttt ttagaggcca aggggtataa 8880
ggaagtgaaa aaagatctca tcatcaaatt accgaagtat agtctttttg agctggaaaa 8940
cggcagaaaa agaatgctgg cctccgcggg cgagttacag aagggaaatg agctggcgct 9000
gccttccaaa tatgttaatt ttctgtacct tgccagtcat tatgagaaac tgaagggcag 9060
ccccgaagat aacgaacaga aacaattatt cgtggaacag cataagcact atttagatga 9120
aattatagag caaattagtg aattttctaa gcgcgttatc ctcgcggatg ctaatttaga 9180
caaagtactg tcagcttata ataaacatcg ggataagccg attagagaac aggccgaaaa 9240
tatcattcat ttgtttacct taaccaacct tggagcacca gctgccttca aatatttcga 9300
taccacaatt gatcgtaaac ggtatacaag tacaaaagaa gtcttggacg caaccctcat 9360
tcatcaatct attactggat tatatgagac acgcattgat ctttcacagc tgggcggaga 9420
caagaagaaa aaactgaaac tgcaccatca tcaccatcat catcaccatc attgataact 9480
cgagaaagct tacataaaaa accggccttg gccccgccgg ttttttatta tttttcttcc 9540
tccgcatgtt caatccgctc cataatcgac ggatggctcc ctctgaaaat tttaacgaga 9600
aacggcgggt tgacccggct cagtcccgta acggccaagt cctgaaacgt ctcaatcgcc 9660
gcttcccggt ttccggtcag ctcaatgccg taacggtcgg cggcgttttc ctgataccgg 9720
gagacggcat tcgtaatc 9738
<210> 79
<211> 23
<212> DNA
<213> Bacillus licheniformis
<400> 79
gcgagcggct caaagagctg agg 23
<210> 80
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 80
cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag cgcggcgtgc cgaagccggc 60
gacgatcaga aaactggcgg acgctttgaa agtcccgtat gaggaactga tggcatctgc 120
aggctatatc agcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 180
catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 240
gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 300
aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 360
gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 420
tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 480
gggggatggc gatgacaagg caatcataaa aagccgaatt tcccttttag gagaagttcg 540
gcttttttcg gctgccttaa gcggcatccg gattcggcgt cttgccttta tgatgcttaa 600
cggggctcag cgcacgctcg agccatccca tgaacagatc ggcgatgatc gccatcagcg 660
ccgtcgggat cgcgcctgct agaatgatcg ctgttccgtt ggtcgcgttt gatcccctga 720
caatgatatc cccgaggccg cctgcgccga caaacgtgcc gatggccgta atgccgatcg 780
cgatgacgag cgcggttctg agccccgcca taatgaccga caaggcgagg ggaagctcca 840
ccatccggag cacttgaaat ttcgtcatgc ccatcgcctt ccctgattca agataggcat 900
gctcgatgct ggcgattccc gtatatgtgt ttcgaatgat cggcaacagc gaatacaaaa 960
acaatgaaag aatcaccgtg tttgcgccga gccccatgac aagcatcaag acgg 1014
<210> 81
<211> 9724
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 81
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggagagctt ctttttcttg 240
agcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacaacc tgtcagccaa agcttgcaga gacagcggat cgcgataaga ttcctcgatg 3720
atttccacca cacgctgtgc cagctcttca tccggcagca gcgccccggc cggattgcag 3780
cgtttgcagg ggcggtaccc ttctgataaa gcatcttttg cattgaaaaa gatctgcaca 3840
ttgtcgattt gcggaactct cgatttgcag gaagggcggc aaaatatgcc ggtcgttttg 3900
accgcgtaat aaaaaactcc gtcataggcg gaatcgtttt ccgtaatcgc ccgccacatt 3960
tcaggcgtca atcgtgattt gctgttcata tcttcacccc gatctatgtc agtataacct 4020
atatgacagc cggaggtgga gaggcggaga acggcacagc aagaagacaa agaagaagag 4080
agactgttgc ctggacctcc gaaacgcgct acaattcatt tacaacacag gatggggtga 4140
gaatattgcc ggaatcagtg aagcaggtga cagaggaaag gccgatatga ttcggccttt 4200
tttatatgta cttcttagcg ggtctctaaa ataaccaaaa agcaaggact gctgaaaggg 4260
ctgacataag ccttttgccg gcggtccttt tttaattctg atttttcaaa cttagccccc 4320
tcgagaaaac cgcttgagta tcctccgctc atgttattga cctccttttc ttgatcaata 4380
tatttgtatg agcggaaaga aaatttgact agacggatgc ccctctgttg aaaatctttt 4440
tacagcatgt cagaatatga tatgatacaa ttcaaaggaa agtttaaact gttatgatta 4500
ggagtgtttg catttatgaa gaagattgca attgcggcga ttacagcgac aagcgtgctg 4560
gctctcagcg catgcagcgg gggagattct gaggttgttg cggaaacaaa agctggaaat 4620
attacaaaag aagaccttta tcaaacatta aaagacaatg ccggagcgaa ttcctccatt 4680
ttcttctgct atcaaaataa cagactcgtg attttccaaa cgagctttca aaaaagcctc 4740
tgccccttgc aaatcggatg cctgtctata aaattcccga tattggttaa acagcggcgc 4800
aatggcggcc gcatctgatg tctttgcttg gcgaatgttc atcttatttc ttcctccctc 4860
tcaataattt tttcattcta tcccttttct gtaaagttta tttttcagaa tacttttatc 4920
atcatgcttt gaaaaaatat cacgataata tccattgttc tcacggaagc acacgcaggt 4980
catttgaacg aattttttcg acaggaattt gccgggactc aggagcattt aacctaaaaa 5040
agcatgacat ttcagcataa tgaacattta ctcatgtcta ttttcgttct tttctgtatg 5100
aaaatagtta tttcgagtct ctacggaaat agcgagagat gatataccta aatagagata 5160
aaatcatctc aaaaaaatgg gtctactaaa atattattcc atctattaca ataaattcac 5220
agaatagtct tttaagtaag tctactctga atttttttaa aaggagaggg taactagtgg 5280
ccccaaaaaa gaaacgcaag gttatggata aaaaatacag cattggtctg gatatcggaa 5340
ccaacagcgt tgggtgggca gtaataacag atgaatacaa agtgccgtca aaaaaattta 5400
aggttctggg gaatacagat cgccacagca taaaaaagaa tctgattggg gcattgctgt 5460
ttgattcggg tgagacagct gaggccacgc gtctgaaacg tacagcaaga agacgttaca 5520
cacgtcgtaa aaatcgtatt tgctacttac aggaaatttt ttctaacgaa atggccaagg 5580
tagatgatag tttcttccat cgtctcgaag aatcttttct ggttgaggaa gataaaaaac 5640
acgaacgtca ccctatcttt ggcaatatcg tggatgaagt ggcctatcat gaaaaatacc 5700
ctacgattta tcatcttcgc aagaagttgg ttgatagtac ggacaaagcg gatctgcgtt 5760
taatccatct tgcgttagcg cacatgatca aatttcgtgg tcatttctta attgaaggtg 5820
atctgaatcc tgataactct gatgtggaca aattgtttat acaattagtg caaacctata 5880
atcagctgtt cgaggaaaac cccattaatg cctctggagt tgatgccaaa gcgattttaa 5940
gcgcgagact ttctaagtcc cggcgtctgg agaatctgat cgcccagtta ccaggggaaa 6000
agaaaaatgg tctgtttggt aatctgattg ccctcagtct ggggcttacc ccgaacttca 6060
aatccaattt tgacctggct gaggacgcaa agctgcagct gagcaaagat acttatgatg 6120
atgacctcga caatctgctc gcccagattg gtgaccaata tgcggatctg tttctggcag 6180
cgaagaatct ttcggatgct atcttgctgt cggatattct gcgtgttaat accgaaatca 6240
ccaaagcgcc tctgtctgca agtatgatca agagatacga cgagcaccac caggacctga 6300
ctcttcttaa ggcactggta cgccaacagc ttccggagaa atacaaagaa atattcttcg 6360
accagtccaa gaatggttac gcgggctaca tcgatggtgg tgcatcacag gaagagttct 6420
ataaatttat taaaccaatc cttgagaaaa tggatggcac ggaagagtta cttgttaaac 6480
ttaaccgcga agacttgctt agaaagcaac gtacattcga caacggctcc atcccacacc 6540
agattcattt aggtgaactt cacgccatct tgcgcagaca agaagatttc tatcccttct 6600
taaaagacaa tcgggagaaa atcgagaaga tcctgacgtt ccgcattccc tattatgtcg 6660
gtcccctggc acgtggtaat tctcggtttg cctggatgac gcgcaaaagt gaggaaacca 6720
tcaccccttg gaactttgaa gaagtcgtgg ataaaggtgc tagcgcgcag tcttttatag 6780
aaagaatgac gaacttcgat aaaaacttgc ccaacgaaaa agtcctgccc aagcactctc 6840
ttttatatga gtactttact gtgtacaacg aactgactaa agtgaaatac gttacggaag 6900
gtatgcgcaa acctgccttt cttagtggcg agcagaaaaa agcaattgtc gatcttctct 6960
ttaaaacgaa tcgcaaggta actgtaaaac agctgaagga agattatttc aaaaagatcg 7020
aatgctttga ttctgtcgag atctcgggtg tcgaagatcg tttcaacgct tccttaggga 7080
cctatcatga tttgctgaag ataataaaag acaaagactt tctcgacaat gaagaaaatg 7140
aagatattct ggaggatatt gttttgacct tgaccttatt cgaagataga gagatgatcg 7200
aggagcgctt aaaaacctat gcccacctgt ttgatgacaa agtcatgaag caattaaagc 7260
gccgcagata tacggggtgg ggccgcttga gccgcaagtt gattaacggt attagagaca 7320
agcagagcgg aaaaactatc ctggatttcc tcaaatctga cggatttgcg aaccgcaatt 7380
ttatgcagct tatacatgat gattcgctta cattcaaaga ggatattcag aaggctcagg 7440
tgtctgggca aggtgattca ctccacgaac atatagcaaa tttggccggc tctcctgcga 7500
ttaagaaggg gatcctgcaa acagttaaag ttgtggatga acttgtaaaa gtaatgggcc 7560
gccacaagcc ggagaatatc gtgatagaaa tggcgcgcga gaatcaaacg acacaaaaag 7620
gtcaaaagaa ctcaagagag agaatgaagc gcattgagga ggggataaag gaacttggat 7680
ctcaaattct gaaagaacat ccagttgaaa acactcagct gcaaaatgaa aaattgtacc 7740
tgtactacct gcagaatgga agagacatgt acgtggatca ggaattggat atcaatagac 7800
tctcggacta tgacgtagat cacattgtcc ctcagagctt cctcaaggat gattctatag 7860
ataataaagt acttacgaga tcggacaaaa atcgcggtaa atcggataac gtcccatcgg 7920
aggaagtcgt taaaaagatg aaaaactatt ggcgtcaact gctgaacgcc aagctgatca 7980
cacagcgtaa gtttgataat ctgactaaag ccgaacgcgg tggtcttagt gaactcgata 8040
aagcaggatt tataaaacgg cagttagtag aaacgcgcca aattacgaaa cacgtggctc 8100
agatcctcga ttctagaatg aatacaaagt acgatgaaaa cgataaactg atccgtgaag 8160
taaaagtcat taccttaaaa tctaaacttg tgtccgattt ccgcaaagat tttcagtttt 8220
acaaggtccg ggaaatcaat aactatcacc atgcacatga tgcatattta aatgcggttg 8280
taggcacggc ccttattaag aaatacccta aactcgaaag tgagtttgtt tatggggatt 8340
ataaagtgta tgacgttcgc aaaatgatcg cgaaatcaga acaggaaatc ggtaaggcta 8400
ccgctaaata ctttttttat tccaacatta tgaatttttt taagaccgaa ataactctcg 8460
cgaatggtga aatccgtaaa cggcctctta tagaaaccaa tggtgaaacg ggagaaatcg 8520
tttgggataa aggtcgtgac tttgccaccg ttcgtaaagt cctctcaatg ccgcaagtta 8580
acattgtcaa gaagacggaa gttcaaacag ggggattctc caaagaatct atcctgccga 8640
agcgtaacag tgataaactt attgccagaa aaaaagattg ggatccaaaa aaatacggag 8700
gctttgattc ccctaccgtc gcgtatagtg tgctggtggt tgctaaagtc gagaaaggga 8760
aaagcaagaa attgaaatca gttaaagaac tgctgggtat tacaattatg gaaagatcgt 8820
cctttgagaa aaatccgatc gactttttag aggccaaggg gtataaggaa gtgaaaaaag 8880
atctcatcat caaattaccg aagtatagtc tttttgagct ggaaaacggc agaaaaagaa 8940
tgctggcctc cgcgggcgag ttacagaagg gaaatgagct ggcgctgcct tccaaatatg 9000
ttaattttct gtaccttgcc agtcattatg agaaactgaa gggcagcccc gaagataacg 9060
aacagaaaca attattcgtg gaacagcata agcactattt agatgaaatt atagagcaaa 9120
ttagtgaatt ttctaagcgc gttatcctcg cggatgctaa tttagacaaa gtactgtcag 9180
cttataataa acatcgggat aagccgatta gagaacaggc cgaaaatatc attcatttgt 9240
ttaccttaac caaccttgga gcaccagctg ccttcaaata tttcgatacc acaattgatc 9300
gtaaacggta tacaagtaca aaagaagtct tggacgcaac cctcattcat caatctatta 9360
ctggattata tgagacacgc attgatcttt cacagctggg cggagacaag aagaaaaaac 9420
tgaaactgca ccatcatcac catcatcatc accatcattg ataactcgag aaagcttaca 9480
taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat 9540
ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac 9600
ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc 9660
ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt 9720
aatc 9724
<210> 82
<211> 23
<212> DNA
<213> Bacillus licheniformis
<400> 82
gagcttcttt ttcttgagca cgg 23
<210> 83
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 83
acctgtcagc caaagcttgc agagacagcg gatcgcgata agattcctcg atgatttcca 60
ccacacgctg tgccagctct tcatccggca gcagcgcccc ggccggattg cagcgtttgc 120
aggggcggta cccttctgat aaagcatctt ttgcattgaa aaagatctgc acattgtcga 180
tttgcggaac tctcgatttg caggaagggc ggcaaaatat gccggtcgtt ttgaccgcgt 240
aataaaaaac tccgtcatag gcggaatcgt tttccgtaat cgcccgccac atttcaggcg 300
tcaatcgtga tttgctgttc atatcttcac cccgatctat gtcagtataa cctatatgac 360
agccggaggt ggagaggcgg agaacggcac agcaagaaga caaagaagaa gagagactgt 420
tgcctggacc tccgaaacgc gctacaattc atttacaaca caggatgggg tgagaatatt 480
gccggaatca gtgaagcagg tgacagagga aaggccgata tgattcggcc ttttttatat 540
gtacttctta gcgggtctct aaaataacca aaaagcaagg actgctgaaa gggctgacat 600
aagccttttg ccggcggtcc ttttttaatt ctgatttttc aaacttagcc ccctcgagaa 660
aaccgcttga gtatcctccg ctcatgttat tgacctcctt ttcttgatca atatatttgt 720
atgagcggaa agaaaatttg actagacgga tgcccctctg ttgaaaatct ttttacagca 780
tgtcagaata tgatatgata caattcaaag gaaagtttaa actgttatga ttaggagtgt 840
ttgcatttat gaagaagatt gcaattgcgg cgattacagc gacaagcgtg ctggctctca 900
gcgcatgcag cgggggagat tctgaggttg ttgcggaaac aaaagctgga aatattacaa 960
aagaagacct ttatcaaaca ttaaaagaca atgccggagc 1000
<210> 84
<211> 9754
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 84
gggtgaagtg gtcaagacct cactaggcac cttaaaaata gcgcaccctg aagaagattt 60
atttgaggta gcccttgcct acctagcttc caagaaagat atcctaacag cacaagagcg 120
gaaagatgtt ttgttctaca tccagaacaa cctctgctaa aattcctgaa aaattttgca 180
aaaagttgtt gactttatct acaaggtgtg gcataatgtg tggatccagt tgacgtatcg 240
attcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 300
aagtggcacc gagtcggtgc gactcctgtt gatagatcca gtaatgacct cagaactcca 360
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatgtcga 420
cctcgagagt tacgctaggg ataacagggt aatataggag ctccagtcgg cttaaaccag 480
ttttcgctgg tgcgaaaaaa gagtgtcttg tgacacctaa attcaaaatc tatcggtcag 540
atttataccg atttgatttt atatattctt gaataacata cgccgagtta tcacataaaa 600
gcgggaacca atcataaaat ttaaacttca ttgcataatc cattaaactc ttaaattcta 660
cgattccttg ttcatcaata aactcaatca tttctttaat taatttatat ctatctgttg 720
ttgttttctt taataattca ttaacatcta caccgccata aactatcata tcttcttttt 780
gatatttaaa tttattagga tcgtccatgt gaagcatata tctcacaaga cctttcacac 840
ttcctgcaat ctgcggaata gtcgcattca attcttctgt taattatttt tatctgttca 900
taagatttat taccctcata catcactaga atatgataat gctctttttt catcctacct 960
tctgtatcag tatccctatc atgtaatgga gacactacaa attgaatgtg taactctttt 1020
aaatactcta accactcggc ttttgctgat tctggatata aaacaaatgt ccaattacgt 1080
cctcttgaat ttttcttgtt ttcagtttct tttattacat tttcgctcat gatataataa 1140
cggtgctaat acacttaaca aaatttagtc atagataggc agcatgccag tgctgtctat 1200
ctttttttgt ttaaaatgca ccgtattcct cctttgcata tttttttatt agaataccgg 1260
ttgcatctga tttgctaata ttatattttt ctttgattct atttaatatc tcattttctt 1320
ctgttgtaag tcttaaagta acagcaactt ttttctcttc ttttctatct acaactatca 1380
ctgtacctcc caacatctgt ttttttcact ttaacataaa aaacaacctt ttaacattaa 1440
aaacccaata tttatttatt tgtttggaca atggacactg gacacctagg ggggaggtcg 1500
tagtaccccc ctatgttttc tcccctaaat aaccccaaaa atctaagaaa aaaagacctc 1560
aaaaaggtct ttaattaaca tctcaaattt cgcatttatt ccaatttcct ttttgcgtgt 1620
gatgcgagct catcggctcc gtcgatacta tgttatacgc caactttcaa aacaactttg 1680
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 1740
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 1800
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 1860
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 1920
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgtggaacg 1980
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 2040
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 2100
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 2160
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 2220
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 2280
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 2340
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 2400
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 2460
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 2520
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 2580
actggatgaa ttgttttagt gactgcagtg agatctggta atgactctct agcttgaggc 2640
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 2700
cggtgaacgc tctcctgagt aggacaaatc cgccgctcta gctaagcaga aggccatcct 2760
gacggatggc ctttttgcgt ttctacaaac tcttgttaac tctagagctg cctgccgcgt 2820
ttcggtgatg aagatcttcc cgatgattaa ttaattcaga acgctcggtt gccgccgggc 2880
gttttttatg aagcttcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2940
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3000
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3060
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3120
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3180
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3240
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3300
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 3360
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3420
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3480
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3540
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3600
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3660
tctgacactc taatagcttc gctttgattg ttgtattatt tattttgctg atcattgtgg 3720
gctccgcttt tgtaaagtat taattcattc gcgcacgaag ccttcttccg aaaaactgca 3780
ggttcatatc gaaaggcgct ccgcttttca tatgagcctg tttttttgta atttaaaaag 3840
aatttatttc cacaataaca aaaaatgttt ataataggat aggctctgag ctgacggctg 3900
acggcgctcg gaaataaaaa ctctcccaca aatgaaactt ttatacaaca ttttcgtctt 3960
atactgttgt taaggcaatt caataacgga aaggaaaaga tcaatgttaa ataagctaag 4020
aatgttgtat gaaaaaacaa caatgaagtg gctgctcaac acttcctatt actttctcat 4080
tctggtgctg ctgtttttaa tttacggatt ccatacagca aatacaggtt catatattta 4140
taatgacttt taatggagaa gaaaacaatg aaactgattg aaacaattaa aaaataccac 4200
aaatgtgctt gatggatccg tcttattcgg aagagctgct tccggagctg agcttgttta 4260
tgttctgcgg agaaacgctt cctgcgtcag tcgccagaca gcttaaagaa agatttccaa 4320
aggctcgtgt ttttaacaca tacggcccga ccgaagcgac cgttgccgtc acttccatcg 4380
aagtaacaga cgacgtatta aacaagtatt cttctcttcc cgtcggttct gaaaagcccg 4440
aaaccgaaat cgtaatcatc aatgaagacg gaaaagccgt ccaagacggg gaaaaaggcg 4500
agatcataat taccggagca agcgtcagca aaggctattt aggcgaaaaa gcgctgacgg 4560
aaaaagcgtt tttctcttac aacggctccc ctgcttaccg caccggtgac gcaggttaca 4620
aagaaaacgg ccagctcttc ttcctcggaa gactcgattt ccaaatcaaa ctgcacggct 4680
accggattga gcttgaagaa ttcctccatt ttcttctgct atcaaaataa cagactcgtg 4740
attttccaaa cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata 4800
aaattcccga tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg 4860
gcgaatgttc atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct 4920
gtaaagttta tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata 4980
tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt 5040
gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta 5100
ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat 5160
agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa 5220
atattattcc atctattaca ataaattcac agaatagtct tttaagtaag tctactctga 5280
atttttttaa aaggagaggg taactagtgg ccccaaaaaa gaaacgcaag gttatggata 5340
aaaaatacag cattggtctg gatatcggaa ccaacagcgt tgggtgggca gtaataacag 5400
atgaatacaa agtgccgtca aaaaaattta aggttctggg gaatacagat cgccacagca 5460
taaaaaagaa tctgattggg gcattgctgt ttgattcggg tgagacagct gaggccacgc 5520
gtctgaaacg tacagcaaga agacgttaca cacgtcgtaa aaatcgtatt tgctacttac 5580
aggaaatttt ttctaacgaa atggccaagg tagatgatag tttcttccat cgtctcgaag 5640
aatcttttct ggttgaggaa gataaaaaac acgaacgtca ccctatcttt ggcaatatcg 5700
tggatgaagt ggcctatcat gaaaaatacc ctacgattta tcatcttcgc aagaagttgg 5760
ttgatagtac ggacaaagcg gatctgcgtt taatccatct tgcgttagcg cacatgatca 5820
aatttcgtgg tcatttctta attgaaggtg atctgaatcc tgataactct gatgtggaca 5880
aattgtttat acaattagtg caaacctata atcagctgtt cgaggaaaac cccattaatg 5940
cctctggagt tgatgccaaa gcgattttaa gcgcgagact ttctaagtcc cggcgtctgg 6000
agaatctgat cgcccagtta ccaggggaaa agaaaaatgg tctgtttggt aatctgattg 6060
ccctcagtct ggggcttacc ccgaacttca aatccaattt tgacctggct gaggacgcaa 6120
agctgcagct gagcaaagat acttatgatg atgacctcga caatctgctc gcccagattg 6180
gtgaccaata tgcggatctg tttctggcag cgaagaatct ttcggatgct atcttgctgt 6240
cggatattct gcgtgttaat accgaaatca ccaaagcgcc tctgtctgca agtatgatca 6300
agagatacga cgagcaccac caggacctga ctcttcttaa ggcactggta cgccaacagc 6360
ttccggagaa atacaaagaa atattcttcg accagtccaa gaatggttac gcgggctaca 6420
tcgatggtgg tgcatcacag gaagagttct ataaatttat taaaccaatc cttgagaaaa 6480
tggatggcac ggaagagtta cttgttaaac ttaaccgcga agacttgctt agaaagcaac 6540
gtacattcga caacggctcc atcccacacc agattcattt aggtgaactt cacgccatct 6600
tgcgcagaca agaagatttc tatcccttct taaaagacaa tcgggagaaa atcgagaaga 6660
tcctgacgtt ccgcattccc tattatgtcg gtcccctggc acgtggtaat tctcggtttg 6720
cctggatgac gcgcaaaagt gaggaaacca tcaccccttg gaactttgaa gaagtcgtgg 6780
ataaaggtgc tagcgcgcag tcttttatag aaagaatgac gaacttcgat aaaaacttgc 6840
ccaacgaaaa agtcctgccc aagcactctc ttttatatga gtactttact gtgtacaacg 6900
aactgactaa agtgaaatac gttacggaag gtatgcgcaa acctgccttt cttagtggcg 6960
agcagaaaaa agcaattgtc gatcttctct ttaaaacgaa tcgcaaggta actgtaaaac 7020
agctgaagga agattatttc aaaaagatcg aatgctttga ttctgtcgag atctcgggtg 7080
tcgaagatcg tttcaacgct tccttaggga cctatcatga tttgctgaag ataataaaag 7140
acaaagactt tctcgacaat gaagaaaatg aagatattct ggaggatatt gttttgacct 7200
tgaccttatt cgaagataga gagatgatcg aggagcgctt aaaaacctat gcccacctgt 7260
ttgatgacaa agtcatgaag caattaaagc gccgcagata tacggggtgg ggccgcttga 7320
gccgcaagtt gattaacggt attagagaca agcagagcgg aaaaactatc ctggatttcc 7380
tcaaatctga cggatttgcg aaccgcaatt ttatgcagct tatacatgat gattcgctta 7440
cattcaaaga ggatattcag aaggctcagg tgtctgggca aggtgattca ctccacgaac 7500
atatagcaaa tttggccggc tctcctgcga ttaagaaggg gatcctgcaa acagttaaag 7560
ttgtggatga acttgtaaaa gtaatgggcc gccacaagcc ggagaatatc gtgatagaaa 7620
tggcgcgcga gaatcaaacg acacaaaaag gtcaaaagaa ctcaagagag agaatgaagc 7680
gcattgagga ggggataaag gaacttggat ctcaaattct gaaagaacat ccagttgaaa 7740
acactcagct gcaaaatgaa aaattgtacc tgtactacct gcagaatgga agagacatgt 7800
acgtggatca ggaattggat atcaatagac tctcggacta tgacgtagat cacattgtcc 7860
ctcagagctt cctcaaggat gattctatag ataataaagt acttacgaga tcggacaaaa 7920
atcgcggtaa atcggataac gtcccatcgg aggaagtcgt taaaaagatg aaaaactatt 7980
ggcgtcaact gctgaacgcc aagctgatca cacagcgtaa gtttgataat ctgactaaag 8040
ccgaacgcgg tggtcttagt gaactcgata aagcaggatt tataaaacgg cagttagtag 8100
aaacgcgcca aattacgaaa cacgtggctc agatcctcga ttctagaatg aatacaaagt 8160
acgatgaaaa cgataaactg atccgtgaag taaaagtcat taccttaaaa tctaaacttg 8220
tgtccgattt ccgcaaagat tttcagtttt acaaggtccg ggaaatcaat aactatcacc 8280
atgcacatga tgcatattta aatgcggttg taggcacggc ccttattaag aaatacccta 8340
aactcgaaag tgagtttgtt tatggggatt ataaagtgta tgacgttcgc aaaatgatcg 8400
cgaaatcaga acaggaaatc ggtaaggcta ccgctaaata ctttttttat tccaacatta 8460
tgaatttttt taagaccgaa ataactctcg cgaatggtga aatccgtaaa cggcctctta 8520
tagaaaccaa tggtgaaacg ggagaaatcg tttgggataa aggtcgtgac tttgccaccg 8580
ttcgtaaagt cctctcaatg ccgcaagtta acattgtcaa gaagacggaa gttcaaacag 8640
ggggattctc caaagaatct atcctgccga agcgtaacag tgataaactt attgccagaa 8700
aaaaagattg ggatccaaaa aaatacggag gctttgattc ccctaccgtc gcgtatagtg 8760
tgctggtggt tgctaaagtc gagaaaggga aaagcaagaa attgaaatca gttaaagaac 8820
tgctgggtat tacaattatg gaaagatcgt cctttgagaa aaatccgatc gactttttag 8880
aggccaaggg gtataaggaa gtgaaaaaag atctcatcat caaattaccg aagtatagtc 8940
tttttgagct ggaaaacggc agaaaaagaa tgctggcctc cgcgggcgag ttacagaagg 9000
gaaatgagct ggcgctgcct tccaaatatg ttaattttct gtaccttgcc agtcattatg 9060
agaaactgaa gggcagcccc gaagataacg aacagaaaca attattcgtg gaacagcata 9120
agcactattt agatgaaatt atagagcaaa ttagtgaatt ttctaagcgc gttatcctcg 9180
cggatgctaa tttagacaaa gtactgtcag cttataataa acatcgggat aagccgatta 9240
gagaacaggc cgaaaatatc attcatttgt ttaccttaac caaccttgga gcaccagctg 9300
ccttcaaata tttcgatacc acaattgatc gtaaacggta tacaagtaca aaagaagtct 9360
tggacgcaac cctcattcat caatctatta ctggattata tgagacacgc attgatcttt 9420
cacagctggg cggagacaag aagaaaaaac tgaaactgca ccatcatcac catcatcatc 9480
accatcattg ataactcgag aaagcttaca taaaaaaccg gccttggccc cgccggtttt 9540
ttattatttt tcttcctccg catgttcaat ccgctccata atcgacggat ggctccctct 9600
gaaaatttta acgagaaacg gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg 9660
aaacgtctca atcgccgctt cccggtttcc ggtcagctca atgccgtaac ggtcggcggc 9720
gttttcctga taccgggaga cggcattcgt aatc 9754
<210> 85
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 85
tccagttgac gtatcgattc cgg 23
<210> 86
<211> 1030
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 86
ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60
ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120
atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180
ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240
tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300
tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360
tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420
ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480
ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac cacaaatgtg 540
cttgatggat ccgtcttatt cggaagagct gcttccggag ctgagcttgt ttatgttctg 600
cggagaaacg cttcctgcgt cagtcgccag acagcttaaa gaaagatttc caaaggctcg 660
tgtttttaac acatacggcc cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac 720
agacgacgta ttaaacaagt attcttctct tcccgtcggt tctgaaaagc ccgaaaccga 780
aatcgtaatc atcaatgaag acggaaaagc cgtccaagac ggggaaaaag gcgagatcat 840
aattaccgga gcaagcgtca gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc 900
gtttttctct tacaacggct cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa 960
cggccagctc ttcttcctcg gaagactcga tttccaaatc aaactgcacg gctaccggat 1020
tgagcttgaa 1030
<210> 87
<211> 1320
<212> DNA
<213> Bacillus licheniformis
<400> 87
ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60
gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120
attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180
gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240
gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300
ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360
ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420
gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480
gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540
ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600
ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660
gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720
gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780
gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840
ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900
actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960
atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020
gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080
tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140
gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200
attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260
gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320
1320
<210> 88
<211> 6393
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 88
aagcttcata tgcaagggtt tattgttttc taaaatctga ttaccaatta gaatgaatat 60
ttcccaaata ttaaataata aaacaaaaaa attgaaaaaa gtgtttccac cattttttca 120
atttttttat aattttttta atctgttatt taaatagttt atagttaaat ttacattttc 180
attagtccat tcaatattct ctccaagata actacgaact gctaacaaaa ttctctccct 240
atgttctaat ggagaagatt cagccactgc atttcccgca atatcttttg gtatgatttt 300
acccgtgtcc atagttaaaa tcatacggca taaagttaat atagagttgg tttcatcatc 360
ctgataatta tctattaatt cctctgacga atccataatg gctcttctca catcagaaaa 420
tggaatatca ggtagtaatt cctctaagtc ataatttccg tatattcttt tattttttcg 480
ttttgcttgg taaagcatta tggttaaatc tgaatttaat tccttctgag gaatgtatcc 540
ttgttcataa agctcttgta accattctcc ataaataaat tcttgtttgg gaggatgatt 600
ccacggtacc atttcttgct gaataataat tgttaattca atatatcgta agttgctttt 660
atctcctatt ttttttgaaa taggtctaat tttttgtata agtatttctt tactttgatc 720
tgtcaatggt tcagatacga cgactaaaaa gtcaagatca ctatttggtt ttagtccact 780
ctcaactcct gatccaaaca tgtaagtacc aataaggtta ttttttaaat gtttccgaag 840
tatttttttc actttattaa tttgttcgta tgtattcaaa tatatcctcc tcactatttt 900
gattagtacc tattttatat ccatagttgt taattaaata aacttaattt agtttattta 960
tggatttcat tggcttctaa attttttatc tagataataa ttattttagt taattttatt 1020
ctagattata tatgatatga tctttcattt ccataaaact aaagtaagtg taaacctatt 1080
cattgtttta aaaatatctc ttgccagtca cgttacgtta ttagttatag ttattataac 1140
atgtattcac gaacgggcgc gccggtatcc gcgcttcttg agcactattt attcaaagcc 1200
gctccagatc aatagcgctt tttcagctcc ctgaggatga attcgtatat cagctgattc 1260
cggtcttctt tcggatagag cataaattcc tgtttcttct gcatggggtt tccttcaatc 1320
ctgtcgataa attttgttct cagccatgcc gttcggtaaa cctggttttc gaaagatgag 1380
atggatacgg gcagctccag cgtttccccg ttgacaaacg tgacaaacgt gttgtcatac 1440
tttgccgcgc aaaactcgtg aacatgcgca tgggaaagcc acccgcactg aggacgagtt 1500
gaggaaaatg tggggaaaag aaaaatgttg tttgagtgat ccaccatgat cggcggttta 1560
tgggaaactt taatgacttc atatgtgccc gcttttcttc ccgcatagct cgatccgaaa 1620
tagcggcagc ttctttcgat aatttgaaac ggcttcatat tgacgcggaa agtcctgtcg 1680
gtctcaagta tttttgaggc ggatttctcc ccctcaccca gaggcaggac agccattgtc 1740
gaactgttta cttcatacgt atcctttgtc atatcctctg tgctcatgtg atttccccct 1800
taaaaataaa ttcattcaaa tacagatgca ttttatttca tatagtaagt acatcaccta 1860
ttagtttgtt gtttaaacaa actaacttat tttcatctta tataacctcg tcagtatttt 1920
caatattttt tttagttttt tatgaacaca ttagatttaa taaagggaag attcgctatg 1980
tactatgttg atacttaatt taaagattaa acaaatggag tggatgaagt ggatatcgct 2040
gatcaaacct ttgtcaaaaa agtaaatcaa aagttattat taaaagaaat ccttaaaaat 2100
tcacctattt caagagcaaa attatctgaa atgactggat taaataaatc aactgtctca 2160
tcacaggtaa acacgttaat gaaagaaagt atggtatttg aaataggtca aggacaatca 2220
agtggcggaa gaagacctgt catgcttgtt tttaataaaa aggcaggata ctccgttgga 2280
atagatgttg gtgtggatta tattaatggc attttaacag accttgaagg aacaatcgtt 2340
cttgatcaat accgccattt ggaatccaat tctccagaaa taacgaaaga cattttgatt 2400
gatatgattc atcactttat tacgcaaatg ccccaatctc cgtacgggtt tattggtata 2460
ggtacttgcg tgcctggact cattgataaa gatcaaaaaa ttgttttcac tccgaactcc 2520
aactggagag atattgactt aaaatcttcg atacaagaga agtacaatgt gtctgttttt 2580
attgaaaatg aggcaaatgc tggcgcatat ggagaaaaac tatttggagc tgcaaaaaat 2640
cacgataaca ttatttacgt aagtatcagc acaggaatag ggatcggtgt tattatcaac 2700
aatcatttat atagaggagt aagcggcttc tctggagaaa tgggacatat gacaatagac 2760
tttaatggtc ctaaatgcag ttgcggaaac cgaggatgct gggaattgta tgcttcagag 2820
aaggctttat ttaaatctct tcagaccaaa gagaaaaaac tgtcctatca agatatcata 2880
aacctcgccc atctgaatga tatcggaacc ttaaatgcat tacaaaattt tggattctat 2940
ttaggaatag gccttaccaa tattctaaat actctcaacc cacaagccgt aattttaaga 3000
aatagcataa ttgaatcgca tcctatggtt ttaaattcaa tgagaagtga agtatcatca 3060
agggtttatt cccaattagg caatagctat gaattattgc catcttcctt aggacagaat 3120
gcaccggcat taggaatgtc ctccattgtg attgatcatt ttctggacat gattacaatg 3180
taatttttta tggaatggac agctcatctt taaagatgag tttttttatt ctaggagtat 3240
ttctgaagca atagtgacat ggcaccttct catatgaaaa aggagttcta aaataaaaat 3300
ctcctttttc atgtgcaaat tatttttctt tataacgaaa atatctaaat gacaatgcat 3360
atgcaagagg ggatcacata aatatatatt ttaaaaatat cccactttat ccaattttcg 3420
tttgttgaac taatgggtgc tttagttgaa gaataaaaga ccacattaaa aaatgtggtc 3480
ttttgtgttt ttttaaagga tttgagcgta gcgaaaaatc cttttctttc ttatcttgat 3540
actatataga aacaacatca tttttcaaaa ttaggtcaaa gccttgtgta tcaagggttt 3600
gatggttctt tgacaggtaa aaactccttc tgctattatt aaatactata tagaaacaac 3660
atcatttttc aaaattaggt caaagccttg tgtatcaagg gtttgatggt tctttgacag 3720
gtaaaaactc cttctgctat tattaaggtg tcgaatcaaa ataatagaat gctagagaac 3780
tagctcagaa ggagtttttt tgttgattta ttcatctgaa aatgattata gcatcctcga 3840
agataaaacc gcaacaggta aaaagcggga ttggaagggg aaaaagagac ggacgaacct 3900
catggcggag cattacgaag cgttagagag taagattggg gcaccttact atggcaaaaa 3960
ggctgaaaaa ctaattagtt gtgcagagta tctttcgttt aagagagacc cggagacggg 4020
caagttaaaa ctgtatcaag cccatttttg taaagtgagg ttatgtccga tgtgtgcgtg 4080
gcgcaggtcg ttaaaaattg cttatcacaa taagttgatc gtagaggaag ccaatagaca 4140
gtacggctgc ggatggattt ttctcacgct gacgattcga aatgtaaagg gagaacggct 4200
gaagccacaa atttctgcga tgatggaagg ctttaggaaa ctgttccagt acaaaaaagt 4260
aaaaacttcg gttcttggat ttttcagagc tttagagatt accaaaaatc atgaagaaga 4320
tacatatcat cctcattttc atgtgttgat accagtaagg aaaaattatt ttgggaaaaa 4380
ctatattaag caggcggagt ggacgagcct ttggaaaaag gcgatgaaat tggattacac 4440
tccaattgtc gatattcgtc gagtgaaagg taaagctaag attgacgctg aacagattga 4500
aaacgatgtg cggaacgcaa tgatggagca aaaagctgtt ctcgaaatct ctaaatatcc 4560
ggttaaggat acggatgttg tgcgcggtaa taaggtgact gaagacaatc tgaacacggt 4620
gctttacttg gatgatgcgt tggcagctcg aaggttaatt ggatacggtg gcattttgaa 4680
ggagatacat aaagagctga atcttggtga tgcggaggac ggcgatctgg tcaagattga 4740
ggaagaagat gacgaggttg caaatggtgc atttgaggtt atggcttatt ggcatcctgg 4800
cattaaaaat tacataatca aataaaaaaa gcagaccttt agaaggcctg cttttttaac 4860
taacccattt gtattgtgtt gaaatatgtt ttgtatggtg cactctcagt acaatctgct 4920
ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 4980
gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5040
tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5100
gcctattttt ataggttaat gtcatgataa taatggtttc ttagcgattc acaaaaaata 5160
ggcacacgaa aaacaagtta agggatgcag tttatgcatc ccttaactta aaatactaaa 5220
aatgcccata ttttttcctc cttataaaat tagtataatt atagcacgag atctaaaagg 5280
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5340
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5400
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5460
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5520
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5580
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5640
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5700
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5760
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5820
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5880
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5940
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6000
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6060
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6120
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 6180
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 6240
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 6300
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 6360
ggaaacagct atgaccatga ttacgccgga tcc 6393
<210> 89
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 89
gtgaggagga tatatttgaa tacatacgaa caaattaata aagtgaaaaa aatacttcgg 60
aaacatttaa aaaataacct tattggtact tacatgtttg gatcaggagt tgagagtgga 120
ctaaaaccaa atagtgatct tgacttttta gtcgtcgtat ctgaaccatt gacagatcaa 180
agtaaagaaa tacttataca aaaaattaga cctatttcaa aaaaaatagg agataaaagc 240
aacttacgat atattgaatt aacaattatt attcagcaag aaatggtacc gtggaatcat 300
cctcccaaac aagaatttat ttatggagaa tggttacaag agctttatga acaaggatac 360
attcctcaga aggaattaaa ttcagattta accataatgc tttaccaagc aaaacgaaaa 420
aataaaagaa tatacggaaa ttatgactta gaggaattac tacctgatat tccattttct 480
gatgtgagaa gagccattat ggattcgtca gaggaattaa tagataatta tcaggatgat 540
gaaaccaact ctatattaac tttatgccgt atgattttaa ctatggacac gggtaaaatc 600
ataccaaaag atattgcggg aaatgcagtg gctgaatctt ctccattaga acatagggag 660
agaattttgt tagcagttcg tagttatctt ggagagaata ttgaatggac taatgaaaat 720
gtaaatttaa ctataaacta tttaaataac agattaaaaa aatta 765
<210> 90
<211> 1161
<212> DNA
<213> Bacillus subtilis
<400> 90
gtggatgaag tggatatcgc tgatcaaacc tttgtcaaaa aagtaaatca aaagttatta 60
ttaaaagaaa tccttaaaaa ttcacctatt tcaagagcaa aattatctga aatgactgga 120
ttaaataaat caactgtctc atcacaggta aacacgttaa tgaaagaaag tatggtattt 180
gaaataggtc aaggacaatc aagtggcgga agaagacctg tcatgcttgt ttttaataaa 240
aaggcaggat actccgttgg aatagatgtt ggtgtggatt atattaatgg cattttaaca 300
gaccttgaag gaacaatcgt tcttgatcaa taccgccatt tggaatccaa ttctccagaa 360
ataacgaaag acattttgat tgatatgatt catcacttta ttacgcaaat gccccaatct 420
ccgtacgggt ttattggtat aggtacttgc gtgcctggac tcattgataa agatcaaaaa 480
attgttttca ctccgaactc caactggaga gatattgact taaaatcttc gatacaagag 540
aagtacaatg tgtctgtttt tattgaaaat gaggcaaatg ctggcgcata tggagaaaaa 600
ctatttggag ctgcaaaaaa tcacgataac attatttacg taagtatcag cacaggaata 660
gggatcggtg ttattatcaa caatcattta tatagaggag taagcggctt ctctggagaa 720
atgggacata tgacaataga ctttaatggt cctaaatgca gttgcggaaa ccgaggatgc 780
tgggaattgt atgcttcaga gaaggcttta tttaaatctc ttcagaccaa agagaaaaaa 840
ctgtcctatc aagatatcat aaacctcgcc catctgaatg atatcggaac cttaaatgca 900
ttacaaaatt ttggattcta tttaggaata ggccttacca atattctaaa tactctcaac 960
ccacaagccg taattttaag aaatagcata attgaatcgc atcctatggt tttaaattca 1020
atgagaagtg aagtatcatc aagggtttat tcccaattag gcaatagcta tgaattattg 1080
ccatcttcct taggacagaa tgcaccggca ttaggaatgt cctccattgt gattgatcat 1140
tttctggaca tgattacaat g 1161
<210> 91
<211> 66
<212> DNA
<213> Bacillus subtilis
<400> 91
tgtacttact atatgaaata aaatgcatct gtatttgaat gaatttattt ttaaggggga 60
aatcac 66
<210> 92
<211> 576
<212> DNA
<213> Bacillus licheniformis
<400> 92
atgagcacag aggatatgac aaaggatacg tatgaagtaa acagttcgac aatggctgtc 60
ctgcctctgg gtgaggggga gaaatccgcc tcaaaaatac ttgagaccga caggactttc 120
cgcgtcaata tgaagccgtt tcaaattatc gaaagaagct gccgctattt cggatcgagc 180
tatgcgggaa gaaaagcggg cacatatgaa gtcattaaag tttcccataa accgccgatc 240
atggtggatc actcaaacaa catttttctt ttccccacat tttcctcaac tcgtcctcag 300
tgcgggtggc tttcccatgc gcatgttcac gagttttgcg cggcaaagta tgacaacacg 360
tttgtcacgt ttgtcaacgg ggaaacgctg gagctgcccg tatccatctc atctttcgaa 420
aaccaggttt accgaacggc atggctgaga acaaaattta tcgacaggat tgaaggaaac 480
cccatgcaga agaaacagga atttatgctc tatccgaaag aagaccggaa tcagctgata 540
tacgaattca tcctcaggga gctgaaaaag cgctat 576
<210> 93
<211> 4946
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 93
tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60
gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120
ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180
gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240
acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300
ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360
caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420
gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480
tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540
ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600
cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660
tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720
tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780
ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840
agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900
ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960
cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020
cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080
cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140
ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200
ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260
ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320
caatcgtgat ttgctgttca tatcttcacc ccgatctatg tcagtataac ctatatgaca 1380
gccggaggtg gagaggcgga gaacggcaca gcaagaagac aaagaagaag agagactgtt 1440
gcctggacct ccgaaacgcg ctacaattca tttacaacac aggatggggt gagaatattg 1500
ccggaatcag tgaagcaggc ctcctaaaat aaaaatctat attttaggag gtaaaacatg 1560
aattttcaaa caatcgagct tgacacatgg tatagaaaat cttattttga ccattacatg 1620
aaggaagcga aatgttcttt cagcatcacg gcaaacgtca atgtgacaaa tttgctcgcc 1680
gtgctcaaga aaaagaagct caagctgtat ccggctttta tttatatcgt atcaagggtc 1740
attcattcgc gccctgagtt tagaacaacg tttgatgaca aaggacagct gggttattgg 1800
gaacaaatgc atccgtgcta tgcgattttt catcaggacg accaaacgtt ttccgccctc 1860
tggacggaat actcagacga tttttcgcag ttttatcatc aatatcttct ggacgccgag 1920
cgctttggag acaaaagggg cctttgggct aagccggaca tcccgcccaa tacgttttca 1980
gtttcttcta ttccatgggt gcgcttttca aacttcaatt taaaccttga taacagcgaa 2040
cacttgctgc cgattattac aaacgggaaa tacttttcag aaggcaggga aacatttttg 2100
cccgtttcct tgcaagttca ccatgcagtg tgtgacggct atcatgccgg cgcttttata 2160
aacgagttgg aacggcttgc cgccgattgt gaggagtggc ttgtgtgaca gaggaaaggc 2220
cgatatgatt cggccttttt tatatgtact tcttagcggg tctctaaaat aaccaaaaag 2280
caaggactgc tgaaagggct gacataagcc ttttgccggc ggtccttttt taattctgat 2340
ttttcaaact tagccccctc gagaaaaccg cttgagtatc ctccgctcat gttattgacc 2400
tccttttctt gatcaatata tttgtatgag cggaaagaaa atttgactag acggatgccc 2460
ctctgttgaa aatcttttta cagcatgtca gaatatgata tgatacaatt caaaggaaag 2520
tttaaactgt tatgattagg agtgtttgca tttatgaaga agattgcaat tgcggcgatt 2580
acagcgacaa gcgtgctggc tctcagcgca tgcagcgggg gagattctga ggttgttgcg 2640
gaaacaaaag ctggaaatat tacaaaagaa gacctttatc aaacattaaa agacaatgcc 2700
ggagcggacg cactgaacat gcttgttcag caaaaagtac tcgatgataa atacgatgtc 2760
tccgacaaag aaatcgacaa aaagctgaac gagtacaaaa aatcaatggg tgaccagctc 2820
aaccagctca ttgaccaaaa aggcgaagac ttcgtcaaag aacagatcaa atacgaactt 2880
ctgatgcaaa aagccgcaaa ggataacata aaagtaaccg atgatgacgt aaaagaatat 2940
tatgacggcc tgaaaggcaa aatccactta agccacattc ttgtgaaaga aaagaaaacg 3000
gctgaagaag ttgagaaaaa gctgaaaaaa ggcgaaaaat tcgaagacct tgcaaaagag 3060
tattcaactg acggtacagc cgaaaaaggc ggcgacctcg gctgggtcgg caaagacgat 3120
aacatggaca aggatttcgt caaagcggca tttgctttga aaaccggcga aatcagcgga 3180
cctgtgaaat cccaattcgg ctatcacatc attaaaaaag acgaagaacg cggcaaatat 3240
gaagacatga aaaaagagct taaaaaagaa gtccaagaac aaaagcaaaa tgatcaaact 3300
gaactgcaat ccgtcattga caaacttgtc aaagatgctg atttaaaagt aaaagacaaa 3360
gagttgaaaa aacaagtcga ccagcgtcaa gctcagacaa gcagcagcag ctgaaagagc 3420
agagaggacg gatttcctga aggaaatccg tttttttatt tttaacatct ctcactgctg 3480
tgtgatttta ctcacggcat ttggaacgcc ggctctcaac aaactttctg tagtgaaaat 3540
catgaaccaa acggatcgtc ggcctgatta acagctgaaa gctgccgatc acaaacatcc 3600
atagtcccgc cggcttcagt tcctcggaga aaaagcagaa gctcccgaca aggaataaaa 3660
ggccgatgag aaaatcgttt aatgtatgta gaactttgta tctttttttg aaaaagagtt 3720
catatcgatt gttattgttt tgcggcattg cttgatcact ccaatccttt tatttaccct 3780
gccggaagcc ggagtgaaac gccggtatac ataggattta tgaattagga aaacatatgg 3840
ggaaataaac catccaggag tgaaaaatat gcggttattc atatgtgcat cgtgcctgtt 3900
cggcttgatt gttccgtcat ttgaaacgaa agcgctgacg tttgaagaat tgccggttaa 3960
acaagcttca aaacaatggg aagttcaaat cggtaaagcc gaagccggaa acggaatggc 4020
gaaaccggaa aaaggagcgt ttcatactta tgctgtcgaa atcaaaaaca ttggacacga 4080
tgtggcttcg gcggaaattt ttgtctatcg gaacgagcct aattcttcaa cgaaattttc 4140
gctttggaac attcctcacg aaaatccggt ttctttagcc aaaagcttaa atcacggaag 4200
ctctgtcaag caccgcaatc tgcttatggc agagaatgcg accgaattgg aagtggacat 4260
gatttggacg gaaaaaggaa gcgaaggcag acttttaaag gaaacgttca ttttcaaggg 4320
agatgaatca tgaagaaaaa atggccgttc atcgtcaacg gtcttttttt aatgacttag 4380
gcagccgatc gttcggccat acgatatcga agcgacctcg aaccagcaga gctcgtcaca 4440
aaacatttgc atttaaagaa aaatacagga tgttttcacc aatatttttc tcaatgatga 4500
tacactattg acaagctgct actttgggag ggtgtttcca tagatgccga tgaagcaaaa 4560
acaccaaatg tgtcatgaga gctctctcta atcgatataa aagtagggtg aaccggggtt 4620
gtcaatctgt aaaagatctt tttttatccc gtgatacgct tttggaattc tgaatcttca 4680
agaaagtccc cagccttttg ctgatcaatc gagaacaaag gatgatacat atgaaaagaa 4740
tagataaaat ctaccatcag ctgctggata attttcgcga aaagaatatc aatcagcttt 4800
taaagataca agggaattcg gctaaagaaa tcgccgggca gctgcaaatg gagcgttcca 4860
atgtcagctt tgaattaaac aatctcgttc gggccaaaaa ggtgatcaag attaaaacgt 4920
tccccgtccg ctacatcccg gtggaa 4946
<210> 94
<211> 1341
<212> DNA
<213> Bacillus licheniformis
<400> 94
tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60
gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120
ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180
gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240
acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300
ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360
caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420
gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480
tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540
ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600
cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660
tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720
tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780
ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840
agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900
ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960
cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020
cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080
cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140
ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200
ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260
ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320
caatcgtgat ttgctgttca t 1341
<210> 95
<211> 216
<212> DNA
<213> Bacillus licheniformis
<400> 95
atcttcaccc cgatctatgt cagtataacc tatatgacag ccggaggtgg agaggcggag 60
aacggcacag caagaagaca aagaagaaga gagactgttg cctggacctc cgaaacgcgc 120
tacaattcat ttacaacaca ggatggggtg agaatattgc cggaatcagt gaagcaggcc 180
tcctaaaata aaaatctata ttttaggagg taaaac 216
<210> 96
<211> 648
<212> DNA
<213> Bacillus licheniformis
<400> 96
atgaattttc aaacaatcga gcttgacaca tggtatagaa aatcttattt tgaccattac 60
atgaaggaag cgaaatgttc tttcagcatc acggcaaacg tcaatgtgac aaatttgctc 120
gccgtgctca agaaaaagaa gctcaagctg tatccggctt ttatttatat cgtatcaagg 180
gtcattcatt cgcgccctga gtttagaaca acgtttgatg acaaaggaca gctgggttat 240
tgggaacaaa tgcatccgtg ctatgcgatt tttcatcagg acgaccaaac gttttccgcc 300
ctctggacgg aatactcaga cgatttttcg cagttttatc atcaatatct tctggacgcc 360
gagcgctttg gagacaaaag gggcctttgg gctaagccgg acatcccgcc caatacgttt 420
tcagtttctt ctattccatg ggtgcgcttt tcaaacttca atttaaacct tgataacagc 480
gaacacttgc tgccgattat tacaaacggg aaatactttt cagaaggcag ggaaacattt 540
ttgcccgttt ccttgcaagt tcaccatgca gtgtgtgacg gctatcatgc cggcgctttt 600
ataaacgagt tggaacggct tgccgccgat tgtgaggagt ggcttgtg 648
<210> 97
<211> 149
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 97
aaaggccgat atgattcggc cttttttata tgtacttctt agcgggtctc taaaataacc 60
aaaaagcaag gactgctgaa agggctgaca taagcctttt gccggcggtc cttttttaat 120
tctgattttt caaacttagc cccctcgag 149
<210> 98
<211> 60
<212> DNA
<213> Bacillus licheniformis
<400> 98
tgacagagga aaggccgata tgattcggcc ttttttatat gtacttctta gcgggtctct 60
60
<210> 99
<211> 98
<212> DNA
<213> Bacillus subtilis
<400> 99
aaaataacca aaaagcaagg actgctgaaa gggctgacat aagccttttg ccggcggtcc 60
ttttttaatt ctgatttttc aaacttagcc ccctcgag 98
<210> 100
<211> 190
<212> DNA
<213> Bacillus licheniformis
<400> 100
aaaaccgctt gagtatcctc cgctcatgtt attgacctcc ttttcttgat caatatattt 60
gtatgagcgg aaagaaaatt tgactagacg gatgcccctc tgttgaaaat ctttttacag 120
catgtcagaa tatgatatga tacaattcaa aggaaagttt aaactgttat gattaggagt 180
gtttgcattt 190
<210> 101
<211> 861
<212> DNA
<213> Bacillus licheniformis
<400> 101
atgaagaaga ttgcaattgc ggcgattaca gcgacaagcg tgctggctct cagcgcatgc 60
agcgggggag attctgaggt tgttgcggaa acaaaagctg gaaatattac aaaagaagac 120
ctttatcaaa cattaaaaga caatgccgga gcggacgcac tgaacatgct tgttcagcaa 180
aaagtactcg atgataaata cgatgtctcc gacaaagaaa tcgacaaaaa gctgaacgag 240
tacaaaaaat caatgggtga ccagctcaac cagctcattg accaaaaagg cgaagacttc 300
gtcaaagaac agatcaaata cgaacttctg atgcaaaaag ccgcaaagga taacataaaa 360
gtaaccgatg atgacgtaaa agaatattat gacggcctga aaggcaaaat ccacttaagc 420
cacattcttg tgaaagaaaa gaaaacggct gaagaagttg agaaaaagct gaaaaaaggc 480
gaaaaattcg aagaccttgc aaaagagtat tcaactgacg gtacagccga aaaaggcggc 540
gacctcggct gggtcggcaa agacgataac atggacaagg atttcgtcaa agcggcattt 600
gctttgaaaa ccggcgaaat cagcggacct gtgaaatccc aattcggcta tcacatcatt 660
aaaaaagacg aagaacgcgg caaatatgaa gacatgaaaa aagagcttaa aaaagaagtc 720
caagaacaaa agcaaaatga tcaaactgaa ctgcaatccg tcattgacaa acttgtcaaa 780
gatgctgatt taaaagtaaa agacaaagag ttgaaaaaac aagtcgacca gcgtcaagct 840
cagacaagca gcagcagctg a 861
<210> 102
<211> 34
<212> DNA
<213> Bacillus licheniformis
<400> 102
cggatttcct gaaggaaatc cgttttttta tttt 34
<210> 103
<211> 1484
<212> DNA
<213> Bacillus licheniformis
<400> 103
taacatctct cactgctgtg tgattttact cacggcattt ggaacgccgg ctctcaacaa 60
actttctgta gtgaaaatca tgaaccaaac ggatcgtcgg cctgattaac agctgaaagc 120
tgccgatcac aaacatccat agtcccgccg gcttcagttc ctcggagaaa aagcagaagc 180
tcccgacaag gaataaaagg ccgatgagaa aatcgtttaa tgtatgtaga actttgtatc 240
tttttttgaa aaagagttca tatcgattgt tattgttttg cggcattgct tgatcactcc 300
aatcctttta tttaccctgc cggaagccgg agtgaaacgc cggtatacat aggatttatg 360
aattaggaaa acatatgggg aaataaacca tccaggagtg aaaaatatgc ggttattcat 420
atgtgcatcg tgcctgttcg gcttgattgt tccgtcattt gaaacgaaag cgctgacgtt 480
tgaagaattg ccggttaaac aagcttcaaa acaatgggaa gttcaaatcg gtaaagccga 540
agccggaaac ggaatggcga aaccggaaaa aggagcgttt catacttatg ctgtcgaaat 600
caaaaacatt ggacacgatg tggcttcggc ggaaattttt gtctatcgga acgagcctaa 660
ttcttcaacg aaattttcgc tttggaacat tcctcacgaa aatccggttt ctttagccaa 720
aagcttaaat cacggaagct ctgtcaagca ccgcaatctg cttatggcag agaatgcgac 780
cgaattggaa gtggacatga tttggacgga aaaaggaagc gaaggcagac ttttaaagga 840
aacgttcatt ttcaagggag atgaatcatg aagaaaaaat ggccgttcat cgtcaacggt 900
ctttttttaa tgacttaggc agccgatcgt tcggccatac gatatcgaag cgacctcgaa 960
ccagcagagc tcgtcacaaa acatttgcat ttaaagaaaa atacaggatg ttttcaccaa 1020
tatttttctc aatgatgata cactattgac aagctgctac tttgggaggg tgtttccata 1080
gatgccgatg aagcaaaaac accaaatgtg tcatgagagc tctctctaat cgatataaaa 1140
gtagggtgaa ccggggttgt caatctgtaa aagatctttt tttatcccgt gatacgcttt 1200
tggaattctg aatcttcaag aaagtcccca gccttttgct gatcaatcga gaacaaagga 1260
tgatacatat gaaaagaata gataaaatct accatcagct gctggataat tttcgcgaaa 1320
agaatatcaa tcagctttta aagatacaag ggaattcggc taaagaaatc gccgggcagc 1380
tgcaaatgga gcgttccaat gtcagctttg aattaaacaa tctcgttcgg gccaaaaagg 1440
tgatcaagat taaaacgttc cccgtccgct acatcccggt ggaa 1484
<210> 104
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 104
tcgttctgaa tgagcaagca 20
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 105
tgttaatcag gccgacgatc 20
<210> 106
<211> 2676
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 106
tcgttctgaa tgagcaagca aatcgaccgc tttctcaatc cttttctgca ggatgtattc 60
tgccggcgag acgcctttga ttcgtttaaa tgtccgctgc aggtgaaaag ggctgatatg 120
gcacctgtca gccaaagctt gcagagacag cggatcgcga taagattcct cgatgatttc 180
caccacacgc tgtgccagct cttcatccgg cagcagcgcc ccggccggat tgcagcgttt 240
gcaggggcgg tacccttctg ataaagcatc ttttgcattg aaaaagatct gcacattgtc 300
gatttgcgga actctcgatt tgcaggaagg gcggcaaaat atgccggtcg ttttgaccgc 360
gtaataaaaa actccgtcat aggcggaatc gttttccgta atcgcccgcc acatttcagg 420
cgtcaatcgt gatttgctgt tcatatcttc accccgatct atgtcagtat aacctatatg 480
acagccggag gtggagaggc ggagaacggc acagcaagaa gacaaagaag aagagagact 540
gttgcctgga cctccgaaac gcgctacaat tcatttacaa cacaggatgg ggtgagaata 600
ttgccggaat cagtgaagca ggcctcctaa aataaaaatc tatattttag gaggtaaaac 660
atgaattttc aaacaatcga gcttgacaca tggtatagaa aatcttattt tgaccattac 720
atgaaggaag cgaaatgttc tttcagcatc acggcaaacg tcaatgtgac aaatttgctc 780
gccgtgctca agaaaaagaa gctcaagctg tatccggctt ttatttatat cgtatcaagg 840
gtcattcatt cgcgccctga gtttagaaca acgtttgatg acaaaggaca gctgggttat 900
tgggaacaaa tgcatccgtg ctatgcgatt tttcatcagg acgaccaaac gttttccgcc 960
ctctggacgg aatactcaga cgatttttcg cagttttatc atcaatatct tctggacgcc 1020
gagcgctttg gagacaaaag gggcctttgg gctaagccgg acatcccgcc caatacgttt 1080
tcagtttctt ctattccatg ggtgcgcttt tcaaacttca atttaaacct tgataacagc 1140
gaacacttgc tgccgattat tacaaacggg aaatactttt cagaaggcag ggaaacattt 1200
ttgcccgttt ccttgcaagt tcaccatgca gtgtgtgacg gctatcatgc cggcgctttt 1260
ataaacgagt tggaacggct tgccgccgat tgtgaggagt ggcttgtgtg acagaggaaa 1320
ggccgatatg attcggcctt ttttatatgt acttcttagc gggtctctaa aataaccaaa 1380
aagcaaggac tgctgaaagg gctgacataa gccttttgcc ggcggtcctt ttttaattct 1440
gatttttcaa acttagcccc ctcgagaaaa ccgcttgagt atcctccgct catgttattg 1500
acctcctttt cttgatcaat atatttgtat gagcggaaag aaaatttgac tagacggatg 1560
cccctctgtt gaaaatcttt ttacagcatg tcagaatatg atatgataca attcaaagga 1620
aagtttaaac tgttatgatt aggagtgttt gcatttatga agaagattgc aattgcggcg 1680
attacagcga caagcgtgct ggctctcagc gcatgcagcg ggggagattc tgaggttgtt 1740
gcggaaacaa aagctggaaa tattacaaaa gaagaccttt atcaaacatt aaaagacaat 1800
gccggagcgg acgcactgaa catgcttgtt cagcaaaaag tactcgatga taaatacgat 1860
gtctccgaca aagaaatcga caaaaagctg aacgagtaca aaaaatcaat gggtgaccag 1920
ctcaaccagc tcattgacca aaaaggcgaa gacttcgtca aagaacagat caaatacgaa 1980
cttctgatgc aaaaagccgc aaaggataac ataaaagtaa ccgatgatga cgtaaaagaa 2040
tattatgacg gcctgaaagg caaaatccac ttaagccaca ttcttgtgaa agaaaagaaa 2100
acggctgaag aagttgagaa aaagctgaaa aaaggcgaaa aattcgaaga ccttgcaaaa 2160
gagtattcaa ctgacggtac agccgaaaaa ggcggcgacc tcggctgggt cggcaaagac 2220
gataacatgg acaaggattt cgtcaaagcg gcatttgctt tgaaaaccgg cgaaatcagc 2280
ggacctgtga aatcccaatt cggctatcac atcattaaaa aagacgaaga acgcggcaaa 2340
tatgaagaca tgaaaaaaga gcttaaaaaa gaagtccaag aacaaaagca aaatgatcaa 2400
actgaactgc aatccgtcat tgacaaactt gtcaaagatg ctgatttaaa agtaaaagac 2460
aaagagttga aaaaacaagt cgaccagcgt caagctcaga caagcagcag cagctgaaag 2520
agcagagagg acggatttcc tgaaggaaat ccgttttttt atttttaaca tctctcactg 2580
ctgtgtgatt ttactcacgg catttggaac gccggctctc aacaaacttt ctgtagtgaa 2640
aatcatgaac caaacggatc gtcggcctga ttaaca 2676
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 107
aacctatatg acagccggag 20
<210> 108
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 108
ggcaaaatcc acttaagcca c 21
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 109
aacgagttgg aacggcttgc 20
<210> 110
<211> 686
<212> DNA
<213> Bacillus licheniformis
<400> 110
cctcctaaaa taaaaatcta tattttagga ggtaaaacat gaattttcaa acaatcgagc 60
ttgacacatg gtatagaaaa tcttattttg accattacat gaaggaagcg aaatgttctt 120
tcagcatcac ggcaaacgtc aatgtgacaa atttgctcgc cgtgctcaag aaaaagaagc 180
tcaagctgta tccggctttt atttatatcg tatcaagggt cattcattcg cgccctgagt 240
ttagaacaac gtttgatgac aaaggacagc tgggttattg ggaacaaatg catccgtgct 300
atgcgatttt tcatcaggac gaccaaacgt tttccgccct ctggacggaa tactcagacg 360
atttttcgca gttttatcat caatatcttc tggacgccga gcgctttgga gacaaaaggg 420
gcctttgggc taagccggac atcccgccca atacgttttc agtttcttct attccatggg 480
tgcgcttttc aaacttcaat ttaaaccttg ataacagcga acacttgctg ccgattatta 540
caaacgggaa atacttttca gaaggcaggg aaacattttt gcccgtttcc ttgcaagttc 600
accatgcagt gtgtgacggc tatcatgccg gcgcttttat aaacgagttg gaacggcttg 660
ccgccgattg tgaggagtgg cttgtg 686
<210> 111
<211> 4260
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 111
tcgcggacaa gtacggcaag acaccggccc aagtcatttt gcgctgggat ttgcaaaacg 60
gggtcgttac gattccgaag tcgactaaag cggagcggat tgcccaaaac gcggacatat 120
ttgattttga actgaccacc gaggaaatga agcaaattga cgcgctgaat gaaaacaccc 180
gtgtcggccc tgatcccgat aactttgact tttaacaaaa cggccccgtt cgacattcga 240
acggggcttt aattgaattg tgcggttaca ccgccggact ccatcatcat cagttctttt 300
ttcatatcca atccgccccg gtatcccgtg agctgcccgc ttttaccgat aacccgatgg 360
caaggcacca ccattaacag cggatttgcg ccgatcgccg cgcctactgc ccgcacagcg 420
gcctgctttt caatatgctc ggcgatatcg gaataggagc aagtgctgcc gtaagggatt 480
tcggagagcg ccttccacac tgccagctga aaaggcgtgc cggcaaggtc gacaggaaag 540
ctgaaatgag ttcgcttgcc gttcaaatac gcctgcagct gctcggcgta ttctgccaat 600
cctttgtcat cccgaatgaa aactggctgt gtaaatcttt tttcagccca agcggccaaa 660
tcctcgaagc cttgattcca tccccctgta aaacagagcc cgcgggcagt cgccccaatg 720
tgaatctgcc aacctcggca aataagcgta cgccagtata cgatttgatc gtccatatgt 780
ttacctccgt ttcatttgcc ggtacgacgt cggcgattgc ccagtcttct ttttaaacaa 840
agaggcaaaa tattccgcat tcgcaatgcc taccattgaa gcgatttctg cgatcgatcg 900
ttctgaatga gcaagcaaat cgaccgcttt ctcaatcctt ttctgcagga tgtattctgc 960
cggcgagacg cctttgattc gtttaaatgt ccgctgcagg tgaaaagggc tgatatggca 1020
cctgtcagcc aaagcttgca gagacagcgg atcgcgataa gattcctcga tgatttccac 1080
cacacgctgt gccagctctt catccggcag cagcgccccg gccggattgc agcgtttgca 1140
ggggcggtac ccttctgata aagcatcttt tgcattgaaa aagatctgca cattgtcgat 1200
ttgcggaact ctcgatttgc aggaagggcg gcaaaatatg ccggtcgttt tgaccgcgta 1260
ataaaaaact ccgtcatagg cggaatcgtt ttccgtaatc gcccgccaca tttcaggcgt 1320
caatcgtgat ttgctgttca tatcttcacc ccgatctatg tcagtataac ctatatgaca 1380
gccggaggtg gagaggcgga gaacggcaca gcaagaagac aaagaagaag agagactgtt 1440
gcctggacct ccgaaacgcg ctacaattca tttacaacac aggatggggt gagaatattg 1500
ccggaatcag tgaagcaggt gacagaggaa aggccgatat gattcggcct tttttatatg 1560
tacttcttag cgggtctcta aaataaccaa aaagcaagga ctgctgaaag ggctgacata 1620
agccttttgc cggcggtcct tttttaattc tgatttttca aacttagccc cctcgagaaa 1680
accgcttgag tatcctccgc tcatgttatt gacctccttt tcttgatcaa tatatttgta 1740
tgagcggaaa gaaaatttga ctagacggat gcccctctgt tgaaaatctt tttacagcat 1800
gtcagaatat gatatgatac aattcaaagg aaagtttaaa ctgttatgat taggagtgtt 1860
tgcatttatg aagaagattg caattgcggc gattacagcg acaagcgtgc tggctctcag 1920
cgcatgcagc gggggagatt ctgaggttgt tgcggaaaca aaagctggaa atattacaaa 1980
agaagacctt tatcaaacat taaaagacaa tgccggagcg gacgcactga acatgcttgt 2040
tcagcaaaaa gtactcgatg ataaatacga tgtctccgac aaagaaatcg acaaaaagct 2100
gaacgagtac aaaaaatcaa tgggtgacca gctcaaccag ctcattgacc aaaaaggcga 2160
agacttcgtc aaagaacaga tcaaatacga acttctgatg caaaaagccg caaaggataa 2220
cataaaagta accgatgatg acgtaaaaga atattatgac ggcctgaaag gcaaaatcca 2280
cttaagccac attcttgtga aagaaaagaa aacggctgaa gaagttgaga aaaagctgaa 2340
aaaaggcgaa aaattcgaag accttgcaaa agagtattca actgacggta cagccgaaaa 2400
aggcggcgac ctcggctggg tcggcaaaga cgataacatg gacaaggatt tcgtcaaagc 2460
ggcatttgct ttgaaaaccg gcgaaatcag cggacctgtg aaatcccaat tcggctatca 2520
catcattaaa aaagacgaag aacgcggcaa atatgaagac atgaaaaaag agcttaaaaa 2580
agaagtccaa gaacaaaagc aaaatgatca aactgaactg caatccgtca ttgacaaact 2640
tgtcaaagat gctgatttaa aagtaaaaga caaagagttg aaaaaacaag tcgaccagcg 2700
tcaagctcag acaagcagca gcagctgaaa gagcagagag gacggatttc ctgaaggaaa 2760
tccgtttttt tatttttaac atctctcact gctgtgtgat tttactcacg gcatttggaa 2820
cgccggctct caacaaactt tctgtagtga aaatcatgaa ccaaacggat cgtcggcctg 2880
attaacagct gaaagctgcc gatcacaaac atccatagtc ccgccggctt cagttcctcg 2940
gagaaaaagc agaagctccc gacaaggaat aaaaggccga tgagaaaatc gtttaatgta 3000
tgtagaactt tgtatctttt tttgaaaaag agttcatatc gattgttatt gttttgcggc 3060
attgcttgat cactccaatc cttttattta ccctgccgga agccggagtg aaacgccggt 3120
atacatagga tttatgaatt aggaaaacat atggggaaat aaaccatcca ggagtgaaaa 3180
atatgcggtt attcatatgt gcatcgtgcc tgttcggctt gattgttccg tcatttgaaa 3240
cgaaagcgct gacgtttgaa gaattgccgg ttaaacaagc ttcaaaacaa tgggaagttc 3300
aaatcggtaa agccgaagcc ggaaacggaa tggcgaaacc ggaaaaagga gcgtttcata 3360
cttatgctgt cgaaatcaaa aacattggac acgatgtggc ttcggcggaa atttttgtct 3420
atcggaacga gcctaattct tcaacgaaat tttcgctttg gaacattcct cacgaaaatc 3480
cggtttcttt agccaaaagc ttaaatcacg gaagctctgt caagcaccgc aatctgctta 3540
tggcagagaa tgcgaccgaa ttggaagtgg acatgatttg gacggaaaaa ggaagcgaag 3600
gcagactttt aaaggaaacg ttcattttca agggagatga atcatgaaga aaaaatggcc 3660
gttcatcgtc aacggtcttt ttttaatgac ttaggcagcc gatcgttcgg ccatacgata 3720
tcgaagcgac ctcgaaccag cagagctcgt cacaaaacat ttgcatttaa agaaaaatac 3780
aggatgtttt caccaatatt tttctcaatg atgatacact attgacaagc tgctactttg 3840
ggagggtgtt tccatagatg ccgatgaagc aaaaacacca aatgtgtcat gagagctctc 3900
tctaatcgat ataaaagtag ggtgaaccgg ggttgtcaat ctgtaaaaga tcttttttta 3960
tcccgtgata cgcttttgga attctgaatc ttcaagaaag tccccagcct tttgctgatc 4020
aatcgagaac aaaggatgat acatatgaaa agaatagata aaatctacca tcagctgctg 4080
gataattttc gcgaaaagaa tatcaatcag cttttaaaga tacaagggaa ttcggctaaa 4140
gaaatcgccg ggcagctgca aatggagcgt tccaatgtca gctttgaatt aaacaatctc 4200
gttcgggcca aaaaggtgat caagattaaa acgttccccg tccgctacat cccggtggaa 4260
4260
<210> 112
<211> 1990
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 112
tcgttctgaa tgagcaagca aatcgaccgc tttctcaatc cttttctgca ggatgtattc 60
tgccggcgag acgcctttga ttcgtttaaa tgtccgctgc aggtgaaaag ggctgatatg 120
gcacctgtca gccaaagctt gcagagacag cggatcgcga taagattcct cgatgatttc 180
caccacacgc tgtgccagct cttcatccgg cagcagcgcc ccggccggat tgcagcgttt 240
gcaggggcgg tacccttctg ataaagcatc ttttgcattg aaaaagatct gcacattgtc 300
gatttgcgga actctcgatt tgcaggaagg gcggcaaaat atgccggtcg ttttgaccgc 360
gtaataaaaa actccgtcat aggcggaatc gttttccgta atcgcccgcc acatttcagg 420
cgtcaatcgt gatttgctgt tcatatcttc accccgatct atgtcagtat aacctatatg 480
acagccggag gtggagaggc ggagaacggc acagcaagaa gacaaagaag aagagagact 540
gttgcctgga cctccgaaac gcgctacaat tcatttacaa cacaggatgg ggtgagaata 600
ttgccggaat cagtgaagca ggtgacagag gaaaggccga tatgattcgg ccttttttat 660
atgtacttct tagcgggtct ctaaaataac caaaaagcaa ggactgctga aagggctgac 720
ataagccttt tgccggcggt ccttttttaa ttctgatttt tcaaacttag ccccctcgag 780
aaaaccgctt gagtatcctc cgctcatgtt attgacctcc ttttcttgat caatatattt 840
gtatgagcgg aaagaaaatt tgactagacg gatgcccctc tgttgaaaat ctttttacag 900
catgtcagaa tatgatatga tacaattcaa aggaaagttt aaactgttat gattaggagt 960
gtttgcattt atgaagaaga ttgcaattgc ggcgattaca gcgacaagcg tgctggctct 1020
cagcgcatgc agcgggggag attctgaggt tgttgcggaa acaaaagctg gaaatattac 1080
aaaagaagac ctttatcaaa cattaaaaga caatgccgga gcggacgcac tgaacatgct 1140
tgttcagcaa aaagtactcg atgataaata cgatgtctcc gacaaagaaa tcgacaaaaa 1200
gctgaacgag tacaaaaaat caatgggtga ccagctcaac cagctcattg accaaaaagg 1260
cgaagacttc gtcaaagaac agatcaaata cgaacttctg atgcaaaaag ccgcaaagga 1320
taacataaaa gtaaccgatg atgacgtaaa agaatattat gacggcctga aaggcaaaat 1380
ccacttaagc cacattcttg tgaaagaaaa gaaaacggct gaagaagttg agaaaaagct 1440
gaaaaaaggc gaaaaattcg aagaccttgc aaaagagtat tcaactgacg gtacagccga 1500
aaaaggcggc gacctcggct gggtcggcaa agacgataac atggacaagg atttcgtcaa 1560
agcggcattt gctttgaaaa ccggcgaaat cagcggacct gtgaaatccc aattcggcta 1620
tcacatcatt aaaaaagacg aagaacgcgg caaatatgaa gacatgaaaa aagagcttaa 1680
aaaagaagtc caagaacaaa agcaaaatga tcaaactgaa ctgcaatccg tcattgacaa 1740
acttgtcaaa gatgctgatt taaaagtaaa agacaaagag ttgaaaaaac aagtcgacca 1800
gcgtcaagct cagacaagca gcagcagctg aaagagcaga gaggacggat ttcctgaagg 1860
aaatccgttt ttttattttt aacatctctc actgctgtgt gattttactc acggcatttg 1920
gaacgccggc tctcaacaaa ctttctgtag tgaaaatcat gaaccaaacg gatcgtcggc 1980
ctgattaaca 1990
<210> 113
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 113
gggtacctcc atggtaaagt 20
<210> 114
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 114
acgtattaat gcagtagccg 20
<210> 115
<211> 2067
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 115
gggtacctcc atggtaaagt ttcgacttaa agcggagatc aaaaaatagc ctggtttacc 60
attttccaca tttttaaatt tatacccctt tcaaaagtca taaaactatc atattctgta 120
ataccacttt tcggaggtga gaatatgtca tactctaata gcttcgcttt gattgttgta 180
ttatttattt tgctgatcat tgtgggctcc gcttttgtaa agtattaatt cattcgcgca 240
cgaagccttc ttccgaaaaa ctgcaggttc atatcgaaag gcgctccgct tttcatatga 300
gcctgttttt ttgtaattta aaaagaattt atttccacaa taacaaaaaa tgtttataat 360
aggataggct ctgagctgac ggctgacggc gctcggaaat aaaaactctc ccacaaatga 420
aacttttata caacattttc gtcttatact gttgttaagg caattcaata acggaaagga 480
aaagatcaat gttaaataag ctaagaatgt tgtatgaaaa aacaacaatg aagtggctgc 540
tcaacacttc ctattacttt ctcattctgg tgctgctgtt tttaatttac ggattccata 600
cagcaaatac aggttcatat atttataatg acttttaatg gagaagaaaa caatgaaact 660
gattgaaaca attaaaaaat accacaaatg tgcttgatgg atccgtctta ttcggaagag 720
ctgcttccgg agctgagctt gtttatgttc tgcggagaaa cgcttcctgc gtcagtcgcc 780
agacagctta aagaaagatt tccaaaggct cgtgttttta acacatacgg cccgaccgaa 840
gcgaccgttg ccgtcacttc catcgaagta acagacgacg tattaaacaa gtattcttct 900
cttcccgtcg gttctgaaaa gcccgaaacc gaaatcgtaa tcatcaatga agacggaaaa 960
gccgtccaag acggggaaaa aggcgagatc ataattaccg gagcaagcgt cagcaaaggc 1020
tatttaggcg aaaaagcgct gacggaaaaa gcgtttttct cttacaacgg ctcccctgct 1080
taccgcaccg gtgacgcagg ttacaaagaa aacggccagc tcttcttcct cggaagactc 1140
gatttccaaa tcaaactgca cggctaccgg attgagcttg aagaaatcga atatcaaatc 1200
aatcagtccc gatatgtgca gtcggcagtc gttattccat tctaccgcga ggagaaaatc 1260
gagtatctga tcgccatgat tgtgcctgcc gaacacgatt tcgaaaagga ataccagtta 1320
accagcgcga ttaagaaaga tttgggcagc aagctgccgg cctatatgat tccgagaaaa 1380
ttcatgtatc aaaaagagat tccgatgaca gcaaacggta aaatcgaccg caagagatta 1440
aaagaagagg taaccgtatg acgccttatg gttcatttct tttcttcatt atattaggaa 1500
ttttactggc gccgaccatc attctcggat tgaacggaaa aagcttccgc ttatataata 1560
tggcggtttc cgttctggtt ctggcgctta ttttttcgaa cagcctgcac gggctgatca 1620
tgctgtgcct gtttacgctt tggcagacgg ttctgatcaa aggctatatc gcttaccgtc 1680
taaaagcgaa cagcggcatc gtattttgtc tggctgcagc agcttctatc ctgcctctgg 1740
cactgtcaaa gctgctgccg tttttcgccg ttgacaactg ggcaacattt ctcggaatct 1800
cgtatttaac ttttaaaggg gttcagctca tcattgaaac ccgcgacggt ctcattaaaa 1860
agcagctccc aatcagcaga ctgctttact ttattctctt ttttccaacc atctcgtcag 1920
gtccgatcga caggtaccgc cgttttgaaa aagacgatca gacggtttgg acaaaggagc 1980
aatacgaaga actgctttac aaaggaatca ataaaatttt tctcggcttt ttgtacaaat 2040
tcattatcgg ctactgcatt aatacgt 2067
<210> 116
<211> 2767
<212> DNA
<213> Bacillus licheniformis
<400> 116
gggtacctcc atggtaaagt ttcgacttaa agcggagatc aaaaaatagc ctggtttacc 60
attttccaca tttttaaatt tatacccctt tcaaaagtca taaaactatc atattctgta 120
ataccacttt tcggaggtga gaatatgtca tactctaata gcttcgcttt gattgttgta 180
ttatttattt tgctgatcat tgtgggctcc gcttttgtaa agtattaatt cattcgcgca 240
cgaagccttc ttccgaaaaa ctgcaggttc atatcgaaag gcgctccgct tttcatatga 300
gcctgttttt ttgtaattta aaaagaattt atttccacaa taacaaaaaa tgtttataat 360
aggataggct ctgagctgac ggctgacggc gctcggaaat aaaaactctc ccacaaatga 420
aacttttata caacattttc gtcttatact gttgttaagg caattcaata acggaaagga 480
aaagatcaat gttaaataag ctaagaatgt tgtatgaaaa aacaacaatg aagtggctgc 540
tcaacacttc ctattacttt ctcattctgg tgctgctgtt tttaatttac ggattccata 600
cagcaaatac aggttcatat atttataatg acttttaatg gagaagaaaa caatgaaact 660
gattgaaaca attaaaaaat acgcgcaaac acaacccgat acccttgctt ttgtgaatga 720
agaagaaaag ctgacatacg gagagctttg gtcacaatct gagcgccttg ccgcaaggat 780
tcaaagcgaa gctttaacag atgcttctcc gatcattgtc tacggacata tgaaaccggt 840
tatggcggtt tccttcctgg cttgtgtaaa agccgggcat ccgtacattc cagttgacgt 900
atcgattccg gcagaccgga ttctgaaaat catcaacagt tcaaaagccg agcttctgct 960
caataattca ggcacttcgg ttgacacggg agatgccctc atttccgtag tggaaccggg 1020
cgttcttgaa ggagacggga tgccggagac agatcccgga cgctgggtac atggggaaga 1080
tactttttac attatctaca catccggaag cacgggaaat ccaaaaggcg tgcaaatctc 1140
agccgataac cttcagagct tcacagattg gatcacgaat gactttccgg tggaaagcgg 1200
ccaagtgttc ttaaatcaag ccccgttttc ctttgattta tcggtaatgg acctttatcc 1260
gtgcctgcag tccggaggca ccttatggac ggttacgaaa gacatgatta atcggccgaa 1320
actattgttt gaagcactga aacagtccaa cgtcaacgtc tggacatcga cgccttcatt 1380
cgcacaaatg tgcttgatgg atccgtctta ttcggaagag ctgcttccgg agctgagctt 1440
gtttatgttc tgcggagaaa cgcttcctgc gtcagtcgcc agacagctta aagaaagatt 1500
tccaaaggct cgtgttttta acacatacgg cccgaccgaa gcgaccgttg ccgtcacttc 1560
catcgaagta acagacgacg tattaaacaa gtattcttct cttcccgtcg gttctgaaaa 1620
gcccgaaacc gaaatcgtaa tcatcaatga agacggaaaa gccgtccaag acggggaaaa 1680
aggcgagatc ataattaccg gagcaagcgt cagcaaaggc tatttaggcg aaaaagcgct 1740
gacggaaaaa gcgtttttct cttacaacgg ctcccctgct taccgcaccg gtgacgcagg 1800
ttacaaagaa aacggccagc tcttcttcct cggaagactc gatttccaaa tcaaactgca 1860
cggctaccgg attgagcttg aagaaatcga atatcaaatc aatcagtccc gatatgtgca 1920
gtcggcagtc gttattccat tctaccgcga ggagaaaatc gagtatctga tcgccatgat 1980
tgtgcctgcc gaacacgatt tcgaaaagga ataccagtta accagcgcga ttaagaaaga 2040
tttgggcagc aagctgccgg cctatatgat tccgagaaaa ttcatgtatc aaaaagagat 2100
tccgatgaca gcaaacggta aaatcgaccg caagagatta aaagaagagg taaccgtatg 2160
acgccttatg gttcatttct tttcttcatt atattaggaa ttttactggc gccgaccatc 2220
attctcggat tgaacggaaa aagcttccgc ttatataata tggcggtttc cgttctggtt 2280
ctggcgctta ttttttcgaa cagcctgcac gggctgatca tgctgtgcct gtttacgctt 2340
tggcagacgg ttctgatcaa aggctatatc gcttaccgtc taaaagcgaa cagcggcatc 2400
gtattttgtc tggctgcagc agcttctatc ctgcctctgg cactgtcaaa gctgctgccg 2460
tttttcgccg ttgacaactg ggcaacattt ctcggaatct cgtatttaac ttttaaaggg 2520
gttcagctca tcattgaaac ccgcgacggt ctcattaaaa agcagctccc aatcagcaga 2580
ctgctttact ttattctctt ttttccaacc atctcgtcag gtccgatcga caggtaccgc 2640
cgttttgaaa aagacgatca gacggtttgg acaaaggagc aatacgaaga actgctttac 2700
aaaggaatca ataaaatttt tctcggcttt ttgtacaaat tcattatcgg ctactgcatt 2760
aatacgt 2767
<210> 117
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 117
ggatacgccg atttcaatgg c 21
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 118
ggctatgtgc tgggggaatt 20
<210> 119
<211> 1523
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 119
ggatacgccg atttcaatgg caagctgatt taaggagaga ttgtgttcaa tcatgtactg 60
gagaacaaaa tctcttttga tatgaatctt ttttaccatg attactcccc tttctaatct 120
cttatgtttc tttttatcta cattgaacat atacgatttg ttaacttttg tcaatacttt 180
taccatccat atgtttccta taggcaatat tcgtactaaa atattttata ataagagatt 240
gcgaggtttt ggccatgacg aactttggac accatttacg acaattaagg gaacggaaaa 300
aactgaccgt caatcaactg gcgatgtatt ccggcgtcag ttcggcaggc atttcgcgaa 360
tcgaaaacgg aaagcgcggc gtgccgaagc cggcgacgat cagaaaactg gcggacgctt 420
tgaaagtccc gtatgaggaa ctgatggcat ctgcaggcta tatcagcgcg tctacagtcc 480
aggaagcaag aagcagctat gattccattt acgacatcgt gtcacagtac gatttagagg 540
acctttctct gtttgacagc gaaaagtgga aggtgctttc aaaaaaagac atcgaaaacc 600
tggacaaata tttcgacttt ctcgtgcagg aagcaagcag ccgaaacaaa aactgaatac 660
ttctccgcgg cacactctcc tctctatcat tttcgtctgt ttacgatcct gctgttattt 720
tatcccttat gttaactttt gtcaatattt ttcctgtcta agtatttcct atagtcaaca 780
tttgtattaa aatgttcata tcatgaattt gcggggggga tggcgatgac aaggcaatca 840
taaaaagccg aatttccctt ttaggagaag ttcggctttt ttcggctgcc ttaagcggca 900
tccggattcg gcgtcttgcc tttatgatgc ttaacggggc tcagcgcacg ctcgagccat 960
cccatgaaca gatcggcgat gatcgccatc agcgccgtcg ggatcgcgcc tgctagaatg 1020
atcgctgttc cgttggtcgc gtttgatccc ctgacaatga tatccccgag gccgcctgcg 1080
ccgacaaacg tgccgatggc cgtaatgccg atcgcgatga cgagcgcggt tctgagcccc 1140
gccataatga ccgacaaggc gaggggaagc tccaccatcc ggagcacttg aaatttcgtc 1200
atgcccatcg ccttccctga ttcaagatag gcatgctcga tgctggcgat tcccgtatat 1260
gtgtttcgaa tgatcggcaa cagcgaatac aaaaacaatg aaagaatcac cgtgtttgcg 1320
ccgagcccca tgacaagcat caagacggcg agcatcgcca gcgccggaac cgtttgaatg 1380
acattagtga tggaaaagac ccatttgctg attttacggt atctggcgat gaaaatgccg 1440
gccgggatgc cgacgacggc ggcgaacaat acgccgtatg ccgacattaa aaagtggcgg 1500
taaaattccc ccagcacata gcc 1523
<210> 120
<211> 1922
<212> DNA
<213> Bacillus licheniformis
<400> 120
ggatacgccg atttcaatgg caagctgatt taaggagaga ttgtgttcaa tcatgtactg 60
gagaacaaaa tctcttttga tatgaatctt ttttaccatg attactcccc tttctaatct 120
cttatgtttc tttttatcta cattgaacat atacgatttg ttaacttttg tcaatacttt 180
taccatccat atgtttccta taggcaatat tcgtactaaa atattttata ataagagatt 240
gcgaggtttt ggccatgacg aactttggac accatttacg acaattaagg gaacggaaaa 300
aactgaccgt caatcaactg gcgatgtatt ccggcgtcag ttcggcaggc atttcgcgaa 360
tcgaaaacgg aaagcgcggc gtgccgaagc cggcgacgat cagaaaactg gcggacgctt 420
tgaaagtccc gtatgaggaa ctgatggcat ctgcaggcta tatcagcgcg tctacagtcc 480
aggaagcaag aagcagctat gattccattt acgacatcgt gtcacagtac gatttagagg 540
acctttctct gtttgacagc gaaaagtgga aggtgctttc aaaaaaagac atcgaaaacc 600
tggacaaata tttcgacttt ctcgtgcagg aagcaagcag ccgaaacaaa aactgaatac 660
ttctccgcgg cacactctcc tctctatcat tttcgtctgt ttacgatcct gctgttattt 720
tatcccttat gttaactttt gtcaatattt ttcctgtcta agtatttcct atagtcaaca 780
tttgtattaa aatgttcata tcatgaattt gcggggggga tggcgatgac aaggttcggc 840
gagcggctca aagagctgag ggaacaaaga agcctgtcgg ttaatcagct tgccatgtat 900
gccggtgtga gcgccgcagc catttccaga gccgcagcca tttccagaat cgaaaacggc 960
caccgcggcg ttcccaagcc cgcgacgatc agaaaattgg ccgaggctct gaaaatgccg 1020
tacgagcagc tcatggatat tgccggttat atgagagctg acgagattcg cgaacagccg 1080
cgcggctatg tcacgatgca ggagatcgcg gccaagcacg gcgtcgaaga cctgtggctg 1140
tttaaacccg agaaatggga ctgtttgtcc cgcgaagacc tgctcaacct cgaacagtat 1200
tttcattttt tggttaatga agcgaagaag cgccaatcat aaaaagccga atttcccttt 1260
taggagaagt tcggcttttt tcggctgcct taagcggcat ccggattcgg cgtcttgcct 1320
ttatgatgct taacggggct cagcgcacgc tcgagccatc ccatgaacag atcggcgatg 1380
atcgccatca gcgccgtcgg gatcgcgcct gctagaatga tcgctgttcc gttggtcgcg 1440
tttgatcccc tgacaatgat atccccgagg ccgcctgcgc cgacaaacgt gccgatggcc 1500
gtaatgccga tcgcgatgac gagcgcggtt ctgagccccg ccataatgac cgacaaggcg 1560
aggggaagct ccaccatccg gagcacttga aatttcgtca tgcccatcgc cttccctgat 1620
tcaagatagg catgctcgat gctggcgatt cccgtatatg tgtttcgaat gatcggcaac 1680
agcgaataca aaaacaatga aagaatcacc gtgtttgcgc cgagccccat gacaagcatc 1740
aagacggcga gcatcgccag cgccggaacc gtttgaatga cattagtgat ggaaaagacc 1800
catttgctga ttttacggta tctggcgatg aaaatgccgg ccgggatgcc gacgacggcg 1860
gcgaacaata cgccgtatgc cgacattaaa aagtggcggt aaaattcccc cagcacatag 1920
cc 1922
<210> 121
<211> 1413
<212> DNA
<213> Bacillus licheniformis
<400> 121
cgtcagttcg gcaggcattt cgcgaatcga aaacggaaag cgcggcgtgc cgaagccggc 60
gacgatcaga aaactggcgg acgctttgaa agtcccgtat gaggaactga tggcatctgc 120
aggctatatc agcgcgtcta cagtccagga agcaagaagc agctatgatt ccatttacga 180
catcgtgtca cagtacgatt tagaggacct ttctctgttt gacagcgaaa agtggaaggt 240
gctttcaaaa aaagacatcg aaaacctgga caaatatttc gactttctcg tgcaggaagc 300
aagcagccga aacaaaaact gaatacttct ccgcggcaca ctctcctctc tatcattttc 360
gtctgtttac gatcctgctg ttattttatc ccttatgtta acttttgtca atatttttcc 420
tgtctaagta tttcctatag tcaacatttg tattaaaatg ttcatatcat gaatttgcgg 480
gggggatggc gatgacaagg ttcggcgagc ggctcaaaga gctgagggaa caaagaagcc 540
tgtcggttaa tcagcttgcc atgtatgccg gtgtgagcgc cgcagccatt tccagagccg 600
cagccatttc cagaatcgaa aacggccacc gcggcgttcc caagcccgcg acgatcagaa 660
aattggccga ggctctgaaa atgccgtacg agcagctcat ggatattgcc ggttatatga 720
gagctgacga gattcgcgaa cagccgcgcg gctatgtcac gatgcaggag atcgcggcca 780
agcacggcgt cgaagacctg tggctgttta aacccgagaa atgggactgt ttgtcccgcg 840
aagacctgct caacctcgaa cagtattttc attttttggt taatgaagcg aagaagcgcc 900
aatcataaaa agccgaattt cccttttagg agaagttcgg cttttttcgg ctgccttaag 960
cggcatccgg attcggcgtc ttgcctttat gatgcttaac ggggctcagc gcacgctcga 1020
gccatcccat gaacagatcg gcgatgatcg ccatcagcgc cgtcgggatc gcgcctgcta 1080
gaatgatcgc tgttccgttg gtcgcgtttg atcccctgac aatgatatcc ccgaggccgc 1140
ctgcgccgac aaacgtgccg atggccgtaa tgccgatcgc gatgacgagc gcggttctga 1200
gccccgccat aatgaccgac aaggcgaggg gaagctccac catccggagc acttgaaatt 1260
tcgtcatgcc catcgccttc cctgattcaa gataggcatg ctcgatgctg gcgattcccg 1320
tatatgtgtt tcgaatgatc ggcaacagcg aatacaaaaa caatgaaaga atcaccgtgt 1380
ttgcgccgag ccccatgaca agcatcaaga cgg 1413
<210> 122
<211> 2009
<212> DNA
<213> Bacillus licheniformis
<400> 122
ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60
ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120
atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180
ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240
tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300
tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360
tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420
ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480
ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac gcgcaaacac 540
aacccgatac ccttgctttt gtgaatgaag aagaaaagct gacatacgga gagctttggt 600
cacaatctga gcgccttgcc gcaaggattc aaagcgaagc tttaacagat gcttctccga 660
tcattgtcta cggacatatg aaaccggtta tggcggtttc cttcctggct tgtgtaaaag 720
ccgggcatcc gtacattcca gttgacgtat cgattccggc agaccggatt ctgaaaatca 780
tcaacagttc aaaagccgag cttctgctca ataattcagg cacttcggtt gacacgggag 840
atgccctcat ttccgtagtg gaaccgggcg ttcttgaagg agacgggatg ccggagacag 900
atcccggacg ctgggtacat ggggaagata ctttttacat tatctacaca tccggaagca 960
cgggaaatcc aaaaggcgtg caaatctcag ccgataacct tcagagcttc acagattgga 1020
tcacgaatga ctttccggtg gaaagcggcc aagtgttctt aaatcaagcc ccgttttcct 1080
ttgatttatc ggtaatggac ctttatccgt gcctgcagtc cggaggcacc ttatggacgg 1140
ttacgaaaga catgattaat cggccgaaac tattgtttga agcactgaaa cagtccaacg 1200
tcaacgtctg gacatcgacg ccttcattcg cacaaatgtg cttgatggat ccgtcttatt 1260
cggaagagct gcttccggag ctgagcttgt ttatgttctg cggagaaacg cttcctgcgt 1320
cagtcgccag acagcttaaa gaaagatttc caaaggctcg tgtttttaac acatacggcc 1380
cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac agacgacgta ttaaacaagt 1440
attcttctct tcccgtcggt tctgaaaagc ccgaaaccga aatcgtaatc atcaatgaag 1500
acggaaaagc cgtccaagac ggggaaaaag gcgagatcat aattaccgga gcaagcgtca 1560
gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc gtttttctct tacaacggct 1620
cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa cggccagctc ttcttcctcg 1680
gaagactcga tttccaaatc aaactgcacg gctaccggat tgagcttgaa gaaatcgaat 1740
atcaaatcaa tcagtcccga tatgtgcagt cggcagtcgt tattccattc taccgcgagg 1800
agaaaatcga gtatctgatc gccatgattg tgcctgccga acacgatttc gaaaaggaat 1860
accagttaac cagcgcgatt aagaaagatt tgggcagcaa gctgccggcc tatatgattc 1920
cgagaaaatt catgtatcaa aaagagattc cgatgacagc aaacggtaaa atcgaccgca 1980
agagattaaa agaagaggta accgtatga 2009
<210> 123
<211> 1557
<212> DNA
<213> Bacillus licheniformis
<400> 123
ttaattgaat tgtgcggtta caccgccgga ctccatcatc atcagttctt ttttcatatc 60
caatccgccc cggtatcccg tgagctgccc gcttttaccg ataacccgat ggcaaggcac 120
caccattaac agcggatttg cgccgatcgc cgcgcctact gcccgcacag cggcctgctt 180
ttcaatatgc tcggcgatat cggaatagga gcaagtgctg ccgtaaggga tttcggagag 240
cgccttccac actgccagct gaaaaggcgt gccggcaagg tcgacaggaa agctgaaatg 300
agttcgcttg ccgttcaaat acgcctgcag ctgctcggcg tattctgcca atcctttgtc 360
atcccgaatg aaaactggct gtgtaaatct tttttcagcc caagcggcca aatcctcgaa 420
gccttgattc catccccctg taaaacagag cccgcgggca gtcgccccaa tgtgaatctg 480
ccaacctcgg caaataagcg tacgccagta tacgatttga tcgtccatat gtttacctcc 540
gtttcatttg ccggtacgac gtcggcgatt gcccagtctt ctttttaaac aaagaggcaa 600
aatattccgc attcgcaatg cctaccattg aagcgatttc tgcgatcgat cgttctgaat 660
gagcaagcaa atcgaccgct ttctcaatcc ttttctgcag gatgtattct gccggcgaga 720
cgcctttgat tcgtttaaat gtccgctgca ggtgaaaagg gctgatatgg cacctgtcag 780
ccaaagcttg cagagacagc ggatcgcgat aagattcctc gatgatttcc accacacgct 840
gtgccagctc ttcatccggc agcagcgccc cggccggatt gcagcgtttg caggggcggt 900
acccttctga taaagcatct tttgcattga aaaagatctg cacattgtcg atttgcggaa 960
ctctcgattt gcaggaaggg cggcaaaata tgccggtcgt tttgaccgcg taataaaaaa 1020
ctccgtcata ggcggaatcg ttttccgtaa tcgcccgcca catttcaggc gtcaatcgtg 1080
atttgctgtt catatcttca ccccgatcta tgtcagtata acctatatga cagccggagg 1140
tggagaggcg gagaacggca cagcaagaag acaaagaaga agagagactg ttgcctggac 1200
ctccgaaacg cgctacaatt catttacaac acaggatggg gtgagaatat tgccggaatc 1260
agtgaagcag gtaacatctc tcactgctgt gtgattttac tcacggcatt tggaacgccg 1320
gctctcaaca aactttctgt agtgaaaatc atgaaccaaa cggatcgtcg gcctgattaa 1380
cagctgaaag ctgccgatca caaacatcca tagtcccgcc ggcttcagtt cctcggagaa 1440
aaagcagaag ctcccgacaa ggaataaaag gccgatgaga aaatcgttta atgtatgtag 1500
aactttgtat ctttttttga aaaagagttc atatcgattg ttattgtttt gcggcat 1557
<210> 124
<211> 2814
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 124
ttaattgaat tgtgcggtta caccgccgga ctccatcatc atcagttctt ttttcatatc 60
caatccgccc cggtatcccg tgagctgccc gcttttaccg ataacccgat ggcaaggcac 120
caccattaac agcggatttg cgccgatcgc cgcgcctact gcccgcacag cggcctgctt 180
ttcaatatgc tcggcgatat cggaatagga gcaagtgctg ccgtaaggga tttcggagag 240
cgccttccac actgccagct gaaaaggcgt gccggcaagg tcgacaggaa agctgaaatg 300
agttcgcttg ccgttcaaat acgcctgcag ctgctcggcg tattctgcca atcctttgtc 360
atcccgaatg aaaactggct gtgtaaatct tttttcagcc caagcggcca aatcctcgaa 420
gccttgattc catccccctg taaaacagag cccgcgggca gtcgccccaa tgtgaatctg 480
ccaacctcgg caaataagcg tacgccagta tacgatttga tcgtccatat gtttacctcc 540
gtttcatttg ccggtacgac gtcggcgatt gcccagtctt ctttttaaac aaagaggcaa 600
aatattccgc attcgcaatg cctaccattg aagcgatttc tgcgatcgat cgttctgaat 660
gagcaagcaa atcgaccgct ttctcaatcc ttttctgcag gatgtattct gccggcgaga 720
cgcctttgat tcgtttaaat gtccgctgca ggtgaaaagg gctgatatgg cacctgtcag 780
ccaaagcttg cagagacagc ggatcgcgat aagattcctc gatgatttcc accacacgct 840
gtgccagctc ttcatccggc agcagcgccc cggccggatt gcagcgtttg caggggcggt 900
acccttctga taaagcatct tttgcattga aaaagatctg cacattgtcg atttgcggaa 960
ctctcgattt gcaggaaggg cggcaaaata tgccggtcgt tttgaccgcg taataaaaaa 1020
ctccgtcata ggcggaatcg ttttccgtaa tcgcccgcca catttcaggc gtcaatcgtg 1080
atttgctgtt catatcttca ccccgatcta tgtcagtata acctatatga cagccggagg 1140
tggagaggcg gagaacggca cagcaagaag acaaagaaga agagagactg ttgcctggac 1200
ctccgaaacg cgctacaatt catttacaac acaggatggg gtgagaatat tgccggaatc 1260
agtgaagcag gtgacagagg aaaggccgat atgattcggc cttttttata tgtacttctt 1320
agcgggtctc taaaataacc aaaaagcaag gactgctgaa agggctgaca taagcctttt 1380
gccggcggtc cttttttaat tctgattttt caaacttagc cccctcgaga aaaccgcttg 1440
agtatcctcc gctcatgtta ttgacctcct tttcttgatc aatatatttg tatgagcgga 1500
aagaaaattt gactagacgg atgcccctct gttgaaaatc tttttacagc atgtcagaat 1560
atgatatgat acaattcaaa ggaaagttta aactgttatg attaggagtg tttgcattta 1620
tgaagaagat tgcaattgcg gcgattacag cgacaagcgt gctggctctc agcgcatgca 1680
gcgggggaga ttctgaggtt gttgcggaaa caaaagctgg aaatattaca aaagaagacc 1740
tttatcaaac attaaaagac aatgccggag cggacgcact gaacatgctt gttcagcaaa 1800
aagtactcga tgataaatac gatgtctccg acaaagaaat cgacaaaaag ctgaacgagt 1860
acaaaaaatc aatgggtgac cagctcaacc agctcattga ccaaaaaggc gaagacttcg 1920
tcaaagaaca gatcaaatac gaacttctga tgcaaaaagc cgcaaaggat aacataaaag 1980
taaccgatga tgacgtaaaa gaatattatg acggcctgaa aggcaaaatc cacttaagcc 2040
acattcttgt gaaagaaaag aaaacggctg aagaagttga gaaaaagctg aaaaaaggcg 2100
aaaaattcga agaccttgca aaagagtatt caactgacgg tacagccgaa aaaggcggcg 2160
acctcggctg ggtcggcaaa gacgataaca tggacaagga tttcgtcaaa gcggcatttg 2220
ctttgaaaac cggcgaaatc agcggacctg tgaaatccca attcggctat cacatcatta 2280
aaaaagacga agaacgcggc aaatatgaag acatgaaaaa agagcttaaa aaagaagtcc 2340
aagaacaaaa gcaaaatgat caaactgaac tgcaatccgt cattgacaaa cttgtcaaag 2400
atgctgattt aaaagtaaaa gacaaagagt tgaaaaaaca agtcgaccag cgtcaagctc 2460
agacaagcag cagcagctga aagagcagag aggacggatt tcctgaagga aatccgtttt 2520
tttattttta acatctctca ctgctgtgtg attttactca cggcatttgg aacgccggct 2580
ctcaacaaac tttctgtagt gaaaatcatg aaccaaacgg atcgtcggcc tgattaacag 2640
ctgaaagctg ccgatcacaa acatccatag tcccgccggc ttcagttcct cggagaaaaa 2700
gcagaagctc ccgacaagga ataaaaggcc gatgagaaaa tcgtttaatg tatgtagaac 2760
tttgtatctt tttttgaaaa agagttcata tcgattgtta ttgttttgcg gcat 2814
<210> 125
<211> 1309
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 125
ctctaatagc ttcgctttga ttgttgtatt atttattttg ctgatcattg tgggctccgc 60
ttttgtaaag tattaattca ttcgcgcacg aagccttctt ccgaaaaact gcaggttcat 120
atcgaaaggc gctccgcttt tcatatgagc ctgttttttt gtaatttaaa aagaatttat 180
ttccacaata acaaaaaatg tttataatag gataggctct gagctgacgg ctgacggcgc 240
tcggaaataa aaactctccc acaaatgaaa cttttataca acattttcgt cttatactgt 300
tgttaaggca attcaataac ggaaaggaaa agatcaatgt taaataagct aagaatgttg 360
tatgaaaaaa caacaatgaa gtggctgctc aacacttcct attactttct cattctggtg 420
ctgctgtttt taatttacgg attccataca gcaaatacag gttcatatat ttataatgac 480
ttttaatgga gaagaaaaca atgaaactga ttgaaacaat taaaaaatac cacaaatgtg 540
cttgatggat ccgtcttatt cggaagagct gcttccggag ctgagcttgt ttatgttctg 600
cggagaaacg cttcctgcgt cagtcgccag acagcttaaa gaaagatttc caaaggctcg 660
tgtttttaac acatacggcc cgaccgaagc gaccgttgcc gtcacttcca tcgaagtaac 720
agacgacgta ttaaacaagt attcttctct tcccgtcggt tctgaaaagc ccgaaaccga 780
aatcgtaatc atcaatgaag acggaaaagc cgtccaagac ggggaaaaag gcgagatcat 840
aattaccgga gcaagcgtca gcaaaggcta tttaggcgaa aaagcgctga cggaaaaagc 900
gtttttctct tacaacggct cccctgctta ccgcaccggt gacgcaggtt acaaagaaaa 960
cggccagctc ttcttcctcg gaagactcga tttccaaatc aaactgcacg gctaccggat 1020
tgagcttgaa gaaatcgaat atcaaatcaa tcagtcccga tatgtgcagt cggcagtcgt 1080
tattccattc taccgcgagg agaaaatcga gtatctgatc gccatgattg tgcctgccga 1140
acacgatttc gaaaaggaat accagttaac cagcgcgatt aagaaagatt tgggcagcaa 1200
gctgccggcc tatatgattc cgagaaaatt catgtatcaa aaagagattc cgatgacagc 1260
aaacggtaaa atcgaccgca agagattaaa agaagaggta accgtatga 1309
<210> 126
<211> 483
<212> PRT
<213> Bacillus licheniformis
<400> 126
Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro
1 5 10 15
Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu
20 25 30
Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn
85 90 95
Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr
100 105 110
Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val
115 120 125
Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro
130 135 140
Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys
165 170 175
Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val
195 200 205
Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln
210 215 220
Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn
260 265 270
Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu
275 280 285
His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met
290 295 300
Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser
305 310 315 320
Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile
370 375 380
Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His
385 390 395 400
Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr
435 440 445
Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser
450 455 460
Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr
465 470 475 480
Val Gln Arg
<210> 127
<211> 9514
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 127
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880
cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940
atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000
gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060
attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120
ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180
aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240
cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300
tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360
agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420
atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480
gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540
aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600
aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660
ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720
agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780
aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840
gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900
cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960
ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020
gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080
acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140
aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200
gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260
ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320
attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380
atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440
ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500
gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560
cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620
aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680
agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gatgaaacaa caaaaacggc 4740
tttacgcccg attgctgacg ctgttatttg cgctcatctt cttgctgcct cattctgcag 4800
ctagcgcagc aaatcttaat gggacgctga tgcagtattt tgaatggtac atgcccaatg 4860
acggccaaca ttggaagcgt ttgcaaaacg actcggcata tttggctgaa cacggtatta 4920
ctgccgtctg gattcccccg gcatataagg gaacgagcca agcggatgtg ggctacggtg 4980
cttacgacct ttatgattta ggggagtttc atcaaaaagg gacggttcgg acaaagtacg 5040
gcacaaaagg agagctgcaa tctgcgatca aaagtcttca ttcccgcgac attaacgttt 5100
acggggatgt ggtcatcaac cacaaaggcg gcgctgatgc gaccgaagat gtaaccgcgg 5160
ttgaagtcga tcccgctgac cgcaaccgcg taatttcagg agaacaccta attaaagcct 5220
ggacacattt tcattttccg gggcgcggca gcacatacag cgattttaaa tggcattggt 5280
accattttga cggaaccgat tgggacgagt cccgaaagct gaaccgcatc tataagtttc 5340
aaggaaaggc ttgggattgg gaagtttcca atgaaaacgg caactatgat tatttgatgt 5400
atgccgacat cgattatgac catcctgatg tcgcagcaga aattaagaga tggggcactt 5460
ggtatgccaa tgaactgcaa ttggacggtt tccgtcttga tgctgtcaaa cacattaaat 5520
tttctttttt gcgggattgg gttaatcatg tcagggaaaa aacggggaag gaaatgttta 5580
cggtagctga atattggcag aatgacttgg gcgcgctgga aaactatttg aacaaaacaa 5640
attttaatca ttcagtgttt gacgtgccgc ttcattatca gttccatgct gcatcgacac 5700
agggaggcgg ctatgatatg aggaaattgc tgaacggtac ggtcgtttcc aagcatccgt 5760
tgaaatcggt tacatttgtc gataaccatg atacacagcc ggggcaatcg cttgagtcga 5820
ctgtccaaac atggtttaag ccgcttgctt acgcttttat tctcacaagg gaatctggat 5880
accctcaggt tttctacggg gatatgtacg ggacgaaagg agactcccag cgcgaaattc 5940
ctgccttgaa acacaaaatt gaaccgatct taaaagcgag aaaacagtat gcgtacggag 6000
cacagcatga ttatttcgac caccatgaca ttgtcggctg gacaagggaa ggcgacagct 6060
cggttgcaaa ttcaggtttg gcggcattaa taacagacgg acccggtggg gcaaagcgaa 6120
tgtatgtcgg ccggcaaaac gccggtgaga catggcatga cattaccgga aaccgttcgg 6180
agccggttgt catcaattcg gaaggctggg gagagtttca cgtaaacggc gggtcggttt 6240
caatttatgt tcaaagatag aagcttctcg aggttaacag aggacggatt tcctgaagga 6300
aatccgtttt tttattttac agaagctgcg gaacctgaaa agaattcctt tcaggttccg 6360
ttttttttag gaattctccc tgatctcaag catctggcgg ggataaatcc gctctccttt 6420
caaatcgttc cattctttga ggcgctgtac agttacgccc attttttcgg cgatatgatg 6480
aagcgtatcc cctttccgca ctacatatgt accggtcttc gattcatcgt catgaaggcg 6540
gagtgtttgg ccggccttga gatttgaatg tttcaacccg tttattctca tgatctcctc 6600
gatggatata ccgctatcct tgctgattct ccagagcgtg tccccttttt gaacggtcac 6660
cgcaccgctc attgtcccgg cgttttgata aacgtggata gaattttgcc ggaacgcctc 6720
ctcacgaagc accgtcagcg gattgattgc atatctttta tcttcagtcc atgaaccgtg 6780
atgcatttca aaatgcaggt gggttccggt cgatattccc gtattgccga tgattccgat 6840
ttgctcgcct tttttcaccc gctccttttc ctttttcagg cgtttgctta agtgggcata 6900
aacggtttca tatccgttgt catgtttaat aaatatcact tggccgtagg agtcggattg 6960
atacgatttg cttatcgttc cgtctgcggc tgccgctact gcttcccctt cgggagcagc 7020
gatgtcaagc cccttatgct ttccgcctct cgtaccgaat tgatctgtga tctctccttt 7080
aatcggttca atccactctg aggcttccgc ccccggggca ttgacgaaaa gcgccaatcc 7140
cgaaagccat gcgatcgcga acaggaagtt ttgatgtctg agtttcttca aggttttcca 7200
tatcctccta ttacatgcat cttcggtaaa attgccccct attcggagac agcttagtat 7260
acttccaaat caatacaatt tatacattaa aaaaagactc cgcacaggga gtcttttagt 7320
tttctatcgt catcggattc ggtgcgtacg gaacctgtac agatttcgac aggtcatagg 7380
cgccgacctt ggttatggat gcgtttttaa atttcacttt tgtgaagccg aaatctttcg 7440
cggtcaatag aaggccttcc accatcaaga catcttcggg tttattttca atattcgcgg 7500
aggaagaaaa ttgaatgatc agttcttttc cattcttttg aatatcttca atcggcgtat 7560
catcggataa aatgggtttt aaatgagtgc cgctttcttc gtttttcatc atcttaatcg 7620
cttcctgcac cgattcgtaa gattcgcttg aaggtgcaag gaaccggcgc ccgtctgagc 7680
tttcatataa atagtagcat ttttgcgtct ggtgcataat cgccatatcg gcgagcattc 7740
cgaatgtttc aaattcaaca cccgatttat cattggaaat aaacagaaca gaatcatacg 7800
atccccattt aaaggtttcg ttgatcacat ttttcagccg ttcgaaatct tcgactgata 7860
gctccggtat tttctcatca acttgaatct tcagtttttt attgtttttc tgctctttga 7920
acttcacctt atcaaggtaa gctgtgtcaa atgatgtaaa ctggtccact ccaagccggc 7980
tgtaagcgtg aagcgcatct tcaagatttg tcatgccagt gcttttctcg aggcttaccg 8040
ggacaacgac agacttggac tcgtcaagga aagcgaaggt gatatagtcg tctttttgat 8100
tctgtgagac gacaaacgta tttgcaggtt cagacttggc agcatcagcc tccgtctgca 8160
ccaattttcc gtcagaagaa atgttggcgt cggcgctgtt ttgagatctg atctgttcga 8220
ttaactgggg agtgatcagc atcagaagaa agagaaccaa aactgtagca gcaaatgcgc 8280
cgacccgttt tttcggtgat ttacgctttg gtgcgagaat cagcttttga tagatctgat 8340
ttgccgaacg attatcctta accgttggaa gttggcttag taacgccttc agccgttctt 8400
cgttccattc tgacttcttc attctttgga tcctccttca aaagctccat ctgtttacga 8460
agcactttca gaccgcggtg ctgagtggtt tttaccttgc tttcggaaaa attcaaggct 8520
tttgctgttt cactgatcga atatccttga ataaaacgca agacgataac tgatctttgg 8580
tcaagcgtac acttgtctag ggcctcgaaa atttccttta ggttttcatt ttgcatcacg 8640
atgtcctcag gcagaggctt gcggtctttt acatcttgtt tctcccagtc aaacgtcccc 8700
aaaatccgct ggcggatcgt ctgctgcttt ctgaaccagt cgatcgcaac gtgccgcgca 8760
atcgaaagaa gccaggtttt ttcgctgctc ctgccttcaa atgtttcgta agaatgcagg 8820
acgcggatgt atacttcctg aactaagtct tccgcctgat ttttgtcttt taccatataa 8880
aataaaaact gaaataaatc ctgatgatac tgatcatata ttttctgaaa ggtttcttcc 8940
acctgaaacc cctccgttca atttattgtc gtttgtcaat cttaaaaggt tacattacaa 9000
ctattacaac tatattacga acatatgaaa atggaaaggg ggttttgcga aagttaagct 9060
taattttaac ttaacaagca caaaagcacc cgttctaaat gaacaggtgc caaggttata 9120
ggagcccaca ttttcactaa gctgtgccct tacaaggctt tcgttctcct gaccggagcg 9180
ttgcggatcc gctgaaatga actaatttca atccgtttat gactttaagt ccaattgttg 9240
gcgaagcttt ttggaaatct ccattctctt ttcgtcagtc actaggtgat accataagcc 9300
gtcaactttt ttgtcttcac cttcaatttc tacctgctta atatctttag cagcttcttt 9360
ataagaactt tgaatatcga tcatcttgtc cagtgttaag tttgttttga tgtttttttc 9420
taatgctgcc aaaatctctt gatagtttgt taatgatttt aattgtgcac cttcatgaat 9480
aatttcgttg ataatctcac gctgacgctc ttga 9514
<210> 128
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 128
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 60
ttgacttaaa agaagctaaa tgttatagta ataaa 95
<210> 129
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 129
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaag 57
<210> 130
<211> 87
<212> DNA
<213> Bacillus licheniformis
<400> 130
atgaaacaac aaaaacggct ttacgcccga ttgctgacgc tgttatttgc gctcatcttc 60
ttgctgcctc attctgcagc tagcgca 87
<210> 131
<211> 1452
<212> DNA
<213> Bacillus licheniformis
<400> 131
gcaaatctta atgggacgct gatgcagtat tttgaatggt acatgcccaa tgacggccaa 60
cattggaagc gtttgcaaaa cgactcggca tatttggctg aacacggtat tactgccgtc 120
tggattcccc cggcatataa gggaacgagc caagcggatg tgggctacgg tgcttacgac 180
ctttatgatt taggggagtt tcatcaaaaa gggacggttc ggacaaagta cggcacaaaa 240
ggagagctgc aatctgcgat caaaagtctt cattcccgcg acattaacgt ttacggggat 300
gtggtcatca accacaaagg cggcgctgat gcgaccgaag atgtaaccgc ggttgaagtc 360
gatcccgctg accgcaaccg cgtaatttca ggagaacacc taattaaagc ctggacacat 420
tttcattttc cggggcgcgg cagcacatac agcgatttta aatggcattg gtaccatttt 480
gacggaaccg attgggacga gtcccgaaag ctgaaccgca tctataagtt tcaaggaaag 540
gcttgggatt gggaagtttc caatgaaaac ggcaactatg attatttgat gtatgccgac 600
atcgattatg accatcctga tgtcgcagca gaaattaaga gatggggcac ttggtatgcc 660
aatgaactgc aattggacgg tttccgtctt gatgctgtca aacacattaa attttctttt 720
ttgcgggatt gggttaatca tgtcagggaa aaaacgggga aggaaatgtt tacggtagct 780
gaatattggc agaatgactt gggcgcgctg gaaaactatt tgaacaaaac aaattttaat 840
cattcagtgt ttgacgtgcc gcttcattat cagttccatg ctgcatcgac acagggaggc 900
ggctatgata tgaggaaatt gctgaacggt acggtcgttt ccaagcatcc gttgaaatcg 960
gttacatttg tcgataacca tgatacacag ccggggcaat cgcttgagtc gactgtccaa 1020
acatggttta agccgcttgc ttacgctttt attctcacaa gggaatctgg ataccctcag 1080
gttttctacg gggatatgta cgggacgaaa ggagactccc agcgcgaaat tcctgccttg 1140
aaacacaaaa ttgaaccgat cttaaaagcg agaaaacagt atgcgtacgg agcacagcat 1200
gattatttcg accaccatga cattgtcggc tggacaaggg aaggcgacag ctcggttgca 1260
aattcaggtt tggcggcatt aataacagac ggacccggtg gggcaaagcg aatgtatgtc 1320
ggccggcaaa acgccggtga gacatggcat gacattaccg gaaaccgttc ggagccggtt 1380
gtcatcaatt cggaaggctg gggagagttt cacgtaaacg gcgggtcggt ttcaatttat 1440
gttcaaagat ag 1452
<210> 132
<211> 6218
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 132
ggtagaggaa ttcctggtcg gccaaggcta caatccgttt ccgcttgtca ggtttacgga 60
aagggcagac gtagccgcaa gccatatttt agaggggcat gtcatcgtga tcgtcgatac 120
gtcgccaagc gtcatcatca caccgaccac tttgtttcac catgttcagc atgctgagga 180
atacagacag acgccggctg ttgggacgtt tttaaggtgg gtgcggtttt tcggtatttt 240
ggcctccacc tttttgctgc cgctttggct gctgtttgtc attcatccgt cgctcttgcc 300
tgataattta tcgtttatcg ggttgaataa agacacccat attccgatta tcatgcagat 360
tttcctggcg gatctcggcg tcgaattttt aagaatggcc gccattcata cgccgacggc 420
gctttcgact gcaatgggcc tgatcgccgc tgtattgatc ggcgatatcg cgatcaatgt 480
cggcttgttt tctcccgaag tcattttata cgtttccctc tcggcaatcg gagcctacac 540
gacaccaagc tacgagctga gcctggcgaa taaaatggtg aagctgttta tgctgatatt 600
ggtggcgctt tttaaagtgg agggatttgt catcggatta acgatcttaa ctatagtgat 660
gacttcgatc aggtcattgc gaacgcctta cttatggcct ctcctcccgt tcaatggaaa 720
agcgttttgg catgttctcg tgcgcacgtc cgttccaggg ggaaaagtca ggccgagcat 780
cgttcatccg agaaaccgct ccagacagcc gtgaagccgg cattcgaaga ggcttttccc 840
cggggaaaag cctctttttc aataatcgaa ttccggtctt tgagtaccga tgcctctgta 900
ttcattggca gagatcgcga ctgcccggag gctgcagatg ttgttctgtc ttctgatcgg 960
atagacgaca tacagcattt cgcggccgta cgggtcaatc gttgacgaat gaaggaaaac 1020
ctcagttcct ctccgccaaa atctcgtatt cgccggagct gtaataatct gcccttcata 1080
aggctcataa attctctgtt cataatgcgc agccggctga taaggggcgt atacatcttc 1140
aggtgcatag ccgggagcgg gggtgtaggg atagcgattt ggatacatat gataacctct 1200
ttcccacttc gttttttggt tttcatcttt aagattatat tcaggtaaat gcctatttgt 1260
atgggcgaaa atctcagctt ttcggctctt tttttattga atggacgttg tgtatgccta 1320
tttctatcaa gcgctgtttt ctgttattct ataatcaata gaatggatta gttgtttagg 1380
gaatcatttc ctttataaat caagaaaatt tggacaaatg gtggtttagt ttttaaaacg 1440
aaatgttata atacaacata agaatcgcac tatcatgaag ccggaagatg catcgggcag 1500
caaccggagc gccccttgca cctttgtcga tagagaaaga gggaatgaca attgttttta 1560
cacggtacta gcagacaaaa tgaaagaggg cacctcgaaa tcggcggtgt cgatgttcta 1620
tcattggcag aaagatacgg aacacctctt tatgtatacg atgtcgcgct gattagagag 1680
cgcgcccgaa aattccagaa ggcattcaag gaagccggtt taaaagcgca ggtagcgtat 1740
gcaagcaagg cgttttcatc ggttgccatg attcagcttg ccgaacaaga ggggctgtct 1800
ctggatgtgg tatcgggagg agagcttttc actgcgatca aagcagggtt cccagctgag 1860
cggattcatt ttcacggaaa caataagagc cctgaagaac tagccatggc gctggagcat 1920
caaatcggct gcatcgtgct cgataacttt cacgagatcg ccattacaga agatctttgc 1980
aagcgatcag gacaaactgt agacgttttg ctcagaatca ctccgggagt tgaagcgcac 2040
acgcacgatt atattacgac ggggcaggaa gattccaaat tcggttttga tctgcataat 2100
ggacaggtcg aacaagccat cgaacaagtc ctccgctcgt ctgcgtttaa gctcctcggc 2160
gtgcactgcc acatcggttc gcaaattttt gatacggcag gatttgtcct tgcagcagac 2220
aagattttcg agaagcttgc ggaatggcgg gagacttact ctttcattcc ggaagtgctc 2280
aatcttggcg ggggcttcgg catccgctat acaaaagacg acgagccgct tgcagctgat 2340
gtttatgttg aaaaaatcat cgaggcggtc aaagcaaatg ccgagcattt cggctttgac 2400
atccctgaga tttggatcga accaggccgg tctctcgtcg gtgatgcggg gactacgctg 2460
tacacgatcg gttctcaaaa agaggtgccg ggcattcgca aatatgtagc catcgacggc 2520
ggcatgagcg ataatatcag gccggcgctt tatgaggcaa aatatgaagc agccgtcgcc 2580
aacaggatga acgatgcttg tcatgatacc gcatcaatcg caggaaaatg ctgcgaaagc 2640
ggagatatgc tgatttggga tttggaaatc cccgaagttc gcgacggaga tgtgctcgcc 2700
gttttctgca ccggtgcgta cggctacagc atggccaaca actacaaccg cattccgcgc 2760
ccggccgtcg tctttgtcga ggacggggaa gcgcagctcg tcattcagag agagacgtat 2820
gaggatatcg tcaagctgga tctgccgctg aaatcgaaag tcaaacaata aaaaaatgga 2880
gattccctaa gaggggggtc tccattttta attcaagctg ataaacagct gacatcaact 2940
aaaagtttca ttaaatactt tgaaaaaagt tgttgactta aaagaagcta aatgttatag 3000
taattgtaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 3060
aaagaatgaa acaacaaaaa cggctttacg cccgattgct gacgctgtta tttgcgctca 3120
tcttcttgct gcctcattct gcagctagcg cagcaaatct taatgggacg ctgatgcagt 3180
attttgaatg gtacatgccc aatgacggcc aacattggaa gcgtttgcaa aacgactcgg 3240
catatttggc tgaacacggt attactgccg tctggattcc cccggcatat aagggaacga 3300
gccaagcgga tgtgggctac ggtgcttacg acctttatga tttaggggag tttcatcaaa 3360
aagggacggt tcggacaaag tacggcacaa aaggagagct gcaatctgcg atcaaaagtc 3420
ttcattcccg cgacattaac gtttacgggg atgtggtcat caaccacaaa ggcggcgctg 3480
atgcgaccga agatgtaacc gcggttgaag tcgatcccgc tgaccgcaac cgcgtaattt 3540
caggagaaca cctaattaaa gcctggacac attttcattt tccggggcgc ggcagcacat 3600
acagcgattt taaatggcat tggtaccatt ttgacggaac cgattgggac gagtcccgaa 3660
agctgaaccg catctataag tttcaaggaa aggcttggga ttgggaagtt tccaatgaaa 3720
acggcaacta tgattatttg atgtatgccg acatcgatta tgaccatcct gatgtcgcag 3780
cagaaattaa gagatggggc acttggtatg ccaatgaact gcaattggac ggtttccgtc 3840
ttgatgctgt caaacacatt aaattttctt ttttgcggga ttgggttaat catgtcaggg 3900
aaaaaacggg gaaggaaatg tttacggtag ctgaatattg gcagaatgac ttgggcgcgc 3960
tggaaaacta tttgaacaaa acaaatttta atcattcagt gtttgacgtg ccgcttcatt 4020
atcagttcca tgctgcatcg acacagggag gcggctatga tatgaggaaa ttgctgaacg 4080
gtacggtcgt ttccaagcat ccgttgaaat cggttacatt tgtcgataac catgatacac 4140
agccggggca atcgcttgag tcgactgtcc aaacatggtt taagccgctt gcttacgctt 4200
ttattctcac aagggaatct ggataccctc aggttttcta cggggatatg tacgggacga 4260
aaggagactc ccagcgcgaa attcctgcct tgaaacacaa aattgaaccg atcttaaaag 4320
cgagaaaaca gtatgcgtac ggagcacagc atgattattt cgaccaccat gacattgtcg 4380
gctggacaag ggaaggcgac agctcggttg caaattcagg tttggcggca ttaataacag 4440
acggacccgg tggggcaaag cgaatgtatg tcggccggca aaacgccggt gagacatggc 4500
atgacattac cggaaaccgt tcggagccgg ttgtcatcaa ttcggaaggc tggggagagt 4560
ttcacgtaaa cggcgggtcg gtttcaattt atgttcaaag atagaagctt ctcgaggtta 4620
acagaggacg gatttcctga aggaaatccg tttttttatt ttcaagcacg aaaaacactt 4680
cccggtgatc gggaggtgtt ttttgttaaa aagatcatga catgcataga acagcgaccg 4740
ggctaattgt atataatatt gtgaatttaa caaaaaattt acaaaggaga tgataaaggc 4800
aatgaccagg gtgaaaagga tgagatttgc tgatttgttg gatttagagg cggagtagat 4860
gaaaccggcc aaagtatccc tactccaccg attgctccag tgcctgaagc aatgtgttga 4920
ttgtaacaca gtaaatcgtt ttacagcaat aaacattttt gtgaatattt tattgatttc 4980
ggctgtgatc tcattcccat attctgctgc ggcccatggc gcaacacagt ccggcgatca 5040
atattcaagc tttgaagaat tggagcggaa tgaagatcca gcttcttacc gaattacgga 5100
gaagaacgca agagtgccga tgctcatcat ggccatccat ggaggcggca tcgaacccgg 5160
aacgagcgaa atcgccaatg aagtgtccaa aaactattcc ctgtacttgt ttgaagggct 5220
gaaatcatca ggcaatacgg accttcacat tacaagcacg cgttttgacg agccagcggc 5280
gctcgcaatt actgcaagcc accagtatgt catgtcgctc cacggctatt acagtgaaga 5340
ccgcgatatt aaagtaggcg gcacagaccg cgctaaaatc agaatattgg ttgatgagct 5400
gaaccgctcg gggtttgccg ctgaaatgct ggggacagat gacaagtatg ccggaaccca 5460
tccgaataac atcgccaaca agtcgctttc cgggctgagc attcagcttg aaatgagcac 5520
gggtttccgc aaatctttat tcgaccggtt tacactaaaa gacagggcgg cgacgcaaaa 5580
cgaaacgttt taccgattta caaagctgct gacagatttt attcatgaaa actatgaaga 5640
agacggaggg gatttcccct ctgcaaaaat aaaacacccc cttcaagtga aaaaggaggt 5700
gtttcggcgg ttgtgttaac cgttggactc tgaggtgccg ccgccggtga atacggaaac 5760
gatggcgttc cacagagaca caaagaagtc gatcagtttt tgaagaaagt tttgtccttc 5820
ttcagaatcc aagaatttcg tgattttatc ctttgctttg tcaagctggt ctccaacctg 5880
gttccagtcg atattaatat ttttcatgtt attaaataaa gatataagag agtttttctg 5940
atcttctgtg agtgtcacgc caagttcgga agcagccgaa tcaatcgttt tctccaattc 6000
ctcttttgac tcgggaactc cgtttttcga gatttcttcc ttgactttgg ccatcagcgc 6060
tgacgcgttt tcactgccga ttttctcgcc aagctctgaa gtggtgacaa gctcttcatt 6120
cgcgaccttt ttcacatctt cggaaatttt ttcgcccgaa gtcgtttcat acgctttcat 6180
caatccggtt aaagcggctg tgcctgacac ttcaaacg 6218
<210> 133
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 133
tcgttccggg ttcgatgccg cctccatgga tggccatgat gagcatcggc actcttgcgt 60
tcttctccgt aattcggtaa gaagctggat cttcattccg ctccaattct tcaaagcttg 120
aatattgatc gccggactgt gttgcgccat gggccgcagc agaatatggg aatgagatca 180
cagccgaaat caataaaata ttcacaaaaa tgtttattgc tgtaaaacga tttactgtgt 240
tacaatcaac acattgcttc aggcactgga gcaatcggtg gagtagggat actttggccg 300
gtttcatcta ctccgcctct aaatccaaca aatcagcaaa tctcatcctt ttcaccctgg 360
tcattgcctt tatcatctcc tttgtaaatt ttttgttaaa ttcacaatat tatatacaat 420
tagcccggtc gctgttctat gcatgtcatg atctttttaa caaaaaacac ctcccgatca 480
ccgggaagtg tttttcgtgc ttgtcattcc ctctttctct atcgacaaag gtgcaagggg 540
cgctccggtt gctgcccgat gcatcttccg gcttcatgat agtgcgattc ttatgttgta 600
ttataacatt tcgttttaaa aactaaacca ccatttgtcc aaattttctt gatttataaa 660
ggaaatgatt ccctaaacaa ctaatccatt ctattgatta tagaataaca gaaaacagcg 720
cttgatagaa ataggcatac acaacgtcca ttcaataaaa aaagagccga aaagctgaga 780
ttttcgccca tacaaatagg catttacctg aatataatct taaagatgaa aaccaaaaaa 840
cgaagtggga aagaggttat catatgtatc caaatcgcta tccctacacc cccgctcccg 900
gctatgcacc tgaagatgta tacgcccctt atcagccggc tgcgcattat gaacagagaa 960
tttatgagcc ttatgaaggg cagattatta cagctccggc 1000
<210> 134
<211> 1320
<212> DNA
<213> Bacillus licheniformis
<400> 134
ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60
gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120
attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180
gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240
gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300
ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360
ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420
gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480
gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540
ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600
ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660
gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720
gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780
gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840
ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900
actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960
atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020
gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080
tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140
gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200
attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260
gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320
1320
<210> 135
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 135
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60
cttaaaagaa gctaaatgtt atagtaattg t 91
<210> 136
<211> 484
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 136
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His
1 5 10 15
Leu Pro Asn Asp Gly Gln His Trp Asn Arg Leu Arg Asn Asp Ala Ala
20 25 30
Asn Leu Lys Asn Leu Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Ile Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Ser Gln Leu Gln Ser Ala Ile Ala Ser Leu Gln Asn Asn Gly
85 90 95
Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Gly Thr Glu Trp Val Gln Ala Val Glu Val Asn Pro Ser Asn Arg Asn
115 120 125
Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg
165 170 175
Ile Tyr Lys Phe Thr Gly Lys Gly Trp Asp Trp Glu Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His
195 200 205
Pro Glu Val Ile Asn Glu Leu Arg Arg Trp Gly Val Trp Tyr Thr Asn
210 215 220
Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys
225 230 235 240
Tyr Ser Phe Thr Arg Asp Trp Leu Asn His Val Arg Ser Thr Thr Gly
245 250 255
Lys Asn Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly
260 265 270
Ala Ile Glu Asn Tyr Leu His Lys Thr Asn Trp Asn His Ser Val Phe
275 280 285
Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly Gly
290 295 300
Asn Tyr Asp Met Arg Gln Ile Leu Asn Gly Thr Val Val Ser Lys His
305 310 315 320
Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Ala
325 330 335
Glu Ala Leu Glu Ser Phe Val Glu Ala Trp Phe Lys Pro Leu Ala Tyr
340 345 350
Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly
355 360 365
Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Ala Ala Met Lys Gly Lys
370 375 380
Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Thr Gln
385 390 395 400
His Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly
405 410 415
Asn Ser Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly
420 425 430
Pro Gly Gly Ser Lys Trp Met Tyr Val Gly Arg His Lys Ala Gly Gln
435 440 445
Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile Asn
450 455 460
Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile
465 470 475 480
Trp Val Asn Lys
<210> 137
<211> 9545
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 137
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgag ctctcgctga taaacagctg 2880
acatcaacta aaagcttcat taaatacttt gaaaaaagtt gttgacttaa aagaagctaa 2940
atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3000
ggagagggta aagaatgaaa caacaaaaac ggctttacgc ccgattgctg acgctgttat 3060
ttgcgctcat cttcttgctg cctcattctg cagctagcgc acaccacaac ggaacaaacg 3120
gcacaatgat gcagtatttt gaatggcacc tgccgaatga tggacagcat tggaatagac 3180
tgagaaacga cgcagcgaac ctgaagaacc ttggcatcac ggcagtctgg attccgcctg 3240
cgtggaaagg cacatcacaa aatgatgtcg gctatggcgc atatgacctg tacgacctgg 3300
gagagttcaa ccagaaggga acaatcagaa cgaaatatgg aacaagatca caactgcaaa 3360
gcgctatcgc gagcctgcaa aataatggca tccaagttta tggcgacgtg gtcatgaacc 3420
acaaaggcgg agcagacgga acggaatggg ttcaagcggt cgaggtgaat ccgagcaaca 3480
gaaaccaaga ggttacgggc gaatacacga tcgaagcctg gacaaagttc gactttccgg 3540
gcagaggcaa tacacactca agcttcaagt ggagatggta tcactttgac ggcacggact 3600
gggatcaaag cagacgtctg aataacagaa tctataagtt tacaggcaaa ggttgggatt 3660
gggaggtgga cacagaaaac ggaaactatg actatctgat gtatgctgac gtcgacatgg 3720
atcatccgga ggtcatcaat gagctgagaa gatggggcgt ttggtacacg aacacactga 3780
acctggatgg attcagaatt gacgcagtca aacacatcaa gtactcattt acaagagact 3840
ggcttaacca cgtgagatca acaacgggaa agaacaatat gttcgccgtt gcggagtttt 3900
ggaagaatga tctgggcgca atcgagaact atcttcacaa gacgaactgg aatcatagcg 3960
tcttcgatgt cccgctgcac tacaatctgt ataatgcatc aaagtcaggc ggcaactacg 4020
atatgagaca aatcctgaat ggaacggtcg tctcaaaaca cccgatgcac gccgtcacgt 4080
ttgtcgataa tcacgattca caaccggcag aagcccttga gagctttgtt gaggcatggt 4140
tcaaaccgct ggcctatgct ctgatcctga caagagagca aggctatccg tcagtgtttt 4200
acggcgatta ctacggcatt ccgacacatg gcgtcgcagc catgaaagga aagattgatc 4260
cgattctgga ggctagacag aaatacgcct acggaacgca acacgattac cttgatcacc 4320
ataacatcat cggatggacg agagagggaa actcagcaca tcctaactca ggccttgcaa 4380
caattatgtc agatggaccg ggaggcagca aatggatgta cgttggcaga cacaaggcag 4440
gacaggtttg gagagatatc acgggcaata gaacaggaac agttacaatc aacgctgacg 4500
gctggggcaa ttttagcgtt aatggcggct cagttagcat ctgggtgaat aaatgaaaga 4560
gcagagagga cggatttcct gaaggaaatc cgttttttta ttttgcggcc gcatattccg 4620
cattcgcaat gcctaccgca tactaaaaac cgcacattca cagttatttc atttttaatt 4680
ttcgtctttc cgcgtgaaac tcattgacac tctttatgga atatggtaaa ttatcagata 4740
tttatgacgc ttatttagga ggaaatctta catgtttcga gtattggtct cagataaaat 4800
gtccagcgac ggcctcaaac cattaatgga agcagatttt attgaaattg tagaaaagaa 4860
tgttgcggaa gcggaagacg agcttcatac gtttgacgcg ctcttggtgc ggagcgccac 4920
gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg aaaatcgtcg ccagagcagg 4980
tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa cacggtgtta tcgtcgtaaa 5040
cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc tttgcaatgt tttcagcgtt 5100
aatgagacat attccgcagg caaacatctc cgtgaaatca agggagtgga atcgttcggc 5160
ttacgtcggt tcagagcttt acggaaaaac gctcggcatc atcggaatgg gccgcatcgg 5220
aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc gttcatgtat ttgacccgtt 5280
cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg aacagctttg aagaagttct 5340
ggcatgcgcc gacatcatta cggttcatac cccgctcacg aaagaaacga agggactttt 5400
gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt ctcgttaact gtgcaagagg 5460
cggcatcatc gatgaagcag cgcttttgga agctctggaa agcggacatg tcgctggcgc 5520
tgccttggat gtattcgaag tcgagcctcc ggtcgattca aaactgatcg atcatccgct 5580
tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa gcccagctga atgtcgctgc 5640
acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac cctgtgatgt ccgcgatcaa 5700
ccttccggcc atgacaaagg attcattcga aaaaatccag ccttatcatc agtttgccaa 5760
tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct gttcaagatg tagccatcca 5820
atatgaaggc tccatcgcca aacttgaaac gtcatttatt acgaaaagcc ttttggccgg 5880
atttctgaag ccgagggtcg cggctaccgt taacgaagtg aatgccggca ccgttgcgaa 5940
agagcgcggc atcagcttca gcgaaaaaat ttcttccaat gagtcaggct atgaaaactg 6000
catctctgtg actgtcacgg gagatgtaac aacattctct ttaagagcga cgtacattcc 6060
gcacttcggc ggacgcatcg ttgccttaaa cggctttgat attgattttt atccggctgg 6120
acaccttgtc tacattcacc accaggataa accaggggct atcggccatg tcggacgaat 6180
tttaggagac catgacatca atatcgccac tatgcaggta ggccgaaaag aaaaaggcgg 6240
agaagcgatc atgatgcttt cctttgaccg ccaccttgag gacgatattt tagctgagct 6300
gaaaaacatc ccggatatcg tgtctgttaa agccatcgac cttccttaaa cagaagctgc 6360
ggaacctgaa aagaattcct ttcaggttcc gtttttttta ggaattctcc ctgatctcaa 6420
gcatctggcg gggataaatc cgctctcctt tcaaatcgtt ccattctttg aggcgctgta 6480
cagttacgcc cattttttcg gcgatatgat gaagcgtatc ccctttccgc actacatatg 6540
taccggtctt cgattcatcg tcatgaaggc ggagtgtttg gccggccttg agatttgaat 6600
gtttcaaccc gtttattctc atgatctcct cgatggatat accgctatcc ttgctgattc 6660
tccagagcgt gtcccctttt tgaacggtca ccgcaccgct cattgtcccg gcgttttgat 6720
aaacgtggat agaattttgc cggaacgcct cctcacgaag caccgtcagc ggattgattg 6780
catatctttt atcttcagtc catgaaccgt gatgcatttc aaaatgcagg tgggttccgg 6840
tcgatattcc cgtattgccg atgattccga tttgctcgcc ttttttcacc cgctcctttt 6900
cctttttcag gcgtttgctt aagtgggcat aaacggtttc atatccgttg tcatgtttaa 6960
taaatatcac ttggccgtag gagtcggatt gatacgattt gcttatcgtt ccgtctgcgg 7020
ctgccgctac tgcttcccct tcgggagcag cgatgtcaag ccccttatgc tttccgcctc 7080
tcgtaccgaa ttgatctgtg atctctcctt taatcggttc aatccactct gaggcttccg 7140
cccccggggc attgacgaaa agcgccaatc ccgaaagcca tgcgatcgcg aacaggaagt 7200
tttgatgtct gagtttcttc aaggttttcc atatcctcct attacatgca tcttcggtaa 7260
aattgccccc tattcggaga cagcttagta tacttccaaa tcaatacaat ttatacatta 7320
aaaaaagact ccgcacaggg agtcttttag ttttctatcg tcatcggatt cggtgcgtac 7380
ggaacctgta cagatttcga caggtcatag gcgccgacct tggttatgga tgcgttttta 7440
aatttcactt ttgtgaagcc gaaatctttc gcggtcaata gaaggccttc caccatcaag 7500
acatcttcgg gtttattttc aatattcgcg gaggaagaaa attgaatgat cagttctttt 7560
ccattctttt gaatatcttc aatcggcgta tcatcggata aaatgggttt taaatgagtg 7620
ccgctttctt cgtttttcat catcttaatc gcttcctgca ccgattcgta agattcgctt 7680
gaaggtgcaa ggaaccggcg cccgtctgag ctttcatata aatagtagca tttttgcgtc 7740
tggtgcataa tcgccatatc ggcgagcatt ccgaatgttt caaattcaac acccgattta 7800
tcattggaaa taaacagaac agaatcatac gatccccatt taaaggtttc gttgatcaca 7860
tttttcagcc gttcgaaatc ttcgactgat agctccggta ttttctcatc aacttgaatc 7920
ttcagttttt tattgttttt ctgctctttg aacttcacct tatcaaggta agctgtgtca 7980
aatgatgtaa actggtccac tccaagccgg ctgtaagcgt gaagcgcatc ttcaagattt 8040
gtcatgccag tgcttttctc gaggcttacc gggacaacga cagacttgga ctcgtcaagg 8100
aaagcgaagg tgatatagtc gtctttttga ttctgtgaga cgacaaacgt atttgcaggt 8160
tcagacttgg cagcatcagc ctccgtctgc accaattttc cgtcagaaga aatgttggcg 8220
tcggcgctgt tttgagatct gatctgttcg attaactggg gagtgatcag catcagaaga 8280
aagagaacca aaactgtagc agcaaatgcg ccgacccgtt ttttcggtga tttacgcttt 8340
ggtgcgagaa tcagcttttg atagatctga tttgccgaac gattatcctt aaccgttgga 8400
agttggctta gtaacgcctt cagccgttct tcgttccatt ctgacttctt cattctttgg 8460
atcctccttc aaaagctcca tctgtttacg aagcactttc agaccgcggt gctgagtggt 8520
ttttaccttg ctttcggaaa aattcaaggc ttttgctgtt tcactgatcg aatatccttg 8580
aataaaacgc aagacgataa ctgatctttg gtcaagcgta cacttgtcta gggcctcgaa 8640
aatttccttt aggttttcat tttgcatcac gatgtcctca ggcagaggct tgcggtcttt 8700
tacatcttgt ttctcccagt caaacgtccc caaaatccgc tggcggatcg tctgctgctt 8760
tctgaaccag tcgatcgcaa cgtgccgcgc aatcgaaaga agccaggttt tttcgctgct 8820
cctgccttca aatgtttcgt aagaatgcag gacgcggatg tatacttcct gaactaagtc 8880
ttccgcctga tttttgtctt ttaccatata aaataaaaac tgaaataaat cctgatgata 8940
ctgatcatat attttctgaa aggtttcttc cacctgaaac ccctccgttc aatttattgt 9000
cgtttgtcaa tcttaaaagg ttacattaca actattacaa ctatattacg aacatatgaa 9060
aatggaaagg gggttttgcg aaagttaagc ttaattttaa cttaacaagc acaaaagcac 9120
ccgttctaaa tgaacaggtg ccaaggttat aggagcccac attttcacta agctgtgccc 9180
ttacaaggct ttcgttctcc tgaccggagc gttgcggatc cgctgaaatg aactaatttc 9240
aatccgttta tgactttaag tccaattgtt ggcgaagctt tttggaaatc tccattctct 9300
tttcgtcagt cactaggtga taccataagc cgtcaacttt tttgtcttca ccttcaattt 9360
ctacctgctt aatatcttta gcagcttctt tataagaact ttgaatatcg atcatcttgt 9420
ccagtgttaa gtttgttttg atgttttttt ctaatgctgc caaaatctct tgatagtttg 9480
ttaatgattt taattgtgca ccttcatgaa taatttcgtt gataatctca cgctgacgct 9540
cttga 9545
<210> 138
<211> 93
<212> DNA
<213> Bacillus subtilis
<400> 138
tcgctgataa acagctgaca tcaactaaaa gcttcattaa atactttgaa aaaagttgtt 60
gacttaaaag aagctaaatg ttatagtaat aaa 93
<210> 139
<211> 58
<212> DNA
<213> Bacillus subtilis
<400> 139
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaaga 58
<210> 140
<211> 1455
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 140
caccacaacg gaacaaacgg cacaatgatg cagtattttg aatggcacct gccgaatgat 60
ggacagcatt ggaatagact gagaaacgac gcagcgaacc tgaagaacct tggcatcacg 120
gcagtctgga ttccgcctgc gtggaaaggc acatcacaaa atgatgtcgg ctatggcgca 180
tatgacctgt acgacctggg agagttcaac cagaagggaa caatcagaac gaaatatgga 240
acaagatcac aactgcaaag cgctatcgcg agcctgcaaa ataatggcat ccaagtttat 300
ggcgacgtgg tcatgaacca caaaggcgga gcagacggaa cggaatgggt tcaagcggtc 360
gaggtgaatc cgagcaacag aaaccaagag gttacgggcg aatacacgat cgaagcctgg 420
acaaagttcg actttccggg cagaggcaat acacactcaa gcttcaagtg gagatggtat 480
cactttgacg gcacggactg ggatcaaagc agacgtctga ataacagaat ctataagttt 540
acaggcaaag gttgggattg ggaggtggac acagaaaacg gaaactatga ctatctgatg 600
tatgctgacg tcgacatgga tcatccggag gtcatcaatg agctgagaag atggggcgtt 660
tggtacacga acacactgaa cctggatgga ttcagaattg acgcagtcaa acacatcaag 720
tactcattta caagagactg gcttaaccac gtgagatcaa caacgggaaa gaacaatatg 780
ttcgccgttg cggagttttg gaagaatgat ctgggcgcaa tcgagaacta tcttcacaag 840
acgaactgga atcatagcgt cttcgatgtc ccgctgcact acaatctgta taatgcatca 900
aagtcaggcg gcaactacga tatgagacaa atcctgaatg gaacggtcgt ctcaaaacac 960
ccgatgcacg ccgtcacgtt tgtcgataat cacgattcac aaccggcaga agcccttgag 1020
agctttgttg aggcatggtt caaaccgctg gcctatgctc tgatcctgac aagagagcaa 1080
ggctatccgt cagtgtttta cggcgattac tacggcattc cgacacatgg cgtcgcagcc 1140
atgaaaggaa agattgatcc gattctggag gctagacaga aatacgccta cggaacgcaa 1200
cacgattacc ttgatcacca taacatcatc ggatggacga gagagggaaa ctcagcacat 1260
cctaactcag gccttgcaac aattatgtca gatggaccgg gaggcagcaa atggatgtac 1320
gttggcagac acaaggcagg acaggtttgg agagatatca cgggcaatag aacaggaaca 1380
gttacaatca acgctgacgg ctggggcaat tttagcgtta atggcggctc agttagcatc 1440
tgggtgaata aatga 1455
<210> 141
<211> 3113
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 141
ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60
gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120
attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180
gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240
gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300
ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360
ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420
gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480
gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540
ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600
ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660
gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720
gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780
gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840
ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900
actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960
atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020
gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080
tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140
gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200
attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260
gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320
aaaaatggag attccctaag aggggggtct ccatttttaa ttcagagctc gtcgctgata 1380
aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg ttgacttaaa 1440
agaagctaaa tgttatagta ataaaacaga atagtctttt aagtaagtct actctgaatt 1500
tttttaaaag gagagggtaa agaatgaaac aacaaaaacg gctttacgcc cgattgctga 1560
cgctgttatt tgcgctcatc ttcttgctgc ctcattctgc agctagcgca caccacaacg 1620
gaacaaacgg cacaatgatg cagtattttg aatggcacct gccgaatgat ggacagcatt 1680
ggaatagact gagaaacgac gcagcgaacc tgaagaacct tggcatcacg gcagtctgga 1740
ttccgcctgc gtggaaaggc acatcacaaa atgatgtcgg ctatggcgca tatgacctgt 1800
acgacctggg agagttcaac cagaagggaa caatcagaac gaaatatgga acaagatcac 1860
aactgcaaag cgctatcgcg agcctgcaaa ataatggcat ccaagtttat ggcgacgtgg 1920
tcatgaacca caaaggcgga gcagacggaa cggaatgggt tcaagcggtc gaggtgaatc 1980
cgagcaacag aaaccaagag gttacgggcg aatacacgat cgaagcctgg acaaagttcg 2040
actttccggg cagaggcaat acacactcaa gcttcaagtg gagatggtat cactttgacg 2100
gcacggactg ggatcaaagc agacgtctga ataacagaat ctataagttt acaggcaaag 2160
gttgggattg ggaggtggac acagaaaacg gaaactatga ctatctgatg tatgctgacg 2220
tcgacatgga tcatccggag gtcatcaatg agctgagaag atggggcgtt tggtacacga 2280
acacactgaa cctggatgga ttcagaattg acgcagtcaa acacatcaag tactcattta 2340
caagagactg gcttaaccac gtgagatcaa caacgggaaa gaacaatatg ttcgccgttg 2400
cggagttttg gaagaatgat ctgggcgcaa tcgagaacta tcttcacaag acgaactgga 2460
atcatagcgt cttcgatgtc ccgctgcact acaatctgta taatgcatca aagtcaggcg 2520
gcaactacga tatgagacaa atcctgaatg gaacggtcgt ctcaaaacac ccgatgcacg 2580
ccgtcacgtt tgtcgataat cacgattcac aaccggcaga agcccttgag agctttgttg 2640
aggcatggtt caaaccgctg gcctatgctc tgatcctgac aagagagcaa ggctatccgt 2700
cagtgtttta cggcgattac tacggcattc cgacacatgg cgtcgcagcc atgaaaggaa 2760
agattgatcc gattctggag gctagacaga aatacgccta cggaacgcaa cacgattacc 2820
ttgatcacca taacatcatc ggatggacga gagagggaaa ctcagcacat cctaactcag 2880
gccttgcaac aattatgtca gatggaccgg gaggcagcaa atggatgtac gttggcagac 2940
acaaggcagg acaggtttgg agagatatca cgggcaatag aacaggaaca gttacaatca 3000
acgctgacgg ctggggcaat tttagcgtta atggcggctc agttagcatc tgggtgaata 3060
aatgaaagag cagagaggac ggatttcctg aaggaaatcc gtttttttat ttt 3113
<210> 142
<211> 2231
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 142
gtgttgtgct gaatcaatac atagaggccg gcggcgtatc gggtacaaca tctgtcaaga 60
cgtttaacgc tgatttaaag cagaaaaagc tgctgtccct tcaagatctg tttgaagaga 120
attcagattt tctgaacagg atttcaagca ttgcctatca ggaattgaaa aatcggaatc 180
cgtctgctga catggctttt ttaaaagaag ggacgagccc tcaggaagaa catttcagcc 240
gctttgcgct tcttgaaaac gaggtggaat tttattttga gaaaaaacaa gccggtcttg 300
aacagtttgt aaaaataaaa aaagaatggg taaaagatat tttaaaagac cgatatcagg 360
atatgaaaaa gaatcgtctt caggccaaac ctgatcagga gcctgttccg cttccgaagc 420
aagcgaaaat taatcccgat gaaaaagtga ttgccctcac atttgatgac ggtccgaatc 480
ccgctacaac gaataaaata ttaaacgctt tacagaagca tgaagggcat gcgaccttct 540
ttgtgcttgg aagcagagcc caatattatc ccgaaacgat aaaacggatg ctgaaggaag 600
gaaacgaagt cggcaaccat tcctgggacc atccgttatt gacaaggctg tcaaacgaaa 660
aagcgtatca ggagattaac gacacgcaag aaatgatcga aaaaatcagc ggacacctgc 720
ctgtacactt gcgtcctcca tacggcggga tcaatgattc cgtccgctcg ctttccaatc 780
tgaaggtttc attgtgggat gttgatccgg aagattggaa gtacaaaaat aagcaaaaga 840
ttgtcaatca tgtcatgagc catgcgggag acggaaaaat cgtcttaatg cacgatattt 900
atgcaacgtc cgcagatgct gctgaagaga ttattaaaaa gctgaaagca aaaggctatc 960
aattggtaac tgtatctcag cttgaagaag tgaagaagca gagaggctat tgaataaatg 1020
agtagaaagc gccatatcgg cgcttttctt ttggaagaaa atatagggaa aatggtactt 1080
gttaaaaatt cggaatattt atacaatatc atatgtttca cattgaaagg ggaggagaat 1140
catgaaacaa caaaaacggc tttacgcccg attgctgacg ctgttaggat cccacgtaaa 1200
cggcgggtcg gtttcaattt atgttcaaag atagaagagc aggctgacag tttgaatcgc 1260
ataggtaagg cggggatgaa atggcaacgt tatctgatgt agcaaagaaa gcaaatgtgt 1320
cgaaaatgac ggtatcgcgg gtgatcaatc atcctgagac tgtgacggat gaattgaaaa 1380
agcttgttca ttccgcaatg aaggagctca attatatacc gaactatgca gcaagagcgc 1440
tcgttcaaaa cagaacacag gtcgtcaagc tgctcatact ggaagaaatg gatacaacag 1500
aaccttatta tatgaatctg ttaacgggaa tcagccgcga gctggaccgt catcattatg 1560
ctttgcagct tgtcacaagg aaatctctca atatcggcca gtgcgacggc attattgcga 1620
cggggttgag aaaagccgat tttgaagggc tcatcaaggt ttttgaaaag cctgtcgttg 1680
tattcgggca aaatgaaatg ggctacgatt ttattgatgt taacaatgaa aaaggaacct 1740
atatggcaac acgtcacgtc attggtctgg gcgtccgcaa tgtcgtcttt tttgggatcg 1800
atttggatga gccctttgaa cgctcaaggg aaaaaggcta tcttcaggcg atggaaggca 1860
gtctgaaaaa agcagcgatt ttccggatgg aaaacagttc aaaaaaaagt gaagcacgcg 1920
cgcgggaagt gcttgcatcc tttgacgcac ctgcagcggt tgtttgcgct tcggaccgaa 1980
tcgcgctcgg ggttatccgc gcggtgcaat cgcttggtaa aagaattccg gaagatgtcg 2040
cggtcaccgg ctatgacggg gtgtttctcg accggatcgc ttcgcctcgc ctgacaaccg 2100
tcagacagcc tgttgttgaa atgggagagg cttgcgcgag aatcctgctg aaaaaaatca 2160
atgaagacgg agcgccgcaa ggcaatcaat tttttgagcc ggagcttatt gtccgcgaat 2220
cgactttgta g 2231
<210> 143
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 143
Ala Ala Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Val Pro
1 5 10 15
Asn Asp Gly Gln Gln Trp Asn Arg Leu Arg Thr Asp Ala Pro Tyr Leu
20 25 30
Ser Ser Val Gly Ile Thr Ala Val Trp Thr Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Lys Ser Ala Val Asn Thr Leu His Ser Asn Gly Ile Gln
85 90 95
Val Tyr Gly Asp Val Val Met Asn His Lys Ala Gly Ala Asp Tyr Thr
100 105 110
Glu Asn Val Thr Ala Val Glu Val Asn Pro Ser Asn Arg Tyr Gln Glu
115 120 125
Thr Ser Gly Glu Tyr Asn Ile Gln Ala Trp Thr Gly Phe Asn Phe Pro
130 135 140
Gly Arg Gly Thr Thr Tyr Ser Asn Trp Lys Trp Gln Trp Phe His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Gln Ser Arg Ser Leu Ser Arg Ile Phe Lys
165 170 175
Phe His Gly Lys Ala Trp Asp Trp Pro Val Ser Ser Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Tyr Asp Tyr Asp His Pro Asp Val
195 200 205
Val Asn Glu Met Lys Lys Trp Gly Val Trp Tyr Ala Asn Glu Val Gly
210 215 220
Leu Asp Gly Tyr Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Lys Asp Trp Val Asp Asn Ala Arg Ala Ala Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Gly Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Asn Asn
260 265 270
Tyr Leu Ala Lys Val Asn Tyr Asn Gln Ser Leu Phe Asp Ala Pro Leu
275 280 285
His Tyr Asn Phe Tyr Ala Ala Ser Thr Gly Gly Gly Ala Tyr Asp Met
290 295 300
Arg Asn Ile Leu Asn Asn Thr Leu Val Ala Ser Asn Pro Thr Lys Ala
305 310 315 320
Val Thr Leu Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Ser Gly Gly Tyr Pro Ala Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Thr Thr Thr Tyr Glu Ile Pro Ala Leu Lys Ser Lys Ile
370 375 380
Glu Pro Leu Leu Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Thr Gln Arg
385 390 395 400
Asp Tyr Ile Asp Asn Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Thr Lys Ala Lys Ser Gly Leu Ala Thr Val Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Arg Met Tyr Val Gly Thr Ser Asn Ala Gly Glu Ile
435 440 445
Trp Tyr Asp Leu Thr Gly Asn Arg Thr Asp Lys Ile Thr Ile Gly Ser
450 455 460
Asp Gly Tyr Ala Thr Phe Pro Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Gln Gln
<210> 144
<211> 9515
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 144
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880
cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940
atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000
gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060
attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120
ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180
aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240
cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300
tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360
agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420
atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480
gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540
aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600
aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660
ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720
agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780
aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840
gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900
cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960
ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020
gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080
acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140
aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200
gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260
ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320
attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380
atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440
ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500
gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560
cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620
aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680
agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gatgaaacaa caaaaacggc 4740
tttacgcccg attgctgacg ctgttatttg cgctcatctt cttgctgcct cattctgcag 4800
ctagcgcagc agcgacaaac ggaacaatga tgcagtattt cgagtggtat gtacctaacg 4860
acggccagca atggaacaga ctgagaacag atgcccctta cttgtcatct gttggtatta 4920
cagcagtatg gacaccgccg gcttataagg gcacgtctca agcagatgtg gggtacggcc 4980
cgtacgatct gtatgattta ggcgagttta atcaaaaagg tacagtcaga acgaagtatg 5040
gcacaaaagg agaacttaaa tctgctgtca acacgctgca ttcaaatgga atccaagtgt 5100
atggtgatgt cgtgatgaat cataaagcag gtgctgatta tacagaaaac gtaacggcgg 5160
tggaggtgaa tccgtctaat agatatcagg aaacgagcgg cgaatataat attcaggcat 5220
ggacaggctt caactttccg ggcagaggaa caacgtattc taactggaaa tggcagtggt 5280
tccattttga tggaacggat tgggaccaga gcagaagcct ctctagaatc ttcaaattcc 5340
atggaaaggc gtgggactgg ccggtttctt cagaaaacgg aaattatgac tatctgatgt 5400
acgcggacta tgattatgac catccggatg tcgtgaatga aatgaaaaag tggggcgtct 5460
ggtatgccaa cgaagttggg ttagatggat acagacttga cgcggtcaaa catattaaat 5520
ttagctttct caaagactgg gtggataacg caagagcagc gacgggaaaa gaaatgttta 5580
cggttggcga atattggcaa aatgatttag gggccctgaa taactacctg gcaaaggtaa 5640
attacaacca atctcttttt gatgcgccgt tgcattacaa cttttacgct gcctcaacag 5700
ggggtggagc gtacgatatg agaaatattc ttaataacac gttagtcgca agcaatccga 5760
caaaggctgt tacgttagtt gagaatcatg acacacagcc tggacaatca ctggaatcaa 5820
cagtccaacc gtggtttaaa ccgttagcct acgcgtttat tctcacgaga agcggaggct 5880
atcctgcggt attttatgga gatatgtacg gtacaaaagg aacgacaaca tatgagatcc 5940
ctgctcttaa atctaaaatc gaacctttgc ttaaggctag aaaagactat gcttatggaa 6000
cacagagaga ctatattgat aacccggatg tcattggctg gacgagagaa ggggactcaa 6060
cgaaagccaa gagcggtctg gccacagtga ttacagatgg gccgggcggt tcaaaaagaa 6120
tgtatgttgg cacgagcaat gcgggtgaaa tctggtatga tttgacaggg aatagaacag 6180
ataaaatcac gattggaagc gatggctatg caacatttcc tgtcaatggg ggctcagttt 6240
cagtatgggt gcagcaatga aagcttctcg aggttaacag aggacggatt tcctgaagga 6300
aatccgtttt tttattttac agaagctgcg gaacctgaaa agaattcctt tcaggttccg 6360
ttttttttag gaattctccc tgatctcaag catctggcgg ggataaatcc gctctccttt 6420
caaatcgttc cattctttga ggcgctgtac agttacgccc attttttcgg cgatatgatg 6480
aagcgtatcc cctttccgca ctacatatgt accggtcttc gattcatcgt catgaaggcg 6540
gagtgtttgg ccggccttga gatttgaatg tttcaacccg tttattctca tgatctcctc 6600
gatggatata ccgctatcct tgctgattct ccagagcgtg tccccttttt gaacggtcac 6660
cgcaccgctc attgtcccgg cgttttgata aacgtggata gaattttgcc ggaacgcctc 6720
ctcacgaagc accgtcagcg gattgattgc atatctttta tcttcagtcc atgaaccgtg 6780
atgcatttca aaatgcaggt gggttccggt cgatattccc gtattgccga tgattccgat 6840
ttgctcgcct tttttcaccc gctccttttc ctttttcagg cgtttgctta agtgggcata 6900
aacggtttca tatccgttgt catgtttaat aaatatcact tggccgtagg agtcggattg 6960
atacgatttg cttatcgttc cgtctgcggc tgccgctact gcttcccctt cgggagcagc 7020
gatgtcaagc cccttatgct ttccgcctct cgtaccgaat tgatctgtga tctctccttt 7080
aatcggttca atccactctg aggcttccgc ccccggggca ttgacgaaaa gcgccaatcc 7140
cgaaagccat gcgatcgcga acaggaagtt ttgatgtctg agtttcttca aggttttcca 7200
tatcctccta ttacatgcat cttcggtaaa attgccccct attcggagac agcttagtat 7260
acttccaaat caatacaatt tatacattaa aaaaagactc cgcacaggga gtcttttagt 7320
tttctatcgt catcggattc ggtgcgtacg gaacctgtac agatttcgac aggtcatagg 7380
cgccgacctt ggttatggat gcgtttttaa atttcacttt tgtgaagccg aaatctttcg 7440
cggtcaatag aaggccttcc accatcaaga catcttcggg tttattttca atattcgcgg 7500
aggaagaaaa ttgaatgatc agttcttttc cattcttttg aatatcttca atcggcgtat 7560
catcggataa aatgggtttt aaatgagtgc cgctttcttc gtttttcatc atcttaatcg 7620
cttcctgcac cgattcgtaa gattcgcttg aaggtgcaag gaaccggcgc ccgtctgagc 7680
tttcatataa atagtagcat ttttgcgtct ggtgcataat cgccatatcg gcgagcattc 7740
cgaatgtttc aaattcaaca cccgatttat cattggaaat aaacagaaca gaatcatacg 7800
atccccattt aaaggtttcg ttgatcacat ttttcagccg ttcgaaatct tcgactgata 7860
gctccggtat tttctcatca acttgaatct tcagtttttt attgtttttc tgctctttga 7920
acttcacctt atcaaggtaa gctgtgtcaa atgatgtaaa ctggtccact ccaagccggc 7980
tgtaagcgtg aagcgcatct tcaagatttg tcatgccagt gcttttctcg aggcttaccg 8040
ggacaacgac agacttggac tcgtcaagga aagcgaaggt gatatagtcg tctttttgat 8100
tctgtgagac gacaaacgta tttgcaggtt cagacttggc agcatcagcc tccgtctgca 8160
ccaattttcc gtcagaagaa atgttggcgt cggcgctgtt ttgagatctg atctgttcga 8220
ttaactgggg agtgatcagc atcagaagaa agagaaccaa aactgtagca gcaaatgcgc 8280
cgacccgttt tttcggtgat ttacgctttg gtgcgagaat cagcttttga tagatctgat 8340
ttgccgaacg attatcctta accgttggaa gttggcttag taacgccttc agccgttctt 8400
cgttccattc tgacttcttc attctttgga tcctccttca aaagctccat ctgtttacga 8460
agcactttca gaccgcggtg ctgagtggtt tttaccttgc tttcggaaaa attcaaggct 8520
tttgctgttt cactgatcga atatccttga ataaaacgca agacgataac tgatctttgg 8580
tcaagcgtac acttgtctag ggcctcgaaa atttccttta ggttttcatt ttgcatcacg 8640
atgtcctcag gcagaggctt gcggtctttt acatcttgtt tctcccagtc aaacgtcccc 8700
aaaatccgct ggcggatcgt ctgctgcttt ctgaaccagt cgatcgcaac gtgccgcgca 8760
atcgaaagaa gccaggtttt ttcgctgctc ctgccttcaa atgtttcgta agaatgcagg 8820
acgcggatgt atacttcctg aactaagtct tccgcctgat ttttgtcttt taccatataa 8880
aataaaaact gaaataaatc ctgatgatac tgatcatata ttttctgaaa ggtttcttcc 8940
acctgaaacc cctccgttca atttattgtc gtttgtcaat cttaaaaggt tacattacaa 9000
ctattacaac tatattacga acatatgaaa atggaaaggg ggttttgcga aagttaagct 9060
taattttaac ttaacaagca caaaagcacc cgttctaaat gaacaggtgc caaggttata 9120
ggagcccaca ttttcactaa gctgtgccct tacaaggctt tcgttctcct gaccggagcg 9180
ttgcggatcc gctgaaatga actaatttca atccgtttat gactttaagt ccaattgttg 9240
gcgaagcttt ttggaaatct ccattctctt ttcgtcagtc actaggtgat accataagcc 9300
gtcaactttt ttgtcttcac cttcaatttc tacctgctta atatctttag cagcttcttt 9360
ataagaactt tgaatatcga tcatcttgtc cagtgttaag tttgttttga tgtttttttc 9420
taatgctgcc aaaatctctt gatagtttgt taatgatttt aattgtgcac cttcatgaat 9480
aatttcgttg ataatctcac gctgacgctc ttgac 9515
<210> 145
<211> 1452
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 145
gcagcgacaa acggaacaat gatgcagtat ttcgagtggt atgtacctaa cgacggccag 60
caatggaaca gactgagaac agatgcccct tacttgtcat ctgttggtat tacagcagta 120
tggacaccgc cggcttataa gggcacgtct caagcagatg tggggtacgg cccgtacgat 180
ctgtatgatt taggcgagtt taatcaaaaa ggtacagtca gaacgaagta tggcacaaaa 240
ggagaactta aatctgctgt caacacgctg cattcaaatg gaatccaagt gtatggtgat 300
gtcgtgatga atcataaagc aggtgctgat tatacagaaa acgtaacggc ggtggaggtg 360
aatccgtcta atagatatca ggaaacgagc ggcgaatata atattcaggc atggacaggc 420
ttcaactttc cgggcagagg aacaacgtat tctaactgga aatggcagtg gttccatttt 480
gatggaacgg attgggacca gagcagaagc ctctctagaa tcttcaaatt ccatggaaag 540
gcgtgggact ggccggtttc ttcagaaaac ggaaattatg actatctgat gtacgcggac 600
tatgattatg accatccgga tgtcgtgaat gaaatgaaaa agtggggcgt ctggtatgcc 660
aacgaagttg ggttagatgg atacagactt gacgcggtca aacatattaa atttagcttt 720
ctcaaagact gggtggataa cgcaagagca gcgacgggaa aagaaatgtt tacggttggc 780
gaatattggc aaaatgattt aggggccctg aataactacc tggcaaaggt aaattacaac 840
caatctcttt ttgatgcgcc gttgcattac aacttttacg ctgcctcaac agggggtgga 900
gcgtacgata tgagaaatat tcttaataac acgttagtcg caagcaatcc gacaaaggct 960
gttacgttag ttgagaatca tgacacacag cctggacaat cactggaatc aacagtccaa 1020
ccgtggttta aaccgttagc ctacgcgttt attctcacga gaagcggagg ctatcctgcg 1080
gtattttatg gagatatgta cggtacaaaa ggaacgacaa catatgagat ccctgctctt 1140
aaatctaaaa tcgaaccttt gcttaaggct agaaaagact atgcttatgg aacacagaga 1200
gactatattg ataacccgga tgtcattggc tggacgagag aaggggactc aacgaaagcc 1260
aagagcggtc tggccacagt gattacagat gggccgggcg gttcaaaaag aatgtatgtt 1320
ggcacgagca atgcgggtga aatctggtat gatttgacag ggaatagaac agataaaatc 1380
acgattggaa gcgatggcta tgcaacattt cctgtcaatg ggggctcagt ttcagtatgg 1440
gtgcagcaat ga 1452
<210> 146
<211> 9214
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 146
catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60
tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120
cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180
gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240
tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300
aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360
cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420
ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480
tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540
gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600
cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660
cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720
gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780
tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840
agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900
cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960
gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020
attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080
atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140
tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200
gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260
acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320
gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380
gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440
atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500
tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560
gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620
ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680
ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740
cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800
ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860
ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920
ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980
ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040
tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100
cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160
ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220
cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280
cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340
agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400
cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460
ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520
cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580
tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640
gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700
agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760
ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820
tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880
ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940
aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000
gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060
tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120
agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180
tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240
caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300
catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360
tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420
gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480
ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540
tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600
ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660
agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720
ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780
gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840
ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900
ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960
ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020
gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080
gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140
taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200
aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260
cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320
ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380
gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440
tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500
aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560
aagtctactc tgaatttttt taaaaggaga gggtaaagat gaaacaacaa aaacggcttt 4620
acgcccgatt gctgacgctg ttatttgcgc tcatcttctt gctgcctcat tctgcagcta 4680
gcgcagcagc gacaaacgga acaatgatgc agtatttcga gtggtatgta cctaacgacg 4740
gccagcaatg gaacagactg agaacagatg ccccttactt gtcatctgtt ggtattacag 4800
cagtatggac accgccggct tataagggca cgtctcaagc agatgtgggg tacggcccgt 4860
acgatctgta tgatttaggc gagtttaatc aaaaaggtac agtcagaacg aagtatggca 4920
caaaaggaga acttaaatct gctgtcaaca cgctgcattc aaatggaatc caagtgtatg 4980
gtgatgtcgt gatgaatcat aaagcaggtg ctgattatac agaaaacgta acggcggtgg 5040
aggtgaatcc gtctaataga tatcaggaaa cgagcggcga atataatatt caggcatgga 5100
caggcttcaa ctttccgggc agaggaacaa cgtattctaa ctggaaatgg cagtggttcc 5160
attttgatgg aacggattgg gaccagagca gaagcctctc tagaatcttc aaattccatg 5220
gaaaggcgtg ggactggccg gtttcttcag aaaacggaaa ttatgactat ctgatgtacg 5280
cggactatga ttatgaccat ccggatgtcg tgaatgaaat gaaaaagtgg ggcgtctggt 5340
atgccaacga agttgggtta gatggataca gacttgacgc ggtcaaacat attaaattta 5400
gctttctcaa agactgggtg gataacgcaa gagcagcgac gggaaaagaa atgtttacgg 5460
ttggcgaata ttggcaaaat gatttagggg ccctgaataa ctacctggca aaggtaaatt 5520
acaaccaatc tctttttgat gcgccgttgc attacaactt ttacgctgcc tcaacagggg 5580
gtggagcgta cgatatgaga aatattctta ataacacgtt agtcgcaagc aatccgacaa 5640
aggctgttac gttagttgag aatcatgaca cacagcctgg acaatcactg gaatcaacag 5700
tccaaccgtg gtttaaaccg ttagcctacg cgtttattct cacgagaagc ggaggctatc 5760
ctgcggtatt ttatggagat atgtacggta caaaaggaac gacaacatat gagatccctg 5820
ctcttaaatc taaaatcgaa cctttgctta aggctagaaa agactatgct tatggaacac 5880
agagagacta tattgataac ccggatgtca ttggctggac gagagaaggg gactcaacga 5940
aagccaagag cggtctggcc acagtgatta cagatgggcc gggcggttca aaaagaatgt 6000
atgttggcac gagcaatgcg ggtgaaatct ggtatgattt gacagggaat agaacagata 6060
aaatcacgat tggaagcgat ggctatgcaa catttcctgt caatgggggc tcagtttcag 6120
tatgggtgca gcaatgaaag cttctcgagg ttaacagagg acggatttcc tgaaggaaat 6180
ccgttttttt attttcaagc acgaaaaaca cttcccggtg atcgggaggt gttttttgtt 6240
aaaaagatca tgacatgcat agaacagcga ccgggctaat tgtatataat attgtgaatt 6300
taacaaaaaa tttacaaagg agatgataaa ggcaatgacc agggtgaaaa ggatgagatt 6360
tgctgatttg ttggatttag aggcggagta gatgaaaccg gccaaagtat ccctactcca 6420
ccgattgctc cagtgcctga agcaatgtgt tgattgtaac acagtaaatc gttttacagc 6480
aataaacatt tttgtgaata ttttattgat ttcggctgtg atctcattcc catattctgc 6540
tgcggcccat ggcgcaacac agtccggcga tcaatattca agctttgaag aattggagcg 6600
gaatgaagat ccagcttctt accgaattac ggagaagaac gcaagagtgc cgatgctcat 6660
catggccatc catggaggcg gcatcgaacc cggaacgagc gaaatcgcca atgaagtgtc 6720
caaaaactat tccctgtact tgtttgaagg gctgaaatca tcaggcaata cggaccttca 6780
cattacaagc acgcgttttg acgagccagc ggcgctcgca attactgcaa gccaccagta 6840
tgtcatgtcg ctccacggct attacagtga agaccgcgat attaaagtag gcggcacaga 6900
ccgcgctaaa atcagaatat tggttgatga gctgaaccgc tcggggtttg ccgctgaaat 6960
gctggggaca gatgacaagt atgccggaac ccatccgaat aacatcgcca acaagtcgct 7020
ttccgggctg agcattcagc ttgaaatgag cacgggtttc cgcaaatctt tattcgaccg 7080
gtttacacta aaagacaggg cggcgacgca aaacgaaacg ttttaccgat ttacaaagct 7140
gctgacagat tttattcatg aaaactatga agaagacgga ggggatttcc cctctgcaaa 7200
aataaaacac ccccttcaag tgaaaaagga ggtgtttcgg cggttgtgtt aaccgttgga 7260
ctctgaggtg ccgccgccgg tgaatacgga aacgatggcg ttccacagag acacaaagaa 7320
gtcgatcagt ttttgaagaa agttttgtcc ttcttcagaa tccaagaatt tcgtgatttt 7380
atcctttgct ttgtcaagct ggtctccaac ctggttccag tcgatattaa tatttttcat 7440
gttattaaat aaagatataa gagagttttt ctgatcttct gtgagtgtca cgccaagttc 7500
ggaagcagcc gaatcaatcg ttttctccaa ttcctctttt gactcgggaa ctccgttttt 7560
cgagatttct tccttgactt tggccatcag cgctgacgcg ttttcactgc cgattttctc 7620
gccaagctct gaagtggtga caagctcttc attcgcgacc tttttcacat cttcggaaat 7680
tttttcgccc gaagtcgttt catacgcttt catcaatccg gttaaagcgg ctgtgcctga 7740
cacttcaaac ggagcggtga catagacttt ggcgtctttt acaccggccg tcatcagcgc 7800
gttcaaatac atctcatctg taattctgct gatattgtgt gtctgaactt ccaaaccggt 7860
gccttttttc gctacggtaa ttgaagaaga agaaatcgct cttgttccga tttgtgcttt 7920
cggtatataa tcccctaaat atttatgctc ctcatcattt gtcacctcga tgatggtcgc 7980
attttcaggc gcattcattt cttttaatac tttttgtctg tcctggcttg acaagtcttt 8040
ccccagcgtg acgatgacat cacccactgc ggcgtcagcg aagctgacct gcgggaaaat 8100
gagcagacac aatgctgtaa agattcctag tatcgatttt ttcaagctca atgccctcct 8160
taaaaatgca ggcttcaggc agaattgctg tacttttaaa gaagcctgcc ggaacggaaa 8220
taatgcgttc cgaaatatag acggatgaaa gatgagtgag gtttcaaaga aaaaaagaga 8280
gaattttctc ttcaagtcaa atgccctccc ggcatcgtat ctcgccgctc ttttatcatt 8340
catgattttc acaggcgatt caaccttttt ttaaaatttt ttacaaaaac gatacaagag 8400
cggcgtttat ttcggtcgat tggctctctg cttcttcaat atgatataat gacccttgtg 8460
aaatgaaagg agagaatcaa gatggctaaa aaaggataca tacaactgac aaacggcaaa 8520
aaaatcgagt ttgaactata tccggatgcg gcgccgggaa ctgtcgccaa ctttgaaaaa 8580
cttgcaaacg aagggttcta tgacgggctg aagttccacc gcgtcatccc gggcttcgtc 8640
agccagggag gctgcccgca cggcaccgga acaggcggac ctggatatac gattaaatgc 8700
gagacagaag ggaatccgca caaacacgaa gccggttctc tctcaatggc tcacgcagga 8760
aaagataccg gaggcagcca attttttatc gtccatgagc ctcagccgca cttgaacggc 8820
gttcacaccg ttttcggaaa ggtcacatca ggccttgatg ccgtcacttc aatggagcag 8880
ggacaaggca tggaaaaagt cgaagtattt gatgcataat cagagagcgc aaaaaacagc 8940
ccgcttagcc gggctgtttt tttgtctgta acggtgttta ttttccaggt gcaacaggac 9000
ttgaggccga ttcttcgtcc acatcctgat aggaaataac gatgctaata aataaaataa 9060
ttgtgaaaaa atgacccttt atgtaaaata tattcaagtg aagagctaga tagagaacgc 9120
aatctgtaaa aaaggaaggg gcgtaagggg tgagcgtaaa aatcccatcg acggcagtcg 9180
gcgtaaaaat taatgactgg tataacgcga tacg 9214
<210> 147
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 147
Ala Ala Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Val Pro
1 5 10 15
Asn Asp Gly Gln Gln Trp Asn Arg Leu Arg Thr Asp Ala Pro Tyr Leu
20 25 30
Ser Ser Val Gly Ile Thr Ala Val Trp Thr Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Lys Ser Ala Val Asn Thr Leu His Ser Asn Gly Ile Gln
85 90 95
Val Tyr Gly Asp Val Val Met Asn His Lys Ala Gly Ala Asp Tyr Thr
100 105 110
Glu Asn Val Thr Ala Val Glu Val Asn Pro Ser Asn Arg Asn Gln Glu
115 120 125
Thr Ser Gly Glu Tyr Asn Ile Gln Ala Trp Thr Gly Phe Asn Phe Pro
130 135 140
Gly Arg Gly Thr Thr Tyr Ser Asn Phe Lys Trp Gln Trp Phe His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Gln Ser Arg Ser Leu Ser Arg Ile Phe Lys
165 170 175
Phe Thr Gly Lys Ala Trp Asp Trp Pro Val Ser Ser Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Tyr Asp Tyr Asp His Pro Asp Val
195 200 205
Val Asn Glu Met Lys Lys Trp Gly Val Trp Tyr Ala Asn Glu Val Gly
210 215 220
Leu Asp Gly Tyr Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Lys Asp Trp Val Asp Asn Ala Arg Ala Ala Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Gly Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Asn Asn
260 265 270
Tyr Leu Ala Lys Val Asn Tyr Asn Gln Ser Leu Phe Asp Ala Pro Leu
275 280 285
His Tyr Asn Phe Tyr Ala Ala Ser Thr Gly Gly Gly Tyr Tyr Asp Met
290 295 300
Arg Asn Ile Leu Asn Asn Thr Leu Val Ala Ser Asn Pro Thr Lys Ala
305 310 315 320
Val Thr Leu Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Ser Gly Gly Tyr Pro Ser Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Thr Thr Thr Arg Glu Ile Pro Ala Leu Lys Ser Lys Ile
370 375 380
Glu Pro Leu Leu Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Thr Gln Arg
385 390 395 400
Asp Tyr Ile Asp Asn Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Thr Lys Ala Lys Ser Gly Leu Ala Thr Val Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Arg Met Tyr Val Gly Thr Ser Asn Ala Gly Glu Ile
435 440 445
Trp Tyr Asp Leu Thr Gly Asn Asn Ser Thr Lys Ile Thr Ile Gly Ser
450 455 460
Asp Gly Tyr Ala Thr Phe Pro Val Asn Lys Gly Ser Val Ser Val Trp
465 470 475 480
Val Gln Gln
<210> 148
<211> 9516
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 148
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880
cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940
atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000
gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060
attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120
ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180
aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240
cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300
tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360
agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420
atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480
gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540
aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600
aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660
ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720
agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780
aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840
gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900
cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960
ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020
gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080
acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140
aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200
gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260
ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320
attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380
atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440
ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500
gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560
cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620
aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680
agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gaatgaaaca acaaaaacgg 4740
ctttacgccc gattgctgac gctgttattt gcgctcatct tcttgctgcc tcattctgca 4800
gctagcgcag cagcgacaaa cggaacaatg atgcagtatt tcgagtggta tgtacctaac 4860
gacggccagc aatggaacag actgagaaca gatgcccctt acttgtcatc tgttggtatt 4920
acagcagtat ggacaccgcc ggcttataag ggcacgtctc aagcagatgt ggggtacggc 4980
ccgtacgatc tgtatgattt aggcgagttt aatcaaaaag gtacagtcag aacgaagtat 5040
ggcacaaaag gagaacttaa atctgctgtc aacacgctgc attcaaatgg aatccaagtg 5100
tatggtgatg tcgtgatgaa tcataaagca ggtgctgatt atacagaaaa cgtaacggcg 5160
gtggaggtga atccgtctaa tagaaatcag gaaacgagcg gcgaatataa tattcaggca 5220
tggacaggct tcaactttcc gggcagagga acaacgtatt ctaacttcaa atggcagtgg 5280
ttccattttg atggaacgga ttgggaccag agcagaagcc tctctagaat cttcaaattc 5340
acgggaaagg cgtgggactg gccggtttct tcagaaaacg gaaattatga ctatctgatg 5400
tacgcggact acgattatga ccatccggat gtcgtgaatg aaatgaaaaa gtggggcgtc 5460
tggtatgcca acgaagttgg gttagatgga tacagacttg acgcggtcaa acatattaaa 5520
tttagctttc tcaaagactg ggtggataac gcaagagcag cgacgggaaa agaaatgttt 5580
acggttggcg aatattggca aaatgattta ggggccctga ataactacct ggcaaaggta 5640
aattacaacc aatctctttt tgatgcgccg ttgcattaca acttttacgc tgcctcaaca 5700
gggggtggat attacgatat gagaaatatt cttaataaca cgttagtcgc aagcaatccg 5760
acaaaggctg ttacgttagt tgagaatcat gacacacagc ctggacaatc actggaatca 5820
acagtccaac cgtggtttaa accgttagcc tacgcgttta ttctcacgag aagcggaggc 5880
tatccttctg tattttatgg agatatgtac ggtacaaaag gaacgacaac aagagagatc 5940
cctgctctta aatctaaaat cgaacctttg cttaaggcta gaaaagacta tgcttatgga 6000
acacagagag actatattga taacccggat gtcattggct ggacgagaga aggggactca 6060
acgaaagcca agagcggtct ggccacagtg attacagatg ggccgggcgg ttcaaaaaga 6120
atgtatgttg gcacgagcaa tgcgggtgaa atctggtatg atttgacagg gaataactca 6180
acaaaaatca cgattggaag cgatggctat gcaacatttc ctgtcaataa aggctcagtt 6240
tcagtatggg tgcagcaata gaagcttctc gaggttaaca gaggacggat ttcctgaagg 6300
aaatccgttt ttttatttta cagaagctgc ggaacctgaa aagaattcct ttcaggttcc 6360
gtttttttta ggaattctcc ctgatctcaa gcatctggcg gggataaatc cgctctcctt 6420
tcaaatcgtt ccattctttg aggcgctgta cagttacgcc cattttttcg gcgatatgat 6480
gaagcgtatc ccctttccgc actacatatg taccggtctt cgattcatcg tcatgaaggc 6540
ggagtgtttg gccggccttg agatttgaat gtttcaaccc gtttattctc atgatctcct 6600
cgatggatat accgctatcc ttgctgattc tccagagcgt gtcccctttt tgaacggtca 6660
ccgcaccgct cattgtcccg gcgttttgat aaacgtggat agaattttgc cggaacgcct 6720
cctcacgaag caccgtcagc ggattgattg catatctttt atcttcagtc catgaaccgt 6780
gatgcatttc aaaatgcagg tgggttccgg tcgatattcc cgtattgccg atgattccga 6840
tttgctcgcc ttttttcacc cgctcctttt cctttttcag gcgtttgctt aagtgggcat 6900
aaacggtttc atatccgttg tcatgtttaa taaatatcac ttggccgtag gagtcggatt 6960
gatacgattt gcttatcgtt ccgtctgcgg ctgccgctac tgcttcccct tcgggagcag 7020
cgatgtcaag ccccttatgc tttccgcctc tcgtaccgaa ttgatctgtg atctctcctt 7080
taatcggttc aatccactct gaggcttccg cccccggggc attgacgaaa agcgccaatc 7140
ccgaaagcca tgcgatcgcg aacaggaagt tttgatgtct gagtttcttc aaggttttcc 7200
atatcctcct attacatgca tcttcggtaa aattgccccc tattcggaga cagcttagta 7260
tacttccaaa tcaatacaat ttatacatta aaaaaagact ccgcacaggg agtcttttag 7320
ttttctatcg tcatcggatt cggtgcgtac ggaacctgta cagatttcga caggtcatag 7380
gcgccgacct tggttatgga tgcgttttta aatttcactt ttgtgaagcc gaaatctttc 7440
gcggtcaata gaaggccttc caccatcaag acatcttcgg gtttattttc aatattcgcg 7500
gaggaagaaa attgaatgat cagttctttt ccattctttt gaatatcttc aatcggcgta 7560
tcatcggata aaatgggttt taaatgagtg ccgctttctt cgtttttcat catcttaatc 7620
gcttcctgca ccgattcgta agattcgctt gaaggtgcaa ggaaccggcg cccgtctgag 7680
ctttcatata aatagtagca tttttgcgtc tggtgcataa tcgccatatc ggcgagcatt 7740
ccgaatgttt caaattcaac acccgattta tcattggaaa taaacagaac agaatcatac 7800
gatccccatt taaaggtttc gttgatcaca tttttcagcc gttcgaaatc ttcgactgat 7860
agctccggta ttttctcatc aacttgaatc ttcagttttt tattgttttt ctgctctttg 7920
aacttcacct tatcaaggta agctgtgtca aatgatgtaa actggtccac tccaagccgg 7980
ctgtaagcgt gaagcgcatc ttcaagattt gtcatgccag tgcttttctc gaggcttacc 8040
gggacaacga cagacttgga ctcgtcaagg aaagcgaagg tgatatagtc gtctttttga 8100
ttctgtgaga cgacaaacgt atttgcaggt tcagacttgg cagcatcagc ctccgtctgc 8160
accaattttc cgtcagaaga aatgttggcg tcggcgctgt tttgagatct gatctgttcg 8220
attaactggg gagtgatcag catcagaaga aagagaacca aaactgtagc agcaaatgcg 8280
ccgacccgtt ttttcggtga tttacgcttt ggtgcgagaa tcagcttttg atagatctga 8340
tttgccgaac gattatcctt aaccgttgga agttggctta gtaacgcctt cagccgttct 8400
tcgttccatt ctgacttctt cattctttgg atcctccttc aaaagctcca tctgtttacg 8460
aagcactttc agaccgcggt gctgagtggt ttttaccttg ctttcggaaa aattcaaggc 8520
ttttgctgtt tcactgatcg aatatccttg aataaaacgc aagacgataa ctgatctttg 8580
gtcaagcgta cacttgtcta gggcctcgaa aatttccttt aggttttcat tttgcatcac 8640
gatgtcctca ggcagaggct tgcggtcttt tacatcttgt ttctcccagt caaacgtccc 8700
caaaatccgc tggcggatcg tctgctgctt tctgaaccag tcgatcgcaa cgtgccgcgc 8760
aatcgaaaga agccaggttt tttcgctgct cctgccttca aatgtttcgt aagaatgcag 8820
gacgcggatg tatacttcct gaactaagtc ttccgcctga tttttgtctt ttaccatata 8880
aaataaaaac tgaaataaat cctgatgata ctgatcatat attttctgaa aggtttcttc 8940
cacctgaaac ccctccgttc aatttattgt cgtttgtcaa tcttaaaagg ttacattaca 9000
actattacaa ctatattacg aacatatgaa aatggaaagg gggttttgcg aaagttaagc 9060
ttaattttaa cttaacaagc acaaaagcac ccgttctaaa tgaacaggtg ccaaggttat 9120
aggagcccac attttcacta agctgtgccc ttacaaggct ttcgttctcc tgaccggagc 9180
gttgcggatc cgctgaaatg aactaatttc aatccgttta tgactttaag tccaattgtt 9240
ggcgaagctt tttggaaatc tccattctct tttcgtcagt cactaggtga taccataagc 9300
cgtcaacttt tttgtcttca ccttcaattt ctacctgctt aatatcttta gcagcttctt 9360
tataagaact ttgaatatcg atcatcttgt ccagtgttaa gtttgttttg atgttttttt 9420
ctaatgctgc caaaatctct tgatagtttg ttaatgattt taattgtgca ccttcatgaa 9480
taatttcgtt gataatctca cgctgacgct cttgac 9516
<210> 149
<211> 1452
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 149
gcagcgacaa acggaacaat gatgcagtat ttcgagtggt atgtacctaa cgacggccag 60
caatggaaca gactgagaac agatgcccct tacttgtcat ctgttggtat tacagcagta 120
tggacaccgc cggcttataa gggcacgtct caagcagatg tggggtacgg cccgtacgat 180
ctgtatgatt taggcgagtt taatcaaaaa ggtacagtca gaacgaagta tggcacaaaa 240
ggagaactta aatctgctgt caacacgctg cattcaaatg gaatccaagt gtatggtgat 300
gtcgtgatga atcataaagc aggtgctgat tatacagaaa acgtaacggc ggtggaggtg 360
aatccgtcta atagaaatca ggaaacgagc ggcgaatata atattcaggc atggacaggc 420
ttcaactttc cgggcagagg aacaacgtat tctaacttca aatggcagtg gttccatttt 480
gatggaacgg attgggacca gagcagaagc ctctctagaa tcttcaaatt cacgggaaag 540
gcgtgggact ggccggtttc ttcagaaaac ggaaattatg actatctgat gtacgcggac 600
tacgattatg accatccgga tgtcgtgaat gaaatgaaaa agtggggcgt ctggtatgcc 660
aacgaagttg ggttagatgg atacagactt gacgcggtca aacatattaa atttagcttt 720
ctcaaagact gggtggataa cgcaagagca gcgacgggaa aagaaatgtt tacggttggc 780
gaatattggc aaaatgattt aggggccctg aataactacc tggcaaaggt aaattacaac 840
caatctcttt ttgatgcgcc gttgcattac aacttttacg ctgcctcaac agggggtgga 900
tattacgata tgagaaatat tcttaataac acgttagtcg caagcaatcc gacaaaggct 960
gttacgttag ttgagaatca tgacacacag cctggacaat cactggaatc aacagtccaa 1020
ccgtggttta aaccgttagc ctacgcgttt attctcacga gaagcggagg ctatccttct 1080
gtattttatg gagatatgta cggtacaaaa ggaacgacaa caagagagat ccctgctctt 1140
aaatctaaaa tcgaaccttt gcttaaggct agaaaagact atgcttatgg aacacagaga 1200
gactatattg ataacccgga tgtcattggc tggacgagag aaggggactc aacgaaagcc 1260
aagagcggtc tggccacagt gattacagat gggccgggcg gttcaaaaag aatgtatgtt 1320
ggcacgagca atgcgggtga aatctggtat gatttgacag ggaataactc aacaaaaatc 1380
acgattggaa gcgatggcta tgcaacattt cctgtcaata aaggctcagt ttcagtatgg 1440
gtgcagcaat ag 1452
<210> 150
<211> 9215
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 150
catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60
tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120
cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180
gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240
tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300
aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360
cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420
ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480
tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540
gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600
cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660
cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720
gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780
tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840
agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900
cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960
gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020
attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080
atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140
tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200
gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260
acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320
gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380
gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440
atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500
tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560
gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620
ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680
ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740
cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800
ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860
ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920
ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980
ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040
tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100
cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160
ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220
cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280
cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340
agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400
cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460
ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520
cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580
tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640
gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700
agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760
ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820
tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880
ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940
aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000
gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060
tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120
agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180
tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240
caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300
catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360
tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420
gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480
ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540
tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600
ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660
agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720
ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780
gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840
ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900
ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960
ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020
gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080
gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140
taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200
aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260
cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320
ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380
gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440
tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500
aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560
aagtctactc tgaatttttt taaaaggaga gggtaaagaa tgaaacaaca aaaacggctt 4620
tacgcccgat tgctgacgct gttatttgcg ctcatcttct tgctgcctca ttctgcagct 4680
agcgcagcag cgacaaacgg aacaatgatg cagtatttcg agtggtatgt acctaacgac 4740
ggccagcaat ggaacagact gagaacagat gccccttact tgtcatctgt tggtattaca 4800
gcagtatgga caccgccggc ttataagggc acgtctcaag cagatgtggg gtacggcccg 4860
tacgatctgt atgatttagg cgagtttaat caaaaaggta cagtcagaac gaagtatggc 4920
acaaaaggag aacttaaatc tgctgtcaac acgctgcatt caaatggaat ccaagtgtat 4980
ggtgatgtcg tgatgaatca taaagcaggt gctgattata cagaaaacgt aacggcggtg 5040
gaggtgaatc cgtctaatag aaatcaggaa acgagcggcg aatataatat tcaggcatgg 5100
acaggcttca actttccggg cagaggaaca acgtattcta acttcaaatg gcagtggttc 5160
cattttgatg gaacggattg ggaccagagc agaagcctct ctagaatctt caaattcacg 5220
ggaaaggcgt gggactggcc ggtttcttca gaaaacggaa attatgacta tctgatgtac 5280
gcggactacg attatgacca tccggatgtc gtgaatgaaa tgaaaaagtg gggcgtctgg 5340
tatgccaacg aagttgggtt agatggatac agacttgacg cggtcaaaca tattaaattt 5400
agctttctca aagactgggt ggataacgca agagcagcga cgggaaaaga aatgtttacg 5460
gttggcgaat attggcaaaa tgatttaggg gccctgaata actacctggc aaaggtaaat 5520
tacaaccaat ctctttttga tgcgccgttg cattacaact tttacgctgc ctcaacaggg 5580
ggtggatatt acgatatgag aaatattctt aataacacgt tagtcgcaag caatccgaca 5640
aaggctgtta cgttagttga gaatcatgac acacagcctg gacaatcact ggaatcaaca 5700
gtccaaccgt ggtttaaacc gttagcctac gcgtttattc tcacgagaag cggaggctat 5760
ccttctgtat tttatggaga tatgtacggt acaaaaggaa cgacaacaag agagatccct 5820
gctcttaaat ctaaaatcga acctttgctt aaggctagaa aagactatgc ttatggaaca 5880
cagagagact atattgataa cccggatgtc attggctgga cgagagaagg ggactcaacg 5940
aaagccaaga gcggtctggc cacagtgatt acagatgggc cgggcggttc aaaaagaatg 6000
tatgttggca cgagcaatgc gggtgaaatc tggtatgatt tgacagggaa taactcaaca 6060
aaaatcacga ttggaagcga tggctatgca acatttcctg tcaataaagg ctcagtttca 6120
gtatgggtgc agcaatagaa gcttctcgag gttaacagag gacggatttc ctgaaggaaa 6180
tccgtttttt tattttcaag cacgaaaaac acttcccggt gatcgggagg tgttttttgt 6240
taaaaagatc atgacatgca tagaacagcg accgggctaa ttgtatataa tattgtgaat 6300
ttaacaaaaa atttacaaag gagatgataa aggcaatgac cagggtgaaa aggatgagat 6360
ttgctgattt gttggattta gaggcggagt agatgaaacc ggccaaagta tccctactcc 6420
accgattgct ccagtgcctg aagcaatgtg ttgattgtaa cacagtaaat cgttttacag 6480
caataaacat ttttgtgaat attttattga tttcggctgt gatctcattc ccatattctg 6540
ctgcggccca tggcgcaaca cagtccggcg atcaatattc aagctttgaa gaattggagc 6600
ggaatgaaga tccagcttct taccgaatta cggagaagaa cgcaagagtg ccgatgctca 6660
tcatggccat ccatggaggc ggcatcgaac ccggaacgag cgaaatcgcc aatgaagtgt 6720
ccaaaaacta ttccctgtac ttgtttgaag ggctgaaatc atcaggcaat acggaccttc 6780
acattacaag cacgcgtttt gacgagccag cggcgctcgc aattactgca agccaccagt 6840
atgtcatgtc gctccacggc tattacagtg aagaccgcga tattaaagta ggcggcacag 6900
accgcgctaa aatcagaata ttggttgatg agctgaaccg ctcggggttt gccgctgaaa 6960
tgctggggac agatgacaag tatgccggaa cccatccgaa taacatcgcc aacaagtcgc 7020
tttccgggct gagcattcag cttgaaatga gcacgggttt ccgcaaatct ttattcgacc 7080
ggtttacact aaaagacagg gcggcgacgc aaaacgaaac gttttaccga tttacaaagc 7140
tgctgacaga ttttattcat gaaaactatg aagaagacgg aggggatttc ccctctgcaa 7200
aaataaaaca cccccttcaa gtgaaaaagg aggtgtttcg gcggttgtgt taaccgttgg 7260
actctgaggt gccgccgccg gtgaatacgg aaacgatggc gttccacaga gacacaaaga 7320
agtcgatcag tttttgaaga aagttttgtc cttcttcaga atccaagaat ttcgtgattt 7380
tatcctttgc tttgtcaagc tggtctccaa cctggttcca gtcgatatta atatttttca 7440
tgttattaaa taaagatata agagagtttt tctgatcttc tgtgagtgtc acgccaagtt 7500
cggaagcagc cgaatcaatc gttttctcca attcctcttt tgactcggga actccgtttt 7560
tcgagatttc ttccttgact ttggccatca gcgctgacgc gttttcactg ccgattttct 7620
cgccaagctc tgaagtggtg acaagctctt cattcgcgac ctttttcaca tcttcggaaa 7680
ttttttcgcc cgaagtcgtt tcatacgctt tcatcaatcc ggttaaagcg gctgtgcctg 7740
acacttcaaa cggagcggtg acatagactt tggcgtcttt tacaccggcc gtcatcagcg 7800
cgttcaaata catctcatct gtaattctgc tgatattgtg tgtctgaact tccaaaccgg 7860
tgcctttttt cgctacggta attgaagaag aagaaatcgc tcttgttccg atttgtgctt 7920
tcggtatata atcccctaaa tatttatgct cctcatcatt tgtcacctcg atgatggtcg 7980
cattttcagg cgcattcatt tcttttaata ctttttgtct gtcctggctt gacaagtctt 8040
tccccagcgt gacgatgaca tcacccactg cggcgtcagc gaagctgacc tgcgggaaaa 8100
tgagcagaca caatgctgta aagattccta gtatcgattt tttcaagctc aatgccctcc 8160
ttaaaaatgc aggcttcagg cagaattgct gtacttttaa agaagcctgc cggaacggaa 8220
ataatgcgtt ccgaaatata gacggatgaa agatgagtga ggtttcaaag aaaaaaagag 8280
agaattttct cttcaagtca aatgccctcc cggcatcgta tctcgccgct cttttatcat 8340
tcatgatttt cacaggcgat tcaacctttt tttaaaattt tttacaaaaa cgatacaaga 8400
gcggcgttta tttcggtcga ttggctctct gcttcttcaa tatgatataa tgacccttgt 8460
gaaatgaaag gagagaatca agatggctaa aaaaggatac atacaactga caaacggcaa 8520
aaaaatcgag tttgaactat atccggatgc ggcgccggga actgtcgcca actttgaaaa 8580
acttgcaaac gaagggttct atgacgggct gaagttccac cgcgtcatcc cgggcttcgt 8640
cagccaggga ggctgcccgc acggcaccgg aacaggcgga cctggatata cgattaaatg 8700
cgagacagaa gggaatccgc acaaacacga agccggttct ctctcaatgg ctcacgcagg 8760
aaaagatacc ggaggcagcc aattttttat cgtccatgag cctcagccgc acttgaacgg 8820
cgttcacacc gttttcggaa aggtcacatc aggccttgat gccgtcactt caatggagca 8880
gggacaaggc atggaaaaag tcgaagtatt tgatgcataa tcagagagcg caaaaaacag 8940
cccgcttagc cgggctgttt ttttgtctgt aacggtgttt attttccagg tgcaacagga 9000
cttgaggccg attcttcgtc cacatcctga taggaaataa cgatgctaat aaataaaata 9060
attgtgaaaa aatgaccctt tatgtaaaat atattcaagt gaagagctag atagagaacg 9120
caatctgtaa aaaaggaagg ggcgtaaggg gtgagcgtaa aaatcccatc gacggcagtc 9180
ggcgtaaaaa ttaatgactg gtataacgcg atacg 9215
<210> 151
<211> 485
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 151
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser
20 25 30
Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Ala Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Ser Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly
85 90 95
Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Ala Thr Glu Met Val Arg Ala Val Glu Val Asn Pro Asn Asn Arg Asn
115 120 125
Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Arg Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg
165 170 175
Ile Tyr Lys Phe Arg Gly His Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Leu Tyr Ala Asp Ile Asp Met
195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Asn Trp Gly Val Trp Tyr
210 215 220
Thr Asn Thr Leu Gly Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Ile Asn His Val Arg Ser Ala
245 250 255
Thr Gly Lys Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Ile Glu Asn Tyr Leu Gln Lys Thr Asn Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly
290 295 300
Gly Asn Tyr Asp Met Arg Asn Ile Phe Asn Gly Thr Val Val Gln Arg
305 310 315 320
His Pro Ser His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Glu Glu Ala Leu Glu Ser Phe Val Glu Glu Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Thr Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Arg Ser
370 375 380
Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Lys
385 390 395 400
Gln Asn Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Thr Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Ala Gly Gly Ser Lys Trp Met Phe Val Gly Arg Asn Lys Ala Gly
435 440 445
Gln Val Trp Ser Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Ile Trp Val Asn Lys
485
<210> 152
<211> 9522
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 152
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880
cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940
atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000
gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060
attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120
ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180
aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240
cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300
tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360
agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420
atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480
gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540
aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600
aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660
ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720
agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780
aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840
gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900
cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960
ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020
gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080
acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140
aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200
gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260
ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320
attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380
atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440
ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500
gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560
cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620
aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680
agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gaatgaaaca acaaaaacgg 4740
ctttacgccc gattgctgac gctgttattt gcgctcatct tcttgctgcc tcattctgca 4800
gctagcgcac atcataacgg tacgaacggg acaatgatgc aatactttga atggtatcta 4860
cctaatgacg gaaatcattg gaatcgatta aactctgatg cgagtaacct taaaagcaaa 4920
gggattacag cggtgtggat tcctccagca tggaagggcg cttctcaaaa tgacgtagga 4980
tacggagcct atgacctgta tgatctggga gaatttaatc aaaaaggtac cgtccgtaca 5040
aaatatggaa cacgtagtca gttacaagct gcggtaacct ccttaaaaaa taatggaatt 5100
caagtatatg gtgacgttgt tatgaatcac aaaggtggcg cagacgctac tgaaatggta 5160
agggccgttg aagtgaatcc caataaccgt aaccaagaag tgactggtga atataccatt 5220
gaagcttgga ctagatttga ttttccaggg cgaggaaata ctcattctag ctttaaatgg 5280
agatggtatc attttgatgg tgtggattgg gatcagtcac gtagactgaa caatcgcatc 5340
tataaattta gaggtcatgg caaagcttgg gattgggaag ttgatacgga aaatggtaat 5400
tatgattatt tactatacgc tgatattgat atggatcacc cagaagtagt aaatgaatta 5460
agaaattggg gtgtttggta cacaaacaca ttaggactcg atggatttag aatagatgcg 5520
gttaaacata taaagtatag ctttacgcgc gattggatta atcacgttag aagtgcaaca 5580
ggtaaaaata tgtttgcggt tgctgagttt tggaagaatg atttaggtgc aattgaaaac 5640
tatctgcaga aaacaaactg gaaccattca gtctttgatg tgccgttaca ttataatctt 5700
tataatgcat caaaaagcgg agggaactat gatatgcgaa acatatttaa tggaacggtt 5760
gttcaacgac atccaagtca tgctgtaaca tttgttgata atcatgattc gcagcctgaa 5820
gaagcattag aatcttttgt tgaagaatgg tttaaaccat tagcgtatgc gcttacatta 5880
acgcgtgaac aaggataccc ttctgtattt tacggagatt attatgggat tccaacacat 5940
ggagtgccag caatgagatc aaaaatcgat ccgattttag aagcacgtca aaagtatgca 6000
tacggaaaac aaaatgatta cttagaccat cataatatca ttggttggac gcgtgaaggg 6060
aatacagcac accccaattc aggtctagct accatcatgt ctgatggagc gggtggaagt 6120
aagtggatgt ttgttgggcg taataaggct ggtcaagtat ggagtgatat tacaggaaac 6180
cgtacaggta cggttacaat caatgcagac ggttggggca atttctctgt gaatggaggg 6240
tcagtttcta tttgggtcaa caaataaaag cttctcgagg ttaacagagg acggatttcc 6300
tgaaggaaat ccgttttttt attttacaga agctgcggaa cctgaaaaga attcctttca 6360
ggttccgttt tttttaggaa ttctccctga tctcaagcat ctggcgggga taaatccgct 6420
ctcctttcaa atcgttccat tctttgaggc gctgtacagt tacgcccatt ttttcggcga 6480
tatgatgaag cgtatcccct ttccgcacta catatgtacc ggtcttcgat tcatcgtcat 6540
gaaggcggag tgtttggccg gccttgagat ttgaatgttt caacccgttt attctcatga 6600
tctcctcgat ggatataccg ctatccttgc tgattctcca gagcgtgtcc cctttttgaa 6660
cggtcaccgc accgctcatt gtcccggcgt tttgataaac gtggatagaa ttttgccgga 6720
acgcctcctc acgaagcacc gtcagcggat tgattgcata tcttttatct tcagtccatg 6780
aaccgtgatg catttcaaaa tgcaggtggg ttccggtcga tattcccgta ttgccgatga 6840
ttccgatttg ctcgcctttt ttcacccgct ccttttcctt tttcaggcgt ttgcttaagt 6900
gggcataaac ggtttcatat ccgttgtcat gtttaataaa tatcacttgg ccgtaggagt 6960
cggattgata cgatttgctt atcgttccgt ctgcggctgc cgctactgct tccccttcgg 7020
gagcagcgat gtcaagcccc ttatgctttc cgcctctcgt accgaattga tctgtgatct 7080
ctcctttaat cggttcaatc cactctgagg cttccgcccc cggggcattg acgaaaagcg 7140
ccaatcccga aagccatgcg atcgcgaaca ggaagttttg atgtctgagt ttcttcaagg 7200
ttttccatat cctcctatta catgcatctt cggtaaaatt gccccctatt cggagacagc 7260
ttagtatact tccaaatcaa tacaatttat acattaaaaa aagactccgc acagggagtc 7320
ttttagtttt ctatcgtcat cggattcggt gcgtacggaa cctgtacaga tttcgacagg 7380
tcataggcgc cgaccttggt tatggatgcg tttttaaatt tcacttttgt gaagccgaaa 7440
tctttcgcgg tcaatagaag gccttccacc atcaagacat cttcgggttt attttcaata 7500
ttcgcggagg aagaaaattg aatgatcagt tcttttccat tcttttgaat atcttcaatc 7560
ggcgtatcat cggataaaat gggttttaaa tgagtgccgc tttcttcgtt tttcatcatc 7620
ttaatcgctt cctgcaccga ttcgtaagat tcgcttgaag gtgcaaggaa ccggcgcccg 7680
tctgagcttt catataaata gtagcatttt tgcgtctggt gcataatcgc catatcggcg 7740
agcattccga atgtttcaaa ttcaacaccc gatttatcat tggaaataaa cagaacagaa 7800
tcatacgatc cccatttaaa ggtttcgttg atcacatttt tcagccgttc gaaatcttcg 7860
actgatagct ccggtatttt ctcatcaact tgaatcttca gttttttatt gtttttctgc 7920
tctttgaact tcaccttatc aaggtaagct gtgtcaaatg atgtaaactg gtccactcca 7980
agccggctgt aagcgtgaag cgcatcttca agatttgtca tgccagtgct tttctcgagg 8040
cttaccggga caacgacaga cttggactcg tcaaggaaag cgaaggtgat atagtcgtct 8100
ttttgattct gtgagacgac aaacgtattt gcaggttcag acttggcagc atcagcctcc 8160
gtctgcacca attttccgtc agaagaaatg ttggcgtcgg cgctgttttg agatctgatc 8220
tgttcgatta actggggagt gatcagcatc agaagaaaga gaaccaaaac tgtagcagca 8280
aatgcgccga cccgtttttt cggtgattta cgctttggtg cgagaatcag cttttgatag 8340
atctgatttg ccgaacgatt atccttaacc gttggaagtt ggcttagtaa cgccttcagc 8400
cgttcttcgt tccattctga cttcttcatt ctttggatcc tccttcaaaa gctccatctg 8460
tttacgaagc actttcagac cgcggtgctg agtggttttt accttgcttt cggaaaaatt 8520
caaggctttt gctgtttcac tgatcgaata tccttgaata aaacgcaaga cgataactga 8580
tctttggtca agcgtacact tgtctagggc ctcgaaaatt tcctttaggt tttcattttg 8640
catcacgatg tcctcaggca gaggcttgcg gtcttttaca tcttgtttct cccagtcaaa 8700
cgtccccaaa atccgctggc ggatcgtctg ctgctttctg aaccagtcga tcgcaacgtg 8760
ccgcgcaatc gaaagaagcc aggttttttc gctgctcctg ccttcaaatg tttcgtaaga 8820
atgcaggacg cggatgtata cttcctgaac taagtcttcc gcctgatttt tgtcttttac 8880
catataaaat aaaaactgaa ataaatcctg atgatactga tcatatattt tctgaaaggt 8940
ttcttccacc tgaaacccct ccgttcaatt tattgtcgtt tgtcaatctt aaaaggttac 9000
attacaacta ttacaactat attacgaaca tatgaaaatg gaaagggggt tttgcgaaag 9060
ttaagcttaa ttttaactta acaagcacaa aagcacccgt tctaaatgaa caggtgccaa 9120
ggttatagga gcccacattt tcactaagct gtgcccttac aaggctttcg ttctcctgac 9180
cggagcgttg cggatccgct gaaatgaact aatttcaatc cgtttatgac tttaagtcca 9240
attgttggcg aagctttttg gaaatctcca ttctcttttc gtcagtcact aggtgatacc 9300
ataagccgtc aacttttttg tcttcacctt caatttctac ctgcttaata tctttagcag 9360
cttctttata agaactttga atatcgatca tcttgtccag tgttaagttt gttttgatgt 9420
ttttttctaa tgctgccaaa atctcttgat agtttgttaa tgattttaat tgtgcacctt 9480
catgaataat ttcgttgata atctcacgct gacgctcttg ac 9522
<210> 153
<211> 1458
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 153
catcataacg gtacgaacgg gacaatgatg caatactttg aatggtatct acctaatgac 60
ggaaatcatt ggaatcgatt aaactctgat gcgagtaacc ttaaaagcaa agggattaca 120
gcggtgtgga ttcctccagc atggaagggc gcttctcaaa atgacgtagg atacggagcc 180
tatgacctgt atgatctggg agaatttaat caaaaaggta ccgtccgtac aaaatatgga 240
acacgtagtc agttacaagc tgcggtaacc tccttaaaaa ataatggaat tcaagtatat 300
ggtgacgttg ttatgaatca caaaggtggc gcagacgcta ctgaaatggt aagggccgtt 360
gaagtgaatc ccaataaccg taaccaagaa gtgactggtg aatataccat tgaagcttgg 420
actagatttg attttccagg gcgaggaaat actcattcta gctttaaatg gagatggtat 480
cattttgatg gtgtggattg ggatcagtca cgtagactga acaatcgcat ctataaattt 540
agaggtcatg gcaaagcttg ggattgggaa gttgatacgg aaaatggtaa ttatgattat 600
ttactatacg ctgatattga tatggatcac ccagaagtag taaatgaatt aagaaattgg 660
ggtgtttggt acacaaacac attaggactc gatggattta gaatagatgc ggttaaacat 720
ataaagtata gctttacgcg cgattggatt aatcacgtta gaagtgcaac aggtaaaaat 780
atgtttgcgg ttgctgagtt ttggaagaat gatttaggtg caattgaaaa ctatctgcag 840
aaaacaaact ggaaccattc agtctttgat gtgccgttac attataatct ttataatgca 900
tcaaaaagcg gagggaacta tgatatgcga aacatattta atggaacggt tgttcaacga 960
catccaagtc atgctgtaac atttgttgat aatcatgatt cgcagcctga agaagcatta 1020
gaatcttttg ttgaagaatg gtttaaacca ttagcgtatg cgcttacatt aacgcgtgaa 1080
caaggatacc cttctgtatt ttacggagat tattatggga ttccaacaca tggagtgcca 1140
gcaatgagat caaaaatcga tccgatttta gaagcacgtc aaaagtatgc atacggaaaa 1200
caaaatgatt acttagacca tcataatatc attggttgga cgcgtgaagg gaatacagca 1260
caccccaatt caggtctagc taccatcatg tctgatggag cgggtggaag taagtggatg 1320
tttgttgggc gtaataaggc tggtcaagta tggagtgata ttacaggaaa ccgtacaggt 1380
acggttacaa tcaatgcaga cggttggggc aatttctctg tgaatggagg gtcagtttct 1440
atttgggtca acaaataa 1458
<210> 154
<211> 9219
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 154
catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 60
tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 120
cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 180
gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 240
tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 300
aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 360
cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 420
ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 480
tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 540
gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 600
cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 660
cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 720
gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 780
tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 840
agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 900
cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 960
gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1020
attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1080
atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1140
tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1200
gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1260
acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1320
gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1380
gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1440
atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1500
tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1560
gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1620
ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1680
ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1740
cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1800
ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1860
ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1920
ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 1980
ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2040
tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2100
cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2160
ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2220
cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2280
cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2340
agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2400
cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2460
ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2520
cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2580
tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2640
gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2700
agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2760
ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2820
tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2880
ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 2940
aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3000
gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3060
tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3120
agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3180
tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3240
caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3300
catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3360
tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3420
gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3480
ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3540
tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3600
ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3660
agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3720
ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3780
gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3840
ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3900
ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 3960
ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4020
gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4080
gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4140
taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4200
aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4260
cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4320
ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4380
gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4440
tttaattcaa gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa 4500
aagttgttga cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt 4560
aagtctactc tgaatttttt taaaaggaga gggtaaagaa tgaaacaaca aaaacggctt 4620
tacgcccgat tgctgacgct gttatttgcg ctcatcttct tgctgcctca ttctgcagct 4680
agcgcacatc ataacggtac gaacgggaca atgatgcaat actttgaatg gtatctacct 4740
aatgacggaa atcattggaa tcgattaaac tctgatgcga gtaaccttaa aagcaaaggg 4800
attacagcgg tgtggattcc tccagcatgg aagggcgctt ctcaaaatga cgtaggatac 4860
ggagcctatg acctgtatga tctgggagaa tttaatcaaa aaggtaccgt ccgtacaaaa 4920
tatggaacac gtagtcagtt acaagctgcg gtaacctcct taaaaaataa tggaattcaa 4980
gtatatggtg acgttgttat gaatcacaaa ggtggcgcag acgctactga aatggtaagg 5040
gccgttgaag tgaatcccaa taaccgtaac caagaagtga ctggtgaata taccattgaa 5100
gcttggacta gatttgattt tccagggcga ggaaatactc attctagctt taaatggaga 5160
tggtatcatt ttgatggtgt ggattgggat cagtcacgta gactgaacaa tcgcatctat 5220
aaatttagag gtcatggcaa agcttgggat tgggaagttg atacggaaaa tggtaattat 5280
gattatttac tatacgctga tattgatatg gatcacccag aagtagtaaa tgaattaaga 5340
aattggggtg tttggtacac aaacacatta ggactcgatg gatttagaat agatgcggtt 5400
aaacatataa agtatagctt tacgcgcgat tggattaatc acgttagaag tgcaacaggt 5460
aaaaatatgt ttgcggttgc tgagttttgg aagaatgatt taggtgcaat tgaaaactat 5520
ctgcagaaaa caaactggaa ccattcagtc tttgatgtgc cgttacatta taatctttat 5580
aatgcatcaa aaagcggagg gaactatgat atgcgaaaca tatttaatgg aacggttgtt 5640
caacgacatc caagtcatgc tgtaacattt gttgataatc atgattcgca gcctgaagaa 5700
gcattagaat cttttgttga agaatggttt aaaccattag cgtatgcgct tacattaacg 5760
cgtgaacaag gatacccttc tgtattttac ggagattatt atgggattcc aacacatgga 5820
gtgccagcaa tgagatcaaa aatcgatccg attttagaag cacgtcaaaa gtatgcatac 5880
ggaaaacaaa atgattactt agaccatcat aatatcattg gttggacgcg tgaagggaat 5940
acagcacacc ccaattcagg tctagctacc atcatgtctg atggagcggg tggaagtaag 6000
tggatgtttg ttgggcgtaa taaggctggt caagtatgga gtgatattac aggaaaccgt 6060
acaggtacgg ttacaatcaa tgcagacggt tggggcaatt tctctgtgaa tggagggtca 6120
gtttctattt gggtcaacaa ataaaagctt ctcgaggtta acagaggacg gatttcctga 6180
aggaaatccg tttttttatt ttagcacgaa aaacacttcc cggtgatcgg gaggtgtttt 6240
ttgttaaaaa gatcatgaca tgcatagaac agcgaccggg ctaattgtat ataatattgt 6300
gaatttaaca aaaaatttac aaaggagatg ataaaggcaa tgaccagggt gaaaaggatg 6360
agatttgctg atttgttgga tttagaggcg gagtagatga aaccggccaa agtatcccta 6420
ctccaccgat tgctccagtg cctgaagcaa tgtgttgatt gtaacacagt aaatcgtttt 6480
acagcaataa acatttttgt gaatatttta ttgatttcgg ctgtgatctc attcccatat 6540
tctgctgcgg cccatggcgc aacacagtcc ggcgatcaat attcaagctt tgaagaattg 6600
gagcggaatg aagatccagc ttcttaccga attacggaga agaacgcaag agtgccgatg 6660
ctcatcatgg ccatccatgg aggcggcatc gaacccggaa cgagcgaaat cgccaatgaa 6720
gtgtccaaaa actattccct gtacttgttt gaagggctga aatcatcagg caatacggac 6780
cttcacatta caagcacgcg ttttgacgag ccagcggcgc tcgcaattac tgcaagccac 6840
cagtatgtca tgtcgctcca cggctattac agtgaagacc gcgatattaa agtaggcggc 6900
acagaccgcg ctaaaatcag aatattggtt gatgagctga accgctcggg gtttgccgct 6960
gaaatgctgg ggacagatga caagtatgcc ggaacccatc cgaataacat cgccaacaag 7020
tcgctttccg ggctgagcat tcagcttgaa atgagcacgg gtttccgcaa atctttattc 7080
gaccggttta cactaaaaga cagggcggcg acgcaaaacg aaacgtttta ccgatttaca 7140
aagctgctga cagattttat tcatgaaaac tatgaagaag acggagggga tttcccctct 7200
gcaaaaataa aacaccccct tcaagtgaaa aaggaggtgt ttcggcggtt gtgttaaccg 7260
ttggactctg aggtgccgcc gccggtgaat acggaaacga tggcgttcca cagagacaca 7320
aagaagtcga tcagtttttg aagaaagttt tgtccttctt cagaatccaa gaatttcgtg 7380
attttatcct ttgctttgtc aagctggtct ccaacctggt tccagtcgat attaatattt 7440
ttcatgttat taaataaaga tataagagag tttttctgat cttctgtgag tgtcacgcca 7500
agttcggaag cagccgaatc aatcgttttc tccaattcct cttttgactc gggaactccg 7560
tttttcgaga tttcttcctt gactttggcc atcagcgctg acgcgttttc actgccgatt 7620
ttctcgccaa gctctgaagt ggtgacaagc tcttcattcg cgaccttttt cacatcttcg 7680
gaaatttttt cgcccgaagt cgtttcatac gctttcatca atccggttaa agcggctgtg 7740
cctgacactt caaacggagc ggtgacatag actttggcgt cttttacacc ggccgtcatc 7800
agcgcgttca aatacatctc atctgtaatt ctgctgatat tgtgtgtctg aacttccaaa 7860
ccggtgcctt ttttcgctac ggtaattgaa gaagaagaaa tcgctcttgt tccgatttgt 7920
gctttcggta tataatcccc taaatattta tgctcctcat catttgtcac ctcgatgatg 7980
gtcgcatttt caggcgcatt catttctttt aatacttttt gtctgtcctg gcttgacaag 8040
tctttcccca gcgtgacgat gacatcaccc actgcggcgt cagcgaagct gacctgcggg 8100
aaaatgagca gacacaatgc tgtaaagatt cctagtatcg attttttcaa gctcaatgcc 8160
ctccttaaaa atgcaggctt caggcagaat tgctgtactt ttaaagaagc ctgccggaac 8220
ggaaataatg cgttccgaaa tatagacgga tgaaagatga gtgaggtttc aaagaaaaaa 8280
agagagaatt ttctcttcaa gtcaaatgcc ctcccggcat cgtatctcgc cgctctttta 8340
tcattcatga ttttcacagg cgattcaacc tttttttaaa attttttaca aaaacgatac 8400
aagagcggcg tttatttcgg tcgattggct ctctgcttct tcaatatgat ataatgaccc 8460
ttgtgaaatg aaaggagaga atcaagatgg ctaaaaaagg atacatacaa ctgacaaacg 8520
gcaaaaaaat cgagtttgaa ctatatccgg atgcggcgcc gggaactgtc gccaactttg 8580
aaaaacttgc aaacgaaggg ttctatgacg ggctgaagtt ccaccgcgtc atcccgggct 8640
tcgtcagcca gggaggctgc ccgcacggca ccggaacagg cggacctgga tatacgatta 8700
aatgcgagac agaagggaat ccgcacaaac acgaagccgg ttctctctca atggctcacg 8760
caggaaaaga taccggaggc agccaatttt ttatcgtcca tgagcctcag ccgcacttga 8820
acggcgttca caccgttttc ggaaaggtca catcaggcct tgatgccgtc acttcaatgg 8880
agcagggaca aggcatggaa aaagtcgaag tatttgatgc ataatcagag agcgcaaaaa 8940
acagcccgct tagccgggct gtttttttgt ctgtaacggt gtttattttc caggtgcaac 9000
aggacttgag gccgattctt cgtccacatc ctgataggaa ataacgatgc taataaataa 9060
aataattgtg aaaaaatgac cctttatgta aaatatattc aagtgaagag ctagatagag 9120
aacgcaatct gtaaaaaagg aaggggcgta aggggtgagc gtaaaaatcc catcgacggc 9180
agtcggcgta aaaattaatg actggtataa cgcgatacg 9219
<210> 155
<211> 286
<212> PRT
<213> Bacillus licheniformis
<400> 155
Met Lys Lys Ile Ala Ile Ala Ala Ile Thr Ala Thr Ser Val Leu Ala
1 5 10 15
Leu Ser Ala Cys Ser Gly Gly Asp Ser Glu Val Val Ala Glu Thr Lys
20 25 30
Ala Gly Asn Ile Thr Lys Glu Asp Leu Tyr Gln Thr Leu Lys Asp Asn
35 40 45
Ala Gly Ala Asp Ala Leu Asn Met Leu Val Gln Gln Lys Val Leu Asp
50 55 60
Asp Lys Tyr Asp Val Ser Asp Lys Glu Ile Asp Lys Lys Leu Asn Glu
65 70 75 80
Tyr Lys Lys Ser Met Gly Asp Gln Leu Asn Gln Leu Ile Asp Gln Lys
85 90 95
Gly Glu Asp Phe Val Lys Glu Gln Ile Lys Tyr Glu Leu Leu Met Gln
100 105 110
Lys Ala Ala Lys Asp Asn Ile Lys Val Thr Asp Asp Asp Val Lys Glu
115 120 125
Tyr Tyr Asp Gly Leu Lys Gly Lys Ile His Leu Ser His Ile Leu Val
130 135 140
Lys Glu Lys Lys Thr Ala Glu Glu Val Glu Lys Lys Leu Lys Lys Gly
145 150 155 160
Glu Lys Phe Glu Asp Leu Ala Lys Glu Tyr Ser Thr Asp Gly Thr Ala
165 170 175
Glu Lys Gly Gly Asp Leu Gly Trp Val Gly Lys Asp Asp Asn Met Asp
180 185 190
Lys Asp Phe Val Lys Ala Ala Phe Ala Leu Lys Thr Gly Glu Ile Ser
195 200 205
Gly Pro Val Lys Ser Gln Phe Gly Tyr His Ile Ile Lys Lys Asp Glu
210 215 220
Glu Arg Gly Lys Tyr Glu Asp Met Lys Lys Glu Leu Lys Lys Glu Val
225 230 235 240
Gln Glu Gln Lys Gln Asn Asp Gln Thr Glu Leu Gln Ser Val Ile Asp
245 250 255
Lys Leu Val Lys Asp Ala Asp Leu Lys Val Lys Asp Lys Glu Leu Lys
260 265 270
Lys Gln Val Asp Gln Arg Gln Ala Gln Thr Ser Ser Ser Ser
275 280 285
<210> 156
<211> 134
<212> PRT
<213> Bacillus licheniformis
<400> 156
Met Ala Met Thr Arg Phe Gly Glu Arg Leu Lys Glu Leu Arg Glu Gln
1 5 10 15
Arg Ser Leu Ser Val Asn Gln Leu Ala Met Tyr Ala Gly Val Ser Ala
20 25 30
Ala Ala Ile Ser Arg Ile Glu Asn Gly His Arg Gly Val Pro Lys Pro
35 40 45
Ala Thr Ile Arg Lys Leu Ala Glu Ala Leu Lys Met Pro Tyr Glu Gln
50 55 60
Leu Met Asp Ile Ala Gly Tyr Met Arg Ala Asp Glu Ile Arg Glu Gln
65 70 75 80
Pro Arg Gly Tyr Val Thr Met Gln Glu Ile Ala Ala Lys His Gly Val
85 90 95
Glu Asp Leu Trp Leu Phe Lys Pro Glu Lys Trp Asp Cys Leu Ser Arg
100 105 110
Glu Asp Leu Leu Asn Leu Glu Gln Tyr Phe His Phe Leu Val Asn Glu
115 120 125
Ala Lys Lys Arg Gln Ser
130
<210> 157
<211> 140
<212> PRT
<213> Bacillus licheniformis
<400> 157
Met Ala Met Thr Arg Phe Gly Glu Arg Leu Lys Glu Leu Arg Glu Gln
1 5 10 15
Arg Ser Leu Ser Val Asn Gln Leu Ala Met Tyr Ala Gly Val Ser Ala
20 25 30
Ala Ala Ile Ser Arg Ala Ala Ala Ile Ser Arg Ile Glu Asn Gly His
35 40 45
Arg Gly Val Pro Lys Pro Ala Thr Ile Arg Lys Leu Ala Glu Ala Leu
50 55 60
Lys Met Pro Tyr Glu Gln Leu Met Asp Ile Ala Gly Tyr Met Arg Ala
65 70 75 80
Asp Glu Ile Arg Glu Gln Pro Arg Gly Tyr Val Thr Met Gln Glu Ile
85 90 95
Ala Ala Lys His Gly Val Glu Asp Leu Trp Leu Phe Lys Pro Glu Lys
100 105 110
Trp Asp Cys Leu Ser Arg Glu Asp Leu Leu Asn Leu Glu Gln Tyr Phe
115 120 125
His Phe Leu Val Asn Glu Ala Lys Lys Arg Gln Ser
130 135 140
<210> 158
<211> 423
<212> DNA
<213> Bacillus licheniformis
<400> 158
atggcgatga caaggttcgg cgagcggctc aaagagctga gggaacaaag aagcctgtcg 60
gttaatcagc ttgccatgta tgccggtgtg agcgccgcag ccatttccag agccgcagcc 120
atttccagaa tcgaaaacgg ccaccgcggc gttcccaagc ccgcgacgat cagaaaattg 180
gccgaggctc tgaaaatgcc gtacgagcag ctcatggata ttgccggtta tatgagagct 240
gacgagattc gcgaacagcc gcgcggctat gtcacgatgc aggagatcgc ggccaagcac 300
ggcgtcgaag acctgtggct gtttaaaccc gagaaatggg actgtttgtc ccgcgaagac 360
ctgctcaacc tcgaacagta ttttcatttt ttggttaatg aagcgaagaa gcgccaatca 420
taa 423
Claims (16)
- 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서,
(a) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 도입함으로써, POI를 발현하는 모체 B. 리체니포르미스 세포를 변형시키는 단계, 및
(b) 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고,
변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법. - 변형된 바실러스 리체니포르미스 세포에서 증가된 양의 관심 단백질(POI)을 생산하는 방법으로서,
(a) (i) POI를 암호화하는 발현 카세트, 및 (ii) 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 폴리뉴클레오티드를 모체 B. 리체니포르미스 세포에 도입하는 단계, 및
(b) 단계 (a)의 변형된 세포를 POI의 생산에 적합한 조건하에 발효시키는 단계를 포함하고,
변형된 세포는 동일한 조건하에 발효될 때 모세포에 비해 증가된 양의 POI를 생산하는, 방법. - 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터 서열을 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF 서열을 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 모세포는 천연 prsA 단백질을 암호화하는 내인성 prsA 유전자를 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 도입된 폴리뉴클레오티드는 변형된 세포의 게놈에 통합되는, 방법.
- 제1항 또는 제2항에 있어서, 변형된 세포는 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 추가로 포함하는, 방법.
- 제1항 또는 제2항에 있어서, POI는 효소인, 방법.
- 모체 B. 리체니포르미스 세포로부터 유래된 변형된 바실러스 리체니포르미스 세포로서, 천연 prsA 오픈 리딩 프레임(ORF)에 작동가능하게 연결된 천연 prsA 프로모터를 포함하는 도입된 폴리뉴클레오티드를 포함하는 변형된 세포.
- 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 100에 대해 적어도 95%의 서열 동일성을 포함하는 천연 prsA 프로모터를 포함하는, 변형된 세포.
- 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 101에 대해 적어도 90%의 서열 동일성을 포함하는 천연 prsA ORF를 포함하는, 변형된 세포.
- 제9항에 있어서, 도입된 폴리뉴클레오티드는 서열번호 155에 대해 약 90%의 서열 동일성을 포함하는 천연 prsA 단백질을 암호화하는, 변형된 세포.
- 제9항에 있어서, 서열번호 122에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 dltA 유전자 및/또는 서열번호 121 또는 서열번호 158에 대해 적어도 90%의 서열 동일성을 포함하는 결실 또는 파괴된 rghR2 유전자를 포함하는 변형된 세포.
- 제9항에 있어서, 이종성 관심 단백질(POI)을 암호화하는 도입된 발현 구성체를 포함하는 변형된 세포.
- 제14항에 있어서, POI는 효소인, 변형된 세포.
- 제14항의 변형된 세포에 의해 생산된 관심 단백질.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062961234P | 2020-01-15 | 2020-01-15 | |
US62/961,234 | 2020-01-15 | ||
PCT/US2021/013420 WO2021146411A1 (en) | 2020-01-15 | 2021-01-14 | Compositions and methods for enhanced protein production in bacillus licheniformis |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220127844A true KR20220127844A (ko) | 2022-09-20 |
Family
ID=74592750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227026692A KR20220127844A (ko) | 2020-01-15 | 2021-01-14 | 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230340442A1 (ko) |
EP (1) | EP4090738A1 (ko) |
JP (1) | JP2023524334A (ko) |
KR (1) | KR20220127844A (ko) |
CN (1) | CN114945665A (ko) |
WO (1) | WO2021146411A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117836315A (zh) * | 2021-08-20 | 2024-04-05 | 丹尼斯科美国公司 | 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物 |
WO2023091878A1 (en) | 2021-11-16 | 2023-05-25 | Danisco Us Inc. | Compositions and methods for enhanced protein production in bacillus cells |
WO2023091631A2 (en) * | 2021-11-18 | 2023-05-25 | Dansico Us Inc. | High performance alphα-amylases for starch liquefaction |
WO2024050343A1 (en) | 2022-09-02 | 2024-03-07 | Danisco Us Inc. | Subtilisin variants and methods related thereto |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4760025A (en) | 1984-05-29 | 1988-07-26 | Genencor, Inc. | Modified enzymes and methods for making same |
US5310675A (en) | 1983-06-24 | 1994-05-10 | Genencor, Inc. | Procaryotic carbonyl hydrolases |
US5801038A (en) | 1984-05-29 | 1998-09-01 | Genencor International Inc. | Modified subtilisins having amino acid alterations |
WO1987004461A1 (en) | 1986-01-15 | 1987-07-30 | Amgen | THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS AND METHOD FOR PRODUCTION THEREOF |
US4980288A (en) | 1986-02-12 | 1990-12-25 | Genex Corporation | Subtilisin with increased thermal stability |
US4914031A (en) | 1987-04-10 | 1990-04-03 | Amgen, Inc. | Subtilisin analogs |
DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
PT89702B (pt) | 1988-02-11 | 1994-04-29 | Gist Brocades Nv | Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem |
DE3909096A1 (de) | 1989-03-20 | 1990-09-27 | Garabed Antranikian | Alpha-amylase |
US5665587A (en) | 1989-06-26 | 1997-09-09 | Novo Nordisk A/S | Modified subtilisins and detergent compositions containing same |
DK97190D0 (da) | 1990-04-19 | 1990-04-19 | Novo Nordisk As | Oxidationsstabile detergentenzymer |
US5482849A (en) | 1990-12-21 | 1996-01-09 | Novo Nordisk A/S | Subtilisin mutants |
EP0583339B1 (en) | 1991-05-01 | 1998-07-08 | Novo Nordisk A/S | Stabilized enzymes and detergent compositions |
KR100322793B1 (ko) | 1993-02-11 | 2002-06-20 | 마가렛 에이.혼 | 산화안정성알파-아밀라아제 |
DE4411223A1 (de) | 1994-03-31 | 1995-10-05 | Solvay Enzymes Gmbh & Co Kg | Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren |
EP2206768B1 (en) | 1997-10-13 | 2015-04-01 | Novozymes A/S | Alpha-amylase mutants |
MA24811A1 (fr) | 1997-10-23 | 1999-12-31 | Procter & Gamble | Compositions de lavage contenant des variantes de proteases multisubstituees |
WO1999043794A1 (en) | 1998-02-27 | 1999-09-02 | Novo Nordisk A/S | Maltogenic alpha-amylase variants |
US6835550B1 (en) | 1998-04-15 | 2004-12-28 | Genencor International, Inc. | Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins |
US6197565B1 (en) | 1998-11-16 | 2001-03-06 | Novo-Nordisk A/S | α-Amylase variants |
ES2496568T3 (es) | 1999-03-30 | 2014-09-19 | Novozymes A/S | Variantes de alfa-amilasa |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
WO2002014490A2 (en) | 2000-08-11 | 2002-02-21 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
AU2003228393A1 (en) | 2002-03-29 | 2003-10-13 | Genencor International, Inc. | Ehanced protein expression in bacillus |
CA2483006C (en) | 2002-04-22 | 2013-10-29 | Genencor International, Inc. | Methods of creating modified promoters resulting in varying levels of gene expression |
DE102004047776B4 (de) | 2004-10-01 | 2018-05-09 | Basf Se | Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung |
DE102004047777B4 (de) | 2004-10-01 | 2018-05-09 | Basf Se | Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung |
CA2597980C (en) | 2005-02-18 | 2016-01-05 | Genencor International, Inc. | Polypeptides having alpha-amylase and granular starch hydrolyzing activity |
JP5226958B2 (ja) * | 2007-02-22 | 2013-07-03 | 花王株式会社 | 組換え微生物 |
EP2428572A3 (en) | 2007-03-09 | 2012-12-12 | Danisco US, Inc., Genencor Division | Alkaliphilic Bacillus species alpha-amylase variants, compositions comprising alpha-amylase variants, and methods of use |
RU2009149405A (ru) | 2007-05-30 | 2011-07-10 | ДАНИСКО ЮЭс, ИНК., ДЖЕНЕНКОР ДИВИЖН (US) | Улучшенные варианты альфа-амилазы bacillus licheniformis |
CA2689635C (en) | 2007-05-30 | 2016-07-12 | Danisco Us Inc. | Variants of an alpha-amylase with improved production levels in fermentation processes |
JP5687566B2 (ja) | 2011-06-01 | 2015-03-18 | 日東電工株式会社 | 防水通音部材 |
JP6378089B2 (ja) | 2011-12-09 | 2018-08-22 | ダニスコ・ユーエス・インク | 微生物におけるタンパク質産生のための、B.ズブチリス(B.subtilis)からのリボソームプロモーター |
FR2992915B1 (fr) | 2012-07-03 | 2015-08-07 | Renault Sa | "ensemble de verrouillage pour une ceinture de securite de vehicule automobile" |
CN105229147B (zh) | 2013-03-11 | 2020-08-11 | 丹尼斯科美国公司 | α-淀粉酶组合变体 |
EP3585910B1 (en) | 2017-02-24 | 2024-03-20 | Danisco US Inc. | Compositions and methods for increased protein production in bacillus licheniformis |
CA3057713A1 (en) | 2017-03-31 | 2018-10-04 | Danisco Us Inc | Alpha-amylase combinatorial variants |
US11879127B2 (en) | 2017-08-23 | 2024-01-23 | Danisco Us Inc. | Methods and compositions for efficient genetic modifications of Bacillus licheniformis strains |
JP7218985B2 (ja) | 2017-09-13 | 2023-02-07 | ダニスコ・ユーエス・インク | バチルス属(Bacillus)におけるタンパク質産生の増加のための改変5’-非翻訳領域(UTR)配列 |
US11781125B2 (en) | 2017-12-15 | 2023-10-10 | Danisco Us Inc. | Cas9 variants and methods of use |
-
2021
- 2021-01-14 WO PCT/US2021/013420 patent/WO2021146411A1/en unknown
- 2021-01-14 US US17/791,502 patent/US20230340442A1/en active Pending
- 2021-01-14 CN CN202180009565.4A patent/CN114945665A/zh active Pending
- 2021-01-14 KR KR1020227026692A patent/KR20220127844A/ko unknown
- 2021-01-14 JP JP2022543057A patent/JP2023524334A/ja active Pending
- 2021-01-14 EP EP21704996.4A patent/EP4090738A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021146411A1 (en) | 2021-07-22 |
EP4090738A1 (en) | 2022-11-23 |
JP2023524334A (ja) | 2023-06-12 |
US20230340442A1 (en) | 2023-10-26 |
CN114945665A (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220127844A (ko) | 바실러스 리체니포르미스에서 단백질 생산을 향상시키기 위한 조성물 및 방법 | |
AU2023270322A1 (en) | Compositions and methods for modifying genomes | |
CN107278227B (zh) | 用于体外病毒基因组工程的组合物和方法 | |
KR20210096629A (ko) | 바실러스 세포에서의 향상된 단백질 생산을 위한 신규 프로모터 서열 및 이의 방법 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
KR20200105879A (ko) | 증가된 단백질 생산을 위한 돌연변이체 및 유전자 변형된 바실러스 세포 및 이의 방법 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
KR20180043297A (ko) | 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산 | |
CN108431221A (zh) | 用于转化梭状芽胞杆菌属细菌的遗传工具 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
CN110551713A (zh) | 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具 | |
DK2623594T3 (da) | Antistof mod human prostaglandin-E2-receptor EP4 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
KR20210080375A (ko) | 암 면역요법을 위한 재조합 폭스바이러스 | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
KR20210148269A (ko) | 선형 재조합 dna 작제물 및 이의 조성물을 이용하여 공여 dna 서열을 바실러스 게놈 내에 통합시키기 위한 방법 | |
KR20210148270A (ko) | 이중 원형 재조합 dna 작제물 및 이의 조성물을 이용하여 바실러스의 게놈 내로의 폴리뉴클레오타이드를 통합하기 위한 방법 | |
KR20220121844A (ko) | 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법 | |
KR20180084135A (ko) | 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
KR20170088866A (ko) | 공발현 플라스미드 | |
KR20210110826A (ko) | 하나 이상의 비-고유 꼬리 섬유를 가지는 비-복제성 형질도입 입자 및 형질도입 입자-기반 리포터 시스템 |