KR20220098245A - 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 - Google Patents

바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 Download PDF

Info

Publication number
KR20220098245A
KR20220098245A KR1020227020443A KR20227020443A KR20220098245A KR 20220098245 A KR20220098245 A KR 20220098245A KR 1020227020443 A KR1020227020443 A KR 1020227020443A KR 20227020443 A KR20227020443 A KR 20227020443A KR 20220098245 A KR20220098245 A KR 20220098245A
Authority
KR
South Korea
Prior art keywords
bacillus
cell
sequence
dna
genome
Prior art date
Application number
KR1020227020443A
Other languages
English (en)
Inventor
펠리페 오세아스 벤데주
스테이시 아이린 로비다 스터브스
Original Assignee
다니스코 유에스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니스코 유에스 인크. filed Critical 다니스코 유에스 인크.
Publication of KR20220098245A publication Critical patent/KR20220098245A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물이 제공된다. 본 개시내용은 선택 가능한 마커의 사용 없이 그리고 상기 게놈 내로의 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법뿐만 아니라, 관심 유전자를 결실시키고/시키거나 바실러스 종 세포의 게놈 내에 점 돌연변이를 제공하기 위한 방법을 포함한다.

Description

바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법
본 발명은 박테리아 분자 생물학 분야에 관한 것으로서, 보다 구체적으로 선택 가능한 마커의 사용 없이 그리고 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 조성물 및 방법에 관한 것이다.
관련 출원의 상호 참조
본 출원은 2019년 11월 19일자로 출원된 미국 특허 가출원 제62/937,372호의 이익을 주장하며, 그 전체가 본원에 참조로 포함된다.
전자로 제출된 서열 목록의 참조
본 서열 목록의 공식 사본은 2020년 11월 2일자로 작성되고 그 크기가 188 킬로바이트이며 본 명세서와 동시에 제출된 파일명 NB41425-WO-PCT_SequenceListing.txt의 ASCII 형식의 서열 목록으로서 EFS-Web을 통해 전자 제출되었다. 이러한 ASCII 형식의 문헌에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.
바실러스 종(Bacillus sp.)에서의 효소의 상업적 생산은 항생제 내성 마커-부재 균주의 제작 방법이 요구된다. 이들 방법은 몇몇 기준에 맞아야 하는데, 즉 (i) 관심 유전자의 삽입 및 숙주 변형 둘 모두에 유용해야 하고, (ii) 신속하고 효율적이어야 하고, (iii) 사용하기 쉬어야 한다.
바실러스 종의 염색체를 변경하기 위해 널리 사용되고 알려진 방법은 플라스미드 작제물을 구축하는 단계, 및 이들을 대장균(Escherichia coli) 내로 형질전환시키는 단계를 수반한다. 후속적으로, 선택 가능한 마커를 사용하여 플라스미드를 대장균으로부터 단리하고, 바실러스 종에 형질전환시킨다. 이러한 방법의 광범위한 사용은 적어도 부분적으로는 대장균이 바실러스보다 형질전환시키기 쉽다는 생각에 기인할 수 있다. 이와 관련하여, 플라스미드의 시험관 내 결찰은 대장균은 형질전환시키지만 바실러스는 형질전환시키지 않는 니킹(nicking)된 산물을 초래한다. 바실러스 종에서 공여 DNA를 도입하기 위한 통상적인 접근법은 복제 플라스미드에 기반을 두고 있다. 불행하게도, 이 같은 접근법은 일반적으로 세포에서 플라스미드를 유지하기 위해 항생제 또는 기타 선택 가능한 마커에 대한 필요성을 비롯하여 다수의 단점과 연관이 있다. 이는 생산 균주에 바람직하지 않으며, 이는 선별 조건의 선택을 제한한다. 복제 플라스미드의 사용에 있어서 다른 단점은 플라스미드 상에 종종 복수개의 유전자가 존재하여 유전자 조절 및 발현에 영향을 미친다는 것이다.
대안적으로, 통합 플라스미드 또는 벡터가 사용될 수 있다. 통합 벡터는 복제 기원을 포함하지 않으며, 따라서 안정한 유지를 위해 숙주 염색체 내로의 삽입이 요구된다. 그러나, 이들은 문제가 없는 것은 아니다. 통합은 삽입된(현재 선형) 벡터의 양 말단에 클로닝된 영역의 복제를 초래하는 캠벨(Campbell) 유형의 재조합 이벤트를 통해 발생한다. 통합 위치에 따라 유전자가 파괴될 수 있으며, 그 결과 형질전환 효율이 떨어질 수 있다.
현재, ARM-부재 균주를 제작하기 위해 무항생제 선택 카세트가 사용될 수 있다(문헌[Ferrari et al. 1985, Nat. Biotechnol. Vol. 3: 1003~1007]). 그러나 이는 시간 소모적이며, 카세트는 동일한 균주에서 유용하도록 제거될 필요가 있다.
유전자 변형 및 바실러스 종 세포의 게놈 내로의 유전자 통합을 위한 이전 방법은 자발적 이중 가닥 절단의 발생 및 짧은 상동성 아암(게놈 내에 삽입될 관심 유전자(GOI) 및 게놈 내에 통합된 관심 유전자를 갖는 바실러스 종 세포의 식별을 가능케 하도록 게놈 내에 또한 삽입된 선택 가능한 마커 둘 모두를 포함함)을 갖는 선형 DNA 단편 상에 함께 위치한 선택 가능한 마커의 사용에 의존하였다(2002년 2월 21일자로 공개된 WO02/14490). 선택 가능한 마커 및 GOI는 세포 내의 DNA와의 재조합 시에 GOI 및 선택 가능한 마커 둘 모두가 세포의 DNA에 통합될 수 있도록 전형적으로 2개의 짧은 상동성 아암에 의해 플랭킹되어 있었다. 바실러스 종 세포 내로의 게놈의 통합을 위한 짧은 상동성 아암을 갖는 이 같은 선형 단편의 형질전환 동안의 선택 가능한 마커의 사용은 게놈의 특정 유전자위의 효율적인 변형을 위해 선택될 필요가 있다. 선택 가능한 마커는 정확한 발현용 유전자위 내에 통합되어야 하고, 이러한 통합은 개체군 내 및 게놈 내에서 확률적 방식으로 발생하는 희귀하고 자발적 DNA 손상에 의존한다. 이러한 희귀한 이벤트는 오직 마커의 사용과 염색체 통합을 조합함으로써 선택될 수 있다(2002년 2월 21일자로 공개된 WO02/14490).
바실러스 서브틸리스(Bacillus subtilis)에서, 유전자 결실 및 유전자 내에서의 점 돌연변이의 도입을 가능케 하기 위해 Cas 엔도뉴클레아제/RNA-가이딩된 시스템과 조합하여 단일 플라스미드 시스템을 사용하는 것이 기재되어 있다(문헌[Altenbuchner J., 2016, Applied and Environmental Microbiology, vol.82(17) pg. 5421~5427]). Cas-기반 게놈 조작 기법이 다수의 상이한 숙주 세포 유형에 적용되어 왔지만, 이들 기법에는 제한이 있는 것으로 알려져 있다. CRISPR/Cas9 방법은 마커가 없는 ARM-부재 균주를 제작하기 위해 사용되었다(문헌[So et al. 2017, Front Microbiol, Vol. 8: 1167], 문헌[Zhang et al. 2016, Sci Rep, Vol. 6: 27943]). 이러한 접근법은 Cas9 기술에 대한 접근, 변형될 게놈 상의 모든 부위에 대한 가이드 RNA 및 Cas9를 암호화하는 플라스미드 또는 선형 단편의 제작이 요구된다. 이는 또한 절차의 말기에 Cas9의 제거가 요구된다. 이전 방법의 개선에도 불구하고, Cas9-기반 방법은 여전히 관련된 많은 단계를 갖는다.
따라서, 선택 가능한 마커 및/또는 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내로의 공여 DNA 서열(예를 들어, 관심 폴리뉴클레오타이드, 단일 유전자 발현 카세트 또는 복수개의 유전자 발현 카세트를 들 수 있지만, 이에 제한되지 않음)의 유전자 통합뿐만 아니라 게놈 변형을 위한 효과적이면서 효율적이거나, 또는 달리 더 강력한 방법의 개발에 대한 요구가 여전히 존재한다.
본 개시내용은 선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물을 포함한다. 본 개시내용은 선택 가능한 마커의 사용 없이 그리고 상기 게놈 내로의 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법, 및 관심 유전자를 결실시키고/시키거나 바실러스 종 세포의 게놈 내에 돌연변이를 제공하기 위한 방법을 포함한다.
임의의 특정 이론, 기작 또는 작용 모드에 제한되지 않지만, 놀랍고도 예상치 못하게도, 본 출원인은 이의 단부에 긴 상동성 아암(각각의 상동성 아암은 적어도 900개의 뉴클레오타이드를 가짐)을 포함하는 선형 DNA 작제물이 수용능 바실러스 종 세포 내로 도입되는 경우에 게놈 변형(예를 들어, 공여 DNA 서열 통합, 뉴클레오타이드 결실, 돌연변이를 들 수 있지만, 이에 제한되지 않음)에서의 높은 효율이 관찰되며, 이때 도입 및 게놈 변형은 선택 가능한 마커 또는 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 발생한다는 것을 발견하였다.
이 방법은 선형 DNA 작제물을 수용능 바실러스 종 세포 내로 도입하는 단계를 이용하며, 이때 상기 선형 DNA 작제물은 선택적으로 상기 상동성 아암에 의해 플랭킹된 공여 DNA를 포함하는 적어도 900 bp의 상동성 아암에 의해 플랭킹되고, 상기 DNA 작제물은 엔도뉴클레아제를 암호화하는 DNA 단편을 포함하지 않으며, 상기 DNA 작제물은 선택 가능한 마커를 암호화하는 DNA 서열을 포함하지 않는다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않으며, 선택적으로는 이 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역과 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
일부 구현예에서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는다.
본원에 기재되어 있는 바와 같은 선형 DNA 작제물은 이중 가닥 DNA일 수 있다.
하나의 구현예에서, 수용능 바실러스 종 세포는 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 렌투스(Bacillus lentus), 바실러스 브레비스(Bacillus brevis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 클라우시(Bacillus clausii), 바실러스 할로두란스(Bacillus halodurans), 바실러스 메가테리움(Bacillus megaterium), 바실러스 코아귤란스(Bacillus coagulans), 바실러스 서큘란스(Bacillus circulans), 바실러스 라우투스(Bacillus lautus) 및 바실러스 투링기엔시스(Bacillus thuringiensis)로 이루어진 군으로부터 선택되는 바실러스 종 세포이다.
하나의 구현예에서, 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되었다.
하나의 구현예에서, 수용능 바실러스 종 세포는 Pxyl-ComK 균주를 들 수 있지만 이에 제한되지 않는 초수용능 바실러스 종 균주에서 유래한 것이다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
도 1은, 수용능 바실러스 종 세포 내로 도입된 선형 DNA 작제물로서, 이의 단부에 긴 상동성 아암(HR1 및 HR2; 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드(0.9 kb 이상)를 가짐)을 포함하는 선형 DNA 작제물을 사용하여 바실러스 종 세포의 게놈을 변형시키기 위한 방법을 보여준다. 상부 도면(도 1)에서, 선형 DNA 작제물은 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고 및 하나는 3' 하류 아암인 HR2임)에 의해 플랭킹된 공여 DNA를 포함한다. 공여 DNA는 관심 유전자를 발현하는 발현 카세트를 포함할 수 있다. 공여 작제물이 세포 내로 도입되면, 관심 게놈 유전좌위 내에 공여 DNA를 통합시키는 상동성 재조합이 발생할 수 있다. 하부 도면(도 1)에서, 선형 DNA 작제물은 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고 및 하나는 3' 하류 아암인 HR2임)를 포함하며, HR 아암들 사이에는 어떠한 추가적인 DNA도 없다. 이러한 선형 DNA 작제물이 세포 내로 도입되면, 뉴클레오타이드 결실(유전자 결실)을 초래할 수 있는 상동성 재조합이 발생할 수 있다. 선형 DNA 작제물은 당업자에게 알려져 있는 임의의 기작에 의해 바실러스 종 세포 내로 도입될 수 있다.
본 개시내용은 선택 가능한 마커의 사용 없이 그리고 가이드 RNA/Cas 엔도뉴클레아제 시스템의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물을 포함한다. 본 개시내용은 상기 게놈 내로의 선택 가능한 마커의 통합 없이 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법 및 조성물을 포함한다. 하나의 양태에서, 이 방법은 수용능 바실러스 종 세포의 게놈 내로의 상기 공여 DNA의 도입을 위한 긴 상동성 아암(900개 이상의 뉴클레오타이드의 길이를 가짐)에 의해 플랭킹된 공여 DNA 서열을 포함하는 선형 DNA 작제물을 이용하며, 이와 같이 상기 바실러스 종 세포의 게놈에서 선택 가능한 마커를 통합시킬 필요 없이 그리고 가이딩된 Cas 시스템의 필요 없이 상기 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 매우 효과적인 시스템을 제공한다.
본 개시내용은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법 및 조성물을 추가로 포함하며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
본 문헌은 읽기 쉽도록 여러 부문으로 구성되어 있지만, 독자라면 한 부문의 서술이 다른 부문에 적용될 수 있음을 이해할 것이다. 이러한 방식으로, 본 개시내용의 상이한 부문에 사용된 표제가 제한적인 것으로 해석되어서는 안 된다.
본원에 제공된 표제는 본 명세서를 전체로 참조할 수 있는 본 조성물 및 방법의 다양한 양태 또는 구현예를 제한하는 것은 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 조성물 및 방법이 속하는 기술분야의 당업자가 일반적으로 이해하는 바와 동일한 의미를 갖는다. 대표적인 예시적 방법 및 재료가 이제 기재되지만, 본원에서 기재되어 있는 것과 유사하거나 동등한 임의의 방법 및 재료가 본 조성물 및 방법의 실시 또는 시험에 사용될 수도 있다.
본 명세서에서 언급된 모든 간행물 및 특허는, 각각의 개별 간행물 또는 특허가 구체적이고 개별적으로 참조로 포함되는 것으로 표시된 것처럼 참조로 본원에 포함되며, 이 간행물이 언급된 것과 관련하여 방법 및/또는 재료를 개시 및 기재하기 위해 참조로 본원에 포함된다.
본원에서 사용된 바와 같이, "개시내용" 또는 "개시된 개시내용"이란 용어는 제한하기 위한 것이 아니라, 일반적으로 청구범위에 정의되거나 본원에 기재되어 있는 개시내용 중 임의의 것에 적용된다. 이들 용어는 본원에서 상호 교환 가능하게 사용된다.
Cas 유전자 및 단백질
CRISPR(클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부: clustered regularly interspaced short palindromic repeat) 유전자위는, 예를 들어 박테리아 및 고세균 세포에 의해 외래 DNA를 파괴하는 데 사용되는 DNA 개열 시스템의 성분을 암호화하는 특정 유전자위를 지칭한다(문헌[Horvath and Barrangou, 2010, Science 327: 167~170; WO2007/025097; 2007년 3월 1일자로 공개됨]. CRISPR 유전자위는 다양한 Cas(CRISPR-연관(associated)) 유전자에 의해 플랭킹될 수 있는, 짧은 가변 DNA 서열(소위 '스페이서'로 지칭됨)에 의해 분리된 짧은 직접 반복부(CRISPR 반복부)를 포함하는 CRISPR 배열로 이루어질 수 있다. 주어진 CRISPR 유전자위에서 CRISPR-연관 유전자의 개수는 종들 간에 달라질 수 있다. 다중-아단위 효과기 복합체(I형, III형 및 IV형 아형을 포함함)를 갖는 클래스 1 시스템, 및 단일 단백질 효과기(예를 들어, Cas9, Cpf1, C2c1, C2c2, C2c3을 들 수 있지만, 이에 제한되지 않는 II형 및 V형 아형을 포함함)를 갖는 클래스 2 시스템을 포함하는 여러 CRISPR/Cas 시스템이 기재되어 있다. 클래스 1 시스템(본원에 참조로 포함된 문헌[Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13: 1~15]; 문헌[Zetsche et al., 2015, Cell 163, 1~13]; 및 2013년 11월 23일자로 공개된 WO 2013/176772 A1). 박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(트랜스-활성화 CRISPR RNA)를 이용하여 Cas 엔도뉴클레아제를 이의 DNA 표적으로 가이딩한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 tracrRNA(트랜스-활성화 CRISPR RNA)와 염기 쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 개열하도록 유도하는 RNA 듀플렉스를 형성하는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질을 수반하는 완전히 이해되지 않은 과정을 통해 획득된다. 모든 II형 CRISPR/Cas 유전자위는 cas9 유전자 외에도 cas1 및 cas2 유전자를 포함한다(문헌[Chylinski et al., 2013, RNA Biology 10: 726~737]; 문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]). II형 CRISPR-Cas 유전자위는 각각의 CRISPR 배열 내 반복부와 부분적으로 상보적인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 기타 단백질을 포함할 수 있다. cas1 및 cas2 유전자 부근에 있는 cas9의 존재는 II형 유전자위의 특징이다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]). I형 CRISPR-Cas(CRISPR-연관(associated)) 시스템은 침입하는 바이러스 DNA에 대해 방어하기 위해 단일 CRISPR RNA(crRNA) 및 Cas3과 함께 기능을 하는 캐스케이드(Cascade; 항바이러스 방어를 위한 CRISPR-연관 복합체)로 지칭되는 단백질의 복합체로 이루어져 있다(전문이 본원에 포함된 문헌[Brouns, S.J.J. et al. Science 321: 960~964]; 문헌[Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13: 1~15]).
본원에서 "Cas 유전자"란 용어는 일반적으로 플랭킹 CRISPR 유전자위에 결합되거나, 회합되거나, 가까이 있거나, 또는 그 부근에 있는 유전자를 지칭한다. "Cas 유전자", "cas 유전자", "CRISPR-연관(Cas) 유전자" 및 "클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부-연관 유전자"란 용어는 본원에서 상호 교환 가능하게 사용된다.
"Cas 단백질" 또는 "Cas 폴리펩타이드"란 용어는 Cas(CRISPR-연관(associated)) 유전자에 의해 암호화된 폴리펩타이드를 지칭한다. Cas 단백질은 Cas 엔도뉴클레아제를 포함한다.
Cas 단백질은 박테리아 또는 고세균 단백질일 수 있다. 본원에서 I형 내지 III형 CRISPR Cas 단백질은 통상적으로 그 기원이 원핵생물이며, 예를 들어 I형 및 III형 Cas 단백질은 박테리아 종 또는 고세균 종으로부터 유래할 수 있는 반면, II형 Cas 단백질(즉, Cas9)은 박테리아 종으로부터 유래할 수 있다. 기타 양태에서, Cas 단백질은 Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체 또는 이의 변형된 버전 중 하나 이상을 포함한다. Cas 단백질은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas 5, Cas7, Cas8, Cas10 또는 이들의 조합 또는 복합체를 포함한다.
"Cas 엔도뉴클레아제"란 용어는, 적합한 폴리뉴클레오타이드 성분과 복합체를 이루는 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나 개열할 수 있는 Cas 폴리펩타이드(Cas 단백질)를 지칭한다. Cas 엔도뉴클레아제는 (예를 들어, 세포의 게놈 내의 표적 부위에서) 이중 가닥 DNA 내의 특정 표적 부위의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나 개열하도록 가이드 폴리뉴클레오타이드에 의해 가이딩된다. 본원에 기재되어 있는 Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다. 본원에 기재되어 있는 공여 DNA 삽입 방법에 사용된 Cas 엔도뉴클레아제는 단일 또는 이중 가닥 절단을 표적 부위에서의 DNA 내로 도입하는 엔도뉴클레아제이다. 대안적으로, Cas 엔도뉴클레아제에는 DNA 개열 또는 닉킹 활성이 결여될 수 있지만, 이는 적합한 RNA 성분과 복합체를 형성하는 경우에 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
본원에서 사용된 바와 같이, "Cas9"(이전에는 Cas5, Csn1 또는 Csx12로서 지칭됨) 또는 "Cas9 엔도뉴클레아제"로서 지칭되거나 "Cas9 엔도뉴클레아제 활성"을 갖는 폴리펩타이드는 DNA 표적 서열의 전부 또는 일부에 특이적으로 결합하고, 선택적으로는 이를 닉킹하거나 개열하기 위해 cr뉴클레오타이드 및 tracr뉴클레오타이드와의 복합체, 또는 단일 가이드 폴리뉴클레오타이드와 복합체를 형성하는 Cas 엔도뉴클레아제를 지칭한다. Cas9 엔도뉴클레아제는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 개열할 수 있다(도메인 둘 모두의 공동 작용에 의해 DNA 이중 가닥 개열이 초래되는 반면, 하나의 도메인의 활성에 의해 닉(nick)이 초래됨). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 이때 도메인 I은 Cas9의 N-말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인에 플랭킹하는 단백질의 중간에 위치한다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15], 문헌[Hsu et al, 2013, Cell 157: 1262~1278]). Cas9 엔도뉴클레아제는 전형적으로 II형 CRISPR 시스템으로부터 유래하는데, 이 시스템은 적어도 하나의 폴리뉴클레오타이드 성분과 복합체를 이룬 Cas9 엔도뉴클레아제를 사용하는 DNA 개열 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 트랜스-활성화 CRISPR RNA(tracrRNA)와 복합체를 이룰 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와 복합체를 이룰 수 있다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]).
가이딩된 Cas 시스템
"가이드 RNA/Cas 엔도뉴클레아제 복합체", "가이드 RNA/Cas 엔도뉴클레아제 시스템", "가이드 RNA/Cas 복합체", "가이드 RNA/Cas 시스템", "gRNA/Cas 복합체", "gRNA/Cas 시스템", "RNA-가이딩된 엔도뉴클레아제", "RGEN"이란 용어는 본원에서 상호 교환 가능하게 사용되며, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하며, 이때 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나, 개열(단일 또는 이중 가닥 절단을 도입)하도록 할 수 있다.
DNA 작제물 및 공여 DNA
상동성 지향적 복구(HDR)는 이중 가닥 및 단일 가닥 DNA 절단을 복구하는 세포 내의 기작이다. 상동성 지향적 복구는 상동성 재조합(HR) 및 단일 가닥 어닐링(SSA)을 포함한다(문헌[Lieber. 2010 Annu. Rev. Biochem. 79: 181~211]). 가장 일반적인 형태의 HDR은 상동성 재조합(HR)으로 지칭되며, 이는 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 절단)에서의 상동성 지향적 복구는 이중 가닥 절단에서의 HDR과 다른 기작을 통해 일어날 수 있다(문헌[Davis and Maizels. PNAS (0027-8424), 111(10), p. E924~E932).
상동성 재조합은 상동성 부위에서 2개의 DNA 분자 사이의 DNA 단편의 교환을 포함한다. 상동성 재조합의 빈도는 여러 인자에 영향을 받는다. 상이한 유기체는 상동성 재조합의 양 및 상동성 재조합과 비상동성 재조합의 상대 비율이 다르다. 상동성 재조합을 관찰하는 데 필요한 상동성 영역(상동성 아암)의 길이는 유기체마다 다르다. 예를 들어, 상동 재조합(HR)을 통한 원핵생물 유기체(세포)의 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 상동 재조합은 기타 유기체에서 또한 이루어져 왔다. 예를 들어, 기생 원생동물 리슈마니아(Leishmania)에서의 상동 재조합에 적어도 150 bp 내지 200 bp의 상동성이 필요했으며(문헌[Papadopoulou and Dumas, (1997) Nucleic Acids Res 25: 4278~86]), 프로토박테리움인 대장균에서의 효율적인 재조합에 적어도 150 bp 내지 200 bp의 상동성이 필요하다(문헌[Lovett et al (2002) Genetics 160: 851~859]).
"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 본원에 기재되어 있는 DNA 작제물에서 발견되는 "게놈 영역에 대한 상동성 영역"은 세포 또는 유기체 게놈 내의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동성 영역은 상동성 재조합을 촉진시키는 데 충분한 임의의 길이를 가질 수 있다. 예를 들어, 본원에 기재되어 있는 선형 DNA 작제물의 상동성 영역이 상응하는 상동성 영역과의 상동성 재조합을 겪는 데 충분한 상동성을 갖도록 상동성 영역은 적어도 약 900개의 염기 쌍(bp)과 2,000 bp 사이; 900개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 2,000 bp 사이; 1,000개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 4,000 bp 사이; 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이; 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이; 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이; 5,000 bp와 최대 6,000 bp 사이의 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오타이드 서열이 상동성 재조합 반응을 위한 기질로서 작용하기에 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각각의 폴리뉴클레오타이드 단편의 전체 길이뿐만 아니라 폴리뉴클레오타이드의 서열 유사성을 포함한다. 서열 유사성은 전체 서열 길이에 걸친 서열 동일성(%)에 의해, 및/또는 100%의 서열 동일성을 갖는 연속된 뉴클레오타이드와 같은 국부적 유사성 및 서열 길이의 일부에 걸친 서열 동일성(%)을 포함하는 보존된 영역에 의해 기술될 수 있다.
또한, 상동성의 양은 2개의 폴리뉴클레오타이드의 전체 정렬된 길이에 걸친 서열 동일성(%)에 의해 기술될 수도 있는데, 이는 적어도 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성(%)을 포함한다. 충분한 상동성은 폴리뉴클레오타이드 길이, 전체 서열 동일성(%) 및 선택적으로 연속된 뉴클레오타이드의 보존된 영역 또는 국소 서열 동일성(%)의 임의의 조합을 포함하며, 예를 들어 충분한 상동성은 게놈의 영역과 적어도 80%의 서열 동일성을 갖는 900 bp 내지 7,000 bp의 영역으로서 기술될 수 있다. 충분한 상동성은 또한 높은 엄격성 조건 하에 특이적으로 혼성화하는 2개의 폴리뉴클레오타이드의 예측된 능력에 의해 기술될 수 있고, 예를 들어 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.)]; 및 문헌[Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York)]을 참고한다.
본원에서 사용된 바와 같이, "게놈 영역"은 변형될 게놈 서열의 어느 한 측에 존재하거나, 대안적으로 변형될 게놈 서열의 일부를 또한 포함하는 세포의 게놈 내의 염색체의 분절이다. 본원에 기재되어 있는 바와 같은 게놈 영역은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는다.
본원에 기재되어 있는 바와 같은 게놈 영역이 상응하는 상동성 영역과의 상동성 재조합을 겪는 데 충분한 상동성을 갖도록 게놈 영역은 적어도 약 900개의 염기 쌍(bp)과 2,000 bp 사이, 900개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 2,000 bp 사이, 1,000개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 4,000 bp 사이, 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이, 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이, 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이, 5,000 bp와 최대 6,000 bp 사이의 길이 또는 그 이상의 염기를 포함할 수 있다.
본원에 기재되어 있는 바와 같이, 변형될 게놈 서열은 변형될 단일 염기(예를 들어, 본원에 기재되어 있는 점 돌연변이) 및 결실된 유전자 또는 염색체 단편을 포함한다. 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 것이 바람직한 양태에서, 게놈 영역은 바실러스 종 게놈 상에서 서로에 대해 바로 옆에 직접 위치한다.
주어진 게놈 영역과 DNA 작제물 상에서 발견되는 상응하는 상동성 영역(HR1, HR2) 사이의 구조적 유사성은 상동성 재조합이 일어날 수 있도록 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, DNA 작제물의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 이 서열이 상동성 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있다.
본원에서 사용된 바와 같이, "DNA 작제물"은 적어도 제1 상동성 아암(HR1; 5 프라임 상동성 아암인 5'HR로도 지칭됨) 및 제2 상동성 아암(HR2; 3 프라임 상동성 아암인 3'HR로도 지칭됨)을 포함하는 DNA 서열을 지칭한다. DNA 작제물은 제1과 제2 상동성 아암 사이에 공여 DNA(상동성 아암에 의해 플랭킹된 공여 DNA)를 추가로 포함할 수 있다.
본원에서 사용된 바와 같이, "선형 DNA 작제물"은 선형인 단일 가닥 또는 이중 가닥 DNA 작제물을 지칭한다.
본원에서 사용된 바와 같이, "상동성 아암"은 바실러스 종 게놈 내의 게놈 영역에 상동성인 핵산 서열을 지칭한다. 주어진 게놈 영역과 DNA 작제물 상에서 발견되는 상응하는 상동성 아암(HR1, HR2) 사이의 구조적 유사성은 상동성 재조합이 일어날 수 있도록 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, DNA 작제물의 HR1 및/또는 HR2의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 이 서열이 상동성 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있다.
하나의 양태에서, 바실러스 종 게놈 내에 통합될 관심 뉴클레오타이드 서열을 포함하고, 본원에 기재되어 있는 선형 이중 가닥 DNA 작제물 상에 위치한 이중 가닥 공여 DNA 서열에 플랭킹하는 본 개시내용의 상동성 아암은 약 900개의 염기 쌍(bp)과 2,000 bp 사이, 900개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 2,000 bp 사이, 1,000개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 4,000 bp 사이, 900개의 염기 쌍(bp)과 2,000 bp 사이; 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이, 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이, 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이, 5,000 bp와 최대 7,000 bp 사이를 포함한다.
하나의 양태에서, 바실러스 종 게놈 내에 통합될 관심 뉴클레오타이드 서열을 포함하고, 선형 단일 가닥 DNA 작제물 상에 위치한 단일 가닥 공여 DNA에 플랭킹하는 본 개시내용의 상동성 아암은 약 900개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드, 900개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드, 900개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 4,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 4,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 5,000개의 뉴클레오타이드 내지, 6,000개의 뉴클레오타이드 내지 최대 7,000개의 뉴클레오타이드를 포함한다.
본원에서 사용된 바와 같이, "공여 DNA" 및 "공여 DNA 서열"은 바실러스 종 세포의 게놈 내에 삽입될 관심 뉴클레오타이드 서열을 포함하는 DNA 서열을 지칭한다.
본원에서 사용된 바와 같은 공여 DNA는 제1 상동성 아암(HR1; 5 프라임 상동성 아암인 5'HR로도 지칭됨) 및 제2 상동성 아암(HR2; 3 프라임 상동성 아암인 3'HR로도 지칭됨)에 의해 플랭킹되며, 이는 수용능 바실러스 종 게놈 내로의 공여 DNA의 통합 위치를 결정한다.
하나의 양태에서, 공여 DNA 서열의 관심 뉴클레오타이드 서열은 관심 폴리뉴클레오타이드, 재조합 DNA, 관심 합성 서열, 관심 이종성 서열, 관심 상동성 서열, 관심 유전자, 하나 이상의 발현 카세트, 하나 이상의 재조합 DNA 작제물, 하나 이상의 발현 카세트, 형질전환되지 않은 천연 게놈 서열과 비교할 때 목적하는 변형/돌연변이(예를 들어, 염기 치환)를 갖는 뉴클레오타이드 서열(예를 들어, 단일 염기를 포함하지만 이에 제한되지 않음), 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열 또는 이의 임의의 하나의 조합을 포함한다.
본원에 기재되어 있는 관심 폴리뉴클레오타이드는 관심 유기체에서의 발현을 위한 발현 카세트에 제공될 수 있다.
본원에서 사용된 바와 같이, "발현"이란 용어는 전구체 형태 또는 성숙한 형태의 기능적 최종 산물(예를 들어, crRNA, tracrRNA, mRNA, 가이드 RNA, sRNA, siRNA, 안티센스 RNA 또는 폴리펩타이드(단백질))의 생산을 지칭한다. "발현"이란 용어는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이 단계는 전사, 전사 후 변형, 번역, 번역 후 변형 및 분비를 포함하지만, 이에 제한되지 않는다.
발현 카세트는 본원에 개시되어 있는 바와 같이 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열 및 또는 태그 및 합성 서열을 포함할 수 있다.
본원에 개시되어 있는 발현 카세트는 바실러스 종(숙주) 세포에서 기능적인 전사 및 번역 개시 영역(즉, 프로모터), 5' 비번역된 영역, 다양한 단백질 태그 및 서열을 암호화하는 폴리뉴클레오타이드, 관심 폴리뉴클레오타이드 및 전사 및 번역 종결 영역(즉, 종결 영역)을 전사의 5'-3' 방향으로 포함할 수 있다. 또한, 발현 카세트에는 본원에서 그 외에 기재된 조절 영역의 전사 조절 하에 있도록 폴리뉴클레오타이드의 삽입을 위한 복수의 제한 부위 및/또는 재조합 부위가 제공된다. 조절 영역(즉, 프로모터, 전사 조절 영역 및 번역 종결 영역) 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 자연적일/유사할 수 있다. 다양한 단백질 서열을 암호화하는 기타 폴리뉴클레오타이드 서열은 관심 폴리뉴클레오타이드의 5' 또는 3' 말단 중 하나에 부가될 수 있다. 대안적으로, 조절 영역 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 이종일 수 있다.
특정 구현예에서, 본원에 개시되어 있는 폴리뉴클레오타이드는 본원에서 그 외에 개시되거나 당해 기술분야에 알려져 있는 바와 같이 관심 폴리뉴클레오타이드 서열 또는 발현 카세트의 임의의 조합에 의해 스태킹(stacking)될 수 있다. 스태킹된 폴리뉴클레오타이드는 초기 폴리뉴클레오타이드와 동일한 프로모터에 작동 가능하게 연결될 수 있거나, 별도의 프로모터 폴리뉴클레오타이드에 작동 가능하게 연결될 수 있다.
발현 카세트는 선택적으로는 상응하는 종결 영역과 함께 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함할 수 있다. 종결 영역은 전사 개시 영역에 자연적일 수 있거나, 작동 가능하게 연결된 관심 폴리뉴클레오타이드에 또는 프로모터 서열에 자연적일 수 있거나, 숙주 유기체에 자연적일 수 있거나, 다른 공급원으로부터 유래(즉, 외래 또는 이종)할 수 있다. 편리한 종결 영역은 세포 외 단백질(예를 들어, B. 서브틸리스로부터의 aprE, B. 리케니포르미스로부터의 aprL)의 분비와 관련된 원핵생물 리보솜 RNA 오페론 또는 유전자로부터의 람다 파지 t0 종결 영역 또는 강한 종결자와 같은 파지 서열로부터 이용 가능하다. 편리한 종결 영역은 옥토핀(octopine) 합성효소 및 노팔린(nopaline) 합성효소 종결 영역과 같은 A. 투메파시엔스의 Ti-플라스미드로부터 이용 가능하다. 또한, 문헌[Guerineau et al. (1991) Mol. Gen. Genet. 262: 141~144]; 문헌[Proudfoot (1991) Cell 64: 671~674]; 문헌[Sanfacon et al. (1991) Genes Dev. 5: 141~149]; 문헌[Mogen et al. (1990) Plant Cell 2: 1261~1272]; 문헌[Munroe et al. (1990) Gene 91: 151~158]; 문헌[Ballas et al. (1989) Nucleic Acids Res. 17: 7891~7903]; 및 문헌[Joshi et al. (1987) Nucleic Acids Res. 15: 9627~9639]을 참고한다.
적절한 경우, 관심 폴리뉴클레오타이드는 형질전환 또는 표적화된 유기체에서의 발현 증가에 최적화될 수 있다. 예를 들어, 폴리뉴클레오타이드는 개선된 발현을 위한 유기체-선호 코돈을 사용하도록 합성되거나 변경될 수 있다.
추가적인 서열 변형은 세포 숙주에서 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은 의사 폴리아데닐화 신호를 암호화하는 서열, 엑손-인트론 스플라이스 부위 신호, 트랜스포존-유사 반복부, 및 유전자 발현에 유해할 수 있는 기타 이 같이 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 알려진 유전자를 참조하여 계산할 때 주어진 세포 숙주에 대해 평균 수준으로 조정될 수 있다. 가능한 경우, 서열은 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
발현 카세트는 5' 리더 서열을 추가로 함유할 수 있다. 이 같은 리더 서열은 번역 또는 RNA 안정성 수준을 향상시키도록 작용할 수 있다. 5' 비번역된 영역과 상호 교환 가능하게 사용되는 5' 리더 서열은 널리 알려져 있고 잘 규명된 박테리아 UTR, 예를 들어 바실러스 서브틸리스 aprE 유전자 또는 바실러스 리케니포르미스 amyL 유전자 또는 임의의 박테리아 리보솜 단백질 유전자로부터의 것에서 유래할 수 있다. 번역 리더는 당해 기술분야에 알려져 있고, 피코르나바이러스(picornavirus) 리더, 예를 들어 EMCV 리더(뇌심근염 5' 비암호화 영역)(문헌[Elroy-Stein et al. (1989) Proc. Natl. Acad. Sci. USA 86: 6126~6130]); 포티바이러스(potyvirus) 리더, 예를 들어 TEV 리더(담배 식각 바이러스(Tobacco Etch Virus))(문헌[Gallie et al. (1995) Gene 165(2): 233~238]), MDMV 리더(옥수수 위축 모자이크 바이러스(Maize Dwarf Mosaic Virus))(문헌[Johnson et al. (1986) Virology 154: 9~20]) 및 인간 면역글로불린 중쇄 결합 단백질(BiP)(문헌[Macejak et al. (1991) Nature 353: 90~94]); 알팔파 모자이크 바이러스의 코트 단백질 mRNA(AMV RNA 4)로부터의 비번역된 리더(Jobling et al. (1987) Nature 325: 622~625); 담배 모자이크 바이러스 리더(TMV)(문헌[Gallie et al. (1989) in Molecular Biology of RNA, ed. Cech (Liss, New York), pp. 237~256]); 및 옥수수 황색얼룩 반점 바이러스 리더(MCMV: maize chlorotic mottle virus reader)(문헌[Lommel et al. (1991) Virology 81: 382~385])를 포함한다. 또한, 문헌[Della-Cioppa et al. (1987) Plant Physiol. 84: 965~968]을 참고한다. 번역을 향상시키는 것으로 알려져 있는 기타 방법, 예를 들어 인트론 등이 또한 사용될 수 있다.
발현 카세트를 제조할 때, 다양한 DNA 단편은 적절한 배향으로, 그리고 적절한 경우 적절한 리딩 프레임에서 DNA 서열을 제공하도록 조작될 수 있다. 이를 위해, 어댑터(adapter) 또는 링커는 DNA 단편을 연결하기 위해 사용될 수 있거나, 기타 조작은 편리한 제한 부위, 필요치 않은 DNA의 제거, 제한 부위의 제거 등을 제공하도록 수반될 수 있다. 이 목적을 위해, 시험관 내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 수반될 수 있다.
일부 구현예에서, 리파아제 또는 프로테아제 단백질을 암호화하는 뉴클레오타이드 서열은 제어 요소, 예를 들어 전사 제어 요소(예를 들어, 프로모터)에 작동 가능하게 연결된다. 전사 제어 요소는 진핵생물 세포 또는 원핵생물 세포(예를 들어, 박테리아 또는 바실러스 종 세포) 중 어느 하나에서 기능적일 수 있다.
바실러스 종 세포에서 유전자, 이의 오픈 리딩 프레임(ORF) 및/또는 이의 변이체 서열의 발현에 사용하기에 적합한 원핵생물 프로모터(원핵생물 세포에서 기능적인 프로모터) 및 프로모터 서열 영역의 비제한적인 예는 일반적으로 당업자에 알려져 있다. 본 개시내용의 프로모터 서열은 일반적으로 바실러스 종 세포(예를 들어, B. 리케니포르미스 세포, B. 서브틸리스 세포 등)에서 기능적이 되도록 선택된다. 마찬가지로, 바실러스 종 세포에서 유전자 발현을 유도하는 데 유용한 프로모터로는 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 xylAxylB 유전자의 프로모터, 바실러스 서브틸리스 알칼라인 프로테아제(aprE) 프로모터(문헌[Stahl et al., 1984]), 바실러스 서브틸리스의 α-아밀라아제 프로모터(문헌[Yang et al., 1983]), 바실러스 아밀로리쿼파시엔스의 α-아밀라아제 프로모터(문헌[Tarkinen et al., 1983]), 바실러스 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(문헌[Yang et al., 1984]), 돌연변이 aprE 프로모터(PCT 공개공보 제WO2001/51643호), 또는 바실러스 리케니포르미스 또는 기타 관련된 바실러스로부터의 임의의 기타 프로모터를 들 수 있지만, 이에 제한되지 않는다. 기타 특정 구현예에서, 프로모터는 미국 특허 공개공보 제2014/0329309호에 개시되어 있는 리보좀 단백질 프로모터 또는 리보솜 RNA 프로모터(예를 들어, rrnI 프로모터)이다. spac와 같은 합성 프로모터는 기타 보조 인자에 따라 구성적이거나 유도성일 수 있다. n25, 람다 pL 또는 pR과 같은 파지 프로모터는 동일한 방식으로 구성적이거나 유도성일 수 있다. 바실러스 종 세포에서 광범위한 활성(프로모터 강도)을 갖는 프로모터 라이브러리를 선별 및 생성하기 위한 방법은 PCT 공개공보 제WO2003/089604호에 기술되어 있다.
바실러스 종에서 기능적인 구성적 프로모터로는 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 알칼라인 프로테아제(aprE)의 프로모터, 바실러스 서브틸리스의 α-아밀라아제 프로모터(문헌[Yang et al., 1983]), 바실러스 아밀로리쿼파시엔스의 α-아밀라아제 프로모터(문헌[Tarkinen et al., 1983]), 바실러스 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(문헌[Yang et al., 1984])를 들 수 있지만, 이에 제한되지 않는다.
하나의 양태에서, 공여 DNA는 바실러스 종 게놈 내에 통합될 재조합 DNA를 포함한다.
본원에서 사용된 바와 같이, "재조합"은 예를 들어 화학적 합성에 의한, 또는 유전자 조작 기술에 의한 단리된 핵산 분절의 조작에 의한, 분리되었을 2개의 서열 분절의 인공 조합을 지칭한다. "재조합"이란 용어는, 생물학적 성분 또는 조성물(예를 들어, 세포, 핵산, 폴리펩타이드/효소, 벡터 등)을 참조하여 사용되는 경우, 생물학적 성분 또는 조성물이 자연에서 발견되지 않는 상태로 있음을 나타낸다. 다시 말해, 생물학적 성분 또는 조성물은 인간의 개입에 의해 이의 자연 상태로부터 변형되었다. 예를 들어, 재조합 세포는 이의 자연적(즉, 비-재조합) 세포에서는 발견되지 않는 하나 이상의 유전자를 발현하는 세포, 하나 이상의 자연적 유전자를 이의 자연적 세포와는 상이한 양으로 발현하는 세포, 및/또는 하나 이상의 자연적 유전자를 이의 자연적 세포와는 상이한 조건 하에 발현하는 세포를 포함한다. 재조합 핵산은 하나 이상의 뉴클레오타이드에 의해 자연적 서열과 다를 수 있고/있거나, 이종성 서열(예를 들어, 이종성 프로모터, 비자연적 또는 변이체 신호 서열을 암호화하는 서열 등)에 작동 가능하게 연결될 수 있고/있거나, 인트론 서열이 없을 수 있고/있거나, 단리된 형태로 있을 수 있다. 재조합 폴리펩타이드/효소는 하나 이상의 아미노산에 의해 자연적 서열과 상이할 수 있고/있거나, 이종성 서열과 융합될 수 있고/있거나, 절두될 수 있거나 아미노산의 내부 결실을 가질 수 있고/있거나, 자연적 세포에서 발견되지 않는 방식으로 (예를 들어, 폴리펩타이드를 암호화하는 발현 벡터의 세포 상에 존재하므로 폴리펩타이드를 과발현시키는 재조합 세포로부터) 발현될 수 있고/있거나, 단리된 형태로 있을 수 있다. 일부 구현예에서, 재조합 폴리뉴클레오타이드 또는 폴리펩타이드/효소는 이의 야생형 대응물과 동일하지만, 비자연적 형태(예를 들어, 단리되거나 농후화된 형태)로 있는 서열을 갖는다는 것이 강조된다.
본원에서 사용된 바와 같이, "재조합 DNA"는 핵산 단편의 인공 조합을 포함하는 적어도 하나의 발현 카세트를 포함하는 DNA 서열을 지칭한다. 재조합 DNA는 본원에 개시되어 있는 바와 같은 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다. 예를 들어, 재조합 DNA는 상이한 공급원으로부터 유래하는 조절 서열 및 암호화 서열을 포함할 수 있다.
본원에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기법은 당해 분야에 널리 알려져 있고, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 보다 자세히 기술되어 있다.
선별 가능한 마커 표현형을 사용하지 않고 변경된 게놈을 갖는 이들 세포를 확인하기 위해 다양한 방법이 이용 가능하다. PCR 방법, 서열분석 방법, 뉴클레아제 소화(digestion), 서던 블롯(Southern blot) 및 이들의 임의의 조합을 포함하지만 이에 제한되지 않는 이 같은 방법은 표적 서열을 직접 분석하여 게놈 서열에서의 임의의 변화를 검출하는 것으로 볼 수 있다.
수용능 바실러스 종에서의 효율적인 게놈 변형을 위해 적어도 900개의 뉴클레오타이드의 길이를 갖는 긴 상동성 아암을 포함하는 선형 DNA 작제물의 용도
본 개시내용은 선택 가능한 마커의 사용 또는 통합 없이 그리고 Cas 엔도뉴클레아제의 사용 또는 통합 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법을 포함한다.
임의의 특정 이론, 기작 또는 작용 모드에 제한되지 않지만, 놀랍고도 예상치 못하게도, 본 출원인은 긴 상동성 아암(각각의 상동성 아암은 적어도 900개의 뉴클레오타이드를 가짐)을 포함하는 선형 DNA 작제물이 수용능 바실러스 종 세포 내로 도입되는 경우에 게놈 변형(예를 들어, 사용된 선형 DNA 작제물의 유형에 따라 공여 DNA 서열 통합, 유전자 결실, 돌연변이를 들 수 있지만, 이에 제한되지 않음)에서의 높은 효율이 관찰되며, 이때 도입 및 게놈 변형은 선택 가능한 마커 또는 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 발생한다는 것을 발견하였다.
본 개시내용은 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 그리고 상기 게놈 내로의 선택 가능한 마커의 통합 없이 공여 DNA를 포함하는 선형 DNA 작제물을 사용하여 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법 및 조성물을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않으며, 선택적으로는 이 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다.
본원에 기재되어 있는 바와 같이, 선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 시스템의 사용 없이 바실러스 종 세포의 게놈 내로 공여 DNA를 통합하는 것은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하는 선형 DNA 작제물을 수용능 바실러스 종 세포 내로 도입함으로써 높은 빈도로 발생할 수 있으며, 이때 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖는다.
본 개시내용은 바실러스 종 세포의 게놈에서 관심 유전자를 결실시키기 위한 방법을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대한 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
본 개시내용은 바실러스 종 세포의 게놈 내로 돌연변이(예를 들어, 점 돌연변이를 들 수 있지만, 이에 제한되지 않음)을 제공하기 위한 방법을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다. 하나의 구현예에서, 상기 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 돌연변이를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함한다. 하나의 양태에서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 바실러스 종 세포의 자연적 서열(변형 이전의 바실러스 종의 게놈 DNA 서열)과 비교하여 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함한다. 하나의 양태에서, 목적하는 돌연변이(염기 치환)을 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있다.
본 개시내용은 복수개의 유전자 발현 카세트를 도입하기 위한 방법을 포함한다. 효소 생산을 위한 바실러스 종 숙주의 개발에서의 장애물 중 하나는, 항생제 내성 마커(아암) 없이 염색체 내의 복수개의 효소 발현 카세트를 통합시키는 것이다. 통합 벡터, Cre/loxP 시스템 및 영양 요구성 마커의 사용과 같은 기존의 접근법은 시간 소모적이고, 편집 효율은 비교적 낮다.
본원에 기재되어 있는 방법은 상류 상동성 아암(HR1) 및 하류 아암(HR2)에 의해 플랭킹된 공여 DNA를 이용하여 복수개의 관심 유전자(관심 유전자 발현 카세트)에 대한 통합을 가능케 하여, 유전자 통합 효율을 높이며, 이때 각각의 상동성 아암은 적어도 900개 초과의 뉴클레오타이드의 길이를 갖는다.
복수개의 유전자 발현 카세트 또는 복수개의 발현 카세트는 본원에서 상호 교환 가능하게 사용되며, 적어도 하나의 관심 유전자를 포함하는 복수개의 동일한 발현 카세트를 지칭한다. 하나의 양태에서, 상기 유전자 발현 카세트의 복수개는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 및 최대 10개로 이루어진 군으로부터 선택된다.
정의
달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 조성물 및 방법이 적용되는 기술분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
"대립유전자" 또는 "대립유전자 변이체"는 염색체 상의 주어진 유전자위를 차지하고 있는 몇몇 대안적인 유전자 형태 중 하나이다. 염색체 상의 주어진 유전자위에 존재하는 모든 대립 유전자가 동일한 경우, 이 유기체는 이 유전자위에서 동형 접합성이다. 염색체 상의 주어진 유전자위에 존재하는 대립유전자가 상이한 경우, 이 유기체는 이 유전자위에서 이형 접합성이다. 폴리펩타이드의 대립유전자 변이체는 유전자의 대립유전자 변이체에 의해 암호화된 폴리펩타이드이다.
본원에서 사용된 바와 같이, "숙주 세포"는 새로 도입된 DNA 서열을 위한 숙주 또는 발현 비히클로서 작용하는 능력을 갖는 세포를 지칭한다. 따라서, 본 개시내용의 특정 구현예에서 숙주 세포는 바실러스 종 세포이다.
"재조합 숙주 세포"("유전자 변형된 숙주 세포"로도 지칭됨)는 이종성 핵산, 예를 들어 재조합 DNA 작제물이 도입되어 있거나, 본원에 기재되어 있는 가이드 RNA/Cas 엔도뉴클레아제 시스템과 같은 게놈 변형 시스템이 도입되어 있거나 이를 포함하는 숙주 세포이다. 예를 들어, 해당 박테리아 숙주 세포는 외인성 핵산(예를 들어, 플라스미드 또는 원형 재조합 DNA 작제물)의 적합한 바실러스 종 세포 내로의 도입에 의해 유전자 변형된 바실러스 종 세포를 포함한다.
본원에서 정의된 바와 같이, "모 세포" 또는 "모 (숙주) 세포"는 상호 교환 가능하게 사용될 수 있으며, "변형되지 않은" 모 세포를 지칭한다. 예를 들어, "모" 세포는 "모" 세포의 게놈이 (예를 들어, 모 세포 내로 도입된 하나 이상의 돌연변이/변형을 통해) 변경되어 이의 변형된 "딸"세포를 생성하는 임의의 미생물 세포 또는 균주를 지칭한다.
본원에서 사용된 바와 같이, "변형된 세포" 또는 "변형된 (숙주) 세포"는 상호 교환 가능하게 사용될 수 있으며, 변형된 세포가 유래하는 "모" 숙주 세포에 존재하지 않는 적어도 하나의 유전자 변형을 포함하는 재조합 (숙주) 세포를 지칭한다.
본원에서 사용된 바와 같이, "바실러스 속" 또는 "바실러스 종" 세포는, 바실러스 서브틸리스, 바실러스 리케니포르미스, 바실러스 렌투스, 바실러스 브레비스, 바실러스 스테아로써모필루스, 바실러스 알칼로필루스, 바실러스 아밀로리퀘파시엔스, 바실러스 클라우시, 바실러스 할로두란스, 바실러스 메가테리움, 바실러스 코아귤란스, 바실러스 서큘란스, 바실러스 라우투스 및 바실러스 투링기엔시스를 포함하지만 이에 제한되지 않는, 당업자에게 알려져 있는 바와 같은 "바실러스" 속 내의 모든 종을 포함한다. 바실러스 속은 계속해서 분류학적 개편을 겪고 이는 것으로 인식된다. 따라서, 이는, 이 속은 이제 "게오바실러스 스테아로써모필루스(GeoBacillus stearothermophilus)"로 지칭되는 B. 스테아로써모필루스와 같은 유기체를 포함하지만 이에 제한되지 않는, 재분류되어 있는 종을 포함시키기 위한 것이다.
본원에서 사용된 바와 같이, "수용능 바실러스 종 세포" 또는 "수용능 바실러스 종 균주로부터의 세포"는 상호 교환 가능하게 사용되며, 당해 기술분야에 알려져 있는 임의의 방법에 의해 수용능이 된 바실러스 종 세포를 지칭한다. 하나의 양태에서, 바실러스 종 세포는 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 된다(문헌[Dubnau D., 1991, Microbiological Reviews, Vol 55, No. 3, p. 395~424]; 문헌[Hamoen et al., 2003, Microbiology, 149, pg. 9~17]).
하나의 양태에서, 바실러스 종 세포는 자연 수용능, 인공 수용능 또는 유도 수용능을 통해 수용능이 된다(문헌[Dubnau D., 1991, Microbiological Reviews, Vol 55, No. 3, p. 395~424]; 문헌[Hamoen et al., 2003, Microbiology, 149, pg. 9~17]; 문헌[Jarmer Hanne et al. FEMS Microbiology Letters 206, pg. 197~200]).
하나의 양태에서, 비수용능 바실러스 종 세포를 수용능으로 만들기 위한 방법은 세포가 DNA의 흡수를 위해 더욱 수용능이 되도록 바실러스 종 세포에서의 ComS, ComS1, ComK 또는 이들 폴리펩타이드(또는 이들 폴리펩타이드를 암호화하는 유전자)의 임의의 조합의 도입 및 발현을 포함한다.
하나의 양태에서, 비수용능 바실러스 종 세포를 수용능으로 만들기 위한 방법은 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 유도성 프로모터를 포함하는 적어도 하나의 핵산 작제물을 비수용능 바실러스 종 세포 내로 도입하는 단계를 포함한다.
이 같은 유도성 프로모터의 예로는 xylAp; 말토오스, 만니톨 또는 아라비노오스와 같은 당에 의해 유도되는 프로모터; tetA 또는 spac 프로모터와 같은 소분자; ydhI 프로모터와 같은 온도 유도형 프로모터; 탠덤(tandem) 프로모터(WO99/043835 및 05/098016 참조)(바람직하게는, 탠덤 프로모터는 Pconsensus amyQ-PcryIIIA-cryIIIA 또는 PamyL4199-Pconsensus amyQ-PcryIIIA-cryIIIA임(PCT/US2007/088186 참조)); 또는 이의 임의의 하나의 조합을 들 수 있지만, 이에 제한되지 않는다.
본원에서 사용된 바와 같이, "초수용능 바실러스 종 세포" 또는 "초수용능 바실러스 종 균주로부터의 세포"는 상호 교환 가능하게 사용되며, 1% 초과의 세포 개체군이 바실러스 종의 염색체 DNA로 형질전환 가능한 수용능 바실러스 종 세포를 지칭한다. 대안적으로, 초수용능은 10% 초과의 세포 개체군이 자가 복제 바실러스 플라스미드로 형질전환 가능하다는 것을 의미한다. 바람직하게는, 초수용능 바실러스 종 세포는 야생형 또는 모 세포 개체군에 대해 관찰된 것보다 높은 속도로 형질전환될 것이다.
하나의 양태에서, 바실러스 종 세포는 ComK 폴리펩타이드(Pxyl-ComK)를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 크실로오스-유도성 프로모터(Pxyl)를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 초수용능이 되어, 초수용능 바실러스 종 Pxyl-ComK 균주를 생성한다.
하나의 양태에서, 초수용능 바실러스 종 균주는 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터(예를 들어, 유도성 프로모터를 들 수 있지만, 이에 제한되지 않음)를 포함하는 적어도 하나의 핵산 작제물을 바실러스 종 세포 내로 도입함으로써 초수용능이 되는 균주이다.
하나의 양태에서, 수용능 또는 초수용능 바실러스 종 균주는 바실러스 서브틸리스 168(BGSC1A1), spoIIAC, aprE, nprE 및 amyE 유전자의 결실을 갖는 바실러스 서브틸리스 168delta4, 바실러스 서브틸리스 A164delta5(상기와 같지만, srfAC USPTO 5891701의 추가적인 결실을 가짐), 바실러스 서브틸리스 MDT101(B. 리케니포르미스 SJ1904의 DNA 메틸트랜스페라아제를 발현함) 및 바실러스 리케니포르미스 SJ1904(USPTO 5733753)로 이루어진 군으로부터 선택된다.
본원에서 사용된 바와 같이, "증가된"이란 용어는 증가된 분량 또는 활성이 비교되는 분량 또는 활성보다 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100% 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 더 큰 분량 또는 활성을 지칭할 수 있다. "증가된", "더 높은" 및 "개선된"이란 용어는 본원에서 상호 교환 가능하게 사용된다. "증가된"이란 용어는 본원에 기재되어 있는 대조군 또는 기준 방법과 비교할 때 본원에 기재되어 있는 다성분 방법에 의해 수득된 형질전환 또는 유전자 편집 효율을 규명하기 위해 사용될 수 있다.
본원에서 사용된 바와 같이, "통합 효율"이란 용어는 이의 게놈 내에 통합된 목적하는 관심 유전자를 갖는 형질전환된 세포의 개수를 형질전환된 세포의 총 개수로 나눔으로써 정의된다. 이러한 개수는 100을 곱해서 "%"로서 나타낼 수 있다.
통합 효율(%) = (이의 게놈 내에 통합된 관심 유전자를 갖는 형질전환된 세포의 개수/형질전환된 세포의 총 개수) * 100
"보존된 도메인" 또는 "모티프"란 용어는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 기타 위치에서의 아미노산은 상동성 단백질 사이에 변경될 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체의 패밀리의 정렬된 서열에서 이들의 높은 보존 정도에 의해 확인되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 확인된 단백질 패밀리에 속하는지를 결정하기 위한 식별자 또는 "서명"으로 사용될 수 있다.
본원에서 사용된 바와 같이, "핵산"은 폴리뉴클레오타이드를 의미하고, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 가닥 또는 이중 가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오타이드를 포함할 수 있다. 따라서, "폴리뉴클레오타이드", "핵산 서열", "뉴클레오타이드 서열" 및 "핵산 단편"이란 용어는 선택적으로 합성, 비천연 또는 변경된 뉴클레오타이드 염기를 함유하는 단일 가닥 또는 이중 가닥인 RNA 및/또는 DNA 및/또는 RNA-DNA의 중합체를 나타내기 위해 상호 교환 가능하게 사용된다. 뉴클레오타이드(보통 이의 5'-모노포스페이트 형태로 발견됨)는 하기와 같이 단일 문자 표시에 의해 지칭된다: 아데노신 또는 데옥시아데노신에 대해서(각각 RNA 또는 DNA에 있어서) "A", 시토신 또는 데옥시시토신에 대해서 "C", 구아노신 또는 데옥시구아노신에 대해서 "G", 우리딘에 대해서 "U", 데옥시티미딘에 대해서 "T", 퓨린(A 또는 G)에 대해서 "R", 피리미딘(C 또는 T)에 대해서 "Y", G 또는 T에 대해서 "K", A 또는 C 또는 T에 대해서 "H", 이노신에 대해서 "I", 및 임의의 뉴클레오타이드에 대해서 "N"(예를 들어, DNA 서열을 지칭하는 경우 N은 A, C, T 또는 G일 수 있고; RNA 서열을 지칭하는 경우 N은 A, C, U 또는 G일 수 있음).
본원에 기재되어 있는 폴리뉴클레오타이드(또는 핵산 분자)는 "유전자", "벡터" 및 "플라스미드"를 포함하는 것으로 이해된다.
"유전자"란 용어는, 단백질 암호화 서열의 전부 또는 일부를 포함하고 프로모터 서열과 같은 조절 서열(전사되지 않은 서열)을 포함할 수 있는 특정 아미노산 서열을 들 수 있지만 이에 제한되지 않는, 기능적인 분자를 암호화하는 폴리뉴클레오타이드를 지칭하며, 여기서 조절 서열은, 예를 들어 유전자가 발현되는 조건을 결정한다. 유전자의 전사된 영역은 비번역된 영역(UTR)(인트론을 포함함), 5'-비번역된 영역(UTR) 및 3'-UTR뿐만 아니라 암호화 서열을 포함할 수 있다. "자연적 유전자"는 그 자신의 조절 서열과 함께 자연에서 발견되는 바와 같은 유전자를 지칭한다.
"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 바람직한 코돈 사용의 빈도를 모방하도록 설계된 코돈 사용 빈도를 갖는 유전자이다. 유전자를 코돈 최적화하도록 이루어진 핵산 변경은 "동의어"이며, 이는 이들이 모 유전자의 암호화된 폴리펩타이드의 아미노산 서열을 변경시키지 않는다는 것을 의미한다. 그러나, 자연적 유전자 및 변이체 유전자 둘 모두는 특정 숙주 세포에 대해 코돈 최적화될 수 있으며, 이와 관련하여 이와 같은 제한은 의도된 것은 아니다. 코돈 선호 유전자를 합성하는 방법이 당해 기술분야에서 이용 가능하다. 예를 들어, 본원에 참조로 포함된 미국 특허 제5,380,831호 및 제5,436,391호, 및 문헌[Murray et al. (1989) Nucleic Acids Res. 17: 477~498]을 참고한다.
추가적인 서열 변형은 숙주 유기체에서의 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은, 예를 들어 의사 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 트랜스포존-유사 반복부, 및 유전자 발현에 유해할 수 있는 이 같은 기타 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은, 숙주 세포에서 발현되는 알려진 유전자를 참조하여 계산할 때, 주어진 숙주 유기체에 대해 평균 수준으로 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
본원에서 사용된 바와 같이, "암호화 서열"이란 용어는 이의 (암호화된) 단백질 산물의 아미노산 서열을 직접 나타낸 뉴클레오타이드 서열을 지칭한다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임(이하 "ORF"로 지칭됨)에 의해 결정되며, 이는 흔히 ATG 시작 코돈으로 시작한다. 암호화 서열은 전형적으로 DNA, cDNA 및 재조합 뉴클레오타이드 서열을 포함한다.
본원에서 정의된 바와 같이, "오픈 리딩 프레임"(이하 "ORF"로 지칭됨)이란 용어는 (i) 개시 코돈, (ii) 아미노산을 나타내는 일련의 2개 이상의 코돈, 및 (iii) 종결 코돈으로 이루어진 중단되지 않은 리딩 프레임을 포함하는 핵산 또는 핵산 서열(자연적으로 발생한 것, 비자연적으로 발생한 것, 또는 합성된 것)을 의미하며, 이때 ORF는 5'에서 3' 방향으로 리딩(또는 번역)된다.
본원에서 사용된 바와 같은 "염색체 통합"이란 용어는 관심 폴리뉴클레오타이드가 바실러스 종의 염색체 내에 통합되는 과정을 지칭한다. 선형 공여 DNA 작제물의 상동성 아암(상동성 아암에 의해 플랭킹된 선형 공여 DNA)은 바실러스 종 염색체의 상동성 영역과 정렬될 것이다. 후속적으로, 이들 상동성 아암 사이의 서열은 이중 교차(즉, 상동성 재조합)로 관심 폴리뉴클레오타이드에 의해 대체된다.
"조절 서열"은 암호화 서열의 상류(5' 비암호화 서열), 내부 또는 하류(3' 비암호화 서열)에 위치하며, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 비번역 서열, 3' 비번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함하지만, 이에 제한되지 않는다.
본원에서 사용된 바와 같이, "프로모터"란 용어는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 그 전체가 자연적 유전자로부터 유래할 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래하는 상이한 요소들로 구성될 수 있거나, 심지어 합성 핵산 분절을 포함할 수 있다. 당업자라면 상이한 프로모터가 상이한 세포 유형으로, 또는 상이한 발달 단계에서, 또는 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 유도할 수 있다는 것을 이해한다. 대부분의 경우 유전자가 대부분의 세포 유형에서 발현되도록 하는 프로모터는 흔히 "구성적 프로모터"로서 지칭된다. 대부분의 경우에 조절 서열의 정확한 경계가 완전하게 정의되지 않았기 때문에 상이한 길이를 갖는 DNA 단편은 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
"작동 가능하게 연결된"은 2개 이상의 요소들 사이의 기능적 연결을 의미하도록 의도된다. 예를 들어, 관심 폴리뉴클레오타이드와 조절 서열(예를 들어, 프로모터) 사이의 작동 가능한 연결은 관심 폴리뉴클레오타이드의 발현을 허용하는 기능적 연결이다(즉, 관심 폴리뉴클레오타이드는 프로모터의 전사적 제어 하에 있음). 작동 가능하게 연결된 요소는 연속적 또는 불연속적일 수 있다. 암호화 서열(예를 들어, ORF)은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 2개의 단백질 암호화 영역의 연결을 지칭하도록 사용될 때, 작동 가능하게 연결되었다는 것은 암호화 영역이 동일한 리딩 프레임 내에 있는 것으로 의도된다.
핵산은 다른 핵산 서열과의 기능적 관계가 이루어지는 경우에 "작동 가능하게 연결된 것이다". 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA는 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우에 폴리펩타이드를 위한 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위는 번역을 용이하게 하기 위해 위치하는 경우에 암호화 서열에 작동 가능하게 연결된다. 일반적으로, "작동 가능하게 연결된"은 연결되어 있는 DNA 서열이 연속적이며, 분비 리더의 경우에 연속적이며 리딩 단계에 있다는 것을 의미한다. 그러나, 인핸서는 연속적이어서는 안 된다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이 같은 부위가 존재하지 않으면 통상적인 관례에 따라 합성 올리고뉴클레오타이드 어댑터(adaptor) 또는 링커가 사용된다.
본원에서 사용된 바와 같이, "관심 유전자의 단백질 암호화 서열에 연결된 관심 유전자(또는 이의 오픈 리딩 프레임)의 발현을 제어하는 기능적인 프로모터 서열"은 바실러스에서 암호화 서열의 전사 및 번역을 제어하는 프로모터 서열을 지칭한다. 예를 들어, 특정 구현예에서 본 개시내용은 5' 프로모터(또는 5' 프로모터 영역 또는 탠덤 5' 프로모터 등)를 포함하는 폴리뉴클레오타이드에 관한 것으로, 프로모터 영역은 관심 단백질을 암호화하는 핵산 서열에 작동 가능하게 연결된다. 따라서, 특정 구현예에서 기능적인 프로모터 서열은 관심 단백질을 암호화하는 관심 유전자의 발현을 제어한다. 기타 구현예에서, 기능적인 프로모터 서열은 바실러스 종 세포에서 관심 단백질을 암호화하는 내인성 유전자 또는 이종성 유전자의 발현의 제어한다.
프로모터 서열은 근위 상류 요소 및 더 원위의 상류 요소로 이루어지며, 이때 후자 요소는 종종 인핸서로서 지칭된다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다.
본원에 개시되어 있는 선형 재조합 DNA 및 원형 재조합 DNA는 당해 기술분야에 알려져 있는 임의의 방법을 이용하여 바실러스 종 세포 내로 도입될 수 있다.
본원에서 정의된 바와 같이, 적어도 하나의 선형 DNA 작제물, 폴리뉴클레오타이드, 또는 이의 유전자 또는 이의 벡터를 "박테리아 세포 내로 도입하기" 또는 "바실러스 종 세포 내로 도입하기"와 같은 문구에서 사용되는 바와 같은 "도입"이란 용어는 수용능 바실러스 종 세포 내로 DNA 작제물을 도입하기 위해 당해 기술분야에 알려져 있는 방법을 포함하며, 이때 이 방법은 바실러스 종 세포 내로 도입될 선형 DNA 작제물을 수용능 바실러스 종의 세포 개체군과 혼합하는 단계를 포함하지만, 이에 제한되지 않는다.
"도입"은, 성분(들)이 유기체 세포의 내부에 또는 세포 자체에 접근하는 방식으로 본원에 개시되어 있는 유기체(예를 들어, 세포 또는 유기체), 선형 DNA 작제물로의 제시를 의미하는 것으로 의도된다. 이 방법 및 조성물은, 본원에 개시되어 있는 선형 DNA 작제물이 유기체의 적어도 하나의 세포의 내부에 접근하는 한 유기체 또는 세포 내로 서열을 도입하기 위한 특정 방법에 의존하지 않는다. 도입은 핵산이 세포의 게놈 내에 혼입(통합)될 수 있는 수용능 바실러스 종 세포 내로의 핵산의 혼입에 대한 언급을 포함하며, 핵산의 세포로의 일시적인(직접적인) 제공에 대한 언급을 포함한다.
안정한 형질전환은 유기체 내로 도입된 뉴클레오타이드 작제물이 유기체의 게놈 내에 통합되며 이의 자손에 의해 유전될 수 있음을 의미하도록 의도된다. 일시적인 형질전환은 폴리뉴클레오타이드가 (직접적 또는 간접적으로) 유기체 내로 도입되고 유기체의 게놈으로 통합되지 않거나, 폴리펩타이드가 유기체로 도입된다는 것을 의미하도록 의도된다. 일시적인 형질전환은 도입된 조성물이 단지 유기체에서 일시적으로 발현되거나 존재한다는 것을 나타낸다.
바실러스 종 세포의 게놈의 변형 및/또는 그 내부로의 삽입을 갖는 이들 세포를 식별하기 위한 다양한 방법이 이용 가능하다. 목적하는 관심 변형을 갖는 형질전환된 세포의 식별은 당업자에게 알려져 있는 임의의 방법에 의해 확인될 수 있다. 예를 들어, 본원에 기재되어 있는 방법에 의해 수득된 이들의 게놈 내에 변형을 갖는 바실러스 종 세포의 식별은 당해 기술분야에 알려져 있는 임의의 표현형 또는 유전자형 스크린에 의해 식별될 수 있다. 선별 가능한 표현형은 탈지유를 함유하는 LB 한천 상에서 성장하는 콜로니 주변의 광륜(halo)의 존재가 바실러스 종 세포의 게놈 내로의 발현 카세트의 통합(본원의 실시예에 기술되어 있는 바와 같음)을 나타내는 표현형 스크린, 항미생물 민감성 스크린, 지시약(indicator)의 색깔 변화를 초래하는 한천에서의 트리글리세리드의 가수분해를 초래하는 발현 카세트의 통합, 색깔 변화를 초래하는 지시약 기질의 가수분해를 초래하는 발현 카세트의 통합, 콜로니 표현형에 영향을 미쳐서 콜로니 형태에서의 차이가 게놈 변형으로서 사용될 수 있는 유전자의 결실, 형광 단백질의 발현을 야기하는 발현 카세트의 통합, 또는 이의 임의의 하나의 조합을 포함한다.
선별 가능한 유전자형 방법은 형질전환된 바실러스 종 세포의 게놈 서열을 결정하기 위한 방법을 포함한다. 이 같은 방법은 게놈 뉴클레오타이드 서열에서의 임의의 변화를 검출하기 위해 게놈 서열을 직접 분석하는 것으로 간주될 수 있으며, 이는 PCR 방법, 서열분석 방법, 뉴클레아제 소화, 서던 블롯 및 이들의 임의의 조합을 포함하지만, 이에 제한되지 않는다. 예를 들어, 본원에 기재되어 있는 방법을 위해 필요한 정도로 본원에 참조로 포함된 미국 특허 출원 제12/147,834호를 참고한다. 이 방법은 또한 이의 게놈 내에 통합된 관심 폴리뉴클레오타이드를 포함하는 세포로부터 유기체를 회수하는 단계를 포함한다.
"게놈", 박테리아 (숙주) 세포 "게놈" 또는 바실러스 (숙주) 세포 "게놈"이란 용어는 핵 내에서 발견되는 염색체 DNA뿐만 아니라 세포의 세포이하 성분(염색체 외 DNA) 내에서 발견되는 세포소기관 DNA를 포함한다.
본원에서 사용된 바와 같이, "플라스미드", "벡터" 및 "카세트"란 용어는 종종 전형적으로는 세포의 중심 대사의 일부가 아니며, 보통 이중 가닥 DNA 분자의 형태인 유전자를 보유하는 염색체 외 요소를 지칭한다. 이 같은 요소는 임의의 공급원으로부터 유래하는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열(선형 또는 원형임)일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 적절한 3' 비번역된 서열과 함께 선택된 유전자 산물을 위한 프로모터 단편 및 DNA 서열을 세포 내로 도입할 수 있는 고유의 제작물에 연결되거나 재조합된다.
"벡터"란 용어는 세포 내에서 복제(번식)할 수 있는 임의의 핵산을 포함하며, 새로운 유전자 또는 DNA 분절을 세포 내로 전달할 수 있다. 벡터는 바이러스, 박테리오파지, 프로바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체(예를 들어, BAC(박테리아 인공 염색체)) 등을 포함하며, 이들은 "에피솜"(즉, 숙주 유기체의 염색체를 자체적으로 복제하거나 상기 염색체 내에 통합시킬 수 있음)이다.
"발현 카세트" 및 "발현 벡터"란 용어는, 세포에서 특정 핵산의 전사를 허용하는 일련의 특정 핵산 요소를 갖는, 재조합 또는 합성에 의해 생성된 핵산 작제물을 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편 내에 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 일부는 기타 서열들 중에서 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포 내에 특정 핵산의 전사를 허용하는 일련의 특정 핵산 요소를 포함한다. 특정 구현예에서, 본 개시내용의 DNA 작제물은 본원에서 정의된 바와 같은 선택 마커 및 불활성화 염색체 또는 유전자 또는 DNA 분절을 포함한다. 다수의 원핵생물 발현 벡터는 상업적으로 구입 가능하며, 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에서 이루어진다.
본원에서 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환된 숙주 세포의 염색체 내의 영역과 상동성이고 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터의 용도는 상동성 재조합을 통해 돌연변이를 숙주 세포의 염색체 내로 도입하는 것이다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단(즉, 스터퍼(stuffer) 서열 또는 플랭킹 서열)에 첨가된 기타 비상동성 서열을 포함한다. 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 닫힌 원을 형성하도록 닫혀있을 수 있다. 적절한 벡터의 선택 및/또는 제작은 당업자의 지식 내에서 충분히 이루어진다.
본원에서 사용된 바와 같이, "플라스미드"란 용어는 클로닝 벡터로서 사용되고 다수의 박테리아 및 일부 진핵생물에서 염색체 외의 자가 복제 유전 요소를 형성하는 원형의 이중 가닥(ds) DNA 작제물을 지칭한다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈 내에 혼입되어 있다.
관심 폴리뉴클레오타이드는 본원에 추가로 기재되어 있으며, 효소의 생산(예를 들어, 비제한적인 예로서 박테리아를 발효하여 효소를 생성하는 것을 통해)에 관여된 것의 상업 시장 및 관심을 반영하는 폴리뉴클레오타이드를 포함한다.
관심 폴리뉴클레오타이드는 하나 이상의 관심 단백질을 암호화할 수 있다. 이는 기타 생물학적 기능을 가질 수 있다. 관심 폴리뉴클레오타이드는 형질전환될 바실러스 종 세포의 게놈, 즉 상동성 또는 이종성 서열 내에 이미 존재하거나 존재하지 않을 수 있다.
관심 뉴클레오타이드는 표적화된 관심 유전자 서열에 대한 메신저 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수 있다. 안티센스 뉴클레오타이드는 상응하는 mRNA와 혼성화하도록 제작된다. 서열이 상응하는 mRNA와 혼성화하여 이의 발현을 간섭하는 한 안티센스 서열의 변형은 이루어질 수 있다. 이러한 방식으로, 상응하는 안티센스 서열에 대해 70%, 80%, 또는 85%의 서열 동일성을 갖는 안티센스 제작물이 사용될 수 있다. 더욱이, 안티센스 뉴클레오타이드의 일부는 표적 유전자의 발현을 방해하기 위해 사용될 수 있다. 일반적으로, 적어도 50개의 뉴클레오타이드, 100개의 뉴클레오타이드, 200개의 뉴클레오타이드 또는 그 이상의 뉴클레오타이드의 서열이 사용될 수 있다.
또한, 유기체 내의 내인성 유전자의 발현을 억제하기 위해 관심 폴리뉴클레오타이드가 또한 센스 배향으로 사용될 수 있다. 폴리뉴클레오타이드를 센스 배향으로 사용하여 유기체에서의 유전자 발현을 억제하기 위한 방법이 당해 기술분야에 알려져 있다. 이 방법은 일반적으로 내인성 유전자의 전사체에 상응하는 뉴클레오타이드 서열의 적어도 일부에 작동 가능하게 연결된 유기체에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 유기체를 형질전환시키는 단계를 수반한다. 전형적으로, 이 같은 뉴클레오타이드 서열은 내인성 유전자의 전사체의 서열에 대해 상당한 서열 동일성, 일반적으로 약 65% 초과의 서열 동일성, 약 85%의 서열 동일성, 약 95% 초과의 서열 동일성을 갖는다. 본원에 참조로 포함된 미국 특허 5,283,184호 및 5,034,323호를 참고한다.
표현형 마커는, 시각적 마커 및 선택 가능한 마커(그것이 양성의 선택 가능한 마커든 음성의 선택 가능한 마커든)를 포함하는, 선별 가능하거나 선택 가능한 마커이다. 임의의 표현형 마커가 사용될 수 있다. 구체적으로, 선택 가능하거나 선별 가능한 마커는 종종 특정 조건 하에 이를 포함하는 분자 또는 세포를 식별하거나, 이를 선택하거나, 이에 반하여 선택할 수 있도록 하는 DNA 분절을 포함한다. 이들 마커는 RNA, 펩타이드 또는 단백질의 생성(이에 제한되지 않음)과 같은 활성을 암호화할 수 있거나, RNA, 펩타이드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다.
"선택 가능한 마커" 및 "선택 가능한 마커 암호화 뉴클레오타이드 서열"이란 용어는 (숙주) 세포 내에서 발현할 수 있으며, 선택 가능한 마커의 발현이 상응하는 선택제의 존재 하에 또는 필수 영양소의 결핍 하에 성장하는 능력을 발현된 유전자를 함유하는 세포에 부여하는 뉴클레오타이드 서열을 지칭한다. 하나의 양태에서, 선택 마커는 벡터를 함유하는 이들 숙주의 용이한 선택을 가능케 하는, 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이 같은 선택 가능한 마커의 예로는 항균제를 들 수 있지만, 이에 제한되지 않는다.
"선택 가능한 마커"이란 용어는 숙주 세포가 유입되는 관심 DNA을 흡수하거나 일부 기타 반응이 일어났다는 암시를 제공하는 유전자를 포함한다. 전형적으로, 선택 가능한 마커는, 외인성 DNA를 함유하는 세포가 형질전환 동안에 임의의 외인성 서열을 수용하지 않은 세포와 구별되도록 하기 위해 숙주 세포에 대한 항미생물 내성 또는 대사적 이점을 부여하는 유전자이다.
"상주하는 선택 가능한 마커"는 형질전환될 미생물의 염색체 상에 위치하는 것이다. 상주하는 선택 가능한 마커는 형질전환용 DNA 작제물 상의 선택 가능한 마커와는 상이한 유전자를 암호화한다. 선택 마커는 당업자에게 잘 알려져 있다. 상기에 나타나 있는 바와 같이, 마커는 항미생물 내성 마커(예를 들어, ampR, phleoR, specR, kanR, eryR, tetR, cmpR 및 neoR)일 수 있다(예를 들어, 문헌[Guerot-Fleury, 1995; Palmeros et al., 2000]; 및 문헌[Trieu-Cuot et al., 1983] 참조). 일부 구현예에서, 본 발명은 클로람페니콜 내성 유전자(예를 들어, pC194 상에 존재하는 유전자뿐만 아니라, 바실러스 리케니포르미스 게놈에 존재하는 내성 유전자)를 제공한다. 이러한 내성 유전자는 본 발명뿐만 아니라, 염색체 통합형 카세트 및 편입형 플라스미드의 염색체 증폭을 수반하는 구현예에 특히 유용하다(예를 들어, 문헌[Albertini and Galizzi, 1985]; 문헌[Stahl and Ferrari, 1984] 참조). 본 발명에 따라 유용한 기타 마커로는 영양 요구성 마커(예를 들어, 세린, 리신, 트립토판); 및 검출 마커(예를 들어, β-갈락토시다아제)를 들 수 있지만, 이에 제한되지 않는다.
관심 폴리뉴클레오타이드는 기타 형질(trait)과 조합하여 스태킹되거나 사용될 수 있는 유전자를 포함한다.
본원에서 사용된 바와 같이, "폴리펩타이드" 및 "단백질"이란 용어는 사용 교환 가능하게 사용되며, 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는, 임의의 길이의 중합체를 지칭한다. 본원에서는 아미노산 잔기에 대한 통상적인 1-문자 또는 3-문자 코드가 사용된다. 폴리펩타이드는 선형 또는 분지형일 수 있으며, 이는 변형된 아미노산을 포함할 수 있고, 이는 비-아미노산에 의해 중단될 수 있다. 폴리펩타이드란 용어는 또한 자연적으로 변형되거나 개입, 예를 들어 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 임의의 기타 조작 또는 변형(예를 들어, 표지 성분과의 접합)에 의해 변형되어 있는 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등)뿐만 아니라, 당해 기술분야에 알려져 있는 기타 변형을 함유하는 폴리펩타이드가 상기 정의 내에 또한 포함된다.
"관심 단백질" 또는 "POI"란 용어는 변형된 바실러스 (딸)세포에서 발현되어야 하는 관심 폴리펩타이드를 지칭한다. 따라서, 본원에서 사용된 바와 같이 POI는 효소, 기질-결합 단백질, 표면 활성 단백질, 구조 단백질, 수용체 단백질, 항체 등일 수 있다.
본원에서 사용된 바와 같이, "관심 유전자" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예를 들어, 폴리뉴클레오타이드, 유전자 또는 ORF)을 지칭한다. "관심 단백질"을 암호화하는 "관심 유전자"는 자연적으로 발생하는 유전자, 돌연변이된 유전자 또는 합성 유전자일 수 있다.
특정 구현예에서, 본 개시내용의 관심 유전자는 상업적으로 관련이 있는 산업용 관심 단백질, 예를 들어 효소(예를 들어, 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산 탈수효소, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 카이모신, 큐티나아제, 데옥시리보뉴클레아제, 에피메라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코신 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소메라아제, 라카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 산화/환원 효소, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 탈중합효소, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 파이타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스페라아제, 수송 단백질, 트랜스글루타미나아제, 자일라아제, 헥소오스 옥시다아제 및 이들의 조합)를 암호화한다.
"돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 지칭한다. 점 돌연변이, 결실 돌연변이, 침묵 돌연변이, 프레임이동 돌연변이, 스플라이싱 돌연변이 등을 포함하는 일부 유형의 돌연변이가 존재한다. 돌연변이는 (예를 들어, 부위 지향적 돌연변이 유발을 통해) 특이적으로, 또는 (예를 들어, 화학 작용제, 복구 마이너스(repair minus) 박테리아 균주를 통한 계대배양(passage)을 통해) 무작위로 이루어질 수 있다.
본원에 기재되어 있는 "점 돌연변이"는 유전자 서열 내의 오직 하나 또는 극 소수의 뉴클레오타이드에 영향을 미치는 돌연변이를 지칭한다. 점 돌연변이는 가장 흔하게는 하나의 염기의 다른 염기로의 치환을 수반한다(이는 DNA 내에서뿐만 아니라 상보적인 염기를 변경함). 점 돌연변이란 용어는 또한 단일 염기 쌍의 삽입 또는 결실을 포함한다. 점 돌연변이 또는 치환은 DNA 또는 RNA의 서열로부터 단일 뉴클레오타이드 염기가 변경, 삽입 또는 결실되는 유전자 돌연변이를 포함한다.
수용능 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이 본원에 기재되어 있다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다. 하나의 구현예에서, 상기 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 돌연변이를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다. 하나의 양태에서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 바실러스 종 세포의 자연적 서열(변형 이전의 바실러스 종의 게놈 DNA 서열)과 비교하여 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함한다. 하나의 양태에서, 목적하는 돌연변이(염기 치환)를 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있다.
본 개시내용의 하나의 양태에서, 공여 DNA는 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고, 하나는 3' 하류 아암인 HR2임)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함한다. 이러한 공여 작제물이 세포 내로 도입되면, 원래의 게놈 서열의 돌연변이를 초래하는 상동성 재조합이 발생할 수 있다.
"돌연변이된 유전자"는 인간 개입을 통해 변경된 유전자이다. 이 같은 "돌연변이된 유전자"는 적어도 하나의 뉴클레오타이드의 부가, 결실 또는 치환에 의해 돌연변이되지 않은 상응하는 유전자의 서열과는 상이한 서열을 갖는다. 본 개시내용의 특정 구현예에서, 돌연변이된 유전자는 본원에 개시되어 있는 바와 같은 방법에서 기인하는 변경을 포함한다. 돌연변이된 세포 또는 유기체는 돌연변이된 유전자를 포함하는 세포 또는 유기체이다.
본원에서 사용된 바와 같이, 폴리펩타이드 또는 이의 서열의 문맥에서, "치환"이란 용어는 하나의 아미노산을 다른 아미노산으로 대체(즉, 치환)하는 것을 의미한다.
본원에서 정의된 바와 같이, "내인성 유전자"는 유기체의 게놈 내의 이의 천연 위치에 있는 유전자를 지칭한다.
본원에서 사용된 바와 같이, 폴리뉴클레오타이드 또는 폴리펩타이드 서열과 관련하여 "이종성"은 외래 종으로부터 기원하는 서열이거나, 동일한 종으로부터 유래하는 경우 의도적인 인간 개입에 의해 조성물에서의 이의 자연적인 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형된다. 예를 들어, 이종성 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터는 폴리뉴클레오타이드가 유래하는 종과 상이한 종에서 기원되거나, 동일한/유사한 종에서 유래하는 경우 하나 또는 둘 모두는 이들의 원래의 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형되거나, 프로모터는 작동 가능하게 연결된 폴리뉴클레오타이드에 있어 자연적인 프로모터가 아니다. 본원에서 사용된 바와 같이, 달리 기재되지 않는 한, 키메라 폴리뉴클레오타이드는 암호화 서열에 이종성인 전사 개시 영역에 작동 가능하게 연결된 암호화 서열을 포함한다.
본원에서 정의된 바와 같이, "이종성" 유전자, "비내인성" 유전자 또는 "외래" 유전자는 정상적으로는 숙주 유기체에서 발견되지 않지만 유전자 전달에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 지칭한다. 본원에서 사용된 바와 같이, "외래" 유전자(들)란 용어는 비자연적 유기체 내에 삽입된 자연적 유전자(또는 ORF) 및/또는 자연적 또는 비자연적 유기체 내에 삽입된 키메라 유전자를 포함한다.
본원에서 정의된 바와 같이, "이종성" 핵산 작제물 또는 "이종성" 핵산 서열은 이것이 발현되는 세포에 자연적이지 않은 서열의 일부를 갖는다.
본원에서 정의된 바와 같이, "이종성 제어 서열"은 관심 유전자의 발현을 조절(제어)하는데 자연에서 기능을 하지 못하는 유전자 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 지칭한다. 일반적으로, 이종성 핵산 서열은 세포에 내인성(자연적)이 아니거나, 이들이 존재하는 게놈의 일부이며, 감염, 형질감염, 형질전환, 마이크로주사, 전기천공 등에 의해 세포에 부가되었다. "이종성" 핵산 작제물은 자연적 숙주 세포에서 발견되는 제어 서열/DNA 암호화 서열 조합과 동일하거나 상이한 제어 서열/DNA 암호화 (ORF) 서열 조합을 함유할 수 있다.
본원에서 사용된 바와 같이, "신호 서열" 및 "신호 펩타이드"란 용어는 성숙한 단백질 또는 전구체 형태의 단백질의 분비 또는 직접적인 수송에 참여할 수 있는 아미노산 잔기의 서열을 지칭한다. 신호 서열은 전형적으로 전구체 또는 성숙한 단백질 서열에 대해 N 말단에 위치한다. 신호 서열은 내인성 또는 외인성일 수 있다. 신호 서열은 정상적으로는 성숙한 단백질에는 결여되어 있다. 신호 서열은 전형적으로 단백질이 수송된 이후에 신호 펩티다아제에 의해 단백질로부터 개열된다.
"유래하는"이란 용어는 "기원하는", "수득된", "수득 가능한" 및 "생성된"이란 용어를 포함하고, 일반적으로 하나의 특정 재료 또는 조성물이 다른 특정 재료 또는 조성물에서 그 기원을 찾거나, 다른 특정 재료 또는 조성물을 참고하여 기술될 수 있는 특징을 갖는다는 것을 나타낸다.
본원에서 사용된 바와 같이, "플랭킹 서열"은 토의 중인 서열의 상류 또는 하류에 있는 임의의 서열을 지칭한다(예를 들어, A-B-C 유전자의 경우에 유전자 B는 A 및 C 유전자 서열에 의해 플랭킹됨). 특정 구현예에서, 유입 서열은 각각의 측면 상에서 상동성 아암에 의해 플랭킹된다. 일부 구현예에서, 플랭킹 서열은 하나의 측면(3' 또는 5') 상에만 존재하는 반면, 기타 구현예에서 이는 플랭킹된 서열의 각각의 측면 상에 존재한다. 각각의 상동성 아암의 서열은 바실러스 종 게놈(예를 들어, 바실러스 염색체) 내의 서열과 상동성이다.
본원에서 사용된 바와 같이, "스터퍼 서열"이란 용어는 상동성 아암(전형적으로 벡터 서열)에 플랭킹하는 임의의 추가 DNA를 지칭한다. 그러나, 이 용어는 임의의 비상동성 DNA 서열을 포함한다. 임의의 이론에 제한되지 않지만, 스터퍼 서열은 세포가 DNA 흡수를 개시하기 위한 중요하지 않은 표적을 제공한다.
핵산 또는 폴리펩타이드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은 특정 비교 창에 걸쳐 최대 관련성(correspondence)을 위해 정렬되는 경우에 동일한 2개의 서열 내의 핵산 염기 또는 아미노산 잔기를 지칭한다.
"서열 동일성(%)"이란 용어는 비교 창에 걸쳐 최적으로 정렬된 2개의 서열을 비교함으로써 결정된 값을 지칭하며, 이때 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개의 서열의 최적 정렬을 위한 기준 서열(부가 또는 결실을 포함하지 않음)과 비교할 때 부가 또는 결실(즉, 갭)을 포함할 수 있다. 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 모두에서 나타나는 위치의 개수를 결정하여 일치된 위치의 개수를 산출하고, 일치된 위치의 개수를 비교 창 내의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성(%)을 수득함으로써 백분율(%)을 계산한다. 서열 동일성(%)의 유용한 예로는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 들 수 있지만, 이에 제한되지 않는다. 이들 동일성은 본원에 기재되어 있는 프로그램 중 임의의 것을 사용하여 결정될 수 있다.
서열 정렬 및 동일성 또는 유사성(%)의 계산은 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM 프로그램을 포함하지만 이에 제한되지 않는, 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초하는 것으로 이해될 것이다. 본원에서 사용된 바와 같이, "디폴트 값"은 최초로 초기화되는 경우에 원래 소프트웨어로 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
"Clustal V 정렬 방법"은 Clustal V(문헌[Higgins and Sharp, (1989) CABIOS 5: 151~153]; 문헌[Higgins et al., (1992) Comput Appl Biosci 8: 189~191]에 기술되어 있음)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY = 10 및 GAP LENGTH PENALTY = 10에 해당한다. Clustal 방법을 사용하는 단백질 서열의 쌍 정렬 및 이의 동일성(%)의 계산을 위한 디폴트 파라미터는 KTUPLE = 1, GAP PENALTY = 3, WINDOW = 5 및 DIAGONALS SAVED = 5이다. 핵산의 경우, 이들 파라미터는 KTUPLE = 2, GAP PENALTY = 5, WINDOW = 4 및 DIAGONALS SAVED = 4이다. Clustal V 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성(%)"을 수득하는 것이 가능하다.
"Clustal W 정렬 방법"은 Clustal W(문헌[Higgins and Sharp, (1989) CABIOS 5: 151~153; 문헌[Higgins et al., (1992) Comput Appl Biosci 8: 189~191]에 기술되어 있음)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM v6.1 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY = 10, GAP LENGTH PENALTY = 0.2, 지연 발산 서열(%) = 30, DNA 전이 가중치 = 0.5, 단백질 가중치 매트릭스 = Gonnet 시리즈, DNA 가중치 매트릭스 = IUB). Clustal W 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성(%)"을 수득할 수 있다.
달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하는 GAP 버전 10(GCG, Accelrys(캘리포니아주의 샌디에고 소재))을 사용하여 수득된 값을 지칭한다: 뉴클레오타이드 서열에 대한 동일성(%) 및 유사성(%)은 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3 및 nwsgapdna.cmp 점수 매트릭스를 사용하며; 아미노산 서열에 대한 동일성(%) 및 유사성(%)은 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2 및 BLOSUM62 점수 매트릭스를 사용함(문헌[Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89: 10915]). GAP는 문헌[Needleman and Wunsch, (1970) J Mol Biol 48: 443~53]의 알고리즘을 사용하여 일치의 개수를 최대화하고 갭의 개수를 최소화하는 2개의 완전한 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 일치된 염기의 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 개수의 일치된 염기와 가장 적은 갭을 갖는 정렬을 생성한다.
"BLAST"는 생물학적 서열 간의 유사성 영역을 찾는데 사용되는 미국 국립 생물공학 정보 센터(NCBI: National Center for Biotechnology Information)에 의해 제공되는 검색 알고리즘이다. 이 프로그램은 뉴클레오타이드 또는 단백질 서열을 서열 데이터베이스와 비교하고, 일치의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열(query sequence)과 충분한 유사성을 갖는 서열을 확인한다. BLAST에는 식별된 서열 및 이들의 쿼리 서열에 대한 국소 정렬이 보고되어 있다.
당업자라면 여러 수준의 서열 동일성이 기타 종 또는 자연적 또는 합성적으로 변형된 종으로부터 폴리펩타이드를 식별하는 데 유용하며, 이때 이 같은 폴리펩타이드가 동일하거나 유사한 기능 또는 활성을 갖는다는 것을 잘 이해하고 있다. 동일성(%)의 유용한 예로는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 제한되지 않는다. 실제로, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%와 같은 50% 내지 100%의 임의의 정수의 아미노산 동일성은 본 개시내용을 기술하는 데 유용할 수 있다.
"번역 리더 서열"은 유전자의 프로모터 서열과 암호화 서열 사이에 위치한 폴리뉴클레오타이드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류에 있는 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예가 기술되어 있다(예를 들어, 문헌[Turner and Foster, (1995) Mol Biotechnol 3: 225~236]).
"3' 비암호화 서열", "전사 종결자" 또는 "종결 서열"은 암호화 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 기타 서열을 포함한다. 폴리아데닐화 신호는 보통 mRNA 전구체의 3' 말단에 대한 폴리아데닐산 영역의 부가에 영향을 주는 것을 특징으로 한다. 상이한 3' 비암호화 서열의 사용은 문헌[Ingelbrecht et al., (1989) Plant Cell 1: 671~680]에 예시되어 있다.
본원에서 사용된 바와 같이, "RNA 전사체"는 DNA 서열의 RNA 중합효소-촉매된 전사로부터 생긴 산물을 지칭한다. RNA 전사체가 DNA 서열의 완벽한 상보적인 복제물인 경우, 이는 1차 전사체 또는 프리-mRNA로서 지칭된다. RNA 전사체가 1차 전사체인 프리-mRNA의 전사 후 가공으로부터 유래하는 RNA 서열인 경우 이는 성숙한 RNA 또는 mRNA로서 지칭된다. "메신저 RNA" 또는 "mRNA"는 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "cDNA"는 효소인 역전사효소를 사용하는 mRNA 주형에 상보적이고 이로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나, DNA 중합효소 I의 Klenow 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는 mRNA를 포함하는 RNA 전사체를 지칭하며, 세포 내 또는 시험관 내에서 단백질로 번역될 수 있다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부에 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참조). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비암호화 서열, 3' 비암호화 서열, 인트론 또는 암호화 서열에 있을 수 있다. "기능적 RNA"는 번역되지 않을 수 있지만 여전히 세포 과정에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. "보체" 및 "역보체(reverse complement)"는 mRNA 전사체에 대하여 본원에서 상호 교환 가능하게 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 의미이다.
"성숙한" 단백질은 번역 후 가공된 폴리펩타이드(즉, 1차 번역 산물에 존재하는 임의의 프리펩타이드 또는 프로펩타이드가 제거된 것)를 지칭한다. "전구체" 단백질은 mRNA의 1차 번역 산물(즉, 프리펩타이드 및 프로펩타이드가 여전히 존재하는 것)을 지칭한다. 프리펩타이드 및 프로펩타이드는 세포 내 국부화 신호일 수 있으나, 이에 제한되지 않는다.
단백질은 아미노산 치환, 결실, 절두(truncation) 및 삽입을 비롯한 다양한 방식으로 변경될 수 있다. 이러한 조작 방법은 일반적으로 알려져 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA 내에서의 돌연변이에 의해 제조될 수 있다. 돌연변이 유발 및 뉴클레오타이드 서열 변경을 위한 방법은, 예를 들어 문헌[Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82: 488~92]; 문헌[Kunkel et al., (1987) Meth Enzymol 154: 367~82]; 미국 특허 제4,873,192호; 문헌[Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York] 및 여기에 인용된 문헌을 포함한다. 단백질의 생물학적 활성에 영향을 미칠 가능성이 없는 아미노산 치환에 관한 지침은, 예를 들어 문헌[Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)]의 모델에서 발견된다. 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산과 교환하는 것과 같은 보존적 치환이 바람직할 수 있다. 보존적 결실, 삽입 및 아미노산 치환은 단백질의 특징에 근본적인 변화를 일으킬 것으로 예상되지 않으며, 임의의 치환, 결실, 삽입, 또는 이들의 조합의 효과는 통상적인 선별 분석법에 의해 평가될 수 있다.
표준 DNA 단리, 정제, 분자 클로닝, 벡터 제작 및 검증/특성화 방법은 잘 확립되어 있다(예를 들어, 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY)] 참조). 벡터 및 작제물은 원형 플라스미드, 및 관심 폴리뉴클레오타이드 및 선택적으로는 기타 성분(링커, 어댑터, 조절 또는 분석을 포함함)을 포함하는 선형 폴리뉴클레오타이드를 포함한다. 일부 예에서, 관심 뉴클레오타이드는 인트론, 암호화 서열, 5' UTR, 3' UTR 및/또는 조절 영역 내에 포함될 수 있다.
약어의 의미는 다음과 같다: "sec"는 초를 의미하고, "min"은 분을 의미하고, "h"는 시간을 의미하고, "d"는 일을 의미하고, "㎕"는 마이크로리터를 의미하고, "㎖"는 밀리리터를 의미하고, "ℓ"는 리터를 의미하고, "μM"은 마이크로몰을 의미하고, "mM"은 밀리몰을 의미하고, "M"은 몰을 의미하고, "mmol"은 밀리몰을 의미하고, "μmole"은 마이크로몰을 의미하고, "g"은 그램을 의미하고, "㎍"은 마이크로그램을 의미하고, "ng"는 나노그램을 의미하고, "U"는 단위를 의미하고, "bp"는 염기 쌍을 의미하고, "kb"는 킬로염기를 의미한다.
본원에 개시되어 있는 조성물 및 방법의 비제한적인 구현예는 하기와 같다:
1. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 900개의 뉴클레오타이드의 길이 또는 900개 초과의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
2. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
3. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실된 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대해 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
4. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)으로 이루어져 있고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실된 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대해 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
5. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300, 3,400, 3,500, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는 것인 방법.
6. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 선형 DNA 작제물은 이중 가닥 DNA인 것인 방법.
7. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 수용능 바실러스 종 세포는 바실러스 서브틸리스, 바실러스 리케니포르미스, 바실러스 렌투스, 바실러스 브레비스, 바실러스 스테아로써모필루스, 바실러스 알칼로필루스, 바실러스 아밀로리퀘파시엔스, 바실러스 클라우시, 바실러스 할로두란스, 바실러스 메가테리움, 바실러스 코아귤란스, 바실러스 서큘란스, 바실러스 라우투스 및 바실러스 투링기엔시스로 이루어진 군으로부터 선택되는 것인 방법.
8. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 상기 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되는 것인 방법.
9. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 상기 수용능 바실러스 종 세포는 초수용능 바실러스 종 균주에서 유래한 것인 방법.
10. 제7 구현예에 있어서, 상기 초수용능 바실러스 종 균주는 Pxyl-ComK 균주인 것인 방법.
11. 제1 또는 제2 구현예에 있어서, 공여 DNA는 관심 폴리뉴클레오타이드, 관심 유전자, 복수개의 관심 유전자, 하나 이상의 재조합 DNA, 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열, 게놈 내로 도입될 점 돌연변이를 포함하는 뉴클레오타이드 서열 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열을 포함하는 것인 방법.
12. 제1 또는 제2 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
13. 제3 또는 제4 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
14. 제3 또는 제4 구현예에 있어서, 선형 DNA 작제물은 상기 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 추가로 포함하고, 상기 공여 DNA는 상기 바실러스 종 세포의 게놈에 삽입되는 반면, 상기 뉴클레오타이드 서열은 상기 바실러스 종 세포의 상기 게놈에서 결실되는 것인 방법.
15. 제14 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖고 이의 게놈 내에 통합된 공여 DNA를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
16. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 상기 DNA 작제물의 상기 단일 염기는 상기 적어도 하나의 바실러스 종의 게놈 내의 상응하는 단일 염기와는 상이하고, 각각의 상동성 아암은 적어도 1,200개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
17. 제16 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 단일 염기 돌연변이를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
18. 제16 구현예에 있어서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함하는 것인 방법.
19. 제16 구현예에 있어서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있는 것인 방법.
실시예
본 개시내용은 하기 실시예에서 추가로 정의된다. 이들 실시예는 본 개시내용의 특정 바람직한 양태를 나타내면서 예시로만 제공되는 것으로 이해되어야 한다. 당업자라면 상기 토의 및 이들 실시예로부터 본 개시내용의 본질적인 특징을 확인할 수 있으며, 본 발명의 진의 및 범주에서 벗어나지 않는 한, 다양한 용도 및 조건에 맞도록 본 개시내용을 다양하게 변화 및 변경시킬 수 있다.
실시예 1
선택이 없는, 바실러스 서브틸리스의 염색체 내로의 선형 공여 DNA의 통합
본 실시예에는 상동성 영역(HR1-aprE 및 HR2-aprE)에 의해 플랭킹된 공여 DNA(관심 유전자를 암호화함)로 구성된 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 통합 빈도가 기재되어 있다. 관심 유전자(GOI)는 리파아제 및 프로테아제이다.
게놈 DNA로부터 선형 DNA 작제물을 하기와 같이 증폭하였다. HR1-aprE1을 암호화하는 제1 작제물(서열 번호 1), 프로테우스 불가리스(Proteus vulgaris)에서 유래한 리파아제(서열 번호 2), BPN' 종결자(서열 번호 3) 및 HR2-aprE1(서열 번호 4)을 올리고(서열 번호 5) 및 (서열 번호 6)를 이용하여 PCR에 의해 증폭하여, 산물(서열 번호 7)을 수득하였다. HR1-aprE2를 암호화하는 제2 작제물(서열 번호 8), P2 프로모터(서열 번호 9), 바실러스 지브소니(Bacillus gibsonii)에서 유래한 프로테아제(서열 번호 10), BPN' 종결자(서열 번호 3) 및 HR2-aprE2(서열 번호 11)를 올리고(서열 번호 12) 및 (서열 번호 13)를 이용하여 PCR에 의해 증폭하여, 산물(서열 번호 14)을 수득하였다.
리파아제(서열 번호 7) 또는 프로테아제(서열 번호 14)를 암호화하는 공여 DNA의 통합을 위한 이들 합성 선형 DNA 작제물을 바실러스 서브틸리스(B. subtilis) 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크(baffled flask) 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 100 ng의 (서열 번호 7) 및 (서열 번호 14) DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-4 및 10-5 희석액으로부터의 100 ㎕를 (서열 번호 7)의 경우에 로다민 올리브 오일 한천(ROA) 및 (서열 번호 14)의 경우에 1.6% 탈지유를 함유하는 LB 한천 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다. 리파아제를 발현하는 세포는 ROA 상에 짙은 핑크색 광륜을 갖는 핑크색 콜로니로서 나타나는 반면, 모세포는 백색 콜로니로서 나타난다. 프로테아제를 발현하는 세포는 LB-탈지유 한천 상에 투명한 광륜을 형성한다.
리파아제를 암호화하는 공여 DNA의 통합 빈도를 결정하기 위해, ROA 상에서 비선택적으로 성장된 핑크색 콜로니의 비율(%)을 점수로 나타냈다(표 1). 탈지유를 함유하는 비선택적 LB 한천 상의 콜로니 주변의 광륜의 존재를 프로테아제의 통합 빈도를 결정하기 위해 사용하였다. 표 1에 나타나 있는 바와 같이, 46%의 콜로니가 프로테아제 통합을 나타내는 광륜을 포함하는 것으로 확인되었다.
선택이 없는 공여 DNA의 통합 빈도
서열 번호 게놈 유전좌위 상동성 아암(HR1)의 길이(bp) 상동성 아암(HR2)의 길이(bp) 통합 빈도(%)
DNA 부재 해당 없음 해당 없음 해당 없음 해당 없음 0
리파아제 통합 7 aprE 3,275 2,912 31
프로테아제 통합 14 aprE 2,965 2,971 46
실시예 2
선택이 없는, 다양한 길이의 상동성 아암을 포함하는 선형 DNA 작제물을 이용한 바실러스 서브틸리스의 염색체 내로의 선형 공여 DNA의 통합
본 실시예에는 길이가 다양한 상동성 영역에 의해 플랭킹된 공여 DNA(관심 유전자를 암호화함)로 구성된 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 통합 빈도가 기재되어 있다.
aprE 유전좌위(서열 번호 7) 및 프로테아제(서열 번호 14)에서 리파아제의 통합을 위한 공여 DNA를 포함하는 DNA 작제물을 PCR용 주형으로 사용하여 길이가 다양한 상동성 아암을 갖는 산물을 증폭하였다. 주형, 프라이머 및 HR1 및 HR2 상동성 길이는 표 2에 나열되어 있다.
다양한 길이의 HR를 갖는 공여 DNA의 제작
주형 F 프라이머 R 프라이머 산물 HR1(bp) HR2(bp)
서열 번호 7 서열 번호 16 서열 번호 17 서열 번호 22 336 755
서열 번호 7 서열 번호 18 서열 번호 19 서열 번호 23 1,200 1,681
서열 번호 7 서열 번호 18 서열 번호 13 서열 번호 24 1,200 2,971
서열 번호 7 서열 번호 12 서열 번호 19 서열 번호 25 3,265 1,681
서열 번호 7 서열 번호 5 서열 번호 6 서열 번호 26 3,275 2,912
서열 번호 7 서열 번호 12 서열 번호 20 서열 번호 27 3,265 6,095
서열 번호 7 서열 번호 16 서열 번호 20 서열 번호 28 336 6,095
서열 번호 14 서열 번호 21 서열 번호 17 서열 번호 29 289 755
서열 번호 14 서열 번호 18 서열 번호 19 서열 번호 30 900 1,681
서열 번호 14 서열 번호 18 서열 번호 13 서열 번호 31 900 2,971
서열 번호 14 서열 번호 12 서열 번호 19 서열 번호 32 2,965 1,681
서열 번호 14 서열 번호 12 서열 번호 13 서열 번호 33 2,965 2,971
상술한 선형 공여 DNA 작제물(서열 번호 22, 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26, 서열 번호 27, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32 및 서열 번호 33)을 B. 서브틸리스 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 80 ng의 DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-3, 10-4 및 10-5 희석액으로부터의 100 ㎕를 LB 한천 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다.
리파아제를 암호화하는 공여 DNA의 통합 빈도를 결정하기 위해, ROA 상에서 비선택적으로 성장된 핑크색 콜로니의 비율(%)을 점수로 나타냈다(표 3). 탈지유를 함유하는 비선택적 LB 한천 상의 콜로니 주변의 광륜의 존재를 프로테아제의 통합 빈도를 결정하기 위해 사용하였다. 표 3에 나타나 있는 바와 같이, 900 bp 미만의 상동성 아암 길이에서는 고빈도의 통합이 얻어지지 않았다.
선택이 없는 공여 DNA의 통합 빈도는 긴 상동성 아암을 요구한다
서열 번호 게놈 유전좌위 상동성 아암(HR1)의 길이(bp) 상동성 아암(HR2)의 길이(bp) 통합 빈도(%)
DNA 부재 해당 없음 해당 없음 해당 없음 해당 없음 0
통합 서열 번호 22 aprE 336 755 0
통합 서열 번호 23 aprE 1,200 1,681 1
통합 서열 번호 24 aprE 1,200 2,971 2
통합 서열 번호 25 aprE 3,265 1,681 10
통합 서열 번호 26 aprE 3,275 2,912 32
통합 서열 번호 27 aprE 3,265 6,095 37
통합 서열 번호 28 aprE 336 6,095 0
통합 서열 번호 29 aprE 289 755 0
통합 서열 번호 30 aprE 900 1,681 5
통합 서열 번호 31 aprE 900 2,971 2
통합 서열 번호 32 aprE 2,965 1,681 9
통합 서열 번호 33 aprE 2,965 2,971 28
실시예 3
선택이 없는, 길이가 다양한 상동성 아암을 포함하는 선형 DNA 작제물을 이용한 바실러스 서브틸리스의 염색체 내로의 마커-부재 결실 및 점 돌연변이
본 실시예에는 결실 및 점 돌연변이를 생성하기 위해 길이가 약 3 kb인 상동성 영역을 포함하는 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 결실 또는 점 돌연변이 빈도가 기재되어 있다.
B. 서브틸리스에서의 skf 유전좌위의 결실을 위해, HR1-skf(서열 번호 35) 및 HR2-skf(서열 번호 36) 서열을 포함하는 선형 DNA 작제물(서열 번호 34)을 PCR에 의해 증폭하였다.
B. 서브틸리스에서의 lipA 유전자 유전좌위의 결실을 위해, HR1-lipA(서열 번호 38) 및 HR2-lipA(서열 번호 39) 서열을 포함하는 선형 DNA 작제물(서열 번호 37)을 PCR에 의해 증폭하였다.
B. 서브틸리스 게놈의 통합된 Proteus HR2 리파아제(서열 번호 40) 내로 S79의 아미노산 변경을 도입하기 위해, 돌연변이 유발 PCR 전략을 사용하였다. 먼저, 합성 P4 프로모터(서열 번호 42)에 의해 구동되는 리파아제를 암호화하는 게놈 서열(서열 번호 41)을 전방향 프라이머(서열 번호 12) 및 역방향 프라이머(서열 번호 43)를 이용한 PCR용 주형으로 사용하여 서열 번호 44를 생성하였다. 이어, 서열 번호 41을 전방향 프라이머(서열 번호 45) 및 역방향 프라이머(서열 번호 46)를 이용한 PCR용 주형으로 사용하여 서열 번호 47을 생성하였다. 최종 선형 DNA 작제물을 생성하기 위해, 10 ng의 단편 둘 모두를 함께 혼합하고, 98℃에서 30초 동아, 98℃에서 10초 동안의 24회 사이클, 70℃(-0.5/사이클)에서 30초 동안, 72℃에서 3.5분 동안 배양한 후, 72℃에서 3분 동안 배양하였다. 얻어진 산물을 올리고(서열 번호 12) 및 (서열 번호 13)를 사용하여 PCR에 의해 증폭하여, 서열 번호 48의 선형 DNA 작제물을 수득하였다.
선형 DNA 작제물(서열 번호 34), (서열 번호 37) 및 (서열 번호 48)을 B. 서브틸리스 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 100 ng의 DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-3, 10-4 및 10-5 희석액으로부터의 100 ㎕를 skf(서열 번호 34)의 결실을 위한 LB 한천 또는 lipA(서열 번호 37)이 결실 또는 리파아제 점 돌연변이(서열 번호 48)를 위한 로다민 올리브 오일 한천(ROA) 중 하나 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다.
skf 결실 빈도를 결정하기 위해, 콜로니로부터의 DNA를 B. 서브틸리스에서 skf 유전좌위에 특이적인 프라이머를 사용하여 PCR에 의해 증폭하였다. skf 유전좌위가 성공적으로 결실되면 프라이머(서열 번호 49) 및 (서열 번호 50)은 1,200 bp의 산물을 생성한다. 형질전환체의 콜로니 PCR에 의해 전체 콜로니 중 31%가 skf 유전좌위의 결실을 갖는다는 것이 밝혀졌다(표 4).
B. 서브틸리스 lipA 유전자의 결실 또는 이종성 리파아제에서의 점 돌연변이의 빈도는 ROA 플레이트 상의 백색 콜로니의 빈도에 의해 결정되었다. lipA의 결실의 경우에 콜로니의 25%는 백색인 것으로 밝혀졌으며, 점 돌연변이의 경우에 32%는 백색이었다(표 4). 각각의 형질전환을 위한 백색 콜로니의 예는 염색체 영역을 증폭시키고 결실에 대한 예상된 크기 변화를 찾음으로써, 그리고 점 돌연변이의 부위를 서열분석함으로써 결실 또는 점 돌연변이를 포함하는 것으로 추가로 확인되었다.
선택이 없는 고빈도의 결실 및 점 돌연변이
서열 번호 게놈 유전좌위 상동성 아암(HR1)의 길이(bp) 상동성 아암(HR2)의 길이(bp) 통합 빈도(%)
DNA 부재 해당 없음 해당 없음 해당 없음 해당 없음 0
skf 결실 16 skf 3,006 3,032 31
lipA 결실 19 lipA 3,040 3,047 25
리파아제 점 돌연변이 27 aprE 2,965 2,971 32
SEQUENCE LISTING <110> Danisco US Inc. <120> SELECTION MARKER FREE METHODS FOR MODIFYING THE GENOME OF BACILLUS AND COMPOSITIONS THEREOF <130> NB41425-WO-PCT <160> 50 <170> PatentIn version 3.5 <210> 1 <211> 3275 <212> DNA <213> Bacillus subtilis <400> 1 ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60 cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120 acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180 ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240 tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300 tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360 gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420 cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480 actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540 cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600 gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660 cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720 agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780 cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840 gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900 gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960 aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020 atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080 gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140 tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200 agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260 gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320 ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380 aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440 caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500 gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560 gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620 gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680 tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740 gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800 cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860 cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920 cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980 caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040 cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100 cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160 aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220 atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280 ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340 ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400 gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460 tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520 ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580 gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640 tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700 aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760 cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820 tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880 atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940 tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000 tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060 aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120 ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180 gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240 atctattaca ataaattcac agaatagtct tttaa 3275 <210> 2 <211> 864 <212> DNA <213> artificial sequence <220> <223> synthesized sequence -Optimized coding sequence for Proteus vulgaris (WP099659650.1) lipase <400> 2 gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60 ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120 acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180 gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 240 ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300 tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360 aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420 agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480 acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540 gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600 cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660 gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720 cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780 gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840 tttttagcgt caaaaaagct ctaa 864 <210> 3 <211> 254 <212> DNA <213> Bacillus amyloliquefaciens <400> 3 tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 60 catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 120 gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 180 cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 240 cggcattcgt aatc 254 <210> 4 <211> 2912 <212> DNA <213> Bacillus subtilis <400> 4 aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60 gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120 aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180 cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240 ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300 aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360 aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420 attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480 caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540 ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600 tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660 aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720 ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780 gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840 cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900 aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960 ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020 tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080 cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140 cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200 accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260 gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320 atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380 agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440 catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500 ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560 cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620 atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680 cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740 gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800 aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860 tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920 aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980 cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040 cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100 ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160 attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220 agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280 tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340 tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400 cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460 gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520 caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580 atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640 tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700 gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760 tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820 tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880 ttcatgtgaa tccctcctgc ctccattatt tc 2912 <210> 5 <211> 25 <212> DNA <213> artificial sequence <220> <223> synthesized sequence - F primer <400> 5 ccctgctgac agaaatatcc ggcgg 25 <210> 6 <211> 21 <212> DNA <213> artificial sequence <220> <223> synthesized sequence - R primer <400> 6 gaaataatgg aggcaggagg g 21 <210> 7 <211> 7346 <212> DNA <213> artificial sequence <220> <223> synthesized sequence - HR1-aprE, aprE promoter, Proteus vulgaris lipase, BPNprime terminator, HR2-aprE <400> 7 ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60 cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120 acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180 ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240 tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300 tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360 gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420 cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480 actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540 cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600 gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660 cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720 agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780 cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840 gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900 gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960 aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020 atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080 gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140 tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200 agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260 gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320 ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380 aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440 caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500 gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560 gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620 gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680 tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740 gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800 cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860 cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920 cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980 caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040 cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100 cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160 aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220 atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280 ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340 ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400 gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460 tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520 ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580 gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640 tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700 aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760 cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820 tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880 atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940 tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000 tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060 aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120 ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180 gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240 atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300 aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360 tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420 tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480 gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540 gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600 tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660 cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720 tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780 agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840 actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900 ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960 ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020 aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080 agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140 tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200 gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260 atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320 cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380 atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440 tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500 agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560 aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620 tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680 cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740 gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800 atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860 actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920 aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980 atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040 tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100 ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160 taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220 cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280 ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340 aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400 tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460 gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520 ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580 aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640 tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700 ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760 tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820 cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880 gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940 cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000 cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060 tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120 cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180 aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240 gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300 cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360 gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420 ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480 catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540 ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600 gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660 gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720 agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780 acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840 ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900 agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960 tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020 gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080 gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140 atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200 gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260 aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320 tgaatccctc ctgcctccat tatttc 7346 <210> 8 <211> 2965 <212> DNA <213> Bacillus subtilis <400> 8 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgc 2965 <210> 9 <211> 94 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- P2 promoter <400> 9 gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60 cttaaaagaa gctaaatgtt atagtaattg taca 94 <210> 10 <211> 339 <212> DNA <213> Bacillus gibonsii <400> 10 gtgagaagca aaaaattgtg gatcagcttg ttgtttgcgt taacgttaat ctttacgatg 60 gcgttcagca acatgtctgc gcaggctgct gaagaagcaa aagaaaaata tttaattggc 120 tttaatgagc aggaagctgt cagtgagttt gtagaacaag tagaggcaaa tgacgaggtc 180 gccattctct ctgaggaaga ggaagtcgaa attgaattgc ttcatgaatt tgaaacgatt 240 cctgttttat ccgttgagtt aagcccagaa gatgtggacg cgcttgaact cgatccagcg 300 atttcttata ttgaagagga tgcagaagta acgacaatg 339 <210> 11 <211> 2971 <212> DNA <213> Bacillus subtilis <400> 11 aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60 gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120 aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180 cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240 ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300 aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360 aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420 attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480 caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540 ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600 tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660 aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720 ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780 gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840 cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900 aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960 ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020 tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080 cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140 cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200 accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260 gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320 atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380 agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440 catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500 ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560 cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620 atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680 cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740 gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800 aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860 tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920 aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980 cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040 cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100 ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160 attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220 agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280 tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340 tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400 cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460 gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520 caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580 atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640 tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700 gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760 tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820 tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880 ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 2940 tgttttgcct tagtaaatca gatcaaggaa a 2971 <210> 12 <211> 20 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 12 tcgtcaacgc ctgcctcagc 20 <210> 13 <211> 25 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 13 tttccttgat ctgatttact aaggc 25 <210> 14 <211> 7488 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 14 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000 taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060 aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120 agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180 agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240 gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300 ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360 ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420 tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480 cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540 atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600 gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660 gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720 gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780 gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840 agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900 gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960 gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020 attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080 agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140 caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200 aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260 taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500 agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560 ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620 aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680 gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740 ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800 gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860 aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920 aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980 aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040 aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100 tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160 atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220 tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280 gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340 ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400 tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460 gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520 ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580 ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640 tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700 ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760 gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820 tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880 ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940 ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000 cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060 tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120 aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180 cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240 tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300 ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360 agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420 gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480 aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540 tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600 ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660 atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720 aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780 caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840 aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900 tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960 tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020 gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080 accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140 ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200 cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260 cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320 tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380 ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440 cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488 <210> 15 <211> 576 <212> DNA <213> Bacillus subtilis <400> 15 atgagtcaga aaacagacgc acctttagaa tcgtatgaag tgaacggcgc aacaattgcc 60 gtgctgccag aagaaataga cggcaaaatc tgttccaaaa ttattgaaaa agattgcgtg 120 ttttatgtaa acatgaagcc gctgcaaatt gtcgacagaa gctgccgatt ttttggatca 180 agctatgcgg gaagaaaagc aggaacttat gaagtgacaa aaatttcaca caagccgccg 240 atcatggtgg acccttcgaa ccaaatcttt ttattcccta cactttcttc gacaagaccc 300 caatgcggct ggatttccca tgtgcatgta aaagaattca aagcgactga attcgacgat 360 acggaagtga cgttttccaa tgggaaaacg atggagctgc cgatctctta taattcgttc 420 gagaaccagg tataccgaac agcgtggctc agaaccaaat tccaagacag aatcgaccac 480 cgcgtgccga aaagacagga atttatgctg tacccgaaag aagagcggac gaagatgatt 540 tatgatttta ttttgcgtga gctcggggaa cggtat 576 <210> 16 <211> 26 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 16 cacgataata tccattgttc tcacgg 26 <210> 17 <211> 20 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 17 gatatgtggt gccgaaacgc 20 <210> 18 <211> 20 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 18 gcaaaacgcg gatcattgga 20 <210> 19 <211> 22 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 19 gtttgcaaaa atattgcggc cg 22 <210> 20 <211> 21 <212> DNA <213> artificial sequence <220> <223> synthesized sequence- primer <400> 20 ccatgatacg cggaagaacc g 21 <210> 21 <211> 21 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 21 gctatcaaaa taacagactc g 21 <210> 22 <211> 2209 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 22 cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60 acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120 tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180 ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240 gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300 tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360 ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420 gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480 tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540 aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600 gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660 agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720 gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780 aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840 aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900 aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960 ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020 cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080 gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140 gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200 tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260 catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320 gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380 cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440 cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500 aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560 ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620 gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680 gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740 atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800 caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860 gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920 gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980 aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040 tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100 tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160 tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatc 2209 <210> 23 <211> 3999 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 23 gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60 ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120 ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180 ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240 gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300 catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360 cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420 gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480 ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540 tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600 cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660 cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720 gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780 cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840 tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900 aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960 aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020 tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080 gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140 tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200 gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260 ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320 acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380 gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440 ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500 tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560 aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620 agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680 acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740 gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800 cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860 gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920 cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980 gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040 tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100 ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160 ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220 cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280 cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340 cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400 tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460 atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520 ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580 ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640 ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700 gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760 agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820 aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880 aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940 ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000 tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060 ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120 gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180 tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240 tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300 atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360 tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420 cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480 gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540 gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600 tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660 aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720 tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780 acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840 gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900 ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960 tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaac 3999 <210> 24 <211> 5289 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 24 gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60 ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120 ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180 ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240 gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300 catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360 cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420 gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480 ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540 tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600 cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660 cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720 gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780 cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840 tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900 aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960 aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020 tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080 gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140 tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200 gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260 ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320 acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380 gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440 ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500 tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560 aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620 agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680 acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740 gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800 cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860 gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920 cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980 gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040 tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100 ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160 ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220 cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280 cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340 cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400 tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460 atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520 ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580 ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640 ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700 gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760 agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820 aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880 aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940 ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000 tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060 ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120 gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180 tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240 tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300 atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360 tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420 cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480 gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540 gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600 tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660 aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720 tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780 acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840 gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900 ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960 tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaacg ttgtcatttt catcctgacc 4020 tctgggtccg cagcttccgg ctcggcctcc cccgtctggc ataaaatgac gagctcaacc 4080 tttggcagcg attcatgcat gctctcataa agcggcaaaa gctggctaac gcccacgatt 4140 gcctttacat cgccatttgt cagcatataa ccaatttctg tcggcgtgta caacggattg 4200 atgggaacaa ctacgatccc agcttttaaa gcgccaaaaa acgcgatgat aaaatcaggc 4260 gaattgccaa gcagcaaagc taaatggtcc cctttctcca taccggcttc ctgaaggccg 4320 tccgcaaatc gctgaatata ttcattcagc tcttgatacg tcatcatgtg atctttaaac 4380 ctgcatgcga tgctgtcggg cttctcagat gctgtttctt ccaattttga aacaagattc 4440 attctcccac cccttaagtg aatgaatagt cattcattat tgaagccaag ctttcttctc 4500 cattatagag aaacagaaaa aaacactcaa gagcaaaaag ccctgagtgt cagtactgtc 4560 atagtttctt caatgcttcg gcaatcggcg tatctccttc tgtcagatca aaggcccgat 4620 tttccgtatt cttctcatct aaagaggcaa tgaccgtttt tgcaacgtca tcacgggaaa 4680 taaatccccg ctccagatcc ttcgctgctg aaacagttcc cgttccaggc tcattgcgaa 4740 ggcctcccgg acggataatc gtataggtta aaccgctcgc ttccagaatt ttatcagcat 4800 aatgcttggc cacataataa ggcttgagtg cctcattcca attttcacgg ttatgggctt 4860 gcagggcgct gaccataata aaccgtttga ttccggcaat ggccgcagct tcaatggctt 4920 ttgccgctcc atcaagatcc accagcagcg ttttatcata gcctgtgctg ccgccggaac 4980 cggctgtgaa aatgatcgcg tcacaacctt ttgccgcagc ggcgatttct tccgggctgc 5040 cctccagatt cgcaagcaca gcttctgcac cggcagcttc aagagacgct ttctgttctt 5100 cttttctgac catcgctctg atggaatgat caggattatc ttggaataaa gagacgagtc 5160 tttgcccgat ttgtccgttc gctccgatta aaaacacttt catgtgaatc cctcctgcct 5220 ccattatttc aaaaacacaa ccgctctttc aaacgatgtg ttttgcctta gtaaatcaga 5280 tcaaggaaa 5289 <210> 25 <211> 6064 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 25 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000 ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060 tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120 gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180 tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240 tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300 cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360 ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420 ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480 ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540 tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600 cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660 aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720 cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780 tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840 ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900 cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960 tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020 ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080 tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140 aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200 cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260 cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320 gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380 atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440 ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500 gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560 aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620 atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680 aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740 agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800 ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860 ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920 ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980 atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040 cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100 ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160 ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220 ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280 aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340 gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400 gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460 gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520 aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580 aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640 aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700 gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760 aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820 attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880 cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940 tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000 atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060 aaac 6064 <210> 26 <211> 7346 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 26 ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60 cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120 acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180 ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240 tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300 tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360 gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420 cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480 actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540 cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600 gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660 cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720 agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780 cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840 gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900 gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960 aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020 atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080 gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140 tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200 agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260 gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320 ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380 aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440 caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500 gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560 gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620 gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680 tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740 gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800 cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860 cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920 cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980 caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040 cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100 cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160 aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220 atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280 ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340 ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400 gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460 tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520 ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580 gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640 tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700 aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760 cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820 tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880 atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940 tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000 tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060 aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120 ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180 gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240 atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300 aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360 tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420 tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480 gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540 gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600 tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660 cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720 tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780 agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840 actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900 ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960 ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020 aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080 agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140 tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200 gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260 atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320 cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380 atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440 tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500 agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560 aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620 tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680 cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740 gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800 atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860 actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920 aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980 atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040 tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100 ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160 taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220 cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280 ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340 aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400 tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460 gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520 ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580 aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640 tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700 ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760 tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820 cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880 gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940 cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000 cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060 tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120 cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180 aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240 gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300 cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360 gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420 ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480 catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540 ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600 gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660 gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720 agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780 acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840 ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900 agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960 tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020 gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080 gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140 atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200 gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260 aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320 tgaatccctc ctgcctccat tatttc 7346 <210> 27 <211> 10478 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 27 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000 ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060 tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120 gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180 tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240 tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300 cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360 ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420 ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480 ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540 tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600 cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660 aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720 cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780 tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840 ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900 cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960 tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020 ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080 tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140 aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200 cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260 cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320 gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380 atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440 ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500 gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560 aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620 atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680 aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740 agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800 ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860 ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920 ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980 atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040 cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100 ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160 ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220 ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280 aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340 gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400 gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460 gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520 aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580 aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640 aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700 gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760 aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820 attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880 cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940 tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000 atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060 aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 6120 ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 6180 caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 6240 ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 6300 aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 6360 ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 6420 atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 6480 ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 6540 attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 6600 aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 6660 ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 6720 gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 6780 gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 6840 ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 6900 ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 6960 gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 7020 tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 7080 gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 7140 gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 7200 ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 7260 actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 7320 atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 7380 atgcttgaga ttcacacctt cgagcacatc agcgatgacg ctgcgttcgt attgttttcc 7440 gaccagcagg ttttcaattt cagatacatc accgacaccg aagaaatctc cgaagatttt 7500 gcagtcctcg attttgcctt tcttgacttc caggtgcaaa tcgatcgatc caaccggata 7560 acgcttcgaa tgattaaggt taaattttgg tgagcggccg tagttccaat cccaattctg 7620 atagcgctct ttcgaaattt gatgaatggt ctcccaatct ttttccgtca gcttatactc 7680 cggcacgttt ccaacgtcgt ttgtgttaaa aatatggcga agcaaatggc tgcggaattc 7740 ttcggtggtc attttatcat cgagaaactc actgatgttt gccactcggc ttctgatcga 7800 tttgatgcct tttgattcaa ttttatcctt tttcaccttt aatgctgata caacatgatc 7860 aatggctgaa tcaaacatga gggtgccgtg gctgaaaata cggcctttcg ttgcaaactg 7920 agcgtttccg gatattttcc ggccatctac tacaatgtcg ttccggccgc ttaattcggc 7980 ttcaacccca agctgatgta acgcctgaat cactggctca gtgaattttt taaagttatg 8040 aaagctgtcc ccgtcatcct tggtaataaa gctgaagttc aagttcccca gatcatggta 8100 cacagcgccc ccgcctgata aacggcggac gacgataatc ccgttttcct caacatattt 8160 tgtattgatt tcttctattg tattttggtt tttcccaatg ataatagacg gttgattcac 8220 ataaaagagc aaatattgct gttcagggtc taaatgcttt acacagtact cctcgatagc 8280 aagattgatc cgcggatcat tgatattttg attgtctata aataacatgg tgctcctcct 8340 ttatccttcc cacacaaaac ctgatttcgc aatattcact tctccgttaa aaacggtttt 8400 cgcttctttg cgaaggttgt catgcacgcc aaaatgcggc aaatgtgtca gcagcagttc 8460 tcccgctccg gcttcttttg caatgcgccc agcttccagg ctgttcatat ggcctgcact 8520 tgttccgtct tgatcggcat aaaaattgca ttctgagatc aataaatcag catctttcga 8580 aaacggtata aatgaatcct gatagctgga atcagcagta taaacgacag tgtggctgcc 8640 gtcagtaatc cgcatggcat agcacgtcac cgggtgaatc gtttttaaaa aggtgatcgt 8700 aaacggaccg gcagtcagcg gctgatccgg ctgataggcg atcccttttg tatgtgtttt 8760 atatgtaagc ttttgaaact gttctatatc agcatcatgt ccgtaaatcg gaagcgtatg 8820 ctctcctttg ccgagaaacg aaccgacttg cttggcaaat tgcagcggtc cgatatcagc 8880 gatatggtca tggtgataat gagacagaac gaccgcatcc agcttttccg ccggcacata 8940 tccgaacagc ttagacaata cggcactgcc gcaatcaaca agcagagagt aatcacctga 9000 ctgaaacaaa tagcctgacg tcgcttcatt tgcggccgga aaaccgccat agcatccgat 9060 aactgtaact ttcataatgt cctcctatct tttcaaaaaa attggtcctc cttcaatata 9120 cccatttttc ttgaaaaaag catgttttaa acattgtatc aaaacagtta ttgatttttg 9180 taatctgtta tattacaatg aaatcactac aaaggggaaa gagggattgg ttatgctggg 9240 gaaaatcaca gaatttttta gaaacctgcc ttcgaaaaag tgtgcggaat gcggaaaaaa 9300 gatagaagag cagcatgagt gttatggtaa tatctgcaat gactgtataa aagtaaacga 9360 tttgtaatga gcgaaaatcc cgcgccttac gcgtgggatt ttcttatttt ttcacatatc 9420 tcttaatttt gaaataatag tcaggttagg tcaaagctca cctgttttta gataattctg 9480 gtgattatca taatgtcatt gaatattctt tattttcgaa atataattta ctatagacga 9540 attgatttct tatctattat aatttgatct aatagtgaga ttaaatatat gtctattcat 9600 gatatatgtt gatactttgt tttttgggag gtaatctatg aaaagaatta agtttggatt 9660 agccacacaa atattcgttg gacttattct aggtgtcatt gttggcgtca tttggtatgg 9720 caacccagca ttgcctactt acctgcagcc aatcggggat ctctttttac gcttaatcaa 9780 aatgatagtg attcctattg ttgtctccag cttaatcatc ggtgtagccg gtgcaggaaa 9840 tggaaagcaa gtcggtaaat taggcttcag aacgattctg tacttcgaga tcatcacgac 9900 ttttgccatt attctcggac tagcccttgc aaacatcttc catccgggta caggagttaa 9960 tatacacgaa gctcaaaaat cggacatcag tcaatatgtt gaaactgaaa aagaacaaag 10020 taataaatca gtggcggaaa cgttcctcca tattgtgccg acaaacttct tccagtcatt 10080 ggtcgaaggg gatcttctag ccatcatctg ctttacagta ctatttgcat tgggtatttc 10140 cgcgatcggt gaaagaggca agcctgtatt agcctttttt gaaggtgtat cccatgccat 10200 gttccacgtt gtaaaccttg tgatgaaagt ggcgccattc ggcgttttcg ctcttatcgg 10260 agtgactgtg tctaaattcg gactcggttc tcttatctct ctcggaaagc tcgtcggatt 10320 ggtttatgtc gcgcttgctt tcttcttaat tgttattttc gggattgtcg caaaaattgc 10380 cggcatcagc atcttcaagt tccttgctta catgaaggac gaaatcttac tggcgttcag 10440 tacgtccagc tctgaaacgg ttcttccgcg tatcatgg 10478 <210> 28 <211> 7549 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 28 cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60 acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120 tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180 ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240 gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300 tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360 ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420 gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480 tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540 aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600 gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660 agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720 gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780 aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840 aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900 aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960 ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020 cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080 gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140 gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200 tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260 catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320 gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380 cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440 cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500 aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560 ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620 gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680 gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740 atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800 caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860 gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920 gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980 aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040 tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100 tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160 tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatcc ctttaccgct 2220 tccccgcttt gggggtccgg cacgccgatg acaaccgcct ccttgacgtc cggatggctg 2280 tacagcacct cctccacctc ccgcggatac acattgtatc ctcctacaat gatcatgtct 2340 tttttccggt caacaatgta aaaatagccg tcctcatccc gtcttgccaa gtcccccgta 2400 taaagccacc cgtcttttaa tgcatgctct gtttccatcg gcattttata atagcccttc 2460 atcacattgg ggcctttcac gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg 2520 agcggatcta cgaccttgtt ttcgacatgt aagatacttg tcccgatgga gcccggcttt 2580 ctgcccctgt caaacgggtt aaagcacgtg acgggtgatg cttccgagag cccgtagcct 2640 tccaaaatgg taacaccgaa tttttcttca aacgccgtca gcaacgcgac tggcatggac 2700 gcgcctcccg aaatgcacag ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc 2760 tgaaacaagt agttatacat tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta 2820 acaagcttaa aaacagatgc cggactgaat tgaggctcaa tcaatacagt tgcgccgctc 2880 atcagcggtg cattcataca gacggttaaa caaaacacgt gaaacatggg aagagcgcag 2940 accacattgt ccctctcatc cattcccaaa tagcctgcga catcgttggc attgctgtac 3000 aaattctgat gtgtcagcat cgcgcctttc ggttttccag tcgttcctga cgtatataaa 3060 ataaccgcgg tatcatcagg tacaggttct tggttttgtt tagcggcaga tgtcggccgc 3120 aatatttttg caaacgttgt cattttcatc ctgacctctg ggtccgcagc ttccggctcg 3180 gcctcccccg tctggcataa aatgacgagc tcaacctttg gcagcgattc atgcatgctc 3240 tcataaagcg gcaaaagctg gctaacgccc acgattgcct ttacatcgcc atttgtcagc 3300 atataaccaa tttctgtcgg cgtgtacaac ggattgatgg gaacaactac gatcccagct 3360 tttaaagcgc caaaaaacgc gatgataaaa tcaggcgaat tgccaagcag caaagctaaa 3420 tggtcccctt tctccatacc ggcttcctga aggccgtccg caaatcgctg aatatattca 3480 ttcagctctt gatacgtcat catgtgatct ttaaacctgc atgcgatgct gtcgggcttc 3540 tcagatgctg tttcttccaa ttttgaaaca agattcattc tcccacccct taagtgaatg 3600 aatagtcatt cattattgaa gccaagcttt cttctccatt atagagaaac agaaaaaaac 3660 actcaagagc aaaaagccct gagtgtcagt actgtcatag tttcttcaat gcttcggcaa 3720 tcggcgtatc tccttctgtc agatcaaagg cccgattttc cgtattcttc tcatctaaag 3780 aggcaatgac cgtttttgca acgtcatcac gggaaataaa tccccgctcc agatccttcg 3840 ctgctgaaac agttcccgtt ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat 3900 aggttaaacc gctcgcttcc agaattttat cagcataatg cttggccaca taataaggct 3960 tgagtgcctc attccaattt tcacggttat gggcttgcag ggcgctgacc ataataaacc 4020 gtttgattcc ggcaatggcc gcagcttcaa tggcttttgc cgctccatca agatccacca 4080 gcagcgtttt atcatagcct gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac 4140 aaccttttgc cgcagcggcg atttcttccg ggctgccctc cagattcgca agcacagctt 4200 ctgcaccggc agcttcaaga gacgctttct gttcttcttt tctgaccatc gctctgatgg 4260 aatgatcagg attatcttgg aataaagaga cgagtctttg cccgatttgt ccgttcgctc 4320 cgattaaaaa cactttcatg tgaatccctc ctgcctccat tatttcaaaa acacaaccgc 4380 tctttcaaac gatgtgtttt gccttagtaa atcagatcaa ggaaatcctc tttcgtaatg 4440 ttcccaaagt aatgcttgag attcacacct tcgagcacat cagcgatgac gctgcgttcg 4500 tattgttttc cgaccagcag gttttcaatt tcagatacat caccgacacc gaagaaatct 4560 ccgaagattt tgcagtcctc gattttgcct ttcttgactt ccaggtgcaa atcgatcgat 4620 ccaaccggat aacgcttcga atgattaagg ttaaattttg gtgagcggcc gtagttccaa 4680 tcccaattct gatagcgctc tttcgaaatt tgatgaatgg tctcccaatc tttttccgtc 4740 agcttatact ccggcacgtt tccaacgtcg tttgtgttaa aaatatggcg aagcaaatgg 4800 ctgcggaatt cttcggtggt cattttatca tcgagaaact cactgatgtt tgccactcgg 4860 cttctgatcg atttgatgcc ttttgattca attttatcct ttttcacctt taatgctgat 4920 acaacatgat caatggctga atcaaacatg agggtgccgt ggctgaaaat acggcctttc 4980 gttgcaaact gagcgtttcc ggatattttc cggccatcta ctacaatgtc gttccggccg 5040 cttaattcgg cttcaacccc aagctgatgt aacgcctgaa tcactggctc agtgaatttt 5100 ttaaagttat gaaagctgtc cccgtcatcc ttggtaataa agctgaagtt caagttcccc 5160 agatcatggt acacagcgcc cccgcctgat aaacggcgga cgacgataat cccgttttcc 5220 tcaacatatt ttgtattgat ttcttctatt gtattttggt ttttcccaat gataatagac 5280 ggttgattca cataaaagag caaatattgc tgttcagggt ctaaatgctt tacacagtac 5340 tcctcgatag caagattgat ccgcggatca ttgatatttt gattgtctat aaataacatg 5400 gtgctcctcc tttatccttc ccacacaaaa cctgatttcg caatattcac ttctccgtta 5460 aaaacggttt tcgcttcttt gcgaaggttg tcatgcacgc caaaatgcgg caaatgtgtc 5520 agcagcagtt ctcccgctcc ggcttctttt gcaatgcgcc cagcttccag gctgttcata 5580 tggcctgcac ttgttccgtc ttgatcggca taaaaattgc attctgagat caataaatca 5640 gcatctttcg aaaacggtat aaatgaatcc tgatagctgg aatcagcagt ataaacgaca 5700 gtgtggctgc cgtcagtaat ccgcatggca tagcacgtca ccgggtgaat cgtttttaaa 5760 aaggtgatcg taaacggacc ggcagtcagc ggctgatccg gctgataggc gatccctttt 5820 gtatgtgttt tatatgtaag cttttgaaac tgttctatat cagcatcatg tccgtaaatc 5880 ggaagcgtat gctctccttt gccgagaaac gaaccgactt gcttggcaaa ttgcagcggt 5940 ccgatatcag cgatatggtc atggtgataa tgagacagaa cgaccgcatc cagcttttcc 6000 gccggcacat atccgaacag cttagacaat acggcactgc cgcaatcaac aagcagagag 6060 taatcacctg actgaaacaa atagcctgac gtcgcttcat ttgcggccgg aaaaccgcca 6120 tagcatccga taactgtaac tttcataatg tcctcctatc ttttcaaaaa aattggtcct 6180 ccttcaatat acccattttt cttgaaaaaa gcatgtttta aacattgtat caaaacagtt 6240 attgattttt gtaatctgtt atattacaat gaaatcacta caaaggggaa agagggattg 6300 gttatgctgg ggaaaatcac agaatttttt agaaacctgc cttcgaaaaa gtgtgcggaa 6360 tgcggaaaaa agatagaaga gcagcatgag tgttatggta atatctgcaa tgactgtata 6420 aaagtaaacg atttgtaatg agcgaaaatc ccgcgcctta cgcgtgggat tttcttattt 6480 tttcacatat ctcttaattt tgaaataata gtcaggttag gtcaaagctc acctgttttt 6540 agataattct ggtgattatc ataatgtcat tgaatattct ttattttcga aatataattt 6600 actatagacg aattgatttc ttatctatta taatttgatc taatagtgag attaaatata 6660 tgtctattca tgatatatgt tgatactttg ttttttggga ggtaatctat gaaaagaatt 6720 aagtttggat tagccacaca aatattcgtt ggacttattc taggtgtcat tgttggcgtc 6780 atttggtatg gcaacccagc attgcctact tacctgcagc caatcgggga tctcttttta 6840 cgcttaatca aaatgatagt gattcctatt gttgtctcca gcttaatcat cggtgtagcc 6900 ggtgcaggaa atggaaagca agtcggtaaa ttaggcttca gaacgattct gtacttcgag 6960 atcatcacga cttttgccat tattctcgga ctagcccttg caaacatctt ccatccgggt 7020 acaggagtta atatacacga agctcaaaaa tcggacatca gtcaatatgt tgaaactgaa 7080 aaagaacaaa gtaataaatc agtggcggaa acgttcctcc atattgtgcc gacaaacttc 7140 ttccagtcat tggtcgaagg ggatcttcta gccatcatct gctttacagt actatttgca 7200 ttgggtattt ccgcgatcgg tgaaagaggc aagcctgtat tagccttttt tgaaggtgta 7260 tcccatgcca tgttccacgt tgtaaacctt gtgatgaaag tggcgccatt cggcgttttc 7320 gctcttatcg gagtgactgt gtctaaattc ggactcggtt ctcttatctc tctcggaaag 7380 ctcgtcggat tggtttatgt cgcgcttgct ttcttcttaa ttgttatttt cgggattgtc 7440 gcaaaaattg ccggcatcag catcttcaag ttccttgctt acatgaagga cgaaatctta 7500 ctggcgttca gtacgtccag ctctgaaacg gttcttccgc gtatcatgg 7549 <210> 29 <211> 2596 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 29 gctatcaaaa taacagactc gtgattttcc aaacgagctt tcaaaaaagc ctctgcccct 60 tgcaaatcgg atgcctgtct ataaaattcc cgatattggt taaacagcgg cgcaatggcg 120 gccgcatctg atgtctttgc ttggcgaatg ttcatcttat ttcttcctcc ctctcaataa 180 ttttttcatt ctatcccttt tctgtaaagt ttatttttca gaatactttt atcatcatgc 240 tttgaaaaaa tatcacgata atatccattg ttctcacgga agcacacgcg ctgataaaca 300 gctgacatca actaaaagtt tcattaaata ctttgaaaaa agttgttgac ttaaaagaag 360 ctaaatgtta tagtaattgt acagaatagt cttttaagta agtctactct gaattttttt 420 aaaaggagag ggtaaagagt gagaagcaaa aaattgtgga tcagcttgtt gtttgcgtta 480 acgttaatct ttacgatggc gttcagcaac atgtctgcgc aggctgctga agaagcaaaa 540 gaaaaatatt taattggctt taatgagcag gaagctgtca gtgagtttgt agaacaagta 600 gaggcaaatg acgaggtcgc cattctctct gaggaagagg aagtcgaaat tgaattgctt 660 catgaatttg aaacgattcc tgttttatcc gttgagttaa gcccagaaga tgtggacgcg 720 cttgaactcg atccagcgat ttcttatatt gaagaggatg cagaagtaac gacaatgcaa 780 caaacagtgc catggggaat tactcgtgtg caagccccag ctgttcataa ccgtggaatt 840 acaggttctg gtgtaagagt tgctatcctc gattcaggta tttccacaca tgaagactta 900 aatgttcgtg gtggcgttag ctttgtacca ggggaaccaa cgtatgctga tttaaatggg 960 catggcacgc atgtggctgg gacggtagct gctttaaaca attcgattgg cgttgttggc 1020 gtagcaccgt cagcggatct atacgctgtt aaagtattag gggcgaatgg tagaggttcg 1080 gtcagcggga ttgcccaagg attggaatgg gcagcacaaa ataacatgca cattgctaat 1140 atgagtttag gaacagatgc accaagttct acacttgagc gtgctgttaa ttatgcgact 1200 tctagagatg ttcttgttat tgcggcaact gggaataacg gttctggctc agtaggctat 1260 ccggcccgtt atgcgaacgc aatggcagtc ggagctactg accaaaacaa cagacgcgcc 1320 aacttttcac agtatggcac ggggattgac attgtcgcac caggtgtaaa cgtgcagagc 1380 acatacccag gtaaccgtta tgtgagcatg aacggtacat cgatggctac tcctcatgtt 1440 gcaggtgcag cagcccttgt taaacaacgc tatccatctt ggaatgcgac tcaaatccgc 1500 gaccatctaa agaatacggc aacgaattta ggaaactctt cacaatttgg aagcggactt 1560 gtcaatgcag aagcggcaac acgctaatct agatacataa aaaaccggcc ttggccccgc 1620 cggtttttta ttatttttct tcctccgcat gttcaatccg ctccataatc gacggatggc 1680 tccctctgaa aattttaacg agaaacggcg ggttgacccg gctcagtccc gtaacggcca 1740 agtcctgaaa cgtctcaatc gccgcttccc ggtttccggt cagctcaatg ccgtaacggt 1800 cggcggcgtt ttcctgatac cgggagacgg cattcgtaat caacgcctca ctcctcacat 1860 caacccgtta cttctattgt aatcataaat tcaaattctt agaaccaagc tgtgttccgc 1920 acttttccac ccttttaagc atggaaaccc cgatcgctgg gaaaactaac aatgtttgga 1980 gtgatgcaaa tgaaaaaaat agtggcagcc atcgtggtaa tcggtcttgt gtttatcgca 2040 tttttttatc tttacagccg atcaggcgat gtgtatcaat cggtagacgc ggatttgatc 2100 acactgtctt caagcggcca ggaagatatc gagattgaaa aaagacagca cgtcaaagat 2160 atgctggata ttatgaatca gggaaaacag gtgaagacag aaaaaacatc agcccctgat 2220 tacgaaggga caatcaagtt tcataaagac cggtatgact cattcagact atggattgac 2280 ggcagccagc aagccgtttt tttgaaggat ggcacatact acaaattaag caaaaatgat 2340 acaaaggcgc tgctaaatat tattaaaaaa gaagcaaagg attgaaaatg aaaaagcgaa 2400 gctaaccgct tcgctttttc attttattgg ggcaaaatat ctctcagtgc ccgtctgagc 2460 attttccccg tcgcattttt cggaatatcg tcaagaaacg taatggcggc aggccgcttg 2520 tattttgcca gatgcttttc gcagtgctgc atgatgtcct cctctgttac cccagagcgt 2580 ttcggcacca catatc 2596 <210> 30 <211> 4133 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 30 gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60 ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120 ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180 ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240 gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300 catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360 cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420 gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480 ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540 tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600 cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660 cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720 gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780 cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840 tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900 gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960 cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020 tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080 tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140 aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200 tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260 ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320 atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380 cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440 accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500 atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560 atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620 gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680 gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740 acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800 attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860 cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920 acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980 acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040 ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100 ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160 gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220 cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280 cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340 cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400 gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460 actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520 ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580 caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640 tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700 cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760 acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820 cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880 tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940 gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000 gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060 cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120 caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180 ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240 cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300 gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360 aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420 catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480 tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540 cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600 agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660 tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720 ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780 taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840 gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900 cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960 ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020 cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080 caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aac 4133 <210> 31 <211> 5423 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 31 gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60 ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120 ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180 ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240 gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300 catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360 cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420 gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480 ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540 tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600 cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660 cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720 gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780 cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840 tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900 gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960 cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020 tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080 tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140 aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200 tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260 ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320 atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380 cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440 accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500 atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560 atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620 gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680 gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740 acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800 attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860 cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920 acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980 acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040 ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100 ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160 gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220 cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280 cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340 cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400 gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460 actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520 ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580 caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640 tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700 cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760 acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820 cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880 tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940 gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000 gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060 cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120 caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180 ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240 cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300 gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360 aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420 catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480 tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540 cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600 agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660 tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720 ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780 taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840 gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900 cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960 ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020 cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080 caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aacgttgtca 4140 ttttcatcct gacctctggg tccgcagctt ccggctcggc ctcccccgtc tggcataaaa 4200 tgacgagctc aacctttggc agcgattcat gcatgctctc ataaagcggc aaaagctggc 4260 taacgcccac gattgccttt acatcgccat ttgtcagcat ataaccaatt tctgtcggcg 4320 tgtacaacgg attgatggga acaactacga tcccagcttt taaagcgcca aaaaacgcga 4380 tgataaaatc aggcgaattg ccaagcagca aagctaaatg gtcccctttc tccataccgg 4440 cttcctgaag gccgtccgca aatcgctgaa tatattcatt cagctcttga tacgtcatca 4500 tgtgatcttt aaacctgcat gcgatgctgt cgggcttctc agatgctgtt tcttccaatt 4560 ttgaaacaag attcattctc ccacccctta agtgaatgaa tagtcattca ttattgaagc 4620 caagctttct tctccattat agagaaacag aaaaaaacac tcaagagcaa aaagccctga 4680 gtgtcagtac tgtcatagtt tcttcaatgc ttcggcaatc ggcgtatctc cttctgtcag 4740 atcaaaggcc cgattttccg tattcttctc atctaaagag gcaatgaccg tttttgcaac 4800 gtcatcacgg gaaataaatc cccgctccag atccttcgct gctgaaacag ttcccgttcc 4860 aggctcattg cgaaggcctc ccggacggat aatcgtatag gttaaaccgc tcgcttccag 4920 aattttatca gcataatgct tggccacata ataaggcttg agtgcctcat tccaattttc 4980 acggttatgg gcttgcaggg cgctgaccat aataaaccgt ttgattccgg caatggccgc 5040 agcttcaatg gcttttgccg ctccatcaag atccaccagc agcgttttat catagcctgt 5100 gctgccgccg gaaccggctg tgaaaatgat cgcgtcacaa ccttttgccg cagcggcgat 5160 ttcttccggg ctgccctcca gattcgcaag cacagcttct gcaccggcag cttcaagaga 5220 cgctttctgt tcttcttttc tgaccatcgc tctgatggaa tgatcaggat tatcttggaa 5280 taaagagacg agtctttgcc cgatttgtcc gttcgctccg attaaaaaca ctttcatgtg 5340 aatccctcct gcctccatta tttcaaaaac acaaccgctc tttcaaacga tgtgttttgc 5400 cttagtaaat cagatcaagg aaa 5423 <210> 32 <211> 6198 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 32 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000 taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060 aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120 agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180 agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240 gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300 ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360 ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420 tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480 cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540 atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600 gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660 gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720 gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780 gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840 agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900 gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960 gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020 attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080 agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140 caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200 aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260 taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500 agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560 ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620 aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680 gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740 ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800 gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860 aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920 aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980 aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040 aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100 tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160 atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220 tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280 gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340 ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400 tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460 gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520 ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580 ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640 tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700 ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760 gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820 tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880 ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940 ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000 cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060 tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120 aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180 cgcaatattt ttgcaaac 6198 <210> 33 <211> 7488 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 33 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000 taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060 aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120 agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180 agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240 gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300 ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360 ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420 tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480 cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540 atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600 gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660 gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720 gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780 gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840 agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900 gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960 gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020 attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080 agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140 caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200 aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260 taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320 ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380 acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440 cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500 agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560 ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620 aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680 gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740 ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800 gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860 aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920 aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980 aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040 aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100 tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160 atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220 tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280 gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340 ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400 tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460 gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520 ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580 ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640 tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700 ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760 gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820 tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880 ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940 ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000 cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060 tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120 aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180 cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240 tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300 ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360 agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420 gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480 aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540 tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600 ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660 atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720 aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780 caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840 aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900 tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960 tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020 gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080 accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140 ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200 cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260 cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320 tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380 ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440 cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488 <210> 34 <211> 6017 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 34 gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60 tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120 ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180 agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240 ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300 gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360 atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420 tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480 atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540 gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600 ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660 atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720 aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780 ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840 gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900 taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960 acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020 caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080 cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140 atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200 tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260 ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320 atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380 ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440 gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500 gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560 ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620 tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680 ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740 caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800 tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860 ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920 ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980 ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040 ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100 ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160 tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220 ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280 tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340 gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400 tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460 attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520 tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580 atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640 cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700 gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760 aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820 gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880 gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940 tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000 agctccggtc cttcctataa gcaggaaggt tttttaatga aatatttttt tattagtagg 3060 taaattcatc aaatgttctg ctatgctcca aatgtacacc tttccgtaag ggcaaagtca 3120 aatgtgaaaa aaaactgttc caaagttaat cagaaattta ttttcatatt gtatccttcg 3180 gtatcaagtg aaaggagcat catatgaaaa cattatggaa agtcctcaaa attgtttttg 3240 tcagcttggc tgctttggtt ttgcttgtat ccgtctcggt atttatttat caccatttcc 3300 agctaaataa ggaggcggca ctgctgaaag gtaaaggcac agtagtcgat gttgacggta 3360 aaaagatgaa tgtgtatcaa gagggaagcg ggaaggatac gtttgtgttt atgtccggtt 3420 cgggtattgc tgcgcctgct tatgaaatga aggggctgta cagcaagttt tcaaaagaaa 3480 ataagattgc tgttgtagat cgggcaggtt atggatacag tgaagtgtct cacgatgaca 3540 gagatattga tacggtattg gaacagacga ggaaagcgct tatgaaaagc ggaaataagc 3600 ctccttatat tttaatgcct cattcgatat ccgggattga agcgatgtat tgggcacaga 3660 aatatcctaa ggaaatcaag gccattattg cgatggatat tggattgccc cagcagtacg 3720 tcacgtataa attgagcgga gttgaccgat tgaaagtgag agggttccac ctgttaacct 3780 cgattggttt tcatcggttt ataccttccg ctgtatataa tcctgaggtg attcgacagt 3840 cgtttttaac tgatgaagaa aaagaaatct ataaagccat taactttaag caatttttta 3900 atgcagatat ggagcatgag cttttacagt cttaccaaaa cggcagcaaa tctgtgaatc 3960 tgcctgcgcc aaaggaaact cccgtcttga ttttagatgc agtctctgac caaaatagac 4020 attcaaagta tgctatacaa aaccgaaaag actatgaagc gtttgcggct caattcaata 4080 ctgccgatat aaaggaactg aggggaacac acagtattta tttatatcag cctgatcaaa 4140 tatataaact gtccatggag tttatgagaa aggttcgcta ggatgaaggg ttatcgtatt 4200 ttaatcgttg aggacgatgt gatgattggt gatttgctgc aaaagatttt gcagcgcgag 4260 ggatatcgtg tgatatggaa aacagatgga gcggatgtgc tttcggtgat tcagaaggtg 4320 gatttggtca ttatggatgt gatgctgccg ggtgaagacg ggtatcaaat gtctgcaaaa 4380 atcaaaaagc tggggctggg cattccggtt atttttctct cagcccgcaa tgacatggac 4440 agcaagcttc aaggtttgca gatcggcgag gattatatgg taaagccctt tgatccgaga 4500 gagctgctat taagaatgcg gaatatgctt gagcatcatt atgggacctt tacgcaaatc 4560 aaacatttgt atattgatgc ggtaacgaaa aaagtgttca atgaaagcct gcatgatgag 4620 gtattattta ctgcgattga gcggaaaatt ttcttttatt tatatgaaaa tagagacagt 4680 atcctgacaa aggaacattt ctttgaatat ctatggcagc tcgaagatag aaacccgaat 4740 attgtcaatg tgcatattaa aaaaattaga gctaaaatca atgatcaagc gggtgagatg 4800 attgaaaata tatatggaga agggtatcgg ctgaataccg ttgtgaagaa atgaagctca 4860 agacaaaata tcagttgtta ttgtttacgg ccgtcattag tgttccgatg ctattgctgg 4920 cggtcagtgt tttgatgtcg gtgatttatg acagcatgtt taaaccgatg aatcatggta 4980 tgccctttca caggtcgttt gcatacccgg caatgatcgt tgtatttttg atatcactct 5040 tattgttagc ttttttattt tcaaagtcga ttcattctct gttgcataaa atcaatctat 5100 taaatcaaac cattcggcat ttggcgagtg atcaaagggt gcccgataaa attgaagtga 5160 agcgtgctga tgaaatcggg gaactgatca agtcggtcaa tttgttaatt gaacggacga 5220 catatcgtga actggagctg agacagcagg aggaaatcaa aaaggagctt ttgcaaaaac 5280 tgcggcatga cattaataca cctttaacgg ctctcaggct gcagttattt tatttggaag 5340 accaatgtca tggtcaggct gtattcgaat cattgtatca gcaaatcgaa tatatctcgg 5400 aattaactaa tgaattcaat ctatattccg ctgagacgct ggaaagctct tatattgtaa 5460 atgaagaagt gcgtctaaac gagctattag aaacagcggt gaaaaagtgg gattatttat 5520 acagtatgag tgggattgag ctgcactata agccggcaga tcaagatgtg atatggatga 5580 gcaacacgtt atggatggaa aggctgtttg ataatatttt tcaaaatacg ttaaggcatt 5640 caaaagctaa aaagatggaa gtcacgattg aacatggcga tgtttttatt cgtgatgacg 5700 gtattggatt tgatcggaat gagagcagtg agggacttgg gttaaagatt attgaggata 5760 catgcaggct gcttgcgatt acttatgagc tgcatacaaa tgataacgga acggggttct 5820 tgttttcaaa agagtgaccc cgctgatgtt tttctttctc ctataaaatt tatataatag 5880 ggagaaagaa atggggtgaa catcatatgt ttaaaaaaat catcaaaacg attaagtacc 5940 tctcaagcag ttctagtgac cgatatcgca gacaccggca ttacagcagc agccggcgca 6000 gacattatcg cagctac 6017 <210> 35 <211> 3006 <212> DNA <213> Bacillus subtilis <400> 35 gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60 tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120 ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180 agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240 ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300 gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360 atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420 tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480 atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540 gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600 ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660 atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720 aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780 ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840 gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900 taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960 acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020 caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080 cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140 atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200 tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260 ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320 atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380 ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440 gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500 gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560 ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620 tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680 ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740 caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800 tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860 ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920 ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980 ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040 ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100 ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160 tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220 ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280 tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340 gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400 tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460 attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520 tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580 atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640 cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700 gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760 aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820 gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880 gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940 tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000 agctcc 3006 <210> 36 <211> 3032 <212> DNA <213> Bacillus subtilis <400> 36 ggaaaattag gggtgagctc cggtccttcc tataagcagg aaggtttttt aatgaaatat 60 ttttttatta gtaggtaaat tcatcaaatg ttctgctatg ctccaaatgt acacctttcc 120 gtaagggcaa agtcaaatgt gaaaaaaaac tgttccaaag ttaatcagaa atttattttc 180 atattgtatc cttcggtatc aagtgaaagg agcatcatat gaaaacatta tggaaagtcc 240 tcaaaattgt ttttgtcagc ttggctgctt tggttttgct tgtatccgtc tcggtattta 300 tttatcacca tttccagcta aataaggagg cggcactgct gaaaggtaaa ggcacagtag 360 tcgatgttga cggtaaaaag atgaatgtgt atcaagaggg aagcgggaag gatacgtttg 420 tgtttatgtc cggttcgggt attgctgcgc ctgcttatga aatgaagggg ctgtacagca 480 agttttcaaa agaaaataag attgctgttg tagatcgggc aggttatgga tacagtgaag 540 tgtctcacga tgacagagat attgatacgg tattggaaca gacgaggaaa gcgcttatga 600 aaagcggaaa taagcctcct tatattttaa tgcctcattc gatatccggg attgaagcga 660 tgtattgggc acagaaatat cctaaggaaa tcaaggccat tattgcgatg gatattggat 720 tgccccagca gtacgtcacg tataaattga gcggagttga ccgattgaaa gtgagagggt 780 tccacctgtt aacctcgatt ggttttcatc ggtttatacc ttccgctgta tataatcctg 840 aggtgattcg acagtcgttt ttaactgatg aagaaaaaga aatctataaa gccattaact 900 ttaagcaatt ttttaatgca gatatggagc atgagctttt acagtcttac caaaacggca 960 gcaaatctgt gaatctgcct gcgccaaagg aaactcccgt cttgatttta gatgcagtct 1020 ctgaccaaaa tagacattca aagtatgcta tacaaaaccg aaaagactat gaagcgtttg 1080 cggctcaatt caatactgcc gatataaagg aactgagggg aacacacagt atttatttat 1140 atcagcctga tcaaatatat aaactgtcca tggagtttat gagaaaggtt cgctaggatg 1200 aagggttatc gtattttaat cgttgaggac gatgtgatga ttggtgattt gctgcaaaag 1260 attttgcagc gcgagggata tcgtgtgata tggaaaacag atggagcgga tgtgctttcg 1320 gtgattcaga aggtggattt ggtcattatg gatgtgatgc tgccgggtga agacgggtat 1380 caaatgtctg caaaaatcaa aaagctgggg ctgggcattc cggttatttt tctctcagcc 1440 cgcaatgaca tggacagcaa gcttcaaggt ttgcagatcg gcgaggatta tatggtaaag 1500 ccctttgatc cgagagagct gctattaaga atgcggaata tgcttgagca tcattatggg 1560 acctttacgc aaatcaaaca tttgtatatt gatgcggtaa cgaaaaaagt gttcaatgaa 1620 agcctgcatg atgaggtatt atttactgcg attgagcgga aaattttctt ttatttatat 1680 gaaaatagag acagtatcct gacaaaggaa catttctttg aatatctatg gcagctcgaa 1740 gatagaaacc cgaatattgt caatgtgcat attaaaaaaa ttagagctaa aatcaatgat 1800 caagcgggtg agatgattga aaatatatat ggagaagggt atcggctgaa taccgttgtg 1860 aagaaatgaa gctcaagaca aaatatcagt tgttattgtt tacggccgtc attagtgttc 1920 cgatgctatt gctggcggtc agtgttttga tgtcggtgat ttatgacagc atgtttaaac 1980 cgatgaatca tggtatgccc tttcacaggt cgtttgcata cccggcaatg atcgttgtat 2040 ttttgatatc actcttattg ttagcttttt tattttcaaa gtcgattcat tctctgttgc 2100 ataaaatcaa tctattaaat caaaccattc ggcatttggc gagtgatcaa agggtgcccg 2160 ataaaattga agtgaagcgt gctgatgaaa tcggggaact gatcaagtcg gtcaatttgt 2220 taattgaacg gacgacatat cgtgaactgg agctgagaca gcaggaggaa atcaaaaagg 2280 agcttttgca aaaactgcgg catgacatta atacaccttt aacggctctc aggctgcagt 2340 tattttattt ggaagaccaa tgtcatggtc aggctgtatt cgaatcattg tatcagcaaa 2400 tcgaatatat ctcggaatta actaatgaat tcaatctata ttccgctgag acgctggaaa 2460 gctcttatat tgtaaatgaa gaagtgcgtc taaacgagct attagaaaca gcggtgaaaa 2520 agtgggatta tttatacagt atgagtggga ttgagctgca ctataagccg gcagatcaag 2580 atgtgatatg gatgagcaac acgttatgga tggaaaggct gtttgataat atttttcaaa 2640 atacgttaag gcattcaaaa gctaaaaaga tggaagtcac gattgaacat ggcgatgttt 2700 ttattcgtga tgacggtatt ggatttgatc ggaatgagag cagtgaggga cttgggttaa 2760 agattattga ggatacatgc aggctgcttg cgattactta tgagctgcat acaaatgata 2820 acggaacggg gttcttgttt tcaaaagagt gaccccgctg atgtttttct ttctcctata 2880 aaatttatat aatagggaga aagaaatggg gtgaacatca tatgtttaaa aaaatcatca 2940 aaacgattaa gtacctctca agcagttcta gtgaccgata tcgcagacac cggcattaca 3000 gcagcagccg gcgcagacat tatcgcagct ac 3032 <210> 37 <211> 6087 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 37 cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60 acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120 cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180 tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240 cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300 cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360 cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420 agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480 cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540 gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600 gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660 atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720 gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780 accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840 tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900 gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960 atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020 agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080 tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140 gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200 acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260 cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320 gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380 tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440 taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500 gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560 tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620 atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680 aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740 aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800 taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860 gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920 gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980 ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040 agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100 tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160 tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220 tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280 cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340 ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400 atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460 cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520 ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580 ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640 tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700 cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760 accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820 agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880 ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940 ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000 acttaattaa tttggtaacg taatataatt ggagaatttg gttattctgc tttcagcaca 3060 atggttttcg cagccatatc atgaacggtt tgttttttct tcgtaaatgc ggcagtcaaa 3120 tagatcaggc gggagaacac atgcacccac gctatcaggt aacggacaat ggcttgcggg 3180 aaggatattt ttttatatgt ttcgtccctc acgatttgca gcccgatgat ttttttgccc 3240 agtgtgccct tccaatttgt cagcggcatc agcaaagggt acacaatcag catcaatatg 3300 gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa atccggctgc caaaatcact 3360 gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc gcagcatgaa accagctagt 3420 tccaatagaa acactcctta aaatgttaaa taaacaccta atgattgtaa aaaagaaggg 3480 cctaaagtgg gaataggtga taagccttaa atcacaaaag ttggtgaaaa tgtcataggt 3540 aaattggcat aatcagccag cttatcacat taccaaattc ttttttagcc cgaaaccaag 3600 ccctcagaag ttatttttgt taaaatagaa aagttacaac agaattcgga gggtttattg 3660 tgggaaaagt gaaacgaaat gccccttgcc catgcggcag cggcaagaaa tataaaaaat 3720 gctgcggaag taaagttgtc gacttcccgg cggaactagc ggcaaaagaa gcgaaacaaa 3780 ttcaggaaga cttagtggag tatgccttca cagtacatag agaaagcatt tcaggcttta 3840 tcaaccagca tgattttctt tctgctatgg acagacagac gaaagacatc agcgtattta 3900 acttaggaat ctggggaatc ttcttccacc cgcttgctgg tgagaagaca atcttcgaag 3960 agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa aacgcgtgag atcgtagaat 4020 catggcagag catgacgcct gctttattgc tgctgaagga cctgaaggaa ggcatcattc 4080 actttgaaga tgtcattacg gcaaaacaat tcgaagtgga aatggacgcc agcaatcaag 4140 accttcctcc agtgggaagc ctgattcttg gatacccaat ccacgaagcg gaaaaagcag 4200 aattcttcat gcagttcacg atcttcccgg tgaagagaac agaagcgctg atcagcaagg 4260 tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac gccggaggac ttcatgaagc 4320 aggaattcaa caacgttctg ttcgcgttgt tagctgagaa agatgaagag ccacaagcag 4380 agaaagcgga agtaagcact gttgagtggg caaacgactt ggagaaagaa accgctgcgg 4440 ctattgaaga aggcatgagc ggggaagagt atccgactga attgatccca gctgttattg 4500 acatctggaa aacattctgc gagaaaaaat cacctgtcat cagaaagccg gaagcttttg 4560 cggcggcagt tgaatattat gtaaacgcaa tttctcttaa cggcgcgtcc gtttcccagg 4620 ctaaactggc gaaaaaatac ggcgttagcg catcaacgat ttccagccgt tacaaagaaa 4680 ttgaaagcac gctgcaagat gaagcagatc gttttgcaca agcgttatcc tcataatgga 4740 aaaaaccttg aaaagccagg cttttcaagg tttttttatt tctgaaacgg aattttgatt 4800 tctaaccgga agatggggtg gcggtaggta aaatccagcc tgccaaaagc gcccttcacc 4860 agtttttgaa tgatatatgt gcccatgcct tcatgagcgc cgtttttcgt tgagcggcca 4920 aacgattgat aaattgtatc gagcactttt gggtccatcc cgggagtgct gttttcacaa 4980 gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt taatctctgc tttttctcgg 5040 gcctccgccg cgctgtcgag cgcattttct aatatgttgc cgaccaagct gacctgatca 5100 gcaggcgaaa acggaaggga agaaagcggt gtatgcatat gcagcgaaac actcacattc 5160 gaggcgcggg ctttttctaa aaaatcataa agcacccctg caacgtacgc gttctctcct 5220 ttcaaaaaac ggtcatattg gctgtattga tccgcccagt tttgaatata tgcttgtgta 5280 tctgccttgg gctgagctga tttgattgca gtgatatgtt tcattgtgtc atgattccgg 5340 cttctgacat caatcagcat ttgattggcg tgctgttcag cttgagtcag cttatcaatt 5400 tgatcagaaa gccttgcctg caaagcagac tgtccgatac ggagcccttc acaccctgca 5460 aatatcgcga ttacacataa taccggcatg atgtctgtgc caatcaacac cactcccacc 5520 gacatcactt gaatcaccgc aatccacgca caaagccctg aggaacagtg tttccacacc 5580 cgcttcgtat tccaaatgta caatcctgca gcagctgcgc ctaaagcagc ggcgagccaa 5640 gaggcggctg tgctgtgtga aaaagcagca gctccctgat aacatatgaa actaaataaa 5700 atcagataaa gacattgaaa aagggtaatc acgtactaaa ctcctcaaaa atagtagttt 5760 tgaaaataat caagctgctg cttagtgatc atcgcttttt tagacgttcc ctcaaaggaa 5820 actgtgaatg aatgcttggt ataagcggaa aaatgcttta tgtaatgaat gttgataata 5880 aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt cgcctttaat atcatttaat 5940 gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg tcgtcgaacg tcccgtccgt 6000 tctgcgaaaa taatatcctt cttttgcagg acgtgcattt cagacttttg ctttatcaat 6060 atacgcccat tcaaactcgt ttccgtt 6087 <210> 38 <211> 3040 <212> DNA <213> Bacillus subtilis <400> 38 cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60 acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120 cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180 tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240 cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300 cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360 cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420 agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480 cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540 gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600 gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660 atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720 gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780 accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840 tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900 gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960 atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020 agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080 tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140 gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200 acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260 cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320 gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380 tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440 taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500 gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560 tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620 atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680 aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740 aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800 taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860 gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920 gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980 ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040 agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100 tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160 tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220 tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280 cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340 ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400 atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460 cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520 ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580 ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640 tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700 cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760 accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820 agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880 ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940 ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000 acttaattaa tttggtaacg taatataatt ggagaatttg 3040 <210> 39 <211> 3047 <212> DNA <213> Bacillus subtilis <400> 39 gttattctgc tttcagcaca atggttttcg cagccatatc atgaacggtt tgttttttct 60 tcgtaaatgc ggcagtcaaa tagatcaggc gggagaacac atgcacccac gctatcaggt 120 aacggacaat ggcttgcggg aaggatattt ttttatatgt ttcgtccctc acgatttgca 180 gcccgatgat ttttttgccc agtgtgccct tccaatttgt cagcggcatc agcaaagggt 240 acacaatcag catcaatatg gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa 300 atccggctgc caaaatcact gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc 360 gcagcatgaa accagctagt tccaatagaa acactcctta aaatgttaaa taaacaccta 420 atgattgtaa aaaagaaggg cctaaagtgg gaataggtga taagccttaa atcacaaaag 480 ttggtgaaaa tgtcataggt aaattggcat aatcagccag cttatcacat taccaaattc 540 ttttttagcc cgaaaccaag ccctcagaag ttatttttgt taaaatagaa aagttacaac 600 agaattcgga gggtttattg tgggaaaagt gaaacgaaat gccccttgcc catgcggcag 660 cggcaagaaa tataaaaaat gctgcggaag taaagttgtc gacttcccgg cggaactagc 720 ggcaaaagaa gcgaaacaaa ttcaggaaga cttagtggag tatgccttca cagtacatag 780 agaaagcatt tcaggcttta tcaaccagca tgattttctt tctgctatgg acagacagac 840 gaaagacatc agcgtattta acttaggaat ctggggaatc ttcttccacc cgcttgctgg 900 tgagaagaca atcttcgaag agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa 960 aacgcgtgag atcgtagaat catggcagag catgacgcct gctttattgc tgctgaagga 1020 cctgaaggaa ggcatcattc actttgaaga tgtcattacg gcaaaacaat tcgaagtgga 1080 aatggacgcc agcaatcaag accttcctcc agtgggaagc ctgattcttg gatacccaat 1140 ccacgaagcg gaaaaagcag aattcttcat gcagttcacg atcttcccgg tgaagagaac 1200 agaagcgctg atcagcaagg tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac 1260 gccggaggac ttcatgaagc aggaattcaa caacgttctg ttcgcgttgt tagctgagaa 1320 agatgaagag ccacaagcag agaaagcgga agtaagcact gttgagtggg caaacgactt 1380 ggagaaagaa accgctgcgg ctattgaaga aggcatgagc ggggaagagt atccgactga 1440 attgatccca gctgttattg acatctggaa aacattctgc gagaaaaaat cacctgtcat 1500 cagaaagccg gaagcttttg cggcggcagt tgaatattat gtaaacgcaa tttctcttaa 1560 cggcgcgtcc gtttcccagg ctaaactggc gaaaaaatac ggcgttagcg catcaacgat 1620 ttccagccgt tacaaagaaa ttgaaagcac gctgcaagat gaagcagatc gttttgcaca 1680 agcgttatcc tcataatgga aaaaaccttg aaaagccagg cttttcaagg tttttttatt 1740 tctgaaacgg aattttgatt tctaaccgga agatggggtg gcggtaggta aaatccagcc 1800 tgccaaaagc gcccttcacc agtttttgaa tgatatatgt gcccatgcct tcatgagcgc 1860 cgtttttcgt tgagcggcca aacgattgat aaattgtatc gagcactttt gggtccatcc 1920 cgggagtgct gttttcacaa gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt 1980 taatctctgc tttttctcgg gcctccgccg cgctgtcgag cgcattttct aatatgttgc 2040 cgaccaagct gacctgatca gcaggcgaaa acggaaggga agaaagcggt gtatgcatat 2100 gcagcgaaac actcacattc gaggcgcggg ctttttctaa aaaatcataa agcacccctg 2160 caacgtacgc gttctctcct ttcaaaaaac ggtcatattg gctgtattga tccgcccagt 2220 tttgaatata tgcttgtgta tctgccttgg gctgagctga tttgattgca gtgatatgtt 2280 tcattgtgtc atgattccgg cttctgacat caatcagcat ttgattggcg tgctgttcag 2340 cttgagtcag cttatcaatt tgatcagaaa gccttgcctg caaagcagac tgtccgatac 2400 ggagcccttc acaccctgca aatatcgcga ttacacataa taccggcatg atgtctgtgc 2460 caatcaacac cactcccacc gacatcactt gaatcaccgc aatccacgca caaagccctg 2520 aggaacagtg tttccacacc cgcttcgtat tccaaatgta caatcctgca gcagctgcgc 2580 ctaaagcagc ggcgagccaa gaggcggctg tgctgtgtga aaaagcagca gctccctgat 2640 aacatatgaa actaaataaa atcagataaa gacattgaaa aagggtaatc acgtactaaa 2700 ctcctcaaaa atagtagttt tgaaaataat caagctgctg cttagtgatc atcgcttttt 2760 tagacgttcc ctcaaaggaa actgtgaatg aatgcttggt ataagcggaa aaatgcttta 2820 tgtaatgaat gttgataata aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt 2880 cgcctttaat atcatttaat gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg 2940 tcgtcgaacg tcccgtccgt tctgcgaaaa taatatcctt cttttgcagg acgtgcattt 3000 cagacttttg ctttatcaat atacgcccat tcaaactcgt ttccgtt 3047 <210> 40 <211> 864 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 40 gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60 ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120 acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180 gtgcaaaaga ttctcaaaga gactaaagtc aaaaaggtga atttgatcgg gcactcccaa 240 ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300 tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360 aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420 agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480 acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540 gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600 cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660 gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720 cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780 gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840 tttttagcgt caaaaaagct ctaa 864 <210> 41 <211> 7380 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 41 gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60 atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120 agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180 tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240 acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300 atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360 tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420 ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480 agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540 aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600 tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660 gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720 atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780 ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840 ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900 accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960 acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020 ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080 agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140 tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200 aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260 agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320 gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380 tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440 tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500 caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560 gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620 ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680 tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740 gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800 taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860 actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920 gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980 aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040 acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100 gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160 ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220 atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280 tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340 tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400 acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460 gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520 ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580 tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640 aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700 aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760 cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820 ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880 attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940 aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000 acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060 atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120 ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180 ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240 ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300 ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360 gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420 tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480 gaatttgatc gggcacgcgc aaggtcctct tgcgtgtcgt tatgtggcgg ccaagcatgc 3540 taaaagtatt gcaagtgtta catctgtgaa tggagtgaat cacggtagcg aaatcgccga 3600 tcttgtcaga cggattatga gaaaagattc tgtccctgag tatatcgcgg acgcggtaat 3660 gaaggctatt ggcactataa tcagtacttt tagcggaaat agaggaaacc ctcaagacgc 3720 tatagcagct ctggaggcct taacgacgga aaacgtgatg gaatttaaca aaaaatatcc 3780 tcagggactg ccagcaattc gtgggggtga aggtaaagaa gtcgtgaacg gcgtacacta 3840 ctatagcttt ggttcttaca tacagggtct catcgctggc gagaagggaa acttgctcga 3900 tcctacccac gccgctatgc gcgttttatc cgcgtttttt tcagaacgtg agaacgatgg 3960 tttagtagga cggacttcaa tgcggctcgg caagttaatt aaagacgact acgctgagga 4020 tcatttagat atggtcaatc aagttgcggg gttagttgga cgcggggagg atataattgc 4080 tatatatacg aatcatgcca attttttagc gtcaaaaaag ctctaatcta gatacataaa 4140 aaaccggcct tggccccgcc ggttttttat tatttttctt cctccgcatg ttcaatccgc 4200 tccataatcg acggatggct ccctctgaaa attttaacga gaaacggcgg gttgacccgg 4260 ctcagtcccg taacggccaa gtcctgaaac gtctcaatcg ccgcttcccg gtttccggtc 4320 agctcaatgc cgtaacggtc ggcggcgttt tcctgatacc gggagacggc attcgtaatc 4380 aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 4440 gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 4500 aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 4560 cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 4620 ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 4680 aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 4740 aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 4800 attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 4860 caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 4920 ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 4980 tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 5040 aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 5100 ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 5160 gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 5220 cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 5280 aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 5340 ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 5400 tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 5460 cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 5520 cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 5580 accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 5640 gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 5700 atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 5760 agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 5820 catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 5880 ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 5940 cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 6000 atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 6060 cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 6120 gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 6180 aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 6240 tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 6300 aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 6360 cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 6420 cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 6480 ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 6540 attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 6600 agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 6660 tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 6720 tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 6780 cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 6840 gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 6900 caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 6960 atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 7020 tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 7080 gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 7140 tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 7200 tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 7260 ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 7320 tgttttgcct tagtaaatca gatcaaggaa atcctctttc gtaatgttcc caaagtaatg 7380 <210> 42 <211> 94 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 42 gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaagttgt 60 tgacttaaaa gaagctaaat gttatagtaa taaa 94 <210> 43 <211> 39 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 43 cacgcaagag gaccttgcgc gtgcccgatc aaattcacc 39 <210> 44 <211> 3516 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 44 gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60 atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120 agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180 tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240 acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300 atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360 tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420 ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480 agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540 aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600 tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660 gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720 atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780 ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840 ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900 accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960 acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020 ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080 agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140 tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200 aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260 agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320 gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380 tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440 tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500 caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560 gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620 ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680 tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740 gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800 taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860 actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920 gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980 aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040 acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100 gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160 ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220 atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280 tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340 tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400 acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460 gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520 ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580 tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640 aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700 aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760 cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820 ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880 attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940 aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000 acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060 atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120 ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180 ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240 ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300 ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360 gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420 tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480 gaatttgatc gggcacgcgc aaggtcctct tgcgtg 3516 <210> 45 <211> 39 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 45 ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtg 39 <210> 46 <211> 28 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 46 cattactttg ggaacattac gaaagagg 28 <210> 47 <211> 3903 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 47 ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 60 tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 120 cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 180 aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 240 cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 300 tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 360 ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 420 cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 480 tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 540 ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 600 tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 660 aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 720 cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 780 cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 840 gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 900 atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 960 ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 1020 gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 1080 aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 1140 atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 1200 aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 1260 agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 1320 ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 1380 ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 1440 ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 1500 atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 1560 cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 1620 ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 1680 ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 1740 ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 1800 aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 1860 gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 1920 gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 1980 gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 2040 aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 2100 aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 2160 aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 2220 gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 2280 aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 2340 attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 2400 cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 2460 tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 2520 atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 2580 aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 2640 ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 2700 caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 2760 ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 2820 aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 2880 ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 2940 atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 3000 ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 3060 attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 3120 aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 3180 ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 3240 gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 3300 gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 3360 ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 3420 ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 3480 gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 3540 tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 3600 gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 3660 gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 3720 ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 3780 actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 3840 atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 3900 atg 3903 <210> 48 <211> 7334 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 48 tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60 ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120 tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180 cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240 gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300 ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360 cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420 gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480 gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540 gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600 ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660 ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720 gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780 tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840 cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900 gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960 ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020 ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080 aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140 atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200 gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260 tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320 aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380 cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440 agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500 tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560 gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620 aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680 aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740 ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800 catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860 ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920 cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980 accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040 tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100 cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160 ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220 cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280 tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340 ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400 agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460 gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520 taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580 acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640 agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700 ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760 aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820 cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880 taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940 ccattgttct cacggaagca cacgcgtcgc tgataaacag ctgacatcaa tatcctattt 3000 tttcaaaaaa tattttaaaa gttgttgact taaaagaagc taaatgttat agtaataaaa 3060 cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg gtaaagaaag 3120 ccgccaggaa aaacttgtct gaatagtacg gttgcaattt ttaggggaaa cagatatact 3180 taagtgtaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 3240 aaagagtgtc aacaacatat cctattgtcc tggtacacgg cctttctggt ttcgatgaca 3300 tcgtaggata cccttatttt tatgggattg ccgacgccct ggagaaagat ggccacaaag 3360 tttttacagc ctcactctct gcattcaatt ccaacgaagt ccgtggcgag caattatggg 3420 agttcgtgca aaagattctc aaagagacta aagtcaaaaa ggtgaatttg atcgggcacg 3480 cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca tgctaaaagt attgcaagtg 3540 ttacatctgt gaatggagtg aatcacggta gcgaaatcgc cgatcttgtc agacggatta 3600 tgagaaaaga ttctgtccct gagtatatcg cggacgcggt aatgaaggct attggcacta 3660 taatcagtac ttttagcgga aatagaggaa accctcaaga cgctatagca gctctggagg 3720 ccttaacgac ggaaaacgtg atggaattta acaaaaaata tcctcaggga ctgccagcaa 3780 ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca ctactatagc tttggttctt 3840 acatacaggg tctcatcgct ggcgagaagg gaaacttgct cgatcctacc cacgccgcta 3900 tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga tggtttagta ggacggactt 3960 caatgcggct cggcaagtta attaaagacg actacgctga ggatcattta gatatggtca 4020 atcaagttgc ggggttagtt ggacgcgggg aggatataat tgctatatat acgaatcatg 4080 ccaatttttt agcgtcaaaa aagctctaat ctagatacat aaaaaaccgg ccttggcccc 4140 gccggttttt tattattttt cttcctccgc atgttcaatc cgctccataa tcgacggatg 4200 gctccctctg aaaattttaa cgagaaacgg cgggttgacc cggctcagtc ccgtaacggc 4260 caagtcctga aacgtctcaa tcgccgcttc ccggtttccg gtcagctcaa tgccgtaacg 4320 gtcggcggcg ttttcctgat accgggagac ggcattcgta atcaacgcct cactcctcac 4380 atcaacccgt tacttctatt gtaatcataa attcaaattc ttagaaccaa gctgtgttcc 4440 gcacttttcc acccttttaa gcatggaaac cccgatcgct gggaaaacta acaatgtttg 4500 gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt aatcggtctt gtgtttatcg 4560 cattttttta tctttacagc cgatcaggcg atgtgtatca atcggtagac gcggatttga 4620 tcacactgtc ttcaagcggc caggaagata tcgagattga aaaaagacag cacgtcaaag 4680 atatgctgga tattatgaat cagggaaaac aggtgaagac agaaaaaaca tcagcccctg 4740 attacgaagg gacaatcaag tttcataaag accggtatga ctcattcaga ctatggattg 4800 acggcagcca gcaagccgtt tttttgaagg atggcacata ctacaaatta agcaaaaatg 4860 atacaaaggc gctgctaaat attattaaaa aagaagcaaa ggattgaaaa tgaaaaagcg 4920 aagctaaccg cttcgctttt tcattttatt ggggcaaaat atctctcagt gcccgtctga 4980 gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa cgtaatggcg gcaggccgct 5040 tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc ctcctctgtt accccagagc 5100 gtttcggcac cacatatccc tttaccgctt ccccgctttg ggggtccggc acgccgatga 5160 caaccgcctc cttgacgtcc ggatggctgt acagcacctc ctccacctcc cgcggataca 5220 cattgtatcc tcctacaatg atcatgtctt ttttccggtc aacaatgtaa aaatagccgt 5280 cctcatcccg tcttgccaag tcccccgtat aaagccaccc gtcttttaat gcatgctctg 5340 tttccatcgg cattttataa tagcccttca tcacattggg gcctttcacg atcaattcgc 5400 cgacctggtg agcgggcagc tcgcgtccga gcggatctac gaccttgttt tcgacatgta 5460 agatacttgt cccgatggag cccggctttc tgcccctgtc aaacgggtta aagcacgtga 5520 cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt aacaccgaat ttttcttcaa 5580 acgccgtcag caacgcgact ggcatggacg cgcctcccga aatgcacagc cggatcgaag 5640 aaaaatcatc tttctttccg ttttcatgct gaaacaagta gttatacatt gtaggcacac 5700 cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa aacagatgcc ggactgaatt 5760 gaggctcaat caatacagtt gcgccgctca tcagcggtgc attcatacag acggttaaac 5820 aaaacacgtg aaacatggga agagcgcaga ccacattgtc cctctcatcc attcccaaat 5880 agcctgcgac atcgttggca ttgctgtaca aattctgatg tgtcagcatc gcgcctttcg 5940 gttttccagt cgttcctgac gtatataaaa taaccgcggt atcatcaggt acaggttctt 6000 ggttttgttt agcggcagat gtcggccgca atatttttgc aaacgttgtc attttcatcc 6060 tgacctctgg gtccgcagct tccggctcgg cctcccccgt ctggcataaa atgacgagct 6120 caacctttgg cagcgattca tgcatgctct cataaagcgg caaaagctgg ctaacgccca 6180 cgattgcctt tacatcgcca tttgtcagca tataaccaat ttctgtcggc gtgtacaacg 6240 gattgatggg aacaactacg atcccagctt ttaaagcgcc aaaaaacgcg atgataaaat 6300 caggcgaatt gccaagcagc aaagctaaat ggtccccttt ctccataccg gcttcctgaa 6360 ggccgtccgc aaatcgctga atatattcat tcagctcttg atacgtcatc atgtgatctt 6420 taaacctgca tgcgatgctg tcgggcttct cagatgctgt ttcttccaat tttgaaacaa 6480 gattcattct cccacccctt aagtgaatga atagtcattc attattgaag ccaagctttc 6540 ttctccatta tagagaaaca gaaaaaaaca ctcaagagca aaaagccctg agtgtcagta 6600 ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct ccttctgtca gatcaaaggc 6660 ccgattttcc gtattcttct catctaaaga ggcaatgacc gtttttgcaa cgtcatcacg 6720 ggaaataaat ccccgctcca gatccttcgc tgctgaaaca gttcccgttc caggctcatt 6780 gcgaaggcct cccggacgga taatcgtata ggttaaaccg ctcgcttcca gaattttatc 6840 agcataatgc ttggccacat aataaggctt gagtgcctca ttccaatttt cacggttatg 6900 ggcttgcagg gcgctgacca taataaaccg tttgattccg gcaatggccg cagcttcaat 6960 ggcttttgcc gctccatcaa gatccaccag cagcgtttta tcatagcctg tgctgccgcc 7020 ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc gcagcggcga tttcttccgg 7080 gctgccctcc agattcgcaa gcacagcttc tgcaccggca gcttcaagag acgctttctg 7140 ttcttctttt ctgaccatcg ctctgatgga atgatcagga ttatcttgga ataaagagac 7200 gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac actttcatgt gaatccctcc 7260 tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg atgtgttttg ccttagtaaa 7320 tcagatcaag gaaa 7334 <210> 49 <211> 25 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 49 gaagctgaat gagatttctt aaggc 25 <210> 50 <211> 23 <212> DNA <213> artificial sequence <220> <223> synthesized sequence <400> 50 aaggaggctt atttccgctt ttc 23

Claims (16)

  1. 선택 가능한 마커의 사용 없이 공여 DNA를 바실러스 종 세포의 게놈 내에 통합시키기 위한 방법으로서,
    수용능 바실러스 종(competent Bacillus sp.)의 세포 개체군을 제공하는 단계; 및 선형 DNA 작제물을 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹(flanking)된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인, 방법.
  2. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내의 뉴클레오타이드 서열을 결실시키기 위한 방법으로서,
    수용능 바실러스 종 세포의 개체군을 제공하는 단계; 및 선형 DNA 작제물을 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대한 서열 상동성을 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인, 방법.
  3. 제1항 또는 제2항에 있어서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는 것인 방법.
  4. 제1항 또는 제2항에 있어서, 상기 선형 DNA 작제물은 이중 가닥 DNA인 것인 방법.
  5. 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 렌투스(Bacillus lentus), 바실러스 브레비스(Bacillus brevis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 클라우시(Bacillus clausii), 바실러스 할로두란스(Bacillus halodurans), 바실러스 메가테리움(Bacillus megaterium), 바실러스 코아귤란스(Bacillus coagulans), 바실러스 서큘란스(Bacillus circulans), 바실러스 라우투스(Bacillus lautus) 및 바실러스 투링기엔시스(Bacillus thuringiensis)로 이루어진 군으로부터 선택되는 것인 방법.
  6. 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되는 것인 방법.
  7. 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 초수용능 바실러스 종 균주에서 유래하는 것인 방법.
  8. 제8항에 있어서, 상기 초수용능 바실러스 종 균주는 Pxyl-ComK 균주인 것인 방법.
  9. 제1항에 있어서, 상기 공여 DNA는 관심 폴리뉴클레오타이드, 관심 유전자, 복수개의 관심 유전자, 하나 이상의 재조합 DNA, 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열을 포함하는 것인 방법.
  10. 제1항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
  11. 제2항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
  12. 제2항에 있어서, 상기 선형 DNA 작제물은 상기 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 추가로 포함하며, 이때 상기 공여 DNA는 상기 바실러스 종 세포의 게놈 내에 삽입되는 반면, 상기 뉴클레오타이드 서열은 상기 바실러스 종 세포의 상기 게놈에서 결실되는 것인 방법.
  13. 제12항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖고 이의 게놈 내에 통합된 공여 DNA를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
  14. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법으로서,
    수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
  15. 제14항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 돌연변이를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
  16. 제1항, 제2항 및 제14항 중 어느 한 항의 방법에 따라 생산된 단리된 바실러스 종 세포.
KR1020227020443A 2019-11-19 2020-11-18 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 KR20220098245A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962937372P 2019-11-19 2019-11-19
US62/937,372 2019-11-19
PCT/US2020/060988 WO2021101950A1 (en) 2019-11-19 2020-11-18 Selection marker free methods for modifying the genome of bacillus and compositions thereof

Publications (1)

Publication Number Publication Date
KR20220098245A true KR20220098245A (ko) 2022-07-11

Family

ID=73793838

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227020443A KR20220098245A (ko) 2019-11-19 2020-11-18 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법

Country Status (6)

Country Link
US (1) US20220389459A1 (ko)
EP (1) EP4061939A1 (ko)
JP (1) JP2023502967A (ko)
KR (1) KR20220098245A (ko)
CN (1) CN114981428A (ko)
WO (1) WO2021101950A1 (ko)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
TW261517B (ko) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
EP1309677B2 (en) 2000-08-11 2012-04-11 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
AU2003230981A1 (en) 2002-04-22 2003-11-03 Genencor International, Inc. Methods of creating modified promoters resulting in varying levels of gene expression
US20050221446A1 (en) 2004-03-31 2005-10-06 Novozymes Biopolymer A/S. Methods for producing hyaluronic acid in a Bacillus cell
EP2325332B1 (en) 2005-08-26 2012-10-31 DuPont Nutrition Biosciences ApS Use of CRISPR associated genes (CAS)
CN104053780A (zh) 2011-12-09 2014-09-17 丹尼斯科美国公司 用于在微生物中生产蛋白质的来自枯草芽孢杆菌的核糖体启动子
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
CN104232674A (zh) * 2014-07-15 2014-12-24 广东肇庆星湖生物科技股份有限公司 一种提高解淀粉芽孢杆菌生产鸟苷产量的方法

Also Published As

Publication number Publication date
JP2023502967A (ja) 2023-01-26
WO2021101950A1 (en) 2021-05-27
US20220389459A1 (en) 2022-12-08
EP4061939A1 (en) 2022-09-28
CN114981428A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
KR102375732B1 (ko) 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
US6808896B2 (en) Method for stable chromosomal multi-copy integration of genes
JP4571304B2 (ja) バチルス細胞内でのポリペプチドの製法
DK2235176T3 (en) IMPROVED PROTEIN MANUFACTURING IN BACILLUS
US20220162621A1 (en) Methods For Polynucleotide Integration Into The Genome Of Bacillus Using Dual Circular Recombinant DNA Constructs And Compositions Thereof
US20220177923A1 (en) Methods for integrating a donor DNA sequence into the genome of bacillus using linear recombinant DNA constructs and compositions thereof
DK2206788T3 (en) A recombinant microorganism
EP2152732A1 (en) A modified secretion system to increase expression of polypeptides in bacteria
Vasil et al. Regulation of exotoxin A synthesis in Pseudomonas aeruginosa: characterization of toxA‐lacZ fusions in wild‐type and mutant strains
KR20220098245A (ko) 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법
US8535911B2 (en) Cell with improved secretion mediated by MrgA protein or homologue
CN116897160A (zh) 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
KR20220097505A (ko) 바실러스 세포에서 단백질 생산을 향상시키기 위한 조성물 및 방법
DK1297170T3 (en) A process for stable chromosomal integration of multiple copies of the genes
Anandan et al. Identification of two classes of transcriptional regulator genes in the cyanobacterium Synechococcus sp. strain PCC 7942
JP4749060B2 (ja) 新規プロモーターdna及び該dnaを用いたタンパク質の生産方法
CN111630165A (zh) 通过抑制条件性必需基因进行反向选择
Lee et al. Cloning and mulecular characterization of a nprX gene of bacillus subtilis NS15-4 encoding a neutral protease