KR20220098245A - 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 - Google Patents
바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 Download PDFInfo
- Publication number
- KR20220098245A KR20220098245A KR1020227020443A KR20227020443A KR20220098245A KR 20220098245 A KR20220098245 A KR 20220098245A KR 1020227020443 A KR1020227020443 A KR 1020227020443A KR 20227020443 A KR20227020443 A KR 20227020443A KR 20220098245 A KR20220098245 A KR 20220098245A
- Authority
- KR
- South Korea
- Prior art keywords
- bacillus
- cell
- sequence
- dna
- genome
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/24—Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물이 제공된다. 본 개시내용은 선택 가능한 마커의 사용 없이 그리고 상기 게놈 내로의 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법뿐만 아니라, 관심 유전자를 결실시키고/시키거나 바실러스 종 세포의 게놈 내에 점 돌연변이를 제공하기 위한 방법을 포함한다.
Description
본 발명은 박테리아 분자 생물학 분야에 관한 것으로서, 보다 구체적으로 선택 가능한 마커의 사용 없이 그리고 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 조성물 및 방법에 관한 것이다.
관련 출원의 상호 참조
본 출원은 2019년 11월 19일자로 출원된 미국 특허 가출원 제62/937,372호의 이익을 주장하며, 그 전체가 본원에 참조로 포함된다.
전자로 제출된 서열 목록의 참조
본 서열 목록의 공식 사본은 2020년 11월 2일자로 작성되고 그 크기가 188 킬로바이트이며 본 명세서와 동시에 제출된 파일명 NB41425-WO-PCT_SequenceListing.txt의 ASCII 형식의 서열 목록으로서 EFS-Web을 통해 전자 제출되었다. 이러한 ASCII 형식의 문헌에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.
바실러스 종(Bacillus sp.)에서의 효소의 상업적 생산은 항생제 내성 마커-부재 균주의 제작 방법이 요구된다. 이들 방법은 몇몇 기준에 맞아야 하는데, 즉 (i) 관심 유전자의 삽입 및 숙주 변형 둘 모두에 유용해야 하고, (ii) 신속하고 효율적이어야 하고, (iii) 사용하기 쉬어야 한다.
바실러스 종의 염색체를 변경하기 위해 널리 사용되고 알려진 방법은 플라스미드 작제물을 구축하는 단계, 및 이들을 대장균(Escherichia coli) 내로 형질전환시키는 단계를 수반한다. 후속적으로, 선택 가능한 마커를 사용하여 플라스미드를 대장균으로부터 단리하고, 바실러스 종에 형질전환시킨다. 이러한 방법의 광범위한 사용은 적어도 부분적으로는 대장균이 바실러스보다 형질전환시키기 쉽다는 생각에 기인할 수 있다. 이와 관련하여, 플라스미드의 시험관 내 결찰은 대장균은 형질전환시키지만 바실러스는 형질전환시키지 않는 니킹(nicking)된 산물을 초래한다. 바실러스 종에서 공여 DNA를 도입하기 위한 통상적인 접근법은 복제 플라스미드에 기반을 두고 있다. 불행하게도, 이 같은 접근법은 일반적으로 세포에서 플라스미드를 유지하기 위해 항생제 또는 기타 선택 가능한 마커에 대한 필요성을 비롯하여 다수의 단점과 연관이 있다. 이는 생산 균주에 바람직하지 않으며, 이는 선별 조건의 선택을 제한한다. 복제 플라스미드의 사용에 있어서 다른 단점은 플라스미드 상에 종종 복수개의 유전자가 존재하여 유전자 조절 및 발현에 영향을 미친다는 것이다.
대안적으로, 통합 플라스미드 또는 벡터가 사용될 수 있다. 통합 벡터는 복제 기원을 포함하지 않으며, 따라서 안정한 유지를 위해 숙주 염색체 내로의 삽입이 요구된다. 그러나, 이들은 문제가 없는 것은 아니다. 통합은 삽입된(현재 선형) 벡터의 양 말단에 클로닝된 영역의 복제를 초래하는 캠벨(Campbell) 유형의 재조합 이벤트를 통해 발생한다. 통합 위치에 따라 유전자가 파괴될 수 있으며, 그 결과 형질전환 효율이 떨어질 수 있다.
현재, ARM-부재 균주를 제작하기 위해 무항생제 선택 카세트가 사용될 수 있다(문헌[Ferrari et al. 1985, Nat. Biotechnol. Vol. 3: 1003~1007]). 그러나 이는 시간 소모적이며, 카세트는 동일한 균주에서 유용하도록 제거될 필요가 있다.
유전자 변형 및 바실러스 종 세포의 게놈 내로의 유전자 통합을 위한 이전 방법은 자발적 이중 가닥 절단의 발생 및 짧은 상동성 아암(게놈 내에 삽입될 관심 유전자(GOI) 및 게놈 내에 통합된 관심 유전자를 갖는 바실러스 종 세포의 식별을 가능케 하도록 게놈 내에 또한 삽입된 선택 가능한 마커 둘 모두를 포함함)을 갖는 선형 DNA 단편 상에 함께 위치한 선택 가능한 마커의 사용에 의존하였다(2002년 2월 21일자로 공개된 WO02/14490). 선택 가능한 마커 및 GOI는 세포 내의 DNA와의 재조합 시에 GOI 및 선택 가능한 마커 둘 모두가 세포의 DNA에 통합될 수 있도록 전형적으로 2개의 짧은 상동성 아암에 의해 플랭킹되어 있었다. 바실러스 종 세포 내로의 게놈의 통합을 위한 짧은 상동성 아암을 갖는 이 같은 선형 단편의 형질전환 동안의 선택 가능한 마커의 사용은 게놈의 특정 유전자위의 효율적인 변형을 위해 선택될 필요가 있다. 선택 가능한 마커는 정확한 발현용 유전자위 내에 통합되어야 하고, 이러한 통합은 개체군 내 및 게놈 내에서 확률적 방식으로 발생하는 희귀하고 자발적 DNA 손상에 의존한다. 이러한 희귀한 이벤트는 오직 마커의 사용과 염색체 통합을 조합함으로써 선택될 수 있다(2002년 2월 21일자로 공개된 WO02/14490).
바실러스 서브틸리스(Bacillus subtilis)에서, 유전자 결실 및 유전자 내에서의 점 돌연변이의 도입을 가능케 하기 위해 Cas 엔도뉴클레아제/RNA-가이딩된 시스템과 조합하여 단일 플라스미드 시스템을 사용하는 것이 기재되어 있다(문헌[Altenbuchner J., 2016, Applied and Environmental Microbiology, vol.82(17) pg. 5421~5427]). Cas-기반 게놈 조작 기법이 다수의 상이한 숙주 세포 유형에 적용되어 왔지만, 이들 기법에는 제한이 있는 것으로 알려져 있다. CRISPR/Cas9 방법은 마커가 없는 ARM-부재 균주를 제작하기 위해 사용되었다(문헌[So et al. 2017, Front Microbiol, Vol. 8: 1167], 문헌[Zhang et al. 2016, Sci Rep, Vol. 6: 27943]). 이러한 접근법은 Cas9 기술에 대한 접근, 변형될 게놈 상의 모든 부위에 대한 가이드 RNA 및 Cas9를 암호화하는 플라스미드 또는 선형 단편의 제작이 요구된다. 이는 또한 절차의 말기에 Cas9의 제거가 요구된다. 이전 방법의 개선에도 불구하고, Cas9-기반 방법은 여전히 관련된 많은 단계를 갖는다.
따라서, 선택 가능한 마커 및/또는 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내로의 공여 DNA 서열(예를 들어, 관심 폴리뉴클레오타이드, 단일 유전자 발현 카세트 또는 복수개의 유전자 발현 카세트를 들 수 있지만, 이에 제한되지 않음)의 유전자 통합뿐만 아니라 게놈 변형을 위한 효과적이면서 효율적이거나, 또는 달리 더 강력한 방법의 개발에 대한 요구가 여전히 존재한다.
본 개시내용은 선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물을 포함한다. 본 개시내용은 선택 가능한 마커의 사용 없이 그리고 상기 게놈 내로의 Cas 엔도뉴클레아제의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법, 및 관심 유전자를 결실시키고/시키거나 바실러스 종 세포의 게놈 내에 돌연변이를 제공하기 위한 방법을 포함한다.
임의의 특정 이론, 기작 또는 작용 모드에 제한되지 않지만, 놀랍고도 예상치 못하게도, 본 출원인은 이의 단부에 긴 상동성 아암(각각의 상동성 아암은 적어도 900개의 뉴클레오타이드를 가짐)을 포함하는 선형 DNA 작제물이 수용능 바실러스 종 세포 내로 도입되는 경우에 게놈 변형(예를 들어, 공여 DNA 서열 통합, 뉴클레오타이드 결실, 돌연변이를 들 수 있지만, 이에 제한되지 않음)에서의 높은 효율이 관찰되며, 이때 도입 및 게놈 변형은 선택 가능한 마커 또는 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 발생한다는 것을 발견하였다.
이 방법은 선형 DNA 작제물을 수용능 바실러스 종 세포 내로 도입하는 단계를 이용하며, 이때 상기 선형 DNA 작제물은 선택적으로 상기 상동성 아암에 의해 플랭킹된 공여 DNA를 포함하는 적어도 900 bp의 상동성 아암에 의해 플랭킹되고, 상기 DNA 작제물은 엔도뉴클레아제를 암호화하는 DNA 단편을 포함하지 않으며, 상기 DNA 작제물은 선택 가능한 마커를 암호화하는 DNA 서열을 포함하지 않는다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않으며, 선택적으로는 이 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역과 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
일부 구현예에서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는다.
본원에 기재되어 있는 바와 같은 선형 DNA 작제물은 이중 가닥 DNA일 수 있다.
하나의 구현예에서, 수용능 바실러스 종 세포는 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 렌투스(Bacillus lentus), 바실러스 브레비스(Bacillus brevis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 클라우시(Bacillus clausii), 바실러스 할로두란스(Bacillus halodurans), 바실러스 메가테리움(Bacillus megaterium), 바실러스 코아귤란스(Bacillus coagulans), 바실러스 서큘란스(Bacillus circulans), 바실러스 라우투스(Bacillus lautus) 및 바실러스 투링기엔시스(Bacillus thuringiensis)로 이루어진 군으로부터 선택되는 바실러스 종 세포이다.
하나의 구현예에서, 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되었다.
하나의 구현예에서, 수용능 바실러스 종 세포는 Pxyl-ComK 균주를 들 수 있지만 이에 제한되지 않는 초수용능 바실러스 종 균주에서 유래한 것이다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
도 1은, 수용능 바실러스 종 세포 내로 도입된 선형 DNA 작제물로서, 이의 단부에 긴 상동성 아암(HR1 및 HR2; 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드(0.9 kb 이상)를 가짐)을 포함하는 선형 DNA 작제물을 사용하여 바실러스 종 세포의 게놈을 변형시키기 위한 방법을 보여준다. 상부 도면(도 1)에서, 선형 DNA 작제물은 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고 및 하나는 3' 하류 아암인 HR2임)에 의해 플랭킹된 공여 DNA를 포함한다. 공여 DNA는 관심 유전자를 발현하는 발현 카세트를 포함할 수 있다. 공여 작제물이 세포 내로 도입되면, 관심 게놈 유전좌위 내에 공여 DNA를 통합시키는 상동성 재조합이 발생할 수 있다. 하부 도면(도 1)에서, 선형 DNA 작제물은 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고 및 하나는 3' 하류 아암인 HR2임)를 포함하며, HR 아암들 사이에는 어떠한 추가적인 DNA도 없다. 이러한 선형 DNA 작제물이 세포 내로 도입되면, 뉴클레오타이드 결실(유전자 결실)을 초래할 수 있는 상동성 재조합이 발생할 수 있다. 선형 DNA 작제물은 당업자에게 알려져 있는 임의의 기작에 의해 바실러스 종 세포 내로 도입될 수 있다.
본 개시내용은 선택 가능한 마커의 사용 없이 그리고 가이드 RNA/Cas 엔도뉴클레아제 시스템의 사용 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법 및 조성물을 포함한다. 본 개시내용은 상기 게놈 내로의 선택 가능한 마커의 통합 없이 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법 및 조성물을 포함한다. 하나의 양태에서, 이 방법은 수용능 바실러스 종 세포의 게놈 내로의 상기 공여 DNA의 도입을 위한 긴 상동성 아암(900개 이상의 뉴클레오타이드의 길이를 가짐)에 의해 플랭킹된 공여 DNA 서열을 포함하는 선형 DNA 작제물을 이용하며, 이와 같이 상기 바실러스 종 세포의 게놈에서 선택 가능한 마커를 통합시킬 필요 없이 그리고 가이딩된 Cas 시스템의 필요 없이 상기 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 매우 효과적인 시스템을 제공한다.
본 개시내용은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법 및 조성물을 추가로 포함하며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
본 문헌은 읽기 쉽도록 여러 부문으로 구성되어 있지만, 독자라면 한 부문의 서술이 다른 부문에 적용될 수 있음을 이해할 것이다. 이러한 방식으로, 본 개시내용의 상이한 부문에 사용된 표제가 제한적인 것으로 해석되어서는 안 된다.
본원에 제공된 표제는 본 명세서를 전체로 참조할 수 있는 본 조성물 및 방법의 다양한 양태 또는 구현예를 제한하는 것은 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 조성물 및 방법이 속하는 기술분야의 당업자가 일반적으로 이해하는 바와 동일한 의미를 갖는다. 대표적인 예시적 방법 및 재료가 이제 기재되지만, 본원에서 기재되어 있는 것과 유사하거나 동등한 임의의 방법 및 재료가 본 조성물 및 방법의 실시 또는 시험에 사용될 수도 있다.
본 명세서에서 언급된 모든 간행물 및 특허는, 각각의 개별 간행물 또는 특허가 구체적이고 개별적으로 참조로 포함되는 것으로 표시된 것처럼 참조로 본원에 포함되며, 이 간행물이 언급된 것과 관련하여 방법 및/또는 재료를 개시 및 기재하기 위해 참조로 본원에 포함된다.
본원에서 사용된 바와 같이, "개시내용" 또는 "개시된 개시내용"이란 용어는 제한하기 위한 것이 아니라, 일반적으로 청구범위에 정의되거나 본원에 기재되어 있는 개시내용 중 임의의 것에 적용된다. 이들 용어는 본원에서 상호 교환 가능하게 사용된다.
Cas 유전자 및 단백질
CRISPR(클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부: clustered regularly interspaced short palindromic repeat) 유전자위는, 예를 들어 박테리아 및 고세균 세포에 의해 외래 DNA를 파괴하는 데 사용되는 DNA 개열 시스템의 성분을 암호화하는 특정 유전자위를 지칭한다(문헌[Horvath and Barrangou, 2010, Science 327: 167~170; WO2007/025097; 2007년 3월 1일자로 공개됨]. CRISPR 유전자위는 다양한 Cas(CRISPR-연관(associated)) 유전자에 의해 플랭킹될 수 있는, 짧은 가변 DNA 서열(소위 '스페이서'로 지칭됨)에 의해 분리된 짧은 직접 반복부(CRISPR 반복부)를 포함하는 CRISPR 배열로 이루어질 수 있다. 주어진 CRISPR 유전자위에서 CRISPR-연관 유전자의 개수는 종들 간에 달라질 수 있다. 다중-아단위 효과기 복합체(I형, III형 및 IV형 아형을 포함함)를 갖는 클래스 1 시스템, 및 단일 단백질 효과기(예를 들어, Cas9, Cpf1, C2c1, C2c2, C2c3을 들 수 있지만, 이에 제한되지 않는 II형 및 V형 아형을 포함함)를 갖는 클래스 2 시스템을 포함하는 여러 CRISPR/Cas 시스템이 기재되어 있다. 클래스 1 시스템(본원에 참조로 포함된 문헌[Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13: 1~15]; 문헌[Zetsche et al., 2015, Cell 163, 1~13]; 및 2013년 11월 23일자로 공개된 WO 2013/176772 A1). 박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(트랜스-활성화 CRISPR RNA)를 이용하여 Cas 엔도뉴클레아제를 이의 DNA 표적으로 가이딩한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 tracrRNA(트랜스-활성화 CRISPR RNA)와 염기 쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 개열하도록 유도하는 RNA 듀플렉스를 형성하는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질을 수반하는 완전히 이해되지 않은 과정을 통해 획득된다. 모든 II형 CRISPR/Cas 유전자위는 cas9 유전자 외에도 cas1 및 cas2 유전자를 포함한다(문헌[Chylinski et al., 2013, RNA Biology 10: 726~737]; 문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]). II형 CRISPR-Cas 유전자위는 각각의 CRISPR 배열 내 반복부와 부분적으로 상보적인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 기타 단백질을 포함할 수 있다. cas1 및 cas2 유전자 부근에 있는 cas9의 존재는 II형 유전자위의 특징이다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]). I형 CRISPR-Cas(CRISPR-연관(associated)) 시스템은 침입하는 바이러스 DNA에 대해 방어하기 위해 단일 CRISPR RNA(crRNA) 및 Cas3과 함께 기능을 하는 캐스케이드(Cascade; 항바이러스 방어를 위한 CRISPR-연관 복합체)로 지칭되는 단백질의 복합체로 이루어져 있다(전문이 본원에 포함된 문헌[Brouns, S.J.J. et al. Science 321: 960~964]; 문헌[Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13: 1~15]).
본원에서 "Cas 유전자"란 용어는 일반적으로 플랭킹 CRISPR 유전자위에 결합되거나, 회합되거나, 가까이 있거나, 또는 그 부근에 있는 유전자를 지칭한다. "Cas 유전자", "cas 유전자", "CRISPR-연관(Cas) 유전자" 및 "클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부-연관 유전자"란 용어는 본원에서 상호 교환 가능하게 사용된다.
"Cas 단백질" 또는 "Cas 폴리펩타이드"란 용어는 Cas(CRISPR-연관(associated)) 유전자에 의해 암호화된 폴리펩타이드를 지칭한다. Cas 단백질은 Cas 엔도뉴클레아제를 포함한다.
Cas 단백질은 박테리아 또는 고세균 단백질일 수 있다. 본원에서 I형 내지 III형 CRISPR Cas 단백질은 통상적으로 그 기원이 원핵생물이며, 예를 들어 I형 및 III형 Cas 단백질은 박테리아 종 또는 고세균 종으로부터 유래할 수 있는 반면, II형 Cas 단백질(즉, Cas9)은 박테리아 종으로부터 유래할 수 있다. 기타 양태에서, Cas 단백질은 Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체 또는 이의 변형된 버전 중 하나 이상을 포함한다. Cas 단백질은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas 5, Cas7, Cas8, Cas10 또는 이들의 조합 또는 복합체를 포함한다.
"Cas 엔도뉴클레아제"란 용어는, 적합한 폴리뉴클레오타이드 성분과 복합체를 이루는 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나 개열할 수 있는 Cas 폴리펩타이드(Cas 단백질)를 지칭한다. Cas 엔도뉴클레아제는 (예를 들어, 세포의 게놈 내의 표적 부위에서) 이중 가닥 DNA 내의 특정 표적 부위의 전부 또는 일부를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나 개열하도록 가이드 폴리뉴클레오타이드에 의해 가이딩된다. 본원에 기재되어 있는 Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다. 본원에 기재되어 있는 공여 DNA 삽입 방법에 사용된 Cas 엔도뉴클레아제는 단일 또는 이중 가닥 절단을 표적 부위에서의 DNA 내로 도입하는 엔도뉴클레아제이다. 대안적으로, Cas 엔도뉴클레아제에는 DNA 개열 또는 닉킹 활성이 결여될 수 있지만, 이는 적합한 RNA 성분과 복합체를 형성하는 경우에 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다.
본원에서 사용된 바와 같이, "Cas9"(이전에는 Cas5, Csn1 또는 Csx12로서 지칭됨) 또는 "Cas9 엔도뉴클레아제"로서 지칭되거나 "Cas9 엔도뉴클레아제 활성"을 갖는 폴리펩타이드는 DNA 표적 서열의 전부 또는 일부에 특이적으로 결합하고, 선택적으로는 이를 닉킹하거나 개열하기 위해 cr뉴클레오타이드 및 tracr뉴클레오타이드와의 복합체, 또는 단일 가이드 폴리뉴클레오타이드와 복합체를 형성하는 Cas 엔도뉴클레아제를 지칭한다. Cas9 엔도뉴클레아제는 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 개열할 수 있다(도메인 둘 모두의 공동 작용에 의해 DNA 이중 가닥 개열이 초래되는 반면, 하나의 도메인의 활성에 의해 닉(nick)이 초래됨). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 이때 도메인 I은 Cas9의 N-말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인에 플랭킹하는 단백질의 중간에 위치한다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15], 문헌[Hsu et al, 2013, Cell 157: 1262~1278]). Cas9 엔도뉴클레아제는 전형적으로 II형 CRISPR 시스템으로부터 유래하는데, 이 시스템은 적어도 하나의 폴리뉴클레오타이드 성분과 복합체를 이룬 Cas9 엔도뉴클레아제를 사용하는 DNA 개열 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 트랜스-활성화 CRISPR RNA(tracrRNA)와 복합체를 이룰 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와 복합체를 이룰 수 있다(문헌[Makarova et al. 2015, Nature Reviews Microbiology Vol. 13: 1~15]).
가이딩된 Cas 시스템
"가이드 RNA/Cas 엔도뉴클레아제 복합체", "가이드 RNA/Cas 엔도뉴클레아제 시스템", "가이드 RNA/Cas 복합체", "가이드 RNA/Cas 시스템", "gRNA/Cas 복합체", "gRNA/Cas 시스템", "RNA-가이딩된 엔도뉴클레아제", "RGEN"이란 용어는 본원에서 상호 교환 가능하게 사용되며, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하며, 이때 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 이에 결합하고, 선택적으로는 이를 닉킹하거나, 개열(단일 또는 이중 가닥 절단을 도입)하도록 할 수 있다.
DNA 작제물 및 공여 DNA
상동성 지향적 복구(HDR)는 이중 가닥 및 단일 가닥 DNA 절단을 복구하는 세포 내의 기작이다. 상동성 지향적 복구는 상동성 재조합(HR) 및 단일 가닥 어닐링(SSA)을 포함한다(문헌[Lieber. 2010 Annu. Rev. Biochem. 79: 181~211]). 가장 일반적인 형태의 HDR은 상동성 재조합(HR)으로 지칭되며, 이는 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 절단)에서의 상동성 지향적 복구는 이중 가닥 절단에서의 HDR과 다른 기작을 통해 일어날 수 있다(문헌[Davis and Maizels. PNAS (0027-8424), 111(10), p. E924~E932).
상동성 재조합은 상동성 부위에서 2개의 DNA 분자 사이의 DNA 단편의 교환을 포함한다. 상동성 재조합의 빈도는 여러 인자에 영향을 받는다. 상이한 유기체는 상동성 재조합의 양 및 상동성 재조합과 비상동성 재조합의 상대 비율이 다르다. 상동성 재조합을 관찰하는 데 필요한 상동성 영역(상동성 아암)의 길이는 유기체마다 다르다. 예를 들어, 상동 재조합(HR)을 통한 원핵생물 유기체(세포)의 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 상동 재조합은 기타 유기체에서 또한 이루어져 왔다. 예를 들어, 기생 원생동물 리슈마니아(Leishmania)에서의 상동 재조합에 적어도 150 bp 내지 200 bp의 상동성이 필요했으며(문헌[Papadopoulou and Dumas, (1997) Nucleic Acids Res 25: 4278~86]), 프로토박테리움인 대장균에서의 효율적인 재조합에 적어도 150 bp 내지 200 bp의 상동성이 필요하다(문헌[Lovett et al (2002) Genetics 160: 851~859]).
"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 본원에 기재되어 있는 DNA 작제물에서 발견되는 "게놈 영역에 대한 상동성 영역"은 세포 또는 유기체 게놈 내의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동성 영역은 상동성 재조합을 촉진시키는 데 충분한 임의의 길이를 가질 수 있다. 예를 들어, 본원에 기재되어 있는 선형 DNA 작제물의 상동성 영역이 상응하는 상동성 영역과의 상동성 재조합을 겪는 데 충분한 상동성을 갖도록 상동성 영역은 적어도 약 900개의 염기 쌍(bp)과 2,000 bp 사이; 900개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 2,000 bp 사이; 1,000개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 4,000 bp 사이; 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이; 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이; 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이; 5,000 bp와 최대 6,000 bp 사이의 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오타이드 서열이 상동성 재조합 반응을 위한 기질로서 작용하기에 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각각의 폴리뉴클레오타이드 단편의 전체 길이뿐만 아니라 폴리뉴클레오타이드의 서열 유사성을 포함한다. 서열 유사성은 전체 서열 길이에 걸친 서열 동일성(%)에 의해, 및/또는 100%의 서열 동일성을 갖는 연속된 뉴클레오타이드와 같은 국부적 유사성 및 서열 길이의 일부에 걸친 서열 동일성(%)을 포함하는 보존된 영역에 의해 기술될 수 있다.
또한, 상동성의 양은 2개의 폴리뉴클레오타이드의 전체 정렬된 길이에 걸친 서열 동일성(%)에 의해 기술될 수도 있는데, 이는 적어도 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성(%)을 포함한다. 충분한 상동성은 폴리뉴클레오타이드 길이, 전체 서열 동일성(%) 및 선택적으로 연속된 뉴클레오타이드의 보존된 영역 또는 국소 서열 동일성(%)의 임의의 조합을 포함하며, 예를 들어 충분한 상동성은 게놈의 영역과 적어도 80%의 서열 동일성을 갖는 900 bp 내지 7,000 bp의 영역으로서 기술될 수 있다. 충분한 상동성은 또한 높은 엄격성 조건 하에 특이적으로 혼성화하는 2개의 폴리뉴클레오타이드의 예측된 능력에 의해 기술될 수 있고, 예를 들어 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.)]; 및 문헌[Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York)]을 참고한다.
본원에서 사용된 바와 같이, "게놈 영역"은 변형될 게놈 서열의 어느 한 측에 존재하거나, 대안적으로 변형될 게놈 서열의 일부를 또한 포함하는 세포의 게놈 내의 염색체의 분절이다. 본원에 기재되어 있는 바와 같은 게놈 영역은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는다.
본원에 기재되어 있는 바와 같은 게놈 영역이 상응하는 상동성 영역과의 상동성 재조합을 겪는 데 충분한 상동성을 갖도록 게놈 영역은 적어도 약 900개의 염기 쌍(bp)과 2,000 bp 사이, 900개의 염기 쌍(bp)과 3,000 bp 사이; 1,000개의 염기 쌍(bp)과 2,000 bp 사이, 1,000개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 4,000 bp 사이, 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이, 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이, 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이, 5,000 bp와 최대 6,000 bp 사이의 길이 또는 그 이상의 염기를 포함할 수 있다.
본원에 기재되어 있는 바와 같이, 변형될 게놈 서열은 변형될 단일 염기(예를 들어, 본원에 기재되어 있는 점 돌연변이) 및 결실된 유전자 또는 염색체 단편을 포함한다. 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 것이 바람직한 양태에서, 게놈 영역은 바실러스 종 게놈 상에서 서로에 대해 바로 옆에 직접 위치한다.
주어진 게놈 영역과 DNA 작제물 상에서 발견되는 상응하는 상동성 영역(HR1, HR2) 사이의 구조적 유사성은 상동성 재조합이 일어날 수 있도록 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, DNA 작제물의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 이 서열이 상동성 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있다.
본원에서 사용된 바와 같이, "DNA 작제물"은 적어도 제1 상동성 아암(HR1; 5 프라임 상동성 아암인 5'HR로도 지칭됨) 및 제2 상동성 아암(HR2; 3 프라임 상동성 아암인 3'HR로도 지칭됨)을 포함하는 DNA 서열을 지칭한다. DNA 작제물은 제1과 제2 상동성 아암 사이에 공여 DNA(상동성 아암에 의해 플랭킹된 공여 DNA)를 추가로 포함할 수 있다.
본원에서 사용된 바와 같이, "선형 DNA 작제물"은 선형인 단일 가닥 또는 이중 가닥 DNA 작제물을 지칭한다.
본원에서 사용된 바와 같이, "상동성 아암"은 바실러스 종 게놈 내의 게놈 영역에 상동성인 핵산 서열을 지칭한다. 주어진 게놈 영역과 DNA 작제물 상에서 발견되는 상응하는 상동성 아암(HR1, HR2) 사이의 구조적 유사성은 상동성 재조합이 일어날 수 있도록 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, DNA 작제물의 HR1 및/또는 HR2의 "상동성 영역"과 유기체 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 이 서열이 상동성 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있다.
하나의 양태에서, 바실러스 종 게놈 내에 통합될 관심 뉴클레오타이드 서열을 포함하고, 본원에 기재되어 있는 선형 이중 가닥 DNA 작제물 상에 위치한 이중 가닥 공여 DNA 서열에 플랭킹하는 본 개시내용의 상동성 아암은 약 900개의 염기 쌍(bp)과 2,000 bp 사이, 900개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 2,000 bp 사이, 1,000개의 염기 쌍(bp)과 3,000 bp 사이, 1,000개의 염기 쌍(bp)과 4,000 bp 사이, 900개의 염기 쌍(bp)과 2,000 bp 사이; 2,000 bp와 3,000 bp 사이; 2,000 bp와 4,000 bp 사이; 2,000 bp와 5,000 bp 사이; 2,000 bp와 6,000 bp 사이, 3,000 bp와 4,000 bp 사이; 3,000 bp와 5,000 bp 사이; 3,000 bp와 6,000 bp 사이, 4,000 bp와 5,000 bp 사이; 4,000 bp와 6,000 bp 사이, 5,000 bp와 최대 7,000 bp 사이를 포함한다.
하나의 양태에서, 바실러스 종 게놈 내에 통합될 관심 뉴클레오타이드 서열을 포함하고, 선형 단일 가닥 DNA 작제물 상에 위치한 단일 가닥 공여 DNA에 플랭킹하는 본 개시내용의 상동성 아암은 약 900개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드, 900개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드, 1,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드, 900개의 뉴클레오타이드 내지 2,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 3,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 2,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 4,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 3,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 4,000개의 뉴클레오타이드 내지 5,000개의 뉴클레오타이드; 4,000개의 뉴클레오타이드 내지 6,000개의 뉴클레오타이드; 5,000개의 뉴클레오타이드 내지, 6,000개의 뉴클레오타이드 내지 최대 7,000개의 뉴클레오타이드를 포함한다.
본원에서 사용된 바와 같이, "공여 DNA" 및 "공여 DNA 서열"은 바실러스 종 세포의 게놈 내에 삽입될 관심 뉴클레오타이드 서열을 포함하는 DNA 서열을 지칭한다.
본원에서 사용된 바와 같은 공여 DNA는 제1 상동성 아암(HR1; 5 프라임 상동성 아암인 5'HR로도 지칭됨) 및 제2 상동성 아암(HR2; 3 프라임 상동성 아암인 3'HR로도 지칭됨)에 의해 플랭킹되며, 이는 수용능 바실러스 종 게놈 내로의 공여 DNA의 통합 위치를 결정한다.
하나의 양태에서, 공여 DNA 서열의 관심 뉴클레오타이드 서열은 관심 폴리뉴클레오타이드, 재조합 DNA, 관심 합성 서열, 관심 이종성 서열, 관심 상동성 서열, 관심 유전자, 하나 이상의 발현 카세트, 하나 이상의 재조합 DNA 작제물, 하나 이상의 발현 카세트, 형질전환되지 않은 천연 게놈 서열과 비교할 때 목적하는 변형/돌연변이(예를 들어, 염기 치환)를 갖는 뉴클레오타이드 서열(예를 들어, 단일 염기를 포함하지만 이에 제한되지 않음), 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열 또는 이의 임의의 하나의 조합을 포함한다.
본원에 기재되어 있는 관심 폴리뉴클레오타이드는 관심 유기체에서의 발현을 위한 발현 카세트에 제공될 수 있다.
본원에서 사용된 바와 같이, "발현"이란 용어는 전구체 형태 또는 성숙한 형태의 기능적 최종 산물(예를 들어, crRNA, tracrRNA, mRNA, 가이드 RNA, sRNA, siRNA, 안티센스 RNA 또는 폴리펩타이드(단백질))의 생산을 지칭한다. "발현"이란 용어는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이 단계는 전사, 전사 후 변형, 번역, 번역 후 변형 및 분비를 포함하지만, 이에 제한되지 않는다.
발현 카세트는 본원에 개시되어 있는 바와 같이 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열 및 또는 태그 및 합성 서열을 포함할 수 있다.
본원에 개시되어 있는 발현 카세트는 바실러스 종(숙주) 세포에서 기능적인 전사 및 번역 개시 영역(즉, 프로모터), 5' 비번역된 영역, 다양한 단백질 태그 및 서열을 암호화하는 폴리뉴클레오타이드, 관심 폴리뉴클레오타이드 및 전사 및 번역 종결 영역(즉, 종결 영역)을 전사의 5'-3' 방향으로 포함할 수 있다. 또한, 발현 카세트에는 본원에서 그 외에 기재된 조절 영역의 전사 조절 하에 있도록 폴리뉴클레오타이드의 삽입을 위한 복수의 제한 부위 및/또는 재조합 부위가 제공된다. 조절 영역(즉, 프로모터, 전사 조절 영역 및 번역 종결 영역) 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 자연적일/유사할 수 있다. 다양한 단백질 서열을 암호화하는 기타 폴리뉴클레오타이드 서열은 관심 폴리뉴클레오타이드의 5' 또는 3' 말단 중 하나에 부가될 수 있다. 대안적으로, 조절 영역 및/또는 관심 폴리뉴클레오타이드는 숙주 세포에 또는 서로에 이종일 수 있다.
특정 구현예에서, 본원에 개시되어 있는 폴리뉴클레오타이드는 본원에서 그 외에 개시되거나 당해 기술분야에 알려져 있는 바와 같이 관심 폴리뉴클레오타이드 서열 또는 발현 카세트의 임의의 조합에 의해 스태킹(stacking)될 수 있다. 스태킹된 폴리뉴클레오타이드는 초기 폴리뉴클레오타이드와 동일한 프로모터에 작동 가능하게 연결될 수 있거나, 별도의 프로모터 폴리뉴클레오타이드에 작동 가능하게 연결될 수 있다.
발현 카세트는 선택적으로는 상응하는 종결 영역과 함께 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함할 수 있다. 종결 영역은 전사 개시 영역에 자연적일 수 있거나, 작동 가능하게 연결된 관심 폴리뉴클레오타이드에 또는 프로모터 서열에 자연적일 수 있거나, 숙주 유기체에 자연적일 수 있거나, 다른 공급원으로부터 유래(즉, 외래 또는 이종)할 수 있다. 편리한 종결 영역은 세포 외 단백질(예를 들어, B. 서브틸리스로부터의 aprE, B. 리케니포르미스로부터의 aprL)의 분비와 관련된 원핵생물 리보솜 RNA 오페론 또는 유전자로부터의 람다 파지 t0 종결 영역 또는 강한 종결자와 같은 파지 서열로부터 이용 가능하다. 편리한 종결 영역은 옥토핀(octopine) 합성효소 및 노팔린(nopaline) 합성효소 종결 영역과 같은 A. 투메파시엔스의 Ti-플라스미드로부터 이용 가능하다. 또한, 문헌[Guerineau et al. (1991) Mol. Gen. Genet. 262: 141~144]; 문헌[Proudfoot (1991) Cell 64: 671~674]; 문헌[Sanfacon et al. (1991) Genes Dev. 5: 141~149]; 문헌[Mogen et al. (1990) Plant Cell 2: 1261~1272]; 문헌[Munroe et al. (1990) Gene 91: 151~158]; 문헌[Ballas et al. (1989) Nucleic Acids Res. 17: 7891~7903]; 및 문헌[Joshi et al. (1987) Nucleic Acids Res. 15: 9627~9639]을 참고한다.
적절한 경우, 관심 폴리뉴클레오타이드는 형질전환 또는 표적화된 유기체에서의 발현 증가에 최적화될 수 있다. 예를 들어, 폴리뉴클레오타이드는 개선된 발현을 위한 유기체-선호 코돈을 사용하도록 합성되거나 변경될 수 있다.
추가적인 서열 변형은 세포 숙주에서 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은 의사 폴리아데닐화 신호를 암호화하는 서열, 엑손-인트론 스플라이스 부위 신호, 트랜스포존-유사 반복부, 및 유전자 발현에 유해할 수 있는 기타 이 같이 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 세포에서 발현되는 알려진 유전자를 참조하여 계산할 때 주어진 세포 숙주에 대해 평균 수준으로 조정될 수 있다. 가능한 경우, 서열은 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
발현 카세트는 5' 리더 서열을 추가로 함유할 수 있다. 이 같은 리더 서열은 번역 또는 RNA 안정성 수준을 향상시키도록 작용할 수 있다. 5' 비번역된 영역과 상호 교환 가능하게 사용되는 5' 리더 서열은 널리 알려져 있고 잘 규명된 박테리아 UTR, 예를 들어 바실러스 서브틸리스 aprE 유전자 또는 바실러스 리케니포르미스 amyL 유전자 또는 임의의 박테리아 리보솜 단백질 유전자로부터의 것에서 유래할 수 있다. 번역 리더는 당해 기술분야에 알려져 있고, 피코르나바이러스(picornavirus) 리더, 예를 들어 EMCV 리더(뇌심근염 5' 비암호화 영역)(문헌[Elroy-Stein et al. (1989) Proc. Natl. Acad. Sci. USA 86: 6126~6130]); 포티바이러스(potyvirus) 리더, 예를 들어 TEV 리더(담배 식각 바이러스(Tobacco Etch Virus))(문헌[Gallie et al. (1995) Gene 165(2): 233~238]), MDMV 리더(옥수수 위축 모자이크 바이러스(Maize Dwarf Mosaic Virus))(문헌[Johnson et al. (1986) Virology 154: 9~20]) 및 인간 면역글로불린 중쇄 결합 단백질(BiP)(문헌[Macejak et al. (1991) Nature 353: 90~94]); 알팔파 모자이크 바이러스의 코트 단백질 mRNA(AMV RNA 4)로부터의 비번역된 리더(Jobling et al. (1987) Nature 325: 622~625); 담배 모자이크 바이러스 리더(TMV)(문헌[Gallie et al. (1989) in Molecular Biology of RNA, ed. Cech (Liss, New York), pp. 237~256]); 및 옥수수 황색얼룩 반점 바이러스 리더(MCMV: maize chlorotic mottle virus reader)(문헌[Lommel et al. (1991) Virology 81: 382~385])를 포함한다. 또한, 문헌[Della-Cioppa et al. (1987) Plant Physiol. 84: 965~968]을 참고한다. 번역을 향상시키는 것으로 알려져 있는 기타 방법, 예를 들어 인트론 등이 또한 사용될 수 있다.
발현 카세트를 제조할 때, 다양한 DNA 단편은 적절한 배향으로, 그리고 적절한 경우 적절한 리딩 프레임에서 DNA 서열을 제공하도록 조작될 수 있다. 이를 위해, 어댑터(adapter) 또는 링커는 DNA 단편을 연결하기 위해 사용될 수 있거나, 기타 조작은 편리한 제한 부위, 필요치 않은 DNA의 제거, 제한 부위의 제거 등을 제공하도록 수반될 수 있다. 이 목적을 위해, 시험관 내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 수반될 수 있다.
일부 구현예에서, 리파아제 또는 프로테아제 단백질을 암호화하는 뉴클레오타이드 서열은 제어 요소, 예를 들어 전사 제어 요소(예를 들어, 프로모터)에 작동 가능하게 연결된다. 전사 제어 요소는 진핵생물 세포 또는 원핵생물 세포(예를 들어, 박테리아 또는 바실러스 종 세포) 중 어느 하나에서 기능적일 수 있다.
바실러스 종 세포에서 유전자, 이의 오픈 리딩 프레임(ORF) 및/또는 이의 변이체 서열의 발현에 사용하기에 적합한 원핵생물 프로모터(원핵생물 세포에서 기능적인 프로모터) 및 프로모터 서열 영역의 비제한적인 예는 일반적으로 당업자에 알려져 있다. 본 개시내용의 프로모터 서열은 일반적으로 바실러스 종 세포(예를 들어, B. 리케니포르미스 세포, B. 서브틸리스 세포 등)에서 기능적이 되도록 선택된다. 마찬가지로, 바실러스 종 세포에서 유전자 발현을 유도하는 데 유용한 프로모터로는 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 xylA 및 xylB 유전자의 프로모터, 바실러스 서브틸리스 알칼라인 프로테아제(aprE) 프로모터(문헌[Stahl et al., 1984]), 바실러스 서브틸리스의 α-아밀라아제 프로모터(문헌[Yang et al., 1983]), 바실러스 아밀로리쿼파시엔스의 α-아밀라아제 프로모터(문헌[Tarkinen et al., 1983]), 바실러스 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(문헌[Yang et al., 1984]), 돌연변이 aprE 프로모터(PCT 공개공보 제WO2001/51643호), 또는 바실러스 리케니포르미스 또는 기타 관련된 바실러스로부터의 임의의 기타 프로모터를 들 수 있지만, 이에 제한되지 않는다. 기타 특정 구현예에서, 프로모터는 미국 특허 공개공보 제2014/0329309호에 개시되어 있는 리보좀 단백질 프로모터 또는 리보솜 RNA 프로모터(예를 들어, rrnI 프로모터)이다. spac와 같은 합성 프로모터는 기타 보조 인자에 따라 구성적이거나 유도성일 수 있다. n25, 람다 pL 또는 pR과 같은 파지 프로모터는 동일한 방식으로 구성적이거나 유도성일 수 있다. 바실러스 종 세포에서 광범위한 활성(프로모터 강도)을 갖는 프로모터 라이브러리를 선별 및 생성하기 위한 방법은 PCT 공개공보 제WO2003/089604호에 기술되어 있다.
바실러스 종에서 기능적인 구성적 프로모터로는 바실러스 리케니포르미스 아밀라아제 유전자(amyL)의 프로모터, 바실러스 스테아로써모필루스 말토제닉 아밀라아제 유전자(amyM)의 프로모터, 바실러스 아밀로리쿼파시엔스 아밀라아제(amyQ)의 프로모터, 바실러스 서브틸리스 알칼라인 프로테아제(aprE)의 프로모터, 바실러스 서브틸리스의 α-아밀라아제 프로모터(문헌[Yang et al., 1983]), 바실러스 아밀로리쿼파시엔스의 α-아밀라아제 프로모터(문헌[Tarkinen et al., 1983]), 바실러스 서브틸리스로부터의 중성 프로테아제(nprE) 프로모터(문헌[Yang et al., 1984])를 들 수 있지만, 이에 제한되지 않는다.
하나의 양태에서, 공여 DNA는 바실러스 종 게놈 내에 통합될 재조합 DNA를 포함한다.
본원에서 사용된 바와 같이, "재조합"은 예를 들어 화학적 합성에 의한, 또는 유전자 조작 기술에 의한 단리된 핵산 분절의 조작에 의한, 분리되었을 2개의 서열 분절의 인공 조합을 지칭한다. "재조합"이란 용어는, 생물학적 성분 또는 조성물(예를 들어, 세포, 핵산, 폴리펩타이드/효소, 벡터 등)을 참조하여 사용되는 경우, 생물학적 성분 또는 조성물이 자연에서 발견되지 않는 상태로 있음을 나타낸다. 다시 말해, 생물학적 성분 또는 조성물은 인간의 개입에 의해 이의 자연 상태로부터 변형되었다. 예를 들어, 재조합 세포는 이의 자연적(즉, 비-재조합) 세포에서는 발견되지 않는 하나 이상의 유전자를 발현하는 세포, 하나 이상의 자연적 유전자를 이의 자연적 세포와는 상이한 양으로 발현하는 세포, 및/또는 하나 이상의 자연적 유전자를 이의 자연적 세포와는 상이한 조건 하에 발현하는 세포를 포함한다. 재조합 핵산은 하나 이상의 뉴클레오타이드에 의해 자연적 서열과 다를 수 있고/있거나, 이종성 서열(예를 들어, 이종성 프로모터, 비자연적 또는 변이체 신호 서열을 암호화하는 서열 등)에 작동 가능하게 연결될 수 있고/있거나, 인트론 서열이 없을 수 있고/있거나, 단리된 형태로 있을 수 있다. 재조합 폴리펩타이드/효소는 하나 이상의 아미노산에 의해 자연적 서열과 상이할 수 있고/있거나, 이종성 서열과 융합될 수 있고/있거나, 절두될 수 있거나 아미노산의 내부 결실을 가질 수 있고/있거나, 자연적 세포에서 발견되지 않는 방식으로 (예를 들어, 폴리펩타이드를 암호화하는 발현 벡터의 세포 상에 존재하므로 폴리펩타이드를 과발현시키는 재조합 세포로부터) 발현될 수 있고/있거나, 단리된 형태로 있을 수 있다. 일부 구현예에서, 재조합 폴리뉴클레오타이드 또는 폴리펩타이드/효소는 이의 야생형 대응물과 동일하지만, 비자연적 형태(예를 들어, 단리되거나 농후화된 형태)로 있는 서열을 갖는다는 것이 강조된다.
본원에서 사용된 바와 같이, "재조합 DNA"는 핵산 단편의 인공 조합을 포함하는 적어도 하나의 발현 카세트를 포함하는 DNA 서열을 지칭한다. 재조합 DNA는 본원에 개시되어 있는 바와 같은 관심 폴리뉴클레오타이드에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다. 예를 들어, 재조합 DNA는 상이한 공급원으로부터 유래하는 조절 서열 및 암호화 서열을 포함할 수 있다.
본원에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기법은 당해 분야에 널리 알려져 있고, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 보다 자세히 기술되어 있다.
선별 가능한 마커 표현형을 사용하지 않고 변경된 게놈을 갖는 이들 세포를 확인하기 위해 다양한 방법이 이용 가능하다. PCR 방법, 서열분석 방법, 뉴클레아제 소화(digestion), 서던 블롯(Southern blot) 및 이들의 임의의 조합을 포함하지만 이에 제한되지 않는 이 같은 방법은 표적 서열을 직접 분석하여 게놈 서열에서의 임의의 변화를 검출하는 것으로 볼 수 있다.
수용능 바실러스 종에서의 효율적인 게놈 변형을 위해 적어도 900개의 뉴클레오타이드의 길이를 갖는 긴 상동성 아암을 포함하는 선형 DNA 작제물의 용도
본 개시내용은 선택 가능한 마커의 사용 또는 통합 없이 그리고 Cas 엔도뉴클레아제의 사용 또는 통합 없이 바실러스 종 세포의 게놈을 변형시키기 위한 방법을 포함한다.
임의의 특정 이론, 기작 또는 작용 모드에 제한되지 않지만, 놀랍고도 예상치 못하게도, 본 출원인은 긴 상동성 아암(각각의 상동성 아암은 적어도 900개의 뉴클레오타이드를 가짐)을 포함하는 선형 DNA 작제물이 수용능 바실러스 종 세포 내로 도입되는 경우에 게놈 변형(예를 들어, 사용된 선형 DNA 작제물의 유형에 따라 공여 DNA 서열 통합, 유전자 결실, 돌연변이를 들 수 있지만, 이에 제한되지 않음)에서의 높은 효율이 관찰되며, 이때 도입 및 게놈 변형은 선택 가능한 마커 또는 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 발생한다는 것을 발견하였다.
본 개시내용은 가이딩된 Cas 엔도뉴클레아제 시스템의 사용 없이 그리고 상기 게놈 내로의 선택 가능한 마커의 통합 없이 공여 DNA를 포함하는 선형 DNA 작제물을 사용하여 수용능 바실러스 종 세포의 게놈 내에 공여 DNA 서열을 통합시키기 위한 방법 및 조성물을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않으며, 선택적으로는 이 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다.
본원에 기재되어 있는 바와 같이, 선택 가능한 마커의 사용 없이 그리고 가이딩된 Cas 시스템의 사용 없이 바실러스 종 세포의 게놈 내로 공여 DNA를 통합하는 것은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하는 선형 DNA 작제물을 수용능 바실러스 종 세포 내로 도입함으로써 높은 빈도로 발생할 수 있으며, 이때 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖는다.
본 개시내용은 바실러스 종 세포의 게놈에서 관심 유전자를 결실시키기 위한 방법을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대한 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다.
본 개시내용은 바실러스 종 세포의 게놈 내로 돌연변이(예를 들어, 점 돌연변이를 들 수 있지만, 이에 제한되지 않음)을 제공하기 위한 방법을 포함한다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다. 하나의 구현예에서, 상기 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 돌연변이를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함한다. 하나의 양태에서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 바실러스 종 세포의 자연적 서열(변형 이전의 바실러스 종의 게놈 DNA 서열)과 비교하여 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함한다. 하나의 양태에서, 목적하는 돌연변이(염기 치환)을 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있다.
본 개시내용은 복수개의 유전자 발현 카세트를 도입하기 위한 방법을 포함한다. 효소 생산을 위한 바실러스 종 숙주의 개발에서의 장애물 중 하나는, 항생제 내성 마커(아암) 없이 염색체 내의 복수개의 효소 발현 카세트를 통합시키는 것이다. 통합 벡터, Cre/loxP 시스템 및 영양 요구성 마커의 사용과 같은 기존의 접근법은 시간 소모적이고, 편집 효율은 비교적 낮다.
본원에 기재되어 있는 방법은 상류 상동성 아암(HR1) 및 하류 아암(HR2)에 의해 플랭킹된 공여 DNA를 이용하여 복수개의 관심 유전자(관심 유전자 발현 카세트)에 대한 통합을 가능케 하여, 유전자 통합 효율을 높이며, 이때 각각의 상동성 아암은 적어도 900개 초과의 뉴클레오타이드의 길이를 갖는다.
복수개의 유전자 발현 카세트 또는 복수개의 발현 카세트는 본원에서 상호 교환 가능하게 사용되며, 적어도 하나의 관심 유전자를 포함하는 복수개의 동일한 발현 카세트를 지칭한다. 하나의 양태에서, 상기 유전자 발현 카세트의 복수개는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 및 최대 10개로 이루어진 군으로부터 선택된다.
정의
달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 조성물 및 방법이 적용되는 기술분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
"대립유전자" 또는 "대립유전자 변이체"는 염색체 상의 주어진 유전자위를 차지하고 있는 몇몇 대안적인 유전자 형태 중 하나이다. 염색체 상의 주어진 유전자위에 존재하는 모든 대립 유전자가 동일한 경우, 이 유기체는 이 유전자위에서 동형 접합성이다. 염색체 상의 주어진 유전자위에 존재하는 대립유전자가 상이한 경우, 이 유기체는 이 유전자위에서 이형 접합성이다. 폴리펩타이드의 대립유전자 변이체는 유전자의 대립유전자 변이체에 의해 암호화된 폴리펩타이드이다.
본원에서 사용된 바와 같이, "숙주 세포"는 새로 도입된 DNA 서열을 위한 숙주 또는 발현 비히클로서 작용하는 능력을 갖는 세포를 지칭한다. 따라서, 본 개시내용의 특정 구현예에서 숙주 세포는 바실러스 종 세포이다.
"재조합 숙주 세포"("유전자 변형된 숙주 세포"로도 지칭됨)는 이종성 핵산, 예를 들어 재조합 DNA 작제물이 도입되어 있거나, 본원에 기재되어 있는 가이드 RNA/Cas 엔도뉴클레아제 시스템과 같은 게놈 변형 시스템이 도입되어 있거나 이를 포함하는 숙주 세포이다. 예를 들어, 해당 박테리아 숙주 세포는 외인성 핵산(예를 들어, 플라스미드 또는 원형 재조합 DNA 작제물)의 적합한 바실러스 종 세포 내로의 도입에 의해 유전자 변형된 바실러스 종 세포를 포함한다.
본원에서 정의된 바와 같이, "모 세포" 또는 "모 (숙주) 세포"는 상호 교환 가능하게 사용될 수 있으며, "변형되지 않은" 모 세포를 지칭한다. 예를 들어, "모" 세포는 "모" 세포의 게놈이 (예를 들어, 모 세포 내로 도입된 하나 이상의 돌연변이/변형을 통해) 변경되어 이의 변형된 "딸"세포를 생성하는 임의의 미생물 세포 또는 균주를 지칭한다.
본원에서 사용된 바와 같이, "변형된 세포" 또는 "변형된 (숙주) 세포"는 상호 교환 가능하게 사용될 수 있으며, 변형된 세포가 유래하는 "모" 숙주 세포에 존재하지 않는 적어도 하나의 유전자 변형을 포함하는 재조합 (숙주) 세포를 지칭한다.
본원에서 사용된 바와 같이, "바실러스 속" 또는 "바실러스 종" 세포는, 바실러스 서브틸리스, 바실러스 리케니포르미스, 바실러스 렌투스, 바실러스 브레비스, 바실러스 스테아로써모필루스, 바실러스 알칼로필루스, 바실러스 아밀로리퀘파시엔스, 바실러스 클라우시, 바실러스 할로두란스, 바실러스 메가테리움, 바실러스 코아귤란스, 바실러스 서큘란스, 바실러스 라우투스 및 바실러스 투링기엔시스를 포함하지만 이에 제한되지 않는, 당업자에게 알려져 있는 바와 같은 "바실러스" 속 내의 모든 종을 포함한다. 바실러스 속은 계속해서 분류학적 개편을 겪고 이는 것으로 인식된다. 따라서, 이는, 이 속은 이제 "게오바실러스 스테아로써모필루스(GeoBacillus stearothermophilus)"로 지칭되는 B. 스테아로써모필루스와 같은 유기체를 포함하지만 이에 제한되지 않는, 재분류되어 있는 종을 포함시키기 위한 것이다.
본원에서 사용된 바와 같이, "수용능 바실러스 종 세포" 또는 "수용능 바실러스 종 균주로부터의 세포"는 상호 교환 가능하게 사용되며, 당해 기술분야에 알려져 있는 임의의 방법에 의해 수용능이 된 바실러스 종 세포를 지칭한다. 하나의 양태에서, 바실러스 종 세포는 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 된다(문헌[Dubnau D., 1991, Microbiological Reviews, Vol 55, No. 3, p. 395~424]; 문헌[Hamoen et al., 2003, Microbiology, 149, pg. 9~17]).
하나의 양태에서, 바실러스 종 세포는 자연 수용능, 인공 수용능 또는 유도 수용능을 통해 수용능이 된다(문헌[Dubnau D., 1991, Microbiological Reviews, Vol 55, No. 3, p. 395~424]; 문헌[Hamoen et al., 2003, Microbiology, 149, pg. 9~17]; 문헌[Jarmer Hanne et al. FEMS Microbiology Letters 206, pg. 197~200]).
하나의 양태에서, 비수용능 바실러스 종 세포를 수용능으로 만들기 위한 방법은 세포가 DNA의 흡수를 위해 더욱 수용능이 되도록 바실러스 종 세포에서의 ComS, ComS1, ComK 또는 이들 폴리펩타이드(또는 이들 폴리펩타이드를 암호화하는 유전자)의 임의의 조합의 도입 및 발현을 포함한다.
하나의 양태에서, 비수용능 바실러스 종 세포를 수용능으로 만들기 위한 방법은 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 유도성 프로모터를 포함하는 적어도 하나의 핵산 작제물을 비수용능 바실러스 종 세포 내로 도입하는 단계를 포함한다.
이 같은 유도성 프로모터의 예로는 xylAp; 말토오스, 만니톨 또는 아라비노오스와 같은 당에 의해 유도되는 프로모터; tetA 또는 spac 프로모터와 같은 소분자; ydhI 프로모터와 같은 온도 유도형 프로모터; 탠덤(tandem) 프로모터(WO99/043835 및 05/098016 참조)(바람직하게는, 탠덤 프로모터는 Pconsensus amyQ-PcryIIIA-cryIIIA 또는 PamyL4199-Pconsensus amyQ-PcryIIIA-cryIIIA임(PCT/US2007/088186 참조)); 또는 이의 임의의 하나의 조합을 들 수 있지만, 이에 제한되지 않는다.
본원에서 사용된 바와 같이, "초수용능 바실러스 종 세포" 또는 "초수용능 바실러스 종 균주로부터의 세포"는 상호 교환 가능하게 사용되며, 1% 초과의 세포 개체군이 바실러스 종의 염색체 DNA로 형질전환 가능한 수용능 바실러스 종 세포를 지칭한다. 대안적으로, 초수용능은 10% 초과의 세포 개체군이 자가 복제 바실러스 플라스미드로 형질전환 가능하다는 것을 의미한다. 바람직하게는, 초수용능 바실러스 종 세포는 야생형 또는 모 세포 개체군에 대해 관찰된 것보다 높은 속도로 형질전환될 것이다.
하나의 양태에서, 바실러스 종 세포는 ComK 폴리펩타이드(Pxyl-ComK)를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 크실로오스-유도성 프로모터(Pxyl)를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 초수용능이 되어, 초수용능 바실러스 종 Pxyl-ComK 균주를 생성한다.
하나의 양태에서, 초수용능 바실러스 종 균주는 ComK, ComS, ComS1, ComG, ComC, ComDE, Spo0H, AbrB, Spo0A, Spo0K, Sin, DegU, Com A, ComP, ComQ, COmB, srfA, ComK 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터(예를 들어, 유도성 프로모터를 들 수 있지만, 이에 제한되지 않음)를 포함하는 적어도 하나의 핵산 작제물을 바실러스 종 세포 내로 도입함으로써 초수용능이 되는 균주이다.
하나의 양태에서, 수용능 또는 초수용능 바실러스 종 균주는 바실러스 서브틸리스 168(BGSC1A1), spoIIAC, aprE, nprE 및 amyE 유전자의 결실을 갖는 바실러스 서브틸리스 168delta4, 바실러스 서브틸리스 A164delta5(상기와 같지만, srfAC USPTO 5891701의 추가적인 결실을 가짐), 바실러스 서브틸리스 MDT101(B. 리케니포르미스 SJ1904의 DNA 메틸트랜스페라아제를 발현함) 및 바실러스 리케니포르미스 SJ1904(USPTO 5733753)로 이루어진 군으로부터 선택된다.
본원에서 사용된 바와 같이, "증가된"이란 용어는 증가된 분량 또는 활성이 비교되는 분량 또는 활성보다 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100% 또는 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배, 16배, 17배, 18배, 19배, 20배, 21배, 22배, 23배, 24배, 25배, 26배, 27배, 28배, 29배, 30배, 31배, 32배, 33배, 34배, 35배, 36배, 37배, 38배, 39배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 110배, 120배, 130배, 140배, 150배, 160배, 170배, 180배, 190배, 200배, 210배, 220배, 230배, 240배, 250배, 260배, 270배, 280배, 290배, 300배, 310배, 320배, 330배, 340배, 350배, 360배, 370배, 380배, 390배, 400배, 410배, 420배, 430배, 440배, 440배, 450배, 460배, 470배, 480배, 490배 또는 500배 더 큰 분량 또는 활성을 지칭할 수 있다. "증가된", "더 높은" 및 "개선된"이란 용어는 본원에서 상호 교환 가능하게 사용된다. "증가된"이란 용어는 본원에 기재되어 있는 대조군 또는 기준 방법과 비교할 때 본원에 기재되어 있는 다성분 방법에 의해 수득된 형질전환 또는 유전자 편집 효율을 규명하기 위해 사용될 수 있다.
본원에서 사용된 바와 같이, "통합 효율"이란 용어는 이의 게놈 내에 통합된 목적하는 관심 유전자를 갖는 형질전환된 세포의 개수를 형질전환된 세포의 총 개수로 나눔으로써 정의된다. 이러한 개수는 100을 곱해서 "%"로서 나타낼 수 있다.
통합 효율(%) = (이의 게놈 내에 통합된 관심 유전자를 갖는 형질전환된 세포의 개수/형질전환된 세포의 총 개수) * 100
"보존된 도메인" 또는 "모티프"란 용어는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 기타 위치에서의 아미노산은 상동성 단백질 사이에 변경될 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체의 패밀리의 정렬된 서열에서 이들의 높은 보존 정도에 의해 확인되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 확인된 단백질 패밀리에 속하는지를 결정하기 위한 식별자 또는 "서명"으로 사용될 수 있다.
본원에서 사용된 바와 같이, "핵산"은 폴리뉴클레오타이드를 의미하고, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 가닥 또는 이중 가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오타이드를 포함할 수 있다. 따라서, "폴리뉴클레오타이드", "핵산 서열", "뉴클레오타이드 서열" 및 "핵산 단편"이란 용어는 선택적으로 합성, 비천연 또는 변경된 뉴클레오타이드 염기를 함유하는 단일 가닥 또는 이중 가닥인 RNA 및/또는 DNA 및/또는 RNA-DNA의 중합체를 나타내기 위해 상호 교환 가능하게 사용된다. 뉴클레오타이드(보통 이의 5'-모노포스페이트 형태로 발견됨)는 하기와 같이 단일 문자 표시에 의해 지칭된다: 아데노신 또는 데옥시아데노신에 대해서(각각 RNA 또는 DNA에 있어서) "A", 시토신 또는 데옥시시토신에 대해서 "C", 구아노신 또는 데옥시구아노신에 대해서 "G", 우리딘에 대해서 "U", 데옥시티미딘에 대해서 "T", 퓨린(A 또는 G)에 대해서 "R", 피리미딘(C 또는 T)에 대해서 "Y", G 또는 T에 대해서 "K", A 또는 C 또는 T에 대해서 "H", 이노신에 대해서 "I", 및 임의의 뉴클레오타이드에 대해서 "N"(예를 들어, DNA 서열을 지칭하는 경우 N은 A, C, T 또는 G일 수 있고; RNA 서열을 지칭하는 경우 N은 A, C, U 또는 G일 수 있음).
본원에 기재되어 있는 폴리뉴클레오타이드(또는 핵산 분자)는 "유전자", "벡터" 및 "플라스미드"를 포함하는 것으로 이해된다.
"유전자"란 용어는, 단백질 암호화 서열의 전부 또는 일부를 포함하고 프로모터 서열과 같은 조절 서열(전사되지 않은 서열)을 포함할 수 있는 특정 아미노산 서열을 들 수 있지만 이에 제한되지 않는, 기능적인 분자를 암호화하는 폴리뉴클레오타이드를 지칭하며, 여기서 조절 서열은, 예를 들어 유전자가 발현되는 조건을 결정한다. 유전자의 전사된 영역은 비번역된 영역(UTR)(인트론을 포함함), 5'-비번역된 영역(UTR) 및 3'-UTR뿐만 아니라 암호화 서열을 포함할 수 있다. "자연적 유전자"는 그 자신의 조절 서열과 함께 자연에서 발견되는 바와 같은 유전자를 지칭한다.
"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 바람직한 코돈 사용의 빈도를 모방하도록 설계된 코돈 사용 빈도를 갖는 유전자이다. 유전자를 코돈 최적화하도록 이루어진 핵산 변경은 "동의어"이며, 이는 이들이 모 유전자의 암호화된 폴리펩타이드의 아미노산 서열을 변경시키지 않는다는 것을 의미한다. 그러나, 자연적 유전자 및 변이체 유전자 둘 모두는 특정 숙주 세포에 대해 코돈 최적화될 수 있으며, 이와 관련하여 이와 같은 제한은 의도된 것은 아니다. 코돈 선호 유전자를 합성하는 방법이 당해 기술분야에서 이용 가능하다. 예를 들어, 본원에 참조로 포함된 미국 특허 제5,380,831호 및 제5,436,391호, 및 문헌[Murray et al. (1989) Nucleic Acids Res. 17: 477~498]을 참고한다.
추가적인 서열 변형은 숙주 유기체에서의 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은, 예를 들어 의사 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 트랜스포존-유사 반복부, 및 유전자 발현에 유해할 수 있는 이 같은 기타 잘 규명된 서열의 제거를 포함한다. 서열의 G-C 함량은, 숙주 세포에서 발현되는 알려진 유전자를 참조하여 계산할 때, 주어진 숙주 유기체에 대해 평균 수준으로 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다.
본원에서 사용된 바와 같이, "암호화 서열"이란 용어는 이의 (암호화된) 단백질 산물의 아미노산 서열을 직접 나타낸 뉴클레오타이드 서열을 지칭한다. 암호화 서열의 경계는 일반적으로 오픈 리딩 프레임(이하 "ORF"로 지칭됨)에 의해 결정되며, 이는 흔히 ATG 시작 코돈으로 시작한다. 암호화 서열은 전형적으로 DNA, cDNA 및 재조합 뉴클레오타이드 서열을 포함한다.
본원에서 정의된 바와 같이, "오픈 리딩 프레임"(이하 "ORF"로 지칭됨)이란 용어는 (i) 개시 코돈, (ii) 아미노산을 나타내는 일련의 2개 이상의 코돈, 및 (iii) 종결 코돈으로 이루어진 중단되지 않은 리딩 프레임을 포함하는 핵산 또는 핵산 서열(자연적으로 발생한 것, 비자연적으로 발생한 것, 또는 합성된 것)을 의미하며, 이때 ORF는 5'에서 3' 방향으로 리딩(또는 번역)된다.
본원에서 사용된 바와 같은 "염색체 통합"이란 용어는 관심 폴리뉴클레오타이드가 바실러스 종의 염색체 내에 통합되는 과정을 지칭한다. 선형 공여 DNA 작제물의 상동성 아암(상동성 아암에 의해 플랭킹된 선형 공여 DNA)은 바실러스 종 염색체의 상동성 영역과 정렬될 것이다. 후속적으로, 이들 상동성 아암 사이의 서열은 이중 교차(즉, 상동성 재조합)로 관심 폴리뉴클레오타이드에 의해 대체된다.
"조절 서열"은 암호화 서열의 상류(5' 비암호화 서열), 내부 또는 하류(3' 비암호화 서열)에 위치하며, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 비번역 서열, 3' 비번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함하지만, 이에 제한되지 않는다.
본원에서 사용된 바와 같이, "프로모터"란 용어는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 그 전체가 자연적 유전자로부터 유래할 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래하는 상이한 요소들로 구성될 수 있거나, 심지어 합성 핵산 분절을 포함할 수 있다. 당업자라면 상이한 프로모터가 상이한 세포 유형으로, 또는 상이한 발달 단계에서, 또는 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 유도할 수 있다는 것을 이해한다. 대부분의 경우 유전자가 대부분의 세포 유형에서 발현되도록 하는 프로모터는 흔히 "구성적 프로모터"로서 지칭된다. 대부분의 경우에 조절 서열의 정확한 경계가 완전하게 정의되지 않았기 때문에 상이한 길이를 갖는 DNA 단편은 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
"작동 가능하게 연결된"은 2개 이상의 요소들 사이의 기능적 연결을 의미하도록 의도된다. 예를 들어, 관심 폴리뉴클레오타이드와 조절 서열(예를 들어, 프로모터) 사이의 작동 가능한 연결은 관심 폴리뉴클레오타이드의 발현을 허용하는 기능적 연결이다(즉, 관심 폴리뉴클레오타이드는 프로모터의 전사적 제어 하에 있음). 작동 가능하게 연결된 요소는 연속적 또는 불연속적일 수 있다. 암호화 서열(예를 들어, ORF)은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 2개의 단백질 암호화 영역의 연결을 지칭하도록 사용될 때, 작동 가능하게 연결되었다는 것은 암호화 영역이 동일한 리딩 프레임 내에 있는 것으로 의도된다.
핵산은 다른 핵산 서열과의 기능적 관계가 이루어지는 경우에 "작동 가능하게 연결된 것이다". 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA는 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우에 폴리펩타이드를 위한 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위는 번역을 용이하게 하기 위해 위치하는 경우에 암호화 서열에 작동 가능하게 연결된다. 일반적으로, "작동 가능하게 연결된"은 연결되어 있는 DNA 서열이 연속적이며, 분비 리더의 경우에 연속적이며 리딩 단계에 있다는 것을 의미한다. 그러나, 인핸서는 연속적이어서는 안 된다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이 같은 부위가 존재하지 않으면 통상적인 관례에 따라 합성 올리고뉴클레오타이드 어댑터(adaptor) 또는 링커가 사용된다.
본원에서 사용된 바와 같이, "관심 유전자의 단백질 암호화 서열에 연결된 관심 유전자(또는 이의 오픈 리딩 프레임)의 발현을 제어하는 기능적인 프로모터 서열"은 바실러스에서 암호화 서열의 전사 및 번역을 제어하는 프로모터 서열을 지칭한다. 예를 들어, 특정 구현예에서 본 개시내용은 5' 프로모터(또는 5' 프로모터 영역 또는 탠덤 5' 프로모터 등)를 포함하는 폴리뉴클레오타이드에 관한 것으로, 프로모터 영역은 관심 단백질을 암호화하는 핵산 서열에 작동 가능하게 연결된다. 따라서, 특정 구현예에서 기능적인 프로모터 서열은 관심 단백질을 암호화하는 관심 유전자의 발현을 제어한다. 기타 구현예에서, 기능적인 프로모터 서열은 바실러스 종 세포에서 관심 단백질을 암호화하는 내인성 유전자 또는 이종성 유전자의 발현의 제어한다.
프로모터 서열은 근위 상류 요소 및 더 원위의 상류 요소로 이루어지며, 이때 후자 요소는 종종 인핸서로서 지칭된다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다.
본원에 개시되어 있는 선형 재조합 DNA 및 원형 재조합 DNA는 당해 기술분야에 알려져 있는 임의의 방법을 이용하여 바실러스 종 세포 내로 도입될 수 있다.
본원에서 정의된 바와 같이, 적어도 하나의 선형 DNA 작제물, 폴리뉴클레오타이드, 또는 이의 유전자 또는 이의 벡터를 "박테리아 세포 내로 도입하기" 또는 "바실러스 종 세포 내로 도입하기"와 같은 문구에서 사용되는 바와 같은 "도입"이란 용어는 수용능 바실러스 종 세포 내로 DNA 작제물을 도입하기 위해 당해 기술분야에 알려져 있는 방법을 포함하며, 이때 이 방법은 바실러스 종 세포 내로 도입될 선형 DNA 작제물을 수용능 바실러스 종의 세포 개체군과 혼합하는 단계를 포함하지만, 이에 제한되지 않는다.
"도입"은, 성분(들)이 유기체 세포의 내부에 또는 세포 자체에 접근하는 방식으로 본원에 개시되어 있는 유기체(예를 들어, 세포 또는 유기체), 선형 DNA 작제물로의 제시를 의미하는 것으로 의도된다. 이 방법 및 조성물은, 본원에 개시되어 있는 선형 DNA 작제물이 유기체의 적어도 하나의 세포의 내부에 접근하는 한 유기체 또는 세포 내로 서열을 도입하기 위한 특정 방법에 의존하지 않는다. 도입은 핵산이 세포의 게놈 내에 혼입(통합)될 수 있는 수용능 바실러스 종 세포 내로의 핵산의 혼입에 대한 언급을 포함하며, 핵산의 세포로의 일시적인(직접적인) 제공에 대한 언급을 포함한다.
안정한 형질전환은 유기체 내로 도입된 뉴클레오타이드 작제물이 유기체의 게놈 내에 통합되며 이의 자손에 의해 유전될 수 있음을 의미하도록 의도된다. 일시적인 형질전환은 폴리뉴클레오타이드가 (직접적 또는 간접적으로) 유기체 내로 도입되고 유기체의 게놈으로 통합되지 않거나, 폴리펩타이드가 유기체로 도입된다는 것을 의미하도록 의도된다. 일시적인 형질전환은 도입된 조성물이 단지 유기체에서 일시적으로 발현되거나 존재한다는 것을 나타낸다.
바실러스 종 세포의 게놈의 변형 및/또는 그 내부로의 삽입을 갖는 이들 세포를 식별하기 위한 다양한 방법이 이용 가능하다. 목적하는 관심 변형을 갖는 형질전환된 세포의 식별은 당업자에게 알려져 있는 임의의 방법에 의해 확인될 수 있다. 예를 들어, 본원에 기재되어 있는 방법에 의해 수득된 이들의 게놈 내에 변형을 갖는 바실러스 종 세포의 식별은 당해 기술분야에 알려져 있는 임의의 표현형 또는 유전자형 스크린에 의해 식별될 수 있다. 선별 가능한 표현형은 탈지유를 함유하는 LB 한천 상에서 성장하는 콜로니 주변의 광륜(halo)의 존재가 바실러스 종 세포의 게놈 내로의 발현 카세트의 통합(본원의 실시예에 기술되어 있는 바와 같음)을 나타내는 표현형 스크린, 항미생물 민감성 스크린, 지시약(indicator)의 색깔 변화를 초래하는 한천에서의 트리글리세리드의 가수분해를 초래하는 발현 카세트의 통합, 색깔 변화를 초래하는 지시약 기질의 가수분해를 초래하는 발현 카세트의 통합, 콜로니 표현형에 영향을 미쳐서 콜로니 형태에서의 차이가 게놈 변형으로서 사용될 수 있는 유전자의 결실, 형광 단백질의 발현을 야기하는 발현 카세트의 통합, 또는 이의 임의의 하나의 조합을 포함한다.
선별 가능한 유전자형 방법은 형질전환된 바실러스 종 세포의 게놈 서열을 결정하기 위한 방법을 포함한다. 이 같은 방법은 게놈 뉴클레오타이드 서열에서의 임의의 변화를 검출하기 위해 게놈 서열을 직접 분석하는 것으로 간주될 수 있으며, 이는 PCR 방법, 서열분석 방법, 뉴클레아제 소화, 서던 블롯 및 이들의 임의의 조합을 포함하지만, 이에 제한되지 않는다. 예를 들어, 본원에 기재되어 있는 방법을 위해 필요한 정도로 본원에 참조로 포함된 미국 특허 출원 제12/147,834호를 참고한다. 이 방법은 또한 이의 게놈 내에 통합된 관심 폴리뉴클레오타이드를 포함하는 세포로부터 유기체를 회수하는 단계를 포함한다.
"게놈", 박테리아 (숙주) 세포 "게놈" 또는 바실러스 (숙주) 세포 "게놈"이란 용어는 핵 내에서 발견되는 염색체 DNA뿐만 아니라 세포의 세포이하 성분(염색체 외 DNA) 내에서 발견되는 세포소기관 DNA를 포함한다.
본원에서 사용된 바와 같이, "플라스미드", "벡터" 및 "카세트"란 용어는 종종 전형적으로는 세포의 중심 대사의 일부가 아니며, 보통 이중 가닥 DNA 분자의 형태인 유전자를 보유하는 염색체 외 요소를 지칭한다. 이 같은 요소는 임의의 공급원으로부터 유래하는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열(선형 또는 원형임)일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 적절한 3' 비번역된 서열과 함께 선택된 유전자 산물을 위한 프로모터 단편 및 DNA 서열을 세포 내로 도입할 수 있는 고유의 제작물에 연결되거나 재조합된다.
"벡터"란 용어는 세포 내에서 복제(번식)할 수 있는 임의의 핵산을 포함하며, 새로운 유전자 또는 DNA 분절을 세포 내로 전달할 수 있다. 벡터는 바이러스, 박테리오파지, 프로바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체(예를 들어, BAC(박테리아 인공 염색체)) 등을 포함하며, 이들은 "에피솜"(즉, 숙주 유기체의 염색체를 자체적으로 복제하거나 상기 염색체 내에 통합시킬 수 있음)이다.
"발현 카세트" 및 "발현 벡터"란 용어는, 세포에서 특정 핵산의 전사를 허용하는 일련의 특정 핵산 요소를 갖는, 재조합 또는 합성에 의해 생성된 핵산 작제물을 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편 내에 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 일부는 기타 서열들 중에서 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포 내에 특정 핵산의 전사를 허용하는 일련의 특정 핵산 요소를 포함한다. 특정 구현예에서, 본 개시내용의 DNA 작제물은 본원에서 정의된 바와 같은 선택 마커 및 불활성화 염색체 또는 유전자 또는 DNA 분절을 포함한다. 다수의 원핵생물 발현 벡터는 상업적으로 구입 가능하며, 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에서 이루어진다.
본원에서 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환된 숙주 세포의 염색체 내의 영역과 상동성이고 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터의 용도는 상동성 재조합을 통해 돌연변이를 숙주 세포의 염색체 내로 도입하는 것이다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단(즉, 스터퍼(stuffer) 서열 또는 플랭킹 서열)에 첨가된 기타 비상동성 서열을 포함한다. 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 닫힌 원을 형성하도록 닫혀있을 수 있다. 적절한 벡터의 선택 및/또는 제작은 당업자의 지식 내에서 충분히 이루어진다.
본원에서 사용된 바와 같이, "플라스미드"란 용어는 클로닝 벡터로서 사용되고 다수의 박테리아 및 일부 진핵생물에서 염색체 외의 자가 복제 유전 요소를 형성하는 원형의 이중 가닥(ds) DNA 작제물을 지칭한다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈 내에 혼입되어 있다.
관심 폴리뉴클레오타이드는 본원에 추가로 기재되어 있으며, 효소의 생산(예를 들어, 비제한적인 예로서 박테리아를 발효하여 효소를 생성하는 것을 통해)에 관여된 것의 상업 시장 및 관심을 반영하는 폴리뉴클레오타이드를 포함한다.
관심 폴리뉴클레오타이드는 하나 이상의 관심 단백질을 암호화할 수 있다. 이는 기타 생물학적 기능을 가질 수 있다. 관심 폴리뉴클레오타이드는 형질전환될 바실러스 종 세포의 게놈, 즉 상동성 또는 이종성 서열 내에 이미 존재하거나 존재하지 않을 수 있다.
관심 뉴클레오타이드는 표적화된 관심 유전자 서열에 대한 메신저 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수 있다. 안티센스 뉴클레오타이드는 상응하는 mRNA와 혼성화하도록 제작된다. 서열이 상응하는 mRNA와 혼성화하여 이의 발현을 간섭하는 한 안티센스 서열의 변형은 이루어질 수 있다. 이러한 방식으로, 상응하는 안티센스 서열에 대해 70%, 80%, 또는 85%의 서열 동일성을 갖는 안티센스 제작물이 사용될 수 있다. 더욱이, 안티센스 뉴클레오타이드의 일부는 표적 유전자의 발현을 방해하기 위해 사용될 수 있다. 일반적으로, 적어도 50개의 뉴클레오타이드, 100개의 뉴클레오타이드, 200개의 뉴클레오타이드 또는 그 이상의 뉴클레오타이드의 서열이 사용될 수 있다.
또한, 유기체 내의 내인성 유전자의 발현을 억제하기 위해 관심 폴리뉴클레오타이드가 또한 센스 배향으로 사용될 수 있다. 폴리뉴클레오타이드를 센스 배향으로 사용하여 유기체에서의 유전자 발현을 억제하기 위한 방법이 당해 기술분야에 알려져 있다. 이 방법은 일반적으로 내인성 유전자의 전사체에 상응하는 뉴클레오타이드 서열의 적어도 일부에 작동 가능하게 연결된 유기체에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 유기체를 형질전환시키는 단계를 수반한다. 전형적으로, 이 같은 뉴클레오타이드 서열은 내인성 유전자의 전사체의 서열에 대해 상당한 서열 동일성, 일반적으로 약 65% 초과의 서열 동일성, 약 85%의 서열 동일성, 약 95% 초과의 서열 동일성을 갖는다. 본원에 참조로 포함된 미국 특허 5,283,184호 및 5,034,323호를 참고한다.
표현형 마커는, 시각적 마커 및 선택 가능한 마커(그것이 양성의 선택 가능한 마커든 음성의 선택 가능한 마커든)를 포함하는, 선별 가능하거나 선택 가능한 마커이다. 임의의 표현형 마커가 사용될 수 있다. 구체적으로, 선택 가능하거나 선별 가능한 마커는 종종 특정 조건 하에 이를 포함하는 분자 또는 세포를 식별하거나, 이를 선택하거나, 이에 반하여 선택할 수 있도록 하는 DNA 분절을 포함한다. 이들 마커는 RNA, 펩타이드 또는 단백질의 생성(이에 제한되지 않음)과 같은 활성을 암호화할 수 있거나, RNA, 펩타이드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다.
"선택 가능한 마커" 및 "선택 가능한 마커 암호화 뉴클레오타이드 서열"이란 용어는 (숙주) 세포 내에서 발현할 수 있으며, 선택 가능한 마커의 발현이 상응하는 선택제의 존재 하에 또는 필수 영양소의 결핍 하에 성장하는 능력을 발현된 유전자를 함유하는 세포에 부여하는 뉴클레오타이드 서열을 지칭한다. 하나의 양태에서, 선택 마커는 벡터를 함유하는 이들 숙주의 용이한 선택을 가능케 하는, 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이 같은 선택 가능한 마커의 예로는 항균제를 들 수 있지만, 이에 제한되지 않는다.
"선택 가능한 마커"이란 용어는 숙주 세포가 유입되는 관심 DNA을 흡수하거나 일부 기타 반응이 일어났다는 암시를 제공하는 유전자를 포함한다. 전형적으로, 선택 가능한 마커는, 외인성 DNA를 함유하는 세포가 형질전환 동안에 임의의 외인성 서열을 수용하지 않은 세포와 구별되도록 하기 위해 숙주 세포에 대한 항미생물 내성 또는 대사적 이점을 부여하는 유전자이다.
"상주하는 선택 가능한 마커"는 형질전환될 미생물의 염색체 상에 위치하는 것이다. 상주하는 선택 가능한 마커는 형질전환용 DNA 작제물 상의 선택 가능한 마커와는 상이한 유전자를 암호화한다. 선택 마커는 당업자에게 잘 알려져 있다. 상기에 나타나 있는 바와 같이, 마커는 항미생물 내성 마커(예를 들어, ampR, phleoR, specR, kanR, eryR, tetR, cmpR 및 neoR)일 수 있다(예를 들어, 문헌[Guerot-Fleury, 1995; Palmeros et al., 2000]; 및 문헌[Trieu-Cuot et al., 1983] 참조). 일부 구현예에서, 본 발명은 클로람페니콜 내성 유전자(예를 들어, pC194 상에 존재하는 유전자뿐만 아니라, 바실러스 리케니포르미스 게놈에 존재하는 내성 유전자)를 제공한다. 이러한 내성 유전자는 본 발명뿐만 아니라, 염색체 통합형 카세트 및 편입형 플라스미드의 염색체 증폭을 수반하는 구현예에 특히 유용하다(예를 들어, 문헌[Albertini and Galizzi, 1985]; 문헌[Stahl and Ferrari, 1984] 참조). 본 발명에 따라 유용한 기타 마커로는 영양 요구성 마커(예를 들어, 세린, 리신, 트립토판); 및 검출 마커(예를 들어, β-갈락토시다아제)를 들 수 있지만, 이에 제한되지 않는다.
관심 폴리뉴클레오타이드는 기타 형질(trait)과 조합하여 스태킹되거나 사용될 수 있는 유전자를 포함한다.
본원에서 사용된 바와 같이, "폴리펩타이드" 및 "단백질"이란 용어는 사용 교환 가능하게 사용되며, 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는, 임의의 길이의 중합체를 지칭한다. 본원에서는 아미노산 잔기에 대한 통상적인 1-문자 또는 3-문자 코드가 사용된다. 폴리펩타이드는 선형 또는 분지형일 수 있으며, 이는 변형된 아미노산을 포함할 수 있고, 이는 비-아미노산에 의해 중단될 수 있다. 폴리펩타이드란 용어는 또한 자연적으로 변형되거나 개입, 예를 들어 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 임의의 기타 조작 또는 변형(예를 들어, 표지 성분과의 접합)에 의해 변형되어 있는 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등)뿐만 아니라, 당해 기술분야에 알려져 있는 기타 변형을 함유하는 폴리펩타이드가 상기 정의 내에 또한 포함된다.
"관심 단백질" 또는 "POI"란 용어는 변형된 바실러스 (딸)세포에서 발현되어야 하는 관심 폴리펩타이드를 지칭한다. 따라서, 본원에서 사용된 바와 같이 POI는 효소, 기질-결합 단백질, 표면 활성 단백질, 구조 단백질, 수용체 단백질, 항체 등일 수 있다.
본원에서 사용된 바와 같이, "관심 유전자" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예를 들어, 폴리뉴클레오타이드, 유전자 또는 ORF)을 지칭한다. "관심 단백질"을 암호화하는 "관심 유전자"는 자연적으로 발생하는 유전자, 돌연변이된 유전자 또는 합성 유전자일 수 있다.
특정 구현예에서, 본 개시내용의 관심 유전자는 상업적으로 관련이 있는 산업용 관심 단백질, 예를 들어 효소(예를 들어, 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산 탈수효소, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 카이모신, 큐티나아제, 데옥시리보뉴클레아제, 에피메라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코신 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소메라아제, 라카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 산화/환원 효소, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 탈중합효소, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 파이타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스페라아제, 수송 단백질, 트랜스글루타미나아제, 자일라아제, 헥소오스 옥시다아제 및 이들의 조합)를 암호화한다.
"돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 지칭한다. 점 돌연변이, 결실 돌연변이, 침묵 돌연변이, 프레임이동 돌연변이, 스플라이싱 돌연변이 등을 포함하는 일부 유형의 돌연변이가 존재한다. 돌연변이는 (예를 들어, 부위 지향적 돌연변이 유발을 통해) 특이적으로, 또는 (예를 들어, 화학 작용제, 복구 마이너스(repair minus) 박테리아 균주를 통한 계대배양(passage)을 통해) 무작위로 이루어질 수 있다.
본원에 기재되어 있는 "점 돌연변이"는 유전자 서열 내의 오직 하나 또는 극 소수의 뉴클레오타이드에 영향을 미치는 돌연변이를 지칭한다. 점 돌연변이는 가장 흔하게는 하나의 염기의 다른 염기로의 치환을 수반한다(이는 DNA 내에서뿐만 아니라 상보적인 염기를 변경함). 점 돌연변이란 용어는 또한 단일 염기 쌍의 삽입 또는 결실을 포함한다. 점 돌연변이 또는 치환은 DNA 또는 RNA의 서열로부터 단일 뉴클레오타이드 염기가 변경, 삽입 또는 결실되는 유전자 돌연변이를 포함한다.
수용능 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이 본원에 기재되어 있다.
하나의 구현예에서, 이 방법은 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법이며, 이때 이 방법은 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 여기서 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는다. 하나의 구현예에서, 상기 방법은 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 돌연변이를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함한다. 하나의 양태에서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 바실러스 종 세포의 자연적 서열(변형 이전의 바실러스 종의 게놈 DNA 서열)과 비교하여 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함한다. 하나의 양태에서, 목적하는 돌연변이(염기 치환)를 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있다.
본 개시내용의 하나의 양태에서, 공여 DNA는 적어도 900개의 뉴클레오타이드의 길이를 갖는 2개의 상동성 아암(하나는 5' 상류 아암인 HR1이고, 하나는 3' 하류 아암인 HR2임)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함한다. 이러한 공여 작제물이 세포 내로 도입되면, 원래의 게놈 서열의 돌연변이를 초래하는 상동성 재조합이 발생할 수 있다.
"돌연변이된 유전자"는 인간 개입을 통해 변경된 유전자이다. 이 같은 "돌연변이된 유전자"는 적어도 하나의 뉴클레오타이드의 부가, 결실 또는 치환에 의해 돌연변이되지 않은 상응하는 유전자의 서열과는 상이한 서열을 갖는다. 본 개시내용의 특정 구현예에서, 돌연변이된 유전자는 본원에 개시되어 있는 바와 같은 방법에서 기인하는 변경을 포함한다. 돌연변이된 세포 또는 유기체는 돌연변이된 유전자를 포함하는 세포 또는 유기체이다.
본원에서 사용된 바와 같이, 폴리펩타이드 또는 이의 서열의 문맥에서, "치환"이란 용어는 하나의 아미노산을 다른 아미노산으로 대체(즉, 치환)하는 것을 의미한다.
본원에서 정의된 바와 같이, "내인성 유전자"는 유기체의 게놈 내의 이의 천연 위치에 있는 유전자를 지칭한다.
본원에서 사용된 바와 같이, 폴리뉴클레오타이드 또는 폴리펩타이드 서열과 관련하여 "이종성"은 외래 종으로부터 기원하는 서열이거나, 동일한 종으로부터 유래하는 경우 의도적인 인간 개입에 의해 조성물에서의 이의 자연적인 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형된다. 예를 들어, 이종성 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터는 폴리뉴클레오타이드가 유래하는 종과 상이한 종에서 기원되거나, 동일한/유사한 종에서 유래하는 경우 하나 또는 둘 모두는 이들의 원래의 형태 및/또는 게놈 유전좌위로부터 실질적으로 변형되거나, 프로모터는 작동 가능하게 연결된 폴리뉴클레오타이드에 있어 자연적인 프로모터가 아니다. 본원에서 사용된 바와 같이, 달리 기재되지 않는 한, 키메라 폴리뉴클레오타이드는 암호화 서열에 이종성인 전사 개시 영역에 작동 가능하게 연결된 암호화 서열을 포함한다.
본원에서 정의된 바와 같이, "이종성" 유전자, "비내인성" 유전자 또는 "외래" 유전자는 정상적으로는 숙주 유기체에서 발견되지 않지만 유전자 전달에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 지칭한다. 본원에서 사용된 바와 같이, "외래" 유전자(들)란 용어는 비자연적 유기체 내에 삽입된 자연적 유전자(또는 ORF) 및/또는 자연적 또는 비자연적 유기체 내에 삽입된 키메라 유전자를 포함한다.
본원에서 정의된 바와 같이, "이종성" 핵산 작제물 또는 "이종성" 핵산 서열은 이것이 발현되는 세포에 자연적이지 않은 서열의 일부를 갖는다.
본원에서 정의된 바와 같이, "이종성 제어 서열"은 관심 유전자의 발현을 조절(제어)하는데 자연에서 기능을 하지 못하는 유전자 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 지칭한다. 일반적으로, 이종성 핵산 서열은 세포에 내인성(자연적)이 아니거나, 이들이 존재하는 게놈의 일부이며, 감염, 형질감염, 형질전환, 마이크로주사, 전기천공 등에 의해 세포에 부가되었다. "이종성" 핵산 작제물은 자연적 숙주 세포에서 발견되는 제어 서열/DNA 암호화 서열 조합과 동일하거나 상이한 제어 서열/DNA 암호화 (ORF) 서열 조합을 함유할 수 있다.
본원에서 사용된 바와 같이, "신호 서열" 및 "신호 펩타이드"란 용어는 성숙한 단백질 또는 전구체 형태의 단백질의 분비 또는 직접적인 수송에 참여할 수 있는 아미노산 잔기의 서열을 지칭한다. 신호 서열은 전형적으로 전구체 또는 성숙한 단백질 서열에 대해 N 말단에 위치한다. 신호 서열은 내인성 또는 외인성일 수 있다. 신호 서열은 정상적으로는 성숙한 단백질에는 결여되어 있다. 신호 서열은 전형적으로 단백질이 수송된 이후에 신호 펩티다아제에 의해 단백질로부터 개열된다.
"유래하는"이란 용어는 "기원하는", "수득된", "수득 가능한" 및 "생성된"이란 용어를 포함하고, 일반적으로 하나의 특정 재료 또는 조성물이 다른 특정 재료 또는 조성물에서 그 기원을 찾거나, 다른 특정 재료 또는 조성물을 참고하여 기술될 수 있는 특징을 갖는다는 것을 나타낸다.
본원에서 사용된 바와 같이, "플랭킹 서열"은 토의 중인 서열의 상류 또는 하류에 있는 임의의 서열을 지칭한다(예를 들어, A-B-C 유전자의 경우에 유전자 B는 A 및 C 유전자 서열에 의해 플랭킹됨). 특정 구현예에서, 유입 서열은 각각의 측면 상에서 상동성 아암에 의해 플랭킹된다. 일부 구현예에서, 플랭킹 서열은 하나의 측면(3' 또는 5') 상에만 존재하는 반면, 기타 구현예에서 이는 플랭킹된 서열의 각각의 측면 상에 존재한다. 각각의 상동성 아암의 서열은 바실러스 종 게놈(예를 들어, 바실러스 염색체) 내의 서열과 상동성이다.
본원에서 사용된 바와 같이, "스터퍼 서열"이란 용어는 상동성 아암(전형적으로 벡터 서열)에 플랭킹하는 임의의 추가 DNA를 지칭한다. 그러나, 이 용어는 임의의 비상동성 DNA 서열을 포함한다. 임의의 이론에 제한되지 않지만, 스터퍼 서열은 세포가 DNA 흡수를 개시하기 위한 중요하지 않은 표적을 제공한다.
핵산 또는 폴리펩타이드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은 특정 비교 창에 걸쳐 최대 관련성(correspondence)을 위해 정렬되는 경우에 동일한 2개의 서열 내의 핵산 염기 또는 아미노산 잔기를 지칭한다.
"서열 동일성(%)"이란 용어는 비교 창에 걸쳐 최적으로 정렬된 2개의 서열을 비교함으로써 결정된 값을 지칭하며, 이때 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개의 서열의 최적 정렬을 위한 기준 서열(부가 또는 결실을 포함하지 않음)과 비교할 때 부가 또는 결실(즉, 갭)을 포함할 수 있다. 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 모두에서 나타나는 위치의 개수를 결정하여 일치된 위치의 개수를 산출하고, 일치된 위치의 개수를 비교 창 내의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성(%)을 수득함으로써 백분율(%)을 계산한다. 서열 동일성(%)의 유용한 예로는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 들 수 있지만, 이에 제한되지 않는다. 이들 동일성은 본원에 기재되어 있는 프로그램 중 임의의 것을 사용하여 결정될 수 있다.
서열 정렬 및 동일성 또는 유사성(%)의 계산은 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM 프로그램을 포함하지만 이에 제한되지 않는, 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초하는 것으로 이해될 것이다. 본원에서 사용된 바와 같이, "디폴트 값"은 최초로 초기화되는 경우에 원래 소프트웨어로 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
"Clustal V 정렬 방법"은 Clustal V(문헌[Higgins and Sharp, (1989) CABIOS 5: 151~153]; 문헌[Higgins et al., (1992) Comput Appl Biosci 8: 189~191]에 기술되어 있음)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY = 10 및 GAP LENGTH PENALTY = 10에 해당한다. Clustal 방법을 사용하는 단백질 서열의 쌍 정렬 및 이의 동일성(%)의 계산을 위한 디폴트 파라미터는 KTUPLE = 1, GAP PENALTY = 3, WINDOW = 5 및 DIAGONALS SAVED = 5이다. 핵산의 경우, 이들 파라미터는 KTUPLE = 2, GAP PENALTY = 5, WINDOW = 4 및 DIAGONALS SAVED = 4이다. Clustal V 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성(%)"을 수득하는 것이 가능하다.
"Clustal W 정렬 방법"은 Clustal W(문헌[Higgins and Sharp, (1989) CABIOS 5: 151~153; 문헌[Higgins et al., (1992) Comput Appl Biosci 8: 189~191]에 기술되어 있음)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc.(위스콘신주 매디슨 소재))의 MegAlignTM v6.1 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY = 10, GAP LENGTH PENALTY = 0.2, 지연 발산 서열(%) = 30, DNA 전이 가중치 = 0.5, 단백질 가중치 매트릭스 = Gonnet 시리즈, DNA 가중치 매트릭스 = IUB). Clustal W 프로그램을 사용하여 서열을 정렬한 후, 동일한 프로그램에서 "서열 거리" 표를 보고 "동일성(%)"을 수득할 수 있다.
달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하는 GAP 버전 10(GCG, Accelrys(캘리포니아주의 샌디에고 소재))을 사용하여 수득된 값을 지칭한다: 뉴클레오타이드 서열에 대한 동일성(%) 및 유사성(%)은 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3 및 nwsgapdna.cmp 점수 매트릭스를 사용하며; 아미노산 서열에 대한 동일성(%) 및 유사성(%)은 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2 및 BLOSUM62 점수 매트릭스를 사용함(문헌[Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89: 10915]). GAP는 문헌[Needleman and Wunsch, (1970) J Mol Biol 48: 443~53]의 알고리즘을 사용하여 일치의 개수를 최대화하고 갭의 개수를 최소화하는 2개의 완전한 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 일치된 염기의 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 개수의 일치된 염기와 가장 적은 갭을 갖는 정렬을 생성한다.
"BLAST"는 생물학적 서열 간의 유사성 영역을 찾는데 사용되는 미국 국립 생물공학 정보 센터(NCBI: National Center for Biotechnology Information)에 의해 제공되는 검색 알고리즘이다. 이 프로그램은 뉴클레오타이드 또는 단백질 서열을 서열 데이터베이스와 비교하고, 일치의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열(query sequence)과 충분한 유사성을 갖는 서열을 확인한다. BLAST에는 식별된 서열 및 이들의 쿼리 서열에 대한 국소 정렬이 보고되어 있다.
당업자라면 여러 수준의 서열 동일성이 기타 종 또는 자연적 또는 합성적으로 변형된 종으로부터 폴리펩타이드를 식별하는 데 유용하며, 이때 이 같은 폴리펩타이드가 동일하거나 유사한 기능 또는 활성을 갖는다는 것을 잘 이해하고 있다. 동일성(%)의 유용한 예로는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 제한되지 않는다. 실제로, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%와 같은 50% 내지 100%의 임의의 정수의 아미노산 동일성은 본 개시내용을 기술하는 데 유용할 수 있다.
"번역 리더 서열"은 유전자의 프로모터 서열과 암호화 서열 사이에 위치한 폴리뉴클레오타이드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류에 있는 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예가 기술되어 있다(예를 들어, 문헌[Turner and Foster, (1995) Mol Biotechnol 3: 225~236]).
"3' 비암호화 서열", "전사 종결자" 또는 "종결 서열"은 암호화 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 기타 서열을 포함한다. 폴리아데닐화 신호는 보통 mRNA 전구체의 3' 말단에 대한 폴리아데닐산 영역의 부가에 영향을 주는 것을 특징으로 한다. 상이한 3' 비암호화 서열의 사용은 문헌[Ingelbrecht et al., (1989) Plant Cell 1: 671~680]에 예시되어 있다.
본원에서 사용된 바와 같이, "RNA 전사체"는 DNA 서열의 RNA 중합효소-촉매된 전사로부터 생긴 산물을 지칭한다. RNA 전사체가 DNA 서열의 완벽한 상보적인 복제물인 경우, 이는 1차 전사체 또는 프리-mRNA로서 지칭된다. RNA 전사체가 1차 전사체인 프리-mRNA의 전사 후 가공으로부터 유래하는 RNA 서열인 경우 이는 성숙한 RNA 또는 mRNA로서 지칭된다. "메신저 RNA" 또는 "mRNA"는 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "cDNA"는 효소인 역전사효소를 사용하는 mRNA 주형에 상보적이고 이로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나, DNA 중합효소 I의 Klenow 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는 mRNA를 포함하는 RNA 전사체를 지칭하며, 세포 내 또는 시험관 내에서 단백질로 번역될 수 있다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부에 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참조). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비암호화 서열, 3' 비암호화 서열, 인트론 또는 암호화 서열에 있을 수 있다. "기능적 RNA"는 번역되지 않을 수 있지만 여전히 세포 과정에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. "보체" 및 "역보체(reverse complement)"는 mRNA 전사체에 대하여 본원에서 상호 교환 가능하게 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 의미이다.
"성숙한" 단백질은 번역 후 가공된 폴리펩타이드(즉, 1차 번역 산물에 존재하는 임의의 프리펩타이드 또는 프로펩타이드가 제거된 것)를 지칭한다. "전구체" 단백질은 mRNA의 1차 번역 산물(즉, 프리펩타이드 및 프로펩타이드가 여전히 존재하는 것)을 지칭한다. 프리펩타이드 및 프로펩타이드는 세포 내 국부화 신호일 수 있으나, 이에 제한되지 않는다.
단백질은 아미노산 치환, 결실, 절두(truncation) 및 삽입을 비롯한 다양한 방식으로 변경될 수 있다. 이러한 조작 방법은 일반적으로 알려져 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA 내에서의 돌연변이에 의해 제조될 수 있다. 돌연변이 유발 및 뉴클레오타이드 서열 변경을 위한 방법은, 예를 들어 문헌[Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82: 488~92]; 문헌[Kunkel et al., (1987) Meth Enzymol 154: 367~82]; 미국 특허 제4,873,192호; 문헌[Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York] 및 여기에 인용된 문헌을 포함한다. 단백질의 생물학적 활성에 영향을 미칠 가능성이 없는 아미노산 치환에 관한 지침은, 예를 들어 문헌[Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)]의 모델에서 발견된다. 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산과 교환하는 것과 같은 보존적 치환이 바람직할 수 있다. 보존적 결실, 삽입 및 아미노산 치환은 단백질의 특징에 근본적인 변화를 일으킬 것으로 예상되지 않으며, 임의의 치환, 결실, 삽입, 또는 이들의 조합의 효과는 통상적인 선별 분석법에 의해 평가될 수 있다.
표준 DNA 단리, 정제, 분자 클로닝, 벡터 제작 및 검증/특성화 방법은 잘 확립되어 있다(예를 들어, 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY)] 참조). 벡터 및 작제물은 원형 플라스미드, 및 관심 폴리뉴클레오타이드 및 선택적으로는 기타 성분(링커, 어댑터, 조절 또는 분석을 포함함)을 포함하는 선형 폴리뉴클레오타이드를 포함한다. 일부 예에서, 관심 뉴클레오타이드는 인트론, 암호화 서열, 5' UTR, 3' UTR 및/또는 조절 영역 내에 포함될 수 있다.
약어의 의미는 다음과 같다: "sec"는 초를 의미하고, "min"은 분을 의미하고, "h"는 시간을 의미하고, "d"는 일을 의미하고, "㎕"는 마이크로리터를 의미하고, "㎖"는 밀리리터를 의미하고, "ℓ"는 리터를 의미하고, "μM"은 마이크로몰을 의미하고, "mM"은 밀리몰을 의미하고, "M"은 몰을 의미하고, "mmol"은 밀리몰을 의미하고, "μmole"은 마이크로몰을 의미하고, "g"은 그램을 의미하고, "㎍"은 마이크로그램을 의미하고, "ng"는 나노그램을 의미하고, "U"는 단위를 의미하고, "bp"는 염기 쌍을 의미하고, "kb"는 킬로염기를 의미한다.
본원에 개시되어 있는 조성물 및 방법의 비제한적인 구현예는 하기와 같다:
1. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 900개의 뉴클레오타이드의 길이 또는 900개 초과의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
2. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내에 공여 DNA를 통합시키는 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
3. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실된 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대해 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
4. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈에서 뉴클레오타이드 서열을 결실시키기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)으로 이루어져 있고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실된 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대해 서열 상동성을 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
5. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300, 3,400, 3,500, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는 것인 방법.
6. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 선형 DNA 작제물은 이중 가닥 DNA인 것인 방법.
7. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 수용능 바실러스 종 세포는 바실러스 서브틸리스, 바실러스 리케니포르미스, 바실러스 렌투스, 바실러스 브레비스, 바실러스 스테아로써모필루스, 바실러스 알칼로필루스, 바실러스 아밀로리퀘파시엔스, 바실러스 클라우시, 바실러스 할로두란스, 바실러스 메가테리움, 바실러스 코아귤란스, 바실러스 서큘란스, 바실러스 라우투스 및 바실러스 투링기엔시스로 이루어진 군으로부터 선택되는 것인 방법.
8. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 상기 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되는 것인 방법.
9. 제1 내지 제4 구현예 중 어느 한 구현예에 있어서, 상기 수용능 바실러스 종 세포는 초수용능 바실러스 종 균주에서 유래한 것인 방법.
10. 제7 구현예에 있어서, 상기 초수용능 바실러스 종 균주는 Pxyl-ComK 균주인 것인 방법.
11. 제1 또는 제2 구현예에 있어서, 공여 DNA는 관심 폴리뉴클레오타이드, 관심 유전자, 복수개의 관심 유전자, 하나 이상의 재조합 DNA, 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열, 게놈 내로 도입될 점 돌연변이를 포함하는 뉴클레오타이드 서열 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열을 포함하는 것인 방법.
12. 제1 또는 제2 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
13. 제3 또는 제4 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
14. 제3 또는 제4 구현예에 있어서, 선형 DNA 작제물은 상기 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 추가로 포함하고, 상기 공여 DNA는 상기 바실러스 종 세포의 게놈에 삽입되는 반면, 상기 뉴클레오타이드 서열은 상기 바실러스 종 세포의 상기 게놈에서 결실되는 것인 방법.
15. 제14 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖고 이의 게놈 내에 통합된 공여 DNA를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
16. 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법으로서, 수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 상기 DNA 작제물의 상기 단일 염기는 상기 적어도 하나의 바실러스 종의 게놈 내의 상응하는 단일 염기와는 상이하고, 각각의 상동성 아암은 적어도 1,200개의 뉴클레오타이드의 길이를 가지며, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법.
17. 제16 구현예에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 단일 염기 돌연변이를 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
18. 제16 구현예에 있어서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기 변형 또는 치환을 포함하는 것인 방법.
19. 제16 구현예에 있어서, 목적하는 돌연변이를 갖는 뉴클레오타이드 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기로 이루어져 있는 것인 방법.
실시예
본 개시내용은 하기 실시예에서 추가로 정의된다. 이들 실시예는 본 개시내용의 특정 바람직한 양태를 나타내면서 예시로만 제공되는 것으로 이해되어야 한다. 당업자라면 상기 토의 및 이들 실시예로부터 본 개시내용의 본질적인 특징을 확인할 수 있으며, 본 발명의 진의 및 범주에서 벗어나지 않는 한, 다양한 용도 및 조건에 맞도록 본 개시내용을 다양하게 변화 및 변경시킬 수 있다.
실시예 1
선택이 없는, 바실러스 서브틸리스의 염색체 내로의 선형 공여 DNA의 통합
본 실시예에는 상동성 영역(HR1-aprE 및 HR2-aprE)에 의해 플랭킹된 공여 DNA(관심 유전자를 암호화함)로 구성된 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 통합 빈도가 기재되어 있다. 관심 유전자(GOI)는 리파아제 및 프로테아제이다.
게놈 DNA로부터 선형 DNA 작제물을 하기와 같이 증폭하였다. HR1-aprE1을 암호화하는 제1 작제물(서열 번호 1), 프로테우스 불가리스(Proteus vulgaris)에서 유래한 리파아제(서열 번호 2), BPN' 종결자(서열 번호 3) 및 HR2-aprE1(서열 번호 4)을 올리고(서열 번호 5) 및 (서열 번호 6)를 이용하여 PCR에 의해 증폭하여, 산물(서열 번호 7)을 수득하였다. HR1-aprE2를 암호화하는 제2 작제물(서열 번호 8), P2 프로모터(서열 번호 9), 바실러스 지브소니(Bacillus gibsonii)에서 유래한 프로테아제(서열 번호 10), BPN' 종결자(서열 번호 3) 및 HR2-aprE2(서열 번호 11)를 올리고(서열 번호 12) 및 (서열 번호 13)를 이용하여 PCR에 의해 증폭하여, 산물(서열 번호 14)을 수득하였다.
리파아제(서열 번호 7) 또는 프로테아제(서열 번호 14)를 암호화하는 공여 DNA의 통합을 위한 이들 합성 선형 DNA 작제물을 바실러스 서브틸리스(B. subtilis) 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크(baffled flask) 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 100 ng의 (서열 번호 7) 및 (서열 번호 14) DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-4 및 10-5 희석액으로부터의 100 ㎕를 (서열 번호 7)의 경우에 로다민 올리브 오일 한천(ROA) 및 (서열 번호 14)의 경우에 1.6% 탈지유를 함유하는 LB 한천 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다. 리파아제를 발현하는 세포는 ROA 상에 짙은 핑크색 광륜을 갖는 핑크색 콜로니로서 나타나는 반면, 모세포는 백색 콜로니로서 나타난다. 프로테아제를 발현하는 세포는 LB-탈지유 한천 상에 투명한 광륜을 형성한다.
리파아제를 암호화하는 공여 DNA의 통합 빈도를 결정하기 위해, ROA 상에서 비선택적으로 성장된 핑크색 콜로니의 비율(%)을 점수로 나타냈다(표 1). 탈지유를 함유하는 비선택적 LB 한천 상의 콜로니 주변의 광륜의 존재를 프로테아제의 통합 빈도를 결정하기 위해 사용하였다. 표 1에 나타나 있는 바와 같이, 46%의 콜로니가 프로테아제 통합을 나타내는 광륜을 포함하는 것으로 확인되었다.
서열 번호 | 게놈 유전좌위 | 상동성 아암(HR1)의 길이(bp) | 상동성 아암(HR2)의 길이(bp) | 통합 빈도(%) | |
DNA 부재 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 0 |
리파아제 통합 | 7 | aprE | 3,275 | 2,912 | 31 |
프로테아제 통합 | 14 | aprE | 2,965 | 2,971 | 46 |
실시예 2
선택이 없는, 다양한 길이의 상동성 아암을 포함하는 선형 DNA 작제물을 이용한 바실러스 서브틸리스의 염색체 내로의 선형 공여 DNA의 통합
본 실시예에는 길이가 다양한 상동성 영역에 의해 플랭킹된 공여 DNA(관심 유전자를 암호화함)로 구성된 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 통합 빈도가 기재되어 있다.
aprE 유전좌위(서열 번호 7) 및 프로테아제(서열 번호 14)에서 리파아제의 통합을 위한 공여 DNA를 포함하는 DNA 작제물을 PCR용 주형으로 사용하여 길이가 다양한 상동성 아암을 갖는 산물을 증폭하였다. 주형, 프라이머 및 HR1 및 HR2 상동성 길이는 표 2에 나열되어 있다.
주형 | F 프라이머 | R 프라이머 | 산물 | HR1(bp) | HR2(bp) |
서열 번호 7 | 서열 번호 16 | 서열 번호 17 | 서열 번호 22 | 336 | 755 |
서열 번호 7 | 서열 번호 18 | 서열 번호 19 | 서열 번호 23 | 1,200 | 1,681 |
서열 번호 7 | 서열 번호 18 | 서열 번호 13 | 서열 번호 24 | 1,200 | 2,971 |
서열 번호 7 | 서열 번호 12 | 서열 번호 19 | 서열 번호 25 | 3,265 | 1,681 |
서열 번호 7 | 서열 번호 5 | 서열 번호 6 | 서열 번호 26 | 3,275 | 2,912 |
서열 번호 7 | 서열 번호 12 | 서열 번호 20 | 서열 번호 27 | 3,265 | 6,095 |
서열 번호 7 | 서열 번호 16 | 서열 번호 20 | 서열 번호 28 | 336 | 6,095 |
서열 번호 14 | 서열 번호 21 | 서열 번호 17 | 서열 번호 29 | 289 | 755 |
서열 번호 14 | 서열 번호 18 | 서열 번호 19 | 서열 번호 30 | 900 | 1,681 |
서열 번호 14 | 서열 번호 18 | 서열 번호 13 | 서열 번호 31 | 900 | 2,971 |
서열 번호 14 | 서열 번호 12 | 서열 번호 19 | 서열 번호 32 | 2,965 | 1,681 |
서열 번호 14 | 서열 번호 12 | 서열 번호 13 | 서열 번호 33 | 2,965 | 2,971 |
상술한 선형 공여 DNA 작제물(서열 번호 22, 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26, 서열 번호 27, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32 및 서열 번호 33)을 B. 서브틸리스 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 80 ng의 DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-3, 10-4 및 10-5 희석액으로부터의 100 ㎕를 LB 한천 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다.
리파아제를 암호화하는 공여 DNA의 통합 빈도를 결정하기 위해, ROA 상에서 비선택적으로 성장된 핑크색 콜로니의 비율(%)을 점수로 나타냈다(표 3). 탈지유를 함유하는 비선택적 LB 한천 상의 콜로니 주변의 광륜의 존재를 프로테아제의 통합 빈도를 결정하기 위해 사용하였다. 표 3에 나타나 있는 바와 같이, 900 bp 미만의 상동성 아암 길이에서는 고빈도의 통합이 얻어지지 않았다.
서열 번호 | 게놈 유전좌위 | 상동성 아암(HR1)의 길이(bp) | 상동성 아암(HR2)의 길이(bp) | 통합 빈도(%) | |
DNA 부재 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 0 |
통합 | 서열 번호 22 | aprE | 336 | 755 | 0 |
통합 | 서열 번호 23 | aprE | 1,200 | 1,681 | 1 |
통합 | 서열 번호 24 | aprE | 1,200 | 2,971 | 2 |
통합 | 서열 번호 25 | aprE | 3,265 | 1,681 | 10 |
통합 | 서열 번호 26 | aprE | 3,275 | 2,912 | 32 |
통합 | 서열 번호 27 | aprE | 3,265 | 6,095 | 37 |
통합 | 서열 번호 28 | aprE | 336 | 6,095 | 0 |
통합 | 서열 번호 29 | aprE | 289 | 755 | 0 |
통합 | 서열 번호 30 | aprE | 900 | 1,681 | 5 |
통합 | 서열 번호 31 | aprE | 900 | 2,971 | 2 |
통합 | 서열 번호 32 | aprE | 2,965 | 1,681 | 9 |
통합 | 서열 번호 33 | aprE | 2,965 | 2,971 | 28 |
실시예 3
선택이 없는, 길이가 다양한 상동성 아암을 포함하는 선형 DNA 작제물을 이용한 바실러스 서브틸리스의 염색체 내로의 마커-부재 결실 및 점 돌연변이
본 실시예에는 결실 및 점 돌연변이를 생성하기 위해 길이가 약 3 kb인 상동성 영역을 포함하는 선형 DNA 작제물의 조립 및 후속적인 형질전환, 및 ComK의 발현을 위해 유도된 바실러스 서브틸리스 세포의 염색체 내로의 결실 또는 점 돌연변이 빈도가 기재되어 있다.
B. 서브틸리스에서의 skf 유전좌위의 결실을 위해, HR1-skf(서열 번호 35) 및 HR2-skf(서열 번호 36) 서열을 포함하는 선형 DNA 작제물(서열 번호 34)을 PCR에 의해 증폭하였다.
B. 서브틸리스에서의 lipA 유전자 유전좌위의 결실을 위해, HR1-lipA(서열 번호 38) 및 HR2-lipA(서열 번호 39) 서열을 포함하는 선형 DNA 작제물(서열 번호 37)을 PCR에 의해 증폭하였다.
B. 서브틸리스 게놈의 통합된 Proteus HR2 리파아제(서열 번호 40) 내로 S79의 아미노산 변경을 도입하기 위해, 돌연변이 유발 PCR 전략을 사용하였다. 먼저, 합성 P4 프로모터(서열 번호 42)에 의해 구동되는 리파아제를 암호화하는 게놈 서열(서열 번호 41)을 전방향 프라이머(서열 번호 12) 및 역방향 프라이머(서열 번호 43)를 이용한 PCR용 주형으로 사용하여 서열 번호 44를 생성하였다. 이어, 서열 번호 41을 전방향 프라이머(서열 번호 45) 및 역방향 프라이머(서열 번호 46)를 이용한 PCR용 주형으로 사용하여 서열 번호 47을 생성하였다. 최종 선형 DNA 작제물을 생성하기 위해, 10 ng의 단편 둘 모두를 함께 혼합하고, 98℃에서 30초 동아, 98℃에서 10초 동안의 24회 사이클, 70℃(-0.5/사이클)에서 30초 동안, 72℃에서 3.5분 동안 배양한 후, 72℃에서 3분 동안 배양하였다. 얻어진 산물을 올리고(서열 번호 12) 및 (서열 번호 13)를 사용하여 PCR에 의해 증폭하여, 서열 번호 48의 선형 DNA 작제물을 수득하였다.
선형 DNA 작제물(서열 번호 34), (서열 번호 37) 및 (서열 번호 48)을 B. 서브틸리스 내에 하기와 같이 형질전환시켰다. 발현용 PxylA 유도성 프로모터를 사용하여 amyE 유전좌위에 도입된 B. 서브틸리스 comK 유전자(서열 번호 15)를 함유하는 B. 서브틸리스 세포를 125 ㎖의 배플 플라스크 내의 15 ㎖의 L 브로스(1%(wㆍv-1) 트립톤, 0.5% 효모 추출물(wㆍv-1), 1% NaCl(wㆍv-1))에서 37℃에서 250 RPM으로 하룻밤 동안 성장시켰다. 하룻밤 동안의 배양액을 백이십오(125) ㎖의 배플 플라스크 내의 10 ㎖의 신선한 L 브로스에서 0.2(OD600 단위)까지 희석하였다. 배양액이 37℃(250 RPM)에서 0.9(OD600 단위)에 도달할 때까지 세포를 성장시켰다. D-크실로오스를 10%(w/v) 저장액으로부터 0.1%(w/v)가 되도록 첨가하였다. 세포를 37℃(250 RPM) 추가의 2시간 동안 성장시킨 후, 0.5X L-브로스 중의 4 ㎖의 50% 글리세롤을 첨가하고, 혼합하고, 형질전환에 대한 준비가 될 때까지 -80℃에서 저장하였다. 100 ng의 DNA를 100 ㎕의 수용능 세포에 첨가함으로써 형질전환을 준비하고, 37℃에서 1,000 RPM으로 1시간 동안 배양한 후, 900 ㎕의 LB(이는 10-1 희석액임)를 첨가함으로써 세포를 10배 희석하였다. 세포를 10-5까지 추가로 10배씩 4회 희석하였다. 이어서, 10-3, 10-4 및 10-5 희석액으로부터의 100 ㎕를 skf(서열 번호 34)의 결실을 위한 LB 한천 또는 lipA(서열 번호 37)이 결실 또는 리파아제 점 돌연변이(서열 번호 48)를 위한 로다민 올리브 오일 한천(ROA) 중 하나 상에 도말하였다. 플레이트를 37℃에서 하룻밤 동안 배양하였다.
skf 결실 빈도를 결정하기 위해, 콜로니로부터의 DNA를 B. 서브틸리스에서 skf 유전좌위에 특이적인 프라이머를 사용하여 PCR에 의해 증폭하였다. skf 유전좌위가 성공적으로 결실되면 프라이머(서열 번호 49) 및 (서열 번호 50)은 1,200 bp의 산물을 생성한다. 형질전환체의 콜로니 PCR에 의해 전체 콜로니 중 31%가 skf 유전좌위의 결실을 갖는다는 것이 밝혀졌다(표 4).
B. 서브틸리스 lipA 유전자의 결실 또는 이종성 리파아제에서의 점 돌연변이의 빈도는 ROA 플레이트 상의 백색 콜로니의 빈도에 의해 결정되었다. lipA의 결실의 경우에 콜로니의 25%는 백색인 것으로 밝혀졌으며, 점 돌연변이의 경우에 32%는 백색이었다(표 4). 각각의 형질전환을 위한 백색 콜로니의 예는 염색체 영역을 증폭시키고 결실에 대한 예상된 크기 변화를 찾음으로써, 그리고 점 돌연변이의 부위를 서열분석함으로써 결실 또는 점 돌연변이를 포함하는 것으로 추가로 확인되었다.
서열 번호 | 게놈 유전좌위 | 상동성 아암(HR1)의 길이(bp) | 상동성 아암(HR2)의 길이(bp) | 통합 빈도(%) | |
DNA 부재 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 0 |
skf 결실 | 16 | skf | 3,006 | 3,032 | 31 |
lipA 결실 | 19 | lipA | 3,040 | 3,047 | 25 |
리파아제 점 돌연변이 | 27 | aprE | 2,965 | 2,971 | 32 |
SEQUENCE LISTING
<110> Danisco US Inc.
<120> SELECTION MARKER FREE METHODS FOR MODIFYING THE GENOME OF
BACILLUS AND COMPOSITIONS THEREOF
<130> NB41425-WO-PCT
<160> 50
<170> PatentIn version 3.5
<210> 1
<211> 3275
<212> DNA
<213> Bacillus subtilis
<400> 1
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaa 3275
<210> 2
<211> 864
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence -Optimized coding sequence for Proteus
vulgaris (WP099659650.1) lipase
<400> 2
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 240
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840
tttttagcgt caaaaaagct ctaa 864
<210> 3
<211> 254
<212> DNA
<213> Bacillus amyloliquefaciens
<400> 3
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 60
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 120
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 180
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 240
cggcattcgt aatc 254
<210> 4
<211> 2912
<212> DNA
<213> Bacillus subtilis
<400> 4
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880
ttcatgtgaa tccctcctgc ctccattatt tc 2912
<210> 5
<211> 25
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence - F primer
<400> 5
ccctgctgac agaaatatcc ggcgg 25
<210> 6
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence - R primer
<400> 6
gaaataatgg aggcaggagg g 21
<210> 7
<211> 7346
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence - HR1-aprE, aprE promoter, Proteus vulgaris
lipase, BPNprime terminator, HR2-aprE
<400> 7
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300
aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360
tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420
tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480
gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540
gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600
tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660
cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720
tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780
agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840
actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900
ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960
ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020
aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080
agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140
tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200
gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260
atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320
cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380
atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440
tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500
agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560
aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620
tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680
cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740
gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800
atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860
actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920
aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980
atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040
tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100
ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160
taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220
cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280
ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340
aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400
tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460
gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520
ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580
aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640
tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700
ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760
tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820
cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880
gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940
cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000
cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060
tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120
cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180
aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240
gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300
cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360
gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420
ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480
catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540
ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600
gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660
gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720
agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780
acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840
ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900
agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960
tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020
gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080
gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140
atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200
gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260
aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320
tgaatccctc ctgcctccat tatttc 7346
<210> 8
<211> 2965
<212> DNA
<213> Bacillus subtilis
<400> 8
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgc 2965
<210> 9
<211> 94
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- P2 promoter
<400> 9
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60
cttaaaagaa gctaaatgtt atagtaattg taca 94
<210> 10
<211> 339
<212> DNA
<213> Bacillus gibonsii
<400> 10
gtgagaagca aaaaattgtg gatcagcttg ttgtttgcgt taacgttaat ctttacgatg 60
gcgttcagca acatgtctgc gcaggctgct gaagaagcaa aagaaaaata tttaattggc 120
tttaatgagc aggaagctgt cagtgagttt gtagaacaag tagaggcaaa tgacgaggtc 180
gccattctct ctgaggaaga ggaagtcgaa attgaattgc ttcatgaatt tgaaacgatt 240
cctgttttat ccgttgagtt aagcccagaa gatgtggacg cgcttgaact cgatccagcg 300
atttcttata ttgaagagga tgcagaagta acgacaatg 339
<210> 11
<211> 2971
<212> DNA
<213> Bacillus subtilis
<400> 11
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880
ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 2940
tgttttgcct tagtaaatca gatcaaggaa a 2971
<210> 12
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 12
tcgtcaacgc ctgcctcagc 20
<210> 13
<211> 25
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 13
tttccttgat ctgatttact aaggc 25
<210> 14
<211> 7488
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 14
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240
tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300
ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360
agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420
gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480
aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540
tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600
ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660
atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720
aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780
caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840
aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900
tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960
tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020
gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080
accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140
ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200
cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260
cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320
tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380
ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440
cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488
<210> 15
<211> 576
<212> DNA
<213> Bacillus subtilis
<400> 15
atgagtcaga aaacagacgc acctttagaa tcgtatgaag tgaacggcgc aacaattgcc 60
gtgctgccag aagaaataga cggcaaaatc tgttccaaaa ttattgaaaa agattgcgtg 120
ttttatgtaa acatgaagcc gctgcaaatt gtcgacagaa gctgccgatt ttttggatca 180
agctatgcgg gaagaaaagc aggaacttat gaagtgacaa aaatttcaca caagccgccg 240
atcatggtgg acccttcgaa ccaaatcttt ttattcccta cactttcttc gacaagaccc 300
caatgcggct ggatttccca tgtgcatgta aaagaattca aagcgactga attcgacgat 360
acggaagtga cgttttccaa tgggaaaacg atggagctgc cgatctctta taattcgttc 420
gagaaccagg tataccgaac agcgtggctc agaaccaaat tccaagacag aatcgaccac 480
cgcgtgccga aaagacagga atttatgctg tacccgaaag aagagcggac gaagatgatt 540
tatgatttta ttttgcgtga gctcggggaa cggtat 576
<210> 16
<211> 26
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 16
cacgataata tccattgttc tcacgg 26
<210> 17
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 17
gatatgtggt gccgaaacgc 20
<210> 18
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 18
gcaaaacgcg gatcattgga 20
<210> 19
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 19
gtttgcaaaa atattgcggc cg 22
<210> 20
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence- primer
<400> 20
ccatgatacg cggaagaacc g 21
<210> 21
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 21
gctatcaaaa taacagactc g 21
<210> 22
<211> 2209
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 22
cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60
acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120
tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180
ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240
gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300
tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360
ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420
gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480
tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540
aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600
gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660
agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720
gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780
aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840
aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900
aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960
ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020
cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080
gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140
gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440
cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500
aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560
ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620
gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680
gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740
atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800
caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860
gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920
gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980
aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040
tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100
tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160
tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatc 2209
<210> 23
<211> 3999
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 23
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960
aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020
tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080
gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140
tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040
tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100
ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160
ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220
cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280
cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340
cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400
tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460
atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520
ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580
ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640
ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700
gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760
agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820
aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880
aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940
ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000
tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060
ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120
gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180
tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240
tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300
atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360
tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420
cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480
gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540
gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600
tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660
aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720
tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780
acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840
gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900
ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960
tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaac 3999
<210> 24
<211> 5289
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 24
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960
aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020
tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080
gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140
tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040
tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100
ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160
ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220
cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280
cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340
cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400
tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460
atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520
ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580
ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640
ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700
gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760
agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820
aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880
aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940
ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000
tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060
ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120
gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180
tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240
tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300
atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360
tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420
cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480
gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540
gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600
tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660
aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720
tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780
acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840
gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900
ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960
tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaacg ttgtcatttt catcctgacc 4020
tctgggtccg cagcttccgg ctcggcctcc cccgtctggc ataaaatgac gagctcaacc 4080
tttggcagcg attcatgcat gctctcataa agcggcaaaa gctggctaac gcccacgatt 4140
gcctttacat cgccatttgt cagcatataa ccaatttctg tcggcgtgta caacggattg 4200
atgggaacaa ctacgatccc agcttttaaa gcgccaaaaa acgcgatgat aaaatcaggc 4260
gaattgccaa gcagcaaagc taaatggtcc cctttctcca taccggcttc ctgaaggccg 4320
tccgcaaatc gctgaatata ttcattcagc tcttgatacg tcatcatgtg atctttaaac 4380
ctgcatgcga tgctgtcggg cttctcagat gctgtttctt ccaattttga aacaagattc 4440
attctcccac cccttaagtg aatgaatagt cattcattat tgaagccaag ctttcttctc 4500
cattatagag aaacagaaaa aaacactcaa gagcaaaaag ccctgagtgt cagtactgtc 4560
atagtttctt caatgcttcg gcaatcggcg tatctccttc tgtcagatca aaggcccgat 4620
tttccgtatt cttctcatct aaagaggcaa tgaccgtttt tgcaacgtca tcacgggaaa 4680
taaatccccg ctccagatcc ttcgctgctg aaacagttcc cgttccaggc tcattgcgaa 4740
ggcctcccgg acggataatc gtataggtta aaccgctcgc ttccagaatt ttatcagcat 4800
aatgcttggc cacataataa ggcttgagtg cctcattcca attttcacgg ttatgggctt 4860
gcagggcgct gaccataata aaccgtttga ttccggcaat ggccgcagct tcaatggctt 4920
ttgccgctcc atcaagatcc accagcagcg ttttatcata gcctgtgctg ccgccggaac 4980
cggctgtgaa aatgatcgcg tcacaacctt ttgccgcagc ggcgatttct tccgggctgc 5040
cctccagatt cgcaagcaca gcttctgcac cggcagcttc aagagacgct ttctgttctt 5100
cttttctgac catcgctctg atggaatgat caggattatc ttggaataaa gagacgagtc 5160
tttgcccgat ttgtccgttc gctccgatta aaaacacttt catgtgaatc cctcctgcct 5220
ccattatttc aaaaacacaa ccgctctttc aaacgatgtg ttttgcctta gtaaatcaga 5280
tcaaggaaa 5289
<210> 25
<211> 6064
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 25
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000
ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060
tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120
gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180
tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240
tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300
cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360
ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420
ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480
ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060
aaac 6064
<210> 26
<211> 7346
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 26
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300
aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360
tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420
tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480
gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540
gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600
tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660
cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720
tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780
agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840
actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900
ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960
ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020
aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080
agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140
tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200
gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260
atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320
cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380
atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440
tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500
agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560
aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620
tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680
cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740
gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800
atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860
actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920
aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980
atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040
tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100
ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160
taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220
cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280
ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340
aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400
tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460
gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520
ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580
aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640
tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700
ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760
tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820
cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880
gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940
cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000
cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060
tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120
cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180
aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240
gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300
cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360
gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420
ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480
catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540
ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600
gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660
gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720
agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780
acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840
ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900
agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960
tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020
gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080
gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140
atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200
gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260
aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320
tgaatccctc ctgcctccat tatttc 7346
<210> 27
<211> 10478
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 27
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000
ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060
tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120
gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180
tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240
tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300
cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360
ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420
ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480
ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060
aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 6120
ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 6180
caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 6240
ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 6300
aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 6360
ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 6420
atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 6480
ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 6540
attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 6600
aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 6660
ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 6720
gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 6780
gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 6840
ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 6900
ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 6960
gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 7020
tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 7080
gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 7140
gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 7200
ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 7260
actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 7320
atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 7380
atgcttgaga ttcacacctt cgagcacatc agcgatgacg ctgcgttcgt attgttttcc 7440
gaccagcagg ttttcaattt cagatacatc accgacaccg aagaaatctc cgaagatttt 7500
gcagtcctcg attttgcctt tcttgacttc caggtgcaaa tcgatcgatc caaccggata 7560
acgcttcgaa tgattaaggt taaattttgg tgagcggccg tagttccaat cccaattctg 7620
atagcgctct ttcgaaattt gatgaatggt ctcccaatct ttttccgtca gcttatactc 7680
cggcacgttt ccaacgtcgt ttgtgttaaa aatatggcga agcaaatggc tgcggaattc 7740
ttcggtggtc attttatcat cgagaaactc actgatgttt gccactcggc ttctgatcga 7800
tttgatgcct tttgattcaa ttttatcctt tttcaccttt aatgctgata caacatgatc 7860
aatggctgaa tcaaacatga gggtgccgtg gctgaaaata cggcctttcg ttgcaaactg 7920
agcgtttccg gatattttcc ggccatctac tacaatgtcg ttccggccgc ttaattcggc 7980
ttcaacccca agctgatgta acgcctgaat cactggctca gtgaattttt taaagttatg 8040
aaagctgtcc ccgtcatcct tggtaataaa gctgaagttc aagttcccca gatcatggta 8100
cacagcgccc ccgcctgata aacggcggac gacgataatc ccgttttcct caacatattt 8160
tgtattgatt tcttctattg tattttggtt tttcccaatg ataatagacg gttgattcac 8220
ataaaagagc aaatattgct gttcagggtc taaatgcttt acacagtact cctcgatagc 8280
aagattgatc cgcggatcat tgatattttg attgtctata aataacatgg tgctcctcct 8340
ttatccttcc cacacaaaac ctgatttcgc aatattcact tctccgttaa aaacggtttt 8400
cgcttctttg cgaaggttgt catgcacgcc aaaatgcggc aaatgtgtca gcagcagttc 8460
tcccgctccg gcttcttttg caatgcgccc agcttccagg ctgttcatat ggcctgcact 8520
tgttccgtct tgatcggcat aaaaattgca ttctgagatc aataaatcag catctttcga 8580
aaacggtata aatgaatcct gatagctgga atcagcagta taaacgacag tgtggctgcc 8640
gtcagtaatc cgcatggcat agcacgtcac cgggtgaatc gtttttaaaa aggtgatcgt 8700
aaacggaccg gcagtcagcg gctgatccgg ctgataggcg atcccttttg tatgtgtttt 8760
atatgtaagc ttttgaaact gttctatatc agcatcatgt ccgtaaatcg gaagcgtatg 8820
ctctcctttg ccgagaaacg aaccgacttg cttggcaaat tgcagcggtc cgatatcagc 8880
gatatggtca tggtgataat gagacagaac gaccgcatcc agcttttccg ccggcacata 8940
tccgaacagc ttagacaata cggcactgcc gcaatcaaca agcagagagt aatcacctga 9000
ctgaaacaaa tagcctgacg tcgcttcatt tgcggccgga aaaccgccat agcatccgat 9060
aactgtaact ttcataatgt cctcctatct tttcaaaaaa attggtcctc cttcaatata 9120
cccatttttc ttgaaaaaag catgttttaa acattgtatc aaaacagtta ttgatttttg 9180
taatctgtta tattacaatg aaatcactac aaaggggaaa gagggattgg ttatgctggg 9240
gaaaatcaca gaatttttta gaaacctgcc ttcgaaaaag tgtgcggaat gcggaaaaaa 9300
gatagaagag cagcatgagt gttatggtaa tatctgcaat gactgtataa aagtaaacga 9360
tttgtaatga gcgaaaatcc cgcgccttac gcgtgggatt ttcttatttt ttcacatatc 9420
tcttaatttt gaaataatag tcaggttagg tcaaagctca cctgttttta gataattctg 9480
gtgattatca taatgtcatt gaatattctt tattttcgaa atataattta ctatagacga 9540
attgatttct tatctattat aatttgatct aatagtgaga ttaaatatat gtctattcat 9600
gatatatgtt gatactttgt tttttgggag gtaatctatg aaaagaatta agtttggatt 9660
agccacacaa atattcgttg gacttattct aggtgtcatt gttggcgtca tttggtatgg 9720
caacccagca ttgcctactt acctgcagcc aatcggggat ctctttttac gcttaatcaa 9780
aatgatagtg attcctattg ttgtctccag cttaatcatc ggtgtagccg gtgcaggaaa 9840
tggaaagcaa gtcggtaaat taggcttcag aacgattctg tacttcgaga tcatcacgac 9900
ttttgccatt attctcggac tagcccttgc aaacatcttc catccgggta caggagttaa 9960
tatacacgaa gctcaaaaat cggacatcag tcaatatgtt gaaactgaaa aagaacaaag 10020
taataaatca gtggcggaaa cgttcctcca tattgtgccg acaaacttct tccagtcatt 10080
ggtcgaaggg gatcttctag ccatcatctg ctttacagta ctatttgcat tgggtatttc 10140
cgcgatcggt gaaagaggca agcctgtatt agcctttttt gaaggtgtat cccatgccat 10200
gttccacgtt gtaaaccttg tgatgaaagt ggcgccattc ggcgttttcg ctcttatcgg 10260
agtgactgtg tctaaattcg gactcggttc tcttatctct ctcggaaagc tcgtcggatt 10320
ggtttatgtc gcgcttgctt tcttcttaat tgttattttc gggattgtcg caaaaattgc 10380
cggcatcagc atcttcaagt tccttgctta catgaaggac gaaatcttac tggcgttcag 10440
tacgtccagc tctgaaacgg ttcttccgcg tatcatgg 10478
<210> 28
<211> 7549
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 28
cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60
acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120
tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180
ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240
gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300
tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360
ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420
gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480
tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540
aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600
gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660
agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720
gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780
aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840
aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900
aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960
ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020
cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080
gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140
gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440
cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500
aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560
ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620
gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680
gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740
atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800
caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860
gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920
gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980
aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040
tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100
tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160
tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatcc ctttaccgct 2220
tccccgcttt gggggtccgg cacgccgatg acaaccgcct ccttgacgtc cggatggctg 2280
tacagcacct cctccacctc ccgcggatac acattgtatc ctcctacaat gatcatgtct 2340
tttttccggt caacaatgta aaaatagccg tcctcatccc gtcttgccaa gtcccccgta 2400
taaagccacc cgtcttttaa tgcatgctct gtttccatcg gcattttata atagcccttc 2460
atcacattgg ggcctttcac gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg 2520
agcggatcta cgaccttgtt ttcgacatgt aagatacttg tcccgatgga gcccggcttt 2580
ctgcccctgt caaacgggtt aaagcacgtg acgggtgatg cttccgagag cccgtagcct 2640
tccaaaatgg taacaccgaa tttttcttca aacgccgtca gcaacgcgac tggcatggac 2700
gcgcctcccg aaatgcacag ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc 2760
tgaaacaagt agttatacat tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta 2820
acaagcttaa aaacagatgc cggactgaat tgaggctcaa tcaatacagt tgcgccgctc 2880
atcagcggtg cattcataca gacggttaaa caaaacacgt gaaacatggg aagagcgcag 2940
accacattgt ccctctcatc cattcccaaa tagcctgcga catcgttggc attgctgtac 3000
aaattctgat gtgtcagcat cgcgcctttc ggttttccag tcgttcctga cgtatataaa 3060
ataaccgcgg tatcatcagg tacaggttct tggttttgtt tagcggcaga tgtcggccgc 3120
aatatttttg caaacgttgt cattttcatc ctgacctctg ggtccgcagc ttccggctcg 3180
gcctcccccg tctggcataa aatgacgagc tcaacctttg gcagcgattc atgcatgctc 3240
tcataaagcg gcaaaagctg gctaacgccc acgattgcct ttacatcgcc atttgtcagc 3300
atataaccaa tttctgtcgg cgtgtacaac ggattgatgg gaacaactac gatcccagct 3360
tttaaagcgc caaaaaacgc gatgataaaa tcaggcgaat tgccaagcag caaagctaaa 3420
tggtcccctt tctccatacc ggcttcctga aggccgtccg caaatcgctg aatatattca 3480
ttcagctctt gatacgtcat catgtgatct ttaaacctgc atgcgatgct gtcgggcttc 3540
tcagatgctg tttcttccaa ttttgaaaca agattcattc tcccacccct taagtgaatg 3600
aatagtcatt cattattgaa gccaagcttt cttctccatt atagagaaac agaaaaaaac 3660
actcaagagc aaaaagccct gagtgtcagt actgtcatag tttcttcaat gcttcggcaa 3720
tcggcgtatc tccttctgtc agatcaaagg cccgattttc cgtattcttc tcatctaaag 3780
aggcaatgac cgtttttgca acgtcatcac gggaaataaa tccccgctcc agatccttcg 3840
ctgctgaaac agttcccgtt ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat 3900
aggttaaacc gctcgcttcc agaattttat cagcataatg cttggccaca taataaggct 3960
tgagtgcctc attccaattt tcacggttat gggcttgcag ggcgctgacc ataataaacc 4020
gtttgattcc ggcaatggcc gcagcttcaa tggcttttgc cgctccatca agatccacca 4080
gcagcgtttt atcatagcct gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac 4140
aaccttttgc cgcagcggcg atttcttccg ggctgccctc cagattcgca agcacagctt 4200
ctgcaccggc agcttcaaga gacgctttct gttcttcttt tctgaccatc gctctgatgg 4260
aatgatcagg attatcttgg aataaagaga cgagtctttg cccgatttgt ccgttcgctc 4320
cgattaaaaa cactttcatg tgaatccctc ctgcctccat tatttcaaaa acacaaccgc 4380
tctttcaaac gatgtgtttt gccttagtaa atcagatcaa ggaaatcctc tttcgtaatg 4440
ttcccaaagt aatgcttgag attcacacct tcgagcacat cagcgatgac gctgcgttcg 4500
tattgttttc cgaccagcag gttttcaatt tcagatacat caccgacacc gaagaaatct 4560
ccgaagattt tgcagtcctc gattttgcct ttcttgactt ccaggtgcaa atcgatcgat 4620
ccaaccggat aacgcttcga atgattaagg ttaaattttg gtgagcggcc gtagttccaa 4680
tcccaattct gatagcgctc tttcgaaatt tgatgaatgg tctcccaatc tttttccgtc 4740
agcttatact ccggcacgtt tccaacgtcg tttgtgttaa aaatatggcg aagcaaatgg 4800
ctgcggaatt cttcggtggt cattttatca tcgagaaact cactgatgtt tgccactcgg 4860
cttctgatcg atttgatgcc ttttgattca attttatcct ttttcacctt taatgctgat 4920
acaacatgat caatggctga atcaaacatg agggtgccgt ggctgaaaat acggcctttc 4980
gttgcaaact gagcgtttcc ggatattttc cggccatcta ctacaatgtc gttccggccg 5040
cttaattcgg cttcaacccc aagctgatgt aacgcctgaa tcactggctc agtgaatttt 5100
ttaaagttat gaaagctgtc cccgtcatcc ttggtaataa agctgaagtt caagttcccc 5160
agatcatggt acacagcgcc cccgcctgat aaacggcgga cgacgataat cccgttttcc 5220
tcaacatatt ttgtattgat ttcttctatt gtattttggt ttttcccaat gataatagac 5280
ggttgattca cataaaagag caaatattgc tgttcagggt ctaaatgctt tacacagtac 5340
tcctcgatag caagattgat ccgcggatca ttgatatttt gattgtctat aaataacatg 5400
gtgctcctcc tttatccttc ccacacaaaa cctgatttcg caatattcac ttctccgtta 5460
aaaacggttt tcgcttcttt gcgaaggttg tcatgcacgc caaaatgcgg caaatgtgtc 5520
agcagcagtt ctcccgctcc ggcttctttt gcaatgcgcc cagcttccag gctgttcata 5580
tggcctgcac ttgttccgtc ttgatcggca taaaaattgc attctgagat caataaatca 5640
gcatctttcg aaaacggtat aaatgaatcc tgatagctgg aatcagcagt ataaacgaca 5700
gtgtggctgc cgtcagtaat ccgcatggca tagcacgtca ccgggtgaat cgtttttaaa 5760
aaggtgatcg taaacggacc ggcagtcagc ggctgatccg gctgataggc gatccctttt 5820
gtatgtgttt tatatgtaag cttttgaaac tgttctatat cagcatcatg tccgtaaatc 5880
ggaagcgtat gctctccttt gccgagaaac gaaccgactt gcttggcaaa ttgcagcggt 5940
ccgatatcag cgatatggtc atggtgataa tgagacagaa cgaccgcatc cagcttttcc 6000
gccggcacat atccgaacag cttagacaat acggcactgc cgcaatcaac aagcagagag 6060
taatcacctg actgaaacaa atagcctgac gtcgcttcat ttgcggccgg aaaaccgcca 6120
tagcatccga taactgtaac tttcataatg tcctcctatc ttttcaaaaa aattggtcct 6180
ccttcaatat acccattttt cttgaaaaaa gcatgtttta aacattgtat caaaacagtt 6240
attgattttt gtaatctgtt atattacaat gaaatcacta caaaggggaa agagggattg 6300
gttatgctgg ggaaaatcac agaatttttt agaaacctgc cttcgaaaaa gtgtgcggaa 6360
tgcggaaaaa agatagaaga gcagcatgag tgttatggta atatctgcaa tgactgtata 6420
aaagtaaacg atttgtaatg agcgaaaatc ccgcgcctta cgcgtgggat tttcttattt 6480
tttcacatat ctcttaattt tgaaataata gtcaggttag gtcaaagctc acctgttttt 6540
agataattct ggtgattatc ataatgtcat tgaatattct ttattttcga aatataattt 6600
actatagacg aattgatttc ttatctatta taatttgatc taatagtgag attaaatata 6660
tgtctattca tgatatatgt tgatactttg ttttttggga ggtaatctat gaaaagaatt 6720
aagtttggat tagccacaca aatattcgtt ggacttattc taggtgtcat tgttggcgtc 6780
atttggtatg gcaacccagc attgcctact tacctgcagc caatcgggga tctcttttta 6840
cgcttaatca aaatgatagt gattcctatt gttgtctcca gcttaatcat cggtgtagcc 6900
ggtgcaggaa atggaaagca agtcggtaaa ttaggcttca gaacgattct gtacttcgag 6960
atcatcacga cttttgccat tattctcgga ctagcccttg caaacatctt ccatccgggt 7020
acaggagtta atatacacga agctcaaaaa tcggacatca gtcaatatgt tgaaactgaa 7080
aaagaacaaa gtaataaatc agtggcggaa acgttcctcc atattgtgcc gacaaacttc 7140
ttccagtcat tggtcgaagg ggatcttcta gccatcatct gctttacagt actatttgca 7200
ttgggtattt ccgcgatcgg tgaaagaggc aagcctgtat tagccttttt tgaaggtgta 7260
tcccatgcca tgttccacgt tgtaaacctt gtgatgaaag tggcgccatt cggcgttttc 7320
gctcttatcg gagtgactgt gtctaaattc ggactcggtt ctcttatctc tctcggaaag 7380
ctcgtcggat tggtttatgt cgcgcttgct ttcttcttaa ttgttatttt cgggattgtc 7440
gcaaaaattg ccggcatcag catcttcaag ttccttgctt acatgaagga cgaaatctta 7500
ctggcgttca gtacgtccag ctctgaaacg gttcttccgc gtatcatgg 7549
<210> 29
<211> 2596
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 29
gctatcaaaa taacagactc gtgattttcc aaacgagctt tcaaaaaagc ctctgcccct 60
tgcaaatcgg atgcctgtct ataaaattcc cgatattggt taaacagcgg cgcaatggcg 120
gccgcatctg atgtctttgc ttggcgaatg ttcatcttat ttcttcctcc ctctcaataa 180
ttttttcatt ctatcccttt tctgtaaagt ttatttttca gaatactttt atcatcatgc 240
tttgaaaaaa tatcacgata atatccattg ttctcacgga agcacacgcg ctgataaaca 300
gctgacatca actaaaagtt tcattaaata ctttgaaaaa agttgttgac ttaaaagaag 360
ctaaatgtta tagtaattgt acagaatagt cttttaagta agtctactct gaattttttt 420
aaaaggagag ggtaaagagt gagaagcaaa aaattgtgga tcagcttgtt gtttgcgtta 480
acgttaatct ttacgatggc gttcagcaac atgtctgcgc aggctgctga agaagcaaaa 540
gaaaaatatt taattggctt taatgagcag gaagctgtca gtgagtttgt agaacaagta 600
gaggcaaatg acgaggtcgc cattctctct gaggaagagg aagtcgaaat tgaattgctt 660
catgaatttg aaacgattcc tgttttatcc gttgagttaa gcccagaaga tgtggacgcg 720
cttgaactcg atccagcgat ttcttatatt gaagaggatg cagaagtaac gacaatgcaa 780
caaacagtgc catggggaat tactcgtgtg caagccccag ctgttcataa ccgtggaatt 840
acaggttctg gtgtaagagt tgctatcctc gattcaggta tttccacaca tgaagactta 900
aatgttcgtg gtggcgttag ctttgtacca ggggaaccaa cgtatgctga tttaaatggg 960
catggcacgc atgtggctgg gacggtagct gctttaaaca attcgattgg cgttgttggc 1020
gtagcaccgt cagcggatct atacgctgtt aaagtattag gggcgaatgg tagaggttcg 1080
gtcagcggga ttgcccaagg attggaatgg gcagcacaaa ataacatgca cattgctaat 1140
atgagtttag gaacagatgc accaagttct acacttgagc gtgctgttaa ttatgcgact 1200
tctagagatg ttcttgttat tgcggcaact gggaataacg gttctggctc agtaggctat 1260
ccggcccgtt atgcgaacgc aatggcagtc ggagctactg accaaaacaa cagacgcgcc 1320
aacttttcac agtatggcac ggggattgac attgtcgcac caggtgtaaa cgtgcagagc 1380
acatacccag gtaaccgtta tgtgagcatg aacggtacat cgatggctac tcctcatgtt 1440
gcaggtgcag cagcccttgt taaacaacgc tatccatctt ggaatgcgac tcaaatccgc 1500
gaccatctaa agaatacggc aacgaattta ggaaactctt cacaatttgg aagcggactt 1560
gtcaatgcag aagcggcaac acgctaatct agatacataa aaaaccggcc ttggccccgc 1620
cggtttttta ttatttttct tcctccgcat gttcaatccg ctccataatc gacggatggc 1680
tccctctgaa aattttaacg agaaacggcg ggttgacccg gctcagtccc gtaacggcca 1740
agtcctgaaa cgtctcaatc gccgcttccc ggtttccggt cagctcaatg ccgtaacggt 1800
cggcggcgtt ttcctgatac cgggagacgg cattcgtaat caacgcctca ctcctcacat 1860
caacccgtta cttctattgt aatcataaat tcaaattctt agaaccaagc tgtgttccgc 1920
acttttccac ccttttaagc atggaaaccc cgatcgctgg gaaaactaac aatgtttgga 1980
gtgatgcaaa tgaaaaaaat agtggcagcc atcgtggtaa tcggtcttgt gtttatcgca 2040
tttttttatc tttacagccg atcaggcgat gtgtatcaat cggtagacgc ggatttgatc 2100
acactgtctt caagcggcca ggaagatatc gagattgaaa aaagacagca cgtcaaagat 2160
atgctggata ttatgaatca gggaaaacag gtgaagacag aaaaaacatc agcccctgat 2220
tacgaaggga caatcaagtt tcataaagac cggtatgact cattcagact atggattgac 2280
ggcagccagc aagccgtttt tttgaaggat ggcacatact acaaattaag caaaaatgat 2340
acaaaggcgc tgctaaatat tattaaaaaa gaagcaaagg attgaaaatg aaaaagcgaa 2400
gctaaccgct tcgctttttc attttattgg ggcaaaatat ctctcagtgc ccgtctgagc 2460
attttccccg tcgcattttt cggaatatcg tcaagaaacg taatggcggc aggccgcttg 2520
tattttgcca gatgcttttc gcagtgctgc atgatgtcct cctctgttac cccagagcgt 2580
ttcggcacca catatc 2596
<210> 30
<211> 4133
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 30
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960
cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020
tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080
tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140
aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200
tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260
ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320
atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380
cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440
accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500
atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560
atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620
gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680
gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740
acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800
attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860
cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920
acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980
acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040
ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100
ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160
gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220
cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280
cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340
cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400
gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460
actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520
ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580
caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640
tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700
cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760
acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820
cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880
tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940
gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000
gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060
cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120
caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180
ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240
cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300
gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360
aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420
catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480
tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540
cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600
agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660
tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720
ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780
taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840
gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900
cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960
ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020
cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080
caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aac 4133
<210> 31
<211> 5423
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 31
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960
cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020
tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080
tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140
aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200
tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260
ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320
atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380
cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440
accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500
atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560
atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620
gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680
gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740
acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800
attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860
cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920
acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980
acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040
ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100
ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160
gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220
cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280
cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340
cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400
gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460
actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520
ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580
caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640
tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700
cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760
acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820
cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880
tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940
gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000
gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060
cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120
caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180
ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240
cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300
gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360
aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420
catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480
tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540
cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600
agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660
tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720
ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780
taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840
gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900
cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960
ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020
cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080
caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aacgttgtca 4140
ttttcatcct gacctctggg tccgcagctt ccggctcggc ctcccccgtc tggcataaaa 4200
tgacgagctc aacctttggc agcgattcat gcatgctctc ataaagcggc aaaagctggc 4260
taacgcccac gattgccttt acatcgccat ttgtcagcat ataaccaatt tctgtcggcg 4320
tgtacaacgg attgatggga acaactacga tcccagcttt taaagcgcca aaaaacgcga 4380
tgataaaatc aggcgaattg ccaagcagca aagctaaatg gtcccctttc tccataccgg 4440
cttcctgaag gccgtccgca aatcgctgaa tatattcatt cagctcttga tacgtcatca 4500
tgtgatcttt aaacctgcat gcgatgctgt cgggcttctc agatgctgtt tcttccaatt 4560
ttgaaacaag attcattctc ccacccctta agtgaatgaa tagtcattca ttattgaagc 4620
caagctttct tctccattat agagaaacag aaaaaaacac tcaagagcaa aaagccctga 4680
gtgtcagtac tgtcatagtt tcttcaatgc ttcggcaatc ggcgtatctc cttctgtcag 4740
atcaaaggcc cgattttccg tattcttctc atctaaagag gcaatgaccg tttttgcaac 4800
gtcatcacgg gaaataaatc cccgctccag atccttcgct gctgaaacag ttcccgttcc 4860
aggctcattg cgaaggcctc ccggacggat aatcgtatag gttaaaccgc tcgcttccag 4920
aattttatca gcataatgct tggccacata ataaggcttg agtgcctcat tccaattttc 4980
acggttatgg gcttgcaggg cgctgaccat aataaaccgt ttgattccgg caatggccgc 5040
agcttcaatg gcttttgccg ctccatcaag atccaccagc agcgttttat catagcctgt 5100
gctgccgccg gaaccggctg tgaaaatgat cgcgtcacaa ccttttgccg cagcggcgat 5160
ttcttccggg ctgccctcca gattcgcaag cacagcttct gcaccggcag cttcaagaga 5220
cgctttctgt tcttcttttc tgaccatcgc tctgatggaa tgatcaggat tatcttggaa 5280
taaagagacg agtctttgcc cgatttgtcc gttcgctccg attaaaaaca ctttcatgtg 5340
aatccctcct gcctccatta tttcaaaaac acaaccgctc tttcaaacga tgtgttttgc 5400
cttagtaaat cagatcaagg aaa 5423
<210> 32
<211> 6198
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 32
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaac 6198
<210> 33
<211> 7488
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 33
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240
tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300
ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360
agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420
gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480
aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540
tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600
ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660
atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720
aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780
caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840
aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900
tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960
tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020
gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080
accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140
ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200
cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260
cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320
tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380
ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440
cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488
<210> 34
<211> 6017
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 34
gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60
tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120
ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180
agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240
ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300
gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360
atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420
tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480
atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540
gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600
ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660
atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720
aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780
ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840
gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900
taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960
acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020
caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080
cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140
atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200
tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260
ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320
atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380
ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440
gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500
gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560
ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620
tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680
ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740
caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800
tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860
ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920
ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980
ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040
ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100
ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160
tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220
ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280
tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340
gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400
tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460
attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520
tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580
atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640
cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700
gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760
aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820
gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880
gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940
tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000
agctccggtc cttcctataa gcaggaaggt tttttaatga aatatttttt tattagtagg 3060
taaattcatc aaatgttctg ctatgctcca aatgtacacc tttccgtaag ggcaaagtca 3120
aatgtgaaaa aaaactgttc caaagttaat cagaaattta ttttcatatt gtatccttcg 3180
gtatcaagtg aaaggagcat catatgaaaa cattatggaa agtcctcaaa attgtttttg 3240
tcagcttggc tgctttggtt ttgcttgtat ccgtctcggt atttatttat caccatttcc 3300
agctaaataa ggaggcggca ctgctgaaag gtaaaggcac agtagtcgat gttgacggta 3360
aaaagatgaa tgtgtatcaa gagggaagcg ggaaggatac gtttgtgttt atgtccggtt 3420
cgggtattgc tgcgcctgct tatgaaatga aggggctgta cagcaagttt tcaaaagaaa 3480
ataagattgc tgttgtagat cgggcaggtt atggatacag tgaagtgtct cacgatgaca 3540
gagatattga tacggtattg gaacagacga ggaaagcgct tatgaaaagc ggaaataagc 3600
ctccttatat tttaatgcct cattcgatat ccgggattga agcgatgtat tgggcacaga 3660
aatatcctaa ggaaatcaag gccattattg cgatggatat tggattgccc cagcagtacg 3720
tcacgtataa attgagcgga gttgaccgat tgaaagtgag agggttccac ctgttaacct 3780
cgattggttt tcatcggttt ataccttccg ctgtatataa tcctgaggtg attcgacagt 3840
cgtttttaac tgatgaagaa aaagaaatct ataaagccat taactttaag caatttttta 3900
atgcagatat ggagcatgag cttttacagt cttaccaaaa cggcagcaaa tctgtgaatc 3960
tgcctgcgcc aaaggaaact cccgtcttga ttttagatgc agtctctgac caaaatagac 4020
attcaaagta tgctatacaa aaccgaaaag actatgaagc gtttgcggct caattcaata 4080
ctgccgatat aaaggaactg aggggaacac acagtattta tttatatcag cctgatcaaa 4140
tatataaact gtccatggag tttatgagaa aggttcgcta ggatgaaggg ttatcgtatt 4200
ttaatcgttg aggacgatgt gatgattggt gatttgctgc aaaagatttt gcagcgcgag 4260
ggatatcgtg tgatatggaa aacagatgga gcggatgtgc tttcggtgat tcagaaggtg 4320
gatttggtca ttatggatgt gatgctgccg ggtgaagacg ggtatcaaat gtctgcaaaa 4380
atcaaaaagc tggggctggg cattccggtt atttttctct cagcccgcaa tgacatggac 4440
agcaagcttc aaggtttgca gatcggcgag gattatatgg taaagccctt tgatccgaga 4500
gagctgctat taagaatgcg gaatatgctt gagcatcatt atgggacctt tacgcaaatc 4560
aaacatttgt atattgatgc ggtaacgaaa aaagtgttca atgaaagcct gcatgatgag 4620
gtattattta ctgcgattga gcggaaaatt ttcttttatt tatatgaaaa tagagacagt 4680
atcctgacaa aggaacattt ctttgaatat ctatggcagc tcgaagatag aaacccgaat 4740
attgtcaatg tgcatattaa aaaaattaga gctaaaatca atgatcaagc gggtgagatg 4800
attgaaaata tatatggaga agggtatcgg ctgaataccg ttgtgaagaa atgaagctca 4860
agacaaaata tcagttgtta ttgtttacgg ccgtcattag tgttccgatg ctattgctgg 4920
cggtcagtgt tttgatgtcg gtgatttatg acagcatgtt taaaccgatg aatcatggta 4980
tgccctttca caggtcgttt gcatacccgg caatgatcgt tgtatttttg atatcactct 5040
tattgttagc ttttttattt tcaaagtcga ttcattctct gttgcataaa atcaatctat 5100
taaatcaaac cattcggcat ttggcgagtg atcaaagggt gcccgataaa attgaagtga 5160
agcgtgctga tgaaatcggg gaactgatca agtcggtcaa tttgttaatt gaacggacga 5220
catatcgtga actggagctg agacagcagg aggaaatcaa aaaggagctt ttgcaaaaac 5280
tgcggcatga cattaataca cctttaacgg ctctcaggct gcagttattt tatttggaag 5340
accaatgtca tggtcaggct gtattcgaat cattgtatca gcaaatcgaa tatatctcgg 5400
aattaactaa tgaattcaat ctatattccg ctgagacgct ggaaagctct tatattgtaa 5460
atgaagaagt gcgtctaaac gagctattag aaacagcggt gaaaaagtgg gattatttat 5520
acagtatgag tgggattgag ctgcactata agccggcaga tcaagatgtg atatggatga 5580
gcaacacgtt atggatggaa aggctgtttg ataatatttt tcaaaatacg ttaaggcatt 5640
caaaagctaa aaagatggaa gtcacgattg aacatggcga tgtttttatt cgtgatgacg 5700
gtattggatt tgatcggaat gagagcagtg agggacttgg gttaaagatt attgaggata 5760
catgcaggct gcttgcgatt acttatgagc tgcatacaaa tgataacgga acggggttct 5820
tgttttcaaa agagtgaccc cgctgatgtt tttctttctc ctataaaatt tatataatag 5880
ggagaaagaa atggggtgaa catcatatgt ttaaaaaaat catcaaaacg attaagtacc 5940
tctcaagcag ttctagtgac cgatatcgca gacaccggca ttacagcagc agccggcgca 6000
gacattatcg cagctac 6017
<210> 35
<211> 3006
<212> DNA
<213> Bacillus subtilis
<400> 35
gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60
tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120
ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180
agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240
ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300
gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360
atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420
tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480
atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540
gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600
ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660
atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720
aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780
ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840
gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900
taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960
acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020
caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080
cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140
atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200
tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260
ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320
atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380
ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440
gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500
gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560
ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620
tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680
ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740
caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800
tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860
ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920
ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980
ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040
ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100
ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160
tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220
ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280
tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340
gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400
tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460
attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520
tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580
atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640
cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700
gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760
aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820
gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880
gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940
tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000
agctcc 3006
<210> 36
<211> 3032
<212> DNA
<213> Bacillus subtilis
<400> 36
ggaaaattag gggtgagctc cggtccttcc tataagcagg aaggtttttt aatgaaatat 60
ttttttatta gtaggtaaat tcatcaaatg ttctgctatg ctccaaatgt acacctttcc 120
gtaagggcaa agtcaaatgt gaaaaaaaac tgttccaaag ttaatcagaa atttattttc 180
atattgtatc cttcggtatc aagtgaaagg agcatcatat gaaaacatta tggaaagtcc 240
tcaaaattgt ttttgtcagc ttggctgctt tggttttgct tgtatccgtc tcggtattta 300
tttatcacca tttccagcta aataaggagg cggcactgct gaaaggtaaa ggcacagtag 360
tcgatgttga cggtaaaaag atgaatgtgt atcaagaggg aagcgggaag gatacgtttg 420
tgtttatgtc cggttcgggt attgctgcgc ctgcttatga aatgaagggg ctgtacagca 480
agttttcaaa agaaaataag attgctgttg tagatcgggc aggttatgga tacagtgaag 540
tgtctcacga tgacagagat attgatacgg tattggaaca gacgaggaaa gcgcttatga 600
aaagcggaaa taagcctcct tatattttaa tgcctcattc gatatccggg attgaagcga 660
tgtattgggc acagaaatat cctaaggaaa tcaaggccat tattgcgatg gatattggat 720
tgccccagca gtacgtcacg tataaattga gcggagttga ccgattgaaa gtgagagggt 780
tccacctgtt aacctcgatt ggttttcatc ggtttatacc ttccgctgta tataatcctg 840
aggtgattcg acagtcgttt ttaactgatg aagaaaaaga aatctataaa gccattaact 900
ttaagcaatt ttttaatgca gatatggagc atgagctttt acagtcttac caaaacggca 960
gcaaatctgt gaatctgcct gcgccaaagg aaactcccgt cttgatttta gatgcagtct 1020
ctgaccaaaa tagacattca aagtatgcta tacaaaaccg aaaagactat gaagcgtttg 1080
cggctcaatt caatactgcc gatataaagg aactgagggg aacacacagt atttatttat 1140
atcagcctga tcaaatatat aaactgtcca tggagtttat gagaaaggtt cgctaggatg 1200
aagggttatc gtattttaat cgttgaggac gatgtgatga ttggtgattt gctgcaaaag 1260
attttgcagc gcgagggata tcgtgtgata tggaaaacag atggagcgga tgtgctttcg 1320
gtgattcaga aggtggattt ggtcattatg gatgtgatgc tgccgggtga agacgggtat 1380
caaatgtctg caaaaatcaa aaagctgggg ctgggcattc cggttatttt tctctcagcc 1440
cgcaatgaca tggacagcaa gcttcaaggt ttgcagatcg gcgaggatta tatggtaaag 1500
ccctttgatc cgagagagct gctattaaga atgcggaata tgcttgagca tcattatggg 1560
acctttacgc aaatcaaaca tttgtatatt gatgcggtaa cgaaaaaagt gttcaatgaa 1620
agcctgcatg atgaggtatt atttactgcg attgagcgga aaattttctt ttatttatat 1680
gaaaatagag acagtatcct gacaaaggaa catttctttg aatatctatg gcagctcgaa 1740
gatagaaacc cgaatattgt caatgtgcat attaaaaaaa ttagagctaa aatcaatgat 1800
caagcgggtg agatgattga aaatatatat ggagaagggt atcggctgaa taccgttgtg 1860
aagaaatgaa gctcaagaca aaatatcagt tgttattgtt tacggccgtc attagtgttc 1920
cgatgctatt gctggcggtc agtgttttga tgtcggtgat ttatgacagc atgtttaaac 1980
cgatgaatca tggtatgccc tttcacaggt cgtttgcata cccggcaatg atcgttgtat 2040
ttttgatatc actcttattg ttagcttttt tattttcaaa gtcgattcat tctctgttgc 2100
ataaaatcaa tctattaaat caaaccattc ggcatttggc gagtgatcaa agggtgcccg 2160
ataaaattga agtgaagcgt gctgatgaaa tcggggaact gatcaagtcg gtcaatttgt 2220
taattgaacg gacgacatat cgtgaactgg agctgagaca gcaggaggaa atcaaaaagg 2280
agcttttgca aaaactgcgg catgacatta atacaccttt aacggctctc aggctgcagt 2340
tattttattt ggaagaccaa tgtcatggtc aggctgtatt cgaatcattg tatcagcaaa 2400
tcgaatatat ctcggaatta actaatgaat tcaatctata ttccgctgag acgctggaaa 2460
gctcttatat tgtaaatgaa gaagtgcgtc taaacgagct attagaaaca gcggtgaaaa 2520
agtgggatta tttatacagt atgagtggga ttgagctgca ctataagccg gcagatcaag 2580
atgtgatatg gatgagcaac acgttatgga tggaaaggct gtttgataat atttttcaaa 2640
atacgttaag gcattcaaaa gctaaaaaga tggaagtcac gattgaacat ggcgatgttt 2700
ttattcgtga tgacggtatt ggatttgatc ggaatgagag cagtgaggga cttgggttaa 2760
agattattga ggatacatgc aggctgcttg cgattactta tgagctgcat acaaatgata 2820
acggaacggg gttcttgttt tcaaaagagt gaccccgctg atgtttttct ttctcctata 2880
aaatttatat aatagggaga aagaaatggg gtgaacatca tatgtttaaa aaaatcatca 2940
aaacgattaa gtacctctca agcagttcta gtgaccgata tcgcagacac cggcattaca 3000
gcagcagccg gcgcagacat tatcgcagct ac 3032
<210> 37
<211> 6087
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 37
cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60
acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120
cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180
tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240
cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300
cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360
cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420
agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480
cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540
gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600
gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660
atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720
gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780
accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840
tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900
gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960
atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020
agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080
tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140
gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200
acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260
cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320
gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380
tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440
taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500
gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560
tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620
atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680
aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740
aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800
taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860
gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920
gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980
ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040
agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100
tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160
tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220
tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280
cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340
ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400
atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460
cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520
ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580
ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640
tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700
cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760
accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820
agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880
ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940
ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000
acttaattaa tttggtaacg taatataatt ggagaatttg gttattctgc tttcagcaca 3060
atggttttcg cagccatatc atgaacggtt tgttttttct tcgtaaatgc ggcagtcaaa 3120
tagatcaggc gggagaacac atgcacccac gctatcaggt aacggacaat ggcttgcggg 3180
aaggatattt ttttatatgt ttcgtccctc acgatttgca gcccgatgat ttttttgccc 3240
agtgtgccct tccaatttgt cagcggcatc agcaaagggt acacaatcag catcaatatg 3300
gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa atccggctgc caaaatcact 3360
gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc gcagcatgaa accagctagt 3420
tccaatagaa acactcctta aaatgttaaa taaacaccta atgattgtaa aaaagaaggg 3480
cctaaagtgg gaataggtga taagccttaa atcacaaaag ttggtgaaaa tgtcataggt 3540
aaattggcat aatcagccag cttatcacat taccaaattc ttttttagcc cgaaaccaag 3600
ccctcagaag ttatttttgt taaaatagaa aagttacaac agaattcgga gggtttattg 3660
tgggaaaagt gaaacgaaat gccccttgcc catgcggcag cggcaagaaa tataaaaaat 3720
gctgcggaag taaagttgtc gacttcccgg cggaactagc ggcaaaagaa gcgaaacaaa 3780
ttcaggaaga cttagtggag tatgccttca cagtacatag agaaagcatt tcaggcttta 3840
tcaaccagca tgattttctt tctgctatgg acagacagac gaaagacatc agcgtattta 3900
acttaggaat ctggggaatc ttcttccacc cgcttgctgg tgagaagaca atcttcgaag 3960
agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa aacgcgtgag atcgtagaat 4020
catggcagag catgacgcct gctttattgc tgctgaagga cctgaaggaa ggcatcattc 4080
actttgaaga tgtcattacg gcaaaacaat tcgaagtgga aatggacgcc agcaatcaag 4140
accttcctcc agtgggaagc ctgattcttg gatacccaat ccacgaagcg gaaaaagcag 4200
aattcttcat gcagttcacg atcttcccgg tgaagagaac agaagcgctg atcagcaagg 4260
tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac gccggaggac ttcatgaagc 4320
aggaattcaa caacgttctg ttcgcgttgt tagctgagaa agatgaagag ccacaagcag 4380
agaaagcgga agtaagcact gttgagtggg caaacgactt ggagaaagaa accgctgcgg 4440
ctattgaaga aggcatgagc ggggaagagt atccgactga attgatccca gctgttattg 4500
acatctggaa aacattctgc gagaaaaaat cacctgtcat cagaaagccg gaagcttttg 4560
cggcggcagt tgaatattat gtaaacgcaa tttctcttaa cggcgcgtcc gtttcccagg 4620
ctaaactggc gaaaaaatac ggcgttagcg catcaacgat ttccagccgt tacaaagaaa 4680
ttgaaagcac gctgcaagat gaagcagatc gttttgcaca agcgttatcc tcataatgga 4740
aaaaaccttg aaaagccagg cttttcaagg tttttttatt tctgaaacgg aattttgatt 4800
tctaaccgga agatggggtg gcggtaggta aaatccagcc tgccaaaagc gcccttcacc 4860
agtttttgaa tgatatatgt gcccatgcct tcatgagcgc cgtttttcgt tgagcggcca 4920
aacgattgat aaattgtatc gagcactttt gggtccatcc cgggagtgct gttttcacaa 4980
gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt taatctctgc tttttctcgg 5040
gcctccgccg cgctgtcgag cgcattttct aatatgttgc cgaccaagct gacctgatca 5100
gcaggcgaaa acggaaggga agaaagcggt gtatgcatat gcagcgaaac actcacattc 5160
gaggcgcggg ctttttctaa aaaatcataa agcacccctg caacgtacgc gttctctcct 5220
ttcaaaaaac ggtcatattg gctgtattga tccgcccagt tttgaatata tgcttgtgta 5280
tctgccttgg gctgagctga tttgattgca gtgatatgtt tcattgtgtc atgattccgg 5340
cttctgacat caatcagcat ttgattggcg tgctgttcag cttgagtcag cttatcaatt 5400
tgatcagaaa gccttgcctg caaagcagac tgtccgatac ggagcccttc acaccctgca 5460
aatatcgcga ttacacataa taccggcatg atgtctgtgc caatcaacac cactcccacc 5520
gacatcactt gaatcaccgc aatccacgca caaagccctg aggaacagtg tttccacacc 5580
cgcttcgtat tccaaatgta caatcctgca gcagctgcgc ctaaagcagc ggcgagccaa 5640
gaggcggctg tgctgtgtga aaaagcagca gctccctgat aacatatgaa actaaataaa 5700
atcagataaa gacattgaaa aagggtaatc acgtactaaa ctcctcaaaa atagtagttt 5760
tgaaaataat caagctgctg cttagtgatc atcgcttttt tagacgttcc ctcaaaggaa 5820
actgtgaatg aatgcttggt ataagcggaa aaatgcttta tgtaatgaat gttgataata 5880
aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt cgcctttaat atcatttaat 5940
gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg tcgtcgaacg tcccgtccgt 6000
tctgcgaaaa taatatcctt cttttgcagg acgtgcattt cagacttttg ctttatcaat 6060
atacgcccat tcaaactcgt ttccgtt 6087
<210> 38
<211> 3040
<212> DNA
<213> Bacillus subtilis
<400> 38
cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60
acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120
cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180
tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240
cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300
cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360
cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420
agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480
cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540
gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600
gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660
atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720
gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780
accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840
tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900
gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960
atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020
agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080
tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140
gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200
acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260
cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320
gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380
tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440
taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500
gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560
tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620
atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680
aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740
aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800
taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860
gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920
gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980
ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040
agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100
tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160
tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220
tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280
cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340
ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400
atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460
cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520
ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580
ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640
tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700
cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760
accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820
agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880
ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940
ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000
acttaattaa tttggtaacg taatataatt ggagaatttg 3040
<210> 39
<211> 3047
<212> DNA
<213> Bacillus subtilis
<400> 39
gttattctgc tttcagcaca atggttttcg cagccatatc atgaacggtt tgttttttct 60
tcgtaaatgc ggcagtcaaa tagatcaggc gggagaacac atgcacccac gctatcaggt 120
aacggacaat ggcttgcggg aaggatattt ttttatatgt ttcgtccctc acgatttgca 180
gcccgatgat ttttttgccc agtgtgccct tccaatttgt cagcggcatc agcaaagggt 240
acacaatcag catcaatatg gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa 300
atccggctgc caaaatcact gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc 360
gcagcatgaa accagctagt tccaatagaa acactcctta aaatgttaaa taaacaccta 420
atgattgtaa aaaagaaggg cctaaagtgg gaataggtga taagccttaa atcacaaaag 480
ttggtgaaaa tgtcataggt aaattggcat aatcagccag cttatcacat taccaaattc 540
ttttttagcc cgaaaccaag ccctcagaag ttatttttgt taaaatagaa aagttacaac 600
agaattcgga gggtttattg tgggaaaagt gaaacgaaat gccccttgcc catgcggcag 660
cggcaagaaa tataaaaaat gctgcggaag taaagttgtc gacttcccgg cggaactagc 720
ggcaaaagaa gcgaaacaaa ttcaggaaga cttagtggag tatgccttca cagtacatag 780
agaaagcatt tcaggcttta tcaaccagca tgattttctt tctgctatgg acagacagac 840
gaaagacatc agcgtattta acttaggaat ctggggaatc ttcttccacc cgcttgctgg 900
tgagaagaca atcttcgaag agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa 960
aacgcgtgag atcgtagaat catggcagag catgacgcct gctttattgc tgctgaagga 1020
cctgaaggaa ggcatcattc actttgaaga tgtcattacg gcaaaacaat tcgaagtgga 1080
aatggacgcc agcaatcaag accttcctcc agtgggaagc ctgattcttg gatacccaat 1140
ccacgaagcg gaaaaagcag aattcttcat gcagttcacg atcttcccgg tgaagagaac 1200
agaagcgctg atcagcaagg tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac 1260
gccggaggac ttcatgaagc aggaattcaa caacgttctg ttcgcgttgt tagctgagaa 1320
agatgaagag ccacaagcag agaaagcgga agtaagcact gttgagtggg caaacgactt 1380
ggagaaagaa accgctgcgg ctattgaaga aggcatgagc ggggaagagt atccgactga 1440
attgatccca gctgttattg acatctggaa aacattctgc gagaaaaaat cacctgtcat 1500
cagaaagccg gaagcttttg cggcggcagt tgaatattat gtaaacgcaa tttctcttaa 1560
cggcgcgtcc gtttcccagg ctaaactggc gaaaaaatac ggcgttagcg catcaacgat 1620
ttccagccgt tacaaagaaa ttgaaagcac gctgcaagat gaagcagatc gttttgcaca 1680
agcgttatcc tcataatgga aaaaaccttg aaaagccagg cttttcaagg tttttttatt 1740
tctgaaacgg aattttgatt tctaaccgga agatggggtg gcggtaggta aaatccagcc 1800
tgccaaaagc gcccttcacc agtttttgaa tgatatatgt gcccatgcct tcatgagcgc 1860
cgtttttcgt tgagcggcca aacgattgat aaattgtatc gagcactttt gggtccatcc 1920
cgggagtgct gttttcacaa gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt 1980
taatctctgc tttttctcgg gcctccgccg cgctgtcgag cgcattttct aatatgttgc 2040
cgaccaagct gacctgatca gcaggcgaaa acggaaggga agaaagcggt gtatgcatat 2100
gcagcgaaac actcacattc gaggcgcggg ctttttctaa aaaatcataa agcacccctg 2160
caacgtacgc gttctctcct ttcaaaaaac ggtcatattg gctgtattga tccgcccagt 2220
tttgaatata tgcttgtgta tctgccttgg gctgagctga tttgattgca gtgatatgtt 2280
tcattgtgtc atgattccgg cttctgacat caatcagcat ttgattggcg tgctgttcag 2340
cttgagtcag cttatcaatt tgatcagaaa gccttgcctg caaagcagac tgtccgatac 2400
ggagcccttc acaccctgca aatatcgcga ttacacataa taccggcatg atgtctgtgc 2460
caatcaacac cactcccacc gacatcactt gaatcaccgc aatccacgca caaagccctg 2520
aggaacagtg tttccacacc cgcttcgtat tccaaatgta caatcctgca gcagctgcgc 2580
ctaaagcagc ggcgagccaa gaggcggctg tgctgtgtga aaaagcagca gctccctgat 2640
aacatatgaa actaaataaa atcagataaa gacattgaaa aagggtaatc acgtactaaa 2700
ctcctcaaaa atagtagttt tgaaaataat caagctgctg cttagtgatc atcgcttttt 2760
tagacgttcc ctcaaaggaa actgtgaatg aatgcttggt ataagcggaa aaatgcttta 2820
tgtaatgaat gttgataata aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt 2880
cgcctttaat atcatttaat gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg 2940
tcgtcgaacg tcccgtccgt tctgcgaaaa taatatcctt cttttgcagg acgtgcattt 3000
cagacttttg ctttatcaat atacgcccat tcaaactcgt ttccgtt 3047
<210> 40
<211> 864
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 40
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180
gtgcaaaaga ttctcaaaga gactaaagtc aaaaaggtga atttgatcgg gcactcccaa 240
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840
tttttagcgt caaaaaagct ctaa 864
<210> 41
<211> 7380
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 41
gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60
atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120
agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180
tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240
acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300
atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360
tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420
ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480
agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540
aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600
tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660
gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720
atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780
ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840
ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900
accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960
acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020
ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080
agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140
tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200
aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260
agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320
gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380
tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440
tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500
caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560
gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620
ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680
tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740
gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800
taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860
actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920
gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980
aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040
acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100
gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160
ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220
atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280
tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340
tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400
acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460
gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520
ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580
tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640
aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700
aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760
cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820
ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880
attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940
aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000
acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060
atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120
ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180
ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240
ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300
ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360
gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420
tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480
gaatttgatc gggcacgcgc aaggtcctct tgcgtgtcgt tatgtggcgg ccaagcatgc 3540
taaaagtatt gcaagtgtta catctgtgaa tggagtgaat cacggtagcg aaatcgccga 3600
tcttgtcaga cggattatga gaaaagattc tgtccctgag tatatcgcgg acgcggtaat 3660
gaaggctatt ggcactataa tcagtacttt tagcggaaat agaggaaacc ctcaagacgc 3720
tatagcagct ctggaggcct taacgacgga aaacgtgatg gaatttaaca aaaaatatcc 3780
tcagggactg ccagcaattc gtgggggtga aggtaaagaa gtcgtgaacg gcgtacacta 3840
ctatagcttt ggttcttaca tacagggtct catcgctggc gagaagggaa acttgctcga 3900
tcctacccac gccgctatgc gcgttttatc cgcgtttttt tcagaacgtg agaacgatgg 3960
tttagtagga cggacttcaa tgcggctcgg caagttaatt aaagacgact acgctgagga 4020
tcatttagat atggtcaatc aagttgcggg gttagttgga cgcggggagg atataattgc 4080
tatatatacg aatcatgcca attttttagc gtcaaaaaag ctctaatcta gatacataaa 4140
aaaccggcct tggccccgcc ggttttttat tatttttctt cctccgcatg ttcaatccgc 4200
tccataatcg acggatggct ccctctgaaa attttaacga gaaacggcgg gttgacccgg 4260
ctcagtcccg taacggccaa gtcctgaaac gtctcaatcg ccgcttcccg gtttccggtc 4320
agctcaatgc cgtaacggtc ggcggcgttt tcctgatacc gggagacggc attcgtaatc 4380
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 4440
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 4500
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 4560
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 4620
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 4680
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 4740
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 4800
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 4860
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 4920
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 4980
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 5040
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 5100
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 5160
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 5220
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 5280
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 5340
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 5400
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 5460
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 5520
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 5580
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 5640
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 5700
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 5760
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 5820
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 5880
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 5940
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 6000
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 6060
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 6120
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 6180
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 6240
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 6300
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 6360
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 6420
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 6480
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 6540
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 6600
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 6660
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 6720
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 6780
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 6840
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 6900
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 6960
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 7020
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 7080
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 7140
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 7200
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 7260
ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 7320
tgttttgcct tagtaaatca gatcaaggaa atcctctttc gtaatgttcc caaagtaatg 7380
<210> 42
<211> 94
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 42
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaagttgt 60
tgacttaaaa gaagctaaat gttatagtaa taaa 94
<210> 43
<211> 39
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 43
cacgcaagag gaccttgcgc gtgcccgatc aaattcacc 39
<210> 44
<211> 3516
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 44
gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60
atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120
agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180
tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240
acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300
atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360
tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420
ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480
agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540
aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600
tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660
gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720
atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780
ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840
ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900
accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960
acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020
ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080
agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140
tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200
aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260
agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320
gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380
tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440
tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500
caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560
gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620
ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680
tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740
gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800
taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860
actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920
gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980
aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040
acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100
gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160
ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220
atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280
tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340
tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400
acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460
gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520
ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580
tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640
aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700
aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760
cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820
ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880
attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940
aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000
acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060
atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120
ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180
ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240
ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300
ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360
gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420
tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480
gaatttgatc gggcacgcgc aaggtcctct tgcgtg 3516
<210> 45
<211> 39
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 45
ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtg 39
<210> 46
<211> 28
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 46
cattactttg ggaacattac gaaagagg 28
<210> 47
<211> 3903
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 47
ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 60
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 120
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 180
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 240
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 300
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 360
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 420
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 480
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 540
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 600
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 660
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 720
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 780
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 840
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 900
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 960
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 1020
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 1080
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 1140
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 1200
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 1260
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 1320
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 1380
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 1440
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 1500
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 1560
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 1620
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 1680
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 1740
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 1800
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 1860
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 1920
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 1980
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 2040
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 2100
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 2160
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 2220
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 2280
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 2340
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 2400
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 2460
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 2520
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 2580
aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 2640
ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 2700
caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 2760
ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 2820
aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 2880
ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 2940
atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 3000
ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 3060
attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 3120
aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 3180
ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 3240
gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 3300
gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 3360
ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 3420
ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 3480
gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 3540
tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 3600
gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 3660
gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 3720
ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 3780
actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 3840
atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 3900
atg 3903
<210> 48
<211> 7334
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 48
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgtcgc tgataaacag ctgacatcaa tatcctattt 3000
tttcaaaaaa tattttaaaa gttgttgact taaaagaagc taaatgttat agtaataaaa 3060
cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg gtaaagaaag 3120
ccgccaggaa aaacttgtct gaatagtacg gttgcaattt ttaggggaaa cagatatact 3180
taagtgtaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 3240
aaagagtgtc aacaacatat cctattgtcc tggtacacgg cctttctggt ttcgatgaca 3300
tcgtaggata cccttatttt tatgggattg ccgacgccct ggagaaagat ggccacaaag 3360
tttttacagc ctcactctct gcattcaatt ccaacgaagt ccgtggcgag caattatggg 3420
agttcgtgca aaagattctc aaagagacta aagtcaaaaa ggtgaatttg atcgggcacg 3480
cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca tgctaaaagt attgcaagtg 3540
ttacatctgt gaatggagtg aatcacggta gcgaaatcgc cgatcttgtc agacggatta 3600
tgagaaaaga ttctgtccct gagtatatcg cggacgcggt aatgaaggct attggcacta 3660
taatcagtac ttttagcgga aatagaggaa accctcaaga cgctatagca gctctggagg 3720
ccttaacgac ggaaaacgtg atggaattta acaaaaaata tcctcaggga ctgccagcaa 3780
ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca ctactatagc tttggttctt 3840
acatacaggg tctcatcgct ggcgagaagg gaaacttgct cgatcctacc cacgccgcta 3900
tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga tggtttagta ggacggactt 3960
caatgcggct cggcaagtta attaaagacg actacgctga ggatcattta gatatggtca 4020
atcaagttgc ggggttagtt ggacgcgggg aggatataat tgctatatat acgaatcatg 4080
ccaatttttt agcgtcaaaa aagctctaat ctagatacat aaaaaaccgg ccttggcccc 4140
gccggttttt tattattttt cttcctccgc atgttcaatc cgctccataa tcgacggatg 4200
gctccctctg aaaattttaa cgagaaacgg cgggttgacc cggctcagtc ccgtaacggc 4260
caagtcctga aacgtctcaa tcgccgcttc ccggtttccg gtcagctcaa tgccgtaacg 4320
gtcggcggcg ttttcctgat accgggagac ggcattcgta atcaacgcct cactcctcac 4380
atcaacccgt tacttctatt gtaatcataa attcaaattc ttagaaccaa gctgtgttcc 4440
gcacttttcc acccttttaa gcatggaaac cccgatcgct gggaaaacta acaatgtttg 4500
gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt aatcggtctt gtgtttatcg 4560
cattttttta tctttacagc cgatcaggcg atgtgtatca atcggtagac gcggatttga 4620
tcacactgtc ttcaagcggc caggaagata tcgagattga aaaaagacag cacgtcaaag 4680
atatgctgga tattatgaat cagggaaaac aggtgaagac agaaaaaaca tcagcccctg 4740
attacgaagg gacaatcaag tttcataaag accggtatga ctcattcaga ctatggattg 4800
acggcagcca gcaagccgtt tttttgaagg atggcacata ctacaaatta agcaaaaatg 4860
atacaaaggc gctgctaaat attattaaaa aagaagcaaa ggattgaaaa tgaaaaagcg 4920
aagctaaccg cttcgctttt tcattttatt ggggcaaaat atctctcagt gcccgtctga 4980
gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa cgtaatggcg gcaggccgct 5040
tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc ctcctctgtt accccagagc 5100
gtttcggcac cacatatccc tttaccgctt ccccgctttg ggggtccggc acgccgatga 5160
caaccgcctc cttgacgtcc ggatggctgt acagcacctc ctccacctcc cgcggataca 5220
cattgtatcc tcctacaatg atcatgtctt ttttccggtc aacaatgtaa aaatagccgt 5280
cctcatcccg tcttgccaag tcccccgtat aaagccaccc gtcttttaat gcatgctctg 5340
tttccatcgg cattttataa tagcccttca tcacattggg gcctttcacg atcaattcgc 5400
cgacctggtg agcgggcagc tcgcgtccga gcggatctac gaccttgttt tcgacatgta 5460
agatacttgt cccgatggag cccggctttc tgcccctgtc aaacgggtta aagcacgtga 5520
cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt aacaccgaat ttttcttcaa 5580
acgccgtcag caacgcgact ggcatggacg cgcctcccga aatgcacagc cggatcgaag 5640
aaaaatcatc tttctttccg ttttcatgct gaaacaagta gttatacatt gtaggcacac 5700
cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa aacagatgcc ggactgaatt 5760
gaggctcaat caatacagtt gcgccgctca tcagcggtgc attcatacag acggttaaac 5820
aaaacacgtg aaacatggga agagcgcaga ccacattgtc cctctcatcc attcccaaat 5880
agcctgcgac atcgttggca ttgctgtaca aattctgatg tgtcagcatc gcgcctttcg 5940
gttttccagt cgttcctgac gtatataaaa taaccgcggt atcatcaggt acaggttctt 6000
ggttttgttt agcggcagat gtcggccgca atatttttgc aaacgttgtc attttcatcc 6060
tgacctctgg gtccgcagct tccggctcgg cctcccccgt ctggcataaa atgacgagct 6120
caacctttgg cagcgattca tgcatgctct cataaagcgg caaaagctgg ctaacgccca 6180
cgattgcctt tacatcgcca tttgtcagca tataaccaat ttctgtcggc gtgtacaacg 6240
gattgatggg aacaactacg atcccagctt ttaaagcgcc aaaaaacgcg atgataaaat 6300
caggcgaatt gccaagcagc aaagctaaat ggtccccttt ctccataccg gcttcctgaa 6360
ggccgtccgc aaatcgctga atatattcat tcagctcttg atacgtcatc atgtgatctt 6420
taaacctgca tgcgatgctg tcgggcttct cagatgctgt ttcttccaat tttgaaacaa 6480
gattcattct cccacccctt aagtgaatga atagtcattc attattgaag ccaagctttc 6540
ttctccatta tagagaaaca gaaaaaaaca ctcaagagca aaaagccctg agtgtcagta 6600
ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct ccttctgtca gatcaaaggc 6660
ccgattttcc gtattcttct catctaaaga ggcaatgacc gtttttgcaa cgtcatcacg 6720
ggaaataaat ccccgctcca gatccttcgc tgctgaaaca gttcccgttc caggctcatt 6780
gcgaaggcct cccggacgga taatcgtata ggttaaaccg ctcgcttcca gaattttatc 6840
agcataatgc ttggccacat aataaggctt gagtgcctca ttccaatttt cacggttatg 6900
ggcttgcagg gcgctgacca taataaaccg tttgattccg gcaatggccg cagcttcaat 6960
ggcttttgcc gctccatcaa gatccaccag cagcgtttta tcatagcctg tgctgccgcc 7020
ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc gcagcggcga tttcttccgg 7080
gctgccctcc agattcgcaa gcacagcttc tgcaccggca gcttcaagag acgctttctg 7140
ttcttctttt ctgaccatcg ctctgatgga atgatcagga ttatcttgga ataaagagac 7200
gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac actttcatgt gaatccctcc 7260
tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg atgtgttttg ccttagtaaa 7320
tcagatcaag gaaa 7334
<210> 49
<211> 25
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 49
gaagctgaat gagatttctt aaggc 25
<210> 50
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> synthesized sequence
<400> 50
aaggaggctt atttccgctt ttc 23
Claims (16)
- 선택 가능한 마커의 사용 없이 공여 DNA를 바실러스 종 세포의 게놈 내에 통합시키기 위한 방법으로서,
수용능 바실러스 종(competent Bacillus sp.)의 세포 개체군을 제공하는 단계; 및 선형 DNA 작제물을 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹(flanking)된 공여 DNA를 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인, 방법. - 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내의 뉴클레오타이드 서열을 결실시키기 위한 방법으로서,
수용능 바실러스 종 세포의 개체군을 제공하는 단계; 및 선형 DNA 작제물을 상기 세포 개체군 중 적어도 하나의 바실러스 종 세포 내로 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 결실될 상기 뉴클레오타이드 서열에 플랭킹하는 게놈 DNA 영역에 대한 서열 상동성을 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인, 방법. - 제1항 또는 제2항에 있어서, 각각의 상동성 아암은 적어도 900개, 1,000개, 1,100개, 1,200개, 1,300개, 1,400개, 1,500개, 1,600개, 1,700개, 1,800개, 1,900개, 2,000개, 2,100개, 2,200개, 2,300개, 2,400개, 2,500개, 2,600개, 2,700개, 2,800개, 2,900개, 3,000개, 3,100개, 3,200개, 3,300개, 3,400개, 3,500개, 3,600개, 3,700개, 3,800개, 3,900개, 4,000개, 5,000개, 6,000개의 뉴클레오타이드 및 최대 7,000개의 뉴클레오타이드의 길이를 갖는 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 선형 DNA 작제물은 이중 가닥 DNA인 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 렌투스(Bacillus lentus), 바실러스 브레비스(Bacillus brevis), 바실러스 스테아로써모필루스(Bacillus stearothermophilus), 바실러스 알칼로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 클라우시(Bacillus clausii), 바실러스 할로두란스(Bacillus halodurans), 바실러스 메가테리움(Bacillus megaterium), 바실러스 코아귤란스(Bacillus coagulans), 바실러스 서큘란스(Bacillus circulans), 바실러스 라우투스(Bacillus lautus) 및 바실러스 투링기엔시스(Bacillus thuringiensis)로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 ComK, ComS 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 작동 가능하게 연결된 프로모터를 포함하는 적어도 하나의 도입된 핵산 작제물에 의해 수용능이 되는 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 수용능 바실러스 종 세포는 초수용능 바실러스 종 균주에서 유래하는 것인 방법.
- 제8항에 있어서, 상기 초수용능 바실러스 종 균주는 Pxyl-ComK 균주인 것인 방법.
- 제1항에 있어서, 상기 공여 DNA는 관심 폴리뉴클레오타이드, 관심 유전자, 복수개의 관심 유전자, 하나 이상의 재조합 DNA, 전사 조절 서열, 번역 조절 서열, 프로모터 서열, 종결자 서열, 유전자이식 핵산 서열, 메신저 RNA의 적어도 일부에 상보적인 안티센스 서열, 이종성 서열 또는 이의 임의의 하나의 조합으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열을 포함하는 것인 방법.
- 제1항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 안정하게 통합된 공여 DNA 서열을 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
- 제2항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖는 바실러스 종 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
- 제2항에 있어서, 상기 선형 DNA 작제물은 상기 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 공여 DNA를 추가로 포함하며, 이때 상기 공여 DNA는 상기 바실러스 종 세포의 게놈 내에 삽입되는 반면, 상기 뉴클레오타이드 서열은 상기 바실러스 종 세포의 상기 게놈에서 결실되는 것인 방법.
- 제12항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈으로부터 결실된 뉴클레오타이드 서열을 갖고 이의 게놈 내에 통합된 공여 DNA를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
- 선택 가능한 마커의 사용 없이 바실러스 종 세포의 게놈 내로 돌연변이를 도입하기 위한 방법으로서,
수용능 바실러스 종의 세포 개체군을 제공하는 단계, 및 상기 세포 개체군의 적어도 하나의 바실러스 종 세포 내로 선형 DNA 작제물을 도입하는 단계를 포함하며, 이때 상기 DNA 작제물은 상류 상동성 아암(HR1) 및 하류 상동성 아암(HR2)에 의해 플랭킹된 목적하는 돌연변이를 갖는 뉴클레오타이드 서열을 포함하고, 각각의 상동성 아암은 적어도 900개의 뉴클레오타이드의 길이를 갖고, 상기 DNA 작제물은 선택 가능한 마커를 포함하지 않는 것인 방법. - 제14항에 있어서, 선택 가능한 마커를 포함하지 않는 배지 상에서 상기 적어도 하나의 바실러스 종 세포로부터 자손 세포를 성장시키는 단계, 및 이의 게놈 내에 돌연변이를 갖는 바실러스 종의 자손 세포를 식별하는 단계를 추가로 포함하는 것인 방법.
- 제1항, 제2항 및 제14항 중 어느 한 항의 방법에 따라 생산된 단리된 바실러스 종 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962937372P | 2019-11-19 | 2019-11-19 | |
US62/937,372 | 2019-11-19 | ||
PCT/US2020/060988 WO2021101950A1 (en) | 2019-11-19 | 2020-11-18 | Selection marker free methods for modifying the genome of bacillus and compositions thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220098245A true KR20220098245A (ko) | 2022-07-11 |
Family
ID=73793838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227020443A KR20220098245A (ko) | 2019-11-19 | 2020-11-18 | 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220389459A1 (ko) |
EP (1) | EP4061939A1 (ko) |
JP (1) | JP2023502967A (ko) |
KR (1) | KR20220098245A (ko) |
CN (1) | CN114981428A (ko) |
WO (1) | WO2021101950A1 (ko) |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US5034323A (en) | 1989-03-30 | 1991-07-23 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5231020A (en) | 1989-03-30 | 1993-07-27 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
TW261517B (ko) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
US5955310A (en) | 1998-02-26 | 1999-09-21 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide in a bacillus cell |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
EP1309677B2 (en) | 2000-08-11 | 2012-04-11 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
AU2003230981A1 (en) | 2002-04-22 | 2003-11-03 | Genencor International, Inc. | Methods of creating modified promoters resulting in varying levels of gene expression |
US20050221446A1 (en) | 2004-03-31 | 2005-10-06 | Novozymes Biopolymer A/S. | Methods for producing hyaluronic acid in a Bacillus cell |
EP2325332B1 (en) | 2005-08-26 | 2012-10-31 | DuPont Nutrition Biosciences ApS | Use of CRISPR associated genes (CAS) |
CN104053780A (zh) | 2011-12-09 | 2014-09-17 | 丹尼斯科美国公司 | 用于在微生物中生产蛋白质的来自枯草芽孢杆菌的核糖体启动子 |
DK3401400T3 (da) | 2012-05-25 | 2019-06-03 | Univ California | Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering |
CN104232674A (zh) * | 2014-07-15 | 2014-12-24 | 广东肇庆星湖生物科技股份有限公司 | 一种提高解淀粉芽孢杆菌生产鸟苷产量的方法 |
-
2020
- 2020-11-18 CN CN202080093883.9A patent/CN114981428A/zh not_active Withdrawn
- 2020-11-18 JP JP2022528304A patent/JP2023502967A/ja active Pending
- 2020-11-18 US US17/775,490 patent/US20220389459A1/en active Pending
- 2020-11-18 EP EP20824027.5A patent/EP4061939A1/en active Pending
- 2020-11-18 WO PCT/US2020/060988 patent/WO2021101950A1/en unknown
- 2020-11-18 KR KR1020227020443A patent/KR20220098245A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
JP2023502967A (ja) | 2023-01-26 |
WO2021101950A1 (en) | 2021-05-27 |
US20220389459A1 (en) | 2022-12-08 |
EP4061939A1 (en) | 2022-09-28 |
CN114981428A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102375732B1 (ko) | 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법 | |
US6808896B2 (en) | Method for stable chromosomal multi-copy integration of genes | |
JP4571304B2 (ja) | バチルス細胞内でのポリペプチドの製法 | |
DK2235176T3 (en) | IMPROVED PROTEIN MANUFACTURING IN BACILLUS | |
US20220162621A1 (en) | Methods For Polynucleotide Integration Into The Genome Of Bacillus Using Dual Circular Recombinant DNA Constructs And Compositions Thereof | |
US20220177923A1 (en) | Methods for integrating a donor DNA sequence into the genome of bacillus using linear recombinant DNA constructs and compositions thereof | |
DK2206788T3 (en) | A recombinant microorganism | |
EP2152732A1 (en) | A modified secretion system to increase expression of polypeptides in bacteria | |
Vasil et al. | Regulation of exotoxin A synthesis in Pseudomonas aeruginosa: characterization of toxA‐lacZ fusions in wild‐type and mutant strains | |
KR20220098245A (ko) | 바실러스 게놈 및 이의 조성물을 변형시키기 위한 선택 마커-부재 방법 | |
US8535911B2 (en) | Cell with improved secretion mediated by MrgA protein or homologue | |
CN116897160A (zh) | 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物 | |
US20220282234A1 (en) | Compositions and methods for increased protein production in bacillus lichenformis | |
KR20220097505A (ko) | 바실러스 세포에서 단백질 생산을 향상시키기 위한 조성물 및 방법 | |
DK1297170T3 (en) | A process for stable chromosomal integration of multiple copies of the genes | |
Anandan et al. | Identification of two classes of transcriptional regulator genes in the cyanobacterium Synechococcus sp. strain PCC 7942 | |
JP4749060B2 (ja) | 新規プロモーターdna及び該dnaを用いたタンパク質の生産方法 | |
CN111630165A (zh) | 通过抑制条件性必需基因进行反向选择 | |
Lee et al. | Cloning and mulecular characterization of a nprX gene of bacillus subtilis NS15-4 encoding a neutral protease |