KR20180081527A

KR20180081527A - 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구

Info

Publication number: KR20180081527A
Application number: KR1020187013946A
Authority: KR
Inventors: 프랑수아 바셀; 페레이라 니꼴라 로페스; 플로랑 꼴라; 콘트레라스 아나 로페스
Original assignee: 아이에프피 에너지스 누벨; 스티크팅 와게닝엔 리서치
Priority date: 2015-10-16
Filing date: 2016-10-14
Publication date: 2018-07-16
Also published as: FR3042506B1; US11746346B2; CA3001815A1; FR3042506A1; US20240002835A1; CN108431221A; BR112018007622A2; EP3362559B1; DK3362559T3; EP3362559A1; WO2017064439A1; US20180305680A1

Abstract

본 발명은 클로스트리듐 속의 박테리아, 전형적으로 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 적어도 2종의 상이한 핵산을 포함하는 유전자 도구에 관한 것이다.

Description

클로스트리듐 박테리아의 형질전환을 위한 유전자 도구

본 발명은 클로스트리듐(Clostridium) 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성(solventogenic) 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 적어도 2종의 상이한 핵산을 포함하는 유전자 도구에 관한 것이다.

퍼미큐테스(Firmicutes) 문, 클로스트리듐 속에 속하는 박테리아는 내생포자를 형성할 수 있는 절대 혐기성 그람 양성 바실러스이다. 이러한 속은 그들의 병원성 성질 또는 그들의 산업적 및 의학적 관심의 해석에 관해 연구되는 많은 종들을 함유한다. 예를 들어, 클로스트리듐 테타니(Clostridium tetani), 클로스트리듐 보툴리늄(Clostridium botulinum), 클로스트리듐 퍼프린젠스(Clostridium perfringens) 및 클로스트리듐 디피실(Clostridium difficile)은 각각이 파상풍, 보툴리누스 중독증, 가스 괴저증 및 가막성 대장염의 원인이 되는 동인이 된다. 동시에, 인간에 비병원성인 다른 종들 예컨대 클로스트리듐 아세토부틸리컴(Clostridium acetobutylicum), 클로스트리듐 부티리컴(Clostridium butyricum) 및 클로스트리듐 베이제린키(Clostridium beijerinckii)는 발효에 사용된다. 마지막으로, 클로스트리듐 노비(Clostridium novyi) 및 클로스트리듐 스포로제네스(Clostridium sporogenes)는 최근에 항암 요법의 개발을 목표로 하는 연구에서 사용되고 있다.

산업적 관심 대상의 클로스트리듐 종은 포도당에서 셀룰로스에 이르는 범위의 광범위한 기질 및 당류로부터 용매를 생성시킬 수 있다. 용매 생성 클로스트리듐 박테리아는 이중영양적 성장을 특징으로 한다. 산(아세트산 및 부티르산)이 대수 성장기 동안 생성된다. 그러고 나서, 세포 성장이 멈추고 박테리아가 정체기에 들어가면, 이들은 용매를 생성한다.

대부분의 용매형성성 클로스트리듐 균주는 최종 생성물로서 아세톤, 부탄올 및 에탄올을 생성한다. 이들 균주는 "ABE 균주"라고 불린다. 이것은 예를 들어 씨. 아세토부틸리컴 ATCC824 및 씨. 베이제린키 NCIMB 8052 균주의 경우이다. 다른 균주들도 또한 아세톤을 이소프로판올로 환원시킬 수 있고 "IBE 균주"라고 불린다. 이것은 예를 들어 아세톤을 이소프로판올로 환원시킬 수 있는 1차/2차 알코올-디히드로게나제를 코딩하는 adh 유전자를 그의 게놈에 갖는 균주 씨. 베이제린키 DSM 6423(NRRL B593)의 경우이다.

씨. 아세토부틸리컴 ATCC824에 의한 이소프로판올 생성은 씨. 베이제린키 DSM 6423 유래의 adh 유전자를 발현시키기 위한 플라스미드의 도입 후에 가능하다. 이러한 유전자 변형된 균주는 DSM 6423 균주와 동일한 방식으로 수행한다. 이러한 수행은 각각 산의 재동화에 관여하는 CoA-트랜스퍼라제, 및 아세토아세테이트 디카복실라제를 코딩하는 ctfA, ctfB 및 adc 유전자의 오페론 구조 내 과발현 후에 개선될 수 있다(Collas et al., 2012). 이들 유전자를 함유하는 플라스미드의 도입은 IBE 혼합물을 생성하도록 ATCC824 균주의 발효 프로파일을 변형시킨다. 그러나, 성장 배지 중 항생제의 존재는 이러한 유전자 구성체를 유지시키는데 필요하여, 이 균주를 산업적 용도로 사용하는 것을 불가능하게 만든다.

클로스트리듐 속의 박테리아에 대한 명백한 관심에도 불구하고, 유전자 변형된 균주 획득의 어려움으로 인해 그들 물질대사를 연구하고/하거나 변형시키는 작업은 거의 수행되지 않았다. 가장 강건한 시스템은 게놈의 정밀하고 안정한 변형을 가능하게 하는 상동성 재조합 사건을 기반으로 한다. 그러나, 클로스트리듐에서 관찰되는 상동성 재조합 빈도는 매우 낮고, 선별 마커(예를 들어, 항생제 내성 유전자) 및 대항-선별 마커(예를 들어, 독소 코딩 유전자)가 필수적인 것으로 입증되었다. 2가지 도구가 최근에 개발되었는데(Al-Hinai et al., 2012; Cartman et al., 2012), 각각은 단일 플라스미드의 사용을 기반으로 한다. 획기적이긴 하지만, 이들 시스템은 단점을 갖는다. 제1 시스템은 많은 수의 변형을 수행하기 위한 도구의 재사용을 방지하고 돌연변이체의 유전자 맥락(genetic context)을 변경시킬 수 있는 FRT 카세트(선별가능한 마커의 절제 동안 사용됨)를 변형 부위에 남겨두는 결점을 갖는다. 이들 결점은 당업자에게 잘 알려져 있다. 두 순차적인 상동성 재조합 사건을 필요로 하는, 제2 시스템은 게놈의 필수 영역을 변형시키는데 사용될 수 없다. 2종의 플라스미드의 순차적 사용을 포함하는 도구가 이후에 개발되었는데, 그들 중 하나는 메가뉴클레아제 I-SceI을 코딩하며, 이것은 특정 표적 부위에서 이중 가닥 DNA에 파괴를 유도할 수 있고 상동성 재조합 사건을 촉진할 수 있다(Zhang et al., 2015). 여기서도 역시, 일부 필수 유전자의 변형이 두 순차적 상동성 재조합 사건을 수행하는 필요성으로 인해 불가능하다. 현재, 개발된 최신 세대의 도구(Wang et al., 2015; Xu et al., 2015)는 진핵생물에서 관찰되는 RNA 간섭과 유사한 방식으로 작동하는, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 기술을 기반으로 한다(Barrangou et al., 2007). 각각 씨. 베이제린키 및 씨. 셀룰롤리티컴에 적합화된 문헌 [Wang et al.] 및 문헌 [Xu et al.]에 기술된 도구는 단일 플라스미드의 사용을 기반으로 한다. 문헌 [Xu et al.]은 이중 가닥 파괴 대신 단일 가닥 파괴를 생성하는 Cas9 효소의 변형된 이형(version)을 사용한다. 이용가능한 CRISPR 기술-기반 도구 둘 모두는 박테리아 게놈에 삽입시킬 수 있는 관심 핵산의 크기(및 따라서 코딩 서열 또는 유전자의 개수)(문헌 [Xu et al.]에 따라 고작 약 1.8 kb)를 상당히 제한한다는 주요한 단점을 갖는다.

발명의 개요

본 발명의 목적은 산업적 규모로 클로스트리듐 속의 박테리아의 사용을 가능하게 하기 위해 최초로 박테리아 게놈을 변형시킬 수 있는, 전체로서 클로스트리듐 속, 구체적으로 클로스트리듐 속의 용매형성성 박테리아에 적합화된 유전자 도구를 제공하는 것이다.

따라서 본 발명은 적어도 2종의 상이한 핵산을 포함하는 것을 특징으로 하는, 클로스트리듐 속의 박테리아, 바람직하게는 클로스트리듐 속의 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구에 관한 것이다. 이러한 도구는 예를 들어 박테리아 생존에 필수적인 서열을 포함하는 클로스트리듐 속의 박테리아의 게놈의 영역을 변형시킬 수 있거나, 또는 현존하는 도구를 사용해서는 불가능한, 핵산 서열의 거대 단편의 삽입을 가능하게 할 수 있다.

따라서 본 발명의 제1 목적은:

- 적어도 Cas9을 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및

- 상동성 재조합 기전에 의해, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산

을 포함하는 것을 특징으로 하고,

i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나, 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함하며, 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함하는 것을 특징으로 하는, 클로스트리듐 속의 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구에 관한 것이다.

본 발명은 또한 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함하는 것을 특징으로 하는, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키기 위한 방법에 관한 것이다. 본 발명은 또한 그에 따라 형질전환되고/되거나 유전자 변형된 클로스트리듐 속의 박테리아에 관한 것이다.

본 발명자는 또한 본 발명에 따른 유전자 도구의 성분, 및 임의로는 구체적으로 도구 내에서 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 사용하여, 적어도 하나의 용매, 예를 들어, 용매의 혼합물을 생성시키거나, 또는 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 키트를 개시한다.

또한 산업적 규모로 용매 또는 용매의 혼합물, 바람직하게는 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 이소프로판올/부탄올 혼합물을 생성하기 위한, 본 발명에 따른 유전자 도구, 상동성 재조합에 의해 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 방법, 이에 따라 형질전환 및/또는 유전자 변형된 박테리아의 용도를 개시한다.

발명의 상세한 설명

CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)은 박테리아 및 고세균에서 파지 및 플라스미드에 대항하여 면역 방어 역할을 갖는 유전자의 유전자좌를 의미한다. CRISPR-Cas9 시스템은 본질적으로 표적 게놈에서 이중 가닥 파괴를 유도하는 Cas9 단백질 및 절단 부위에 대한 특이성을 책임지는 가이드 RNA(gRNA)의 조합을 기반으로 한다. DNA에서 표적화 이중 가닥 파괴를 생성시키는 이러한 능력은 관심 균주의 게놈으로 돌연변이를 도입시키는데 필수적인 상동성 재조합 사건을 촉진시킬 수 있다. 세포 생존능은 게놈의 무결성에 의존적이다. 박테리아는 복구 주형을 요구하는 상동성 재조합 기전에 의해서건, 또는 비상동성 말단 연결 기전에 의해서건 간에, 그의 DNA 내 임의 파괴를 복구해야만 한다. 세포에 이러한 주형을 제공함으로서, 파괴 부위에 상응하는 영역을 변형시키는 것이 가능하다(도 2). DNA 분자에 이중 가닥 파괴를 만드는 CRISPR의 능력은 다양한 유기체, 구체적으로 스트렙토코커스 피오제네스(Streptococcus pyogenes)에서 유전자 도구로서의 이의 최근 사용을 가능하게 하였으며, 이는 대장균(E. coli), 및 진핵생물 세포에서 처음 특징규명되었다(Jiang et al., 2013; Cong et al., 2013; Hwang et al., 2013; Hsu et al., 2013). 이는 박테리아 게놈에 대해 제한된 변형만을 가능하게 하는 유전자 도구의 도움으로 클로스트리듐 베이제린키 및 클로스트리듐 셀룰롤리티컴에서 최근에 사용되었는데, 산업적 규모로는 비현실적이다(Wang et al., 2015; Xu et al., 2015).

클로스트리듐 속의 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하고, 적어도 2종의 상이한 핵산을 포함하는 유전자 도구가 본 명세서에서 최초로 개시된다. 본 발명자들은 이 도구를 산업적 관점에서 특히 유용하게 하여, 따라서 오랜 동안 표현된 요구를 충족시키는데 충분히 효과적인 방식으로, 클로스트리듐 속의 용매형성성 박테리아를 형질전환 및/또는 유전자 변형시킬 수 있다는 것을 입증하였다.

클로스트리듐 속의 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는, 본 발명에 따른 구체적인 유전자 도구는:

- 적어도 Cas9를 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및

- 상동성 재조합 기전에 의해서, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산

을 포함하고,

여기서 i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함한다는 것을 고려한다. 이러한 도구에서 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함한다.

표현 "클로스트리듐 속의 박테리아"는 구체적으로 산업적 관심의 클로스트리듐 종, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 의미하려는 의도이다. 표현 "클로스트리듐 속의 박테리아"는 야생형 박테리아 뿐 아니라 CRISPR 시스템에 노출시키지 않고 그들 성능을 개선시키는(예를 들어, ctfA, ctfB 및 adc 유전자의 과발현) 목적으로 유전자 변형시켜 그로부터 유래된 균주를 포함한다.

표현 "산업적 관심의 클로스트리듐 종"은 발효에 의해, 단당류 예컨대 포도당, 자일로스, 프룩토스 또는 만노스, 다당류 예컨대 셀룰로스 또는 헤미셀룰로스, 산 예컨대 부티르산 또는 아세트산, 또는 클로스트리듐 속의 박테리아에 의해 동화될 수 있고 이용될 수 있는 임의의 다른 탄소원(예를 들어, CO, CO₂ 및 메탄올)으로부터 용매를 생성시킬 수 있는 종을 의미하려는 의도이다. 관심의 용매형성성 박테리아의 예로는 아세톤, 부탄올, 에탄올 및/또는 이소프로판올을 생성하는 클로스트리듐 속의 박테리아, 예컨대 "ABE 균주"[발효 생성물로서 아세톤, 부탄올 및 에탄올을 생성하는 균주] 및 "IBE 균주"[발효 생성물로서 이소프로판올(아세톤의 환원에 의함), 부탄올 및 에탄올을 생성하는 균주]와 같이 문헌에서 확인되는 균주들이 있다. 클로스트리듐 속의 용매형성성 박테리아는 씨. 아세토부틸리컴(C. acetobutylicum), 씨. 셀룰롤리티컴(C. cellulolyticum), 씨. 피토퍼멘탄스(C. phytofermentans), 씨. 베이제린키(C. beijerinckii), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 사카로퍼부틸아세토니컴(C. saccharoperbutylacetonicum), 씨. 스포로제네스(C. sporogenes), 씨. 부티리컴(C. butyricum), 씨. 아우란티부티리컴(C. aurantibutyricum) 및 씨. 티로부티리컴(C. tyrobutyricum), 바람직하게는 씨. 아세토부틸리컴, 씨. 베이제린키, 씨. 부티리컴 및 씨. 티로부티리컴 및 씨. 셀룰롤리티컴, 및 보다 바람직하게는 씨. 아세토부틸리컴 및 씨. 베이제린키에서 선택될 수 있다.

구체적인 실시형태에서, 관심있는 클로스트리듐 속의 박테리아는 "ABE 균주", 바람직하게는 씨. 아세토부틸리컴 ATCC824 균주 또는 씨. 베이제린키 NCIMB 8052 균주이다.

다른 구체적인 실시형태에서, 관심있는 클로스트리듐 속의 박테리아는 "IBE 균주", 바람직하게는 씨. 베이제린키 DSM 6423 균주(NRRL B593 균주라고도 식별함)이다.

CRISPR 시스템은 2종의 별개의 성분, 즉 i) 엔도뉴클레아제, 본 경우에서 CRISPR 시스템과 연관된 뉴클레아제(Cas 또는 "CRISPR-연관 단백질"), Cas9, 및 ii) 가이드 RNA를 함유한다. 가이드 RNA는 박테리아 CRISPR RNA(crRNA) 및 tracrRNA(trans-activating CRISPR RNA)의 조합으로 이루어진 키메라 RNA의 형태이다(Jinek et al., Science 2012 - 도 3 참조). gRNA는 Cas 단백질을 위한 가이드로서 제공되는 "스페이서 서열"에 상응하는 crRNA의 표적화 특이성, 및 tracrRNA의 입체형태 특성을 단일 전사물에 조합한다. gRNA 및 Cas9 단백질이 세포에서 동시에 발현되는 경우, 표적 게놈 서열은 영구적으로 변형되거나 또는 차단될 수 있다. 변형은 유리하게는 복구 주형에 의해 가이드된다.

본 발명에 따른 유전자 도구는 적어도 Cas9을 코딩하는 제1 핵산을 포함한다. 용어 "Cas9"은 Cas9 단백질(Csn1 또는 Csx12라고도 함) 또는 이의 기능성 단백질, 펩티드 또는 폴리펩티드 단편을 의미하려는 의도이고, "기능성"은 하나 이상의 가이드 RNA와 상호작용할 수 있고 표적 게놈의 DNA에 이중 가닥 파괴를 생성시킬 수 있는 효소(뉴클레아제) 활성을 수행할 수 있는 것을 의미한다. 따라서, "Cas9"은 예를 들어 단백질의 사전정의된 기능에 필수적이지 않은 단백질 도메인, 구체적으로 하나 이상의 gRNA와 상호작용하는데 필요하지 않은 도메인을 제거하기 위해 절단된, 변형된 단백질을 나타낼 수 있다.

본 발명의 맥락에서 사용시 Cas9(전체 단백질 또는 이의 단편)을 코딩하는 서열은 임의의 공지된 Cas9 단백질로부터 획득될 수 있다(Makarova et al., 2011). 본 발명에서 유용한 Cas9 단백질의 예는 제한없이, 스트렙토코커스 피오제네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 뮤탄스(Streptococcus mutans), 캄필로박터 제주니(Campylobacter jejuni), 프란시셀라 노비시다(Francisella novicida) 및 나이세리아 메닌지티디스(Neisseria meningitidis) 유래의 Cas9 단백질을 포함한다. 본 발명에서 유용한 다른 Cas9 단백질은 또한 [Fonfara et al., 2013]의 논문에 기술되어 있다.

구체적인 실시형태에서, 본 발명에 따른 유전자 도구의 핵산 중 하나에 의해 코딩되는 Cas9 단백질, 또는 이의 기능성 단백질, 펩티드 또는 폴리펩티드 단편은 SEQ ID NO: 1의 아미노산 서열, 또는 SEQ ID NO: 1의 아미노산 서열과 적어도 50%, 바람직하게는 적어도 60% 동일성을 갖고, SEQ ID NO: 1의 아미노산 서열의 위치 10("D10") 및 위치 840("D840")을 차지하는 적어도 2개의 아스파르트산("D")을 함유하는 임의의 다른 아미노산 서열을 포함하거나, 또는 그로 이루어진다.

바람직한 실시형태에서, Cas9는 스트렙토코커스 피오제네스(Streptococcus pyogenes) M1 GAS 균주 유래의 cas9 유전자(NCBI 수탁 번호: NC_002737.2 SPy_1046, SEQ ID NO: 2)에 의해 코딩되는 Cas9 단백질(NCBI 수탁 번호: WP_010922251.1, SEQ ID NO: 1), 또는 클로스트리듐 속의 박테리아가 우선적으로 사용하는 코돈, 전형적으로 이 박테리아 속에서 Cas9 단백질의 촉진된 발현을 가능케 하는, 아데닌("A") 및 티민("T") 염기가 풍부한 코돈을 함유하는 전사물을 생기게 하는 최적화를 겪은 이의 이형("최적화된 이형(optimized version")을 포함하거나, 또는 그로 이루어진다. 이들 최적화된 코돈은 각각의 박테리아 균주에 특이적인, 당업자에게 잘 알려진 코돈 용법 편향성을 준수한다.

이 문헌에 개시된 펩티드 서열에서, 아미노산은 다음의 명명법에 따라 그들의 한 글자 코드로 표시된다: C: 시스테인; D: 아스파르트산; E: 글루탐산; F: 페닐알라닌; G: 글리신; H: 히스티딘; I: 이소류신; K: 리신; L: 류신; M: 메티오닌; N: 아스파라긴; P: 프롤린; Q: 글루타민; R: 아르기닌; S: 세린; T: 트레오닌; V: 발린; W: 트립토판 및 Y: 티로신.

구체적인 실시형태에 따라서, Cas9 도메인은 전체 Cas9 단백질, 바람직하게는 스트렙토코커스 피오제네스 유래의 Cas9 단백질, 또는 이의 최적화된 이형으로 이루어진다.

본 발명에 따른 유전자 도구의 핵산 중 하나에 존재하는 Cas9 코딩 서열은 프로모터의 제어 하에 위치된다. 이 프로모터는 항상성 프로모터이거나 또는 유도성 프로모터일 수 있다. 바람직한 실시형태에서, Cas9 발현을 제어하는 프로모터는 유도성 프로모터이다.

본 발명의 맥락에서 유용한 항상성 프로모터의 예는 thl 유전자의 프로모터, ptb 유전자의 프로모터, adc 유전자의 프로모터, BCS 오페론의 프로모터, 또는 이의 유도체, 바람직하게는 기능성이지만 보다 짧은(절단형) 유도체 예컨대 씨. 아세토부틸리컴 유래의 thl 유전자 프로모터의 "miniPthl" 유도체(Dong et al., 2012), 또는 클로스트리듐에서 단백질의 발현을 가능케하는, 당업자에게 잘 알려진 임의의 다른 프로모터에서 선택될 수 있다.

본 발명의 맥락에서 유용한 유도성 프로모터의 예는 예를 들어 그 발현이 전사 억제인자 TetR에 의해 제어되는 프로모터, 예를 들어, tetA 유전자(본래 대장균 트랜스포존 Tn10에 존재하는 테트라사이클린 내성 유전자)의 프로모터; 그 발현이 L-아라비노스에 의해 제어되는 프로모터, 예를 들어 ptk 유전자의 프로모터(문헌 [Zhang J. et al., 2015] 참조)로서, ARAi 시스템을 구축하기 위해 씨. 아세토부틸리컴 유래의 araR 조절인자 발현 카세트와 조합된 것(문헌 [Zhang J. et al., 2015] 참조); 그 발현이 라미나리비오스(β-1,3 포도당 이량체)에 의해 제어되는 프로모터, 예를 들어 바람직하게는 억제인자 유전자 glyR3 및 관심 유전자가 바로 후속되는, celC 유전자 프로모터(문헌 [Mearls EB et al. (2015)] 참조) 또는 celC 유전자 프로모터(문헌 [Newcomb M. et al., 2011] 참조); 그 발현이 락토스에 의해 제어되는 프로모터, 예를 들어 바람직하게는 AdhE1(알데하이드/알코올 디히드로게나제) 유전자가 바로 후속되는, bgaL 유전자 프로모터(문헌 [Banerjee et al., 2014] 참조); 그 발현이 자일로스에 의해 제어되는 프로모터, 예를 들어 xylB 유전자 프로모터(문헌 [Nariya H et al., 2011] 참조); 및 그 발현이 UV 노출에 의해 제어되는 프로모터, 예를 들어 bcn 프로모터(문헌 [Dupuy et al., 2005] 참조)로부터 선택될 수 있다.

상기 기술된 프로모터 중 하나로부터 유래된 프로모터, 바람직하게는 기능성이지만 짧은(절단형) 유도체가 또한 유리하게 본 발명의 맥락에서 사용될 수 있다.

본 발명에서 유용한 다른 유도성 프로모터가 또한 예를 들어 [Ransom EM et al. (2015)], [Currie DH et al. (2013)], [D'Urzo N et al. (2013)] 및 [Hartman AH et al. (2011)]의 논문에 기술되어 있다.

바람직한 유도성 프로모터는 Pcm-2tetO1 및 Pcm-2tetO2/1로부터 선택된, tetA 로부터 유래된 언히드로테트라사이클린(aTc)-유도성 프로모터(aTc는 테트라사이클린보다 덜 독성이 있고 보다 낮은 농도에서 전사 억제인자 TetR의 억제를 풀어줄 수 있음)이다(Dong et al., 2012).

또 다른 바람직한 유도성 프로모터는 xylB로부터 유래된 자일로스 유도성 프로모터, 예를 들어 클로스트리듐 디피실(Clostridium difficile) 630 유래의 xylB 프로모터이다(Nariya et al., 2011).

본 명세서에 개시된 바와 같은 유도성 프로모터는 유리하게는 효소의 작용을 제어하고 바람직한 유전자 변형을 겪은 형질전환체의 선택을 촉진하는 것을 가능하게 한다.

용어 "가이드 RNA" 또는 "gRNA"는 본 발명의 의미에서 박테리아 염색체의 표적 영역 쪽으로 가이드하기 위해 "Cas9"과 상호작용할 수 있는 RNA 분자를 의미한다. 파괴의 특이성은 gRNA에 의해 결정된다. 상기에 설명한 바와 같이, 각각의 gRNA는 다음의 2개 영역을 포함한다:

- 표적 염색체 영역에 상보적이고 내생성 CRISPR 시스템의 crRNA를 모방하는, gRNA의 5' 말단의 제1 영역(통상적으로 "SDS" 영역이라고 불림), 및

- 내생성 CRISPR 시스템의 crRNA 및 tracrRNA(trans-activating crRNA) 사이의 염기쌍 상호작용을 모방하고 본질적으로 단일 가닥 서열로 3' 방향으로 종결되는 이중 가닥 스템-루프 구조를 갖는, gRNA의 3' 말단의 제2 영역(통상적으로 "핸들" 영역이라고 함). 이 제2 영역은 Cas9에 대한 gRNA의 결합에 필수적이다.

gRNA의 제1 영역(SDS 영역)은 표적화 염색체 서열에 따라 다양하다.

표적 염색체 영역에 상보적인 gRNA의 SDS 영역은 적어도 1개의 뉴클레오티드, 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 또는 40개 뉴클레오티드, 전형적으로 1 내지 40개 뉴클레오티드를 포함한다. 바람직하게는, 이 영역은 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드의 길이를 갖는다.

gRNA의 제2 영역(핸들 영역)은 스템-루프(또는 헤어핀) 구조를 갖는다. 상이한 gRNA의 핸들 영역은 선택된 염색체 표적에 의존하지 않는다.

구체적인 실시형태에 따라서, 핸들 영역은 적어도 1개 뉴클레오티드, 바람직하게는 적어도 1, 50, 100, 200, 500 및 1000개 뉴클레오티드, 전형적으로 1 내지 1000개 뉴클레오티드의 서열을 포함하거나, 또는 그로 이루어진다. 바람직하게, 이 영역은 40 내지 120개 뉴클레오티드의 길이를 갖는다.

gRNA의 전체 길이는 일반적으로 50 내지 1000개 뉴클레오티드, 바람직하게는 80 내지 200개 뉴클레오티드, 보다 특히 구체적으로 90 내지 120개 뉴클레오티드이다. 구체적인 실시형태에 따라서, 본 발명에서 사용하는 바와 같은 gRNA는 95 내지 110개 뉴클레오티드 범위의 길이, 예를 들어 약 100개 또는 약 110개 뉴클레오티드의 길이를 갖는다.

당업자는 표적화하려는 염색체 영역에 따라서 gRNA의 서열 및 구조를 잘 알려진 기술을 사용하여 쉽게 정의할 수 있다(예를 들어, [DiCarlo et al., 2013]의 논문을 참조함).

박테리아 염색체 내의 표적화된 DNA 영역/부분/서열은 비코딩 DNA의 일부분 또는 코딩 DNA의 일부분에 상응할 수 있다. 구체적인 실시형태에서, 박테리아 DNA의 표적화된 부분은 박테리아 생존에 필수적인 하나 이상의 유전자 또는 유전자 부분(들) 또는 그 불활성화가 관심 핵산(들)이 통합된 박테리아의 선택을 가능케 하는 하나 이상의 유전자 또는 DNA 서열을 포함한다.

클로스트리듐 속의 박테리아 내의 표적화 DNA 부분의 구체적인 예는 실험 부문에서 사용되는 서열이다. 이들은 예를 들어 upp(SEQ ID NO: 3) 및 adhE1(SEQ ID NO: 4) 유전자를 코딩하는 서열이다.

표적화된 DNA 영역/부분/서열에는 Cas9 결합에서 역할을 하는 PAM(protospacer adjacent motif) 서열이 후속된다.

소정 gRNA의 SDS 영역은 박테리아 염색체 내의 표적화된 DNA 영역/부분/서열과 100% 동일하거나 또는 적어도 80% 동일하거나, 바람직하게는 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하고, 상기 영역/부분/서열의 상보성 서열의 전부 또는 일부분, 전형적으로 적어도 1개 뉴클레오티드, 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 또는 40개 뉴클레오티드, 전형적으로 1 내지 40개 뉴클레오티드를 포함하는 서열, 바람직하게는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드를 포함하는 서열과 혼성화할 수 있다.

본 발명에 따른 방법에서, 하나 이상의 gRNA가 동시에 사용될 수 있다. 이들 상이한 gRNA는 동일하거나 또는 상이한, 바람직하게는 상이한, 염색체 영역을 표적으로 할 수 있다.

gRNA는 gRNA 분자(성숙형 또는 전구체)의 형태로, 전구체의 형태로 또는 상기 gRNA를 코딩하는 하나 이상의 핵산의 형태로 박테리아 세포에 도입될 수 있다. gRNA는 바람직하게는 상기 gRNA를 코딩하는 하나 이상의 핵산의 형태로 박테리아 세포에 도입된다.

하나 이상의 gRNA가 RNA 분자의 형태로 직접적으로 세포에 도입되는 경우, 이들 gRNA(성숙형 또는 전구체)는 예를 들어 뉴클레아제에 대한 그들의 내성을 증가시키고 따라서 세포 내에서 이들의 수명을 증가시킬 수 있게 하는 변형된 뉴클레오티드 또는 화학 변형을 함유할 수 있다. 이들은 특히, 적어도 하나의 변형되거나 또는 비천연인 뉴클레오티드, 예를 들어 변형된 염기, 예컨대 이노신, 메틸-5-데옥시시티딘, 디메틸아미노-5-데옥시우리딘, 데옥시우리딘, 디아미노-2,6-푸린, 브로모-5-데옥시우리딘 또는 혼성화를 가능케하는 임의의 다른 변형된 염기를 포함하는 뉴클레오티드를 포함할 수 있다. 본 발명에 따라 사용되는 gRNA는 뉴클레오티드간 결합 수준, 예를 들어 포스포로티오에이트, H-포스포네이트 또는 알킬-포스포네이트, 또는 골격의 수준, 예를 들어 알파-올리고뉴클레오티드, 2'-O-알킬 리보스 또는 펩티드 핵산(PNA)에 대해 변형될 수도 있다(Egholm et al., 1992).

gRNA는 천연 RNA, 합성 RNA, 또는 재조합 기술로 생성된 RNA일 수 있다. 상기 gRNA는 당업자에게 공지된 임의 방법 예컨대 화학 합성, 생체내 전사 또는 증폭 기술에 의해 제조될 수 있다.

gRNA가 하나 이상의 핵산의 형태로 박테리아 세포에 도입될 때, 하나 이상의 gRNA를 코딩하는 하나 이상의 서열은 발현 프로모터의 제어 하에 위치된다. 상기 프로모터는 항상성일 수 있거나 또는 유도성일 수 있다.

몇몇 gRNA가 사용될 때, 각각의 gRNA의 발현은 상이한 프로모터에 의해 제어될 수 있다. 바람직하게는, 사용되는 프로모터는 모든 gRNA에 대해 동일하다. 구체적인 실시형태에서, 발현시키고자 의도하는 몇몇개, 예를 들어 오직 소수의 gRNA의 발현을 허용하도록 동일한 프로모터가 사용될 수 있다.

바람직한 실시형태에서, 하나 이상의 gRNA의 발현을 제어하는 하나 이상의 프로모터는 항상성 프로모터이다.

본 발명의 맥락에서 유용한 항상성 프로모터의 예는 thl 유전자의 프로모터, ptb 유전자의 프로모터 또는 bcs 오페론의 프로모터, 또는 이의 유도체, 바람직하게는 miniPthl, 또는 클로스트리듐 내에서 RNA(코딩 또는 비코딩)의 합성을 가능하게 하는, 당업자에게 잘 알려진 임의의 다른 프로모터로부터 선택될 수 있다.

본 발명의 맥락에서 유용한 유도성 프로모터의 예는 tetA 유전자의 프로모터, xylA 유전자의 프로모터, lacI 유전자의 프로모터, 또는 bgaL 유전자의 프로모터, 또는 이의 유도체, 바람직하게는 2tetO1 또는 tetO2/1로부터 선택될 수 있다. 바람직한 유도성 프로모터는 tetO2/1이다.

Cas9 및 하나 이상의 gRNA의 발현을 제어하는 프로모터는 동일하거나 또는 상이할 수 있고 항상성이거나 또는 유도성일 수 있다. 본 발명의 구체적이고 바람직한 실시형태에서, 각각, Cas9 또는 하나 이상의 gRNA의 발현을 제어하는 프로모터 중 오직 하나는 유도성 프로모터이다.

본 발명의 의미 내에서, 용어 "핵산"은 코딩 서열로부터 합성된 전사물의 코돈이 클로스트리듐 속의 박테리아에서 사용을 위해 그에서 가장 빈번하게 발견되는 코돈이 되도록 최적화되거나, 또는 임의로는 화학적으로 변형된(즉, 예를 들어 변형된 결합, 변형된 염기 및/또는 변형된 당을 포함하는 변형된 뉴클레오티드, 비천연 염기를 포함), 임의의 천연, 합성, 반합성 또는 재조합 DNA 또는 RNA 분자를 의미하고자 한다. 상기에서 설명한 바와 같이, 클로스트리듐 속의 경우, 최적화된 코돈은 전형적으로 아데닌("A") 및 티민("T") 염기가 풍부한 코돈이다.

본 발명에 따른 유전자 도구 내에 존재하는 각각의 핵산, 전형적으로 "제1" 핵산 및 "제2" 핵산은 별개의 독립체로 이루어지고, 예를 들어 i) 발현 카세트(또는 "구성체") 예컨대 하나 이상의 관심 (코딩) 서열, 전형적으로 그 발현 생성물이 박테리아 내에서 관심 기능의 생성에 기여하는 몇몇 관심 코딩 서열을 포함하는 오페론에 작동적으로 연결된(당업자가 이해하는 의미로) 적어도 하나의 전사 프로모터를 포함하는 핵산, 또는 예컨대 활성화 서열 및/또는 전사 종결인자를 더 포함하는 핵산; 또는 ii) 상기 정의된 바와 같은 하나 이상의 발현 카세트를 포함하는, 원형 또는 선형의, 단일 가닥 또는 이중 가닥 벡터, 예를 들어 플라스미드, 파지, 코스미드, 인공 또는 합성 염색체에 상응한다. 바람직하게, 벡터는 플라스미드이다.

발현 카세트 및 벡터는 당업자에게 잘 알려진 통상의 절차에 의해 구축될 수 있고 하나 이상의 프로모터, 박테리아 복제 기원(ORI 서열), 종결인자 서열, 선택 유전자, 예를 들어 항생제 내성 유전자, 및 카세트 또는 벡터의 표적화 삽입을 허용하는 서열("측접 영역")을 포함할 수 있다. 또한, 상기 발현 카세트 및 벡터는 당업자에게 잘 알려진 기술에 의해 게놈에 통합시킬 수 있다.

관심 ORI 서열은 pIP404, pAMβ1, repH(씨. 아세토부틸리컴의 복제 기원), ColE1 또는 rep(대장균의 복제 기원), 또는 클로스트리듐 세포 내에서 벡터, 전형적으로 플라스미드를 유지시킬 수 있게 하는 임의의 다른 복제 기원으로부터 선택될 수 있다.

관심 종결 서열은 adc 및 thl 유전자의 종결 서열, bcs 오페론의 종결 서열, 또는 클로스트리듐 내에서 전사의 중지를 위한, 당업자에게 잘 알려진 임의의 다른 종결인자로부터 선택될 수 있다.

관심 선택 유전자는 ermB, catP, bla, tetA, tetM, 및 암피실린, 에리쓰로마이신, 클로람페니콜, 티암페니콜, 테트라사이클린 또는 당업자에게 잘 알려진 클로스트리듐 속의 박테리아를 선택하는데 사용될 수 있는 임의의 다른 항생제에 대한 내성을 위한 임의의 다른 유전자로부터 선택될 수 있다.

구체적인 벡터는 하나 이상의 발현 카세트를 포함하고, 각각의 카세트는 gRNA를 코딩한다.

구체적인 실시형태에서, 본 발명은 청구항에서 확인된 바와 같은 "제1" 핵산으로서 그 서열이 SEQ ID NO: 5, SEQ ID NO: 6 및 SEQ ID NO: 7의 서열 중 하나로부터 선택되는 플라스미드 벡터를 포함하는 유전자 도구에 관한 것이다.

구체적인 실시형태에서, 본 발명은 "제2" 또는 "n번째" 핵산으로서, 그 서열이 SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10 및 SEQ ID NO: 11의 서열 중 하나로부터 선택되는 플라스미드 벡터를 포함하는 유전자 도구에 관한 것이다.

관심 서열은 선택된 복구 주형에 의해 가이드되는 상동성 재조합 기전을 통해 박테리아 게놈에 도입된다(CRISPR 기술에 따름). 관심 서열은 박테리아 게놈 내의 표적화된 부분을 치환한다. 따라서 재조합 과정은 박테리아의 게놈 내에서 표적화 부분의 전체 또는 부분 변형 또는 결실을 가능하게 하거나 또는 박테리아의 게놈에 핵산 단편(구체적인 실시형태에서 거대 단편)의 삽입을 가능하게 한다. 선택된 복구 주형은 실제로, 원하는 형질전환의 성질에 따라 박테리아 게놈의 표적화 서열의 전부 또는 일부, 또는 다소간 변형된 이의 이형을 포함할 수 있다. DNA의 표적화된 부분처럼, 따라서 주형은 그 자체가 천연 및/또는 합성, 코딩 및/또는 비코딩 서열에 상응하는 하나 이상의 핵산 서열 또는 핵산 서열 부분을 포함할 수 있다. 주형은 예를 들어 박테리아 생존, 구체적으로 클로스트리듐 속의 박테리아의 생존에 필수적인 유전자, 또는 그의 불활성화가 하나 이상의 관심 핵산이 통합된 클로스트리듐 속의 박테리아의 선택을 가능하게 하는 하나 이상의 유전자 또는 DNA 서열에 상응하는 하나 이상의 서열 또는 서열의 일부분(들)을 포함할 수 있다. 주형은 또한 하나 이상의 "외래" 서열, 즉 클로스트리듐 속에 속하는 박테리아의 게놈 또는 상기 속의 특정 종의 게놈에 자연적으로 부재하는 서열을 포함할 수 있다. 주형은 또한 상기 기술된 바와 같은 서열의 조합을 포함할 수 있다.

관심 서열의 구체적인 예는 실험 부문에서 사용되는 서열들이다. 이들은 예를 들어 서열 upp_del(SEQ ID NO: 12) 및 upp_중지(SEQ ID NO: 13)이다.

본 발명에 따른 유전자 도구는 복구 주형이, 관심 핵산, 전형적으로 적어도 1개 염기쌍(bp), 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 50, 100, 1,000, 10,000, 100,000 또는 1,000,000 bp, 전형적으로 1 bp 내지 20 kb 또는 1 bp 내지 10 kb, 바람직하게는 10 bp 내지 20 kb 또는 10 bp 내지 10 kb, 예를 들어 1 bp 내지 2 kb를 포함하는 DNA 서열 또는 서열 부분의, 클로스트리듐 속의 박테리아의 박테리아 게놈 내로의 도입을 가이드할 수 있게 한다.

구체적인 실시형태에서, 관심 DNA 서열은 적어도 하나의 관심 생성물, 바람직하게는 용매의 생성을 촉진하는 생성물, 전형적으로 적어도 하나의 관심 단백질, 예를 들어 효소; 막 단백질 예컨대 트랜스포터; 전사 인자; 또는 이의 조합을 코딩한다.

바람직한 실시형태에서, 관심 DNA 서열은 용매의 생성을 촉진하고 전형적으로 i) 예를 들어 알코올 디히드로게나제를 코딩하는 서열(예를 들어 adh, adhE, adhE1, adhE2, bdhA, 및 bdhB에서 선택된 서열), 트랜스퍼라제를 코딩하는 서열(예를 들어, ctfA, ctfB, atoA 및 atoB에서 선택된 서열), 디카복실라제를 코딩하는 서열(예를 들어, adc), 히드로게나제를 코딩하는 서열(예를 들어, etfA, etfB 및 hydA에서 선택된 서열), 및 이의 조합에서 선택되는, 효소, 바람직하게는 알데하이드에서 알코올로의 전환에 관여하는 효소를 코딩하는 서열, ii) 막 단백질을 코딩하는 서열, 예를 들어 포스포트랜스퍼라제를 코딩하는 서열(예를 들어, glcG, bglC, cbe4532, cbe4533, cbe4982, cbe4983, cbe0751에서 선택된 서열), 및 iii) 전사 인자를 코딩하는 서열(예를 들어, sigE, sigF, sigG, sigH, sigK에서 선택된 서열)에서 선택된다.

본 발명은 또한 클로스트리듐 속의 박테리아, 바람직하게는 클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키는 방법에 관한 것이다. 상기 방법은 본 출원에서 개시된 바와 같은 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함한다. 상기 방법은 형질전환된 박테리아, 즉 하나 이상의 원하는 재조합/최적화를 갖는 박테리아를 획득하는 단계를 더 포함할 수 있다.

클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키기 위한 본 발명에 따른 구체적인 방법은 순서대로, 하기 단계를 포함한다:

a) 적어도 하나의 유도성 프로모터를 포함하는 본 출원에 개시된 바와 같은 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계, 및

b) 박테리아를 유전자 변형시키기 위해 유도성 프로모터의 발현을 유도시키는 단계.

본 발명에 따른 유전자 도구의 성분(핵산 또는 gRNA)을 박테리아에 도입시키는 것은 당업자에게 공지된 임의의 직접 또는 간접 방법, 예를 들어 형질전환, 접합, 미세주입, 형질감염, 전기천공 등, 바람직하게는 형질전환에 의해 수행된다(Lutke-Eversloh, 2014).

필요한 경우, 유도 단계는 본 발명에 따른 유전자 도구를 표적 박테리아에 도입시킨 후 당업자에게 공지된 임의 방법으로 실행할 수 있다. 이는 예를 들어 충분한 양으로 존재하는 적합한 물질과 박테리아를 접촉시키거나, 또는 UV 광에 노출시켜 수행된다. 상기 물질은 선택된 유도성 프로모터에 연결된 발현의 억제를 풀어준다. 선택된 프로모터가 Pcm-2tetO1 및 Pcm-tetO2/1에서 선택되는, 언히드로테트라사이클린(aTc)-유도성 프로모터인 경우, aTc는 바람직하게는 약 1 ng/mL 내지 약 5000 ng/mL, 바람직하게는 1 mL 당 약 100 ng 내지 약 500 ng/mL 또는 1 mL 당 약 200 ng 내지 약 300 ng/mL, 예를 들어 약 250 ng/mL 범위의 농도로 사용된다.

구체적인 실시형태에서, 방법은 존재하는 경우 단계 b) 이후에, i) 이미 도입된 것 또는 도입된 것들과 상이한 복구 주형 및 ii) 박테리아의 게놈의 표적화 구역으로 그들의 통합을 가능하게 하는 하나 이상의 가이드 RNA를 코딩하는, n번째, 예를 들어 제3, 제4, 제5 등의 핵산을 도입시키는 하나 이상의 추가 단계를 포함하고, 각각의 추가 단계는, 바람직하게는 유리하게 이전에 도입된 복구 주형을 코딩하는 핵산의 제거 단계로서 이후에 박테리아 세포는 상기 핵산이 "소거된" 것으로 간주되는 것인 단계, 및 바람직하게는 이전에 도입된 하나 이상의 가이드 RNA 또는 하나 이상의 가이드 RNA를 코딩하는 서열의 제거 단계가 선행된다.

구체적으로 유리한 방식으로, 그리고 종래 이용가능한 도구와 대조적으로, 본 발명에 따른 유전자 도구는 한 단계로, 즉 단일 핵산(전형적으로 본 명세서에서 개시하는 바와 같은 "제2" 핵산)을 사용하거나, 또는 몇몇 단계로, 즉 몇몇 핵산(전형적으로 본 명세서에서 개시하는 바와 같은 "제2" 및 하나 이상의 "n번째" 핵산)을 사용하여, 바람직하게는 한 단계로, 소형 크기뿐만 아니라 대형 크기의 관심 서열의 도입을 가능하게 한다.

본 발명의 구체적인 실시형태에서, 이러한 "n번째" 핵산은 박테리아 DNA의 표적화 부분을 결실시키거나 또는 보다 짧은 서열(예를 들어, 적어도 하나의 염기쌍이 결실된 서열) 및/또는 비기능성인 서열에 의해 치환된다. 본 발명의 구체적으로 바람직한 실시형태에서, "제2" 또는 "n번째" 핵산은 유리하게는 박테리아 게놈에 적어도 하나의 염기쌍, 및 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13 kb를 포함하는 관심 핵산을 도입시킨다.

관심 핵산은 사용된 gRNA에 따라서 동일하거나 또는 상이한 영역에서 박테리아 염색체, 및 유용한 것으로 입증된다면 박테리아 생존에 필수적인 유전자, 예를 들어 유전자 gyrA, pfkA, hydA, crt, thl, hbd, 또는 클로스트리듐 속의 박테리아의 생존에 필수적인 것으로 당업자에게 알려진 임의의 다른 유전자 중 하나를 포함하는 박테리아 게놈의 일부분, 및/또는 그 불활성화가 하나 이상의 관심 핵산이 통합된 박테리아의 선택을 가능케 하는 유전자 또는 DNA 서열, 예를 들어 upp 유전자에 삽입될 수 있다.

본 발명에 의해서, 전형적으로 본 발명에 따른 유전자 도구 및 방법에 의해서, 형질전환된 관심 박테리아, 예를 들어 그것이 유래된 박테리아와 유전자형 또는 표현형 차이를 갖는 향상된 변이체, 전형적으로 산업적으로 유용한 박테리아, 예를 들어 용매 또는 생물연료의 생산에 유용한 박테리아가 획득되도록 클로스트리듐 속의 박테리아를 효율적으로(고빈도의 상동성 재조합), 실질적으로(대형 크기의 관심 핵산을 박테리아의 게놈 내에 도입시키는 것이 가능), 그리고 안정하게(형질전환된 박테리아를 항생제와 접촉시켜 유지시킬 필요없음) 변형시키는 것이 이제 가능하다.

본 발명의 또 다른 목적은 본 발명에 따른 방법 및/또는 유전자 도구를 사용하여 형질전환된, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아에 관한 것이다. 이러한 박테리아는 복구 주형을 사용하는 상동성 재조합에 의해 그의 게놈에 도입된 하나 이상의 관심 핵산을 발현한다. 이러한 박테리아는 본 발명에 따른 유전자 도구의 전부 또는 일부, 전형적으로 Cas9 또는 Cas9를 코딩하는 핵산을 포함할 수 있다.

본 발명에 따른 방법 및 유전자 도구를 사용하여 형질전환된, 본 발명에 따른 클로스트리듐 속의 구체적인 박테리아, 예를 들어 박테리아 ATCC824는 더 이상 pSOL 메가플라스미드를 함유하지 않는다.

구체적인 실시형태에서, 본 발명에 따른 방법 및 유전자 도구를 사용하여 형질전환된, 본 발명에 따른 클로스트리듐 속의 박테리아는 그의 게놈에 자발적으로 도입된 하나 이상의 관심 핵산의 발현에 의해서만 하나 이상의 용매를 생성시킬 수 있다.

본 발명은 또한 본 명세서에 개시된 바와 같은 유전자 도구의 성분의 전부 또는 일부, 전형적으로 i) Cas9를 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및 ii) 상동성 재조합 기전에 의해서, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 허용하는 복구 주형을 코딩하는 적어도 제2 핵산, 및 임의로는 도구 내에서 임의로 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 키트에 관한 것이다.

본 발명에 따른 구체적인 키트는 태그를 포함하는 Cas9 단백질의 발현을 가능하게 한다.

본 발명에 따른 키트는 하나 이상의 소모품 예컨대 배양 배지, 적어도 하나의 클로스트리듐 속의 컴피턴트 박테리아(즉, 형질전환에 사용하기 위해 패키징됨), 적어도 하나의 gRNA, Cas9 단백질, 하나 이상의 선택 분자, 또는 설명서 세트를 더 포함할 수 있다.

본 발명은 전형적으로 본 명세서에 개시된 형질전환 방법의 실시 또는 클로스트리듐 속의 박테리아를 사용하여 용매(들)(적어도 하나의 용매)의 생성을 위한 키트에 관한 것이다.

본 발명은 마지막으로, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 형질전환 및/또는 유전자 변형시키기 위한, 예를 들어, 클로스트리듐 속의 박테리아의 향상된 변이체를 발생시키기 위한, 본 발명에 따른 유전자 도구, 또는 방법, 또는 키트의 잠재적인 용도에 관한 것이다.

마지막으로, 본 발명은 전형적으로 산업적 규모로, 구체적으로 용매 또는 생물연료, 또는 이의 혼합물의 생성을 위한, 본 발명에 따른 유전자 도구, 방법, 키트 또는 형질전환된 클로스트리듐 속의 박테리아의 잠재적인 용도에 관한 것이다. 생성될 가능성이 있는 용매는 전형적으로 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 에탄올/이소프로판올, 부탄올/이소프로판올, 또는 에탄올/부탄올 혼합물, 바람직하게는 이소프로판올/부탄올 혼합물이다.

구체적인 실시형태에서, 에탄올/이소프로판올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.

구체적인 실시형태에서, 에탄올/부탄올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.

구체적인 실시형태에서, 이소프로판올/부탄올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.

본 발명에 따른 형질전환된 박테리아의 용도는 전형적으로 산업적 규모로 적어도 100 톤의 아세톤, 적어도 100 톤의 에탄올, 적어도 1000 톤의 이소프로판올, 적어도 1800 톤의 부탄올, 또는 적어도 40,000 톤의 이의 혼합물의 연간 생산을 가능하게 한다.

이하의 실시예 및 도면의 목적은 이의 범주를 제한하지 않고 본 발명을 보다 완전하게 예시하려는 것이다.

도 1: 클로스트리듐의 용매형성성 균주의 물질대사. ABE 균주는 아세톤, 에탄올 및 부탄올을 생성시키는 한편, IBE 균주는 아세톤을 이소프로판올로 전환시키는 adh 유전자를 보유한다. 문헌 [Lee et al., 2012]을 변형시킴.
도 2: CRISPR의 작용 방식(Mali et al.)
도 3: 게놈 편집을 위한 CRISPR-Cas9의 용도. 이중 가닥 파괴는 gRNA에 의해 지정된, Cas9 뉴클레아제에 의해 생성된다. 상동성 재조합에 의한 이러한 파괴의 복구는 복구 주형에 함유된 변형의 게놈 내로의 도입을 가능하게 한다. 도면은 문헌 [Ann Ran et al., 2013]의 것을 변형시켰다.
도 4: upp 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균(E. coli)의 복제 기원. catP, 클로람페니콜 아세틸트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 5: pSOL 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균 복제 기원. catP, 클로람페니콜 아세틸 트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 6: pEC500E-miniPthl-Cas9 벡터 지도. pAMβ1, 씨. 아세토부틸리컴의 복제 기원. rep, 대장균의 복제 기원. bla, β-락타마제 유전자(암피실린 내성). ermB, 메틸라제(에리쓰로마이신 내성). CDS, 코딩 서열.
도 7: 야생형 균주 및 획득된 형질전환체에서 cas9에 의해 표적화된 구역의 서열분석. NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 22는 도 7에 표시된 NC_003030 단편에 상응하고 SEQ ID NO: 23은 각각 "upp_중지 복구 주형", "ATCC824" 및 "ATCC824 upp-"로서 식별되는 서열의 도 7에 표시된 단편에 상응한다.
도 8: 증폭 결과.
A: catP_fwd x catP_rev(예상 크기: 709 bp)
B: RH_ctfB_R x V-CTFA-CAC2707_R(예상 크기: 351 bp)
1: 2-로그 마커(NEB). 2: H₂0, 음성 대조군. 3: 비형질전환 ATCC824. 4: pEC500E-miniPthl-cas9로 형질전환된 ATCC824. 5 & 6: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824(2종의 독립된 형질전환체). 7 & 8: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 9: ATCC824로부터 유래된 균주의 α-아밀라제 활성의 검출. 1: ATCC824; 2: pEC500E 및 pEC750C로 형질전환된 ATCC824; 3: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824; 4: pEC500E 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824; 5: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824.
도 10: 야생형 균주 및 형질전환체의 발효 결과(2종의 기술적 복제물).
도 11: A/B. cas9을 위한 유도성 발현 플라스미드. repH, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. ermB, 메틸라제(에리쓰로마이신 내성). tetR, 전사 억제인자 TetR을 코딩하는 유전자. CDS, 코딩 서열.
도 12: 프로모터 Pcm-2tetO1 및 Pcm-tetO2/1로부터 출발하는 발현에 대한 유도의 효과. 상기 프로모터들은 gusA 유전자의 하류에 위치시켰고, GusA 활성은 100 ng/mL의 aTc의 부재 또는 존재 하에, 씨. 아세토부틸리컴 ATCC824 세포에서 측정하였다. 문헌 [Dong et al., 2012]을 변형시킴.
도 13: pEC750C-gRNA_upp를 함유하는 형질전환체의 생존능에 대한 aTc 농도의 효과.
도 14: 5-FU-낸성 돌연변이체의 생성. 액체 배양액의 연속 희석물을 다양한 배지 상에 침적시켰다. 상동성 재조합 사건이 복구 주형의 삽입을 가능하게 한 형질전환체만이 2YTG + 5-FU 상에서 성장할 수 있었다. 백색 화살표는 후속되는 실험에 선택된 콜로니를 나타낸다. ND, 희석하지 않음.
도 15: upp_del 형질전환체의 PCR 분석.
A. upp 유전자 주변의 유전자 구성. 코딩 서열은 화살표로 나타낸다. 회색 직사각형은 upp_del 주형에서 부재하는 영역을 나타낸다. 사용된 프라이머는 삼각형으로 표시한다. CDS, 코딩 서열. PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함.
B. 증폭 결과. M: 2-로그 마커(NEB). 1: H₂0, 음성 대조군. 2: 비형질전환된 ATCC824.
3: aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824. 4 & 5: 2YTG+5-FU 상에서 단리된, aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 16: 2YTG+5-FU 상에서 단리된 콜로니에서 cas9-표적화 구역의 서열분석.
NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 24는 도 16에 표시된 ATCC824 균주의 게놈 서열의 단편에 상응하고 SEQ ID NO: 25는 각각 "upp_중지 주형", "클론 pFW0001-Pcm-2tetO1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지2"로서 식별되는 서열의 도 16에 표시된 단편에 상응한다.
도 17: pEC750C-gRNA_upp-Δupp::ipa8 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. 아세틸트랜스퍼라제(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열. RHA/LHA: upp 유전자의 측접 서열(ca_c2879).
도 18: 프라이머 CA_C2877 및 CA_C2882를 사용한 증폭 결과. M, 2-로그 크기 마커(NEB). P, pEC750C-gRNA_upp-Δupp::ipa8; WT, ATCC 824.
도 19: ATCC 824 및 돌연변이체 upp_del 및 Δupp::ipa8에 의한 용매의 생성. 오차 막대는 이중으로 수행된 실험의 표준 편차를 나타낸다. upp_del 및 Δupp::ipa8에 대해 획득된 데이터는 각 경우에서 2종의 생물학적으로 독립적인 돌연변이체에 대해 획득된 평균이다.
도 20: 엔도글루카나제 CelA(pWUR3) CelD(pWUR 4)를 발현하는 다양한 균주 및 빈 플라스미드를 발현하는 대조군 균주의 한천 상에서의 엔도글루카나제 활성 측정. 이들 다양한 균주는 0.2% CMC를 함유하는 페트리 디쉬 상에서 48시간 동안 인큐베이션하였다. 콩고 레드 염색으로 가시화시킨 가수분해 후광(halo)은 각 균주의 엔도글루카나제 활성을 특징짓는다. 대조군 균주 상에서는 후광을 검출할 수 없는 한편, 엔도글루카나제 CelA 또는 CelD를 발현하는 균주에서는 분명하게 볼 수 있다.
도 21: pSEC500E_X_Cas9 플라스미드. pAMB1, 씨. 베이제린키의 복제 기원; PxylB, xylB 프로모터; ColE1 기원, 대장균의 복제 기원; AmpR, 암피실린 내성 유전자; PermB, ermB 유전자 프로모터; ermB, 에리쓰로마이신 내성 유전자; 2 마이크론 ori, 효모의 복제 기원; URA3, 영양요구성 마커.
도 22: pS_celAS1 플라스미드. HS1 및 HS2, 상동성 서열; aad9, 스펙티노마이신 내성 유전자; pCB102, 씨. 베이제린키의 복제 기원; ColE1 기원, 대장균에서의 복제 기원. PeglA, eglA 유전자 프로모터.
도 23: 증가되는 농도의 자일로스를 함유하는 CGM 한천 배지 상에서의 씨. 베이제린키 NCIMB8052의 재조합 균주 (pEC500E_Xcas9, pS_celAS1)의 선택.
도 24: celA 유전자가 통합된 NCIMB8052 균주 및 NCIMB8052 균주의 PCR에 의한 확인. M, GeneRuler 1kb DNA 래더(ThermoFisher).

실시예

본 발명자들은 다음의 2종의 표적에 대해서 본 명세서에서 개시하고 청구한 유전자 도구를 시험하였다: upp 및 adhE 유전자.

upp 유전자의 불활성화

선택된 제1 표적은 간단한 스크리닝을 통해서, 디자인된 유전자 변형 기술을 검증할 수 있게 한다. upp 유전자는 우라실 포스포리보실트랜스퍼라제를 코딩한다. 이 효소는 우라실로부터 우라실 모노포스페이트(UMP)를 형성할 뿐만 아니라, 또한 5-플루오로우라실(5-FU)로부터 5-플루오로우라실 모노포스페이트(5-FUMP)를 형성한다. 5-FUMP는 RNA 합성을 차단하는 세포에 유해한 화합물이다. 결과적으로, 이의 게놈에 upp 유전자를 함유하는 박테리아는 이 유전자를 발현하지 않는 균주와 대조적으로, 5-FU를 함유하는 배지 상에서 성장할 수 없을 것이다.

이 유전자의 표적화는 간단한 표현형 관찰에 의해, 변형 전략이 유효한지 여부를 간단하고 신속하게 결정할 수 있게 한다. upp를 표적으로 하는 3종의 플라스미드를 구축하였다(도 4 + SEQ ID NO: 9, 10 및 11 참조). 이들 3종 모두는 유전자를 표적으로 하는 동일한 gRNA를 함유하고, 이들 중 2종은 또한 결실 또는 점 돌연변이를 생성시키는 도구의 능력을 보여주기 위해 상이한 복구 주형을 함유한다:

● upp_del 주형(SEQ ID NO: 12)은 gRNA에 의해 결정되는 파괴 부위의 각 측면으로부터 150-nt에 위치된 2개의 500-뉴클레오티드(nt) 단편을 함유한다. 파괴를 복구하기 위한 이 주형의 사용은 upp 유전자의 코딩 서열 내에서 300-nt 결실을 야기하여, 후자가 이후에 불활성 단백질을 코딩하게 될 것이다.

● upp_중지 주형(SEQ ID NO: 13)은 Cas9이 불완전하고 불활성인 단백질을 코딩할 유전자를 더이상 표적으로 할 수 없는 방식으로 넌센스 돌연변이(중지 코돈으로의 아미노산을 코딩하는 코돈의 치환을 유도)의 존재에 의해 gRNA 인식 부위에서 변형되는, 파괴 부위의 각 측면 상에 위치된 2개의 650-nt 단편을 함유한다.

pSOL 플라스미드의 상실

선택된 제2 표적은 발효 과정에서 관심 대상이다: 용매형성에 관여하는 유전자 세트, 특히 adhE는 pSOL 메가플라스미드 상에 위치하고, 이의 상실이 아세톤 및 부탄올의 생성을 제거하는 것으로 확인되었다. pSOL 표적화 플라스미드를 사용하는 이들 발효 경로의 제거 후(도 5 참조), 게놈에 직접적으로 관심 유전자를 재도입시키는 것이 가능하다. pSOL을 더이상 함유하지 않는 균주를 획득하기 위해서, adhE를 표적화하기 위한 플라스미드를 구축하였다. 발명자들은 pSOL이 세포에 필수적인 기능을 함유하지 않아, 세포가 이의 존재 없이 생존할 수 있게 된다는 것을 보여주었다.

씨. 아세토부틸리컴 ATCC824에서 cas9 의 항상성 발현

선택된 전략은 2종의 플라스미드의 부수적인 사용을 필요로 한다:

- pEC500E 플라스미드로부터 유래된, 뉴클레아제의 항상성 발현을 위한 벡터:

pEC500E-miniPthl-Cas9 (도 6 + SEQ ID NO: 5 참조);

- pEC750C로부터 유래된, 뉴클레아제 파괴 부위를 결정하고 임의로는 파괴의 복구를 가능하게 하는, 표적화 벡터 중 하나:

● pEC750C-gRNA_upp (SEQ ID NO: 9), upp를 표적으로 하는 gRNA 함유;

● pEC750C-gRNA_upp-upp_del (SEQ ID NO: 10), upp를 표적으로 하는 gRNA 및 upp_del 주형 함유;

● pEC750C-gRNA_upp-upp_중지 (SEQ ID NO: 11), upp를 표적으로 하는 gRNA 및 upp_중지 주형 함유;

● pEC750C-gRNA_adhE (SEQ ID NO: 8), adhE를 표적으로 하는 gRNA 함유.

pEC500E-miniPthl-Cas9 발현 벡터 뿐만 아니라, 빈 벡터에 상응하는 대조군 플라스미드(pEC500E)를 ATCC824 균주에 도입시켰다. 그런 다음, 획득된 2종의 균주를 대조군으로 사용한, pEC750C 벡터로부터 유래된, 표적화 벡터로 형질전환시켰다. 이 제2 형질전환 단계의 결과를 하기 표 1에 표시하였다.

표 1: 형질전환 결과. ++, 획득된 수많은 형질전환체(형질전환 당 10² 내지 10³ 콜로니를 획득함); -, 형질전환체 미획득.

획득된 형질전환 결과는 Cas9이 기능성임을 나타내었다. 실제로, 뉴클레아제가 발현되고 upp 유전자가 gRNA에 의해 표적화되는 경우, 게놈 DNA에 야기된 파괴 및 복구 주형의 부재에서 게놈의 복구를 수행하는 박테리아의 불능(pEC500E-miniPthl-cas9 및 pEC750C-gRNA_upp로 형질전환)으로 인해 형질전환체가 획득되지 않았다.

upp 의 표적화

표적화 벡터가 pEC500E를 함유하는 균주에 도입되는 경우 획득된 결과는, 형질전환체가 각각의 표적화 벡터로 획득되었으므로, ATCC824 균주의 게놈이 cas9 상동체를 함유하지 않는다는 것을 보여준다.

pEC500E-miniPthl-cas9 및 pEC750C-gRNA_upp-upp_중지를 함유하는 형질전환체를 이후에 수회 비선택적 배지 상에 재플레이팅하여, 함유하고 있는 플라스미드가 상실되게 하였다. 콜로니가 그들 플라스미드를 소거하여 항생제에 민감해 지면, upp 유전자(SEQ ID NO: 3)를 서열분석하였다(도 7 참조).

원하는 변형이 실제로 존재하였다. 따라서 2종의 플라스미드의 도입 및 강력한 항상성 프로모터에 의한 cas9 유전자의 발현을 포함하는 CRISPR-Cas9 유전자 도구는 실제로 기능성이다.

adhE 의 표적화

pEC500E-miniPthl-cas9 및 pEC750C_gRNA_adhE 플라스미드로의 야생형 균주 형질전환 동안 형질전환체가 획득되었다. cas9가 활성이므로, 이 결과는 pSOL 메가플라스미드의 파괴가 ATCC824의 생존능에 영향을 미치지 않는다는 것을 나타낸다.

pSOL의 가능한 상실을 확증하기 위해, 다양한 시험을 수행하였다:

- pSOL 상에 존재하는 유전자: ctfB 의 PCR 검출

catP_fwd x catP_rev를 사용하는 PCR은 pEC750C 플라스미드 상에 존재하는, 티암페니콜 내성 유전자의 검출을 가능하게 한다. 이의 검출은 표적화 벡터가 존재한다는 것을 확증시켜준다.

RH_ctfB_R x V-CTFA-CAC2707_R을 사용하는 PCR은 pSOL 메가플라스미드 상에 존재하는 ctfB 유전자의 일부분의 검출을 가능하게 하고, 후자가 세포에 존재하는지 여부를 알 수 있게 한다.

증폭은 pSOL 메가플라스미드가 pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE 로 형질전환된 클론에 더이상 존재하지 않는다는 것을 나타내는 것으로 보인다(도 8 참조).

- pSOL 상에 존재하는 유전자에 의해 코딩되는 효소 활성의 검출

pSOL 메가플라스미드에 함유된 유전자 중에서, amyP는 α-아밀라제 활성을 갖는 세포외 효소를 코딩한다. 이 활성은 전분 및 포도당을 함유하는 고형 배지 상에서 검출할 수 있다(Sabathe et al., 2002). 액체 배양액의 희석물을 0.2% 포도당 및 2% 전분을 함유하는 한천 플레이트 상에 침적시키고 72시간 동안 37℃에서 인큐베이션하였다. 그런 다음, α-아밀라제 활성을 요오드 염색에 의해 가시화시켰다. 박테리아 콜로니 주변의 투명한 후광은 α-아밀라제 활성의 존재를 나타낸다. pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE를 함유하는 ATCC824 주변의 활성 부재는 amyP 유전자가 이 균주에서 발현되지 않는다는 것을 나타내어, 메가플라스미드가 더이상 존재하지 않는다는 것을 확증시켜준다(도 9 참조).

- 발효 결과

2종의 균주의 발효 결과를 확립하기 위해 게이프스(Gapes) 배지에서 24시간 동안 ATCC824 야생형 균주 및 형질전환체를 성장시켰다. 획득된 발효 결과는, 형질전환체에서 adhE, adhE1 및 adc 유전자(pSOL 메가플라스미드 상에 존재)의 부재로 인한 에탄올 생성의 감소 및 부탄올 및 아세테이트 생성의 제거를 보여준다(도 10 참조).

따라서 Cas9는 ATCC824 균주의 천연 플라스미드 또는 염색체 상에서 작용할 수 있어, 균주에 존재하는 염색체 및 임의의 염색체외 유전자 물질(플라스미드, 박테리오파지 등)로 이의 작용을 넓히는 것이 가능하다.

씨. 아세토부틸리컴 ATCC824에서 cas9 의 유도성 발현

게놈과 복구 주형 간의 상동성 재조합 사건을 가능하게 하기 위해, 뉴클레아제가 활성인 세포의 수를 증가시키는 것이 필요하다(pEC500E-miniPthl-cas9을 함유하는 ATCC824 균주를 표적화 벡터로 형질전환시켰을 때 10³ 까지). 이를 위해서, 뉴클레아제 발현이 제어되는 시스템이 필요하다. pFW0001 벡터로부터 유래된, cas9 유전자가 언히드로테트라사이클린-유도성 프로모터의 제어 하에 위치하는 2개 벡터를 구축하였다:

● pFW0001-Pcm-2tetO1-cas9 (도 11A + SEQ ID NO: 6 참조);

● pFW0001-Pcm-tetO2/1-cas9 (도 11B + SEQ ID NO: 7 참조);

cas9 발현을 제어하는 프로모터는 전사 억제인자 TetR이 결합하는 오퍼레이터 서열, tetO1 및 tetO2를 함유한다. 이 억제는 언히드로테트라사이클린(aTc)의 존재에 의해 풀어진다. 이 시스템은 적은 누수로 제어된 방출을 가능케 한다. aTc의 존재 하에, 합성은 프로모터 Pcm-2tetO1로부터 출발하여 더 높아진다(도 12 참조).

씨. 아세토부틸리컴 ATCC824의 형질전환:

발현 벡터 및 빈 벡터(pFW0001)를 ATCC824에 도입시켰다. 이후에, 하기 플라스미드를 각 유형의 형질전환체에 도입시켰다(표 2 참조):

● pEC750C-gRNA_upp, upp를 표적으로 하는 gRNA 함유;

● pEC750C-gRNA_upp-upp_del, upp를 표적으로 하는 gRNA 및 upp_del 주형 함유;

● pEC750C-gRNA_upp-upp_중지, upp를 표적으로 하는 gRNA 및 upp_중지 주형 함유;

형질전환된 콜로니는 상이하게 희석하여, 다양한 고형 배지 상에 스트리킹하였다:

● 2YTG + 에리쓰로마이신 (세포 생존능 확인을 위함, 10⁶의 희석 배수);

● 2YTG + 에리쓰로마이신 + 티암페니콜 (형질전환체의 선택을 위함);

● 2YTG + 에리쓰로마이신 + 티암페니콜 + aTc(200 ng/mL) (유도인자 존재 하 형질전환체의 선택을 위함).

표 2: 각각의 형질전환을 위한 각 유형의 배지에서 획득한 콜로니 수.

ery, 에리쓰로마이신. thiam, 티암페니콜. aTc, 언히드로테트라사이클린. 괄호 안, 희석 배수. ND, 희석하지 않음. -, 시험하지 않음.

빈 표적화 벡터(pEC750C, 대조군)가 사용된 경우에도, 존재하는 경우에 소수의 형질전환체가 획득되었으므로, aTc의 독성 효과가 관찰되었다. 예상한 바와 같이, gRNA_upp 카세트를 함유하는 pEC750C가 aTc 함유 배지 상에서 cas9을 발현하는 세포에 도입되었을 때 형질전환체가 획득되지 않았다. 다른 한편으로, aTc가 없는 배지 상에서 각 플라스미드 조합에 대해 많은 형질전환체가 획득되었는데, 이는 cas9이 발현되지 않음을 나타낸다.

aTc의 존재 하에서의 Cas9 발현:

에리쓰로마이신 및 티암페니콜을 함유하는 플레이트 상에서 획득된 다양한 변이체를 동일한 유형의 배지 상에 재플레이팅한 후, 항생제 둘 모두를 함유하는 액체 사전배양물을 접종하는데 사용하였다. 그런 다음, 이들 사전배양물을 시스템이 기능성인지 여부를 결정하기 위해 다양한 농도의 aTc를 함유하는 다른 액체 배양물을 접종하는데 사용하였다.

cas9의 유도:

3종의 형질전환체를 aTc의 존재 하에 cas9 발현을 유도하는 능력을 분석하는데 사용하였다:

pFW0001 및 pEC750C-gRNA_upp를 함유하는 ATCC824;

pFW0001-Pcm-2tetO1-cas9 및 pEC750C-gRNA_upp를 함유하는 ATCC824;

pFW0001-Pcm-tetO2/1-cas9 및 pEC750C-gRNA_upp를 함유하는 ATCC824

에리쓰로마이신, 티암페니콜 및 상승 농도의 aTc를 함유하는 액체 배지를 이들 형질전환체의 액체 사전배양물로부터 접종하였다(도 13 참조). 성장하는 세포의 능력은 72시간의 배양 후 광학 밀도의 측정을 통해 평가하였다.

뉴클레아제를 발현하지 않는 형질전환체는 aTc의 존재에 의해 약간의 영향을 받거나 또는 전혀 영향받지 않았다. 한편, 낮은 aTc 농도에서도, 프로모터 Pcm-2tetO1를 통해 cas9를 발현하는 플라스미드(pFW0001-Pcm-2tetO1-cas9) 및 오직 gRNA만을 함유하는 플라스미드(pEC750C-gRNA_upp)를 함유하는 형질전환체는 상당한 성장 지연을 나타냈다. 프로모터 Pcm-tetO2/1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-tetO2/1-cas9) 및 gRNA 만을 함유하는 플라스미드(pEC750C-gRNA_upp)를 함유하는 형질전환체는 낮은 aTc 농도에서 영향받지 않았다.

그러나, 150 ng/mL에서 출발하여, 강력한 성장 지연이 관찰되었고, 300 ng/mL에서 성장이 관찰되지 않았다. 따라서, 프로모터 Pcm-tetO2/1은 유도인자 부재 하에서 Pcm-2tetO1 보다 더 양호한 발현 억제를 가능하게 하는 것으로 보인다.

돌연변이체의 생성

이중 가닥 파괴를 복구하기 위한 표적화 플라스미드를 함유하는 형질전환체의 액체 배양물을 aTC의 부재 또는 존재(100 ng/mL) 하에서 제조하였다. 사용된 형질전환체는 표 3에 표시된 12개 플라스미드 조합 중 하나를 함유하였다.

표 3: 형질전환체에 존재하는 플라스미드 조합.

72시간 배양 후, 분취액을 다양한 배지 상에 침적시켰다:

● 티암페니콜 및 에리쓰로마이신을 함유하는 2YTG;

● 티암페니콜, 에리쓰로마이신, 및 100 ng/mL의 aTc를 함유하는 2YTG;

● 5-플루오로우라실을 함유하는 2YTG.

상동성 재조합 사건이 복구 주형의 삽입을 가능하게 하는 형질전환체만이 2YTG + 5-FU 상에서 성장할 수 있었다(도 14 참조).

upp_del 형질전환체의 분석:

2YTG + 5-FU 상에서 단리된 클론을 PCR에 의해 분석하였다(도 15 참조).

catP_fwd x catP_rev를 사용하는 PCR은 pEC750C 플라스미드 상에 존재하는 티암페니콜 내성 유전자의 검출을 가능하게 한다. 이의 검출은 표적화 벡터가 존재함을 확증시켜준다.

LHA_upp_fwd x RHA_upp_rev를 사용하는 PCR은 upp 유전자 뿐만 아니라 측접 영역의 증폭을 가능하게 한다. 하기에 표시된 프라이머를 upp_del 복구 주형의 구축에 사용하였다(도 15 + SEQ ID NO: 14-21 참조):

표 4:

upp_주형_fwd x upp_주형_rev를 사용하는 PCR은 upp_del 복구 주형이 부재하는, upp 유전자의 내부 단편의 증폭을 가능하게 한다.

획득된 결과는 분석된 형질전환체의 upp 유전자 내 결실을 확증시켜주었다.

upp_중지 돌연변이체의 분석:

upp 유전자를, aTc에 노출 후 2YTG+5-FU 상에서 단리된 3종의 클론에서 서열분석하였다(도 16 참조):

● 프로모터 Pcm-2tetO1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-2tetO1-cas9) 및 gRAN 뿐만 아니라 upp_중지 복구 주형을 함유하는 플라스미드(pEC750CgRNA_upp-upp_중지)를 함유하는 첫번째;

● 프로모터 Pcm-tetO2/1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-tetO2/1-cas9) 및 gRNA 뿐만 아니라 upp_중지 복구 주형을 함유하는 플라스미드(pEC750CgRNA_upp-upp_중지)를 함유하는 두번째.

따라서 제2 플라스미드에 존재하는 gRNA 및 유도성 프로모터의 제어 하의 cas9 유전자의 사용에 의해 유전자 변형 시스템을 개발하고자 하는 전략은 기능적이다. 항상성 프로모터 miniPthl의 사용과 비교하여, cas9 유전자의 유도는 효소의 작용을 제어하고 원하는 변형을 거친 형질전환체의 선택을 촉진시킬 수 있다.

오페론 ipa8로의 upp 유전자의 치환

만들어진 변형은, thl 유전자의 항상성 프로모터의 제어 하에 ATCC 824 균주의 adc, ctfA, ctfB 유전자(생성된 산의 재동화 및 아세톤의 형성을 가능하게 함) 및 씨. 베이제린키 DSM6423 유래의 adh 유전자(이소프로판올로의 아세톤의 전환을 가능하게 함)를 함유하는 오페론 ipa8의 씨. 아세토부틸리컴 ATCC 824 게놈 내로의 삽입으로 이루어진다. 이러한 3614-bp 오페론이 upp 유전자 대신 삽입된다.

upp 유전자의 각 측면 상에 위치된 1-kb 서열이 측접된 오페론으로 구성된 복구 주형을 pEC750-gRNA_upp 플라스미드에 삽입하여, pEC750C-gRNA_upp-Δ upp::ipa8 플라스미드를 획득하였다(도 17 및 SEQ ID NO: 26 참조).

이 플라스미드를 pFW0001-Pcm-tetO2/1-cas9 플라스미드를 함유하는 컴피턴트 ATCC 824 세포에 도입시켰다. cas9 발현의 유도는 티암페니콜, 에리쓰로마이신, 및 유도인자 aTc를 함유하는 2YTG 배지 상에서 수행하였다.

획득된 콜로니는 ATCC824 균주에서 2720-bp 생성물의 증폭을 가능하게 하는 프라이머 쌍 CA_C2877 및 CA_C2882를 사용하여 PCR에 의해 분석하였다:

CA_C2877: 5'-CTTTTTAAAAAAGTTAAATAAGGAAGG-3' (SEQ ID NO: 27);

CA_C2882: 5'-GTTTAACTTAAGTTACAGAAAAGCTAGG-3' (SEQ ID NO: 28)

유도 후 획득된 4종의 독립 콜로니 및 다양한 대조군에 대해 수행된 PCR 검정의 결과는 ipa8 오페론으로의 upp 유전자의 치환을 확증시켜주었다(도 18).

획득된 돌연변이체 뿐만 아니라, WT 균주 및 Δupp 돌연변이체(대조군으로서 사용)에 대해서 72시간 동안 34℃ 및 150 rpm에서 게이프스 배지(Gapes et al., 1996) 중에서 발효를 수행하였다. 발효 상청액은 내부 표준물로서 0.5 g/L 프로판올 용액을 사용하여 HPLC를 통해 분석하였다. 탄수화물 농도는 굴절률 검출기(Varian 350 RI)가 장착된 Aminex®HXP-87P 컬럼(Biorad, 300 mm × 7.8 mm) 상에서 정량하였다. 컬럼 온도는 80℃였고 용리액은 0.4 mL/분의 유속의 황산으로 이루어졌다(Spectra System RI 150).

획득된 결과는 Δupp::ipa8 돌연변이체가 WT 균주 또는 Δupp 돌연변이체와 대조적으로 아세톤을 이소프로판올로 환원시킬 수 있다는 것을 보여주었다(도 19).

클로스트리듐 베이제린키 NCIMB8052의 게놈 내로의 celA 유전자의 삽입

만들어진 변형은, 클로스트리듐 사카로부틸리컴 NCP262 유래의 eglA 프로모터의 제어 하에 네오칼리마스틱스 파트리시아럼(Neocallimastix patriciarum) 유래의 celA 유전자의 씨. 베이제린키 NCIMB8052 게놈 내로의 삽입으로 이루어진다. 이 유전자는 CMC(카복시메틸 셀룰로스)라고 불리는, 셀룰로스 기질을 분해할 수 있는 효소를 코딩한다. 1667 bp 크기의 유전자 및 이의 프로모터를 hbd 유전자 이후에 삽입시켰고, 이 균주가 CMC를 분해할 수 있게 된다(도 20, Lopez-Contreras et al., 2001).

이러한 삽입을 수행하기 위해, 2종의 플라스미드를 사용하였다:

- pEC500E_X_cas9 플라스미드: 클로스트리듐 디피실 630 유래의 xylB 유도성 프로모터의 제어 하에서 cas9 유전자를 발현함(Nariya et al., 2011)(도 21 및 SEQ ID NO: 29 참조).

- xylB 프로모터의 제어 하에서 가이드 RNA를 발현하고 씨. 베이제린키 NCIMB8052 유래의 hbd 유전자를 표적으로 하는 pS_XR_celAS1 플라스미드. 이 플라스미드는 또한 가이드 RNA가 표적으로 하는 영역의 각 측면에 위치하는 1001 및 1017개 염기쌍의 2개 상동성 영역이 측접된, egl2 프로모터의 제어 하의 celA 유전자로 이루어진 복구 주형을 함유한다(도 22 및 SEQ ID NO: 30 참조).

이들 2종의 플라스미드를 순차적으로 NCIMB8052에 도입시켰다. cas9 발현의 유도는 스펙티노마이신 및 에리쓰로마이신 뿐만 아니라 상승 농도의 자일로스 유도인자를 함유하는 CGM(6.25 g/L 효모 추출물; 0.5 g/L MgSO₄·7H₂O; 0.95 g/L KH₂HPO₄; 0.95 g/L K₂HPO₄; 0.013 g/L MnSO₄·7H₂O; 0.013 g/L FeSO₄·7H₂O; 1.25 g/L NaCl; 2.5 g/L (NH₄)₂SO₄; 2.5 g/L 아스파라긴) 상에서 수행하였다(도 24).

6% 자일로스를 함유하는 CGM 상에서 유도 후 획득된 콜로니는 NCIMB8052 균주에서 2070-염기쌍 생성물 및 celA 유전자를 통합한 경우 3718-염기쌍 생성물의 증폭을 가능하게 하는 프라이머 쌍 Cbei_325_F 및 Cbei_325_R을 사용하여 PCR에 의해 분석하였다:

Cbei_325_F (celA) 5' - AGATAATTATGAAGTTAATCCTTAG - 3'(SEQ ID NO: 31)

Cbei_326_R (celA) 5' - CATTTGCTTTCAGGTCTTCTTTTGCTG - 3'(SEQ ID NO: 32)

대조군 균주 및 유도 후 획득된 독립 콜로니에 대해 수행된 PCR 검정의 결과는, NCIMB8052 내로의 celA 유전자의 삽입을 확증시켜주었다(도 25).

참조문헌

- Al-Hinai, M. A. et al. Novel system for efficient isolation of Clostridium double-crossover allelic exchange mutants enabling markerless chromosomal gene deletions and DNA integration. Appl . Environ Microbiol . 2012. 78(22): 8112-21.

- Ran, F. A. et al. Genome engineering using the CRISPR-Cas9 system. Nature protocols. 2013. 8(11): 2281-308.

- Barrangou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science. 2007, 315(5819): 1709-12.

- Banerjee, A. et al. Lactose-inducible system for metabolic engineering of Clostridium ljungdahlii, Appl. Environ. Microbiol. 2014.80(8): 2410-6.

- Cartman, S. T. et al. Precise manipulation of the Clostridium difficile chromosome reveals a lack of association between the tcdC genotype and toxin production. Appl. Environ. Microbiol. 2012. 78(13): 4683-90.

- Currie, D.H. et al. Functional heterologous expression of an engineered full length CipA from Clostridium thermocellum in Thermoanaerobacterium saccharolyticum, Biotechnol. Biofuels. 2013. 6(1): 32.

- DiCarlo, J. E. et al. Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Res. 2013, 41(7): 4336-43

- Dong, H. et al. Development of an anhydrotetracycline-inducible gene expression system for solvent-producing Clostridium acetobutylicum: A useful tool for strain engineering. Metab. Eng. 2012. 14(1): 59-67.

- D'Urzo, N. et al. High-level intracellular expression of heterologous proteins in Brevibacillus choshinensis SP3 under the control of a xylose inducible promoter. Microb. Cell Fact. 2013. 12: 12

- Egholm, M. et al. Peptide nucleic acids (PNA). Oligonucleotide analogs with an achiral peptide backbone. J. Am. Chem. Soc. 1992. 114(5): 1895-7.

- Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids res. 2013, 42(4): 2577-90.

- Gapes, J. R., Nimcevic, D., & Friedl, A. (1996). Long-Term Continuous Cultivation of Clostridium beijerinckii in a Two-Stage Chemostat with On-Line Solvent Removal. Applied and environmental microbiology, 62(9), 3210-3219.

- Hartman, A.H. et al. Construction and characterization of a lactose-inducible promoter system for controlled gene expression in Clostridium perfringens. Appl. Environ. Microbiol. 77(2): 471-8

- Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 2012. 337(6096): 816-21.

- Lee, J. et al. Metabolic engineering of Clostridium acetobutylicum ATCC 824 for isopropanol-butanol-ethanol fermentation. Appl. Environ. Microbiol; 2012. 78(5): 1416-23.

- Lopez-Contreras AM, Smidt H, van der Oost J, Claassen PAM, Mooibroek H, de Vos WM. 2001. Clostridium beijerinckii Cells Expressing Neocallismatix patriciarum Glycoside Hydrolases Show Enhanced Lichenan Utilization and Solvent Production. Appl Environ Microbiol 67:5127-5133.

- Lutke-Eversloh, T. Application of new metabolic engineering tools for Clostridium acetobutylicum. Appl. Microbiol. Biotechnol. 2014. 98(13): 5823-37.

- Mali, P. et al. Cas9 as a versatile tool for engineering biology. Nat. methods. 2013, 10(10): 957-63.

- Makarova, K. S., et al. Evolution and classification of the CRISPR-Cas systems. Nat. Rev. Microbiol. 2011, 9(6): 467-77.

- Mearls, E.B. et al. Development of a regulatable plasmid-based gene expression system for Clostridium thermocellum, Appl. Microbiol. Biotechnol. 2015.99(18): 7589-99.

- Nariya, H. et al., Development and characterization of a xylose-inducible gene expression system for Clostridium perfringens, Appl. Environ. Microbiol. 2011.77(23): 8439-41.

- Nariya H, Miyata S, Kuwahara T, Okabe A. 2011. Development and characterization of a xylose-inducible gene expression system for Clostridium perfringens. Appl Environ Microbiol 77:8439-8441.

- Newcomb, M. et al. Co-transcription of the celC gene cluster in Clostridium thermocellum, Appl. Microbiol. Biotechnol. 2011. 90(2): 625-34.

- Wang, Y. et al. Markerless chromosomal gene deletion in Clostridium beijerinckii using CRISPR/Cas9 system. J. Biotechnol.2015. 200: 1-5.

- Xu, T. et al. Efficient genome editing in Clostridium cellulolyticum via CRISPR-Cas9 nickase. Appl. Environ. Microbiol. 2015 AEM-00873.

- Zhang, N. et al. I-SceI-mediated scarless gene modification via allelic exchange in Clostridium. J. Microbiol. Methods. 2015, 108: 49-60.

- Zhang, J. et al. A novel arabinose-inducible genetic operation system developed for Clostridium cellulolyticum, Biotechnol. Biofuels. 2015.8: 36.

<110> IFP Energies Nouvelles <120> OUTIL GENETIQUE DE TRANSFORMATION DE BACTERIES CLOSTRIDIUM <130> B2115PC00 <150> FR 1559846 <151> 2015-10-16 <160> 32 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 2 <211> 4107 <212> DNA <213> Streptococcus pyogenes <400> 2 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 3 <211> 630 <212> DNA <213> clostridium <400> 3 atgagtaaag ttacacaaat atcacatcca cttatattac acaaattagc atttatgaga 60 gataaaaaaa caggatctaa agattttaga gagatggtag aagaagtagc aatgctaatg 120 gcatatgaag taacaagaga aatgcagctt gaaactgttg aaatagaaac tcctatatgt 180 ataactaaat gtaaaatgtt agcaggaaaa aaggtagcta tagttcctat acttagagca 240 ggacttggaa tggtaaatgg agtattaaaa ttaatacctg ctgctaaggt tggacatata 300 ggattatata gagatgaaaa gacattaaaa cctgtagaat acttctgtaa acttcctcaa 360 gatatagagg aaagagacat aatagtaact gatccaatgc ttgcaactgg tgggtcagca 420 atagatgcaa taacacttct taagaaaaga ggagcaaaat acataagact tatgtgtctt 480 ataggagcac cagaaggtat agcagcagta caagaagcac atccagatgt agatatatac 540 ctcgcatcaa tagatgaaaa gttagatgaa aatggatata tagttcctgg tcttggagat 600 gctggagata gattattcgg tacaaaataa 630 <210> 4 <211> 2589 <212> DNA <213> clostridium <400> 4 atgaaagtca caacagtaaa ggaattagat gaaaaactca aggtaattaa agaagctcaa 60 aaaaaattct cttgttactc gcaagaaatg gttgatgaaa tctttagaaa tgcagcaatg 120 gcagcaatcg acgcaaggat agagctagca aaagcagctg ttttggaaac cggtatgggc 180 ttagttgaag acaaggttat aaaaaatcat tttgcaggcg aatacatcta taacaaatat 240 aaggatgaaa aaacctgcgg tataattgaa cgaaatgaac cctacggaat tacaaaaata 300 gcagaaccta taggagttgt agctgctata atccctgtaa caaaccccac atcaacaaca 360 atatttaaat ccttaatatc ccttaaaact agaaatggaa ttttcttttc gcctcaccca 420 agggcaaaaa aatccacaat actagcagct aaaacaatac ttgatgcagc cgttaagagt 480 ggtgccccgg aaaatataat aggttggata gatgaacctt caattgaact aactcaatat 540 ttaatgcaaa aagcagatat aacccttgca actggtggtc cctcactagt taaatctgct 600 tattcttccg gaaaaccagc aataggtgtt ggtccgggta acaccccagt aataattgat 660 gaatctgctc atataaaaat ggcagtaagt tcaattatat tatccaaaac ctatgataat 720 ggtgttatat gtgcttctga acaatctgta atagtcttaa aatccatata taacaaggta 780 aaagatgagt tccaagaaag aggagcttat ataataaaga aaaacgaatt ggataaagtc 840 cgtgaagtga tttttaaaga tggatccgta aaccctaaaa tagtcggaca gtcagcttat 900 actatagcag ctatggctgg cataaaagta cctaaaacca caagaatatt aataggagaa 960 gttacctcct taggtgaaga agaacctttt gcccacgaaa aactatctcc tgttttggct 1020 atgtatgagg ctgacaattt tgatgatgct ttaaaaaaag cagtaactct aataaactta 1080 ggaggcctcg gccatacctc aggaatatat gcagatgaaa taaaagcacg agataaaata 1140 gatagattta gtagtgccat gaaaaccgta agaacctttg taaatatccc aacctcacaa 1200 ggtgcaagtg gagatctata taattttaga ataccacctt ctttcacgct tggctgcgga 1260 ttttggggag gaaattctgt ttccgagaat gttggtccaa aacatctttt gaatattaaa 1320 accgtagctg aaaggagaga aaacatgctt tggtttagag ttccacataa agtatatttt 1380 aagttcggtt gtcttcaatt tgctttaaaa gatttaaaag atctaaagaa aaaaagagcc 1440 tttatagtta ctgatagtga cccctataat ttaaactatg ttgattcaat aataaaaata 1500 cttgagcacc tagatattga ttttaaagta tttaataagg ttggaagaga agctgatctt 1560 aaaaccataa aaaaagcaac tgaagaaatg tcctccttta tgccagacac tataatagct 1620 ttaggtggta cccctgaaat gagctctgca aagctaatgt gggtactata tgaacatcca 1680 gaagtaaaat ttgaagatct tgcaataaaa tttatggaca taagaaagag aatatatact 1740 ttcccaaaac tcggtaaaaa ggctatgtta gttgcaatta caacttctgc tggttccggt 1800 tctgaggtta ctccttttgc tttagtaact gacaataaca ctggaaataa gtacatgtta 1860 gcagattatg aaatgacacc aaatatggca attgtagatg cagaacttat gatgaaaatg 1920 ccaaagggat taaccgctta ttcaggtata gatgcactag taaatagtat agaagcatac 1980 acatccgtat atgcttcaga atacacaaac ggactagcac tagaggcaat acgattaata 2040 tttaaatatt tgcctgaggc ttacaaaaac ggaagaacca atgaaaaagc aagagagaaa 2100 atggctcacg cttcaactat ggcaggtatg gcatccgcta atgcatttct aggtctatgt 2160 cattccatgg caataaaatt aagttcagaa cacaatattc ctagtggcat tgccaatgca 2220 ttactaatag aagaagtaat aaaatttaac gcagttgata atcctgtaaa acaagcccct 2280 tgcccacaat ataagtatcc aaacaccata tttagatatg ctcgaattgc agattatata 2340 aagcttggag gaaatactga tgaggaaaag gtagatctct taattaacaa aatacatgaa 2400 ctaaaaaaag ctttaaatat accaacttca ataaaggatg caggtgtttt ggaggaaaac 2460 ttctattcct cccttgatag aatatctgaa cttgcactag atgatcaatg cacaggcgct 2520 aatcctagat ttcctcttac aagtgagata aaagaaatgt atataaattg ttttaaaaaa 2580 caaccttaa 2589 <210> 5 <211> 10469 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 5 catggataaa aagtacagta ttggtctaga cataggaact aactctgttg ggtgggctgt 60 tataacagat gaatataaag ttccatcaaa aaaatttaaa gtattaggaa acactgatag 120 acattcaata aaaaaaaact tgataggtgc tttattattc gattcaggag agactgctga 180 agctacacgt ttaaaaagaa cagctagacg tagatataca agaagaaaaa ataggatatg 240 ttatcttcaa gaaattttta gtaatgaaat ggcaaaagtt gatgattcat tctttcacag 300 actagaagaa agtttcttag ttgaagaaga taagaagcat gaaagacacc ctatttttgg 360 taatatcgta gatgaagtag catatcatga gaagtatcca actatctatc atttaagaaa 420 gaaattagtt gattctacag ataaagctga tctgagatta atatatttag ctttagctca 480 tatgattaaa tttagaggac attttttaat agaaggtgat ttaaacccag acaacagcga 540 tgtagataaa ttatttatcc aattagttca aacttataat caattattcg aagagaatcc 600 aattaatgca agtggtgtag acgctaaggc tatattatca gctagattat caaaatctag 660 aagattagaa aatctaatag ctcaacttcc tggagaaaag aaaaatggac tttttgggaa 720 cctaatagct ctctcactcg gactaacacc aaattttaaa agcaattttg atcttgctga 780 agacgcaaag ttacaactat caaaggatac atacgatgat gatttagata atttgttagc 840 tcaaataggt gatcaatatg ctgatttgtt tcttgcagca aaaaacttaa gtgatgcaat 900 tttactatca gatatactta gagtaaatac agaaataaca aaggctcctt tatcagcaag 960 tatgattaaa cgatatgatg agcatcatca agatttaaca ttattaaagg cacttgtaag 1020 acaacaatta ccagaaaaat ataaagaaat tttctttgat caatctaaaa atggatatgc 1080 tggatatata gacggtggag caagtcaaga agagttttat aaatttataa agcctatttt 1140 agaaaaaatg gatggaactg aagaattact tgttaaactt aacagagaag atttacttag 1200 aaaacaaaga acttttgata atggttcaat tcctcaccaa attcatttag gagaattaca 1260 tgctatacta agaagacaag aagattttta tccatttctt aaagataata gagaaaaaat 1320 tgaaaaaatt ttaactttta gaataccata ttatgtagga ccacttgcaa ggggaaattc 1380 aagatttgca tggatgacta gaaaatcaga agaaactata accccgtgga attttgaaga 1440 agtagtagat aaaggagcta gtgctcaatc atttatagaa agaatgacaa attttgataa 1500 gaatcttcct aacgaaaagg ttttgccaaa gcatagcctt ctttatgagt attttacagt 1560 ttataatgag cttactaaag taaaatacgt tacagaagga atgagaaaac cagcattttt 1620 gtctggtgaa caaaagaaag caatagtaga cctattattt aaaacaaata ggaaggttac 1680 cgtaaagcaa cttaaagaag attacttcaa aaaaattgaa tgctttgata gtgttgaaat 1740 atcaggagtt gaagatagat ttaatgcttc acttggtaca tatcacgatc tcttaaaaat 1800 tataaaagat aaggattttt tagataatga agaaaatgaa gatattcttg aagatatagt 1860 attaacattg acactttttg aagatagaga aatgatagaa gaaagattaa aaacatatgc 1920 acatcttttt gatgataagg ttatgaagca acttaaaaga agaagatata caggttgggg 1980 acgtttgtca agaaagctaa ttaatggtat tagagataaa caatcaggaa agactattct 2040 cgattttctt aaatcagatg gatttgctaa tagaaacttt atgcaattaa ttcatgatga 2100 ttctcttact ttcaaagagg atattcaaaa ggctcaagtt tctggacaag gcgatagctt 2160 acacgaacac attgctaacc ttgcagggag ccccgctatc aaaaaaggaa ttttacaaac 2220 agttaaagtt gtagatgaac ttgttaaagt tatgggaaga cacaaacctg agaatatagt 2280 tatagaaatg gccagagaaa atcaaacaac acaaaaagga caaaaaaatt ctagagagag 2340 aatgaagaga attgaagaag gaataaaaga gctaggatca caaatattaa aagaacatcc 2400 agttgaaaat actcaattgc aaaatgaaaa gttatatttg tattacttac aaaatggaag 2460 agatatgtat gttgatcaag aactcgatat taatagatta agtgactatg atgttgatca 2520 tattgttcct caatcatttt taaaagatga ttcaatcgat aacaaagtat taactagatc 2580 agataaaaat agaggaaagt cagataatgt accatctgaa gaagttgtta aaaaaatgaa 2640 gaactattgg agacaacttt taaatgcaaa gctaattaca caaagaaaat ttgacaattt 2700 aacaaaagca gaaagaggag gattaagcga attagacaaa gctggattta taaaaagaca 2760 acttgttgag acaagacaaa taactaagca tgttgctcaa atacttgatt caagaatgaa 2820 tacaaaatat gatgaaaatg ataaattaat cagagaagta aaagtaataa cattaaagtc 2880 aaaattagta tcagatttca gaaaggattt tcaattttac aaagttcgtg aaataaataa 2940 ctatcatcat gctcatgatg catacttaaa tgctgttgta ggaactgctc ttattaagaa 3000 atatcctaaa ctagaaagcg aatttgttta tggagattat aaagtttatg atgtgcgcaa 3060 aatgatcgcg aaatccgaac aagaaatcgg taaggctaca gcaaaatatt tcttttatag 3120 taatataatg aattttttta agacagaaat aactttggct aatggtgaaa tcagaaaaag 3180 accacttatc gaaacaaatg gagagacagg agaaatagta tgggataaag gaagagattt 3240 tgctactgtt agaaaagtac taagtatgcc acaagtaaat atcgtaaaga aaactgaagt 3300 tcaaactgga ggtttctcta aggaatcaat tttacctaag agaaattcag ataagttaat 3360 tgcaaggaaa aaagattggg acccaaaaaa atacggtggt tttgatagtc caacagttgc 3420 ctatagtgtt cttgtagtag cgaaagttga gaaaggtaag tcaaaaaagt tgaaaagcgt 3480 aaaagaactt cttggtatca caattatgga aagatcttca tttgaaaaaa atccaattga 3540 ctttttagaa gctaagggtt ataaagaagt taaaaaggat ttaatcataa aactaccaaa 3600 gtatagtcta tttgaactcg aaaacggaag aaaacgaatg ctcgctagcg caggagaact 3660 tcaaaaagga aatgaacttg cgctgccatc aaagtatgta aatttcttat atttagcttc 3720 tcattatgag aaattaaaag gatcaccaga ggataatgaa caaaagcaac tatttgtaga 3780 acaacacaaa cattatttag atgaaataat agaacaaata tctgaatttt ctaaaagagt 3840 tatacttgcc gacgcaaatc tagataaggt gctttcagcg tataataaac acagagataa 3900 accaataaga gaacaagcag aaaacattat ccatcttttt acattaacta atcttggtgc 3960 accagctgca tttaagtact ttgatacaac aatagataga aaaagataca catctactaa 4020 agaagtatta gacgcaactt taatacatca atctattaca gggctttatg aaacaagaat 4080 tgatttaagt caactaggcg gagattaagt cgacaaagta ttgttaaaaa taactctgta 4140 gaattataaa ttagttctac agagttattt tttgacccgg gtaccgagct cgaattcgta 4200 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 4260 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 4320 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 4380 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 4440 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 4500 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 4560 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 4620 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 4680 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 4740 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 4800 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 4860 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 4920 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 4980 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 5040 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 5100 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 5160 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 5220 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 5280 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 5340 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 5400 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 5460 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 5520 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 5580 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 5640 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 5700 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 5760 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 5820 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 5880 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 5940 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 6000 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 6060 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 6120 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 6180 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 6240 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 6300 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 6360 ctgccgggcc tcttgcggga tcaaaagaaa aacgaaatga tacaccaatc agtgcaaaaa 6420 aagatataat gggagataag acggttcgtg ttcgtgctga cttgcaccat atcataaaaa 6480 tcgaaacagc aaagaatggc ggaaacgtaa aagaagttat ggaaataaga cttagaagca 6540 aacttaagag tgtgttgata gtgcagtatc ttaaaatttt gtataatagg aattgaagtt 6600 aaattagatg ctaaaaattt gtaattaaga aggagtgatt acatgaacaa aaatataaaa 6660 tattctcaaa actttttaac gagtgaaaaa gtactcaacc aaataataaa acaattgaat 6720 ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta aagggcattt aacgacgaaa 6780 ctggctaaaa taagtaaaca ggtaacgtct attgaattag acagtcatct attcaactta 6840 tcgtcagaaa aattaaaact gaatactcgt gtcactttaa ttcaccaaga tattctacag 6900 tttcaattcc ctaacaaaca gaggtataaa attgttggga gtattcctta ccatttaagc 6960 acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt ctgacatcta tctgattgtt 7020 gaagaaggat tctacaagcg taccttggat attcaccgaa cactagggtt gctcttgcac 7080 actcaagtct cgattcagca attgcttaag ctgccagcgg aatgctttca tcctaaacca 7140 aaagtaaaca gtgtcttaat aaaacttacc cgccatacca cagatgttcc agataaatat 7200 tggaagctat atacgtactt tgtttcaaaa tgggtcaatc gagaatatcg tcaactgttt 7260 actaaaaatc agtttcatca agcaatgaaa cacgccaaag taaacaattt aagtaccgtt 7320 acttatgagc aagtattgtc tatttttaat agttatctat tatttaacgg gaggaaataa 7380 ttctatgagt ccctaggccc aactaactca acgctagtag tggatttaat cccaaatgag 7440 ccaacagaac cagaaccaga aacagaatca gaacaagtaa cattggattt agaaatggaa 7500 gaagaaaaaa gcaatgactt cgtgtgaata atgcacgaaa tcgttgctta ttttttttta 7560 aaagcggtat actagatata acgaaacaac gaactgaata gaaacgaaaa aagagccatg 7620 acacatttat aaaatgtttg acgacatttt ataaatgcat agcccgataa gattgccaaa 7680 ccaacgctta tcagttagtc agatgaactc ttccctcgta agaagttatt taattaactt 7740 tgtttgaaga cggtatataa ccgtactatc attatatagg gaaatcagag agttttcaag 7800 tatctaagct actgaattta agaattgtta agcaatcaat cggaaatcgt ttgattgctt 7860 tttttgtatt catttataga aggtggagtt tgtatgaatc atgatgaatg taaaacttat 7920 ataaaaaata gtttattgga gataagaaaa ttagcaaata tctatacact agaaacgttt 7980 aagaaagagt tagaaaagag aaatatctac ttagaaacaa aatcagataa gtatttttct 8040 tcggaggggg aagattatat atataagtta atagaaaata acaaaataat ttattcgatt 8100 agtggaaaaa aattgactta taaaggaaaa aaatcttttt caaaacatgc aatattgaaa 8160 cagttgaatg aaaaagcaaa ccaagttaat taaacaacct attttatagg atttatagga 8220 aaggagaaca gctgaatgaa tatccctttt gttgtagaaa ctgtgcttca tgacggcttg 8280 ttaaagtaca aatttaaaaa tagtaaaatt cgctcaatca ctaccaagcc aggtaaaagc 8340 aaaggggcta tttttgcgta tcgctcaaaa tcaagcatga ttggcggtcg tggtgttgtt 8400 ctgacttccg aggaagcgat tcaagaaaat caagatacat ttacacattg gacacccaac 8460 gtttatcgtt atggaacgta tgcagacgaa aaccgttcat acacgaaagg acattctgaa 8520 aacaatttaa gacaaatcaa taccttcttt attgattttg atattcacac ggcaaaagaa 8580 actatttcag caagcgatat tttaacaacc gctattgatt taggttttat gcctactatg 8640 attatcaaat ctgataaagg ttatcaagca tattttgttt tagaaacgcc agtctatgtg 8700 acttcaaaat cagaatttaa atctgtcaaa gcagccaaaa taatttcgca aaatatccga 8760 gaatattttg gaaagtcttt gccagttgat ctaacgtgta atcattttgg tattgctcgc 8820 ataccaagaa cggacaatgt agaatttttt gatcctaatt accgttattc tttcaaagaa 8880 tggcaagatt ggtctttcaa acaaacagat aataagggct ttactcgttc aagtctaacg 8940 gttttaagcg gtacagaagg caaaaaacaa gtagatgaac cctggtttaa tctcttattg 9000 cacgaaacga aattttcagg agaaaagggt ttaatagggc gtaataacgt catgtttacc 9060 ctctctttag cctactttag ttcaggctat tcaatcgaaa cgtgcgaata taatatgttt 9120 gagtttaata atcgattaga tcaaccctta gaagaaaaag aagtaatcaa aattgttaga 9180 agtgcctatt cagaaaacta tcaaggggct aatagggaat acattaccat tctttgcaaa 9240 gcttgggtat caagtgattt aaccagtaaa gatttatttg tccgtcaagg gtggtttaaa 9300 ttcaagaaaa aaagaagcga acgtcaacgt gttcatttgt cagaatggaa agaagattta 9360 atggcttata ttagcgaaaa aagcgatgta tacaagcctt atttagtgac gaccaaaaaa 9420 gagattagag aagtgctagg cattcctgaa cggacattag ataaattgct gaaggtactg 9480 aaggcgaatc aggaaatttt ctttaagatt aaaccaggaa gaaatggtgg cattcaactt 9540 gctagtgtta aatcattgtt gctatcgatc attaaagtaa aaaaagaaga aaaagaaagc 9600 tatataaagg cgctgacaaa ttcttttgac ttagagcata cattcattca agagacttta 9660 aacaagctag cagaacgccc taaaacggac acacaactcg atttgtttag ctatgataca 9720 ggctgaaaat aaaacccgca ctatgccatt acatttatat ctatgatacg tgtttgtttt 9780 ttctttgctg tttagcgaat gattagcaga aatatacaga gtaagatttt aattaattat 9840 tagggggaga aggagagagt agcccgaaaa cttttagttg gcttggactg aacgaagtga 9900 gggaaaggct actaaaacgt cgaggggcag tgagagcgaa gcgaacactt gattttttaa 9960 ttttctatct tttataggtc attagagtat acttatttgt cctataaact atttagcagc 10020 ataatagatt tattgaatag gtcatttaag ttgagcatat tagaggagga aaatcttgga 10080 gaaatatttg aagaacccga ttacatggat tggattagtt cttgtggtta cgtggttttt 10140 aactaaaagt agtgaatttt tgatttttgg tgtgtgtgtc ttgttgttag tatttgctag 10200 tcaaagtgat taaatagaat tctagcgcca ttcgccattc aggctgcgca actgttggga 10260 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 10320 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 10380 cagtgccaag cttgcatgcc tgcaggcctc gagtatattg ataaaaataa taatagtggg 10440 tataattaag ttgttaggag gttagttac 10469 <210> 6 <211> 8876 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 6 tcgagactct atcattgata gagtttgaaa ctctatcatt gatagagtat aatatctttg 60 ttcattagag cgataaactt gaatttgaga gggaacttcc atggataaaa agtacagtat 120 tggtctagac ataggaacta actctgttgg gtgggctgtt ataacagatg aatataaagt 180 tccatcaaaa aaatttaaag tattaggaaa cactgataga cattcaataa aaaaaaactt 240 gataggtgct ttattattcg attcaggaga gactgctgaa gctacacgtt taaaaagaac 300 agctagacgt agatatacaa gaagaaaaaa taggatatgt tatcttcaag aaatttttag 360 taatgaaatg gcaaaagttg atgattcatt ctttcacaga ctagaagaaa gtttcttagt 420 tgaagaagat aagaagcatg aaagacaccc tatttttggt aatatcgtag atgaagtagc 480 atatcatgag aagtatccaa ctatctatca tttaagaaag aaattagttg attctacaga 540 taaagctgat ctgagattaa tatatttagc tttagctcat atgattaaat ttagaggaca 600 ttttttaata gaaggtgatt taaacccaga caacagcgat gtagataaat tatttatcca 660 attagttcaa acttataatc aattattcga agagaatcca attaatgcaa gtggtgtaga 720 cgctaaggct atattatcag ctagattatc aaaatctaga agattagaaa atctaatagc 780 tcaacttcct ggagaaaaga aaaatggact ttttgggaac ctaatagctc tctcactcgg 840 actaacacca aattttaaaa gcaattttga tcttgctgaa gacgcaaagt tacaactatc 900 aaaggataca tacgatgatg atttagataa tttgttagct caaataggtg atcaatatgc 960 tgatttgttt cttgcagcaa aaaacttaag tgatgcaatt ttactatcag atatacttag 1020 agtaaataca gaaataacaa aggctccttt atcagcaagt atgattaaac gatatgatga 1080 gcatcatcaa gatttaacat tattaaaggc acttgtaaga caacaattac cagaaaaata 1140 taaagaaatt ttctttgatc aatctaaaaa tggatatgct ggatatatag acggtggagc 1200 aagtcaagaa gagttttata aatttataaa gcctatttta gaaaaaatgg atggaactga 1260 agaattactt gttaaactta acagagaaga tttacttaga aaacaaagaa cttttgataa 1320 tggttcaatt cctcaccaaa ttcatttagg agaattacat gctatactaa gaagacaaga 1380 agatttttat ccatttctta aagataatag agaaaaaatt gaaaaaattt taacttttag 1440 aataccatat tatgtaggac cacttgcaag gggaaattca agatttgcat ggatgactag 1500 aaaatcagaa gaaactataa ccccgtggaa ttttgaagaa gtagtagata aaggagctag 1560 tgctcaatca tttatagaaa gaatgacaaa ttttgataag aatcttccta acgaaaaggt 1620 tttgccaaag catagccttc tttatgagta ttttacagtt tataatgagc ttactaaagt 1680 aaaatacgtt acagaaggaa tgagaaaacc agcatttttg tctggtgaac aaaagaaagc 1740 aatagtagac ctattattta aaacaaatag gaaggttacc gtaaagcaac ttaaagaaga 1800 ttacttcaaa aaaattgaat gctttgatag tgttgaaata tcaggagttg aagatagatt 1860 taatgcttca cttggtacat atcacgatct cttaaaaatt ataaaagata aggatttttt 1920 agataatgaa gaaaatgaag atattcttga agatatagta ttaacattga cactttttga 1980 agatagagaa atgatagaag aaagattaaa aacatatgca catctttttg atgataaggt 2040 tatgaagcaa cttaaaagaa gaagatatac aggttgggga cgtttgtcaa gaaagctaat 2100 taatggtatt agagataaac aatcaggaaa gactattctc gattttctta aatcagatgg 2160 atttgctaat agaaacttta tgcaattaat tcatgatgat tctcttactt tcaaagagga 2220 tattcaaaag gctcaagttt ctggacaagg cgatagctta cacgaacaca ttgctaacct 2280 tgcagggagc cccgctatca aaaaaggaat tttacaaaca gttaaagttg tagatgaact 2340 tgttaaagtt atgggaagac acaaacctga gaatatagtt atagaaatgg ccagagaaaa 2400 tcaaacaaca caaaaaggac aaaaaaattc tagagagaga atgaagagaa ttgaagaagg 2460 aataaaagag ctaggatcac aaatattaaa agaacatcca gttgaaaata ctcaattgca 2520 aaatgaaaag ttatatttgt attacttaca aaatggaaga gatatgtatg ttgatcaaga 2580 actcgatatt aatagattaa gtgactatga tgttgatcat attgttcctc aatcattttt 2640 aaaagatgat tcaatcgata acaaagtatt aactagatca gataaaaata gaggaaagtc 2700 agataatgta ccatctgaag aagttgttaa aaaaatgaag aactattgga gacaactttt 2760 aaatgcaaag ctaattacac aaagaaaatt tgacaattta acaaaagcag aaagaggagg 2820 attaagcgaa ttagacaaag ctggatttat aaaaagacaa cttgttgaga caagacaaat 2880 aactaagcat gttgctcaaa tacttgattc aagaatgaat acaaaatatg atgaaaatga 2940 taaattaatc agagaagtaa aagtaataac attaaagtca aaattagtat cagatttcag 3000 aaaggatttt caattttaca aagttcgtga aataaataac tatcatcatg ctcatgatgc 3060 atacttaaat gctgttgtag gaactgctct tattaagaaa tatcctaaac tagaaagcga 3120 atttgtttat ggagattata aagtttatga tgtgcgcaaa atgatcgcga aatccgaaca 3180 agaaatcggt aaggctacag caaaatattt cttttatagt aatataatga atttttttaa 3240 gacagaaata actttggcta atggtgaaat cagaaaaaga ccacttatcg aaacaaatgg 3300 agagacagga gaaatagtat gggataaagg aagagatttt gctactgtta gaaaagtact 3360 aagtatgcca caagtaaata tcgtaaagaa aactgaagtt caaactggag gtttctctaa 3420 ggaatcaatt ttacctaaga gaaattcaga taagttaatt gcaaggaaaa aagattggga 3480 cccaaaaaaa tacggtggtt ttgatagtcc aacagttgcc tatagtgttc ttgtagtagc 3540 gaaagttgag aaaggtaagt caaaaaagtt gaaaagcgta aaagaacttc ttggtatcac 3600 aattatggaa agatcttcat ttgaaaaaaa tccaattgac tttttagaag ctaagggtta 3660 taaagaagtt aaaaaggatt taatcataaa actaccaaag tatagtctat ttgaactcga 3720 aaacggaaga aaacgaatgc tcgctagcgc aggagaactt caaaaaggaa atgaacttgc 3780 gctgccatca aagtatgtaa atttcttata tttagcttct cattatgaga aattaaaagg 3840 atcaccagag gataatgaac aaaagcaact atttgtagaa caacacaaac attatttaga 3900 tgaaataata gaacaaatat ctgaattttc taaaagagtt atacttgccg acgcaaatct 3960 agataaggtg ctttcagcgt ataataaaca cagagataaa ccaataagag aacaagcaga 4020 aaacattatc catcttttta cattaactaa tcttggtgca ccagctgcat ttaagtactt 4080 tgatacaaca atagatagaa aaagatacac atctactaaa gaagtattag acgcaacttt 4140 aatacatcaa tctattacag ggctttatga aacaagaatt gatttaagtc aactaggcgg 4200 agattaagtc gacaaagtat tgttaaaaat aactctgtag aattataaat tagttctaca 4260 gagttatttt ttgacccggg tatattgata aaaataataa tagtgggtat aattaagttg 4320 ttaggaggtt agttagaatg atgtcaagat tagataaaag taaagtgatt aacagcgcat 4380 tagagctgct taatgaggtc ggaatcgaag gtttaacaac ccgtaaactc gcccagaagc 4440 taggtgtaga gcagcctaca ttgtattggc atgtaaaaaa taagcgggct ttgctcgacg 4500 ccttagccat tgagatgtta gataggcacc atactcactt ttgcccttta gaaggggaaa 4560 gctggcaaga ttttttacgt aataacgcta aaagttttag atgtgcttta ctaagtcatc 4620 gcgatggagc aaaagtacat ttaggtacac ggcctacaga aaaacagtat gaaactctcg 4680 aaaatcaatt agccttttta tgccaacaag gtttttcact agagaatgca ttatatgcac 4740 tcagcgctgt ggggcatttt actttaggtt gcgtattgga agatcaagag catcaagtcg 4800 ctaaagaaga aagggaaaca cctactactg atagtatgcc gccattatta cgacaagcta 4860 tcgaattatt tgatcaccaa ggtgcagagc cagccttctt attcggcctt gaattgatca 4920 tatgcggatt agaaaaacaa cttaaatgtg aaagtgggtc ttaaaagcag cataaccttt 4980 ttccgtgatg gtaacttcac ggtaaccaag atgtcgagtt gagctcgaat tcgtaatcat 5040 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5100 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5160 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5220 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5280 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5340 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5400 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5460 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5520 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5580 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5640 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5700 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5760 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5820 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5880 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5940 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6000 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6060 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6120 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6180 atgagtaaac ttggtctgac agttaccagg tccactgccg ggcctcttgc gggatcaaaa 6240 gaaaaacgaa atgatacacc aatcagtgca aaaaaagata taatgggaga taagacggtt 6300 cgtgttcgtg ctgacttgca ccatatcata aaaatcgaaa cagcaaagaa tggcggaaac 6360 gtaaaagaag ttatggaaat aagacttaga agcaaactta agagtgtgtt gatagtgcag 6420 tatcttaaaa ttttgtataa taggaattga agttaaatta gatgctaaaa atttgtaatt 6480 aagaaggagt gattacatga acaaaaatat aaaatattct caaaactttt taacgagtga 6540 aaaagtactc aaccaaataa taaaacaatt gaatttaaaa gaaaccgata ccgtttacga 6600 aattggaaca ggtaaagggc atttaacgac gaaactggct aaaataagta aacaggtaac 6660 gtctattgaa ttagacagtc atctattcaa cttatcgtca gaaaaattaa aactgaatac 6720 tcgtgtcact ttaattcacc aagatattct acagtttcaa ttccctaaca aacagaggta 6780 taaaattgtt gggagtattc cttaccattt aagcacacaa attattaaaa aagtggtttt 6840 tgaaagccat gcgtctgaca tctatctgat tgttgaagaa ggattctaca agcgtacctt 6900 ggatattcac cgaacactag ggttgctctt gcacactcaa gtctcgattc agcaattgct 6960 taagctgcca gcggaatgct ttcatcctaa accaaaagta aacagtgtct taataaaact 7020 tacccgccat accacagatg ttccagataa atattggaag ctatatacgt actttgtttc 7080 aaaatgggtc aatcgagaat atcgtcaact gtttactaaa aatcagtttc atcaagcaat 7140 gaaacacgcc aaagtaaaca atttaagtac cgttacttat gagcaagtat tgtctatttt 7200 taatagttat ctattattta acgggaggaa ataattctat gagtccctag gcaggcctcc 7260 gccattattt ttttgaacaa ttgacaattc atttcttatt ttttattaag tgatagtcaa 7320 aaggcataac agtgctgaat agaaagaaat ttacagaaaa gaaaattata gaatttagta 7380 tgattaatta tactcattta tgaatgttta attgaataca aaaaaaaata cttgttatgt 7440 attcaattac gggttaaaat atagacaagt tgaaaaattt aataaaaaaa taagtcctca 7500 gctcttatat attaagctac caacttagta tataagccaa aacttaaatg tgctaccaac 7560 acatcaagcc gttagagaac tctatctata gcaatatttc aaatgtaccg acatacaaga 7620 gaaacattaa ctatatatat tcaatttatg agattatctt aacagatata aatgtaaatt 7680 gcaataagta agatttagaa gtttatagcc tttgtgtatt ggaagcagta cgcaaaggct 7740 tttttatttg ataaaaatta gaagtatatt tattttttca taattaattt atgaaaatga 7800 aagggggtga gcaaagtgac agaggaaagc agtatcttat caaataacaa ggtattagca 7860 atatcattat tgactttagc agtaaacatt atgactttta tagtgcttgt agctaagtag 7920 tacgaaaggg ggagctttaa aaagctcctt ggaatacata gaattcataa attaatttat 7980 gaaaagaagg gcgtatatga aaacttgtaa aaattgcaaa gagtttatta aagatactga 8040 aatatgcaaa atacattcgt tgatgattca tgataaaaca gtagcaacct attgcagtaa 8100 atacaatgag tcaagatgtt tacataaagg gaaagtccaa tgtattaatt gttcaaagat 8160 gaaccgatat ggatggtgtg ccataaaaat gagatgtttt acagaggaag aacagaaaaa 8220 agaacgtaca tgcattaaat attatgcaag gagctttaaa aaagctcatg taaagaagag 8280 taaaaagaaa aaataattta tttattaatt taatattgag agtgccgaca cagtatgcac 8340 taaaaaatat atctgtggtg tagtgagccg atacaaaagg atagtcactc gcattttcat 8400 aatacatctt atgttatgat tatgtgtcgg tgggacttca cgacgaaaac ccacaataaa 8460 aaaagagttc ggggtagggt taagcatagt tgaggcaact aaacaatcaa gctaggatat 8520 gcagtagcag accgtaaggt cgttgtttag gtgtgttgta atacatacgc tattaagatg 8580 taaaaatacg gataccaatg aagggaaaag tataattttt ggatgtagtt tgtttgttca 8640 tctatgggca aactacgtcc aaagccgttt ccaaatctgc taaaaagtat atcctttcta 8700 aaatcaaagt caagtatgaa atcataaata aagtttaatt ttgaagttat tatgatatta 8760 tgtttttcta ttaaaataaa ttaagtatat agaatagttt aataatagta tatacttaat 8820 gtgataagtg tctgacagtg tcacagaaag gatgattgtt atggattata agcggc 8876 <210> 7 <211> 8874 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 7 catggataaa aagtacagta ttggtctaga cataggaact aactctgttg ggtgggctgt 60 tataacagat gaatataaag ttccatcaaa aaaatttaaa gtattaggaa acactgatag 120 acattcaata aaaaaaaact tgataggtgc tttattattc gattcaggag agactgctga 180 agctacacgt ttaaaaagaa cagctagacg tagatataca agaagaaaaa ataggatatg 240 ttatcttcaa gaaattttta gtaatgaaat ggcaaaagtt gatgattcat tctttcacag 300 actagaagaa agtttcttag ttgaagaaga taagaagcat gaaagacacc ctatttttgg 360 taatatcgta gatgaagtag catatcatga gaagtatcca actatctatc atttaagaaa 420 gaaattagtt gattctacag ataaagctga tctgagatta atatatttag ctttagctca 480 tatgattaaa tttagaggac attttttaat agaaggtgat ttaaacccag acaacagcga 540 tgtagataaa ttatttatcc aattagttca aacttataat caattattcg aagagaatcc 600 aattaatgca agtggtgtag acgctaaggc tatattatca gctagattat caaaatctag 660 aagattagaa aatctaatag ctcaacttcc tggagaaaag aaaaatggac tttttgggaa 720 cctaatagct ctctcactcg gactaacacc aaattttaaa agcaattttg atcttgctga 780 agacgcaaag ttacaactat caaaggatac atacgatgat gatttagata atttgttagc 840 tcaaataggt gatcaatatg ctgatttgtt tcttgcagca aaaaacttaa gtgatgcaat 900 tttactatca gatatactta gagtaaatac agaaataaca aaggctcctt tatcagcaag 960 tatgattaaa cgatatgatg agcatcatca agatttaaca ttattaaagg cacttgtaag 1020 acaacaatta ccagaaaaat ataaagaaat tttctttgat caatctaaaa atggatatgc 1080 tggatatata gacggtggag caagtcaaga agagttttat aaatttataa agcctatttt 1140 agaaaaaatg gatggaactg aagaattact tgttaaactt aacagagaag atttacttag 1200 aaaacaaaga acttttgata atggttcaat tcctcaccaa attcatttag gagaattaca 1260 tgctatacta agaagacaag aagattttta tccatttctt aaagataata gagaaaaaat 1320 tgaaaaaatt ttaactttta gaataccata ttatgtagga ccacttgcaa ggggaaattc 1380 aagatttgca tggatgacta gaaaatcaga agaaactata accccgtgga attttgaaga 1440 agtagtagat aaaggagcta gtgctcaatc atttatagaa agaatgacaa attttgataa 1500 gaatcttcct aacgaaaagg ttttgccaaa gcatagcctt ctttatgagt attttacagt 1560 ttataatgag cttactaaag taaaatacgt tacagaagga atgagaaaac cagcattttt 1620 gtctggtgaa caaaagaaag caatagtaga cctattattt aaaacaaata ggaaggttac 1680 cgtaaagcaa cttaaagaag attacttcaa aaaaattgaa tgctttgata gtgttgaaat 1740 atcaggagtt gaagatagat ttaatgcttc acttggtaca tatcacgatc tcttaaaaat 1800 tataaaagat aaggattttt tagataatga agaaaatgaa gatattcttg aagatatagt 1860 attaacattg acactttttg aagatagaga aatgatagaa gaaagattaa aaacatatgc 1920 acatcttttt gatgataagg ttatgaagca acttaaaaga agaagatata caggttgggg 1980 acgtttgtca agaaagctaa ttaatggtat tagagataaa caatcaggaa agactattct 2040 cgattttctt aaatcagatg gatttgctaa tagaaacttt atgcaattaa ttcatgatga 2100 ttctcttact ttcaaagagg atattcaaaa ggctcaagtt tctggacaag gcgatagctt 2160 acacgaacac attgctaacc ttgcagggag ccccgctatc aaaaaaggaa ttttacaaac 2220 agttaaagtt gtagatgaac ttgttaaagt tatgggaaga cacaaacctg agaatatagt 2280 tatagaaatg gccagagaaa atcaaacaac acaaaaagga caaaaaaatt ctagagagag 2340 aatgaagaga attgaagaag gaataaaaga gctaggatca caaatattaa aagaacatcc 2400 agttgaaaat actcaattgc aaaatgaaaa gttatatttg tattacttac aaaatggaag 2460 agatatgtat gttgatcaag aactcgatat taatagatta agtgactatg atgttgatca 2520 tattgttcct caatcatttt taaaagatga ttcaatcgat aacaaagtat taactagatc 2580 agataaaaat agaggaaagt cagataatgt accatctgaa gaagttgtta aaaaaatgaa 2640 gaactattgg agacaacttt taaatgcaaa gctaattaca caaagaaaat ttgacaattt 2700 aacaaaagca gaaagaggag gattaagcga attagacaaa gctggattta taaaaagaca 2760 acttgttgag acaagacaaa taactaagca tgttgctcaa atacttgatt caagaatgaa 2820 tacaaaatat gatgaaaatg ataaattaat cagagaagta aaagtaataa cattaaagtc 2880 aaaattagta tcagatttca gaaaggattt tcaattttac aaagttcgtg aaataaataa 2940 ctatcatcat gctcatgatg catacttaaa tgctgttgta ggaactgctc ttattaagaa 3000 atatcctaaa ctagaaagcg aatttgttta tggagattat aaagtttatg atgtgcgcaa 3060 aatgatcgcg aaatccgaac aagaaatcgg taaggctaca gcaaaatatt tcttttatag 3120 taatataatg aattttttta agacagaaat aactttggct aatggtgaaa tcagaaaaag 3180 accacttatc gaaacaaatg gagagacagg agaaatagta tgggataaag gaagagattt 3240 tgctactgtt agaaaagtac taagtatgcc acaagtaaat atcgtaaaga aaactgaagt 3300 tcaaactgga ggtttctcta aggaatcaat tttacctaag agaaattcag ataagttaat 3360 tgcaaggaaa aaagattggg acccaaaaaa atacggtggt tttgatagtc caacagttgc 3420 ctatagtgtt cttgtagtag cgaaagttga gaaaggtaag tcaaaaaagt tgaaaagcgt 3480 aaaagaactt cttggtatca caattatgga aagatcttca tttgaaaaaa atccaattga 3540 ctttttagaa gctaagggtt ataaagaagt taaaaaggat ttaatcataa aactaccaaa 3600 gtatagtcta tttgaactcg aaaacggaag aaaacgaatg ctcgctagcg caggagaact 3660 tcaaaaagga aatgaacttg cgctgccatc aaagtatgta aatttcttat atttagcttc 3720 tcattatgag aaattaaaag gatcaccaga ggataatgaa caaaagcaac tatttgtaga 3780 acaacacaaa cattatttag atgaaataat agaacaaata tctgaatttt ctaaaagagt 3840 tatacttgcc gacgcaaatc tagataaggt gctttcagcg tataataaac acagagataa 3900 accaataaga gaacaagcag aaaacattat ccatcttttt acattaacta atcttggtgc 3960 accagctgca tttaagtact ttgatacaac aatagataga aaaagataca catctactaa 4020 agaagtatta gacgcaactt taatacatca atctattaca gggctttatg aaacaagaat 4080 tgatttaagt caactaggcg gagattaagt cgacaaagta ttgttaaaaa taactctgta 4140 gaattataaa ttagttctac agagttattt tttgacccgg gtatattgat aaaaataata 4200 atagtgggta taattaagtt gttaggaggt tagttagaat gatgtcaaga ttagataaaa 4260 gtaaagtgat taacagcgca ttagagctgc ttaatgaggt cggaatcgaa ggtttaacaa 4320 cccgtaaact cgcccagaag ctaggtgtag agcagcctac attgtattgg catgtaaaaa 4380 ataagcgggc tttgctcgac gccttagcca ttgagatgtt agataggcac catactcact 4440 tttgcccttt agaaggggaa agctggcaag attttttacg taataacgct aaaagtttta 4500 gatgtgcttt actaagtcat cgcgatggag caaaagtaca tttaggtaca cggcctacag 4560 aaaaacagta tgaaactctc gaaaatcaat tagccttttt atgccaacaa ggtttttcac 4620 tagagaatgc attatatgca ctcagcgctg tggggcattt tactttaggt tgcgtattgg 4680 aagatcaaga gcatcaagtc gctaaagaag aaagggaaac acctactact gatagtatgc 4740 cgccattatt acgacaagct atcgaattat ttgatcacca aggtgcagag ccagccttct 4800 tattcggcct tgaattgatc atatgcggat tagaaaaaca acttaaatgt gaaagtgggt 4860 cttaaaagca gcataacctt tttccgtgat ggtaacttca cggtaaccaa gatgtcgagt 4920 tgagctcgaa ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca 4980 caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag 5040 tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 5100 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 5160 gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 5220 tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 5280 agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 5340 cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 5400 ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 5460 tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 5520 gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 5580 gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 5640 gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 5700 ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 5760 ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 5820 ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 5880 gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 5940 ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 6000 tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 6060 ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccag gtccactgcc 6120 gggcctcttg cgggatcaaa agaaaaacga aatgatacac caatcagtgc aaaaaaagat 6180 ataatgggag ataagacggt tcgtgttcgt gctgacttgc accatatcat aaaaatcgaa 6240 acagcaaaga atggcggaaa cgtaaaagaa gttatggaaa taagacttag aagcaaactt 6300 aagagtgtgt tgatagtgca gtatcttaaa attttgtata ataggaattg aagttaaatt 6360 agatgctaaa aatttgtaat taagaaggag tgattacatg aacaaaaata taaaatattc 6420 tcaaaacttt ttaacgagtg aaaaagtact caaccaaata ataaaacaat tgaatttaaa 6480 agaaaccgat accgtttacg aaattggaac aggtaaaggg catttaacga cgaaactggc 6540 taaaataagt aaacaggtaa cgtctattga attagacagt catctattca acttatcgtc 6600 agaaaaatta aaactgaata ctcgtgtcac tttaattcac caagatattc tacagtttca 6660 attccctaac aaacagaggt ataaaattgt tgggagtatt ccttaccatt taagcacaca 6720 aattattaaa aaagtggttt ttgaaagcca tgcgtctgac atctatctga ttgttgaaga 6780 aggattctac aagcgtacct tggatattca ccgaacacta gggttgctct tgcacactca 6840 agtctcgatt cagcaattgc ttaagctgcc agcggaatgc tttcatccta aaccaaaagt 6900 aaacagtgtc ttaataaaac ttacccgcca taccacagat gttccagata aatattggaa 6960 gctatatacg tactttgttt caaaatgggt caatcgagaa tatcgtcaac tgtttactaa 7020 aaatcagttt catcaagcaa tgaaacacgc caaagtaaac aatttaagta ccgttactta 7080 tgagcaagta ttgtctattt ttaatagtta tctattattt aacgggagga aataattcta 7140 tgagtcccta ggcaggcctc cgccattatt tttttgaaca attgacaatt catttcttat 7200 tttttattaa gtgatagtca aaaggcataa cagtgctgaa tagaaagaaa tttacagaaa 7260 agaaaattat agaatttagt atgattaatt atactcattt atgaatgttt aattgaatac 7320 aaaaaaaaat acttgttatg tattcaatta cgggttaaaa tatagacaag ttgaaaaatt 7380 taataaaaaa ataagtcctc agctcttata tattaagcta ccaacttagt atataagcca 7440 aaacttaaat gtgctaccaa cacatcaagc cgttagagaa ctctatctat agcaatattt 7500 caaatgtacc gacatacaag agaaacatta actatatata ttcaatttat gagattatct 7560 taacagatat aaatgtaaat tgcaataagt aagatttaga agtttatagc ctttgtgtat 7620 tggaagcagt acgcaaaggc ttttttattt gataaaaatt agaagtatat ttattttttc 7680 ataattaatt tatgaaaatg aaagggggtg agcaaagtga cagaggaaag cagtatctta 7740 tcaaataaca aggtattagc aatatcatta ttgactttag cagtaaacat tatgactttt 7800 atagtgcttg tagctaagta gtacgaaagg gggagcttta aaaagctcct tggaatacat 7860 agaattcata aattaattta tgaaaagaag ggcgtatatg aaaacttgta aaaattgcaa 7920 agagtttatt aaagatactg aaatatgcaa aatacattcg ttgatgattc atgataaaac 7980 agtagcaacc tattgcagta aatacaatga gtcaagatgt ttacataaag ggaaagtcca 8040 atgtattaat tgttcaaaga tgaaccgata tggatggtgt gccataaaaa tgagatgttt 8100 tacagaggaa gaacagaaaa aagaacgtac atgcattaaa tattatgcaa ggagctttaa 8160 aaaagctcat gtaaagaaga gtaaaaagaa aaaataattt atttattaat ttaatattga 8220 gagtgccgac acagtatgca ctaaaaaata tatctgtggt gtagtgagcc gatacaaaag 8280 gatagtcact cgcattttca taatacatct tatgttatga ttatgtgtcg gtgggacttc 8340 acgacgaaaa cccacaataa aaaaagagtt cggggtaggg ttaagcatag ttgaggcaac 8400 taaacaatca agctaggata tgcagtagca gaccgtaagg tcgttgttta ggtgtgttgt 8460 aatacatacg ctattaagat gtaaaaatac ggataccaat gaagggaaaa gtataatttt 8520 tggatgtagt ttgtttgttc atctatgggc aaactacgtc caaagccgtt tccaaatctg 8580 ctaaaaagta tatcctttct aaaatcaaag tcaagtatga aatcataaat aaagtttaat 8640 tttgaagtta ttatgatatt atgtttttct attaaaataa attaagtata tagaatagtt 8700 taataatagt atatacttaa tgtgataagt gtctgacagt gtcacagaaa ggatgattgt 8760 tatggattat aagcggctcg agtccctatc agtgatagat tgaaactcta tcattgatag 8820 agtataatat ctttgttcat tagagcgata aacttgaatt tgagagggaa cttc 8874 <210> 8 <211> 4938 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 8 tcgactctag aggatccccg ggtaccgagc tcgaattcgt aatcatggtc atagctgttt 60 cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 120 tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 180 cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 240 gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 300 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 360 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 420 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 480 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 540 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 600 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 660 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 720 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 780 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 840 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 900 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 960 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 1020 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 1080 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 1140 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1200 tctgacagtt accaaagcta gcttaatact agtatatact taatgtgata agtgtctgac 1260 agctgaccgg tctaaagagg tccctagcgc ctacggggaa tttgtatcga taaggggtac 1320 aaattcccac taagcgctcg gccggggatc gatccccggg tacgtacccg gcagtttttc 1380 tttttcggca agtgttcaag aagttattaa gtcgggagtg cagtcgaagt gggcaagttg 1440 aaaaattcac aaaaatgtgg tataatatct ttgttcatta gagcgataaa cttgaatttg 1500 agagggaact tagatggtat ttgaaaaaat tgataaaaat agttggaaca gaaaagagta 1560 ttttgaccac tactttgcaa gtgtaccttg tacctacagc atgaccgtta aagtggatat 1620 cacacaaata aaggaaaagg gaatgaaact atatcctgca atgctttatt atattgcaat 1680 gattgtaaac cgccattcag agtttaggac ggcaatcaat caagatggtg aattggggat 1740 atatgatgag atgataccaa gctatacaat atttcacaat gatactgaaa cattttccag 1800 cctttggact gagtgtaagt ctgactttaa atcattttta gcagattatg aaagtgatac 1860 gcaacggtat ggaaacaatc atagaatgga aggaaagcca aatgctccgg aaaacatttt 1920 taatgtatct atgataccgt ggtcaacctt cgatggcttt aatctgaatt tgcagaaagg 1980 atatgattat ttgattccta tttttactat ggggaaatat tataaagaag ataacaaaat 2040 tatacttcct ttggcaattc aagttcatca cgcagtatgt gacggatttc acatttgccg 2100 ttttgtaaac gaattgcagg aattgataaa tagttaactt caggtttgtc tgtaactaaa 2160 aactagtatt taacctagga tcaaaaaaat ttccaataat cccactctaa gccacaaaca 2220 cgccctataa aatcccgctt taatcccact ttgagacaca tgtaatatta ctttacgccc 2280 tagtatagtg ataatttttt acattcaatg ccacgcaaaa aaataaaggg gcactataat 2340 aaaagttcct tcggaactaa ctaaagtaaa aaattatctt tacaacctcc ccaaaaaaaa 2400 gaacaggtac aaagtaccct ataatacaag cgtaaaaaaa atgagggtaa aaataaaaaa 2460 ataaaaaaat aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa 2520 aaaaatataa aaataaaaaa atataaaaat aaaaaaataa aaaaatataa aaataaaaaa 2580 ataaaaaaat ataaaaatat tttttattta aagtttgaaa aaaatttttt tatattatat 2640 aatctttgaa gaaaagaata taaaaaatga gcctttataa aagcccattt tttttcatat 2700 acgtaatatg acgttctaat gtttttattg gtacttctaa cattagagta atttctttat 2760 ttttaaagcc tttttcttta agggctttta ttttttttct taatacattt aattcctctt 2820 tttttgttgc ttttccttta gcttttaatt gctcttgata atttttttta cctctaatat 2880 tttctcttct cttatattcc tttttagaaa ttattattgt catatatttt tgttcttctt 2940 ctgtaatttc taataactct ataagagttt cattcttata cttatattgc ttatttttat 3000 ctaaataaca tctttcagca cttctagttg ctcttataac ttctctttca cttaaatgtt 3060 gtctaaacat actattaagt tctaaaacat catttaatgc cttctcaatg tcttctgtaa 3120 agctacaaag ataatatcta tataaaaata atataagctc tctgtgtcct tttaaatcat 3180 attctcttag ttcacaaagt tttattatgt cttgtattct tccataatat aaacttcttt 3240 ctctataaat ataatttatt ttgcttggtc tacccttttt cctttcatat ggttttaatt 3300 caggtaaaaa tccattttgt atttctctta agtcataaat atattcgtac tcatctaata 3360 tattgactac tgtttttgat ttagagttta tacttcctgg aactcttaat attctcgttg 3420 catctaaggc ttgtctatct gctccaaagt attttaattg attatataaa tattcttgaa 3480 ccgctttcca taatggtaat gctttactag gtactgcatt tattatccat attaaataca 3540 ttcctcttcc actatctatt acatagtttg gtataggaat actttgatta aaataattct 3600 tttctaagtc cattaatacc tggtctttag ttttgccagt tttataataa tccaagtcta 3660 taaacagtgt atttaactct tttatatttt ctaatcgcct acacggctta taaaaggtat 3720 ttagagttat atagatattt tcatcactca tatctaaatc ttttaattca gcgtatttat 3780 agtgccattg gctatatcct tttttatcta taacgctcct ggttatccac cctttacttc 3840 tactatgaat attatctata tagttctttt tattcagctt taatgcgttt ctcacttatt 3900 cacctcccct tctgtaaaac taagaaaatt atatcatatt ttcaataatt attaactatt 3960 cttaaactct taataaaaaa tagagtaagt ccccaattga aacttaatct attttttatg 4020 ttttaattta ttatttttat taaaatattt taaactaaat taaatgattc tttttaattt 4080 tttactattt cattccataa tatattacta taattattta caaataatat ttcttcattt 4140 gtaatattta gatgatttac taattttagt ttttatatat taaataatta atgtataatt 4200 tatataaaaa atcaaaggag cttataaatt atgattattt ccaaagatac taaagattta 4260 atttttttca attttaacaa tactttttgt aatattatgt ttaaatttaa ttgtattttt 4320 ttcatataat aaagccgttg aagtaaacca atccattttc cttatgatgt tattattaaa 4380 tttaagtttt ataataatat ctttattata tttattgttt ttaaaaaaac tagtgaaatt 4440 tctagtgaaa tttccggctt tattaaactt atttttagga attttatttt cattttcatc 4500 tttacaggat ttgattatat ctttaaatat gttttatcaa atattatctt tttctaaatt 4560 tatatatatt tttattatat ttattattat atatatttta tttttaagtt tctttctaac 4620 agctattaaa aagaaactta aaaataaaaa cacgtactct aaaccaataa ataaaactat 4680 ttttattatt gctgccttga ttggaatagt ttttagtaaa attaatttca atattccaca 4740 atattatatt ataagctagc acgcctcgag tatattgata aaaataataa tagtgggtat 4800 aattaagttg ttaggaggtt agttagactt aaaatccata tataacagtt ttagagctag 4860 aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 4920 tgcttttttt gaagcttg 4938 <210> 9 <211> 4938 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 9 tcgactctag aggatccccg ggtaccgagc tcgaattcgt aatcatggtc atagctgttt 60 cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 120 tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 180 cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 240 gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 300 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 360 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 420 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 480 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 540 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 600 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 660 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 720 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 780 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 840 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 900 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 960 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 1020 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 1080 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 1140 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1200 tctgacagtt accaaagcta gcttaatact agtatatact taatgtgata agtgtctgac 1260 agctgaccgg tctaaagagg tccctagcgc ctacggggaa tttgtatcga taaggggtac 1320 aaattcccac taagcgctcg gccggggatc gatccccggg tacgtacccg gcagtttttc 1380 tttttcggca agtgttcaag aagttattaa gtcgggagtg cagtcgaagt gggcaagttg 1440 aaaaattcac aaaaatgtgg tataatatct ttgttcatta gagcgataaa cttgaatttg 1500 agagggaact tagatggtat ttgaaaaaat tgataaaaat agttggaaca gaaaagagta 1560 ttttgaccac tactttgcaa gtgtaccttg tacctacagc atgaccgtta aagtggatat 1620 cacacaaata aaggaaaagg gaatgaaact atatcctgca atgctttatt atattgcaat 1680 gattgtaaac cgccattcag agtttaggac ggcaatcaat caagatggtg aattggggat 1740 atatgatgag atgataccaa gctatacaat atttcacaat gatactgaaa cattttccag 1800 cctttggact gagtgtaagt ctgactttaa atcattttta gcagattatg aaagtgatac 1860 gcaacggtat ggaaacaatc atagaatgga aggaaagcca aatgctccgg aaaacatttt 1920 taatgtatct atgataccgt ggtcaacctt cgatggcttt aatctgaatt tgcagaaagg 1980 atatgattat ttgattccta tttttactat ggggaaatat tataaagaag ataacaaaat 2040 tatacttcct ttggcaattc aagttcatca cgcagtatgt gacggatttc acatttgccg 2100 ttttgtaaac gaattgcagg aattgataaa tagttaactt caggtttgtc tgtaactaaa 2160 aactagtatt taacctagga tcaaaaaaat ttccaataat cccactctaa gccacaaaca 2220 cgccctataa aatcccgctt taatcccact ttgagacaca tgtaatatta ctttacgccc 2280 tagtatagtg ataatttttt acattcaatg ccacgcaaaa aaataaaggg gcactataat 2340 aaaagttcct tcggaactaa ctaaagtaaa aaattatctt tacaacctcc ccaaaaaaaa 2400 gaacaggtac aaagtaccct ataatacaag cgtaaaaaaa atgagggtaa aaataaaaaa 2460 ataaaaaaat aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa 2520 aaaaatataa aaataaaaaa atataaaaat aaaaaaataa aaaaatataa aaataaaaaa 2580 ataaaaaaat ataaaaatat tttttattta aagtttgaaa aaaatttttt tatattatat 2640 aatctttgaa gaaaagaata taaaaaatga gcctttataa aagcccattt tttttcatat 2700 acgtaatatg acgttctaat gtttttattg gtacttctaa cattagagta atttctttat 2760 ttttaaagcc tttttcttta agggctttta ttttttttct taatacattt aattcctctt 2820 tttttgttgc ttttccttta gcttttaatt gctcttgata atttttttta cctctaatat 2880 tttctcttct cttatattcc tttttagaaa ttattattgt catatatttt tgttcttctt 2940 ctgtaatttc taataactct ataagagttt cattcttata cttatattgc ttatttttat 3000 ctaaataaca tctttcagca cttctagttg ctcttataac ttctctttca cttaaatgtt 3060 gtctaaacat actattaagt tctaaaacat catttaatgc cttctcaatg tcttctgtaa 3120 agctacaaag ataatatcta tataaaaata atataagctc tctgtgtcct tttaaatcat 3180 attctcttag ttcacaaagt tttattatgt cttgtattct tccataatat aaacttcttt 3240 ctctataaat ataatttatt ttgcttggtc tacccttttt cctttcatat ggttttaatt 3300 caggtaaaaa tccattttgt atttctctta agtcataaat atattcgtac tcatctaata 3360 tattgactac tgtttttgat ttagagttta tacttcctgg aactcttaat attctcgttg 3420 catctaaggc ttgtctatct gctccaaagt attttaattg attatataaa tattcttgaa 3480 ccgctttcca taatggtaat gctttactag gtactgcatt tattatccat attaaataca 3540 ttcctcttcc actatctatt acatagtttg gtataggaat actttgatta aaataattct 3600 tttctaagtc cattaatacc tggtctttag ttttgccagt tttataataa tccaagtcta 3660 taaacagtgt atttaactct tttatatttt ctaatcgcct acacggctta taaaaggtat 3720 ttagagttat atagatattt tcatcactca tatctaaatc ttttaattca gcgtatttat 3780 agtgccattg gctatatcct tttttatcta taacgctcct ggttatccac cctttacttc 3840 tactatgaat attatctata tagttctttt tattcagctt taatgcgttt ctcacttatt 3900 cacctcccct tctgtaaaac taagaaaatt atatcatatt ttcaataatt attaactatt 3960 cttaaactct taataaaaaa tagagtaagt ccccaattga aacttaatct attttttatg 4020 ttttaattta ttatttttat taaaatattt taaactaaat taaatgattc tttttaattt 4080 tttactattt cattccataa tatattacta taattattta caaataatat ttcttcattt 4140 gtaatattta gatgatttac taattttagt ttttatatat taaataatta atgtataatt 4200 tatataaaaa atcaaaggag cttataaatt atgattattt ccaaagatac taaagattta 4260 atttttttca attttaacaa tactttttgt aatattatgt ttaaatttaa ttgtattttt 4320 ttcatataat aaagccgttg aagtaaacca atccattttc cttatgatgt tattattaaa 4380 tttaagtttt ataataatat ctttattata tttattgttt ttaaaaaaac tagtgaaatt 4440 tctagtgaaa tttccggctt tattaaactt atttttagga attttatttt cattttcatc 4500 tttacaggat ttgattatat ctttaaatat gttttatcaa atattatctt tttctaaatt 4560 tatatatatt tttattatat ttattattat atatatttta tttttaagtt tctttctaac 4620 agctattaaa aagaaactta aaaataaaaa cacgtactct aaaccaataa ataaaactat 4680 ttttattatt gctgccttga ttggaatagt ttttagtaaa attaatttca atattccaca 4740 atattatatt ataagctagc acgcctcgag tatattgata aaaataataa tagtgggtat 4800 aattaagttg ttaggaggtt agttagaact aaatgtaaaa tgttagcgtt ttagagctag 4860 aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 4920 tgcttttttt gaagcttg 4938 <210> 10 <211> 5911 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 10 aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 60 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 120 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 180 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 240 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 300 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 360 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 420 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 480 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 540 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 600 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 660 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 720 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 780 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 840 tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 900 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 960 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1020 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1080 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1140 atctaaagta tatatgagta aacttggtct gacagttacc aaagctagct taatactagt 1200 atatacttaa tgtgataagt gtctgacagc tgaccggtct aaagaggtcc ctagcgccta 1260 cggggaattt gtatcgataa ggggtacaaa ttcccactaa gcgctcggcc ggggatcgat 1320 ccccgggtac gtacccggca gtttttcttt ttcggcaagt gttcaagaag ttattaagtc 1380 gggagtgcag tcgaagtggg caagttgaaa aattcacaaa aatgtggtat aatatctttg 1440 ttcattagag cgataaactt gaatttgaga gggaacttag atggtatttg aaaaaattga 1500 taaaaatagt tggaacagaa aagagtattt tgaccactac tttgcaagtg taccttgtac 1560 ctacagcatg accgttaaag tggatatcac acaaataaag gaaaagggaa tgaaactata 1620 tcctgcaatg ctttattata ttgcaatgat tgtaaaccgc cattcagagt ttaggacggc 1680 aatcaatcaa gatggtgaat tggggatata tgatgagatg ataccaagct atacaatatt 1740 tcacaatgat actgaaacat tttccagcct ttggactgag tgtaagtctg actttaaatc 1800 atttttagca gattatgaaa gtgatacgca acggtatgga aacaatcata gaatggaagg 1860 aaagccaaat gctccggaaa acatttttaa tgtatctatg ataccgtggt caaccttcga 1920 tggctttaat ctgaatttgc agaaaggata tgattatttg attcctattt ttactatggg 1980 gaaatattat aaagaagata acaaaattat acttcctttg gcaattcaag ttcatcacgc 2040 agtatgtgac ggatttcaca tttgccgttt tgtaaacgaa ttgcaggaat tgataaatag 2100 ttaacttcag gtttgtctgt aactaaaaac tagtatttaa cctaggatca aaaaaatttc 2160 caataatccc actctaagcc acaaacacgc cctataaaat cccgctttaa tcccactttg 2220 agacacatgt aatattactt tacgccctag tatagtgata attttttaca ttcaatgcca 2280 cgcaaaaaaa taaaggggca ctataataaa agttccttcg gaactaacta aagtaaaaaa 2340 ttatctttac aacctcccca aaaaaaagaa caggtacaaa gtaccctata atacaagcgt 2400 aaaaaaaatg agggtaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 2460 taaaaaaata aaaaaatata aaaataaaaa aatataaaaa taaaaaaata taaaaataaa 2520 aaaataaaaa aatataaaaa taaaaaaata aaaaaatata aaaatatttt ttatttaaag 2580 tttgaaaaaa atttttttat attatataat ctttgaagaa aagaatataa aaaatgagcc 2640 tttataaaag cccatttttt ttcatatacg taatatgacg ttctaatgtt tttattggta 2700 cttctaacat tagagtaatt tctttatttt taaagccttt ttctttaagg gcttttattt 2760 tttttcttaa tacatttaat tcctcttttt ttgttgcttt tcctttagct tttaattgct 2820 cttgataatt ttttttacct ctaatatttt ctcttctctt atattccttt ttagaaatta 2880 ttattgtcat atatttttgt tcttcttctg taatttctaa taactctata agagtttcat 2940 tcttatactt atattgctta tttttatcta aataacatct ttcagcactt ctagttgctc 3000 ttataacttc tctttcactt aaatgttgtc taaacatact attaagttct aaaacatcat 3060 ttaatgcctt ctcaatgtct tctgtaaagc tacaaagata atatctatat aaaaataata 3120 taagctctct gtgtcctttt aaatcatatt ctcttagttc acaaagtttt attatgtctt 3180 gtattcttcc ataatataaa cttctttctc tataaatata atttattttg cttggtctac 3240 cctttttcct ttcatatggt tttaattcag gtaaaaatcc attttgtatt tctcttaagt 3300 cataaatata ttcgtactca tctaatatat tgactactgt ttttgattta gagtttatac 3360 ttcctggaac tcttaatatt ctcgttgcat ctaaggcttg tctatctgct ccaaagtatt 3420 ttaattgatt atataaatat tcttgaaccg ctttccataa tggtaatgct ttactaggta 3480 ctgcatttat tatccatatt aaatacattc ctcttccact atctattaca tagtttggta 3540 taggaatact ttgattaaaa taattctttt ctaagtccat taatacctgg tctttagttt 3600 tgccagtttt ataataatcc aagtctataa acagtgtatt taactctttt atattttcta 3660 atcgcctaca cggcttataa aaggtattta gagttatata gatattttca tcactcatat 3720 ctaaatcttt taattcagcg tatttatagt gccattggct atatcctttt ttatctataa 3780 cgctcctggt tatccaccct ttacttctac tatgaatatt atctatatag ttctttttat 3840 tcagctttaa tgcgtttctc acttattcac ctccccttct gtaaaactaa gaaaattata 3900 tcatattttc aataattatt aactattctt aaactcttaa taaaaaatag agtaagtccc 3960 caattgaaac ttaatctatt ttttatgttt taatttatta tttttattaa aatattttaa 4020 actaaattaa atgattcttt ttaatttttt actatttcat tccataatat attactataa 4080 ttatttacaa ataatatttc ttcatttgta atatttagat gatttactaa ttttagtttt 4140 tatatattaa ataattaatg tataatttat ataaaaaatc aaaggagctt ataaattatg 4200 attatttcca aagatactaa agatttaatt tttttcaatt ttaacaatac tttttgtaat 4260 attatgttta aatttaattg tatttttttc atataataaa gccgttgaag taaaccaatc 4320 cattttcctt atgatgttat tattaaattt aagttttata ataatatctt tattatattt 4380 attgttttta aaaaaactag tgaaatttct agtgaaattt ccggctttat taaacttatt 4440 tttaggaatt ttattttcat tttcatcttt acaggatttg attatatctt taaatatgtt 4500 ttatcaaata ttatcttttt ctaaatttat atatattttt attatattta ttattatata 4560 tattttattt ttaagtttct ttctaacagc tattaaaaag aaacttaaaa ataaaaacac 4620 gtactctaaa ccaataaata aaactatttt tattattgct gccttgattg gaatagtttt 4680 tagtaaaatt aatttcaata ttccacaata ttatattata agctagcacg cctcgagtat 4740 attgataaaa ataataatag tgggtataat taagttgtta ggaggttagt tagaactaaa 4800 tgtaaaatgt tagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 4860 caacttgaaa aagtggcacc gagtcggtgc tttttttgaa gcttgtcgac atgaagatag 4920 caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa catttagaga 4980 gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt gattatccag 5040 attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt ggaatactca 5100 tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga ataagagcag 5160 ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat gcaaatatac 5220 ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta gatacatttt 5280 taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt acacaaatag 5340 aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat cacatccact 5400 tatattacac aaacttcctc aagatataga ggaaagagac ataatagtaa ctgatccaat 5460 gcttgcaact ggtgggtcag caatagatgc aataacactt cttaagaaaa gaggagcaaa 5520 atacataaga cttatgtgtc ttataggagc accagaaggt atagcagcag tacaagaagc 5580 acatccagat gtagatatat acctcgcatc aatagatgaa aagttagatg aaaatggata 5640 tatagttcct ggtcttggag atgctggaga tagattattc ggtacaaaat aaattgcata 5700 aataaaaagg gctgaaaaat aaatttcagt ccttttattt atattttaac tttattccat 5760 gccactgcct cttctgataa taatagaaat tattaaagtt aatacagatg taagggcaac 5820 tgttccacct ggagcacaat ttaagtaata agagctaaat aatccaacga gtacatctat 5880 aaagctaaat aatattgata atataagcgt g 5911 <210> 11 <211> 6217 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 11 aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 60 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 120 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 180 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 240 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 300 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 360 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 420 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 480 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 540 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 600 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 660 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 720 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 780 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 840 tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 900 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 960 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1020 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1080 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1140 atctaaagta tatatgagta aacttggtct gacagttacc aaagctagct taatactagt 1200 atatacttaa tgtgataagt gtctgacagc tgaccggtct aaagaggtcc ctagcgccta 1260 cggggaattt gtatcgataa ggggtacaaa ttcccactaa gcgctcggcc ggggatcgat 1320 ccccgggtac gtacccggca gtttttcttt ttcggcaagt gttcaagaag ttattaagtc 1380 gggagtgcag tcgaagtggg caagttgaaa aattcacaaa aatgtggtat aatatctttg 1440 ttcattagag cgataaactt gaatttgaga gggaacttag atggtatttg aaaaaattga 1500 taaaaatagt tggaacagaa aagagtattt tgaccactac tttgcaagtg taccttgtac 1560 ctacagcatg accgttaaag tggatatcac acaaataaag gaaaagggaa tgaaactata 1620 tcctgcaatg ctttattata ttgcaatgat tgtaaaccgc cattcagagt ttaggacggc 1680 aatcaatcaa gatggtgaat tggggatata tgatgagatg ataccaagct atacaatatt 1740 tcacaatgat actgaaacat tttccagcct ttggactgag tgtaagtctg actttaaatc 1800 atttttagca gattatgaaa gtgatacgca acggtatgga aacaatcata gaatggaagg 1860 aaagccaaat gctccggaaa acatttttaa tgtatctatg ataccgtggt caaccttcga 1920 tggctttaat ctgaatttgc agaaaggata tgattatttg attcctattt ttactatggg 1980 gaaatattat aaagaagata acaaaattat acttcctttg gcaattcaag ttcatcacgc 2040 agtatgtgac ggatttcaca tttgccgttt tgtaaacgaa ttgcaggaat tgataaatag 2100 ttaacttcag gtttgtctgt aactaaaaac tagtatttaa cctaggatca aaaaaatttc 2160 caataatccc actctaagcc acaaacacgc cctataaaat cccgctttaa tcccactttg 2220 agacacatgt aatattactt tacgccctag tatagtgata attttttaca ttcaatgcca 2280 cgcaaaaaaa taaaggggca ctataataaa agttccttcg gaactaacta aagtaaaaaa 2340 ttatctttac aacctcccca aaaaaaagaa caggtacaaa gtaccctata atacaagcgt 2400 aaaaaaaatg agggtaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 2460 taaaaaaata aaaaaatata aaaataaaaa aatataaaaa taaaaaaata taaaaataaa 2520 aaaataaaaa aatataaaaa taaaaaaata aaaaaatata aaaatatttt ttatttaaag 2580 tttgaaaaaa atttttttat attatataat ctttgaagaa aagaatataa aaaatgagcc 2640 tttataaaag cccatttttt ttcatatacg taatatgacg ttctaatgtt tttattggta 2700 cttctaacat tagagtaatt tctttatttt taaagccttt ttctttaagg gcttttattt 2760 tttttcttaa tacatttaat tcctcttttt ttgttgcttt tcctttagct tttaattgct 2820 cttgataatt ttttttacct ctaatatttt ctcttctctt atattccttt ttagaaatta 2880 ttattgtcat atatttttgt tcttcttctg taatttctaa taactctata agagtttcat 2940 tcttatactt atattgctta tttttatcta aataacatct ttcagcactt ctagttgctc 3000 ttataacttc tctttcactt aaatgttgtc taaacatact attaagttct aaaacatcat 3060 ttaatgcctt ctcaatgtct tctgtaaagc tacaaagata atatctatat aaaaataata 3120 taagctctct gtgtcctttt aaatcatatt ctcttagttc acaaagtttt attatgtctt 3180 gtattcttcc ataatataaa cttctttctc tataaatata atttattttg cttggtctac 3240 cctttttcct ttcatatggt tttaattcag gtaaaaatcc attttgtatt tctcttaagt 3300 cataaatata ttcgtactca tctaatatat tgactactgt ttttgattta gagtttatac 3360 ttcctggaac tcttaatatt ctcgttgcat ctaaggcttg tctatctgct ccaaagtatt 3420 ttaattgatt atataaatat tcttgaaccg ctttccataa tggtaatgct ttactaggta 3480 ctgcatttat tatccatatt aaatacattc ctcttccact atctattaca tagtttggta 3540 taggaatact ttgattaaaa taattctttt ctaagtccat taatacctgg tctttagttt 3600 tgccagtttt ataataatcc aagtctataa acagtgtatt taactctttt atattttcta 3660 atcgcctaca cggcttataa aaggtattta gagttatata gatattttca tcactcatat 3720 ctaaatcttt taattcagcg tatttatagt gccattggct atatcctttt ttatctataa 3780 cgctcctggt tatccaccct ttacttctac tatgaatatt atctatatag ttctttttat 3840 tcagctttaa tgcgtttctc acttattcac ctccccttct gtaaaactaa gaaaattata 3900 tcatattttc aataattatt aactattctt aaactcttaa taaaaaatag agtaagtccc 3960 caattgaaac ttaatctatt ttttatgttt taatttatta tttttattaa aatattttaa 4020 actaaattaa atgattcttt ttaatttttt actatttcat tccataatat attactataa 4080 ttatttacaa ataatatttc ttcatttgta atatttagat gatttactaa ttttagtttt 4140 tatatattaa ataattaatg tataatttat ataaaaaatc aaaggagctt ataaattatg 4200 attatttcca aagatactaa agatttaatt tttttcaatt ttaacaatac tttttgtaat 4260 attatgttta aatttaattg tatttttttc atataataaa gccgttgaag taaaccaatc 4320 cattttcctt atgatgttat tattaaattt aagttttata ataatatctt tattatattt 4380 attgttttta aaaaaactag tgaaatttct agtgaaattt ccggctttat taaacttatt 4440 tttaggaatt ttattttcat tttcatcttt acaggatttg attatatctt taaatatgtt 4500 ttatcaaata ttatcttttt ctaaatttat atatattttt attatattta ttattatata 4560 tattttattt ttaagtttct ttctaacagc tattaaaaag aaacttaaaa ataaaaacac 4620 gtactctaaa ccaataaata aaactatttt tattattgct gccttgattg gaatagtttt 4680 tagtaaaatt aatttcaata ttccacaata ttatattata agctagcacg cctcgagtat 4740 attgataaaa ataataatag tgggtataat taagttgtta ggaggttagt tagaactaaa 4800 tgtaaaatgt tagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 4860 caacttgaaa aagtggcacc gagtcggtgc tttttttgaa gcttgtcgac atgaagatag 4920 caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa catttagaga 4980 gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt gattatccag 5040 attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt ggaatactca 5100 tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga ataagagcag 5160 ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat gcaaatatac 5220 ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta gatacatttt 5280 taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt acacaaatag 5340 aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat cacatccact 5400 tatattacac aaattagcat ttatgagaga taaaaaaaca ggatctaaag attttagaga 5460 gatggtagaa gaagtagcaa tgctaatggc atatgaagta acaagagaaa tgcagcttga 5520 aactgttgaa atagaaactc ctatatgtat aactaaatgt aagatgtaag caggaaaaaa 5580 ggtagctata gttcctatac ttagagcagg acttggaatg gtaaatggag tattaaaatt 5640 aatacctgct gctaaggttg gacatatagg attatataga gatgaaaaga cattaaaacc 5700 tgtagaatac ttctgtaaac ttcctcaaga tatagaggaa agagacataa tagtaactga 5760 tccaatgctt gcaactggtg ggtcagcaat agatgcaata acacttctta agaaaagagg 5820 agcaaaatac ataagactta tgtgtcttat aggagcacca gaaggtatag cagcagtaca 5880 agaagcacat ccagatgtag atatatacct cgcatcaata gatgaaaagt tagatgaaaa 5940 tggatatata gttcctggtc ttggagatgc tggagataga ttattcggta caaaataaat 6000 tgcataaata aaaagggctg aaaaataaat ttcagtcctt ttatttatat tttaacttta 6060 ttccatgcca ctgcctcttc tgataataat agaaattatt aaagttaata cagatgtaag 6120 ggcaactgtt ccacctggag cacaatttaa gtaataagag ctaaataatc caacgagtac 6180 atctataaag ctaaataata ttgataatat aagcgtg 6217 <210> 12 <211> 1002 <212> DNA <213> Artificial Sequence <220> <223> upp_del <400> 12 catgaagata gcaataggta gtgatcatgc aggattttca ttgaaaaagg aagttataaa 60 acatttagag agtaaaaata ttgaggttaa agattttggc actctaactg atgaatcatg 120 tgattatcca gattatgcat taaaagtagc agaggaagtt gctcaaaaaa actttgagtt 180 tggaatactc atttgtggaa caggtatagg aataagcata tcagcaaata aggtgccagg 240 aataagagca gctgtatgta cagatacatt ctgtgctcat gcatcaagag aacataacaa 300 tgcaaatata cttgcaatgg gagaaagagt tgtaggacct ggattagcaa ttgatatagt 360 agatacattt ttaaattcaa aatttcaggg agataggcat caaagaagaa tagacaagat 420 tacacaaata gaaaaaaaat acaatggagg aatgaaataa tgagtaaagt tacacaaata 480 tcacatccac ttatattaca caaacttcct caagatatag aggaaagaga cataatagta 540 actgatccaa tgcttgcaac tggtgggtca gcaatagatg caataacact tcttaagaaa 600 agaggagcaa aatacataag acttatgtgt cttataggag caccagaagg tatagcagca 660 gtacaagaag cacatccaga tgtagatata tacctcgcat caatagatga aaagttagat 720 gaaaatggat atatagttcc tggtcttgga gatgctggag atagattatt cggtacaaaa 780 taaattgcat aaataaaaag ggctgaaaaa taaatttcag tccttttatt tatattttaa 840 ctttattcca tgccactgcc tcttctgata ataatagaaa ttattaaagt taatacagat 900 gtaagggcaa ctgttccacc tggagcacaa tttaagtaat aagagctaaa taatccaacg 960 agtacatcta taaagctaaa taatattgat aatataagcg tg 1002 <210> 13 <211> 1306 <212> DNA <213> Artificial Sequence <220> <223> upp_stop <400> 13 atgaagatag caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa 60 catttagaga gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt 120 gattatccag attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt 180 ggaatactca tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga 240 ataagagcag ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat 300 gcaaatatac ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta 360 gatacatttt taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt 420 acacaaatag aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat 480 cacatccact tatattacac aaattagcat ttatgagaga taaaaaaaca ggatctaaag 540 attttagaga gatggtagaa gaagtagcaa tgctaatggc atatgaagta acaagagaaa 600 tgcagcttga aactgttgaa atagaaactc ctatatgtat aactaaatgt aagatgtaag 660 caggaaaaaa ggtagctata gttcctatac ttagagcagg acttggaatg gtaaatggag 720 tattaaaatt aatacctgct gctaaggttg gacatatagg attatataga gatgaaaaga 780 cattaaaacc tgtagaatac ttctgtaaac ttcctcaaga tatagaggaa agagacataa 840 tagtaactga tccaatgctt gcaactggtg ggtcagcaat agatgcaata acacttctta 900 agaaaagagg agcaaaatac ataagactta tgtgtcttat aggagcacca gaaggtatag 960 cagcagtaca agaagcacat ccagatgtag atatatacct cgcatcaata gatgaaaagt 1020 tagatgaaaa tggatatata gttcctggtc ttggagatgc tggagataga ttattcggta 1080 caaaataaat tgcataaata aaaagggctg aaaaataaat ttcagtcctt ttatttatat 1140 tttaacttta ttccatgcca ctgcctcttc tgataataat agaaattatt aaagttaata 1200 cagatgtaag ggcaactgtt ccacctggag cacaatttaa gtaataagag ctaaataatc 1260 caacgagtac atctataaag ctaaataata ttgataatat aagcgt 1306 <210> 14 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 gtgggcaagt tgaaaaattc ac 22 <210> 15 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 ttaactattt atcaattcct gcaattcg 28 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 cttgagactt tgccgtgagg g 21 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tagttggaat gggcgctagt 20 <210> 18 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 atgaagatag caataggtag tgatcatgc 29 <210> 19 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 acgcttatat tatcaatatt atttagcttt atag 34 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 tgtccaacct tagcagcagg 20 <210> 21 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 gtagaagaag tagcaatgct aatggc 26 <210> 22 <211> 62 <212> DNA <213> Clostridium acetobutylicum <400> 22 aaactcctat atgtataact aaatgtaaaa tgttagcagg aaaaaaggta gctatagttc 60 ct 62 <210> 23 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> fragment upp_stop fig7 <400> 23 aaactcctat atgtataact aaatgtaaga tgtaagcagg aaaaaaggta gctatagttc 60 ct 62 <210> 24 <211> 86 <212> DNA <213> Clostridium acetobutylicum <400> 24 aaactgttga aatagaaact cctatatgta taactaaatg taaaatgtta gcaggaaaaa 60 aggtagctat agttcctata cttaga 86 <210> 25 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> fragment upp_stop fig16 <400> 25 aaactgttga aatagaaact cctatatgta taactaaatg taagatgtaa gcaggaaaaa 60 aggtagctat agttcctata cttaga 86 <210> 26 <211> 10537 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 26 tcgactctag aggatcctac ttggttttat agagatttta aggaggaagc tatgaagata 60 ctttttgttt gtactggtaa tacatgtaga agctgtatgg cagaagctat gtttaatagt 120 atgtgtaata tagatggtat agaagctttt tcagcaggtg catctgctat tcatggaagc 180 aaaacttcct taaattcggc tgtggtagtt agggagaact taggcaaaga tatatcaaat 240 agaaaggcta tacagttgac tactttttta gttgatgaat gtgatttagt tttaacaatg 300 acatctttat taagtgacgt gcttagaagt caaatggaga agaactctaa taagatatat 360 tcattaagtg aatatacagg tgtagagggt gacattactg acccatatgg tagaagtgta 420 gagatctaca gacaaactta taaagacatt gaaaagaggc taaaaatact tattaaaaaa 480 ctaaatgaag atagaagtat ttaatcatat actcttatct tctttttttg cgattatgta 540 ttaagtggag gtgtttttat gaagatagca ataggtagtg atcatgcagg attttcattg 600 aaaaaggaag ttataaaaca tttagagagt aaaaatattg aggttaaaga ttttggcact 660 ctaactgatg aatcatgtga ttatccagat tatgcattaa aagtagcaga ggaagttgct 720 caaaaaaact ttgagtttgg aatactcatt tgtggaacag gtataggaat aagcatatca 780 gcaaataagg tgccaggaat aagagcagct gtatgtacag atacattctg tgctcatgca 840 tcaagagaac ataacaatgc aaatatactt gcaatgggag aaagagttgt aggacctgga 900 ttagcaattg atatagtaga tacattttta aattcaaaat ttcagggaga taggcatcaa 960 agaagaatag acaagattac acaaatagaa aaaaaataca atggaggaat gaaataaaaa 1020 aataagagtt accatttaag gtaactctta tttttattac ttaagataat catatataac 1080 ttcagctcta ggcaatatta tatctgcaag aatgtgagag ctagaaacaa tctcttttac 1140 tggcaaatca ttaagtggcg ccatagcgtg atcaaataac tgcagtcgag ttggtcctgt 1200 ccaagcttca tgtacggtaa catctgtgat tttcgcattt ataagctcac atattctagg 1260 gcttccatca taattgggta ttattttcaa catataatta gggcgacaaa tttgatcctt 1320 tgcttcatta gcatctaagg ctttatgttt gtaccccatt gtagctgtcg caactctaag 1380 ttttccatag tctaaagttc ctactaaagt atctgaatcc acaaaaagct ttggataccc 1440 gagcttttta ggatatgcac ttaattccct tcctactgca attgcaggct cattatctaa 1500 atacatcata tgaagataat ctcccttaac tccattaaag cttacgggaa tagcctgtcc 1560 gctttctgta taacaaccaa gtccactcgt atcatgcatt gccataattt caaacctgac 1620 taagggctca tcaatttcta aaggctctgg cacaacttta cgaagtgcat ccatatctgt 1680 acgatataca atgttaaaat actcacgatt atgaaattta tagggtcctc taggaaatgc 1740 aggcgaagtt aatggcgtgc taatttgttt aattacttca tcctttaaca taaaagtcac 1800 cttcctaaat ttaataatgt ttagcttttc taacatactt tatcttcaca ttataaatcg 1860 cctctagtcc tatttattta tatctagtta ttttttgtcg actgtttcat agtatttctt 1920 tctaaacagc catgggtcta agttcattgg atatgagtaa atctgcagca gttaaagacc 1980 ttatttcatc aatggttgtg tttttattaa tttcagtgag aagtaaacca tcattaataa 2040 cctcaattac tccaagttct gttacaatta gatttgcttg agactttgcc gtgaggggaa 2100 gtgtacattt ttttaaaatt ttaggttgac ctttatttgt atgtctcatt gcaattatta 2160 ctttcttagc tccatttact aaatccatag ctccacccat accagagagc atttttccag 2220 gaacaatcca attggctata ttaccctttt catctacctg gagagcccct aaaacagtaa 2280 catctacgtg accaccacgg attagtgaaa acgaaactga gctatcgaaa aatgtgccgt 2340 caggaagtac tgttgtatag tctcctcctg catttactac atctttatct gcctcattta 2400 ttttaggact agcgcccatt ccaactattc cgttttctga ttggaaagta attttgaaat 2460 tttttggtat ataatctgca accatggtag gaagacctac acctaagttt acaagttgac 2520 cattttttaa ttctcttgca actcttttgg ctattatttc tttcgctagg tttttatcat 2580 taatcatttt atgcaggctc ctttactata taatttataa gaactccggg ggtcattgct 2640 ttttcctttt ctagtttttc acagctaact aaattttcag cttcaactat tacggtttta 2700 gctgccattg ccatataggg attaaagttt ttagtagtac ctttatagaa ggtgtttccg 2760 gcctcatcta caatactacc tttaattaat gctacatcgg ctgtaagagg tagctctaac 2820 aaatattccg ttccatttat agatattttt ttctttcctt tttcaatcaa agttcctaaa 2880 cctgttttag ttagtacacc acctaagcca gatccgcctg cacgtattct ttccactaga 2940 gttccttggg gagagagctc tacttcaagt tcattattaa aaagtttttt gccagtatct 3000 gggttgctgc ctatatatga agcaataagc ttttttactt gattatttga tattaactta 3060 ccaatacctg tattaggata acatgtatca ttacttataa tcgttaaatt ctttatattt 3120 aaattaacta aaaaatcaat taatttggtt ggagtgccac agtttaaaaa acctccaatc 3180 ataattgtca tcccatcttt aaagaatgac cttaaatttt caaatctaat tattttagag 3240 ttcattttaa tccctccttt taaattctct agaaaaatta tctcgaggta taatcctcca 3300 tgatctatta tgttataata taactactgc tttaattaag tcttttggct tgtctttcat 3360 taataacagt gcttcttcta tgtgatcaaa tccatgatat acatgtgtaa ctaatttact 3420 tagatcaaca cgattatata ctaccatatc tcttaacatt tctgctctca aacgtccccc 3480 aggacaaaga cctcctttta tagtcttgtg agccattcca catccccatt ctacacgtgg 3540 tattagtaaa gcatctccac ttccatgata atttatatta gaaattattc ctcctggttt 3600 aaccatagat actgcttggg ataatgtttc agaaccaccg cctgccataa ttacgcggtc 3660 aacgcctttt ccattcgtta atttcataac ttgatcaact atatgaccat ttttataatt 3720 tagaatatct gttgctccat aaaattttgc agcctcaaca caaatcggcc tgctccccac 3780 tccaattatt ctacctgctc cacgtaattt agcacctgct attcccatta agccaacagc 3840 tccaatgcca attaccacaa cacttgaacc catttgaata tctgcaagtt ctgctccatg 3900 aaatccagta gtcatcatat ctgttatcat aacagcattt tctaatggca tgtctttagg 3960 tagaatcgca agattcatat ccgcatcatt tacatgaaaa tattcaccaa aaactccatc 4020 cttgaaattt gaaaatttcc atcctgcgag cataccgttt gagtgctgtt gaaaaccagc 4080 ttgaacttcc aaagatctcc aatctggagt tgtacaagga actataactc tgtcaccagg 4140 tttaaaatcc ttcacttcac ttcctacttc aacaacttca cctacagctt catgccctaa 4200 aatcatattc ttcctatctc caagagctcc ctcaaaaaca gtatgtatat ctgatgtaca 4260 cggagatact gctaatgggc gtacaatagc atcatatgaa cccgcaactg gcctttcttt 4320 ttcgatccat cctaacttat taatacctag cattgcaaaa cctttcataa aatatgttcc 4380 tccttaaaaa tattccttta atagtctaag ggcccccata gtttatccct aatttatacg 4440 ttttctctaa caacttaatt atacccacta ttattatttt tatcaatata ttttgttaaa 4500 aaaaacacaa agtttaatat tttttaacaa aaaaattaaa cttatgcata tgctaacccc 4560 cttaaaatca tgttttagca taaatacata agtttatatt ttaactatat taatgtaata 4620 aaaaatactt gattgcataa ataaaaaggg ctgaaaaata aatttcagtc cttttattta 4680 tattttaact ttattccatg ccactgcctc ttctgataat aatagaaatt attaaagtta 4740 atacagatgt aagggcaact gttccacctg gagcacaatt taagtaataa gagctaaata 4800 atccaacgag tacatctata aagctaaata atattgataa tataagcgtt gacttaaatc 4860 cctttttaaa ctgcatagca gcagctacag gtacagctaa tagtgaagag acaactaata 4920 tccctgttat acgtattgaa acggatataa cgaaaccgac aacgatagaa aatatgtaat 4980 ttaaaaattt tgtgtttatg ccagataccc ttgcaccttg ctcatcaaat gttgtatata 5040 aaaagttgtt ataaaatata gctataagaa atatagatac tacacttatt attagtataa 5100 gtacgagatc acttttacca acagttaaaa tacttccaaa aagaaaagat tcaatgtttc 5160 cgcttgcacg tccacttgtt gttaaggtta tagctattcc aacagataga gttaatataa 5220 ttggaagtat taagtccgaa tactgcttaa aggagtttct aagtaattct attaagacag 5280 cacaaatagt tacaaaaata aaggttgtta tcataggatt tacgccaata aagataccta 5340 tagctacacc ggcaaaagaa gcatgtgata atgcatcacc taccattgag tgtcttttta 5400 aaactaagaa aatacctata agtggacaca aaattgcaat cattaccgag gcaagtaaag 5460 cgttttgcat aaaacttaga cgaaatagtt caatcattat ttaacaacct ccatattgct 5520 ttttaaaaaa tcgttaatgt taagcaaaga gccactttct ccatggaaat tgaaaatatg 5580 agttgaatta gaataagcag cctttaaatt atgttctaca catattattg tgaattcgta 5640 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 5700 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 5760 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 5820 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 5880 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 5940 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6000 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6060 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6120 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6180 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6240 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6300 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6360 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6420 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6480 cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 6540 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 6600 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 6660 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 6720 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 6780 tatatatgag taaacttggt ctgacagtta ccaaagctag cttaatacta gtatatactt 6840 aatgtgataa gtgtctgaca gctgaccggt ctaaagaggt ccctagcgcc tacggggaat 6900 ttgtatcgat aaggggtaca aattcccact aagcgctcgg ccggggatcg atccccgggt 6960 acgtacccgg cagtttttct ttttcggcaa gtgttcaaga agttattaag tcgggagtgc 7020 agtcgaagtg ggcaagttga aaaattcaca aaaatgtggt ataatatctt tgttcattag 7080 agcgataaac ttgaatttga gagggaactt agatggtatt tgaaaaaatt gataaaaata 7140 gttggaacag aaaagagtat tttgaccact actttgcaag tgtaccttgt acctacagca 7200 tgaccgttaa agtggatatc acacaaataa aggaaaaggg aatgaaacta tatcctgcaa 7260 tgctttatta tattgcaatg attgtaaacc gccattcaga gtttaggacg gcaatcaatc 7320 aagatggtga attggggata tatgatgaga tgataccaag ctatacaata tttcacaatg 7380 atactgaaac attttccagc ctttggactg agtgtaagtc tgactttaaa tcatttttag 7440 cagattatga aagtgatacg caacggtatg gaaacaatca tagaatggaa ggaaagccaa 7500 atgctccgga aaacattttt aatgtatcta tgataccgtg gtcaaccttc gatggcttta 7560 atctgaattt gcagaaagga tatgattatt tgattcctat ttttactatg gggaaatatt 7620 ataaagaaga taacaaaatt atacttcctt tggcaattca agttcatcac gcagtatgtg 7680 acggatttca catttgccgt tttgtaaacg aattgcagga attgataaat agttaacttc 7740 aggtttgtct gtaactaaaa actagtattt aacctaggat caaaaaaatt tccaataatc 7800 ccactctaag ccacaaacac gccctataaa atcccgcttt aatcccactt tgagacacat 7860 gtaatattac tttacgccct agtatagtga taatttttta cattcaatgc cacgcaaaaa 7920 aataaagggg cactataata aaagttcctt cggaactaac taaagtaaaa aattatcttt 7980 acaacctccc caaaaaaaag aacaggtaca aagtacccta taatacaagc gtaaaaaaaa 8040 tgagggtaaa aataaaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 8100 taaaaaaata taaaaataaa aaaatataaa aataaaaaaa tataaaaata aaaaaataaa 8160 aaaatataaa aataaaaaaa taaaaaaata taaaaatatt ttttatttaa agtttgaaaa 8220 aaattttttt atattatata atctttgaag aaaagaatat aaaaaatgag cctttataaa 8280 agcccatttt ttttcatata cgtaatatga cgttctaatg tttttattgg tacttctaac 8340 attagagtaa tttctttatt tttaaagcct ttttctttaa gggcttttat tttttttctt 8400 aatacattta attcctcttt ttttgttgct tttcctttag cttttaattg ctcttgataa 8460 ttttttttac ctctaatatt ttctcttctc ttatattcct ttttagaaat tattattgtc 8520 atatattttt gttcttcttc tgtaatttct aataactcta taagagtttc attcttatac 8580 ttatattgct tatttttatc taaataacat ctttcagcac ttctagttgc tcttataact 8640 tctctttcac ttaaatgttg tctaaacata ctattaagtt ctaaaacatc atttaatgcc 8700 ttctcaatgt cttctgtaaa gctacaaaga taatatctat ataaaaataa tataagctct 8760 ctgtgtcctt ttaaatcata ttctcttagt tcacaaagtt ttattatgtc ttgtattctt 8820 ccataatata aacttctttc tctataaata taatttattt tgcttggtct accctttttc 8880 ctttcatatg gttttaattc aggtaaaaat ccattttgta tttctcttaa gtcataaata 8940 tattcgtact catctaatat attgactact gtttttgatt tagagtttat acttcctgga 9000 actcttaata ttctcgttgc atctaaggct tgtctatctg ctccaaagta ttttaattga 9060 ttatataaat attcttgaac cgctttccat aatggtaatg ctttactagg tactgcattt 9120 attatccata ttaaatacat tcctcttcca ctatctatta catagtttgg tataggaata 9180 ctttgattaa aataattctt ttctaagtcc attaatacct ggtctttagt tttgccagtt 9240 ttataataat ccaagtctat aaacagtgta tttaactctt ttatattttc taatcgccta 9300 cacggcttat aaaaggtatt tagagttata tagatatttt catcactcat atctaaatct 9360 tttaattcag cgtatttata gtgccattgg ctatatcctt ttttatctat aacgctcctg 9420 gttatccacc ctttacttct actatgaata ttatctatat agttcttttt attcagcttt 9480 aatgcgtttc tcacttattc acctcccctt ctgtaaaact aagaaaatta tatcatattt 9540 tcaataatta ttaactattc ttaaactctt aataaaaaat agagtaagtc cccaattgaa 9600 acttaatcta ttttttatgt tttaatttat tatttttatt aaaatatttt aaactaaatt 9660 aaatgattct ttttaatttt ttactatttc attccataat atattactat aattatttac 9720 aaataatatt tcttcatttg taatatttag atgatttact aattttagtt tttatatatt 9780 aaataattaa tgtataattt atataaaaaa tcaaaggagc ttataaatta tgattatttc 9840 caaagatact aaagatttaa tttttttcaa ttttaacaat actttttgta atattatgtt 9900 taaatttaat tgtatttttt tcatataata aagccgttga agtaaaccaa tccattttcc 9960 ttatgatgtt attattaaat ttaagtttta taataatatc tttattatat ttattgtttt 10020 taaaaaaact agtgaaattt ctagtgaaat ttccggcttt attaaactta tttttaggaa 10080 ttttattttc attttcatct ttacaggatt tgattatatc tttaaatatg ttttatcaaa 10140 tattatcttt ttctaaattt atatatattt ttattatatt tattattata tatattttat 10200 ttttaagttt ctttctaaca gctattaaaa agaaacttaa aaataaaaac acgtactcta 10260 aaccaataaa taaaactatt tttattattg ctgccttgat tggaatagtt tttagtaaaa 10320 ttaatttcaa tattccacaa tattatatta taagctagca cgcctcgagt atattgataa 10380 aaataataat agtgggtata attaagttgt taggaggtta gttagaacta aatgtaaaat 10440 gttagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 10500 aaaagtggca ccgagtcggt gctttttttg aagcttg 10537 <210> 27 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 ctttttaaaa aagttaaata aggaagg 27 <210> 28 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 gtttaactta agttacagaa aagctagg 28 <210> 29 <211> 12849 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 29 ctagtagtgg atttaatccc aaatgagcca acagaaccag aaccagaaac agaatcagaa 60 caagtaacat tggatttaga aatggaagaa gaaaaaagca atgacttcgt gtgaataatg 120 cacgaaatcg ttgcttattt ttttttaaaa gcggtatact agatataacg aaacaacgaa 180 ctgaatagaa acgaaaaaag agccatgaca catttataaa atgtttgacg acattttata 240 aatgcatagc ccgataagat tgccaaacca acgcttatca gttagtcaga tgaactcttc 300 cctcgtaaga agttatttaa ttaactttgt ttgaagacgg tatataaccg tactatcatt 360 atatagggaa atcagagagt tttcaagtat ctaagctact gaatttaaga attgttaagc 420 aatcaatcgg aaatcgtttg attgcttttt ttgtattcat ttatagaagg tggagtttgt 480 atgaatcatg atgaatgtaa aacttatata aaaaatagtt tattggagat aagaaaatta 540 gcaaatatct atacactaga aacgtttaag aaagagttag aaaagagaaa tatctactta 600 gaaacaaaat cagataagta tttttcttcg gagggggaag attatatata taagttaata 660 gaaaataaca aaataattta ttcgattagt ggaaaaaaat tgacttataa aggaaaaaaa 720 tctttttcaa aacatgcaat attgaaacag ttgaatgaaa aagcaaacca agttaattaa 780 acaacctatt ttataggatt tataggaaag gagaacagct gaatgaatat cccttttgtt 840 gtagaaactg tgcttcatga cggcttgtta aagtacaaat ttaaaaatag taaaattcgc 900 tcaatcacta ccaagccagg taaaagcaaa ggggctattt ttgcgtatcg ctcaaaatca 960 agcatgattg gcggtcgtgg tgttgttctg acttccgagg aagcgattca agaaaatcaa 1020 gatacattta cacattggac acccaacgtt tatcgttatg gaacgtatgc agacgaaaac 1080 cgttcataca cgaaaggaca ttctgaaaac aatttaagac aaatcaatac cttctttatt 1140 gattttgata ttcacacggc aaaagaaact atttcagcaa gcgatatttt aacaaccgct 1200 attgatttag gttttatgcc tactatgatt atcaaatctg ataaaggtta tcaagcatat 1260 tttgttttag aaacgccagt ctatgtgact tcaaaatcag aatttaaatc tgtcaaagca 1320 gccaaaataa tttcgcaaaa tatccgagaa tattttggaa agtctttgcc agttgatcta 1380 acgtgtaatc attttggtat tgctcgcata ccaagaacgg acaatgtaga attttttgat 1440 cctaattacc gttattcttt caaagaatgg caagattggt ctttcaaaca aacagataat 1500 aagggcttta ctcgttcaag tctaacggtt ttaagcggta cagaaggcaa aaaacaagta 1560 gatgaaccct ggtttaatct cttattgcac gaaacgaaat tttcaggaga aaagggttta 1620 atagggcgta ataacgtcat gtttaccctc tctttagcct actttagttc aggctattca 1680 atcgaaacgt gcgaatataa tatgtttgag tttaataatc gattagatca acccttagaa 1740 gaaaaagaag taatcaaaat tgttagaagt gcctattcag aaaactatca aggggctaat 1800 agggaataca ttaccattct ttgcaaagct tgggtatcaa gtgatttaac cagtaaagat 1860 ttatttgtcc gtcaagggtg gtttaaattc aagaaaaaaa gaagcgaacg tcaacgtgtt 1920 catttgtcag aatggaaaga agatttaatg gcttatatta gcgaaaaaag cgatgtatac 1980 aagccttatt tagtgacgac caaaaaagag attagagaag tgctaggcat tcctgaacgg 2040 acattagata aattgctgaa ggtactgaag gcgaatcagg aaattttctt taagattaaa 2100 ccaggaagaa atggtggcat tcaacttgct agtgttaaat cattgttgct atcgatcatt 2160 aaagtaaaaa aagaagaaaa agaaagctat ataaaggcgc tgacaaattc ttttgactta 2220 gagcatacat tcattcaaga gactttaaac aagctagcag aacgccctaa aacggacaca 2280 caactcgatt tgtttagcta tgatacaggc tgaaaataaa acccgcacta tgccattaca 2340 tttatatcta tgatacgtgt ttgttttttc tttgctgttt agcgaatgat tagcagaaat 2400 atacagagta agattttaat taattattag ggggagaagg agagagtagc ccgaaaactt 2460 ttagttggct tggactgaac gaagtgaggg aaaggctact aaaacgtcga ggggcagtga 2520 gagcgaagcg aacacttgat tttttaattt tctatctttt ataggtcatt agagtatact 2580 tatttgtcct ataaactatt tagcagcata atagatttat tgaataggtc atttaagttg 2640 agcatattag aggaggaaaa tcttggagaa atatttgaag aacccgatta catggattgg 2700 attagttctt gtggttacgt ggtttttaac taaaagtagt gaatttttga tttttggtgt 2760 gtgtgtcttg ttgttagtat ttgctagtca aagtgattaa atagaattct agcgccattc 2820 gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2880 ccagctggcg aaagggggat gaaataaaag gttattttgc attgacaaag ataattaaat 2940 attttattat tagttcataa gttagtttaa tatactaaca aaaataaagc aagtaaaata 3000 tacctaaaat ataaaaaaat taggatagga aaacgatagt tatgaagtgg cattcaagga 3060 gggatggata aaaagtacag tattggtcta gacataggaa ctaactctgt tgggtgggct 3120 gttataacag atgaatataa agttccatca aaaaaattta aagtattagg aaacactgat 3180 agacattcaa taaaaaaaaa cttgataggt gctttattat tcgattcagg agagactgct 3240 gaagctacac gtttaaaaag aacagctaga cgtagatata caagaagaaa aaataggata 3300 tgttatcttc aagaaatttt tagtaatgaa atggcaaaag ttgatgattc attctttcac 3360 agactagaag aaagtttctt agttgaagaa gataagaagc atgaaagaca ccctattttt 3420 ggtaatatcg tagatgaagt agcatatcat gagaagtatc caactatcta tcatttaaga 3480 aagaaattag ttgattctac agataaagct gatctgagat taatatattt agctttagct 3540 catatgatta aatttagagg acatttttta atagaaggtg atttaaaccc agacaacagc 3600 gatgtagata aattatttat ccaattagtt caaacttata atcaattatt cgaagagaat 3660 ccaattaatg caagtggtgt agacgctaag gctatattat cagctagatt atcaaaatct 3720 agaagattag aaaatctaat agctcaactt cctggagaaa agaaaaatgg actttttggg 3780 aacctaatag ctctctcact cggactaaca ccaaatttta aaagcaattt tgatcttgct 3840 gaagacgcaa agttacaact atcaaaggat acatacgatg atgatttaga taatttgtta 3900 gctcaaatag gtgatcaata tgctgatttg tttcttgcag caaaaaactt aagtgatgca 3960 attttactat cagatatact tagagtaaat acagaaataa caaaggctcc tttatcagca 4020 agtatgatta aacgatatga tgagcatcat caagatttaa cattattaaa ggcacttgta 4080 agacaacaat taccagaaaa atataaagaa attttctttg atcaatctaa aaatggatat 4140 gctggatata tagacggtgg agcaagtcaa gaagagtttt ataaatttat aaagcctatt 4200 ttagaaaaaa tggatggaac tgaagaatta cttgttaaac ttaacagaga agatttactt 4260 agaaaacaaa gaacttttga taatggttca attcctcacc aaattcattt aggagaatta 4320 catgctatac taagaagaca agaagatttt tatccatttc ttaaagataa tagagaaaaa 4380 attgaaaaaa ttttaacttt tagaatacca tattatgtag gaccacttgc aaggggaaat 4440 tcaagatttg catggatgac tagaaaatca gaagaaacta taaccccgtg gaattttgaa 4500 gaagtagtag ataaaggagc tagtgctcaa tcatttatag aaagaatgac aaattttgat 4560 aagaatcttc ctaacgaaaa ggttttgcca aagcatagcc ttctttatga gtattttaca 4620 gtttataatg agcttactaa agtaaaatac gttacagaag gaatgagaaa accagcattt 4680 ttgtctggtg aacaaaagaa agcaatagta gacctattat ttaaaacaaa taggaaggtt 4740 accgtaaagc aacttaaaga agattacttc aaaaaaattg aatgctttga tagtgttgaa 4800 atatcaggag ttgaagatag atttaatgct tcacttggta catatcacga tctcttaaaa 4860 attataaaag ataaggattt tttagataat gaagaaaatg aagatattct tgaagatata 4920 gtattaacat tgacactttt tgaagataga gaaatgatag aagaaagatt aaaaacatat 4980 gcacatcttt ttgatgataa ggttatgaag caacttaaaa gaagaagata tacaggttgg 5040 ggacgtttgt caagaaagct aattaatggt attagagata aacaatcagg aaagactatt 5100 ctcgattttc ttaaatcaga tggatttgct aatagaaact ttatgcaatt aattcatgat 5160 gattctctta ctttcaaaga ggatattcaa aaggctcaag tttctggaca aggcgatagc 5220 ttacacgaac acattgctaa ccttgcaggg agccccgcta tcaaaaaagg aattttacaa 5280 acagttaaag ttgtagatga acttgttaaa gttatgggaa gacacaaacc tgagaatata 5340 gttatagaaa tggccagaga aaatcaaaca acacaaaaag gacaaaaaaa ttctagagag 5400 agaatgaaga gaattgaaga aggaataaaa gagctaggat cacaaatatt aaaagaacat 5460 ccagttgaaa atactcaatt gcaaaatgaa aagttatatt tgtattactt acaaaatgga 5520 agagatatgt atgttgatca agaactcgat attaatagat taagtgacta tgatgttgat 5580 catattgttc ctcaatcatt tttaaaagat gattcaatcg ataacaaagt attaactaga 5640 tcagataaaa atagaggaaa gtcagataat gtaccatctg aagaagttgt taaaaaaatg 5700 aagaactatt ggagacaact tttaaatgca aagctaatta cacaaagaaa atttgacaat 5760 ttaacaaaag cagaaagagg aggattaagc gaattagaca aagctggatt tataaaaaga 5820 caacttgttg agacaagaca aataactaag catgttgctc aaatacttga ttcaagaatg 5880 aatacaaaat atgatgaaaa tgataaatta atcagagaag taaaagtaat aacattaaag 5940 tcaaaattag tatcagattt cagaaaggat tttcaatttt acaaagttcg tgaaataaat 6000 aactatcatc atgctcatga tgcatactta aatgctgttg taggaactgc tcttattaag 6060 aaatatccta aactagaaag cgaatttgtt tatggagatt ataaagttta tgatgtgcgc 6120 aaaatgatcg cgaaatccga acaagaaatc ggtaaggcta cagcaaaata tttcttttat 6180 agtaatataa tgaatttttt taagacagaa ataactttgg ctaatggtga aatcagaaaa 6240 agaccactta tcgaaacaaa tggagagaca ggagaaatag tatgggataa aggaagagat 6300 tttgctactg ttagaaaagt actaagtatg ccacaagtaa atatcgtaaa gaaaactgaa 6360 gttcaaactg gaggtttctc taaggaatca attttaccta agagaaattc agataagtta 6420 attgcaagga aaaaagattg ggacccaaaa aaatacggtg gttttgatag tccaacagtt 6480 gcctatagtg ttcttgtagt agcgaaagtt gagaaaggta agtcaaaaaa gttgaaaagc 6540 gtaaaagaac ttcttggtat cacaattatg gaaagatctt catttgaaaa aaatccaatt 6600 gactttttag aagctaaggg ttataaagaa gttaaaaagg atttaatcat aaaactacca 6660 aagtatagtc tatttgaact cgaaaacgga agaaaacgaa tgctcgctag cgcaggagaa 6720 cttcaaaaag gaaatgaact tgcgctgcca tcaaagtatg taaatttctt atatttagct 6780 tctcattatg agaaattaaa aggatcacca gaggataatg aacaaaagca actatttgta 6840 gaacaacaca aacattattt agatgaaata atagaacaaa tatctgaatt ttctaaaaga 6900 gttatacttg ccgacgcaaa tctagataag gtgctttcag cgtataataa acacagagat 6960 aaaccaataa gagaacaagc agaaaacatt atccatcttt ttacattaac taatcttggt 7020 gcaccagctg catttaagta ctttgataca acaatagata gaaaaagata cacatctact 7080 aaagaagtat tagacgcaac tttaatacat caatctatta cagggcttta tgaaacaaga 7140 attgatttaa gtcaactagg cggagattaa gaattttttt agaaagaaca tgtgagcaaa 7200 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7260 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 7320 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 7380 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 7440 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 7500 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 7560 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 7620 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 7680 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7740 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7800 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7860 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7920 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7980 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 8040 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 8100 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 8160 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 8220 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 8280 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 8340 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 8400 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 8460 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 8520 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 8580 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 8640 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 8700 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 8760 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8820 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8880 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8940 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 9000 ctgccgggcc tcttgcggga tcaaaagaaa aacgaaatga tacaccaatc agtgcaaaaa 9060 aagatataat gggagataag acggttcgtg ttcgtgctga cttgcaccat atcataaaaa 9120 tcgaaacagc aaagaatggc ggaaacgtaa aagaagttat ggaaataaga cttagaagca 9180 aacttaagag tgtgttgata gtgcagtatc ttaaaatttt gtataatagg aattgaagtt 9240 aaattagatg ctaaaaattt gtaattaaga aggagtgatt acatgaacaa aaatataaaa 9300 tattctcaaa actttttaac gagtgaaaaa gtactcaacc aaataataaa acaattgaat 9360 ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta aagggcattt aacgacgaaa 9420 ctggctaaaa taagtaaaca ggtaacgtct attgaattag acagtcatct attcaactta 9480 tcgtcagaaa aattaaaact gaatactcgt gtcactttaa ttcaccaaga tattctacag 9540 tttcaattcc ctaacaaaca gaggtataaa attgttggga gtattcctta ccatttaagc 9600 acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt ctgacatcta tctgattgtt 9660 gaagaaggat tctacaagcg taccttggat attcaccgaa cactagggtt gctcttgcac 9720 actcaagtct cgattcagca attgcttaag ctgccagcgg aatgctttca tcctaaacca 9780 aaagtaaaca gtgtcttaat aaaacttacc cgccatacca cagatgttcc agataaatat 9840 tggaagctat atacgtactt tgtttcaaaa tgggtcaatc gagaatatcg tcaactgttt 9900 actaaaaatc agtttcatca agcaatgaaa cacgccaaag taaacaattt aagtaccgtt 9960 acttatgagc aagtattgtc tatttttaat agttatctat tatttaacgg gaggaaataa 10020 ttctatgagt ccctaggggt tccgcgcaca tttccccgaa aagtgccacc tgaacgaagc 10080 atctgtgctt cattttgtag aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa 10140 gaatctgagc tgcattttta cagaacagaa atgcaacgcg aaagcgctat tttaccaacg 10200 aagaatctgt gcttcatttt tgtaaaacaa aaatgcaacg cgagagcgct aatttttcaa 10260 acaaagaatc tgagctgcat ttttacagaa cagaaatgca acgcgagagc gctattttac 10320 caacaaagaa tctatacttc ttttttgttc tacaaaaatg catcccgaga gcgctatttt 10380 tctaacaaag catcttagat tacttttttt ctcctttgtg cgctctataa tgcagtctct 10440 tgataacttt ttgcactgta ggtccgttaa ggttagaaga aggctacttt ggtgtctatt 10500 ttctcttcca taaaaaaagc ctgactccac ttcccgcgtt tactgattac tagcgaagct 10560 gcgggtgcat tttttcaaga taaaggcatc cccgattata ttctataccg atgtggattg 10620 cgcatacttt gtgaacagaa agtgatagcg ttgatgattc ttcattggtc agaaaattat 10680 gaacggtttc ttctattttg tctctatata ctacgtatag gaaatgttta cattttcgta 10740 ttgttttcga ttcactctat gaatagttct tactacaatt tttttgtcta aagagtaata 10800 ctagagataa acataaaaaa tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag 10860 gtggatgggt aggttatata gggatatagc acagagatat atagcaaaga gatacttttg 10920 agcaatgttt gtggaagcgg tattcgcaat attttagtag ctcgttacag tccggtgcgt 10980 ttttggtttt ttgaaagtgc gtcttcagag cgcttttggt tttcaaaagc gctctgaagt 11040 tcctatactt tctagagaat aggaacttcg gaataggaac ttcaaagcgt ttccgaaaac 11100 gagcgcttcc gaaaatgcaa cgcgagctgc gcacatacag ctcactgttc acgtcgcacc 11160 tatatctgcg tgttgcctgt atatatatat acatgagaag aacggcatag tgcgtgttta 11220 tgcttaaatg cgtacttata tgcgtctatt tatgtaggat gaaaggtagt ctagtacctc 11280 ctgtgatatt atcccattcc atgcggggta tcgtatgctt ccttcagcac taccctttag 11340 ctgttctata tgctgccact cctcaattgg attagtctca tccttcaatg ctatcatttc 11400 ctttgatatt ggatcatact aagaaaccat tattatcatg acattaacct ataaaaatag 11460 gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca 11520 catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 11580 ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc 11640 agagcagatt gtactgagag tgcaccatac cacagctttt caattcaatt catcattttt 11700 tttttattct tttttttgat ttcggtttct ttgaaatttt tttgattcgg taatctccga 11760 acagaaggaa gaacgaagga aggagcacag acttagattg gtatatatac gcatatgtag 11820 tgttgaagaa acatgaaatt gcccagtatt cttaacccaa ctgcacagaa caaaaacctg 11880 caggaaacga agataaatca tgtcgaaagc tacatataag gaacgtgctg ctactcatcc 11940 tagtcctgtt gctgccaagc tatttaatat catgcacgaa aagcaaacaa acttgtgtgc 12000 ttcattggat gttcgtacca ccaaggaatt actggagtta gttgaagcat taggtcccaa 12060 aatttgttta ctaaaaacac atgtggatat cttgactgat ttttccatgg agggcacagt 12120 taagccgcta aaggcattat ccgccaagta caatttttta ctcttcgaag acagaaaatt 12180 tgctgacatt ggtaatacag tcaaattgca gtactctgcg ggtgtataca gaatagcaga 12240 atgggcagac attacgaatg cacacggtgt ggtgggccca ggtattgtta gcggtttgaa 12300 gcaggcggca gaagaagtaa caaaggaacc tagaggcctt ttgatgttag cagaattgtc 12360 atgcaagggc tccctatcta ctggagaata tactaagggt actgttgaca ttgcgaagag 12420 cgacaaagat tttgttatcg gctttattgc tcaaagagac atgggtggaa gagatgaagg 12480 ttacgattgg ttgattatga cacccggtgt gggtttagat gacaagggag acgcattggg 12540 tcaacagtat agaaccgtgg atgatgtggt ctctacagga tctgacatta ttattgttgg 12600 aagaggacta tttgcaaagg gaagggatgc taaggtagag ggtgaacgtt acagaaaagc 12660 aggctgggaa gcatatttga gaagatgcgg ccagcaaaac taaaaaactg tattataagt 12720 aaatgcatgt atactaaact cacaaattag agcttcaatt taattatatc agttattacc 12780 ctatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgccct aggcccaact 12840 aactcaacg 12849 <210> 30 <211> 9367 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 30 aaaaataatg gccctaggga tatacaattt ttaaaaaata tagctaatct tgcataaact 60 atataataaa tctaatttta gaatgtataa tttaaagggt tatggctgta tatagtcata 120 acccttatat ttcattaatt aaagttaaat tttgtatatt caaaaagctc ttgatattta 180 cggcagagcc accatataga gatgcctcag accctaatga tgaaatttct atatttattc 240 ctttgttaaa agagctaact aacatatctt ttgtaatctg taatatctca gggatatcac 300 taattatttg gctatttaaa tatattattt caggagcata agttgtaata gcattattta 360 tagctattgt taagtaacta caaaactcat gaataacttt tttggcattc tggttatctt 420 cataatatag ttgctttact atatcagaat ctattttagg aatattttct aaagaagaaa 480 gctgttcaaa tacctttttt tctgaacaat actgttctaa acagccacga tttccacaag 540 gacatagttt accattaggc atgatgatag tgtgaccaat ttctccactc ataccatttc 600 tgccactata taatttatta tttattataa tgcctgaacc aaatccactg tgaatactga 660 gactaagtag tgagttatgt acagttgaaa aagtattctc agctaaagct gttaagtttg 720 cttcattttc tatgtgaata ggaaagtcat actttttgct aaggatgcta tataagtcaa 780 tctcattaag attgtaatat ggagtaaaca atactttatt ttcacaagta atcccatgta 840 tagccaaagt aagaccaatt accttataag gagtgtctat tttggatatg ttataactat 900 ttataatttc atctatcaat tgtataacat tgtctttact tacttgtata tctgttaatt 960 tcttagaatt tataatagtt ccatctaagt aagatagaga agaaaatata tagtcgtatc 1020 caatgtccat acttaaagaa atccctgcac atttattaaa tactaataat atgggttttc 1080 ttccgccact atgagtacta tttccaattc ctatttcatg aactagagat tcatcaataa 1140 gttttttggt aatagcggat atagttgctt tattcaatcc tatagtagaa gctatacttg 1200 ccctagaaat aggaccattt tttataattt gttcaagtac caatctttca ttcatttctc 1260 gaatagtgta tttatcagta accaatttga tattcctcct taaaataata ttgtaatact 1320 ttttacacaa aaataaaagg ttattttgca ttgacaaaga taattaaata ttttattatt 1380 agttcataag ttagtttaat atactaacaa aaataaagca agtaaaatat acctaaaata 1440 taaaaaaatt aggataggaa aacgatagtt atgaagtggc attcaaggag tatggaaaaa 1500 ctcaagttta tgcttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta 1560 tcaacttgaa aaagtggcac cgagtcggtg cttttaaagt attgttaaaa ataactctgt 1620 agaattataa attagttcta cagagttatt ttttaaaaaa attcaagctt gcatgcctgc 1680 aggccatttt agctaaggat atctataatg aaaagattta gaggaggaat aatttatgaa 1740 aaagattttt gtacttggag caggaacaat gggtgctggt atcgttcaag cattcgctca 1800 aaaaggttgt gaagtaattg taagagacat aaaggaagaa tttgttgaca gaggaatagc 1860 tggaatcact aaaggattag aaaagcaagt tgctaaagga aaaatgtctg aagaagataa 1920 agaagctata ctttcaagaa tttcaggaac aactgatatg aaattagctg ctgactgtga 1980 tttagtagtt gaagctgcaa tcgaaaacat gaaaattaag aaggaaatct tcgctgaatt 2040 agatggaatt tgtaagccag aagcgatttt agcttcaaac acttcatctt tatcaattac 2100 tgaagttgct tcagctacaa agagacctga taaagttatc ggaatgcatt tctttaatcc 2160 agctccagta atgaagcttg ttgaaattat taaaggaata gctacttctc aagaaacttt 2220 tgatgctgtt aaggaattat cagttgctat tggaaaagaa ccagtagaag ttgcagaagc 2280 tccaggattc gttgtaaaca gaatattaat cccaatgatt aacgaagctt catttatcct 2340 acaagaagga atagcttcag ttgaagatat tgatacagct atgaaatatg gtgctaacca 2400 tccaatggga cctttagctt taggagatct tattggatta gacgtttgct tagctatcat 2460 ggatgtttta ttcactgaaa caggtgataa caagtacaga gctagcagca tattaagaaa 2520 atatgttaga gctggatggc ttggaagaaa atcaggaaaa ggattctatg attactctaa 2580 ataatatcat gaatatatgg aaaaactcaa gtttatgctt caaactgctt cccctaattc 2640 cccattttta tatatatttg tattaaatta actttaatgt tacaatgttc ttagtatatt 2700 ttccttaata ttacattagt tctataaact ttattgttct taatatttaa ataaaatcca 2760 tgaagggagg aaaaaactat cttttaaaag tttatagtaa ataaaaaaaa attattaatg 2820 taaaaatata ctaagtatag aatatttata atagggggta ttaacttgtt ttcaaaaatc 2880 aaaaaaatta atttttttaa aaaaacattt tcttttttaa ttgctgttgt aatgatgttg 2940 tttacagtat taggaacaaa tacttataaa gctgaagctg caagtggtgg tgcctgggct 3000 caatgtggag gtgaaaactt ccatggtgat aaatgttgtg tttccggtca cacttgtgtt 3060 agtattaacc aatggtattc acaatgtcaa ccaggaggtg ctccaagcaa taatgcttca 3120 aacaataata ataacaataa caataataac aacaacaata ataacaacaa caataatcac 3180 aacaacaaca acaataacaa caataacaat aacaatggtg gtagtggtag tactaaaaac 3240 ttcttcgata accaaattta tgctaaccca aagtttattg aagaagtcaa ttcttctatt 3300 ccaagattaa gttatgattt acaacaaaag gctcaaaagg ttaagaatgt tccaactgcc 3360 gtttggttag cttgggatgg agccactgga gaagttgctc aacatcttaa agctgctggt 3420 tctaaaactg ttgtcttcat catgtacatg attccaactc gtgattgtaa cgctaatgcc 3480 tctgctggtg gtgctggtaa cctcaacact tacaagggat acgttgataa tattgctaga 3540 actattcgta gttatccaaa ttcaaaggtt gttatgattc ttgaaccaga tactcttggt 3600 aaccttgtta ctgctaatag tgctaactgt caaaacgttc gtaacttaca taagaatgct 3660 ttatcttatg gtgttaatgt tttcggtagc atgagtaatg ttagtgttta ccttgatgct 3720 gctcatggtg cttggttagg tagctctact gataaggttg cttctgttgt taaggaaatc 3780 ttaaataatg ctccaaatgg aaagattcgt ggtttaagta ctaacatttc taactaccaa 3840 tcaatttctt ctgaatacca ataccaccaa aaacttgcct ctgctcttgc tgctgtcggt 3900 gttccaaaca tgcacttcat tgttgatact ggtcgtaatg gtgttactat taattctgga 3960 acatggtgta acttagtcgg tactggtctt ggtgaacgtc caagaggtaa tccaaatgct 4020 ggtatgccat tattagatgc ttacatgtgg cttaagactc caggagaatc tgacggttca 4080 tcctctggtt ctagagctga tccaaattgt tctagtaatg attctcttag aggtgctcca 4140 gatgctggtc aatggttcca tgattacttc gctcaattag taagaaatgc tagaccatca 4200 ttttaagcaa atttctaaat gattgaattt aacaaaaatt actaatctag aggatccccg 4260 ggtaccgagc tcgaattcgt aatcatggaa atatataaat aactactaga ttacataaat 4320 aagtttaaat taaagaatat tgtaaaattc aacaaaacat tttattactg ttaagtaagt 4380 gatataatat attaaataat aactattttc ttaagattaa ttgtataatt taattgaata 4440 ttggatatta aaaaaataaa tagttaaaaa atatgatata ggtggtacac atcagaaaat 4500 gggcaatata aactgtgaca taatctttag aaaaaaactt tagtgtagaa tatattattt 4560 aaagaagaat atatgaatga aataagttaa aactaaggtt gatatgatat tatgtttatc 4620 aatgatttta ctaaaaagat aaaaatatat tttgaatatt cataatcaaa gggtagggtt 4680 catcaatatg catattagat tatgagatga tgcaaactaa ataattttat actgtaaggg 4740 agacggataa taaaatggat tataaatctg tagaatttta tgataattat ttaataataa 4800 aagaattaag aaattttaaa ttaaaacata tatttgagtg cggacagatt tttaggtttg 4860 aagaggtagc agaaaatgat tttattgtaa ttgcgtttgg aagattaatt gaagttaaag 4920 aagatggaaa tgacgtaata atttataatt ctacaaagga agattttaaa aatatttggc 4980 ttaagtattt tgatttagat agagattact cagttataaa agatgaactt tcaaaagatg 5040 ttttacttaa acaaagtatt gaatttggat atggtgttag agtcttgaat caagatccat 5100 ttgaaatgtt gcttagcttt attatttcag cgcgaaataa tataccatca ataaagaaga 5160 ctgtaaataa aatatctaat aaatggggaa aagaaattat ttataaggat aaaacctact 5220 atgcgtttcc taatataggt gaaataaaag atgctacact agaagaaata caggagacag 5280 gagcatcttc catggacgcg tgacgtcgac tctagaaatt cttctaaata taagaatatt 5340 ttaaagaaat atctttatat attagttatt aaaatttata agattataag aaacattata 5400 acatatttta gaacttttta actattctaa aagattaatt tacatattaa catttaatta 5460 tgggtaaaaa ctattttgaa aaatgattta tatggaatta tgtttcttaa atatacaatc 5520 atgtttcatg aatacataat tattttaaat gtattgggag ggtaaattga ttgtgaaacg 5580 cggcgatgtt tattttgctg atttatctcc tgttgttggc tcagagcaag gcggggtgcg 5640 cccggtttta gtgatccaaa atgacatcgg aaatcgcttc agcccaactg ctattgttgc 5700 agccataaca gcacaaatac agaaagcgaa attaccaacc cacgtcgaaa tcgatgcaaa 5760 acgctacggt tttgaaagag attccgttat tttgctggag caaattcgga cgattgacaa 5820 gcaaaggtta acggataaga ttactcatct ggatgatgaa atgatggata aggttgatga 5880 agccttacaa atcagtttgg cactcattga tttttagaca tatttgcagg ttgctcaaat 5940 agagcgaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 6000 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 6060 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 6120 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 6180 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 6240 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 6300 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 6360 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 6420 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 6480 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 6540 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 6600 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 6660 agggattttg gtcatgagat tatcaaaaag gagtttaaac ttctaaaatc tgattaccaa 6720 ttagaatgaa tatttcccaa atattaaata ataaaacaaa aaaattgaaa aaagtgtttc 6780 caccattttt tcaatttttt tataattttt ttaatctgtt atttaaatag tttatagtta 6840 aatttacatt ttcattagtc cattcaatat tctctccaag ataactacga actgctaaca 6900 aaattctctc cctatgttct aatggagaag attcagccac tgcatttccc gcaatatctt 6960 ttggtatgat tttacccgtg tccatagtta aaatcatacg gcataaagtt aatatagagt 7020 tggtttcatc atcctgataa ttatctatta attcctctga cgaatccata atggctcttc 7080 tcacatcaga aaatggaata tcaggtagta attcctctaa gtcataattt ccgtatattc 7140 ttttattttt tcgttttgct tggtaaagca ttatggttaa atctgaattt aattccttct 7200 gaggaatgta tccttgttca taaagctctt gtaaccattc tccataaata aattcttgtt 7260 tgggaggatg attccacggt accatttctt gctgaataat aattgttaat tcaatatatc 7320 gtaagttgct tttatctcct attttctttg aaataggtct aattttttgt ataagtattt 7380 ctttactttg atctgtcaat ggttcagata cgacgactaa aaagtcaaga tcactatttg 7440 gttttagtcc actctcaact cctgatccaa acatgtaagt accaataagg ttatttttta 7500 aatgtttccg aagtattttt ttcactttat taatttgttc gtatgtattc aaatatatcc 7560 tcctcactat tttgattagt acctatttta tatccatagt tgttaattaa ataaacttaa 7620 tttagtttat ttatagattt cattggcttc taaatttttt atctagataa taattatttt 7680 agttaatttt attctagatt atatatgata tgatctttca tttccataaa actaaagtaa 7740 gtgtaaacct attcattggg ccggccgctt ataatccata acaatcatcc tttctgtgac 7800 actgtcagac acttatcaca ttaagtatat actattatta aactattcta tatacttaat 7860 ttattttaat agaaaaacat aatatcataa taacttcaaa attaaacttt atttatgatt 7920 tcatacttga ctttgatttt agaaaggata tactttttag cagatttgga aacggctttg 7980 gacgtagttt gcccatagat gaacaaacaa actacatcca aaaattatac ttttcccttc 8040 attggtatcc gtatttttac atcttaatag cgtatgtatt acaacacacc taaacaacga 8100 ccttacggtc tgctactgca tatcctagct tgattgttta gttgcctcaa ctatgcttaa 8160 ccctaccccg aactcttttt ttattgtggg ttttcgtcgt gaagtcccac cgacacataa 8220 tcataacata agatgtatta tgaaaatgcg agtgactatc cttttgtatc ggctcactac 8280 accacagata tattttttag tgcatactgt gtcggcactc tcaatattaa attaataaat 8340 aaattatttt ttctttttac tcttctttac atgagctttt ttaaagctcc ttgcataata 8400 tttaatgcat gtacgttctt ttttctgttc ttcctctgta aaacatctca tttttatggc 8460 acaccatcca tatcggttca tctttgaaca attaatacat tggactttcc ctttatgtaa 8520 acatcttgac tcattgtatt tactgcaata ggttgctact gttttatcat gaatcatcaa 8580 cgaatgtatt ttgcatattt cagtatcttt aataaactct ttgcaatttt tacaagtttt 8640 catatacgcc cttcttttca taaattaatt tatgaattct atgtattcca aggagctttt 8700 taaagctccc cctttcgtac tacttagcta caagcactat aaaagtcata atgtttactg 8760 ctaaagtcaa taatgatatt gctaatacct tgttatttga taagatactg ctttcctctg 8820 tcactttgct cacccccttt cattttcata aattaattat gaaaaaataa atatacttct 8880 aatttttatc aaataaaaaa gcctttgcgt actgcttcca atacacaaag gctataaact 8940 tctaaatctt acttattgca atttacattt atatctgtta agataatctc ataaattgaa 9000 tatatatagt taatgtttct cttgtatgtc ggtacatttg aaatattgct atagatagag 9060 ttctctaacg gcttgatgtg ttggtagcac atttaagttt tggcttatat actaagttgg 9120 tagcttaata tataagagct gaggacttat ttttttatta aatttttcaa cttgtctata 9180 ttttaacccg taattgaata cataacaagt attttttttt gtattcaatt aaacattcat 9240 aaatgagtat aattaatcat actaaattct ataattttct tttctgtaaa tttctttcta 9300 ttcagcactg ttatgccttt tgactatcac ttaataaaaa ataagaaatg aattgtcaat 9360 tgttcaa 9367 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 agataattat gaagttaatc cttag 25 <210> 32 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 32 catttgcttt caggtcttct tttgctg 27

Claims

클로스트리듐(Clostridium) 속의 용매형성성(solventogenic) 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구로서,
- 적어도 Cas9을 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및
- 상동성 재조합 기전에 의해, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산
을 포함하는 것을 특징으로 하고, i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나, 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함하며, 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함하는 것을 특징으로 하는 유전자 도구.
제1항에 있어서, 상기 하나 이상의 가이드 RNA를 코딩하는 서열은 프로모터가 선행되고 상기 프로모터 또는 Cas9 제어 프로모터는 유도성 프로모터인 것을 특징으로 하는 유전자 도구.
제1항 또는 제2항에 있어서, 박테리아 DNA의 표적화 부분은 박테리아 생존에 필수적인 유전자 또는 유전자 부분을 포함하는 것을 특징으로 하는 유전자 도구.
제1항 내지 제3항 중 어느 한 항에 있어서, 클로스트리듐 속의 용매형성성 박테리아는 씨. 아세토부틸리컴(C. acetobutylicum), 씨. 셀룰롤리티컴(C. cellulolyticum), 씨. 피토퍼멘탄스(C. phytofermentans), 씨. 베이제린키(C. beijerinckii), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 사카로퍼부틸아세토니컴(C. saccharoperbutylacetonicum), 씨. 스포로제네스(C. sporogenes), 씨. 부티리컴(C. butyricum), 씨, 아우란티부티리컴(C. aurantibutyricum) 및 씨. 티로부티리컴(C. tyrobutyricum)으로부터 선택되는 것을 특징으로 하는 유전자 도구.
제4항에 있어서, 용매형성성 박테리아가 씨. 아세토부틸리컴일 때, 상기 씨. 아세토부틸리컴 박테리아는 ATCC824 균주이고, 용매형성성 박테리아가 씨. 베이제린키일 때, 상기 씨. 베이제린키 박테리아는 DSM 6423 균주인 것을 특징으로 하는 유전자 도구.
제1항 내지 제5항 중 어느 한 항에 있어서, Cas9 단백질은 SEQ ID NO: 1의 서열을 포함하는 것을 특징으로 하는 유전자 도구.
제1항 내지 제6항 중 어느 한 항에 있어서, Cas9 프로모터는 유도성 프로모터인 것을 특징으로 하는 유전자 도구.
제1항 내지 제7항 중 어느 한 항에 있어서, 관심 DNA 서열은 용매의 생성을 촉진하는 적어도 하나의 생성물, 전형적으로 알데하이드에서 알코올로의 전환에 관여하는 적어도 하나의 효소, 막 단백질, 전사 인자, 또는 이의 조합을 코딩하는 것을 특징으로 하는 유전자 도구.
제1항 내지 제8항 중 어느 한 항에 있어서, 도구 내에 존재하는 각각의 핵산은 별개의 발현 카세트 또는 별개의 벡터, 예를 들어 플라스미드에 속하는 것을 특징으로 하는 유전자 도구.
클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환시키기 위한 방법으로서, 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함하는 것을 특징으로 하는 방법.
제10항에 있어서, 하기 단계를 포함하는 것을 특징으로 하는 방법:
a) 적어도 하나의 유도성 프로모터를 포함하는 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구를 박테리아에 도입시키는 단계, 및
b) 박테리아를 유전자 변형시키기 위해 유도성 프로모터의 발현을 유도시키는 단계.
제10항 또는 제11항에 있어서, 존재하는 경우 단계 b) 이후에, i) 이미 도입된 것 또는 이미 도입된 것들과 상이한 복구 주형, 및 ii) 박테리아의 게놈의 표적화 구역으로 그들의 통합을 가능하게 하는 하나 이상의 가이드 RNA를 코딩하는 n번째 핵산을 도입시키는 하나 이상의 추가 단계를 포함하는 것을 특징으로 하고, 각각의 추가 단계는 이전에 도입시킨 복구 주형을 코딩하는 핵산을 제거하는 단계, 바람직하게는 이전에 도입시킨 하나 이상의 가이드 RNA 또는 하나 이상의 가이드 RNA를 코딩하는 서열을 제거하는 단계가 선행되는 것인 방법.
제10항 내지 제12항 중 어느 한 항에 따른 방법을 사용하여 형질전환된 클로스트리듐 속의 용매형성성 박테리아.
제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구의 성분 및 임의로는 도구 내에서 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 형질전환시키거나 또는 클로스트리듐 속의 박테리아를 사용하여 적어도 하나의 용매를 생성시키기 위한 키트.
산업적 규모로 용매 또는 용매의 혼합물, 바람직하게는 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 이소프로판올/부탄올 혼합물의 생성을 위한, 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구, 제10항 또는 제11항에 따른 방법, 또는 제12항의 방법에 따라 형질전환된 박테리아의 용도.