KR20210144816A - 키메라 플라스미드 라이브러리의 구축 방법 - Google Patents

키메라 플라스미드 라이브러리의 구축 방법 Download PDF

Info

Publication number
KR20210144816A
KR20210144816A KR1020217034567A KR20217034567A KR20210144816A KR 20210144816 A KR20210144816 A KR 20210144816A KR 1020217034567 A KR1020217034567 A KR 1020217034567A KR 20217034567 A KR20217034567 A KR 20217034567A KR 20210144816 A KR20210144816 A KR 20210144816A
Authority
KR
South Korea
Prior art keywords
dna
unit
preparing
plasmid
dna fragment
Prior art date
Application number
KR1020217034567A
Other languages
English (en)
Inventor
켄지 츠게
준 이시이
아키히코 콘도
Original Assignee
고쿠리츠다이가쿠호진 고베다이가쿠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고쿠리츠다이가쿠호진 고베다이가쿠 filed Critical 고쿠리츠다이가쿠호진 고베다이가쿠
Publication of KR20210144816A publication Critical patent/KR20210144816A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은, 장쇄 DNA의 조합 라이브러리를 효율적으로 구축할 수 있고, 얻어진 클론의 유전자형 확인이 용이한 신규 미생물 세포 형질 전환용 DNA 단편의 조제 방법을 제공하는 것을 과제로 한다. 본 발명은, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서, (A) 특정한 연결 순서로 연결할 수 있는 복수 종류의 단위 DNA를 연결시킨 삽입 DNA 유닛을 포함하는 플라스미드를 OGAB법에 의해 복수 종류 조제하는 공정, (B) 공정 (A)에서 조제한 복수 종류의 플라스미드를 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및 (C) 공정 (B)에서 얻어진 복수 종류의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법이다.

Description

키메라 플라스미드 라이브러리의 구축 방법
본 발명은, 신규 키메라 플라스미드 라이브러리의 구축 방법에 관한 것이다.
합성 생물학의 진전에 따라, 복수의 유전자를 연결한 장쇄 DNA의 수요가 증가하고 있다. 장쇄 DNA의 서열 설계에 있어서는, 사용하는 유전자 종류의 선택지나 그 유전자의 발현 강도의 선택지 등, 필연적으로 다수의 발현 파라미터를 검토할 필요가 있기 때문에, 한번의 서열 설계에 의해 목적으로 하는 결과를 달성할 수 있는 가능성은 낮다. 그래서, 대부분의 경우, 최초에 설계(Design)하고, 구축(Build)한 장쇄 DNA를 평가(Test)하고, 그 내용에 대해서 검토(Learn)를 행하고, 이 발견에 기초한 새로운 DNA를 구축한다고 하는 DBTL 사이클(Design-Build-Test-Learn 사이클)을 실행하는 것이 전제가 된다. 이 DBTL 사이클에서 다수의 발현 파라미터를 동시에 검토하기 위해서는, 각 발현 파라미터에 대해서 복수의 선택지가 존재하는 것 중에서 하나를 선택하고, 각각을 연결하여 다종의 장쇄 DNA를 구축하는 조합 라이브러리 기술이 효율성의 관점에서 바람직하다. 즉, 단일의 장쇄 DNA만을 구축하여 평가하는 것 보다, 각 발현 파라미터에 다양성이 있는 복수 종류의 장쇄 DNA를 동시 병행으로 구축하여 비교하는 것이, 각 발현 파라미터에 대한 DNA 설계의 방향성을 짧은 사이클로 유도하기 쉽다.
그러나, 일반적으로 장쇄 DNA의 합성에는, 금전 비용, 시간 비용이 들어 복수의 장쇄 DNA를 구축하는 것이 곤란한 경우가 많다. 장쇄 DNA 구축에 있어서는, 화학 합성에 의해 조달할 수 있는 DNA의 길이가 200 염기 정도로 짧은 것 등의 이유에 의해, 유전자의 기능 단위 등을 지표로 한 짧은 DNA 단편을 다수 준비하고, 이것을 연결(집적)함으로써 구축하는 다중 유전자 단편 집적 기술이 사용되고 있다. 이러한 DNA 단편의 집적 방법으로서는, OGAB법(특허문헌 1:일본 특허 공개 제2004-129654호 공보, 비특허문헌 1: Tsuge,K.,et al.,Nucleic Acids Res.31,e133(2003))), SLIC법(비특허문헌 2: Li MZ, Elledge SJ(2007) Nature Methods 4:251-256), Golden Gate법(비특허문헌 3: Engler,C.et al. PLoS ONE(2008)), Gibson Assembly법(비특허문헌 4: Gibson, D. G.,et al. Nat. Methods,6,343-345.(2009)), LCR법(비특허문헌 5: de Kok,S.et al.ACS Synth.Biol.(2014)), 출아 효모의 유전자 집적법(비특허문헌 6: Gibson, D. G., et al. Proc. Nat. Acad. Sci. USA 6, 105, 20404-20409, 2008)등 다양한 방법이 개발되어 있다.
복수 종류의 장쇄 DNA를 저비용으로 간편하게 조달하기 위해서는, 이 유전자 집적 시에 사용하는 짧은 DNA 단편에 발현 파라미터가 다른 것을 동시에 복수개 준비하고, 이것을 조합적으로 연결하는 조합 라이브러리를 제작하는 것을 생각할 수 있다. 상기의 유전자 집적법에서도, 조합 라이브러리를 구축하는 방법이 개발되어 있다.
또한, 이들 방법에 의해 조달된 장쇄 DNA의 조합 라이브러리를 Test하고, 발현 파라미터의 설계 방향성을 Learn할 때에는, 장쇄 DNA의 유전자형과 그 표현형을 대응지을 필요가 있다. 종래의 조합 라이브러리의 구축에 있어서는, 크게 구별하면 2개의 방법이 있다. 첫번째는, 하나의 유전자 집적에 있어서, 1종류의 장쇄 DNA를 구축하는 방법이다. 이 경우, 각각 재료가 다른 유전자 집적을 조합 라이브러리의 규모 수만큼 개별적으로 행하게 된다. 어느 유전자 집적이 어느 유전자형이 되는지를 사전에 파악할 수 있기 때문에, TEST에서 유전자형을 다시 확인하지 않아도 표현형과의 대응을 신속하게 취할 수 있다고 하는 장점은 있지만, 대규모화가 곤란하다고 하는 단점이 있다. 두번째는, 조합 라이브러리에 사용하는 모든 재료를 혼합하고, 1회의 유전자 집적에 의해 라이브러리를 구축하는 방법이다. 이 방법에서는, 대규모 조합 라이브러리가 얻어지기 쉽다고 하는 장점이 있다. 그러나, 이 라이브러리로부터 선발된 클론이 어느 유전자형을 가지고 있는지는, 개별적으로 시퀀싱에 의해 염기 서열을 확인할 필요가 있는데, 장쇄 DNA가 되면 될수록 염기 서열의 확인에 시간이 걸리기 때문에, TEST가 율속 단계가 된다는 문제점이 있었다.
일본 특허 공개 제2004-129654호 공보(일본 특허 제4479199호)
Tsuge, K., et al., Nucleic Acids Res. 31, e133, 2003 Li MZ, Elledge SJ, Nature Methods 4:251-256, 2007 Engler, C. et al. PLoS ONE, 2008 Gibson, D. G., et al. Nat. Methods, 6, 343-345., 2009 de Kok, S. et al. ACS Synth. Biol., 2014 Gibson, D. G., et al. Proc. Nat.Acad. Sci. USA 6, 105, 20404-20409, 2008
이러한 상황 속에서, 본 발명은, 장쇄 DNA의 조합 라이브러리를 효율적으로 구축할 수 있으며, 또한, 율속 단계가 되는 염기 서열의 확인을 하지 않고도 신속하게 다음 DBTL 사이클을 위한 장쇄 DNA의 조합 라이브러리를 준비 가능한, 신규한 미생물 세포 형질 전환용 DNA 단편의 조제 방법을 제공하는 것을 과제로 한다.
장쇄 DNA의 조합 라이브러리 구축을 효율적으로 행하기 위해서는, 상술한 바와 같이 다중 유전자 단편 집적 기술을 사용하는 것이 바람직한데, 유전자 집적 기술의 여하를 불문하고, 집적 대상의 유전자 단편이 과부족 없는 상태, 즉 각 유전자 단편의 몰 농도가 동일한 것이 중요하다. 그러나, 특히 10을 초과하는 것과 같은 많은 유전자 단편의 몰 농도를 동일한 몰 농도로 조정하는 것은 곤란하기 때문에, 유전자 집적 기술을 이용하여 고효율로 다수의 선택지로 이루어지는 조합 라이브러리를 구축하는 것은 곤란하였다.
통상, 유전자 집적을 행하기 위한 재료가 되는 유전자 단편의 준비는, 단편마다 하나씩 행할 필요가 있으며, 또한, 이러한 단편을 등몰 농도 통합할 때에는, DNA의 중량 농도를 측정하고, DNA 단편의 길이를 바탕으로 계산을 하여 첨가량을 정하는데, DNA 농도의 측정 오차나, DNA의 피펫팅의 오차 등으로부터, 정확하게 등몰 통합하는 것은 매우 곤란하였다. 한편, 한번 집적하여 플라스미드 상태가 된 집적체를 제한 효소로 절단하면 원래의 재료로 환원되는 경우는, 얻어진 재료가 이상적인 등몰 상태로 된다. 본 발명자들은, 실제로 이것을 사용하여 다시 집적을 행하면, 상술한 사람 손으로 DNA 단편을 통합하여 집적하는 경우와 비교하여 100배 이상 집적 효율이 향상되는 것을 발견하였다(Tsuge, NAR, 2003). 또한, 제한 효소로 절단하면 선택지 단편으로 분해되는 집적체의 경우는, 그 선택지 단편의 염기 서열이 동정되지 않아도, 실물의 DNA가 존재하면, 이것을 마찬가지로 준비된 다른 집적체 유래의 선택지 단편과 혼합함으로써 조합 라이브러리를 구축하는 것이 가능해진다. 본 발명자들은, 이 결과에 착상을 얻어 본 발명의 고효율적인 장쇄 DNA 조합 라이브러리 구축법을 완성하기에 이르렀다.
즉, 본 발명자들은, 상기 과제를 해결하기 위하여 예의 검토한 결과, 고초균의 플라스미드 형질 전환계를 이용한 유전자 집적법(OGAB법)에서, 조합 라이브러리의 집적에 사용하는 모든 DNA 단편의 몰 농도 비율이 가능한 한 1에 가깝도록 하기 위하여 상기 방법을 채용하였다. 구체적으로는, 조합화의 대상으로 되는 선택지 유전자 단편을 대충 연결한 종 플라스미드(seed plasmid)를 구축한다. 그리고, 다른 선택지 유전자 단편에 대해서도, 별도의 종 플라스미드를 구축함으로써, 선택지의 최대수와 동일한 수의 종 플라스미드를 준비한다. 각 종 플라스미드를 제한 효소로 절단함으로써, 일단 유전자 단편이 등몰로 혼합된 용액을 얻는다. 이 용액은, 다른 종 플라스미드와 혼합해도 등몰성이 유지된다. 그 후, 이러한 용액이 포함하는 각종 유전자 단편을 직선상으로 연결함으로써, 플라스미드 벡터 부분이 주기적으로 출현하는 의사 탠덤 반복(tandem repeat) 상태의 고분자 DNA를 얻고, 이것을 사용하여 고초균을 형질 전환한다. 고초균체 내에서 플라스미드 벡터 부분의 상동성을 이용하여 환상화함으로써 조합 라이브러리를 효율적으로 구축한다.
이 방법에 의하면, 조합 라이브러리의 구축에 필요한 등몰 농도의 유전자 단편을 매우 간편하게 또한 확실하게 준비할 수 있고, 라이브러리의 구축 규모를 종래에 없이 대규모로 할 수 있다고 하는 특징이 있다. 또한, 이 방법에 의하면, 얻어진 플라스미드의 유전자형 확인을 하지 않고도 다음 사이클의 장쇄 DNA의 조합 라이브러리를 구축 가능하다. 즉, 본 발명의 요지는 이하와 같다.
[1] 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
(A) 특정한 연결 순서로 연결할 수 있는, 복수 종류의 단위 DNA를 연결시킨, 삽입 DNA 유닛을 포함하는 플라스미드를, OGAB법에 의해 복수 종류 조제하는 공정,
(B) 공정 (A)에서 조제한 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
(C) 공정 (B)에서 얻어진 복수 종류의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정
을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[2] 공정 (B)에서 얻어지는 단위 DNA 혼합액에 있어서의, 모든 DNA 단편의 몰 농도 비율이 0.8 내지 1.2인 것을 특징으로 하는, [1]에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[3] 공정 (A)에 있어서, 한가지 종류의 삽입 DNA 유닛이 포함하는 단위 DNA의 종류가, 3 내지 60종류인 것을 특징으로 하는, [1] 또는 [2]에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[4] 공정 (B)에서 사용하는 제한 효소가 3종 이하인, [1] 내지 [3] 중 어느 것에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[5] 상기 제한 효소가, 돌출 말단을 생성하는 제한 효소인, [1] 내지 [4] 중 어느 것에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[6] [1] 내지 [5] 중 어느 것에 기재된 조제 방법에 의해 얻어진 미생물 세포 형질 전환용 DNA 단편을 포함하는 플라스미드.
[7] 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
(B') [6]에 기재된 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
(C) 공정 (B')에서 얻어진 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정
을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[8] 얻어진 장쇄 DNA 단편을 포함하는 플라스미드를 복수 종류 선택하고, 공정 (B')에서의 플라스미드로서 재이용하는 것을 특징으로 하는, [7]에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
[9] [1] 내지 [5], [7], [8] 중 어느 것에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법을 사용하는 키메라 플라스미드 라이브러리의 구축 방법.
본 발명에 의하면, 장쇄 DNA의 조합 라이브러리를 신속하며 효율적으로 구축하는 것이 가능해진다. 또한, 동일한 라이브러리로부터 선택된, 염기 서열을 확인하지 않은 복수의 플라스미드를, 새로운 키메라 라이브러리 구축을 위하여 재이용하는 것이 가능하다.
도 1은, 집적용 플라스미드 벡터 pGETS302-SfiI-pBR의 구조를 도시하는 도면이다.
도 2는, 삽입 유닛을 구성하는 단위 DNA의 상세 구조를 도시하는 도면이다.
도 3은, 이소부탄올을 고생산하기 위하여 디자인된 출아 효모의 인공적인 대사 경로를 도시하는 도면이다.
도 4는, 본 발명의 키메라 플라스미드 라이브러리의 구축 방법을 모식적으로 도시하는 도면이다.
도 5는, 본 발명의 방법에 의해 얻어진 1회째의 키메라 플라스미드 라이브러리 중의 각 플라스미드 있어서의 단위 유전자의 방향과 이소부탄올 생산량을 도시하는 도면이다.
도 6은, 형질 전환에 사용한 플라스미드를 종 플라스미드로 하는, 새로운 조합 라이브러리의 구축 공정을 도시하는 도면이다.
도 7은, 본 발명의 방법에 의해 얻어진 2회째의 키메라 플라스미드 라이브러리 중의 각 플라스미드에 있어서의 단위 유전자의 방향과 이소부탄올 생산량을 도시하는 도면이다.
이하, 본 발명에 대하여 상세하게 설명한다. 또한, 본 명세서에 있어서, 분자 생물학적 방법은 특별히 명기하지 않는 한 당업자에게 공지된 일반적 실험서에 기재된 방법 또는 그것에 준한 방법에 의해 행할 수 있다. 또한, 본 명세서 중에서 사용되는 용어는, 특별히 언급하지 않는 한, 당해 기술 분야에서 통상 사용되는 의미로 해석된다.
<미생물 세포 형질 전환용 DNA 단편의 조제 방법>
본 발명은, 장쇄 DNA의 조합 라이브러리를 효율적으로 구축할 수 있고, 얻어진 클론의 유전자형 확인을 하지 않고도 새로운 조합 라이브러리의 구축이 용이한, 신규 미생물 세포 형질 전환용 DNA 단편의 조제 방법에 관한 것이다. 구체적으로는, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
(A) 특정한 연결 순서로 연결할 수 있는, 복수 종류의 단위 DNA를 연결시킨 삽입 DNA 유닛을 포함하는 플라스미드를 OGAB법에 의해 복수 종류 조제하는 공정,
(B) 공정 (A)에서 조제한 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
(C) 공정 (B)에서 얻어진 복수 종류의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정을 포함하는 것을 특징으로 한다.
본 발명에 있어서는, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA(플라스미드 벡터)와, 삽입 DNA를 포함하는 삽입 DNA 유닛을, 교대로 연결할 수 있는 구조를 갖는 복수의 단위 DNA로서 조제하고, 해당 단위 DNA를 연결하여, 삽입 DNA 유닛을 적어도 하나 가지며, 또한 동일한 단위 DNA를 적어도 2개 갖는 DNA 단편을 제작한 후에, 해당 DNA 단편과 숙주 미생물의 컴피턴트 세포(competent cell)와 공배양하고, 해당 미생물로부터 플라스미드 DNA를 회수함으로써 조합 라이브러리를 조제하고, 조합 라이브러리로부터 선발된 플라스미드 DNA를 새로운 라이브러리의 종 플라스미드로서 이용하는 것이 가능한 방법이다.
본 발명에 있어서, 삽입 DNA 유닛이란, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와 삽입 DNA를 포함하는 단위를 말한다. 또한, 미생물 세포 형질 전환용 DNA 단편은, 삽입 DNA 유닛을 1개 이상 포함하고 있다. 또한, 삽입 DNA 유닛에는, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와 삽입 DNA 이외에도, 필요에 따라서 적당한 염기 서열을 포함할 수 있다. 예를 들어 본 발명의 방법에 의해 삽입 DNA에 포함되는 유전자를 발현하기 위한 플라스미드를 제작하는 경우에는, 프로모터나 오퍼레이터, 액티베이터, 터미네이터와 같은 전사 번역을 제어하는 염기 서열을 포함해도 좋다. 효모를 숙주로 했을 경우의 프로모터로서, 구체적으로는, 해당계 등의 1차 대사 산물의 프로모터 등을 들 수 있다.
본 발명에 있어서, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA란, 제작되는 DNA 단편으로 형질 전환될 수 있는 미생물 중에서 DNA의 복제가 이루어지는 것이면, 어떠한 것이어도 좋다. 본 발명의 숙주 미생물로서는, Bacillus속 세균이 사용되지만, 구체적인 미생물과, 해당 미생물 중에서 유효한 복제 개시점을 포함하는 DNA로서, 예를 들어 B. subtilis(고초균)의 경우는 θ형의 복제 기구를 갖는 것으로, 구체적으로는, pTB19(Imanaka, T., et al. J. Gen. Microbioi. 130, 1399-1408. (1984))나 pLS32(Tanaka, T and Ogra, M. FEBS Lett. 422, 243-246. (1998), pAMβ1(Swinfield, T. J., et al. Gene 87, 79-90. (1990)) 등의 플라스미드에 포함되는 복제 개시점 등의 서열을 들 수 있다.
본 발명에 있어서, 삽입 DNA란, 클로닝하고자 하는 DNA이며, 그 종류나 크기는 특별히 한정되지 않는다. DNA의 종류는, 원핵 생물, 진핵 생물, 바이러스 등의 천연 유래 서열뿐만 아니라, 인공 설계 서열 등 어느 것이어도 좋으며, 특별히 제한되지 않는다. 바람직하게는, 일련의 대사 경로를 구성하는 유전자군이나, 숙주 게놈에 존재하는 유전자 발현의 불활성화를 목적으로 한 안티센스 RNA 유전자군이나, 대사 경로 유전자군과 안티센스 RNA군의 양쪽이 혼입된 것 등을 들 수 있다. 본 발명의 삽입 DNA는 단위 DNA가 연결된 구조를 갖는다.
본 발명에 있어서 단위 DNA란, 서로 그 순서를 유지한 채 반복 연결할 수 있는 구조를 가지고 있으며, 차례로 연결된 단위 DNA가, 1개의 삽입 DNA가 되는 DNA 단편을 구성한다. 단위 DNA 단편의 DNA쇄 길이는 특별히 제한되지 않는다. 또한, 서로 그 순서를 유지한 채 연결한다는 것은, 삽입 DNA 상에서 인접하는 서열을 갖는 단위 DNA가 그 순서 및 방향을 유지하여 결합하는 것을 말하며, 또한, 반복 연결한다는 것은, 삽입 DNA의 5' 말단의 염기 서열을 갖는 단위 DNA의 5' 말단과 삽입 DNA의 3' 말단의 염기 서열을 갖는 단위 DNA의 3' 말단이 결합하는 것을 말한다. 이러한 단위 DNA로서, 구체적으로는, 예를 들어 단편의 돌출 말단의 염기 서열 상보성을 이용하여 서로 순서를 유지한 채 반복 연결할 수 있는 것과 같은 말단을 갖는 것을 들 수 있다. 이 돌출의 구조는, 회분 구조(팔린드롬)가 아니라면, 5' 말단 돌출, 3' 말단 돌출의 돌출 형상 차이도 포함하여 특별히 제한은 없다. 단, 단위 DNA의 제작 시에 돌출 말단을 제한 효소의 소화에 의해 제작할 수 있는 것이 바람직하다. 제한 효소로서는, 특정한 서열을 인식하여 그 근방에 임의 서열의 돌출 말단을 제작 가능한 효소를 사용하면, 단위 DNA 단편의 돌출 말단을 각 연결 부위에서 다른 것으로 만들 수 있기 때문에 그 연결하는 순서가 유지된다. 이러한 제한 효소의 예로서는, 통상의 분자 생물학에 사용되는 제한 효소 이외에, 인공 제한 효소의 TALEN이나 ZNF, 혹은 CRISPR-Cpf1 등의 돌출 말단 정제 가능한 CRISPR 기술 관련 효소 등를 들 수 있지만, 바람직하게는 AarI, AlwNI, BbsI, BbvI, BcoDI, BfuAI, BglI, BsaI, BsaXI, BsmAI, BsmBI, BsmFI, BspMI, BspQI, BtgZI, DraIII, FokI, PflMI, SfaNI, SfiI 등과 같은 TypeII 제한 효소를 사용하는 것이 좋다.
돌출 말단 생성에 사용되는 제한 효소의 종류의 수는 하나의 단위 DNA 잘라내기에는, 1종류의 제한 효소에 의한 절단이 바람직하다. 반드시 모든 단위 DNA를 동일 종류의 제한 효소의 소화에 의해 얻을 필요는 없지만, 사용하는 제한 효소 종류의 총 수는 적은 것이 좋으며, 3종류 이하인 것이 바람직하고, 2종류 이하인 것이 보다 바람직하고, 1종류인 것이 더욱 바람직하다.
삽입 DNA 유닛을 구성하는 단위 DNA 중 1개 이상의 단위 DNA에 대해서는, 숙주 세포에서 유효한 복제 개시점을 포함할 필요가 있다. 그 이외의 단위 DNA에 대해서는, 대사 경로 클러스터, 생물의 연속된 게놈 서열의 일부 혹은 전부, 인공 유전자, 인공 유전자 회로 등, 연속한 염기 서열을 구성하는 요소이지만, 단독의 단위 DNA가 생물학적인 기능 단위와 일치해야 한다는 제약은 없다.
단위 DNA의 제작 방법으로서는, 본 발명의 단위 DNA를 제작할 수 있는 방법이라면 어떠한 것이어도 좋다. 예를 들어 주형 DNA 상의 염기 서열에 각 돌출 말단을 생성하는 제한 효소 인식 서열을 부가한 프라이머를 사용한 폴리머라아제 연쇄 반응(PCR)에 의해 증폭한 DNA 단편, 혹은, 미리 말단에 임의의 돌출 서열을 생성하도록 제한 효소 인식 서열을 도입시킨 화학 합성 DNA 단편 등을 플라스미드 벡터에 클로닝하여 염기 서열을 확인 후 사용한다. 각 단위 DNA는, 특정한 순서로 연결하여 최종적으로 취득하고자 하는 미생물 형질 전환용 DNA 단편이 되도록 설계된다. 목적으로 하는 삽입 DNA를 구성하기 위하여 연결되는 단위 DNA의 수(종류)로서는, 3 내지 60(종류)이며, 바람직하게는 5 내지 50(종류), 보다 바람직하게는 8 내지 25(종류), 더욱 바람직하게는, 10 내지 20(종류)이다.
이하에, 본 발명의 미생물 세포 형질 전환용 DNA 단편의 조제 방법의 각 공정을 상세하게 설명한다.
[공정 (A)]
본 발명의 미생물 세포 형질 전환용 DNA 단편의 조제 방법에서의 공정 (A)에 있어서는, 소위 종 플라스미드가 조제된다. 종 플라스미드는, 공정 (B) 및 공정 (C)를 고려하여, 집적체 구축 후에 단위 DNA 단편으로 분할 가능하도록, 각각의 설계에 맞추어 적절한 제한 효소 인식 서열이 단위 DNA의 경계, 혹은 근방에 도입되어 있는 구조일 필요가 있다. 제한 효소로서는, AarI, AlwNI, BbsI, BbvI, BcoDI, BfuAI, BglI, BsaI, BsaXI, BsmAI, BsmBI, BsmFI, BspMI, BspQI, BtgZI, DraIII, FokI, PflMI, SfaNI, SfiI 등과 같이 임의 서열의 돌출 말단을 제작 가능한 효소를 사용하는 것이 바람직하다. 이러한 제한 효소 처리에 의해 얻어지는 복수의 돌출 서열은, 단일 종 플라스미드 내에서 유일한 서열이 되어 있을 필요가 있다. 또한, 종 플라스미드군은, 조합 라이브러리의 재조합 단위(대부분의 경우, 단위 DNA가 그 단위에 일치하지만, 경우에 따라 재조합 단위가 일부의 종 플라스미드에 있어서는, 복수의 단위 DNA로 이루어지는 경우가 있다.)에서 동일한 돌출 서열을, 동일한 쇄에, 동일한 순서로 가질 필요가 있다.
OGAB 종 플라스미드의 구축에 있어서는, 즉, 상술한 각 단위 DNA를 거의 등몰이 되도록 조정한 단위 DNA 혼합액 중, DNA 리가아제 등을 사용하여 연결(라이게이션)함으로써 미생물 형질 전환용 DNA 단편을 제작하는 것도 가능하지만, 상기의 각 단위 DNA 만이 유전자 집적의 출발 재료로 한정되는 것은 아니고, 최종적으로 상술한 바와 같이 각 단위 DNA로 분할 가능한 구조로 되어 있으면, 어떠한 집적 방법으로 준비된 집적체도 이용 가능하다. 여기서, 거의 등몰이란, 단위 DNA 혼합액에 있어서의, 모든 DNA 단편의 몰 농도 비율이 0.8 내지 1.2의 범위인 것, 바람직하게는 0.9 내지 1.1의 범위인 것, 보다 바람직하게는 0.95 내지 1.05의 범위인 것, 더욱 바람직하게는, 1.0인 것을 말한다. 또한, 단위 DNA 혼합액에 있어서의, 모든 DNA 단편의 몰 농도 비율이 상기 수치 범위 내가 되는 것을, 단위 DNA 혼합액에 포함되는 단위 DNA 농도의 최고값을 최저값으로 나눈 값이, 1.0 내지 1.5의 범위인 것, 1.0 내지 1.2의 범위인 것, 1.0 내지 1.1인 것, 1.0인 것으로 바꿔 말할 수도 있다.
본 공정에서 조제되는 종 플라스미드의 단위 DNA는, 유전자 클러스터, 유전자, 유전자 단편 등 어떤 것이어도 좋다.
단위 DNA의 연결 방법은 특별히 제한되지 않지만, 폴리에틸렌글리콜과 염의 존재 하에서 행하는 것이 바람직하다. 염으로서는, 1가의 알칼리 금속의 염이 바람직하다. 구체적으로는, 10%의 폴리에틸렌글리콜 6000과 250mM의 염화 나트륨을 포함하는 라이게이션 반응액으로 행하는 것이 보다 바람직하다. 또한, 각 단위 DNA의 반응액 중의 농도는 특별히 제한은 없지만, 바람직하게는 각각 1fmol/μL 이상의 농도이며, 또한 등몰이다. 라이게이션의 효소, 반응 온도, 시간은 특별히 제한은 없지만, 바람직하게는 T4DNA 폴리머라아제로 37℃, 30분 이상이다.
본 발명의 미생물 형질 전환용 DNA 단편에 있어서의 숙주 미생물로서는, 자연 형질 전환능을 갖는 것이라면, 특별히 한정되지 않는다. 이러한 미생물로서는, DNA를 도입할 때에 단일쇄 DNA에 처리하여 도입하는 자연 형질 전환능을 갖는 것 등을 들 수 있다. 구체적으로는, Bacillus속 세균, Streptococcus속 세균, Haemophilus속 세균 및 Neisseria속 등을 들 수 있다. 또한, Bacillus속 세균으로서는, B.subtilis(고초균), B.megaterium (거대균), B.stearothermophilus (중도 고열균) 등을 들 수 있다. 이 중, 가장 바람직한 미생물로서는, 그 자연 형질 전환능 및 재조합능이 우수한 고초균을 들 수 있다.
미생물 세포를 컴피턴트 세포로 하는 방법은, 각각의 미생물에 적합한 공지된 방법을 선택할 수 있다. 구체적으로는, 예를 들어 고초균의 경우에는, Anagnostopoulou, C. and Spizizen, J. J. Bacteriol., 81, 741-746(1961)에 기재된 방법을 사용하는 것이 바람직하다. 또한, 형질 전환의 방법도 각각의 미생물에 적합한 공지된 방법을 사용할 수 있다. 컴피턴트 세포에 부여하는 라이게이션 산물의 액량도 특별히 제한은 없다. 바람직하게는 컴피턴트 세포 배양액에 대하여 1/20 내지 등량이며, 보다 바람직하게는 절반량이다. 형질 전환체로부터 플라스미드를 정제하는 방법으로서도 공지된 방법을 사용할 수 있다.
상술한 방법에 의해 얻어진 플라스미드가 목적으로 하는 삽입 DNA를 가지고 있는 것은, 제한 효소 절단에 의해 발생하는 단편의 사이즈 패턴이나 PCR법, 염기 서열 결정법에 의해 확인할 수 있다. 또한, 삽입 DNA가 물질 생산 등의 기능을 갖는 경우는, 그 기능을 검출함으로써 확인하는 것이 가능하다.
조합 라이브러리 구축에서 사용하는 종 플라스미드의 조정은, 일반적인 환상 플라스미드의 정제법이라면 어떤 방법으로도 사용할 수 있지만, 바람직하게는 플라스미드 DNA 이외의 DNA 혼입의 우려가 없는 방법이 좋고, 구체적으로는 염화 세슘-에티듐 브로마이드 밀도 구배 초원심법이 바람직하다.
[공정 (B)]
본 공정은, 공정 (A)에서 조제한 복수 종류의 플라스미드(종 플라스미드)를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정이다. 공정 (A)에서 조제한 복수 종류의 플라스미드(종 플라스미드)는, 고순도로 정제된 후, 단위 DNA로 분해된다. 단위 DNA로의 분해는, 공정 (A)에서의 설계에 맞추어 적절한 제한 효소를 선택할 수 있다.
돌출 말단 생성에 사용되는 제한 효소의 종류의 수는 1개의 단위 DNA의 잘라내기에는, 1종류의 제한 효소에 의한 절단이 바람직하다. 반드시 모든 단위 DNA를 동일 종류의 제한 효소의 소화에 의해 얻을 필요는 없지만, 사용하는 제한 효소 종류의 총 수는 적은 것이 좋으며, 3종류 이하인 것이 바람직하고, 2종류 이하인 것이 보다 바람직하고, 1종류인 것이 더욱 바람직하다.
본 공정에서 얻어지는 단위 DNA 혼합액은, 종 플라스미드가 매우 고순도로 정제되기 때문에, 플라스미드 DNA 이외의 DNA 단편이 존재하지 않도록 되어 있다. 조제한 장쇄 DNA를 제한 효소로 절단하고, 제한 효소를 제거함으로써, 모든 DNA 단편의 몰 농도 비율이 한없이 1에 근접한 DNA 단편 용액(단위 DNA 혼합액)을 얻을 수 있다.
[공정 (C)]
본 공정은, 공정 (B)에서 얻어진 복수 종류의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정이다. 공정 (B)에서 얻어진, 모든 DNA 단편의 몰 농도 비율이 한없이 1에 근접한 DNA 단편 용액(단위 DNA 혼합액)을 출발 재료로 하여 유전자 집적법(OGAB법)을 행함으로써, 보다 효율적으로 유전자 집적을 행할 수 있다. 또한, 본 공정에서의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시키는 방법에 대해서는, 공정 (A)에서의 설명을 적용할 수 있다.
본 발명은, 추가로, 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
(B') 상술한 본 발명의 방법에 의해 조제된 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
(C) 공정 (B')에서 얻어진 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정
을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법도 포함된다.
상술한 본 발명의 방법에 의해 얻어진 장쇄 DNA 단편을 포함하는 플라스미드를 복수 종류 선택하여 공정 (B')에서의 플라스미드로서 재이용할 수 있다.
본 발명에는, 상술한 본 발명의 조제 방법에 의해 얻어진 미생물 세포 형질 전환용 DNA 단편을 포함하는 플라스미드도 포함된다. 또한, 본 발명의 조제 방법을 사용하는 키메라 플라스미드 라이브러리의 구축 방법도 포함된다.
실시예
이하의 실시예에서 본 발명을 구체적으로 설명하지만, 본 발명은 이들 실시예에 의해 한정되는 것은 아니다.
실시예에서 사용한 시약 등, 공통되는 시험 방법 등은 이하와 같다.
고초균의 숙주로서 RM125주(Uozumi, T., et al. Moi. Gen. Genet., 152, 65-69 (1977))와, 그 파생주인 BUSY9797주를 사용하였다. 고초균으로 복제 가능한 플라스미드 벡터로서는, pGET118(Kaneko, S., et al. Nucleic Acids Res. 31, e112 (2003))을 사용하였다. 항생 물질 카르베니실린은, 와코 쥰야꾸 고교사에서 구입하였다. 항생 물질 테트라사이클린은, 시그마사에서 구입하였다. 제한 효소 SfiI와 BspQI는 NEB사에서 구입하였다. T4 DNA Ligase는, 다카라 바이오사에서 구입하였다. 대장균의 플라스미드 구축용의 일반적인 라이게이션에는, Takara Ligation Kit (Mighty) (다카라 바이오사)를 사용하였다. 단위 DNA 조제용의 PCR 반응에는, 도요보사의 KOD plus polymerase를 사용하였다. 한편, 플라스미드에 클로닝된 DNA의 염기 서열 결정을 위한 콜로니 PCR에는, 다카라 바이오사제의 Ex-Tag HS를 사용하였다. pMD-19(simple)는, 다카라 바이오사에서 구입하였다. 환상 플라스미드 정제용 효소 Plasmid Safe는, EPICENTER사제의 것을 사용하였다. DNA 전기 영동용의 저융점 아가로오스 겔인, 2-Hydroxyethyl agarose는, 시그마사에서 구입하였다. 다른 일반적인 전기 영동용 아가로오스 겔은, 인비트로젠사의 UltraPure Agarose를 사용하였다. 페놀:클로로포름:이소아밀알코올 25:24:1과, TE 포화 페놀(8-퀴놀리놀 함유)은, 나카라이테스크사제의 것을 사용하였다. 리소자임은 와코 쥰야꾸 고교사에서 구입하였다. LB 배지의 배지 성분 및 한천은, 벡튼 디킨슨사제의 것을 사용하였다. IPTG(isopropyl s-D-thiogalactopyranoside)는, 와코 쥰야꾸 고교사제를 사용하였다. 다른 모든 배지 성분 및 생화학 시약은, 와코 쥰야꾸 고교사제의 것을 사용하였다.
특기 이외의 플라스미드의 구축은, 대장균 DH5α주, JM109주, TOP10주 중 어느 것을 사용하였다. 구축한 플라스미드의 대장균으로부터의 소량 정제는 퀴아젠사의 QIAprep Spin Miniprep Kit를, 대량 정제는 동사의 QIAfilter Midi Kit를 사용하였다. 효소 반응액으로부터의 DNA의 클린업에는, 퀴아젠사의 MinElute Reaction Cleanup Kit나, 동사의 QIAquick PCR purification Kit를 사용하였다. 통상의 아가로오스 겔 전기 영동에서 분리하여 얻어진 겔 블록을 정제하는 경우는, 퀴아젠사의 MinElute Gel Extraction Kit를 사용하였다. 초미량 분광 광도계는 Thermo사의 nano-drop 2000을 사용하였다. 염기 서열 결정에는, 어플라이드 바이오시스템즈사제의 형광 자동 시퀀서의 3130xl 제네틱 애널라이저를 사용하였다.
다른 일반적인 DNA의 조작에 대해서는, 표준 프로토콜(Sambrook, J., et al., Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (1989))에 따라 행하였다. OGAB법 등에 의한 고초균의 형질 전환과 플라스미드 추출은, 기존 법대로 행하였다(Tsuge, K., et al., Nucleic Acids Res. 31, e133. (2003)).
1. 삽입 DNA 유닛의 조제
(1) 집적용 플라스미드 벡터의 구축
집적용 플라스미드 벡터 pGETS302-SfiI-pBR은, 대장균의 pBR322의 복제 개시점과, 고초균에서 기능하는 복제 개시점 repA, 출아 효모로 복제 가능한 ARS4와 CEN6을 갖는 대장균-고초균-효모간 셔틀 플라스미드 벡터에서, pGETS109(Tsuge, et. al., Nucleic Acids Res., 31, e133. (2003))을 기반으로 다단계의 과정을 거쳐 구축된 플라스미드이다. 도 1에 그 구조를, 서열 번호 1에 염기 서열을 나타낸다. 집적 유전자의 클로닝 부위는, 2개의 SfiI 절단 부위 사이로 되어 있고, 집적 시에는 가장 큰 15kb의 SfiI 단편을 사용한다. 대장균에서의 선택은, 암피실린을 사용하였다. 본 플라스미드 5μg에, 멸균수를 첨가하여 전체를 40μl로 만든 후, 제한 효소에 부속되는 10ХNEB2.1 Buffer를 5μl와, 제한 효소 SfiI(NEB사) 5μl을 첨가하여 5℃, 2h 반응시켰다. 얻어진 액체를, 저융점 아가로오스 겔 전기 영동에 의해 분리 후, 벡터 본체의 약 15kb의 단편을 겔로부터 잘라내고, 목적으로 하는 DNA 단편을 정제하고, 20μl의 TE에 용해하고, 그 1μl를 덜어 초미량 분광 광도계에 의해 농도를 측정하였다.
(2) 단위 DNA 돌출 서열의 설계법
도 2에 나타내는 바와 같이, 1개의 삽입 유닛을 구성하는 단위 DNA는, 집적용 벡터 pGETS302를 포함하여 전부 14단편 존재한다. 출아 효모 중에서 이소부탄올 대사 경로에 관련되는 유전자군은, 전부 12개이고, 이들을 차례로 제1 내지 제12 단위 DNA로 정의한다. 출아 효모 중에서, 형질 전환용 선택 마커로서 작용하는, kanMX4를 제13 단위 DNA로, 집적 벡터를 제14 단위 DNA로 정의한다. 제1 내지 제14 단위 DNA는 숫자대로 연속하고, 제14와 제1단위 DNA가 연결되는 구조가 됨으로써, 1개의 삽입 유닛을 형성한다. 각 단위 DNA의 말단에는, 단편의 좌우로 각각에 단위 DNA의 번호별로 지정된 것에 고유의 3염기의 3' 말단 돌출 염기가 존재한다. 이 상보성에 의해 연결 상대가 지정되어 있다. 구체적으로는, 다음과 같은 구성이 된다. (제14 단위 DNA)-GTT-(제1 단위 DNA)-TGA-(제2 단위 DNA)-CGA-(제3 단위 DNA)-TGT-(제4 단위 DNA)-GAT-(제5 단위 DNA)-TTG-(제6 단위 DNA)-GTC-(제7 단위 DNA)-ATG-(제8 단위 DNA)-TGG-(제9 단위 DNA)-TAG-(제10 단위 DNA)-ACT-(제11 단위 DNA)-GTA-(제12 단위 DNA)-CTT-(제13 단위 DNA)-TCT-(제14 단위 DNA).
2. 출아 효모 이소부탄올 생산 유전자군의 유전자 발현량의 조절
(1) 출아 효모
출아 효모(Saccharomyces cerevisiae)는, 진핵의 미생물이며, 진핵 생물 모델 미생물로서 연구가 진행되고 있고, 게놈 서열이 완전히 밝혀져 있어, 여러가지 정보가 축적되어 있다. 출아 효모는 혐기 호흡으로서 알코올 발효를 행한다. 출아 효모는 맥주나 와인, 일본주 등의 발효에 옛부터 이용되고 있고, 에탄올 생산 능력이 높아 바이오 에탄올 생산의 숙주로서 널리 사용되어 왔다. 현재는, 에탄올 이외의 유용 물질 생산의 숙주로서도 공업적으로 널리 사용되고 있고, 탄소쇄 수가 3이상의 고급 알코올이나 각종 유기산에 첨가하여 색소나 향료, 서플리먼트 등의 부가 가치품의 생산에도 이용되고 있다. 진핵 생물인 출아 효모는, 원핵 생물의 박테리아와 달리 미토콘드리아나 핵 등의 세포 소기관을 갖는다. 또한, 통상 폴리시스트로닉한 발현 형식이 아니고 모노시스트로닉한 발현 형식을 취하기 때문에 1개의 유전자마다 1개의 프로모터가 필요하고, 예를 들어 12개의 유전자를 발현시키기 위하여는 12개의 프로모터가 필요하다.
(2) 이소부탄올 대사 경로 디자인
이소부탄올의 주된 용도는 유기 합성 용제, 페인트 제거제, 메타크릴산 i-부틸의 원료이다. 또한, 이소부탄올은 탈수함으로써 이소부틸렌으로 변환 가능하고, 에틸 tert-부틸에테르(ETBE) 등의 연료 혼합제나 바이오 제트 연료의 원료로서 이용할 수 있으며, 또한 이소부틸렌을 이소옥텐(디이소부틸렌)으로 변환함으로써, 여러 가지 폴리머의 원료로서도 이용 가능하다. 출아 효모는 원래 에탄올을 주된 생성물로서 생산하지만, 약간이지만 퓨젤 알코올로서 이소부탄올을 생산한다. 이소부탄올을 고생산하기 위하여 디자인한 출아 효모의 인공적인 대사 경로를 도 3에 나타낸다. 출아 효모 내의 L-발린 대사 경로 내의 2케토이소발레르산(2-keto-isovalerate)에 케토산 탈탄산 효소(KDC)와 알코올 탈수소 효소(ADH)를 코드하는 2개의 유전자(예를 들어 Lactococcus lactis 유래 kivd와 출아 효모 유래 ADH6)를 도입하면 이소부탄올의 생산량이 향상되기 때문에, 이것을 집적 대상에 첨가하였다. 그러나, 기질의 2케토이소발레르산이 원래 미토콘드리아 내에서 생산되는 것, 그리고 케톨산 환원 이성화 효소(ILV5)나 ADH6이 필요로 하는 NADPH가 부족되는 등의 복수의 원인에 의해 효율적인 이소부탄올 생산을 할 수 없다. 그래서, 미토콘드리아 내에서 이루어지는 피루브산으로부터 2케토이소발레르산까지의 경로(도 3에 이중선으로 표시된 대사 경로)를 구성하고 있는 아세토락트산 합성 효소(ILV2), 케톨산 환원 이성화 효소(ILV5), 디히드록시산 탈수 효소(ILV3)를 코드하는 3개의 유전자와, 미토콘드리아 내의 NADPH를 조정하기 위한 말산 효소(MAE1)의 총 4유전자(도 3에 이중 밑줄선으로 표시된 유전자) 발현의 증강을 목적으로 이것들을 집적 대상에 첨가하였다. 또한, 이러한 대사 경로를 세포질측에도 구성되도록, ilv2CEc, ilvDLl, alsLp 의 3유전자 및 세포질 내의 NADPH의 부족을 해소하기 위하여, 탄산 고정 효소(PYC2), 말산 탈수소 효소(MDH2), 말산 효소(MAE1)의 N말단의 미토콘드리아 이행 시그널을 제거한 sMAE1의 3유전자의 총 6유전자(도 3에 밑줄선으로 표시된 유전자)를 집적 대상에 첨가하였다. 이상에 기재한 12개의 유전자에는, 각각 효모 내에서 강력하게 발현하는 것이 가능한 1차 대사 경로의 프로모터와 터미네이터를 도입하였다.
(3) 종 플라스미드 1: 과잉 발현 유전자군 세트의 디자인
출아 효모 중에서 12개의 유전자를 발현할 수 있도록, 12종류의 프로모터 및 터미네이터를 사용한 발현 카세트를 설계하였다. 구체적으로는, ADH1, FBA1, HXT7, PDC1, PGK1, SED1, TDH1, TDH2, TDH3, TEF1, TEF2, TPI1의 프로모터와 터미네이터를 사용하여 12종류의 발현 카세트를 설계하였다(도 4의 유전자 ORF 상의 화살표가 프로모터 서열을, 핀이 터미네이터 서열을 의미한다.). 각각의 발현 카세트의 프로모터와 터미네이터 사이에는, 삽입되는 유전자의 개시 코돈(ATG)으로부터 종지 코돈(TAA)까지를 서브 클로닝할 수 있도록 BspQI 부위를 역방향으로 2개 배치한 서열 (…atgAGAAGAGCTCTTCAtaa…)을 부가하였다. PDC1 프로모터와 TDH2 프로모터에 대해서는 서열 중에 포함되는 BspQI 부위를 삭제하기 위하여, PDC1 프로모터는 -492 위치의 G를 C로, TDH2 프로모터는 -462 위치의 C를 G로, 각각 변이시킨 서열을 사용하였다. 프로모터와 터미네이터를 포함하는 12종류의 발현 카세트의 좌우 말단 서열은, SfiI에 의한 절단 후에 단위 DNA의 번호별로 지정된 고유의 3염기의 3' 말단 돌출 염기가 출현하도록 디자인한 제한 효소 부위(SfiI 부위)를 각각 부가하고, 상보성에 의해 연결 상대가 지정 되도록 서열을 설계하였다. 이러한 12종류의 프로모터와 터미네이터를 포함하는 발현 카세트는, pMA 혹은 pMK 벡터에 클로닝되도록 디자인하였다. 이어서, 출아 효모 중에서의 이소부탄올 대사 경로에 관계되는 12개의 유전자군으로서 ilvEc, ilvDLl, alsLp, kivd, ILV3, ILV5, ADH6, PYC2, ILV2, MDH2, maeBEc, sMAE1을 선정하고, 각각의 유전자의 개시 코돈은 ATG, 종지 코돈은 TAA로 통일되도록 서열을 개변하였다. 또한, 이들 유전자는 12종류의 발현 카세트 중 어느 것에도 서브 클로닝할 수 있도록, 양쪽 말단에 BspQI 부위를 배치한 서열(TAGGCTCTTCAatg…taaAGAAGAGCCTA)을 부가하도록 설계하였다(도 2). BspQI 부위를 양쪽 말단에 갖는 이러한 유전자는, pCR-BluntII-TOPO 벡터에 클로닝되도록 디자인하였다. 최종적으로, pMA 혹은 pMK에 클로닝된 ADH1, FBA1, HXT7, PDC1, PGK1, SED1, TDH1, TDH2, TDH3, TEF1, TEF2, TPI1의 프로모터와 터미네이터를 갖는 12종류의 발현 카세트의 BspQI 부위 각각에, ilvEc, ilvDLl, alsLp, kivd, ILV3, ILV5, ADH6, PYC2, ILV2, MDH2, maeBEc, sMAE1이 삽입되도록, 합계 12종류의 과잉 발현 카세트(ilvCEc-1st, ilvDLl-2nd, alsLp-3rd, kindEc-4th, ILV3-5th, ILV5-6th, ADH6-7th, PYC2-8th, ILV2-9th, MDH2-10th, maeBEc-11th, sMAE1-12th)를 디자인하였다(서열 번호 2-13). 또한, 출아 효모 내에 있어서, 약제에 의한 선택이 가능하도록, 제13번째의 단편으로서 KanMX 단편(kanMX4-13th)을 도입하였다(서열 번호 14).
(4) 종 플라스미드 2: 발현 억제 유전자군 세트의 디자인
(3) 종 플라스미드 1: 과잉 발현 유전자군 세트의 디자인을 답습하고, 동일한 프로모터 및 터미네이터 서열을 사용하고 있지만, 삽입하는 각 유전자의 ORF 단편은, 과잉 발현 유전자군 세트와 비교하여 반대 방향의 방향이 되도록 설계하였다. 구체적으로는 (3)에서 설계한, 각각의 발현 카세트의 프로모터와 터미네이터 사이에는, 삽입되는 유전자의 개시 코돈(ATG)으로부터 종지 코돈(TAA)까지를 서브 클로닝할 수 있도록 한 플라스미드를 BspQI로 절단하고, 여기에 새롭게 BspQI 부위를 역방향으로 2개 배치한 서열을 연결함으로써, 돌출 서열(…atgttaAGAAGAGCTCTTCAcattaa…의 밑줄부 서열)을 변경한 플라스미드를 준비하였다. 이러한 수순을 거쳐 제작된 발현 억제 카세트(ilvCEc-as-1st, ilvDLl-as-2nd, alsLp-as-3rd, kindEc-as-4th, ILV3-as-5th, ILV5-as-6th, ADH6-as-7th, PYC2-as-8th, ILV2-as-9th, MDH2-as-10th, maeBEc-as-11th, sMAE1-as-12th)의 염기 서열을, 서열 번호 15-26에 나타낸다. 단위 DNA의 결과적으로, 종 플라스미드 2의 단위 DNA는, 종 플라스미드 1의 단위 DNA와 비교하여 새롭게 도입한 돌출 서열의 6염기분이 길게 되어 있다. 또한, 약제 선택 마커의 KanMX에 대해서는, 종 플라스미드 1과 동일한 것을 사용하였다.
(5) 종 플라스미드의 구축
유전자(ORF 영역)에 대해서는, PCR법을 사용하여 출아 효모(YPH499주) 게놈으로부터 증폭하였다. 먼저, 상기에서 결정한 돌출 조합간의 DNA 서열을 증폭하기 위한 프라이머의 5' 말단에 상기에서 결정한 제한 효소 인식 부위를, 바람직한 돌출을 잘라내는 위치에 부가하고, 다시 5' 말단에 TAG의 서열을 부가한 프라이머를 사용하였다. 이러한 프라이머 세트를 사용하여, 출아 효모 게놈으로부터 지정 영역의 DNA 단편을 증폭하였다. PCR의 반응 조건은, 1 반응(50μl)에 대하여 5μl의 KOD Plus 10Хbuffer Ver.2, 3μl의 25mM MgSO4, 5μl의 dNTP(2mM each), 1μl의 KOD Plus(1unit/μl), 48pg의 람다 파지 DNA(TOYOBO), 15pmol의 프라이머(F 프라이머와 R 프라이머 각각), 멸균수를 첨가하여 제작하고, GeneAmp PCR System 9700, Applied Biosystems사)에 의해, 이하의 프로그램에 의해 행하였다. 94℃, 2min, 인큐베이션 후, 98℃ 10s, 55℃ 30s, 68℃ 1min을 30사이클 행하고, 마지막으로 68℃ 7min 인큐베이션하였다.
증폭한 DNA 단편은, 0.7%의 저융점 아가로오스 겔(2-Hydroxyethyl Agarose TypeVII, 시그마사)로 1×TAE(Tris-Acetate-EDTA Buffer) 버퍼 존재 하에서, 범용 아가로오스 겔 전기 영동 장치(i-MyRun. N 핵산용 전기 영동 시스템, 코스모 바이오사)로, 100V(약 8V/cm)의 전압을 인가하고, 1h 영동함으로써, 플라스미드 벡터와 단위 DNA를 분리하였다. 이 영동 겔을, 1μg/ml의 브롬화 에티듐(시그마사)를 포함하는 1×TAE 버퍼 100ml로 30min 염색하고, 장파장의 자외선(366mn)으로 조사하여 가시화함으로써, PCR 산물의 목적 사이즈를 면도기로 잘라내 1.5ml 튜브에 회수하였다. 회수한 저융점 아가로오스 겔(약 300mg 정도)에, 1×TAE 버퍼를 첨가함으로써 전체 체적을 약 700μl로 하고, 이것을 65℃, 10min 항온함으로써, 겔을 용해하였다. 그 후, 등량의 TE 포화 페놀(나카라이테스크사)를 첨가하여, 잘 혼합함으로써 제한 효소를 실활시켰다. 원심 분리(20,000×g, 10min)에 의해 페놀상과 수상으로 분리하고, 수상(약 90μl)을 새로운 1.5ml 튜브에 회수하였다. 여기에 1-부탄올(와코 쥰야꾸 고교사)을 500μl 첨가하여 잘 혼합 후, 원심 분리(20,000×g, 1min)에 의해 분리하고, 수분을 포화한 1-부탄올을 제거하는 조작을 수상의 체적이 450μl 이하가 될 때까지 반복함으로써, 수상의 체적을 감소시켰다. 여기에, 3M 아세트산 칼륨-아세트산 완충액(pH 5.2)을 50μl와, 에탄올 900μl을 첨가하고, 원심 분리(20,000×g, 10min)함으로써, DNA를 침전하고, 이것을 70% 에탄올로 린스하고, 20μl의 TE (10mM Tris-HCl, 1mM EDTA, pH 8.0)에 용해하였다. 이 회수 DNA는, 사용할 때까지 -20℃에서 보존하였다.
얻어진 DNA 단편은, 이하에 나타내는 방법에 의해 TA 클로닝법에 의해 대장균 플라스미드 벡터 중에 클로닝하였다. DNA 단편 8μl에, TAKARA사의 PCR 반응용 효소 Ex-Taq에 부속되는 10×Ex-Taq Buffer 1μl에, 100mM dATP 0.5μl, Ex-Tag 0.5μl을 첨가하고, 65℃에서 10min 항온함으로써, DNA 단편의 3' 말단에 A의 돌출을 부가하였다. 이 DNA 단편 용액 1μl에, TAKARA사의 pMD19-Simple 1μl와 멸균수 3μl을 혼합 후, TAKATA Ligation(Mighty)Mix 5μl을 첨가하고, 16℃에서 30min 항온하였다. 이 라이게이션 용액의 5μl을 50μl의 대장균 DH5α의 케미컬 컴피턴트 세포에 첨가하고, 빙상에서 15min 항온 후, 42℃에서 30sec 열 쇼크를 주고, 2min 빙상에서 방치 후, LB 배지를 200μl 첨가하고, 37℃에서 1h 항온 후, 카르베니실린을 100μg/ml의 농도로 포함하는, 1.5% 한천을 포함하는 LB 플레이트에 도말하고, 37℃에서 밤새 배양함으로써 플라스미드의 형질 전환체를 얻었다.
얻어진 콜로니를, PCR용 주형 DNA 조제 시약(시카 지니어스 DNA 조제 시약, 간토 가가꾸)을 사용하여 조제하였다. 구체적으로는, 시약 키트 내의 시약 a와 시약 b를 1:10의 비율로 혼합한 용액을 2.5μl 준비하고, 여기에 플레이트 상의 콜로니를 이쑤시개로 소량 채취한 것을 현탁 후, 72℃, 6min 처리 후, 94℃, 3min 처리하였다. 얻어진 액체에, TAKARA Ex-Taq용 10×효소 2.5μl와 2.5mM dNTP 용액 2μl, 10pmol/μl의 M13F 프라이머 0.25μl과 10pmol/μl의 M13R 프라이머 0.25μl, 멸균수 17μl, Ex-TaqHS 0.5μl을 첨가하여, 94℃, 5min 인큐베이션 후, 98℃, 20sec, 55℃, 30sec, 72℃, 1min을 30사이클 행함으로써 DNA를 증폭하고, 이 PCR 산물의 염기 서열을 조사함으로써, 바람직한 서열과 완전히 일치하는지 여부를 조사하였다. 최종적으로 모든 클론으로부터 올바른 서열이 얻어졌다.
원하는 서열을 갖는 DNA 단편을 클로닝하는 플라스미드를 갖는 대장균 형질 전환체를 각각 2ml의 100μg/ml의 카르베니실린이 들어간 LB 배지에서 37℃, 120spm, 밤새 배양하고, 얻어진 균체를, QIAfilter Plasmid miniKit(퀴아젠사)를 사용하여, 매뉴얼에 따라 정제하였다. 얻어진 플라스미드를 BspQI로 절단하고, 전기 영동에 의한 사이즈 분획에 의해 ORF 영역을 회수하였다.
효모의 프로모터와 터미네이터를 BspQI 부위에서 연결한 DNA 단편을 SfiI 부위에서 자를 수 있도록 설계한 DNA의 합성(도 2의 과잉 발현용)은, 서모피셔사에 의뢰하였다. 이러한 DNA 단편은, 플라스미드 벡터 pAM 혹은 pMK에 클로닝된 형태로 납품되었다. 이 플라스미드를 BspQI로 절단하고, 상술한 ORF의 BspQI 단편을 연결한 것을 구축하여 종 플라스미드 1의 단위 DNA를 갖는 플라스미드로서 준비하였다. 이러한 단위 DNA 단편의 서열은, 서열 번호 2-13과 같다. 종 플라스미드 2용으로는, 상술한 pMA 혹은 pMK에 클로닝된 프로모터와 터미네이터를 BspQI 부위에서 연결한 DNA 단편을 BspQI로 절단하고, 링커 DNA를 도입함으로써, 도 2의 발현 억제용과 같이 새롭게 구축하였다. 이 플라스미드를 BspQI로 절단하고, 상술한 ORF의 BspQI 단편을 도입함으로써 구축하였다. 이러한 원하는 서열을 갖는 DNA 단편을 클로닝하는 플라스미드를 갖는 대장균 형질 전환체를 각각 2ml의 100μg/ml의 카르베니실린이 들어간 LB 배지에서 37℃, 120spm, 밤새 배양하고, 얻어진 균체를, QIAfilter Plasmid miniKit(퀴아젠사)를 사용하여, 매뉴얼에 따라 정제하였다. 얻어진 플라스미드의 10μl을 분취하고, 멸균수 30μl, 10×NEB buffer#2 5μl, SfiI제한 효소(NEB) 5μl을 첨가하고, 50℃, 2h 반응시킴으로써 단위 DNA 단편을 플라스미드 벡터로부터 분리하였다. 그것을 0.7%의 저융점 아가로오스 겔로, 1×TAE (버퍼 존재 하에서, 범용 아가로오스 겔 전기 영동 장치로, 50V(약 4V/cm)의 전압을 인가하고, 1h 영동함으로써, 플라스미드 벡터와 단위 DNA를 분리하였다. 이 영동 겔을, 1μg/ml의 브롬화 에티듐(시그마사)를 포함하는 1×TAE 버퍼 100ml로 30min 염색하고, 장파장의 자외선(366mn)으로 조사하여 가시화함으로써 3kb 부근을 면도기로 잘라내 1.5ml 튜브에 회수하였다. 회수한 저융점 아가로오스 겔(약 300mg 정도)은, 상술한 바와 같이 정제하고, 20μl의 TE에 용해하였다. 이와 같이 하여 조제한 단위 DN 플라스미드는, 시판되고 있는 Lambda phage genome DNA(TOYOBO)의 희석 계열을 기초로 하여 제작한 검량선을 사용하여, 핵산 형광 염료의 SYBR GreenII 형광 플레이트 리더에 의해 정량하였다.
(6) 유전자 집적
종 플라스미드 1의 집적에는 서열 번호 2-14의, 종 플라스미드 2의 집적에는 서열 번호 14-26의 각 단위 DNA와, 유전자 집적용 벡터의 pGETS302-SfiI(서열 번호 1)가 0.1foml 이상의 등몰을 포함하는 혼합 용액 10μl에 2×라이게이션 버퍼를 11μl 첨가하고, 전체를 37℃, 5min 동안 항온한 후, 1μl의 T4DNA 리가아제(Takara)를 첨가하고, 37℃에서 4h 항온하였다. 10μl을 덜어 전기 영동함으로써 라이게이션되어 있는 것을 확인 후, 이것을 10μl 새로운 튜브에 채취하고, 고초균 컴피턴트 세포를 100μl 첨가하고, 37℃에서 30min, 덕 로터로 회전 배양하였다. 그 후, 300μl의 LB 배지를 첨가하고, 37℃에서 1h, 덕 로터로 회전 배양하고, 그 후, 배양액을 10μg/ml의 테트라사이클린이 들어간 LB 플레이트에 펴고, 37℃에서 밤새 배양하였다. 콜로니는, 과잉 발현과 유전자 발현 억제 중 어느 쪽의 구축으로부터도 100개의 형질 전환체가 얻어졌다. 플라스미드를 추출하여 제한 효소 절단 패턴을 조사함으로써 각각 1개씩 목적으로 하는 구조(도 4의 공정 (A)의 종 플라스미드)를 갖는 형질 전환체를 선택하였다.
(7) 종 플라스미드의 고순도 정제
염화 세슘-에티듐 브로마이드 밀도 구배 초원심법에 의해 고순도의 플라스미드 DNA를 조달하였다. 구체적으로는, LB 배지에 항생 물질(테트라사이클린)을 첨가한 것을 200ml 준비하고, 500ml의 삼각 플라스크에 100ml씩 넣어 37℃에서 밤새 배양하였다. 충분히 증식 후, 플라스미드의 카피 수를 증가시키기 위하여 1M의 IPTG을 각 플라스크에 100μl씩 첨가하고, 추가로 3시간 내지 12시간 정도 배양하였다. 배양 종료 후, 50ml씩 50ml 튜브(팔콘 2070) 4개에 분주하고, 5,000rpm 10min 원심하였다. 상청을 버리고, 균 펠릿을 보텍스에 의해 완전히 풀었다. 10mg/ml의 리소자임이 들어간 Sol.I용액(조성 50mM 글루코오스, 25mM Tris-CI(pH 8.0), 10mM EDTA)를 준비하고, 균이 들어간 튜브 4개에 각각 2.5ml씩 첨가하여 잘 혼합하였다. 이것을 37℃, 30min 인큐베이션하였다. 5,000rpm 10min 원심하고, 상청을 데칸트로 제거하고, 새롭게 리소자임이 들어 있지 않은 Sol.I를 4개의 튜브에 각각 2.5ml 첨가하고, 펠릿을 균일하게 현탁하였다. 신선한 Sol.II(조성 0.2N NaOH, 1% (w/v) 도데실 황산 나트륨)를 조제하고, 4개의 튜브에 각각 5ml씩 첨가하고, 천천히 혼합하여 투명하게 만들었다. Sol.III(조성 60ml 5M 아세트산 칼륨, 11.5ml 빙초산, 28.5ml 물)를 각 튜브에 3.75ml씩 첨가하고, 백탁 물질이 균등하게 분산될 수 있도록 어느 정도 강한 힘으로 혼합하였다. 5,000rpm 10min 원심하고, 상청을 피펫으로 빨아 들여 새로운 4개의 나사 덮개의 50ml 튜브(팔콘 2070)로 옮겼다. 각각의 튜브에 5ml의 페놀·클로로포름을 첨가하고, 격렬하게 혼합하였다. 5,000rpm 10min 원심하고, 상청을 피펫으로 빨아 들여 새로운 4개의 나사 덮개의 50ml 튜브(팔콘 2070)로 옮겼다. 100% 에탄올을 각각 25ml 첨가하여 혼합하고, 5,000rpm 10min 원심하였다. 상청을 제거하였다. 10ml의 TE에 10mg/ml의 RNaseA 용액을 10μl 첨가한 용액(최종 농도 10μg/ml)을 각 튜브에 2.5ml씩 첨가하여 침전을 용해하였다. 4개의 튜브의 액체를 1개로 통합하고, 37℃ 기상의 인큐베이터에서 30min 인큐베이션하였다. 인큐베이션 종료 후에 5ml의 페놀·클로로포름을 첨가하여 잘 혼합 후, 5,000rpm 10min 원심하였다. 상청을 새로운 50ml 튜브에 덜어 옮기고, Sol.III를 1ml 첨가 후, 100% 에탄올을 25ml 첨가하여 혼합하였다. 그 후, 5,000rpm 10min 원심하여 상청을 제거하였다. 침전에 5.4ml의 TE를 첨가하여 완전히 용해하였다. 이어서, 정확하게 칭량한 6.40g의 염화 세슘을 투입하여 완전히 용해하였다. 추가로, 1.3g/ml의 염화 세슘 용액(1.3g의 염화 세슘과 1ml의 물을 섞어서 제작한 용액으로, 체적 조제하지 않음)을 2.6ml 첨가하였다. 마지막으로, 10mg/ml의 에티듐 브로마이드 용액을 600μl 첨가하여 잘 혼합하였다. 초원심 튜브(베크만 362181)를 1개 준비하고, 초원심 튜브에 내용물을 옮겼다. 밸런스와의 무게 차이가 20mg 이내가 되도록, 물, 혹은 1.3g/ml 염화 세슘 용액(비중 약 1.5g/ml 정도)을 첨가하여 무게를 미세 조정하였다. 초원심 장치(베크만 콜터)로 이하의 조건에서 원심을 행하였다. 온도 18℃, 속도 50,000rpm, 가속도 Max, 감속도 Max로 15시간 이상 원심하였다. 원심 종료 후, 자외선(365nm) 관찰 하에서, 1ml의 시린지에, 바늘(21G×5/8”)을 세트한 것을 준비하고, ccc형의 플라스미드의 밴드에 꽂고, 플라스미드 용액을 회수하고, 15ml 튜브로 옮겼다. 여기에 Sol.III을 500μl 첨가하고, 다음에, 전체가 3ml이 되도록 물을 첨가하였다. 추가로, 9ml의 100% 에탄올을 첨가하였다. 5,000rpm 10min 원심하고, 상청을 제거하였다. 얻어진 침전에 700μl의 TE를 15ml 튜브에 첨가하고, DNA를 용해하였다. 이것을 1.5ml의 튜브에 옮기고, 600μl의 1-부탄올을 첨가하여 혼합하고, 15,000rpm으로 10s 정도 원심하고, 2층으로 분리하고, 상층의 부탄올층을 버렸다. 새롭게, 600μl의 1-부탄올을 첨가하여 혼합하고, 15,000rpm으로 10s 정도 원심하고, 2층으로 분리하고, 상층의 부탄올층을 버렸다. 이 조작을, 수층이 450μl 이하가 될 때까지 계속하였다. 50μl의 Sol.III를 첨가하고, 추가로 100% 에탄올을 900μl 첨가하였다. 15,000rpm으로 10min 원심하였다. 상청을 버리고, 침전을 70% 에탄올로 린스하였다. 침전을 22μl의 TE에 용해하였다.
(8) 종 플라스미드로부터의 단위 DNA의 생성
도 4의 공정 (B)의 단위 DNA의 조제는, 이하와 같이 행하였다. 초원심법에 의해 고순도로 정제한 종 플라스미드 300ng분을 분취하고, 멸균수로 40μl로 맞춘 후, 10ХNEBbuffer#2를 5μl와, 제한 효소 SfiI(NEB사)를 5μl 첨가하고, 37℃, 2h 반응시켰다. 반응액을 1μl 전기 영동하여 절단되어 있는 것을 확인하였다. 그 후, 2개의 종 플라스미드의 반응액을 통합하고, 450μl 페놀·클로로포름·이소아밀알코올(25:24:1) (나카라이테스크사)을 첨가하고, 혼합 후, 원심 분리(20,000×g, 10min)에 의해 페놀상과 수상으로 분리하고, 수상(약 900μl)을 새로운 1.5ml 튜브에 회수하였다. 여기에 1-부탄올(와코쥰야꾸 고교사)을 500μl 첨가하여 잘 혼합 후, 원심 분리(20,000×g, 1min)에 의해 분리하고, 수분을 포화한 1-부탄올을 제거하는 조작을 수상의 체적이 450μl 이하가 될 때까지 반복함으로써, 수상의 체적을 감소시켰다. 여기에, 3M 아세트산 칼륨-아세트산 완충액(pH5.2)을 50μl와, 에탄올 900μl을 첨가하고, 원심 분리 (20,000×g, 10min)함으로써 DNA를 침전하고, 이것을 70% 에탄올로 린스하고, 20μl의 TE에 용해하였다.
(9) 조합 라이브러리의 구축
도 4의 공정 (C)의 조합 라이브러리의 구축은, 이하와 같이 행하였다. (8)에서 얻어진 DNA 혼합 용액은, (6)에서 나타낸 유전자 집적법에 의해 집적하여 약 400개의 형질 전환체를 얻었다. 얻어진 형질 전환체로부터 랜덤하게 96주의 콜로니를 선택하고, 2ml의 10μg/ml의 테트라사이클린이 들어간 LB 배지에서 밤새 배양하고, 내부의 플라스미드 카피 수를 증폭하기 위하여 IPTG를 최종 농도 1mM이 되도록 첨가하고, 추가로 37℃에서 3h 배양하였다. 얻어진 균체로부터 플라스미드를 추출하였다. 이러한 추출한 플라스미드의 각각의 유전자의 방향을, 서열 번호 27-62에 나타내는 프라이머 세트를 사용하여 PCR법에 의해 결정하였다(도 5). 그 결과, 12유전자의 모든 요소가 갖추어져 있던 것은 75 클론이고, 21 클론은 단위 DNA의 부분적 결손 혹은 중복이 인정되었다. 75 클론 중 71종류의 다른 조합이 존재하며, 4클론에 대해서는 종류의 중복이 인정되었다.
(10) 조합 라이브러리의 효모로의 도입
(9)에서 얻어진 96개의 조합 라이브러리를 아세트산 리튬(LiAc)법을 사용하여 효모에 도입하였다. 구체적으로는, 모균주가 되는 S. cerevisiae YPH499주를 YPDA 배지(10g/L 건조 효모 추출물[나카라이테스크사제], 20g/L 펩톤[벡톤 디킨슨(BD Difco)사제], 20g/L 글루코오스, 40mg/L 아데닌 황산염) 5mL에 식균하고, 30℃, 150 opm으로 밤새 배양하였다. 배양액을 3,000rpm으로 5min 원심 분리하여 배지를 버린 후, 멸균 증류수 5mL로 균체 펠릿을 현탁하였다. 추가로, 3,000rpm으로 5min 원심 분리한 후, 상청을 버리고, TE/LiAc 용액 1.5mL(10ХTE 150μL, 10ХLiAc 150μL, 멸균 증류수 1,200μL)에 균체 펠릿을 현탁하였다. 균체 현탁액 100μL을 1.5mL 에펜도르프 튜브에 옮기고, 플라스미드 DNA(조합 라이브러리) 1 내지 5XμL과 Carrier DNA[다카라 바이오(클론테크)사제] 2μL을 첨가한 후, TE/LiAc/PEG 용액 600μL(10×TE 60μL, 10×LiAc 60μL, 50% PEG3350 용액 480μL)을 첨가하고, 10sec 볼텍스로 혼합하였다. 혼합액을 30℃에서 30min 인큐베이션한 후, 디메틸술폭시드(DMSO) 70μL을 첨가하여 전도혼화하고, 추가로 42℃에서 15min 인큐베이션하였다. 14,000rpm으로 5sec 원심 분리한 후, 상청을 완전히 제거하고, L-류신을 포함하지 않는 100×아미노산 스톡 용액 (4g/L 아데닌 황산염, 2g/L L-히스티딘, 4g/L L-트립토판, 2g/L 우라실, 3g/L L-리신) 250μL를 첨가하여 균체 펠릿을 현탁하고, 멸균 증류수 550μL을 추가한 후, 전량의 현탁액을 SD 배지 (6.7g/L yeast nitrogen base without amino acids(YNB) [벡톤 디킨슨(BD Difco)사제], 20g/L 글루코오스)의 한천 플레이트(배지에 20g/L 한천 분말을 첨가한다)에 펴고, 건조시킨 후에 30℃에서 3일간 인큐베이션하여 형질 전환체를 얻었다.
(11) 출아 효모에 있어서의 이소부탄올 생산성의 평가
얻어진 효모 형질 전환체의 콜로니를 SD 선택 배지(L-류신을 포함하지 않는 100Х아미노산 스톡 용액을 첨가한 SD 배지) 5mL에 식균하고, 30℃, 150 opm으로 3일간 배양하였다. 3,000rpm으로 5min 원심 분리하고 배지를 버린 후, 멸균 증류수 5mL로 균체 펠릿을 현탁하였다. 추가로 3,000rpm으로 5min 원심 분리하여 상청을 버린 후, 새로운 SD 선택 배지 5mL로 균체 펠릿을 현탁하고, 30℃, 150opm으로 48시간 배양하였다. 배양액을 3,000rpm으로 5min 원심 분리한 후, 상청을 회수하였다. 아세톤 45900μL에 회수한 배지 상청 5100μL을 첨가하여 볼텍스로 혼합하고, 12,000rpm으로 5min 원심 분리한 후, 상청을 회수하였다. 회수한 상청을 유리 바이알에 옮기고, 가스 크로마토그래피 질량 분석 장치(GCMS QP2010 Ultra [시마즈 세이사쿠쇼사제])로, DB-FFAP 칼럼[애질런트 테크놀로지사제]을 사용하여 배지 중에 포함되는 이소부탄올의 농도를 정량하였다. 그 결과, 도 5에 도시한 바와 같이, 클론 96의 146mg/L을 필두로 여러가지 이소부탄올 생산량을 나타내는 주가 얻어졌다. 그 중에는 과잉 발현과, 유전자 발현 억제의 종 플라스미드를 효모에 도입한 주의 이소부탄올 생산량(각각 29mg/L와 15mg/L)보다도 생산량이 많은 주가 얻어졌다.
(12) 라이브러리로부터의 우량 플라스미드의 선택과, 라이브러리의 재구축
이소부탄올 생산량이 120mg/ml 이상이 된, 클론 8, 42, 68, 96의 형질 전환에 사용한 플라스미드를 종 플라스미드로 하는, 새로운 조합 라이브러리를 구축하였다(도 6). 먼저, 상기 플라스미드를 갖는 고초균을 대량 배양하고, (7)에서 나타낸 초원심법에 의해 플라스미드를 추출하고, (8)에서 나타낸 방법에 의해 등몰 혼합한 단위 DNA를 준비하였다. 그 후 (6)에서 나타낸 유전 집적을 행함으로써, 약 200개의 형질 첨가로 이루어지는 2사이클째의 조합 라이브러리를 구축하였다. 여기서부터 랜덤하게 선택한 24 콜로니에 대하여 고초균으로부터 플라스미드를 추출하고, (10)에 나타내는 방법으로 개별적으로 효모에 도입하고, (11)에 나타내는 방법으로 이소부탄올 생산량을 측정하였다. 고초균으로부터 추출한 플라스미드에 대하여 별도 (9)에 기재된 방법에 의해 각 단위 DNA 내의 유전자의 방향을 동정하였다. 이러한 결과를 도 7에 나타낸다. 라이브러리는, 집적이 완전히 이루어지지 않은 클론 3과 12의 2개의 클론을 제외하는 22개의 클론에 대하여, 기대한 바와 같이, 4개의 종 플라스미드 중에서 공통으로 되어 있는 제6, 제9, 제11, 제12 단위 DNA가 공통으로 되어 있고, 그 밖의 단위 DNA에 대해서는, 대체로 종 플라스미드의 조성 비율을 반영한 형태가 되었다. 22개 중 다른 조합은 19종류 존재하고, 그 중 2종류는 종 플라스미드가 된 1회째의 라이브러리 클론 68과 96과 동일하였다. 이소부탄올 생산량에 대해서는, 클론 8, 4, 23, 13이, 각각 173, 171, 169, 164mg/1이 되고, 1회째의 라이브러리의 최고값 146mg/L보다도 높은 생산성을 나타내는 클론이 다수 얻어졌다.
<산업상 이용가능성>
본 발명에 따르면, 장쇄 DNA의 조합 라이브러리를 신속하며 효율적으로 구축하는 것이 가능해진다. 특히, 얻어진 플라스미드의 유전자형 확인을 하지 않아도 동일한 라이브러리로부터 선택된 복수의 플라스미드를, 새로운 키메라 라이브러리 구축을 위하여 재이용하는 것이 가능하기 때문에, 2회째 이후의 라이브러리의 구축을 신속하게 행할 수 있다는 특징을 갖는다.
SEQUENCE LISTING <110> NATIONAL UNIVERSITY CORPORATION KOBE UNIVERSITY <120> A method for constructing chimeric plasmid library <140> PCT/JP2020/013133 <141> 2020-03-24 <150> JP 2019-069798 <151> 2019-04-01 <160> 62 <170> PatentIn version 3.5 <210> 1 <211> 15333 <212> DNA <213> Artificial Sequence <220> <223> Plasmid vector <400> 1 ggccttcttg gccaccccgg gccgtcgacg ctctccctta tgcgactcct gcattaggaa 60 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 120 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 180 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 240 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 300 gatccacagg acgggtgtgg tcgccatgat cgcgtagtcg atagtggctc caagtagcga 360 agcgagcagg actgggcggc ggccaaagcg gtcggacagt gctccgagaa cgggtgcgca 420 tagaaattgc atcaacgcat atagcgctag cagcacgcca tagtgactgg cgatgctgtc 480 ggaatggacg atatcccgca agaggcccgg cagtaccggc ataaccaagc ctatgcctac 540 agcatccagg gtgacggtgc cgaggatgac gatgagcgca ttgttagatt tcatacacgg 600 tgcctgactg cgttagcaat ttaactgtga taaactaccg cattaaagct tatcgatgat 660 aagctgtcaa acatgagaat tcttgaagac gaaagggcct cgtgatacgc ctatttttat 720 aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt cggggaaatg 780 tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga 840 gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac 900 atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc 960 cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca 1020 tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc 1080 caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt gttgacgccg 1140 ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac 1200 cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca 1260 taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg 1320 agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac 1380 cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct gcagcaatgg 1440 caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat 1500 taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg 1560 ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg 1620 cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc 1680 aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc 1740 attggtaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1800 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1860 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1920 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1980 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 2040 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 2100 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 2160 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 2220 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 2280 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 2340 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2400 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2460 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2520 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2580 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2640 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2700 ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta 2760 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2820 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2880 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2940 gttttcaccg tcatcaccga aacgcgcgag gcaggatccg tatttcacac cgcatatcga 3000 cggtcgagga gaacttctag tatatccaca tacctaatat tattgcctta ttaaaaatgg 3060 aatcccaaca attacatcaa aatccacatt ctcttcaaaa tcaattgtcc tgtacttcct 3120 tgttcatgtg tgttcaaaaa cgttatattt ataggataat tatactctat ttctcaacaa 3180 gtaattggtt gtttggccga gcggtctaag gcgcctgatt caagaaatat cttgaccgca 3240 gttaactgtg ggaatactca ggtatcgtaa gatgcaagag ttcgaatctc ttagcaacca 3300 ttattttttt cctcaacata acgagaacac acaggggcgc tatcgcacag aatcaaattc 3360 gatgactgga aattttttgt taatttcaga ggtcgcctga cgcatatacc tttttcaact 3420 gaaaaattgg gagaaaaagg aaaggtgaga ggccggaacc ggcttttcat atagaataga 3480 gaagcgttca tgactaaatg cttgcatcac aatacttgaa gttgacaata ttatttaagg 3540 acctattgtt ttttccaata ggtggttagc aatcgtctta ctttctaact tttcttacct 3600 tttacatttc agcaatatat atatatattt caaggatata ccattctaat gtctgcccct 3660 atgtctgccc ctaagaagat cgtcgttttg ccaggtgacc acgttggtca agaaatcaca 3720 gccgaagcca ttaaggttct taaagctatt tctgatgttc gttccaatgt caagttcgat 3780 ttcgaaaatc atttaattgg tggtgctgct atcgatgcta caggtgtccc acttccagat 3840 gaggcgctgg aagcctccaa gaaggttgat gccgttttgt taggtgctgt gggtggtcct 3900 aaatggggta ccggtagtgt tagacctgaa caaggtttac taaaaatccg taaagaactt 3960 caattgtacg ccaacttaag accatgtaac tttgcatccg actctctttt agacttatct 4020 ccaatcaagc cacaatttgc taaaggtact gacttcgttg ttgtcagaga attagtggga 4080 ggtatttact ttggtaagag aaaggaagac gatggtgatg gtgtcgcttg ggatagtgaa 4140 caatacaccg ttccagaagt gcaaagaatc acaagaatgg ccgctttcat ggccctacaa 4200 catgagccac cattgcctat ttggtccttg gataaagcta atgttttggc ctcttcaaga 4260 ttatggagaa aaactgtgga ggaaaccatc aagaacgaat tccctacatt gaaggttcaa 4320 catcaattga ttgattctgc cgccatgatc ctagttaaga acccaaccca cctaaatggt 4380 attataatca ccagcaacat gtttggtgat atcatctccg atgaagcctc cgttatccca 4440 ggttccttgg gtttgttgcc atctgcgtcc ttggcctctt tgccagacaa gaacaccgca 4500 tttggtttgt acgaaccatg ccacggttct gctccagatt tgccaaagaa taaggttgac 4560 cctatcgcca ctatcttgtc tgctgcaatg atgttgaaat tgtcattgaa cttgcctgaa 4620 gaaggtaagg ccattgaaga tgcagttaaa aaggttttgg atgcaggtat cagaactggt 4680 gatttaggtg gttccaacag taccaccgaa gtcggtgatg ctgtcgccga agaagttaag 4740 aaaatccttg cttaaaaaga ttctcttttt ttatgatatt tgtacataaa ctttataaat 4800 gaaattcata atagaaacga cacgaaatta caaaatggaa tatgttcata gggtagacga 4860 aactatatac gcaatctaca tacatttatc aagaaggaga aaaaggagga tagtaaagga 4920 atacaggtaa gcaaattgat actaatggct caacgtgata aggaaaaaga attgcacttt 4980 aacattaata ttgacaagga ggagggcacc acacaaaaag ttaggtgtaa cagaaaatca 5040 tgaaactacg attcctaatt tgatattgga ggattttctc taaaaaaaaa aaaatacaac 5100 aaataaaaaa cactcaatga cctgaccatt tgatggagtt taagtcaata ccttcttgaa 5160 ccatttccca taatggtgaa agttccctca agaattttac tctgtcagaa acggccttac 5220 gacgtagtcg atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 5280 gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 5340 cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 5400 atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc ctatttttat aggttaatgt 5460 catgataata atggtttctt aggacggatc gcttgcctgt aacttacacg cgcctcgtat 5520 cttttaatga tggaataatt tgggaattta ctctgtgttt atttattttt atgttttgta 5580 tttggatttt agaaagtaaa taaagaaggt agaagagtta cggaatgaag aaaaaaaaat 5640 aaacaaaggt ttaaaaaatt tcaacaaaaa gcgtacttta catatatatt tattagacaa 5700 gaaaagcaga ttaaatagat atacattcga ttaacgataa gtaaaatgta aaatcacagg 5760 attttcgtgt gtggtcttct acacagacaa gatgaaacaa ttcggcatta atacctgaga 5820 gcaggaagag caagataaaa ggtagtattt gttggcgatc cccctagagt cttttacatc 5880 ttcggaaaac aaaaactatt ttttctttaa tttctttttt tactttctat ttttaattta 5940 tatatttata ttaaaaaatt taaattataa ttatttttat agcacgtgat gaaaaggacc 6000 caggatccta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 6060 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 6120 ggcgccaggg tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc 6180 gcctggccct gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa 6240 tcctgtttga tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat 6300 cccactaccg agatatccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg 6360 cccagcgcca tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc 6420 atttgcatgg tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc 6480 ggctgaattt gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag 6540 acagaactta atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc 6600 tccacgccca gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg 6660 tcagagacat caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca 6720 tcctggtcat ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg 6780 tgcaccgccg ttttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg 6840 gcacccagtt gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg 6900 gccagactgg aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc 6960 acgcggttgg gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc 7020 gcagaaacgt ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca 7080 tactctgcga catcgtataa cgttactggt ttcatcaaaa tcgtctccct ccgtttgaat 7140 atttgattga tcgtaaccag atgaagcact ctttccacta tccctacagt gttatggctt 7200 gaacaatcac gaaacaataa ttggtacgta cgatctttca gccgactcaa acatcaaatc 7260 ttacaaatgt agtctttgaa agtattacat atgtaagatt taaatgcaac cgttttttcg 7320 gaaggaaatg atgacctcgt ttccaccgaa ttagcttgca tgcaaatcga taaagatccg 7380 cgttctgcgg taatctcatg tgcatattct tccatctcaa taaggatgaa acgacgattc 7440 cctccatctt gtttgttaag cgataatact gcatgagcag tagtgccact ccctgcaaat 7500 gagtcaagta caatcgcttc tttgttttca gtcgcaaatt gtattagtct ttttaccaaa 7560 tcaattgatt tagggttatc gaaaaccttc cttccaaata tcttctttaa ttgactagaa 7620 ccgttgggtt ttaagtcaaa ccaggcatta cttaacaact ttttgctagt cggtggaaca 7680 aagtgctcaa tcgtgccatt atcattttgt cgtaacaagt caatatcttc cccattattt 7740 tctacatatt caagatacca tttatcaata tcctcttgag ttggattagt aatgcctttt 7800 tgtctaagtt catctaacat catttgatag ttttcaatag cctggagact acgttctttc 7860 ccccatctcc attgaccttc tgtcggagta accccaaata attcatatct catagtttta 7920 cggtctgtac ctctccaatg attattccaa ctaccaggct tttcttctac atcttcataa 7980 accttattaa atcgtcgaga tggctgttta gtgtaaacca aaatagactc ataaccattt 8040 gaaagagaat caattgtgtc aaattgcgct tgaacatttt ttactcctct acgaatgata 8100 atagcgtcac gaaaattctc ctcaccgaat atttcgttca taaggcacgt aagatggtgt 8160 atttcattgt agtcaatgct tacaaatatc actccgtctt ctgacaacaa ctctttcaac 8220 agttttaacc tcggcatcat catacaaagc cacttatcat gtcgggataa gtcttctttg 8280 tctaccactt ttccaagcca ttccctaatc attggggagt tgacattatc attataaatc 8340 catttttcag ttccagtatt gtatggtggg tcaatataga tgcaatctat cttaccagca 8400 tatgtaggta gtagagcttt caacgccttt aaattgtccc catgaatgat aagattgtca 8460 tgaagactaa ctttatcggt cagacttttt tctggttctg ggatcaattc atgatatttt 8520 acagtcaagt gatgattttg tacaaaagac tttcccttaa acgaaatagt aggcatgtat 8580 tgaacctcct tatgtagata aaaaatccta atgtgtttta ttcttagtct ctgctaactc 8640 aaggagagat tatattagag ataaaagtgt taaaaatcac gtacacgaac aaggcgtgta 8700 cgacagcccc ctcctttctc ggagtgttct tcctcttccc ccatgttgga agggcttgtg 8760 atgttgacag caccgtccct acccatcagg acttttaacc atcaacgaca gtggctacga 8820 actagaggag catttgtagg tgtcatgacc tttccaacgt agtcctcgaa agacttgggg 8880 tagtcaacta gggcttttta caagccccac ttcaaaagcc gttaggcttt aagtggtggg 8940 tagttgacct tcggtttgtt cttctctttc ctccaaccaa ttatagaacg gtactcttga 9000 tctttgttgc tcctgttgtt gtttttcctg ttccttctgt tttttatatt ggtttagttt 9060 ataagtagca tgttcacttt gggaagaagc tctattcatt acaagaccat ttaccatata 9120 taaggctcgg tcacgtattg ggtttaatct acctttttta gatttttcat agtctgctat 9180 tttttttatc attttactga tttcgtgcgt gtaaaaagta gaaatccctg ctttccataa 9240 ataacatacc aaccgttctt caaagtgttt atcaaagcta aagttttcac gtaactgtat 9300 aactgaaaat ctattaataa attgataggc ctgtttaata tcttcttgtg aaaaaagtaa 9360 tgacctattt attgtacgac cagttggttc attttcgatt tcctcatcat catcaattaa 9420 taaattattt gaaacattag tagaaatatt tgataagtta ttaaagatat ttgaataatt 9480 attgggtttt atttttgaaa cggtcaccgt ttcatttttg aaaccctcca ccgtttcatt 9540 tttgaaaccc tccaccgttt catttttgaa accgttgtgg ataactcttt ttaacttata 9600 tttacgtttc tttttagtta cttcttcggg tttcttttcg ggttcttctt cactatcttt 9660 tttccttggt ctaccacctg ttttacctaa ttctttagaa acggaattat agtctttatc 9720 ccaatctctt aatttttcta gtggtttata ctttctttct atttcgtgta aaggatactc 9780 ataaacaatt atatttttag gtttagtaga attacggtta gattcttcgt attctatgat 9840 gtctattaat ccatattccc ataaaggttt tatcaatcta taaaacttac tttttgagat 9900 tcctagtgtc tttttatata tgttctcaaa acttctaggt atgcgatcat aatctcggag 9960 ttcatcttct ctatctaccc aagtatggaa cctcaaccat aaagtaaacg tttcgtgtcc 10020 tagtttatca atccaatcat cagctactac ataagtcatt ataggtaggt ttaattccca 10080 tctgttcttc ttaccacgtt ttactggttc attattcact ttgcattcct ccaatcaatt 10140 tgttattgga gaaatgtacg aaacgtgata caatgtaaat gtatctagtt attttttatt 10200 tatagcgttt cgtacatttc tcgaaagagt atccgttgtg agcgggtact cttatttttt 10260 tgtcatcacc aaaccaacgc ctaaaacgtt taatttccat attcatatct caattaaaaa 10320 ataacacgat accagcgagt gtggagtcca caaaaagtac acaaaaagtc tacaaaagtc 10380 cataatacct ataaaataac ctcaactctt ccagaaaaac ttttgttgca gaaaggtctt 10440 ttatgacgtt aatttccttt taaatcattg atataacagg gtttttaagt tagaacgtcc 10500 gacgtaattt ccaattttct attcaatttt ttcacaacgt cataactttt tgcttgtcga 10560 ttcactgcaa cccttaatac atcaacaatc tattgaagca aataacgtcc gacgttcatc 10620 taccaaaacg tccgacgttg aaatgacaat aacacctatc caattagcaa gcaggctaac 10680 gcccataata taagggcgac gaaccatgag acactaattt tttccagtta tagttgtttc 10740 agcagtctgt ataagtgcga tttatctaca ccaagtattt ttgctaattt aatttttgag 10800 attttgggat tctgttctaa taactcctgc aatttaaata atttatcatc tgttttatcc 10860 tgttgttgct taatatactc ctgtcgggtc atatctcccc gctcacgacg tttttgttct 10920 tgataaatcc tatccctttc ccgctttctt ctccgtttct cattagcgtc tataatcgtc 10980 tgtaaatgct tctgttcttc tggtgtgata tctagccatt caatcaactt tttattgcta 11040 atattgtatc cagcactggg atatcctttt tcgattgcaa tccggttagc ctcttcgtta 11100 tttcgtgctt cccacgcctt ttctgcgctc cgtgtagccc tttcaacctc ttttaagggt 11160 aaaggctcag tgaactgtaa attaagtgtc tgtgtttgat ttaaagcctc tacagggtcg 11220 ttcgtgtaac agcacaacca ataacggtat aaaaagcaaa tgatttccct gtatccagtt 11280 acctcataat ttcgtagttc caccaatttc actatatcca ataggcgagc gtaatggagt 11340 ttgtaggtat tgaataactg aactactttc tttttacgcc cccgtttttt cttttgtgga 11400 gcgggattaa taacctcatt gagttctgga aggtaatcaa attgaatctg ccttaactca 11460 tatctgtaat cgtgccgata ttccgctctt acttccgctc cattcttact attgacgctc 11520 ccagcaatcc gaaaaacacg tgctgcatcg gttgcttttg gatctccgcc tagttccttg 11580 agttgctcta ataaataatt ttgaacagcc tgccaaagcg gaagagcctt gtaaggcact 11640 ggctcaagca accatatgag aacaaggcct tgtccactaa aaataaggat attgggttca 11700 ggaatgcttt taccatagaa ttagcttaat tgttatccgc tcacaattcc acacattatg 11760 ccacaccttg tagataaagt caacaacttt ttgcaaaatt tttcaggaat tttagcagag 11820 gttgttctgg atgtagaaca aaacatcttt ccgctcttgt gctgttagga tatctttctt 11880 ggaagctagg taggcaaggg ctacctcaaa taaatcttct tcagggtgcg ctatttttaa 11940 ggtgcctagt gaggtcttga ccacttcacc cataatttca gtgccgaata gtctggactg 12000 ggctgtgtag aattgtagat atgacgacag gaagagtttg tagaaacgca aaaaggccat 12060 ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg cgtcctgccc 12120 gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga tttgtcctac 12180 tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 12240 cctttcgttt tatttgatgc ccaattcctg ttataaaaaa aggatcaatt ttgaactctc 12300 tcccaaagtt gatcccttaa cgatttagaa atccctttga gaatgtttat atacattcaa 12360 ggtaaccagc caactaatga caatgattcc tgaaaaaagt aataacaaat tactatacag 12420 ataagttgac tgatcaactt ccataggtaa caacctttga tcaagtaagg gtatggataa 12480 taaaccacct acaattgcaa tacctgttcc ctctgataaa aagctggtaa agttaagcaa 12540 actcattcca gcaccagctt cctgctgttt caagctactt gaaacaattg ttgatataac 12600 tgttttggtg aacgaaagcc cacctaaaac aaatacgatt ataattgtca tgaaccatga 12660 tgttgtttct aaaagaaagg aagcagttaa aaagctaaca gaaagaaatg taactccgat 12720 gtttaacacg tataaaggac ctcttctatc aacaagtatc ccaccaatgt agccgaaaat 12780 aatgacactc attgttccag ggaaaataat tacacttccg atttcggcag tacttagctg 12840 gtgaacatct ttcatcatat aaggaaccat agagacaaac cctgctactg ttccaaatat 12900 aattccccca caaagaactc caatcataaa aggtatattt ttccctaatc cgggatcaac 12960 aaaaggatct gttactttcc tgatatgttt tacaaatatc aggaatgaca gcacgctaac 13020 gataagaaaa gaaatgctat atgatgttgt aaacaacata aaaaatacaa tgcctacaga 13080 cattagtata attcctttga tatcaaaatg accttttatc cttacttctt tctttaataa 13140 tttcataaga aacggaacag tgataattgt tatcatagga atgagtagaa gataggacca 13200 atgaatataa tgggctatca ttccaccaat cgctggaccg actccttctc ccatggctac 13260 tatcgatcca ataagaccaa atgctttacc cctattttcc tttggaatat agcgcgcaac 13320 tacaaccatt acgagtgctg gaaatgcagc tgcaccagcc ccttgaataa aacgagccat 13380 aataagtaag gaaaagaaag aatggccaac aaacccaatt accgacccga aacaatttat 13440 tataattcca aataggagta accttttgat gcctaattga tcagatagct ttccatatac 13500 agctgttcca atggaaaagg ttaacataaa ggctgtgttc acccagtttg tactcgcagg 13560 tggtttatta aaatcatttg caatatcagg taatgagacg ttcaaaacca tttcatttaa 13620 tacgctaaaa aaagataaaa tgcaaagcca aattaaaatt tggttgtgtc gtaaattcga 13680 ttgtgaatag gatgtattca catttcaccc tccaataatg agggcagacg tagtttatag 13740 ggttaatgat acgcttccct cttttaattg aaccctgtta cattcattat tcattacact 13800 tcataattaa ttcctcctaa acttgattaa aacattttac cacatataaa ctaagtttta 13860 aattcagtat ttcatcactt atacaacaat atggggggat cttgttgaga aatgttaaat 13920 gttttcatat attcttcttc ctccgatttc tgcaaaaatg aatcattgaa tatttaaata 13980 ttcttaattt tattttacaa aaatagagag aaagatcaag tagaaattca atttcacttc 14040 ataaccgata ttaggaattt catttataac taccaataac gtgaattatg taaataagct 14100 gttcatatcg accgggaagg gcgaattctg cggtaaagct catcagcgtg gtcgtgaagc 14160 gattcacaga tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt 14220 aatgtctggc ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcact 14280 gatgcctccg tgtaaggggg atttctgttc atgggggtaa tgataccgat gaaacgagag 14340 aggatgctca cgatacgggt tactgatgat gaacatgccc ggttactgga acgttgtgag 14400 ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa aaatcactca gggtcaatgc 14460 cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta gccagcagca tcctgcgatg 14520 cagatccgga acataatggt gcagggcgct gacttccgcg tttccagact ttacgaaaca 14580 cggaaaccga agaccattca tgttgttgct caggtcgcag acgttttgca gcagcagtcg 14640 cttcacgttc gctcgcgtat cggtgattca ttctgctaac cagtaaggca accccgccag 14700 cctagccggg tcctcaacga caggagcacg atcatgcgca cccgtggcca ggacccaacg 14760 ctgcccgaga tgcgccgcgt gcggctgctg gagatggcgg acgcgatgga tatgttctgc 14820 caagggttgg tttgcgcatt cacagttctc cgcaagaatt gattggctcc aattcttgga 14880 gtggtgaatc cgttagcgag gtgccgccgg cttccattca ggtcgaggtg gcccggctcc 14940 atgcaccgcg acgcaacgcg gggaggcaga caaggtatag ggcggcgcct acaatccatg 15000 ccaacccgtt ccatgtgctc gccgaggcgg cataaatcgc cgtgacgatc agcggtccaa 15060 tgatcgaagt taggctggta agagccgcga gcgatccttg aagctgtccc tgatggtcgt 15120 catctacctg cctggacagc atggcctgca acgcgggcat cccgatgccg ccggaagcga 15180 gaagaatcat aatggggaag gccatccagc ctcgcgtcgc gaacgccagc aagacgtagc 15240 ccagcgcgtc ggccgcaagc ttgaagagct cttctttcag aacgctcggt tgccgccggg 15300 cgttttttat gagacgtctc ggcctgtttg gcc 15333 <210> 2 <211> 2502 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 2 ggcctgtttg gccgggtgta caatatggac ttcctctttt ctggcaacca aacccataca 60 tcgggattcc tataatacct tcgttggtct ccctaacatg taggtggcgg aggggagata 120 tacaatagaa cagataccag acaagacata atgggctaaa caagactaca ccaattacac 180 tgcctcattg atggtggtac ataacgaact aatactgtag ccctagactt gatagccatc 240 atcatatcga agtttcacta ccctttttcc atttgccatc tattgaagta ataataggcg 300 catgcaactt cttttctttt tttttctttt ctctctcccc cgttgttgtc tcaccatatc 360 cgcaatgaca aaaaaatgat ggaagacact aaaggaaaaa attaacgaca aagacagcac 420 caacagatgt cgttgttcca gagctgatga ggggtatctc gaagcacacg aaactttttc 480 cttccttcat tcacgcacac tactctctaa tgagcaacgg tatacggcct tccttccagt 540 tacttgaatt tgaaataaaa aaaagtttgc tgtcttgcta tcaagtataa atagacctgc 600 aattattaat cttttgtttc ctcgtcattg ttctcgttcc ctttcttcct tgtttctttt 660 tctgcacaat atttcaagct ataccaagca tacaatcaac tatctcatat acaatggcta 720 actacttcaa caccttgaat ttgagacaac aattggctca attgggtaaa tgcagattca 780 tgggtagaga tgaatttgct gatggtgctt cttacttgca aggtaaaaag gttgttatcg 840 ttggttgtgg tgcccaaggt ttaaatcaag gtttgaacat gagagactcc ggtttggata 900 tttcttacgc cttgagaaaa gaagccattg ctgaaaaaag agcctcttgg agaaaagcta 960 ctgaaaacgg ttttaaggtc ggtacttacg aagaattgat tccacaagct gatttggtca 1020 ttaacttgac cccagataag caacactctg atgttgttag aactgtccaa ccattgatga 1080 aggatggtgc tgctttgggt tattctcatg gttttaacat cgttgaagtc ggtgaacaaa 1140 tcagaaagga tatcaccgtt gttatggttg ctccaaaatg tccaggtact gaagttagag 1200 aagaatacaa gagaggtttc ggtgttccaa ctttgattgc tgttcatcca gaaaatgatc 1260 caaagggtga aggtatggct attgctaaag cttgggctgc tgctactggt ggtcatagag 1320 ctggtgtttt ggaatcttca tttgttgccg aagttaagtc cgatttgatg ggtgaacaaa 1380 ccattttgtg tggtatgttg caagctggtt ctttgttgtg tttcgataag ttggttgaag 1440 aaggtactga tccagcttac gctgaaaagt tgattcaatt tggttgggaa accattaccg 1500 aagctttgaa acaaggtggt attaccttga tgatggacag attgtctaat ccagctaagt 1560 tgagagctta cgcattgtcc gaacaattga aagaaattat ggcccctttg ttccaaaagc 1620 acatggatga tattatctcc ggtgaattct cttctggtat gatggctgat tgggctaatg 1680 atgataagaa gttgttgact tggagagaag aaactggtaa gactgctttt gaaactgctc 1740 cacaatacga aggtaagatt ggtgaacaag aatacttcga taagggtgtt ttgatgatcg 1800 ctatggttaa ggctggtgtt gaattggcat ttgaaactat ggttgactcc ggtatcattg 1860 aagaatctgc ttactacgaa tccttgcacg aattgccatt gattgctaac actatcgcca 1920 gaaaaagatt atacgaaatg aacgtcgtta tctccgatac tgctgaatac ggtaattact 1980 tgttctctta cgcttgcgtt cctttgttga aaccttttat ggctgaattg caaccaggtg 2040 atttgggtaa agctattcct gaaggtgctg ttgataatgg tcaattgaga gatgttaacg 2100 aagccattag atcccatgcc attgaacaag ttggtaagaa attgagaggt tacatgaccg 2160 acatgaagag aatagctgtt gctggttaag cgaatttctt atgatttatg atttttatta 2220 ttaaataagt tataaaaaaa ataagtgtat acaaatttta aagtgactct taggttttaa 2280 aacgaaaatt cttattcttg agtaactctt tcctgtaggt caggttgctt tctcaggtat 2340 agcatgaggt cgctcttatt gaccacacct ctaccggcat gccgagcaaa tgcctgcaaa 2400 tcgctcccca tttcacccaa ttgtagatat gctaactcca gcaatgagtt gatgaatctc 2460 ggtgtgtatt ttatgtcctc agaggacaag gccttgatgg cc 2502 <210> 3 <211> 3039 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 3 ggccttgatg gccactggta gagagcgact ttgtatgccc caattgcgaa acccgcgata 60 tccttctcga ttctttagta cccgaccagg acaaggaaaa ggaggtcgaa acgtttttga 120 agaaacaaga ggaactacac ggaagctcta aagatggcaa ccagccagaa actaagaaaa 180 tgaagttgat ggatccaact ggcaccgctg gcttgaacaa caataccagc cttccaactt 240 ctgtaaataa cggcggtacg ccagtgccac cagtaccgtt acctttcggt atacctcctt 300 tccccatgtt tccaatgccc ttcatgcctc caacggctac tatcacaaat cctcatcaag 360 ctgacgcaag ccctaagaaa tgaataacaa tactgacagt actaaataat tgcctacttg 420 gcttcacata cgttgcatac gtcgatatag ataataatga taatgacagc aggattatcg 480 taatacgtaa tagttgaaaa tctcaaaaat gtgtgggtca ttacgtaaat aatgatagga 540 atgggattct tctatttttc ctttttccat tctagcagcc gtcgggaaaa cgtggcatcc 600 tctctttcgg gctcaattgg agtcacgctg ccgtgagcat cctctctttc catatctaac 660 aactgagcac gtaaccaatg gaaaagcatg agcttagcgt tgctccaaaa aagtattgga 720 tggttaatac catttgtctg ttctcttctg actttgactc ctcaaaaaaa aaaaatctac 780 aatcaacaga tcgcttcaat tacgccctca caaaaacttt tttccttctt cttcgcccac 840 gttaaatttt atccctcatg ttgtctaacg gatttctgca cttgatttat tataaaaaga 900 caaagacata atacttctct atcaatttca gttattgttc ttccttgcgt tattcttctg 960 ttcttctttt tcttttgtca tatataacca taaccaagta atacatattc aaaatggaat 1020 tcaagtacaa cggtaaggtc gaatccgttg aattgaacaa gtactctaag accttgactc 1080 aagatccaac tcaaccagct acacaagcta tgtattacgg tattggtttc aaggacgaag 1140 atttcaagaa agcccaagtt ggtatcgttt ctatggattg ggatggtaat ccatgcaata 1200 tgcatttggg tactttgggt tccaagatca agtcctctgt taatcaaact gatggtttga 1260 tcggtttaca attccatacc atcggtgttt ctgatggtat tgctaatggt aaattgggta 1320 tgagatactc cttggtcagt agagaagtta ttgccgattc cattgaaact aatgctggtg 1380 ccgaatatta cgatgctata gttgctattc caggttgcga taagaatatg ccaggttcca 1440 ttattggtat ggccagattg aatagaccat ccattatggt ttacggtggt actattgaac 1500 acggtgaata caaaggtgaa aagttgaaca tcgtttccgc ctttgaatct ttgggtcaaa 1560 agattactgg taacatctcc gatgaagatt accatggtgt tatatgcaat gccattccag 1620 gtcaaggtgc ttgtggtggt atgtatactg ctaatacttt ggctgctgct attgaaacct 1680 tgggtatgtc tttgccatac tcttcatcta atccagccgt ttctcaagaa aagcaagaag 1740 aatgcgacga aattggtttg gccattaaga acttgttgga aaaggatatc aagccatccg 1800 acatcatgac caaagaagct tttgaaaacg ccatcaccat cgttatggtt ttgggtggtt 1860 ctacaaatgc cgtcttgcat attattgcaa tggctaacgc tatcggtgtt gaaattactc 1920 aagatgactt ccaaagaatc tccgatatta ctccagtctt gggtgatttt aaaccatccg 1980 gtaagtacat gatggaagac ttgcataaga ttggtggttt gccagctgtt ttgaaatact 2040 tgttgaaaga aggtaaattg cacggtgatt gcttgactgt tacaggtaaa acattggccg 2100 aaaacgttga aactgctttg gatttggatt tcgactccca agatattatg agaccattga 2160 agaatccaat caaggctact ggtcacttgc aaatcttgta tggtaatttg gctcaaggtg 2220 gttccgttgc taaaatctct ggtaaagaag gtgaattctt caagggtact gctagagttt 2280 ttgatggtga acaacatttc atcgacggta tcgaatctgg tagattgcat gctggtgatg 2340 ttgctgttat tagaaacatt ggtccagttg gtggtccagg tatgccagaa atgttgaaac 2400 ctacttctgc tttgattggt gctggtttgg gtaaatcttg tgccttgatt actgatggta 2460 gattctctgg tggtactcat ggttttgttg ttggtcatat tgtccctgaa gctgttgaag 2520 gtggtttaat aggtttggtt gaagatgacg acatcatcga aattgatgcc gttaacaact 2580 ccatctcctt gaaggtttca gatgaagaaa ttgctaagag gagagccaac taccaaaaac 2640 ctactccaaa agctacaaga ggtgttttgg ctaagtttgc taaattgact agaccagctt 2700 ctgaaggttg tgttactgat ttgtaagtta attcaaatta attgatatag ttttttaatg 2760 agtattgaat ctgtttagaa ataatggaat attattttta tttatttatt tatattattg 2820 gtcggctctt ttcttctgaa ggtcaatgac aaaatgatat gaaggaaata atgatttcta 2880 aaattttaca acgtaagata tttttacaaa agcctagctc atcttttgtc atgcactatt 2940 ttactcacgc ttgaaattaa cggccagtcc actgcggagt catttcaaag tcatcctaat 3000 cgatctatcg tttttgatag ctcattggcc tcgatggcc 3039 <210> 4 <211> 2399 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 4 ggcctcgatg gcctcgtagg aacaatttcg ggcccctgcg tgttcttctg aggttcatct 60 tttacatttg cttctgctgg ataattttca gaggcaacaa ggaaaaatta gatggcaaaa 120 agtcgtcttt caaggaaaaa tccccaccat ctttcgagat cccctgtaac ttattggcaa 180 ctgaaagaat gaaaaggagg aaaatacaaa atatactaga actgaaaaaa aaaaagtata 240 aatagagacg atatatgcca atacttcaca atgttcgaat ctattcttca tttgcagcta 300 ttgtaaaata ataaaacatc aagaacaaac aagctcaact tgtcttttct aagaacaaag 360 aataaacaca aaaacaaaaa gtttttttaa ttttaatcaa aaaatgccag acaaaaagta 420 ttatggtgcc gatgctatcg ttgactcctt ggttaatcat gatgtcaagt acgttttcgg 480 tattccaggt gctaagatcg atagagtttt cgaaagattg gaacacccag ttaatccaaa 540 gtctccaaga ttgatcgtta ccagacatga acaaaacgct gcttttattg ctgctggtat 600 tggtagaatt actggtaaac caggtgttgt tatgactact tctggtccag gtgcatctaa 660 tttggctact ggtttggtta ctgctactgc tgaaggtgat ccagttttgg ctatttctgg 720 tcaagttcaa agagccgatt tgttgagatt gacccatcaa tctatgaaca atgctgcttt 780 gttcaagcca atcactaagt actctgctga agttcaagaa ccagaaaaca tctctgaagt 840 tttggccaat gcttaccaag aagctacagc tgctaaacaa ggtgcttctt ttgtttctgt 900 tccacaagat gttaccgact ctatagttag aactccagtt attaccccaa ttcaagctcc 960 aaaattgggt ccagcttctc cagttgaagc tactttgtta gctcaaaaga ttaaggctgc 1020 taagttgcca gttttgttgg ttggtatgag agcttcttca ccagaagtta ctaaggctat 1080 cagaaatttg gttgctgcag ctaatttgcc tgttgttgaa acttttcaag ctgccggtgt 1140 tatttccaga gatttggaag ctaatcactt cttcggtaga gttggtttgt tcagaaatca 1200 accaggtgac atgttattga agaagtccga tttggttatt gccgttggtt acgatccaat 1260 tgaatacgaa cctagaaatt ggaacgccga aggtaaatct agaatcgttg ttattgatgc 1320 catgagagcc gaaatcgatc ataattttca accagaaacc gaattgatcg gtgatattgc 1380 tcaaaccttg gatttcttgt tgccttacat gaagggttac gatatttccg attctgctag 1440 agcttatttg ggtgaattgc aagaaagatt gcaaaccaga gacttcgttc caaacatcga 1500 taagcaatcc aagttgaacc atccattgtc tgttattgca gccttgcaac aaagagtttc 1560 tgatgatatg actgttaccg ttgatgttgg ttcccattac atttggatgg ctagacattt 1620 cagatcctat gaacctagac acttgttgtt ctctaacggt atgcaaactt tgggtgttgc 1680 tttaccatgg gctattgcag ctgctttggt tagaccagat actcaaatag tttccgtttc 1740 tggtgatggt ggttttttgt tttctgccca agaattggaa accgccgtta gattgaaaca 1800 aaacatcgtt catttgatct ggaacgacgg tacttacgat atggttaagt tccaagaaga 1860 aatgaagtac ggtgaagatg ctgctgttca ttttggtcca gttgattttg ttaagtacgc 1920 cgaatctttt ggtgctacag gtttgagagt taatcaacct gctgatttgg aaaaggtttt 1980 ggatcaagct tttgctactg atggtccagt cgttgttgat attccaatcg attactctga 2040 caacaaggct ttgggtaaaa ctatgttgcc agaccaattc tactaatttg cgaacacttt 2100 tattaattca tgatcacgct ctaatttgtg catttgaaat gtactctaat tctaatttta 2160 tatttttaat gatatcttga aaagtaaata cgtttttaat atatacaaaa taatacagtt 2220 taattttcaa gtttttgatc atttgttctc agaaagttga gtgggacgga gacaaagaaa 2280 ctttaaagag aaatgcaaag tgggaagaag tcagttgttt accgaccgca ctgttattca 2340 caaatattcc aattttgcct gcagacccac gtctacaaat tttggtggcc ttgttggcc 2399 <210> 5 <211> 2623 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 5 ggccttgttg gccttgagat aagcacactg cacccatacc ttccttaaaa acgtagcttc 60 cagtttttgg tggttccggc ttccttcccg attccgcccg ctaaacgcat atttttgttg 120 cctggtggca tttgcaaaat gcataaccta tgcatttaaa agattatgta tcctcttctg 180 acttttcgtg tgatgaggct cgtggaaaaa atgaataatt tatgaatttg agaacaattt 240 tgtgttgtta cggtatttta ctatggaata atcaatcaat tgaggatttt atgcaaatat 300 cgtttgaata tttttccgac cctttgagta cttttcttca taattgcata atattgtccg 360 ctgccccttt ttctgttaga cggtgtcttg atctacttgc tatcgttcaa caccacctta 420 ttttctaact attttttttt tagctcattt gaatcagctt atggtgatgg cacatttttg 480 cataaaccta gctgtcctcg ttgaacatag gaaaaaaaaa tatataaaca aggctctttc 540 actctccttg caatcagatt tgggtttgtt ccctttattt tcatatttct tgtcatattc 600 ctttctcaat tattattttc tactcataac ctcacgcaaa ataacacagt caaatcaatc 660 aaaatgtaca ccgttggtga ttacttgttg gatagattgc atgaattggg tatcgaagaa 720 atctttggtg ttccaggtga ttacaacttg caattcttgg accaaatcat ctcccacaaa 780 gatatgaagt gggttggtaa tgctaacgaa ttgaacgctt cttatatggc tgatggttac 840 gctagaacaa aaaaggctgc tgcttttttg actactttcg gtgttggtga attgtctgct 900 gttaatggtt tggctggttc ttacgctgaa aatttgccag ttgttgaaat cgttggttct 960 ccaacttcta aggttcaaaa cgaaggtaaa ttcgttcatc atactttggc cgatggtgat 1020 tttaagcact ttatgaagat gcacgaacca gttactgctg ctagaacttt gttgactgct 1080 gaaaatgcta ccgtcgaaat cgatagagtt ttgtccgctt tgttgaaaga aagaaagcca 1140 gtctacatca acttgcctgt tgatgttgct gctgctaaag ctgaaaaacc atctttgcca 1200 ttgaagaaag aaaactccac ttccaacacc tccgaccaag aaattttgaa caagatccaa 1260 gaatccttga agaacgctaa gaagccaatc gttattactg gtcacgaaat catcagtttc 1320 ggtttggaaa agaccgtcac tcaattcatt tctaagacca agttgccaat caccactttg 1380 aacttcggta agtcatctgt tgatgaagct ttgccatctt tcttgggtat ctacaatggt 1440 actttgtccg aacctaactt gaaagaattc gttgaatccg ccgatttcat cttgatgttg 1500 ggtgttaagt tgaccgattc ttctactggt gctttcactc atcatttgaa cgaaaacaag 1560 atgatctcct tgaacatcga tgaaggtaag atcttcaacg aaagaatcca aaacttcgac 1620 ttcgaatctt tgatctcctc tttgttggac ttgtccgaaa ttgaatacaa gggtaaatac 1680 atcgacaaga agcaagaaga tttcgttcca tccaatgcct tgttgtctca agatagattg 1740 tggcaagctg ttgaaaactt gacccaatct aacgaaacta tcgttgctga acaaggtact 1800 tcttttttcg gtgcctcttc cattttcttg aagtccaagt ctcatttcat tggtcaacca 1860 ttgtggggtt ctattggtta tacttttcca gctgctttgg gttctcaaat tgctgacaaa 1920 gaatctagac acttgttgtt cattggtgac ggttcattgc aattgaccgt tcaagaattg 1980 ggtttggcca ttagagaaaa gattaaccca atctgcttca tcatcaacaa cgatggttac 2040 actgtcgaaa gagaaattca cggtccaaat caatcctaca acgatattcc aatgtggaac 2100 tactctaagt tgccagaatc ttttggtgct accgaagata gagttgtttc caagatagtt 2160 agaaccgaaa acgaatttgt ctccgttatg aaggaagctc aagctgatcc aaatagaatg 2220 tactggatcg aattgatctt ggctaaagaa ggtgctccaa aggttttgaa gaagatgggt 2280 aaattgttcg cagaacaaaa caagtcttaa gcgatttaat ctctaattat tagttaaagt 2340 tttataagca tttttatgta acgaaaaata aattggttca tattattact gcactgtcac 2400 ttaccatgga aagaccagac aagaagttgc cgacagtctg ttgaattggc ctggttaggc 2460 ttaagtctgg gtccgcttct ttacaaattt ggagaatttc tcttaaacga tatgtatatt 2520 cttttcgttg gaaaagatgt cttccaaaaa aaaaaccgat gaattagtgg aaccaaggaa 2580 aaaaaaagag gtatccttga ttaaggaaca ggcctgattg gcc 2623 <210> 6 <211> 2729 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 6 ggcctgattg gccaaagatg ccgatttggg cgcgaatcct ttattttggc ttcaccctca 60 tactattatc agggccagaa aaaggaagtg tttccctcct tcttgaattg atgttaccct 120 cataaagcac gtggcctctt atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa 180 aaagaacaaa actgaaaaaa cccagacacg ctcgacttcc tgtcttccta ttgattgcag 240 cttccaattt cgtcacacaa caaggtccta gcgacggctc acaggttttg taacaagcaa 300 tcgaaggttc tggaatggcg ggaaagggtt tagtaccaca tgctatgatg cccactgtga 360 tctccagagc aaagttcgtt cgatcgtact gttactctct ctctttcaaa cagaattgtc 420 cgaatcgtgt gacaacaaca gcctgttctc acacactctt ttcttctaac caagggggtg 480 gtttagttta gtagaacctc gtgaaactta catttacata tatataaact tgcataaatt 540 ggtcaatgca agaaatacat atttggtctt ttctaattcg tagtttttca agttcttaga 600 tgctttcttt ttctcttttt tacagatcat caaggaagta attatctact ttttacaaca 660 aatataaaac atgggtttgt tgactaaggt tgctacctct agacaattct ctactactag 720 atgtgttgcc aagaagttga acaagtactc ctacattatt accgaaccta aaggtcaagg 780 tgcttctcaa gctatgttgt atgctactgg tttcaagaaa gaagatttca aaaagccaca 840 agtcggtgtt ggttcttgtt ggtggtctgg taatccatgt aatatgcact tgttggactt 900 gaacaacaga tgctcccaat ctattgaaaa ggctggtttg aaagccatgc aattcaacac 960 tattggtgtt tccgatggta tctctatggg tacaaaaggt atgagatact ccttgcaatc 1020 cagagaaatt atcgccgatt ctttcgaaac cattatgatg gctcaacatt acgatgccaa 1080 cattgctatt ccatcttgcg ataagaatat gccaggtgta atgatggcta tgggtagaca 1140 taatagacca tccattatgg tttacggtgg tactattttg ccaggtcatc caacttgtgg 1200 ttcctctaag atttccaaga acatcgatat cgtttccgcc tttcaatctt acggtgaata 1260 tatctctaag caattcaccg aagaagaaag agaagacgtt gttgaacatg cttgtccagg 1320 tccaggttca tgtggtggta tgtatactgc taataccatg gcttctgctg ctgaagtttt 1380 gggtttgact attccaaact cttcatcttt cccagccgtc agtaaagaaa aattggctga 1440 atgtgataac attggtgaat atatcaaaaa gaccatggaa ttgggtatct tgccaagaga 1500 tatcttgacc aaagaagctt tcgaaaacgc tatcacttac gttgttgcta caggtggttc 1560 taccaatgct gttttacatt tggttgctgt tgctcattct gctggtgtta agttgtctcc 1620 agatgatttc caaagaatct ctgataccac tccattgatc ggtgatttta aaccatctgg 1680 taagtacgtt atggccgatt tgattaacgt tggtggtact caatccgtca ttaagtactt 1740 gtacgaaaac aatatgttgc acggtaacac tatgactgtt actggtgata ctttggctga 1800 aagagctaaa aaagctccat ctttgccaga aggtcaagaa atcattaagc cattgtctca 1860 tccaatcaag gctaatggtc acttgcaaat cttgtatggt tctttggctc caggtggtgc 1920 tgttggtaaa attactggta aagaaggtac ttacttcaag ggtagagcta gagtctttga 1980 agaagaaggt gctttcattg aagctttgga aagaggtgaa atcaagaagg gtgaaaagac 2040 cgttgttgtc attagatatg aaggtccaag aggtgctcca ggtatgccag aaatgttgaa 2100 accatcttct gctttgatgg gttacggttt gggtaaagat gttgctttgt taaccgatgg 2160 tagattctct ggtggttctc atggtttctt gattggtcat attgtccctg aagctgcaga 2220 aggtggtcca attggtttgg ttagagatgg tgacgaaatt atcattgatg ccgacaacaa 2280 caagattgat ttgttggtca gtgacaaaga aatggcccaa agaaaacaat cttgggttgc 2340 tccaccacca agatatacaa gaggtacttt gtctaagtac gccaagttgg tttctaatgc 2400 ttctaacggt tgtgttttgg atgcctaaga aataaattga attgaattga aatcgataga 2460 tcaatttttt tcttttctct ttccccatcc tttacgctaa aataatagtt tattttattt 2520 tttgaatatt ttttatttat atacgtatat atagactatt atttatcttt taatgattat 2580 taagattttt attaaaaaaa aattcgctcc tcttttaatg cctttatgca gttttttttt 2640 cccattcgat atttctatgt tcgggttcag cgtattttaa gtttaataac tcgaaaattc 2700 tgcgttcgtt aaagctggcc tttgtggcc 2729 <210> 7 <211> 2514 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 7 ggcctttgtg gccaggattt taatctgttg gagttaaggt gaatacgttt ttccatattg 60 gggtatgcag ctcgaaccta aagtggtatg tacacatccc ctcaagcaca cccattaccc 120 ttataggatt aatgtaagca acagcttaca cggaattgga aatactattc aacgatccat 180 gcatctgcca gattcggaca tgcatattcc ccaattggat atagaaaatt aacgtaaggc 240 agtatctttt cacaatgtac ttgcaacgcg gcgacttaaa gttgaagtac aacctgcagc 300 agcggctttt tgtacggtac gccaaactgt caatggataa tattgcgtag accgaaaaag 360 gtaatcctca acactacccg tggtggatga cctaaagcag taatattggt tggaattatc 420 tcccagacgg caccgtctcc ccgagaaagc ttagccccga ggtctacctt ccatacacca 480 ctgattgctc cacgtcatgc ggccttcttt cgaggacaaa aaggcatata tcgctaaaat 540 tagccatcag aaccgttatt gttattatat tttcattacg aaagaggaga gggcccagcg 600 cgccagagca cacacggtca ttgattactt tatttggcta aagatccatc ccttctcgat 660 gtcatctctt tccattcttg tgtatttttg attgaaaatg attttttgtc cactaatttc 720 taaaaataag acaaaaagcc tttaagcagt ttttcatcca ttttactacg gtaaaatgaa 780 ttagtacggt atggctccca gtcgcattat ttttagattg gccgtagggg ctggggtaga 840 actagagtaa ggaacattgc tctgccctct tttgaactgt catataaata cctgacctat 900 tttattctcc attatcgtat tatctcacct ctctttttct attctcttgt aattattgat 960 ttatagtcgt aactacaaag acaagcaaaa taaaatacgt tcgctctatt aagatgttga 1020 gaactcaagc tgctagattg atctgcaatt ccagagttat tactgccaag agaactttcg 1080 ctttggctac tagagctgct gcttattcta gaccagctgc aagatttgtt aagccaatga 1140 ttactaccag aggtttgaag caaatcaact tcggtggtac tgttgaaacc gtttacgaaa 1200 gagctgattg gcctagagaa aagttgttgg attacttcaa gaacgatacc ttcgccttga 1260 ttggttatgg ttctcaaggt tatggtcaag gtttgaattt gagagacaac ggtttgaacg 1320 ttatcatcgg tgttagaaaa gatggtgctt cttggaaagc tgctattgaa gatggttggg 1380 ttccaggtaa gaatttgttc actgttgaag atgccatcaa gagaggttct tacgttatga 1440 acttgttgtc tgatgctgct caatctgaaa cttggccagc tattaagcca ttattgacta 1500 agggtaagac cttgtacttc tcccatggtt tttcaccagt tttcaaggat ttgacccatg 1560 ttgaaccacc aaaggatttg gatgttattt tggttgctcc aaagggttct ggtagaactg 1620 ttagatcttt gttcaaagaa ggtagaggta tcaactcctc ttacgctgtt tggaatgatg 1680 ttactggtaa agctcacgaa aaagctcaag ctttggctgt tgctattggt tctggttatg 1740 tttaccaaac caccttcgaa agagaagtca attctgactt gtatggtgaa agaggttgtt 1800 tgatgggtgg tattcatggt atgtttttgg cccaatacga tgtcttgaga gaaaatggtc 1860 attctccatc tgaagctttc aacgaaacag ttgaagaagc cacccaatca ttatacccat 1920 tgattggtaa atacggtatg gactacatgt acgatgcttg ttctactact gctagaagag 1980 gtgctttgga ttggtatcca attttcaaga atgccttgaa gccagttttc caagacttgt 2040 acgaatctac taagaacggt actgaaacta agagatcctt ggaattcaac tcccaaccag 2100 attacagaga aaaattggaa aaagaattgg acaccatcag aaacatggaa atctggaagg 2160 ttggtaaaga agtcagaaag ttaagaccag aaaatcaata aacggtggtg tttgacacat 2220 ccgccttctt aatgctttct ttcagtatta tgttattttt ttgttattcg tttttcactt 2280 ctaggctttt tgacagacta gccccgttat accaccatct ttgtgggaaa gcccctaaat 2340 tgccctgagc agtatcgttt catgtctagt ctctttaaag atgtttctta cgcgttgcgt 2400 gtaaaacatc ctctcattca agacagggtt ttctaaaagc aataggggta gtttaataat 2460 tcttatataa tcatcatata cactattttt agttcttaat tggcctgtct ggcc 2514 <210> 8 <211> 2409 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 8 ggcctgtctg gcccttccct tttacagtgc ttcggaaaag cacagcgttg tccaagggaa 60 caatttttct tcaagttaat gcataagaaa tatctttttt tatgtttagc taagtaaaag 120 cagcttggag taaaaaaaaa aatgagtaaa tttctcgatg gattagtttc tcacaggtaa 180 cataacaaaa accaagaaaa gcccgcttct gaaaactaca gttgacttgt atgctaaagg 240 gccagactaa tgggaggaga aaaagaaacg aatgtatatg ctcatttaca ctctatatca 300 ccatatggag gataagttgg gctgagcttc tgatccaatt tattctatcc attagttgct 360 gatatgtccc accagccaac acttgatagt atctactcgc cattcacttc cagcagcgcc 420 agtagggttg ttgagcttag taaaaatgtg cgcaccacaa gcctacatga ctccacgtca 480 catgaaacca caccgtgggg ccttgttgcg ctaggaatag gatatgcgac gaagacgctt 540 ctgcttagta accacaccac attttcaggg ggtcgatctg cttgcttcct ttactgtcac 600 gagcggccca taatcgcgct ttttttttaa aaggcgcgag acagcaaaca ggaagctcgg 660 gtttcaacct tcggagtggt cgcagatctg gagactggat ctttacaata cagtaaggca 720 agccaccatc tgcttcttag gtgcatgcga cggtatccac gtgcagaaca acatagtctg 780 aagaaggggg ggaggagcat gttcattctc tgtagcagta agagcttggt gataatgacc 840 aaaactggag tctcgaaatc atataaatag acaatatatt ttcacacaat gagatttgta 900 gtacagttct attctctctc ttgcataaat aagaaattca tcaagaactt ggtttgatat 960 ttcaccaaca cacacaaaaa acagtacttc actaaattta cacacaaaac aaaatgtcct 1020 acccagaaaa gttcgaaggt attgccattc aatcacacga agattggaag aacccaaaaa 1080 agactaagta cgatccaaag ccattctacg atcatgatat cgacattaag attgaagctt 1140 gtggtgtttg cggttccgat attcattgtg ctgctggtca ttggggtaat atgaagatgc 1200 cattggttgt tggtcacgaa atcgttggta aagttgttaa gttgggtcca aagtctaact 1260 ccggtttgaa agttggtcaa agagttggtg ttggtgctca agttttttct tgtttggaat 1320 gcgatagatg caagaacgat aacgaaccat actgtactaa gttcgttacc acttactctc 1380 aaccatacga agatggttat gtttctcaag gtggttacgc taactacgtt agagttcacg 1440 aacatttcgt tgttccaatc ccagaaaaca tcccatctca tttggctgct ccattattgt 1500 gtggtggttt gactgtttat tccccattgg ttagaaatgg ttgtggtcca ggtaaaaagg 1560 ttggtatagt tggtttgggt ggtattggtt ctatgggtac tttgatttct aaagctatgg 1620 gtgctgaaac ctacgtcatt tctagatcct ctagaaaaag agaagatgca atgaagatgg 1680 gtgccgatca ttatattgct actttggaag aaggtgactg gggtgaaaag tacttcgata 1740 cttttgattt gatcgttgtc tgcgcttctt ccttgactga tattgatttc aacattatgc 1800 caaaggccat gaaggttggt ggtagaatag tttccatttc cattccagaa caacacgaaa 1860 tgttgtcctt gaaaccatac ggtttgaagg ccgtttctat ttcttattct gctttgggtt 1920 ccatcaaaga attgaatcaa ttattgaagt tggtttccga aaaggacatc aagatttggg 1980 ttgaaacttt gccagttggt gaagctggtg ttcatgaagc ttttgaaaga atggaaaagg 2040 gtgacgtcag atacagattc actttggttg gttacgacaa agaattctcc gactaaataa 2100 agcaatcttg atgaggataa tgattttttt ttgaatatac ataaatacta ccgtttttct 2160 gctagatttt gtgaagacgt aaataagtac atattacttt ttaagccaag acaagattaa 2220 gcattaactt tacccttttc tcttctaagt ttcaatacta gttatcactg tttaaaagtt 2280 atggcgagaa cgtcggcggt taaaatatat taccctgaac gtggtgaatt gaagttctag 2340 gatggtttaa agatttttcc tttttgggaa ataagtaaac aatatattgc tgccttggcc 2400 tatgtggcc 2409 <210> 9 <211> 4469 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 9 ggcctatgtg gcctccctgc gcggctaaag ttaaggatgc aaaaaacata agacaactga 60 agttaattta cgtcaattaa gttttccagg gtaatgatgt tttgggcttc cactaattca 120 ataagtatgt catgaaatac gttgtgaaga ggatccagaa ataatgaaaa gaaacaacga 180 aactgggtcg gcctgttgtt tcttttcttt accacgtgat ctgcggcatt tacaggaagt 240 cgcgcgtttt gcgcagttgt tgcaacgcag ctacggctaa caaagcctag tggaactcga 300 ctgatgtgtt agggcctaaa actggtggtg acagctgaag tgaactattc aatccaatca 360 tgtcatggct gtcacaaaga ccttgcggac cgcacgtacg aacacatacg tatgctaata 420 tgtgttttga tagtacccag tgatcgcaga cctgcaattt ttttgtaggt ttggaagaat 480 atataaaggt tgcactcatt caagatagtt tttttcttgt gtgtctattc attttattat 540 tgtttgttta aatgttaaaa aaaccaagaa cttagtttca aattaaattc atcacacaaa 600 caaacaaaac aaaatgtcct cctccaaaaa attggctggt ttgagagata acttctcctt 660 gttgggtgaa aagaacaaga ttttggttgc caacagaggt gaaatcccaa tcagaatttt 720 tagatccgcc cacgaattgt ccatgagaac tattgctatc tactcccacg aagatagatt 780 gtctatgcac agattgaaag ctgatgaagc ctacgttatt ggtgaagaag gtcaatatac 840 tccagttggt gcttatttgg ctatggacga aattattgaa atcgccaaga agcacaaggt 900 tgatttcatt catccaggtt acggtttctt gtccgaaaac tctgaatttg ctgataaggt 960 tgttaaggct ggtattactt ggattggtcc accagctgaa gttattgatt ctgttggtga 1020 caaagtttcc gctagacatt tggctgctag agctaatgtt ccaactgttc caggtactcc 1080 aggtccaatt gaaactgttc aagaagcttt ggatttcgtc aacgaatatg gttacccagt 1140 tattatcaag gctgctttcg gtggtggtgg tagaggtatg agagttgtta gagaaggtga 1200 tgatgttgct gatgcttttc aaagagctac ttctgaagct agaactgctt ttggtaatgg 1260 tacttgcttc gtcgaaagat tcttggataa gccaaagcac atcgaagttc aattattggc 1320 tgataaccac ggtaacgttg ttcacttgtt tgaaagagat tgctccgttc aaagaagaca 1380 ccaaaaggtt gttgaagttg ctccagctaa aactttgcca agagaagtta gagatgccat 1440 tttgactgat gctgttaagt tggctaaagt ctgtggttat agaaatgctg gtactgccga 1500 attcttggtc gataatcaaa acagacacta cttcatcgaa atcaatccta gaatccaagt 1560 cgaacatacc atcaccgaag aaattaccgg tatcgatata gtttccgccc aaattcaaat 1620 tgctgctggt gctactttga ctcaattggg tttgttgcaa gataagatta ccaccagagg 1680 tttctccatt caatgtagaa ttactaccga agatccatcc aagaacttcc aaccagatac 1740 tggtagattg gaagtttaca gatctgccgg tggtaacggt gttagattgg acggtggtaa 1800 tgcatatgct ggtgcaacta tttctccaca ctatgattct atgttggtca agtgttcttg 1860 ttccggttct acttacgaaa tcgttagaag aaagatgatc agagccttga tcgaattcag 1920 aatcagaggt gttaagacca acatcccatt tttgttgacc ttgttgacta acccagtttt 1980 catcgaaggt acttactgga ctaccttcat tgatgatacc ccacaattat tccaaatggt 2040 ttcctcacaa aacagagcac aaaagttgtt gcattacttg gcagatttgg ctgttaacgg 2100 ttcttctatt aagggtcaaa ttggtttgcc aaagttgaag tctaatccat ctgttccaca 2160 cttgcatgat gctcaaggta atgttattaa cgttaccaaa tcagctccac catcaggttg 2220 gagacaagtt ttgttggaaa aaggtccttc cgaattcgct aagcaagtta gacaattcaa 2280 cggtactttg ttgatggata ccacttggag agatgctcat caatctttgt tggctactag 2340 agttagaacc catgatttgg ctacaattgc tccaactact gctcatgctt tagctggtgc 2400 ttttgctttg gaatgttggg gtggtgctac attcgatgtt gctatgagat tcttgcatga 2460 agatccttgg gaaagattga gaaagttgag atctttggtt ccaaacatcc ctttccaaat 2520 gttgttgaga ggtgctaatg gtgttgctta ttcttcattg ccagataacg ccattgatca 2580 ctttgttaag caagctaagg ataacggtgt cgatatcttc agagtattcg atgctttgaa 2640 cgacttggaa caattgaagg ttggtgttaa cgctgttaag aaagctggtg gtgttgtaga 2700 agctactgtt tgttattctg gtgacatgtt gcaaccaggt aagaagtaca atttggacta 2760 ctacttggaa gtcgtcgaaa agatagttca aatgggtact catatcttgg gtatcaaaga 2820 tatggctggt actatgaagc cagctgctgc taagttgttg attggttctt tgagaactag 2880 atacccagat ttgccaatcc atgttcattc tcatgattct gctggtacag ctgttgcttc 2940 tatgactgct tgtgccttgg ctggtgctga tgttgtagat gttgcaatca attctatgtc 3000 cggtttgact tctcaaccat ccattaacgc tttgttagct tctttggaag gtaacattga 3060 caccggtatt aacgtcgaac acgttagaga attggatgct tactgggctg aaatgagatt 3120 gttgtactct tgttttgaag ccgatttgaa aggtccagat cctgaagttt atcaacacga 3180 aattccaggt ggtcaattga ctaacttgtt gttccaagct caacaattag gtttgggtga 3240 acaatgggca gaaactaaga gagcttatag agaagccaac tacttgttag gtgatatcgt 3300 taaggttacc ccaacttcta aagttgtagg tgatttggcc caattcatgg tcagtaacaa 3360 attgacctcc gatgacatta gaagattggc taattccttg gatttcccag attccgttat 3420 ggattttttc gaaggtttga tcggtcaacc atacggtggt tttccagaac cattgagatc 3480 tgatgttttg agaaacaaga gaagaaaatt gacttgcaga ccaggtttgg aattggaacc 3540 atttgatttg gaaaagatca gagaagactt gcaaaacaga ttcggtgaca tcgatgaatg 3600 tgatgttgcc tcttacaata tgtacccaag agtctacgaa gatttccaaa agattagaga 3660 aacctacggt gacttgtcag ttttgccaac taagaatttc ttggctccag ctgaaccaga 3720 tgaagaaatt gaagttacca tcgaacaagg taagaccttg atcattaagt tgcaagcagt 3780 tggtgacttg aacaaaaaga ctggtcaaag agaagtctac ttcgaattga acggtgaatt 3840 gagaaaaatc agagttgccg acaagtccca aaacattcaa tcagttgcta agccaaaagc 3900 cgatgttcat gatactcatc aaataggtgc tccaatggcc ggtgttatta tagaagttaa 3960 ggttcacaaa ggttccttgg tcaaaaaggg tgaatctatt gctgttttgt ccgccatgaa 4020 gatggaaatg gttgtttctt ctcctgctga tggtcaagtt aaggatgttt tcattaagga 4080 cggtgaatcc gttgatgctt ctgatttgtt ggttgtcttg gaagaagaaa ccttgccacc 4140 atctcaaaag aagtaaattt aactccttaa gttactttaa tgatttagtt tttattatta 4200 ataattcatg ctcatgacat ctcatataca cgtttataaa acttaaatag attgaaaatg 4260 tattaaagat tcctcaggga ttcgattttt ttggaagttt ttgttttttt ttccttgaga 4320 tgctgtagta tttgggaaca attatacaat cgaaagatat atgcttacat tcgaccgttt 4380 tagccgtgat cattatccta tagtaacata acctgaagca taactgacac tactatcatc 4440 aatacttgtc acatgaggcc ttggtggcc 4469 <210> 10 <211> 3090 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 10 ggccttggtg gccgaataaa aaacacgctt tttcagttcg agtttatcat tatcaatact 60 gccatttcaa agaatacgta aataattaat agtagtgatt ttcctaactt tatttagtca 120 aaaaattagc cttttaattc tgctgtaacc cgtacatgcc caaaataggg ggcgggttac 180 acagaatata taacatcgta ggtgtctggg tgaacagttt attcctggca tccactaaat 240 ataatggagc ccgcttttta agctggcatc cagaaaaaaa aagaatccca gcaccaaaat 300 attgttttct tcaccaacca tcagttcata ggtccattct cttagcgcaa ctacagagaa 360 caggggcaca aacaggcaaa aaacgggcac aacctcaatg gagtgatgca acctgcctgg 420 agtaaatgat gacacaaggc aattgaccca cgcatgtatc tatctcattt tcttacacct 480 tctattacct tctgctctct ctgatttgga aaaagctgaa aaaaaaggtt gaaaccagtt 540 ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 600 attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 660 agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaaatgatca 720 gacaatccac cttgaagaac ttcgctatta agagatgctt ccaacatatc gcttacagaa 780 atactccagc catgagatct gttgctttgg ctcaaagatt ttactcctca tcctccagat 840 attactctgc ttctccattg ccagcttcta aaagaccaga accagctcca tcttttaacg 900 ttgatccatt ggaacaacca gctgaaccat ctaaattggc taaaaagttg agagccgaac 960 cagatatgga tacttctttt gttggtttga ctggtggtca aatcttcaac gaaatgatgt 1020 ccagacaaaa cgttgatacc gtttttggtt atccaggtgg tgctattttg ccagtttatg 1080 atgctattca caactccgac aagttcaact tcgttttgcc aaaacatgaa caaggtgctg 1140 gtcatatggc tgaaggttat gctagagctt ctggtaaacc aggtgttgtt ttggttactt 1200 ctggtccagg tgctactaat gttgttactc caatggctga tgctttcgct gatggtattc 1260 caatggttgt ttttactggt caagttccaa catccgctat tggtacagat gcttttcaag 1320 aagctgacgt tgttggtatt tctagatctt gtactaagtg gaacgtcatg gttaagtccg 1380 ttgaagaatt gccattgaga atcaacgaag ctttcgaaat tgctacatca ggtagaccag 1440 gtccagtttt ggttgatttg cctaaagatg ttactgccgc cattttgaga aatccaattc 1500 caactaagac taccttgcca tccaatgcct tgaatcaatt gacttctaga gcccaagatg 1560 aattcgtcat gcaatctatt aacaaggctg ccgatttgat caacttggca aaaaaaccag 1620 tcttgtatgt tggtgccggt attttgaatc atgctgatgg tccaagatta ttgaaagaat 1680 tgtccgacag agcccaaatt ccagttacta ctactttaca aggtttgggt tccttcgatc 1740 aagaagatcc aaaatccttg gacatgttgg gtatgcatgg ttgtgctact gctaatttgg 1800 ctgttcaaaa cgccgacttg attattgctg ttggtgctag atttgatgat agagtcactg 1860 gtaacatttc caagtttgct ccagaagcta ggagagctgc tgctgaaggt agaggtggta 1920 ttattcattt tgaagtctcc ccaaagaata tcaacaaggt tgttcaaacc caaatcgccg 1980 ttgaaggtga tgcaactact aatttgggta agatgatgtc taagatcttc ccagtcaaag 2040 aaagatctga atggttcgct caaatcaaca agtggaagaa agaataccca tacgcctaca 2100 tggaagaaac tccaggttct aaaatcaagc cacaaaccgt tatcaagaag ttgtctaagg 2160 ttgctaacga taccggtaga catgttatcg ttactactgg tgttggtcaa catcaaatgt 2220 gggctgctca acattggact tggagaaatc ctcatacttt cattacatct ggtggtttgg 2280 gtactatggg ttatggtttg ccagctgcta ttggtgctca agttgctaaa ccagaatcct 2340 tggttattga tattgatggt gatgcctctt tcaacatgac cttgactgaa ttatcttccg 2400 ctgttcaagc tggtactcca gttaagattt tgatcttgaa caacgaagaa caaggtatgg 2460 tcacacaatg gcaaagtttg ttctacgaac atagatactc ccatacccat caattgaacc 2520 cagatttcat taagttggct gaagccatgg gtttaaaagg tttgagagtc aaaaagcaag 2580 aagaattgga cgctaagttg aaagaattcg tttctactaa gggtcctgtc ttgttggaag 2640 ttgaagttga taagaaggtt ccagtcttgc ctatggttgc tggtggttca ggtttggatg 2700 aattcattaa ctttgaccca gaagtcgaaa gacaacaaac tgaattgaga cataagagaa 2760 ctggtggtaa gcactaagtg aatttacttt aaatcttgca tttaaataaa ttttcttttt 2820 atagctttat gacttagttt caatttatat actattttaa tgacattttc gattcattga 2880 ttgaaagctt tgtgtttttt cttgatgcgc tattgcattg ttcttgtctt tttcgccaca 2940 tgtaatatct gtagtagata cctgatacat tgtggatgct gagtgaaatt ttagttaata 3000 atggaggcgc tcttaataat tttggggata ttggcttttt tttttaaagt ttacaaatga 3060 attttttccg ccaggatggc cttagtggcc 3090 <210> 11 <211> 1810 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 11 ggccttagtg gccgccgtac cacttcaaaa cacccaagca cagcatacta aatttcccct 60 ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag 120 accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt 180 ttcttgaaaa tttttttttt tgattttttt ctctttcgat gacctcccat tgatatttaa 240 gttaataaac ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac 300 tttttttact tcttgctcat tagaaagaaa gcatagcaat ctaatctaag ttttaattac 360 aaaatgccac attctgttac cccatccatt gaacaagatt ccttgaagat tgctattttg 420 ggtgctgctg gtggtattgg tcaatctttg tctttgttgt tgaaggccca attgcaatac 480 caattgaaag aatccaatag atccgtcacc catattcatt tggccttgta cgatgttaat 540 caagaagcca ttaacggtgt taccgctgat ttgtctcata ttgatacccc aatctccgtt 600 tcttcacatt ctccagccgg tggtatagaa aattgcttgc ataatgcttc catcgttgtt 660 attccagctg gtgttccaag aaaaccaggt atgactagag atgatttgtt caacgttaac 720 gccggtatca tttctcaatt gggtgattct attgctgaat gctgcgattt gtctaaggtt 780 ttcgttttgg ttatctccaa cccagttaac tctttggttc cagttatggt cagtaacatc 840 ttgaagaacc atccacaatc tagaaactcc ggtatcgaaa gaagaattat gggtgttacc 900 aagttggata tcgttagagc ttctaccttc ttgagagaaa tcaacatcga atctggtttg 960 actccaagag tcaattctat gccagatgtt cctgttattg gtggtcattc tggtgaaacc 1020 attatccctt tgttctccca atctaacttc ttgtccagat tgaacgaaga tcaattgaag 1080 tacttgatcc acagagttca atacggtggt gatgaagttg ttaaggctaa aaatggtaag 1140 ggttctgcta ctttgtctat ggctcatgct ggttacaaat gcgttgttca attcgtttcc 1200 ttgttgttgg gtaacatcga acaaatccat ggtacttact acgttccatt gaaggatgct 1260 aacaatttcc caattgctcc aggtgctgat caattattgc cattggttga tggtgctgat 1320 tacttcgcta ttccattgac tattactacc aagggtgttt cctacgttga ttacgatatt 1380 gtcaacagaa tgaacgatat ggaaagaaat caaatgttgc caatctgtgt ctcccaattg 1440 aagaagaaca ttgacaaggg tttggaattc gttgcttcta gatctgcttc ttcctaagga 1500 gattgataag acttttctag ttgcatatct tttatattta aatcttatct attagttaat 1560 tttttgtaat ttatccttat atatagtctg gttattctaa aatatcattt cagtatctaa 1620 aaattcccct cttttttcag ttatatctta acaggcgaca gtccaaatgt tgatttatcc 1680 cagtccgatt catcagggtt gtgaagcatt ttgtcaatgg tcgaaatcac atcagtaata 1740 gtgcctctta cttgcctcat agaatttctt tctcttaacg tcaccgtttg gtcttttggc 1800 ctacttggcc 1810 <210> 12 <211> 3106 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 12 ggcctacttg gccgggcgcc ataaccaagg tatctataga ccgccaatca gcaaactacc 60 tccgtacatt catgttgcac ccacacattt atacacccag accgcgacaa attacccata 120 aggttgtttg tgacggcgtc gtacaagaga acgtgggaac tttttaggct caccaaaaaa 180 gaaagaaaaa atacgagttg ctgacagaag cctcaagaaa aaaaaaattc ttcttcgact 240 atgctggagg cagagatgat cgagccggta gttaactata tatagctaaa ttggttccat 300 caccttcttt tctggtgtcg ctccttctag tgctatttct ggcttttcct attttttttt 360 ttccattttt ctttctctct ttctaatata taaattctct tgcattttct atttttctct 420 ctatctattc tacttgttta ttcccttcaa ggtttttttt taaggagtac ttgtttttag 480 aatatacggt caacgaacta taattaacta aacatggatg atcaattgaa gcaatctgcc 540 ttggatttcc atgaatttcc agttccaggt aagatccaag tttctccaac aaaaccattg 600 gctacccaaa gagatttggc tttggcttat tctccaggtg ttgctgctcc atgtttggaa 660 attgaaaaag atccattgaa ggcttacaag tacactgcta gaggtaattt ggttgccgtt 720 atttctaatg gtactgccgt tttgggtttg ggtaatattg gtgctttggc tggtaaacca 780 gttatggaag gtaaaggtgt tttgttcaaa aagttcgccg gtatcgatgt tttcgacatc 840 gaagttgatg aattggatcc agacaagttc attgaagttg ttgctgcttt ggaacctact 900 ttcggtggta ttaacttgga agatattaag gctccagaat gcttctacat cgaacaaaag 960 ttgagagaaa gaatgaacat cccagttttc cacgatgatc aacatggtac tgctattatt 1020 tctaccgctg ctattttgaa cggtttgaga gttgttgaaa agaacatctc cgatgtcaga 1080 atggttgttt ctggtgctgg tgctgctgct attgcttgta tgaatttgtt ggttgccttg 1140 ggtttacaaa agcacaacat cgttgtttgc gattccaaag gtgttatcta ccaaggtaga 1200 gaacctaaca tggctgaaac aaaagctgct tatgctgttg ttgatgatgg taagagaacc 1260 ttggatgatg ttattgaagg tgccgatatt ttcttgggtt gttctggtcc aaaagtcttg 1320 actcaagaaa tggttaagaa aatggctaga gccccaatga ttttggcttt agctaatcca 1380 gaaccagaaa tcttgccacc attggctaaa gaagttagac cagacgctat tatctgtacc 1440 ggtagatctg attacccaaa tcaagttaac aacgtcttgt gcttcccatt catttttaga 1500 ggtgctttgg atgttggtgc taccgctatt aacgaagaaa tgaagttggc tgctgttaga 1560 gctattgctg aattggctca tgctgaacaa tcagaagttg ttgcatctgc ttatggtgat 1620 caagatttgt cttttggtcc agaatatatc atcccaaagc cattcgatcc aagattgatc 1680 gttaagattg ctccagctgt tgctaaagct gctatggaat ctggtgttgc tactagacca 1740 attgctgatt tcgatgttta catcgacaag ttgaccgaat tcgtttacaa gaccaacttg 1800 ttcatgaagc caattttctc acaagctaga aaggctccaa agagagttgt tttgccagaa 1860 ggtgaagaag ctagagtttt acacgctact caagaattag ttaccttggg tttggctaag 1920 ccaattttga ttggtagacc aaacgtcatc gaaatgagaa tccaaaagtt aggtttacaa 1980 atcaaggccg gtgttgactt cgaaatcgtt aacaatgaat ctgacccaag attcaaagaa 2040 tactggaccg aatacttcca aatcatgaag agaagaggtg tcactcaaga acaagctcaa 2100 agagctttga tttctaaccc aactgttatt ggtgccatca tggttcaaag aggtgaagct 2160 gacgctatga tttgtggtac tgttggtgat taccatgaac acttctctgt tgtcaagaac 2220 gttttcggtt atagagatgg tgttcatact gctggtgcta tgaatgcttt gttgttgcca 2280 tctggtaaca ccttcattgc tgatacttac gttaacgatg aaccagatgc tgaagaattg 2340 gctgaaatta ctttgatggc tgctgaaacc gttagaagat ttggtattga acctagagtt 2400 gccttgttgt cccattctaa ttttggttct tcagactgcc catcctcttc aaaaatgaga 2460 caagctttgg aattggtcag agaaagagca ccagaattga tgattgatgg tgaaatgcat 2520 ggtgatgctg ctttggttga agctattaga aatgatagaa tgccagactc ctcattgaaa 2580 ggttctgcta acattttggt catgccaaat atggaagctg ccagaatttc ttacaacttg 2640 ttgagagtct cttccagtga aggtgtaact gttggtccag ttttgatggg tgttgctaaa 2700 ccagttcatg ttttgactcc aattgcctcc gttagaagaa tcgttaatat ggttgctttg 2760 gccgttgttg aagctcaaac tcaaccattg taagagtaat aattattgct tccatataat 2820 atttttatat acctcttatt tttatgtatt agttaattaa gtatttttat ctatctgctt 2880 atcattttct tttcatatag ggggggttgg tgttttcttg cccatcagat tgatgtcctc 2940 caactcggca ctattttaca aagggttttt ttgtaagaga aggagaagac agatactaaa 3000 ccatacgtta ctcgaaacaa aaaaaaaaaa aatggaaaaa gctgctatca acaaaagacg 3060 gcctcatcaa acctaaagaa accatgtcag cgtggcctgt atggcc 3106 <210> 13 <211> 2699 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 13 ggcctgtatg gccctactta ttcccttcga gattatatct aggaacccat caggttggtg 60 gaagattacc cgttctaaga cttttcagct tcctctattg atgttacacc tggacacccc 120 ttttctggca tccagttttt aatcttcagt ggcatgtgag attctccgaa attaattaaa 180 gcaatcacac aattctctcg gataccacct cggttgaaac tgacaggtgg tttgttacgc 240 atgctaatgc aaaggagcct atataccttt ggctcggctg ctgtaacagg gaatataaag 300 ggcagcataa tttaggagtt tagtgaactt gcaacattta ctattttccc ttcttacgta 360 aatatttttc tttttaattc taaatcaatc tttttcaatt ttttgtttgt attcttttct 420 tgcttaaatc tataactaca aaaaacacat acataaacta aaaatgtggc caatccaaca 480 atccagatta tactcttcta acaccagatc tcataaggct actactacta gagaaaacac 540 cttccaaaag ccatactccg atgaagaagt tactaagact ccagttggtt ctagagccag 600 aaagattttt gaagctccac atccacatgc tactagattg actgttgaag gtgctattga 660 atgcccattg gaatccttcc aattattgaa ctcacctttg ttcaacaagg gttctgcttt 720 cactcaagaa gaaagagaag ctttcaactt ggaagctttg ttgccaccac aagttaacac 780 tttggatgaa caattggaaa gatcctacaa gcaattgtgc tacttgaaaa ctccattggc 840 caagaacgat ttcatgactt ctttgagagt tcaaaacaag gtcttgtact tcgccttgat 900 cagaagacac atcaaagaat tggttccaat catctacact ccaactgaag gtgatgctat 960 tgctgcttat tctcacagat tcagaaaacc agaaggtgtc tttttggata tcaccgaacc 1020 agattccatt gaatgtagat tggctactta tggtggtgat aaggatgttg attacatcgt 1080 tgtttccgac tccgaaggta ttttgggtat tggtgatcaa ggtataggtg gtgtcagaat 1140 tgctatttct aagttggctt tgatgacctt gtgtggtggt attcatccag gtagagtttt 1200 gccagtttgt ttggatgttg gtacaaacaa caaaaagttg gccagagatg aattgtacat 1260 gggtaacaag ttctccagaa tcagaggtaa gcaatacgac gatttcttgg aaaagttcat 1320 caaggccgtt aagaaggttt atccatccgc tgttttacac ttcgaagatt tcggtgttaa 1380 gaacgccaga agattattag aaaagtacag atacgaattg ccatccttca acgatgacat 1440 tcaaggtact ggtgctgttg ttatggcttc tttgattgct gcattgaagc acactaacag 1500 agatttgaaa gataccagag tcttgatcta tggtgctggt tctgctggtt taggtattgc 1560 agatcaaatc gttaaccaca tggttactca tggtgtcgac aaagaagaag ccagaaaaaa 1620 gatcttcttg atggacagaa gaggtttgat attgcaatcc tacgaagcta attctacccc 1680 agctcaacat gtttacgcta aatctgatgc tgaatgggct ggtattaaca ctagatcatt 1740 gcacgatgtt gtcgaaaacg ttaagcctac ttgtttggtt ggttgttcta ctcaagctgg 1800 tgcttttaca caagatgtcg ttgaagaaat gcataagcac aatccaagac ctatcatctt 1860 cccattgtct aacccaacta gattgcatga agctgttcca gctgatttga tgaagtggac 1920 taacaacaat gctttggttg ctactggttc tccatttcca ccagttgatg gttacagaat 1980 ctctgaaaac aacaactgct actcctttcc aggtattggt ttgggtgctg ttttgtctag 2040 agctactaca attaccgaca agatgatttc tgctgccgtt gatcaattgg ctgaattgtc 2100 tccattgaga gaaggtgatt ctagaccagg tttattgcca ggtttggata ccattactaa 2160 tacctctgct agattggcaa ctgccgttat tttacaagct ttggaagaag gtactgccag 2220 aatcgaacaa gaacaagttc caggtggtgc tccaggtgaa actgttaagg ttccaagaga 2280 ttttgacgaa tgcttgcaat gggttaaggc tcaaatgtgg gaaccagttt acagaccaat 2340 gattaaggtt caacacgatc catccgttca caccaatcaa ttgtaagatt aatataatta 2400 tataaaaata ttatcttctt ttctttatat ctagtgttat gtaaaataaa ttgatgacta 2460 cggaaagctt ttttatattg tttctttttc attctgagcc acttaaattt cgtgaatgtt 2520 cttgtaaggg acggtagatt tacaagtgat acaacaaaaa gcaaggcgct ttttctaata 2580 aaaagaagaa aagcatttaa caattgaaca cctctatatc aacgaagaat attactttgt 2640 ctctaaatcc ttgtaaaatg tgtacgatct ctatatgggt tactcaggcc tctttggcc 2699 <210> 14 <211> 1475 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 14 ggcctctttg gccagatctg tttagcttgc ctcgtccccg ccgggtcacc cggccagcga 60 catggaggcc cagaataccc tccttgacag tcttgacgtg cgcagctcag gggcatgatg 120 tgactgtcgc ccgtacattt agcccataca tccccatgta taatcatttg catccataca 180 ttttgatggc cgcacggcgc gaagcaaaaa ttacggctcc tcgctgcaga cctgcgagca 240 gggaaacgct cccctcacag acgcgttgaa ttgtccccac gccgcgcccc tgtagagaaa 300 tataaaaggt taggatttgc cactgaggtt cttctttcat atacttcctt ttaaaatctt 360 gctaggatac agttctcaca tcacatccga acataaacaa ccatgggtaa ggaaaagact 420 cacgtttcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 480 gctcgcgata atgtcgggca atcaggtgcg acaatctatc gattgtatgg gaagcccgat 540 gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 600 atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa gcattttatc 660 cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggcaaaac agcattccag 720 gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 780 cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg cgtatttcgt 840 ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 900 gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataagct tttgccattc 960 tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 1020 gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 1080 cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 1140 caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 1200 gagtttttct aatcagtact gacaataaaa agattcttgt tttcaagaac ttgtcatttg 1260 tatagttttt ttatattgta gttgttctat tttaatcaaa tgttagcgtg atttatattt 1320 tttttcgcct cgacatcatc tgcccagatg cgaagttaag tgcgcagaaa gtaatatcat 1380 gcgtcaatcg tatgtgaatg ctggtcgcta tactgctgtc gattcgatac taacgccgcc 1440 atccagtgtc gaaaacgagc tcggccttct tggcc 1475 <210> 15 <211> 2508 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 15 ggcctgtttg gccgggtgta caatatggac ttcctctttt ctggcaacca aacccataca 60 tcgggattcc tataatacct tcgttggtct ccctaacatg taggtggcgg aggggagata 120 tacaatagaa cagataccag acaagacata atgggctaaa caagactaca ccaattacac 180 tgcctcattg atggtggtac ataacgaact aatactgtag ccctagactt gatagccatc 240 atcatatcga agtttcacta ccctttttcc atttgccatc tattgaagta ataataggcg 300 catgcaactt cttttctttt tttttctttt ctctctcccc cgttgttgtc tcaccatatc 360 cgcaatgaca aaaaaatgat ggaagacact aaaggaaaaa attaacgaca aagacagcac 420 caacagatgt cgttgttcca gagctgatga ggggtatctc gaagcacacg aaactttttc 480 cttccttcat tcacgcacac tactctctaa tgagcaacgg tatacggcct tccttccagt 540 tacttgaatt tgaaataaaa aaaagtttgc tgtcttgcta tcaagtataa atagacctgc 600 aattattaat cttttgtttc ctcgtcattg ttctcgttcc ctttcttcct tgtttctttt 660 tctgcacaat atttcaagct ataccaagca tacaatcaac tatctcatat acaatgttaa 720 ccagcaacag ctattctctt catgtcggtc atgtaacctc tcaatttctt accaacttgt 780 tcaatggcat gggatctaat ggcttcgtta acatctctca attgaccatt atcaacagca 840 ccttcaggaa tagctttacc caaatcacct ggttgcaatt cagccataaa aggtttcaac 900 aaaggaacgc aagcgtaaga gaacaagtaa ttaccgtatt cagcagtatc ggagataacg 960 acgttcattt cgtataatct ttttctggcg atagtgttag caatcaatgg caattcgtgc 1020 aaggattcgt agtaagcaga ttcttcaatg ataccggagt caaccatagt ttcaaatgcc 1080 aattcaacac cagccttaac catagcgatc atcaaaacac ccttatcgaa gtattcttgt 1140 tcaccaatct taccttcgta ttgtggagca gtttcaaaag cagtcttacc agtttcttct 1200 ctccaagtca acaacttctt atcatcatta gcccaatcag ccatcatacc agaagagaat 1260 tcaccggaga taatatcatc catgtgcttt tggaacaaag gggccataat ttctttcaat 1320 tgttcggaca atgcgtaagc tctcaactta gctggattag acaatctgtc catcatcaag 1380 gtaataccac cttgtttcaa agcttcggta atggtttccc aaccaaattg aatcaacttt 1440 tcagcgtaag ctggatcagt accttcttca accaacttat cgaaacacaa caaagaacca 1500 gcttgcaaca taccacacaa aatggtttgt tcacccatca aatcggactt aacttcggca 1560 acaaatgaag attccaaaac accagctcta tgaccaccag tagcagcagc ccaagcttta 1620 gcaatagcca taccttcacc ctttggatca ttttctggat gaacagcaat caaagttgga 1680 acaccgaaac ctctcttgta ttcttctcta acttcagtac ctggacattt tggagcaacc 1740 ataacaacgg tgatatcctt tctgatttgt tcaccgactt caacgatgtt aaaaccatga 1800 gaataaccca aagcagcacc atccttcatc aatggttgga cagttctaac aacatcagag 1860 tgttgcttat ctggggtcaa gttaatgacc aaatcagctt gtggaatcaa ttcttcgtaa 1920 gtaccgacct taaaaccgtt ttcagtagct tttctccaag aggctctttt ttcagcaatg 1980 gcttcttttc tcaaggcgta agaaatatcc aaaccggagt ctctcatgtt caaaccttga 2040 tttaaacctt gggcaccaca accaacgata acaacctttt taccttgcaa gtaagaagca 2100 ccatcagcaa attcatctct acccatgaat ctgcatttac ccaattgagc caattgttgt 2160 ctcaaattca aggtgttgaa gtagttagcc attaagcgaa tttcttatga tttatgattt 2220 ttattattaa ataagttata aaaaaaataa gtgtatacaa attttaaagt gactcttagg 2280 ttttaaaacg aaaattctta ttcttgagta actctttcct gtaggtcagg ttgctttctc 2340 aggtatagca tgaggtcgct cttattgacc acacctctac cggcatgccg agcaaatgcc 2400 tgcaaatcgc tccccatttc acccaattgt agatatgcta actccagcaa tgagttgatg 2460 aatctcggtg tgtattttat gtcctcagag gacaaggcct tgatggcc 2508 <210> 16 <211> 3045 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 16 ggccttgatg gccactggta gagagcgact ttgtatgccc caattgcgaa acccgcgata 60 tccttctcga ttctttagta cccgaccagg acaaggaaaa ggaggtcgaa acgtttttga 120 agaaacaaga ggaactacac ggaagctcta aagatggcaa ccagccagaa actaagaaaa 180 tgaagttgat ggatccaact ggcaccgctg gcttgaacaa caataccagc cttccaactt 240 ctgtaaataa cggcggtacg ccagtgccac cagtaccgtt acctttcggt atacctcctt 300 tccccatgtt tccaatgccc ttcatgcctc caacggctac tatcacaaat cctcatcaag 360 ctgacgcaag ccctaagaaa tgaataacaa tactgacagt actaaataat tgcctacttg 420 gcttcacata cgttgcatac gtcgatatag ataataatga taatgacagc aggattatcg 480 taatacgtaa tagttgaaaa tctcaaaaat gtgtgggtca ttacgtaaat aatgatagga 540 atgggattct tctatttttc ctttttccat tctagcagcc gtcgggaaaa cgtggcatcc 600 tctctttcgg gctcaattgg agtcacgctg ccgtgagcat cctctctttc catatctaac 660 aactgagcac gtaaccaatg gaaaagcatg agcttagcgt tgctccaaaa aagtattgga 720 tggttaatac catttgtctg ttctcttctg actttgactc ctcaaaaaaa aaaaatctac 780 aatcaacaga tcgcttcaat tacgccctca caaaaacttt tttccttctt cttcgcccac 840 gttaaatttt atccctcatg ttgtctaacg gatttctgca cttgatttat tataaaaaga 900 caaagacata atacttctct atcaatttca gttattgttc ttccttgcgt tattcttctg 960 ttcttctttt tcttttgtca tatataacca taaccaagta atacatattc aaaatgttac 1020 aaatcagtaa cacaaccttc agaagctggt ctagtcaatt tagcaaactt agccaaaaca 1080 cctcttgtag cttttggagt aggtttttgg tagttggctc tcctcttagc aatttcttca 1140 tctgaaacct tcaaggagat ggagttgtta acggcatcaa tttcgatgat gtcgtcatct 1200 tcaaccaaac ctattaaacc accttcaaca gcttcaggga caatatgacc aacaacaaaa 1260 ccatgagtac caccagagaa tctaccatca gtaatcaagg cacaagattt acccaaacca 1320 gcaccaatca aagcagaagt aggtttcaac atttctggca tacctggacc accaactgga 1380 ccaatgtttc taataacagc aacatcacca gcatgcaatc taccagattc gataccgtcg 1440 atgaaatgtt gttcaccatc aaaaactcta gcagtaccct tgaagaattc accttcttta 1500 ccagagattt tagcaacgga accaccttga gccaaattac catacaagat ttgcaagtga 1560 ccagtagcct tgattggatt cttcaatggt ctcataatat cttgggagtc gaaatccaaa 1620 tccaaagcag tttcaacgtt ttcggccaat gttttacctg taacagtcaa gcaatcaccg 1680 tgcaatttac cttctttcaa caagtatttc aaaacagctg gcaaaccacc aatcttatgc 1740 aagtcttcca tcatgtactt accggatggt ttaaaatcac ccaagactgg agtaatatcg 1800 gagattcttt ggaagtcatc ttgagtaatt tcaacaccga tagcgttagc cattgcaata 1860 atatgcaaga cggcatttgt agaaccaccc aaaaccataa cgatggtgat ggcgttttca 1920 aaagcttctt tggtcatgat gtcggatggc ttgatatcct tttccaacaa gttcttaatg 1980 gccaaaccaa tttcgtcgca ttcttcttgc ttttcttgag aaacggctgg attagatgaa 2040 gagtatggca aagacatacc caaggtttca atagcagcag ccaaagtatt agcagtatac 2100 ataccaccac aagcaccttg acctggaatg gcattgcata taacaccatg gtaatcttca 2160 tcggagatgt taccagtaat cttttgaccc aaagattcaa aggcggaaac gatgttcaac 2220 ttttcacctt tgtattcacc gtgttcaata gtaccaccgt aaaccataat ggatggtcta 2280 ttcaatctgg ccataccaat aatggaacct ggcatattct tatcgcaacc tggaatagca 2340 actatagcat cgtaatattc ggcaccagca ttagtttcaa tggaatcggc aataacttct 2400 ctactgacca aggagtatct catacccaat ttaccattag caataccatc agaaacaccg 2460 atggtatgga attgtaaacc gatcaaacca tcagtttgat taacagagga cttgatcttg 2520 gaacccaaag tacccaaatg catattgcat ggattaccat cccaatccat agaaacgata 2580 ccaacttggg ctttcttgaa atcttcgtcc ttgaaaccaa taccgtaata catagcttgt 2640 gtagctggtt gagttggatc ttgagtcaag gtcttagagt acttgttcaa ttcaacggat 2700 tcgaccttac cgttgtactt gaattccatt aagttaattc aaattaattg atatagtttt 2760 ttaatgagta ttgaatctgt ttagaaataa tggaatatta tttttattta tttatttata 2820 ttattggtcg gctcttttct tctgaaggtc aatgacaaaa tgatatgaag gaaataatga 2880 tttctaaaat tttacaacgt aagatatttt tacaaaagcc tagctcatct tttgtcatgc 2940 actattttac tcacgcttga aattaacggc cagtccactg cggagtcatt tcaaagtcat 3000 cctaatcgat ctatcgtttt tgatagctca ttggcctcga tggcc 3045 <210> 17 <211> 2405 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 17 ggcctcgatg gcctcgtagg aacaatttcg ggcccctgcg tgttcttctg aggttcatct 60 tttacatttg cttctgctgg ataattttca gaggcaacaa ggaaaaatta gatggcaaaa 120 agtcgtcttt caaggaaaaa tccccaccat ctttcgagat cccctgtaac ttattggcaa 180 ctgaaagaat gaaaaggagg aaaatacaaa atatactaga actgaaaaaa aaaaagtata 240 aatagagacg atatatgcca atacttcaca atgttcgaat ctattcttca tttgcagcta 300 ttgtaaaata ataaaacatc aagaacaaac aagctcaact tgtcttttct aagaacaaag 360 aataaacaca aaaacaaaaa gtttttttaa ttttaatcaa aaaatgttag tagaattggt 420 ctggcaacat agttttaccc aaagccttgt tgtcagagta atcgattgga atatcaacaa 480 cgactggacc atcagtagca aaagcttgat ccaaaacctt ttccaaatca gcaggttgat 540 taactctcaa acctgtagca ccaaaagatt cggcgtactt aacaaaatca actggaccaa 600 aatgaacagc agcatcttca ccgtacttca tttcttcttg gaacttaacc atatcgtaag 660 taccgtcgtt ccagatcaaa tgaacgatgt tttgtttcaa tctaacggcg gtttccaatt 720 cttgggcaga aaacaaaaaa ccaccatcac cagaaacgga aactatttga gtatctggtc 780 taaccaaagc agctgcaata gcccatggta aagcaacacc caaagtttgc ataccgttag 840 agaacaacaa gtgtctaggt tcataggatc tgaaatgtct agccatccaa atgtaatggg 900 aaccaacatc aacggtaaca gtcatatcat cagaaactct ttgttgcaag gctgcaataa 960 cagacaatgg atggttcaac ttggattgct tatcgatgtt tggaacgaag tctctggttt 1020 gcaatctttc ttgcaattca cccaaataag ctctagcaga atcggaaata tcgtaaccct 1080 tcatgtaagg caacaagaaa tccaaggttt gagcaatatc accgatcaat tcggtttctg 1140 gttgaaaatt atgatcgatt tcggctctca tggcatcaat aacaacgatt ctagatttac 1200 cttcggcgtt ccaatttcta ggttcgtatt caattggatc gtaaccaacg gcaataacca 1260 aatcggactt cttcaataac atgtcacctg gttgatttct gaacaaacca actctaccga 1320 agaagtgatt agcttccaaa tctctggaaa taacaccggc agcttgaaaa gtttcaacaa 1380 caggcaaatt agctgcagca accaaatttc tgatagcctt agtaacttct ggtgaagaag 1440 ctctcatacc aaccaacaaa actggcaact tagcagcctt aatcttttga gctaacaaag 1500 tagcttcaac tggagaagct ggacccaatt ttggagcttg aattggggta ataactggag 1560 ttctaactat agagtcggta acatcttgtg gaacagaaac aaaagaagca ccttgtttag 1620 cagctgtagc ttcttggtaa gcattggcca aaacttcaga gatgttttct ggttcttgaa 1680 cttcagcaga gtacttagtg attggcttga acaaagcagc attgttcata gattgatggg 1740 tcaatctcaa caaatcggct ctttgaactt gaccagaaat agccaaaact ggatcacctt 1800 cagcagtagc agtaaccaaa ccagtagcca aattagatgc acctggacca gaagtagtca 1860 taacaacacc tggtttacca gtaattctac caataccagc agcaataaaa gcagcgtttt 1920 gttcatgtct ggtaacgatc aatcttggag actttggatt aactgggtgt tccaatcttt 1980 cgaaaactct atcgatctta gcacctggaa taccgaaaac gtacttgaca tcatgattaa 2040 ccaaggagtc aacgatagca tcggcaccat aatacttttt gtctggcatt aatttgcgaa 2100 cacttttatt aattcatgat cacgctctaa tttgtgcatt tgaaatgtac tctaattcta 2160 attttatatt tttaatgata tcttgaaaag taaatacgtt tttaatatat acaaaataat 2220 acagtttaat tttcaagttt ttgatcattt gttctcagaa agttgagtgg gacggagaca 2280 aagaaacttt aaagagaaat gcaaagtggg aagaagtcag ttgtttaccg accgcactgt 2340 tattcacaaa tattccaatt ttgcctgcag acccacgtct acaaattttg gtggccttgt 2400 tggcc 2405 <210> 18 <211> 2629 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 18 ggccttgttg gccttgagat aagcacactg cacccatacc ttccttaaaa acgtagcttc 60 cagtttttgg tggttccggc ttccttcccg attccgcccg ctaaacgcat atttttgttg 120 cctggtggca tttgcaaaat gcataaccta tgcatttaaa agattatgta tcctcttctg 180 acttttcgtg tgatgaggct cgtggaaaaa atgaataatt tatgaatttg agaacaattt 240 tgtgttgtta cggtatttta ctatggaata atcaatcaat tgaggatttt atgcaaatat 300 cgtttgaata tttttccgac cctttgagta cttttcttca taattgcata atattgtccg 360 ctgccccttt ttctgttaga cggtgtcttg atctacttgc tatcgttcaa caccacctta 420 ttttctaact attttttttt tagctcattt gaatcagctt atggtgatgg cacatttttg 480 cataaaccta gctgtcctcg ttgaacatag gaaaaaaaaa tatataaaca aggctctttc 540 actctccttg caatcagatt tgggtttgtt ccctttattt tcatatttct tgtcatattc 600 ctttctcaat tattattttc tactcataac ctcacgcaaa ataacacagt caaatcaatc 660 aaaatgttaa gacttgtttt gttctgcgaa caatttaccc atcttcttca aaacctttgg 720 agcaccttct ttagccaaga tcaattcgat ccagtacatt ctatttggat cagcttgagc 780 ttccttcata acggagacaa attcgttttc ggttctaact atcttggaaa caactctatc 840 ttcggtagca ccaaaagatt ctggcaactt agagtagttc cacattggaa tatcgttgta 900 ggattgattt ggaccgtgaa tttctctttc gacagtgtaa ccatcgttgt tgatgatgaa 960 gcagattggg ttaatctttt ctctaatggc caaacccaat tcttgaacgg tcaattgcaa 1020 tgaaccgtca ccaatgaaca acaagtgtct agattctttg tcagcaattt gagaacccaa 1080 agcagctgga aaagtataac caatagaacc ccacaatggt tgaccaatga aatgagactt 1140 ggacttcaag aaaatggaag aggcaccgaa aaaagaagta ccttgttcag caacgatagt 1200 ttcgttagat tgggtcaagt tttcaacagc ttgccacaat ctatcttgag acaacaaggc 1260 attggatgga acgaaatctt cttgcttctt gtcgatgtat ttacccttgt attcaatttc 1320 ggacaagtcc aacaaagagg agatcaaaga ttcgaagtcg aagttttgga ttctttcgtt 1380 gaagatctta ccttcatcga tgttcaagga gatcatcttg ttttcgttca aatgatgagt 1440 gaaagcacca gtagaagaat cggtcaactt aacacccaac atcaagatga aatcggcgga 1500 ttcaacgaat tctttcaagt taggttcgga caaagtacca ttgtagatac ccaagaaaga 1560 tggcaaagct tcatcaacag atgacttacc gaagttcaaa gtggtgattg gcaacttggt 1620 cttagaaatg aattgagtga cggtcttttc caaaccgaaa ctgatgattt cgtgaccagt 1680 aataacgatt ggcttcttag cgttcttcaa ggattcttgg atcttgttca aaatttcttg 1740 gtcggaggtg ttggaagtgg agttttcttt cttcaatggc aaagatggtt tttcagcttt 1800 agcagcagca acatcaacag gcaagttgat gtagactggc tttctttctt tcaacaaagc 1860 ggacaaaact ctatcgattt cgacggtagc attttcagca gtcaacaaag ttctagcagc 1920 agtaactggt tcgtgcatct tcataaagtg cttaaaatca ccatcggcca aagtatgatg 1980 aacgaattta ccttcgtttt gaaccttaga agttggagaa ccaacgattt caacaactgg 2040 caaattttca gcgtaagaac cagccaaacc attaacagca gacaattcac caacaccgaa 2100 agtagtcaaa aaagcagcag ccttttttgt tctagcgtaa ccatcagcca tataagaagc 2160 gttcaattcg ttagcattac caacccactt catatctttg tgggagatga tttggtccaa 2220 gaattgcaag ttgtaatcac ctggaacacc aaagatttct tcgataccca attcatgcaa 2280 tctatccaac aagtaatcac caacggtgta cattaagcga tttaatctct aattattagt 2340 taaagtttta taagcatttt tatgtaacga aaaataaatt ggttcatatt attactgcac 2400 tgtcacttac catggaaaga ccagacaaga agttgccgac agtctgttga attggcctgg 2460 ttaggcttaa gtctgggtcc gcttctttac aaatttggag aatttctctt aaacgatatg 2520 tatattcttt tcgttggaaa agatgtcttc caaaaaaaaa accgatgaat tagtggaacc 2580 aaggaaaaaa aaagaggtat ccttgattaa ggaacaggcc tgattggcc 2629 <210> 19 <211> 2735 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 19 ggcctgattg gccaaagatg ccgatttggg cgcgaatcct ttattttggc ttcaccctca 60 tactattatc agggccagaa aaaggaagtg tttccctcct tcttgaattg atgttaccct 120 cataaagcac gtggcctctt atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa 180 aaagaacaaa actgaaaaaa cccagacacg ctcgacttcc tgtcttccta ttgattgcag 240 cttccaattt cgtcacacaa caaggtccta gcgacggctc acaggttttg taacaagcaa 300 tcgaaggttc tggaatggcg ggaaagggtt tagtaccaca tgctatgatg cccactgtga 360 tctccagagc aaagttcgtt cgatcgtact gttactctct ctctttcaaa cagaattgtc 420 cgaatcgtgt gacaacaaca gcctgttctc acacactctt ttcttctaac caagggggtg 480 gtttagttta gtagaacctc gtgaaactta catttacata tatataaact tgcataaatt 540 ggtcaatgca agaaatacat atttggtctt ttctaattcg tagtttttca agttcttaga 600 tgctttcttt ttctcttttt tacagatcat caaggaagta attatctact ttttacaaca 660 aatataaaac atgttaggca tccaaaacac aaccgttaga agcattagaa accaacttgg 720 cgtacttaga caaagtacct cttgtatatc ttggtggtgg agcaacccaa gattgttttc 780 tttgggccat ttctttgtca ctgaccaaca aatcaatctt gttgttgtcg gcatcaatga 840 taatttcgtc accatctcta accaaaccaa ttggaccacc ttctgcagct tcagggacaa 900 tatgaccaat caagaaacca tgagaaccac cagagaatct accatcggtt aacaaagcaa 960 catctttacc caaaccgtaa cccatcaaag cagaagatgg tttcaacatt tctggcatac 1020 ctggagcacc tcttggacct tcatatctaa tgacaacaac ggtcttttca cccttcttga 1080 tttcacctct ttccaaagct tcaatgaaag caccttcttc ttcaaagact ctagctctac 1140 ccttgaagta agtaccttct ttaccagtaa ttttaccaac agcaccacct ggagccaaag 1200 aaccatacaa gatttgcaag tgaccattag ccttgattgg atgagacaat ggcttaatga 1260 tttcttgacc ttctggcaaa gatggagctt ttttagctct ttcagccaaa gtatcaccag 1320 taacagtcat agtgttaccg tgcaacatat tgttttcgta caagtactta atgacggatt 1380 gagtaccacc aacgttaatc aaatcggcca taacgtactt accagatggt ttaaaatcac 1440 cgatcaatgg agtggtatca gagattcttt ggaaatcatc tggagacaac ttaacaccag 1500 cagaatgagc aacagcaacc aaatgtaaaa cagcattggt agaaccacct gtagcaacaa 1560 cgtaagtgat agcgttttcg aaagcttctt tggtcaagat atctcttggc aagataccca 1620 attccatggt ctttttgata tattcaccaa tgttatcaca ttcagccaat ttttctttac 1680 tgacggctgg gaaagatgaa gagtttggaa tagtcaaacc caaaacttca gcagcagaag 1740 ccatggtatt agcagtatac ataccaccac atgaacctgg acctggacaa gcatgttcaa 1800 caacgtcttc tctttcttct tcggtgaatt gcttagagat atattcaccg taagattgaa 1860 aggcggaaac gatatcgatg ttcttggaaa tcttagagga accacaagtt ggatgacctg 1920 gcaaaatagt accaccgtaa accataatgg atggtctatt atgtctaccc atagccatca 1980 ttacacctgg catattctta tcgcaagatg gaatagcaat gttggcatcg taatgttgag 2040 ccatcataat ggtttcgaaa gaatcggcga taatttctct ggattgcaag gagtatctca 2100 taccttttgt acccatagag ataccatcgg aaacaccaat agtgttgaat tgcatggctt 2160 tcaaaccagc cttttcaata gattgggagc atctgttgtt caagtccaac aagtgcatat 2220 tacatggatt accagaccac caacaagaac caacaccgac ttgtggcttt ttgaaatctt 2280 ctttcttgaa accagtagca tacaacatag cttgagaagc accttgacct ttaggttcgg 2340 taataatgta ggagtacttg ttcaacttct tggcaacaca tctagtagta gagaattgtc 2400 tagaggtagc aaccttagtc aacaaaccca ttaagaaata aattgaattg aattgaaatc 2460 gatagatcaa tttttttctt ttctctttcc ccatccttta cgctaaaata atagtttatt 2520 ttattttttg aatatttttt atttatatac gtatatatag actattattt atcttttaat 2580 gattattaag atttttatta aaaaaaaatt cgctcctctt ttaatgcctt tatgcagttt 2640 ttttttccca ttcgatattt ctatgttcgg gttcagcgta ttttaagttt aataactcga 2700 aaattctgcg ttcgttaaag ctggcctttg tggcc 2735 <210> 20 <211> 2520 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 20 ggcctttgtg gccaggattt taatctgttg gagttaaggt gaatacgttt ttccatattg 60 gggtatgcag ctcgaaccta aagtggtatg tacacatccc ctcaagcaca cccattaccc 120 ttataggatt aatgtaagca acagcttaca cggaattgga aatactattc aacgatccat 180 gcatctgcca gattcggaca tgcatattcc ccaattggat atagaaaatt aacgtaaggc 240 agtatctttt cacaatgtac ttgcaacgcg gcgacttaaa gttgaagtac aacctgcagc 300 agcggctttt tgtacggtac gccaaactgt caatggataa tattgcgtag accgaaaaag 360 gtaatcctca acactacccg tggtggatga cctaaagcag taatattggt tggaattatc 420 tcccagacgg caccgtctcc ccgagaaagc ttagccccga ggtctacctt ccatacacca 480 ctgattgctc cacgtcatgc ggccttcttt cgaggacaaa aaggcatata tcgctaaaat 540 tagccatcag aaccgttatt gttattatat tttcattacg aaagaggaga gggcccagcg 600 cgccagagca cacacggtca ttgattactt tatttggcta aagatccatc ccttctcgat 660 gtcatctctt tccattcttg tgtatttttg attgaaaatg attttttgtc cactaatttc 720 taaaaataag acaaaaagcc tttaagcagt ttttcatcca ttttactacg gtaaaatgaa 780 ttagtacggt atggctccca gtcgcattat ttttagattg gccgtagggg ctggggtaga 840 actagagtaa ggaacattgc tctgccctct tttgaactgt catataaata cctgacctat 900 tttattctcc attatcgtat tatctcacct ctctttttct attctcttgt aattattgat 960 ttatagtcgt aactacaaag acaagcaaaa taaaatacgt tcgctctatt aagatgttat 1020 tgattttctg gtcttaactt tctgacttct ttaccaacct tccagatttc catgtttctg 1080 atggtgtcca attctttttc caatttttct ctgtaatctg gttgggagtt gaattccaag 1140 gatctcttag tttcagtacc gttcttagta gattcgtaca agtcttggaa aactggcttc 1200 aaggcattct tgaaaattgg ataccaatcc aaagcacctc ttctagcagt agtagaacaa 1260 gcatcgtaca tgtagtccat accgtattta ccaatcaatg ggtataatga ttgggtggct 1320 tcttcaactg tttcgttgaa agcttcagat ggagaatgac cattttctct caagacatcg 1380 tattgggcca aaaacatacc atgaatacca cccatcaaac aacctctttc accatacaag 1440 tcagaattga cttctctttc gaaggtggtt tggtaaacat aaccagaacc aatagcaaca 1500 gccaaagctt gagctttttc gtgagcttta ccagtaacat cattccaaac agcgtaagag 1560 gagttgatac ctctaccttc tttgaacaaa gatctaacag ttctaccaga accctttgga 1620 gcaaccaaaa taacatccaa atcctttggt ggttcaacat gggtcaaatc cttgaaaact 1680 ggtgaaaaac catgggagaa gtacaaggtc ttacccttag tcaataatgg cttaatagct 1740 ggccaagttt cagattgagc agcatcagac aacaagttca taacgtaaga acctctcttg 1800 atggcatctt caacagtgaa caaattctta cctggaaccc aaccatcttc aatagcagct 1860 ttccaagaag caccatcttt tctaacaccg atgataacgt tcaaaccgtt gtctctcaaa 1920 ttcaaacctt gaccataacc ttgagaacca taaccaatca aggcgaaggt atcgttcttg 1980 aagtaatcca acaacttttc tctaggccaa tcagctcttt cgtaaacggt ttcaacagta 2040 ccaccgaagt tgatttgctt caaacctctg gtagtaatca ttggcttaac aaatcttgca 2100 gctggtctag aataagcagc agctctagta gccaaagcga aagttctctt ggcagtaata 2160 actctggaat tgcagatcaa tctagcagct tgagttctca acattaaacg gtggtgtttg 2220 acacatccgc cttcttaatg ctttctttca gtattatgtt atttttttgt tattcgtttt 2280 tcacttctag gctttttgac agactagccc cgttatacca ccatctttgt gggaaagccc 2340 ctaaattgcc ctgagcagta tcgtttcatg tctagtctct ttaaagatgt ttcttacgcg 2400 ttgcgtgtaa aacatcctct cattcaagac agggttttct aaaagcaata ggggtagttt 2460 aataattctt atataatcat catatacact atttttagtt cttaattggc ctgtctggcc 2520 <210> 21 <211> 2415 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 21 ggcctgtctg gcccttccct tttacagtgc ttcggaaaag cacagcgttg tccaagggaa 60 caatttttct tcaagttaat gcataagaaa tatctttttt tatgtttagc taagtaaaag 120 cagcttggag taaaaaaaaa aatgagtaaa tttctcgatg gattagtttc tcacaggtaa 180 cataacaaaa accaagaaaa gcccgcttct gaaaactaca gttgacttgt atgctaaagg 240 gccagactaa tgggaggaga aaaagaaacg aatgtatatg ctcatttaca ctctatatca 300 ccatatggag gataagttgg gctgagcttc tgatccaatt tattctatcc attagttgct 360 gatatgtccc accagccaac acttgatagt atctactcgc cattcacttc cagcagcgcc 420 agtagggttg ttgagcttag taaaaatgtg cgcaccacaa gcctacatga ctccacgtca 480 catgaaacca caccgtgggg ccttgttgcg ctaggaatag gatatgcgac gaagacgctt 540 ctgcttagta accacaccac attttcaggg ggtcgatctg cttgcttcct ttactgtcac 600 gagcggccca taatcgcgct ttttttttaa aaggcgcgag acagcaaaca ggaagctcgg 660 gtttcaacct tcggagtggt cgcagatctg gagactggat ctttacaata cagtaaggca 720 agccaccatc tgcttcttag gtgcatgcga cggtatccac gtgcagaaca acatagtctg 780 aagaaggggg ggaggagcat gttcattctc tgtagcagta agagcttggt gataatgacc 840 aaaactggag tctcgaaatc atataaatag acaatatatt ttcacacaat gagatttgta 900 gtacagttct attctctctc ttgcataaat aagaaattca tcaagaactt ggtttgatat 960 ttcaccaaca cacacaaaaa acagtacttc actaaattta cacacaaaac aaaatgttag 1020 tcggagaatt ctttgtcgta accaaccaaa gtgaatctgt atctgacgtc acccttttcc 1080 attctttcaa aagcttcatg aacaccagct tcaccaactg gcaaagtttc aacccaaatc 1140 ttgatgtcct tttcggaaac caacttcaat aattgattca attctttgat ggaacccaaa 1200 gcagaataag aaatagaaac ggccttcaaa ccgtatggtt tcaaggacaa catttcgtgt 1260 tgttctggaa tggaaatgga aactattcta ccaccaacct tcatggcctt tggcataatg 1320 ttgaaatcaa tatcagtcaa ggaagaagcg cagacaacga tcaaatcaaa agtatcgaag 1380 tacttttcac cccagtcacc ttcttccaaa gtagcaatat aatgatcggc acccatcttc 1440 attgcatctt ctctttttct agaggatcta gaaatgacgt aggtttcagc acccatagct 1500 ttagaaatca aagtacccat agaaccaata ccacccaaac caactatacc aaccttttta 1560 cctggaccac aaccatttct aaccaatggg gaataaacag tcaaaccacc acacaataat 1620 ggagcagcca aatgagatgg gatgttttct gggattggaa caacgaaatg ttcgtgaact 1680 ctaacgtagt tagcgtaacc accttgagaa acataaccat cttcgtatgg ttgagagtaa 1740 gtggtaacga acttagtaca gtatggttcg ttatcgttct tgcatctatc gcattccaaa 1800 caagaaaaaa cttgagcacc aacaccaact ctttgaccaa ctttcaaacc ggagttagac 1860 tttggaccca acttaacaac tttaccaacg atttcgtgac caacaaccaa tggcatcttc 1920 atattacccc aatgaccagc agcacaatga atatcggaac cgcaaacacc acaagcttca 1980 atcttaatgt cgatatcatg atcgtagaat ggctttggat cgtacttagt cttttttggg 2040 ttcttccaat cttcgtgtga ttgaatggca ataccttcga acttttctgg gtaggacatt 2100 aaataaagca atcttgatga ggataatgat ttttttttga atatacataa atactaccgt 2160 ttttctgcta gattttgtga agacgtaaat aagtacatat tactttttaa gccaagacaa 2220 gattaagcat taactttacc cttttctctt ctaagtttca atactagtta tcactgttta 2280 aaagttatgg cgagaacgtc ggcggttaaa atatattacc ctgaacgtgg tgaattgaag 2340 ttctaggatg gtttaaagat ttttcctttt tgggaaataa gtaaacaata tattgctgcc 2400 ttggcctatg tggcc 2415 <210> 22 <211> 4475 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 22 ggcctatgtg gcctccctgc gcggctaaag ttaaggatgc aaaaaacata agacaactga 60 agttaattta cgtcaattaa gttttccagg gtaatgatgt tttgggcttc cactaattca 120 ataagtatgt catgaaatac gttgtgaaga ggatccagaa ataatgaaaa gaaacaacga 180 aactgggtcg gcctgttgtt tcttttcttt accacgtgat ctgcggcatt tacaggaagt 240 cgcgcgtttt gcgcagttgt tgcaacgcag ctacggctaa caaagcctag tggaactcga 300 ctgatgtgtt agggcctaaa actggtggtg acagctgaag tgaactattc aatccaatca 360 tgtcatggct gtcacaaaga ccttgcggac cgcacgtacg aacacatacg tatgctaata 420 tgtgttttga tagtacccag tgatcgcaga cctgcaattt ttttgtaggt ttggaagaat 480 atataaaggt tgcactcatt caagatagtt tttttcttgt gtgtctattc attttattat 540 tgtttgttta aatgttaaaa aaaccaagaa cttagtttca aattaaattc atcacacaaa 600 caaacaaaac aaaatgttac ttcttttgag atggtggcaa ggtttcttct tccaagacaa 660 ccaacaaatc agaagcatca acggattcac cgtccttaat gaaaacatcc ttaacttgac 720 catcagcagg agaagaaaca accatttcca tcttcatggc ggacaaaaca gcaatagatt 780 cacccttttt gaccaaggaa cctttgtgaa ccttaacttc tataataaca ccggccattg 840 gagcacctat ttgatgagta tcatgaacat cggcttttgg cttagcaact gattgaatgt 900 tttgggactt gtcggcaact ctgatttttc tcaattcacc gttcaattcg aagtagactt 960 ctctttgacc agtctttttg ttcaagtcac caactgcttg caacttaatg atcaaggtct 1020 taccttgttc gatggtaact tcaatttctt catctggttc agctggagcc aagaaattct 1080 tagttggcaa aactgacaag tcaccgtagg tttctctaat cttttggaaa tcttcgtaga 1140 ctcttgggta catattgtaa gaggcaacat cacattcatc gatgtcaccg aatctgtttt 1200 gcaagtcttc tctgatcttt tccaaatcaa atggttccaa ttccaaacct ggtctgcaag 1260 tcaattttct tctcttgttt ctcaaaacat cagatctcaa tggttctgga aaaccaccgt 1320 atggttgacc gatcaaacct tcgaaaaaat ccataacgga atctgggaaa tccaaggaat 1380 tagccaatct tctaatgtca tcggaggtca atttgttact gaccatgaat tgggccaaat 1440 cacctacaac tttagaagtt ggggtaacct taacgatatc acctaacaag tagttggctt 1500 ctctataagc tctcttagtt tctgcccatt gttcacccaa acctaattgt tgagcttgga 1560 acaacaagtt agtcaattga ccacctggaa tttcgtgttg ataaacttca ggatctggac 1620 ctttcaaatc ggcttcaaaa caagagtaca acaatctcat ttcagcccag taagcatcca 1680 attctctaac gtgttcgacg ttaataccgg tgtcaatgtt accttccaaa gaagctaaca 1740 aagcgttaat ggatggttga gaagtcaaac cggacataga attgattgca acatctacaa 1800 catcagcacc agccaaggca caagcagtca tagaagcaac agctgtacca gcagaatcat 1860 gagaatgaac atggattggc aaatctgggt atctagttct caaagaacca atcaacaact 1920 tagcagcagc tggcttcata gtaccagcca tatctttgat acccaagata tgagtaccca 1980 tttgaactat cttttcgacg acttccaagt agtagtccaa attgtacttc ttacctggtt 2040 gcaacatgtc accagaataa caaacagtag cttctacaac accaccagct ttcttaacag 2100 cgttaacacc aaccttcaat tgttccaagt cgttcaaagc atcgaatact ctgaagatat 2160 cgacaccgtt atccttagct tgcttaacaa agtgatcaat ggcgttatct ggcaatgaag 2220 aataagcaac accattagca cctctcaaca acatttggaa agggatgttt ggaaccaaag 2280 atctcaactt tctcaatctt tcccaaggat cttcatgcaa gaatctcata gcaacatcga 2340 atgtagcacc accccaacat tccaaagcaa aagcaccagc taaagcatga gcagtagttg 2400 gagcaattgt agccaaatca tgggttctaa ctctagtagc caacaaagat tgatgagcat 2460 ctctccaagt ggtatccatc aacaaagtac cgttgaattg tctaacttgc ttagcgaatt 2520 cggaaggacc tttttccaac aaaacttgtc tccaacctga tggtggagct gatttggtaa 2580 cgttaataac attaccttga gcatcatgca agtgtggaac agatggatta gacttcaact 2640 ttggcaaacc aatttgaccc ttaatagaag aaccgttaac agccaaatct gccaagtaat 2700 gcaacaactt ttgtgctctg ttttgtgagg aaaccatttg gaataattgt ggggtatcat 2760 caatgaaggt agtccagtaa gtaccttcga tgaaaactgg gttagtcaac aaggtcaaca 2820 aaaatgggat gttggtctta acacctctga ttctgaattc gatcaaggct ctgatcatct 2880 ttcttctaac gatttcgtaa gtagaaccgg aacaagaaca cttgaccaac atagaatcat 2940 agtgtggaga aatagttgca ccagcatatg cattaccacc gtccaatcta acaccgttac 3000 caccggcaga tctgtaaact tccaatctac cagtatctgg ttggaagttc ttggatggat 3060 cttcggtagt aattctacat tgaatggaga aacctctggt ggtaatctta tcttgcaaca 3120 aacccaattg agtcaaagta gcaccagcag caatttgaat ttgggcggaa actatatcga 3180 taccggtaat ttcttcggtg atggtatgtt cgacttggat tctaggattg atttcgatga 3240 agtagtgtct gttttgatta tcgaccaaga attcggcagt accagcattt ctataaccac 3300 agactttagc caacttaaca gcatcagtca aaatggcatc tctaacttct cttggcaaag 3360 ttttagctgg agcaacttca acaacctttt ggtgtcttct ttgaacggag caatctcttt 3420 caaacaagtg aacaacgtta ccgtggttat cagccaataa ttgaacttcg atgtgctttg 3480 gcttatccaa gaatctttcg acgaagcaag taccattacc aaaagcagtt ctagcttcag 3540 aagtagctct ttgaaaagca tcagcaacat catcaccttc tctaacaact ctcatacctc 3600 taccaccacc accgaaagca gccttgataa taactgggta accatattcg ttgacgaaat 3660 ccaaagcttc ttgaacagtt tcaattggac ctggagtacc tggaacagtt ggaacattag 3720 ctctagcagc caaatgtcta gcggaaactt tgtcaccaac agaatcaata acttcagctg 3780 gtggaccaat ccaagtaata ccagccttaa caaccttatc agcaaattca gagttttcgg 3840 acaagaaacc gtaacctgga tgaatgaaat caaccttgtg cttcttggcg atttcaataa 3900 tttcgtccat agccaaataa gcaccaactg gagtatattg accttcttca ccaataacgt 3960 aggcttcatc agctttcaat ctgtgcatag acaatctatc ttcgtgggag tagatagcaa 4020 tagttctcat ggacaattcg tgggcggatc taaaaattct gattgggatt tcacctctgt 4080 tggcaaccaa aatcttgttc ttttcaccca acaaggagaa gttatctctc aaaccagcca 4140 attttttgga ggaggacatt aaatttaact ccttaagtta ctttaatgat ttagttttta 4200 ttattaataa ttcatgctca tgacatctca tatacacgtt tataaaactt aaatagattg 4260 aaaatgtatt aaagattcct cagggattcg atttttttgg aagtttttgt ttttttttcc 4320 ttgagatgct gtagtatttg ggaacaatta tacaatcgaa agatatatgc ttacattcga 4380 ccgttttagc cgtgatcatt atcctatagt aacataacct gaagcataac tgacactact 4440 atcatcaata cttgtcacat gaggccttgg tggcc 4475 <210> 23 <211> 3096 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 23 ggccttggtg gccgaataaa aaacacgctt tttcagttcg agtttatcat tatcaatact 60 gccatttcaa agaatacgta aataattaat agtagtgatt ttcctaactt tatttagtca 120 aaaaattagc cttttaattc tgctgtaacc cgtacatgcc caaaataggg ggcgggttac 180 acagaatata taacatcgta ggtgtctggg tgaacagttt attcctggca tccactaaat 240 ataatggagc ccgcttttta agctggcatc cagaaaaaaa aagaatccca gcaccaaaat 300 attgttttct tcaccaacca tcagttcata ggtccattct cttagcgcaa ctacagagaa 360 caggggcaca aacaggcaaa aaacgggcac aacctcaatg gagtgatgca acctgcctgg 420 agtaaatgat gacacaaggc aattgaccca cgcatgtatc tatctcattt tcttacacct 480 tctattacct tctgctctct ctgatttgga aaaagctgaa aaaaaaggtt gaaaccagtt 540 ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 600 attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 660 agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaaatgttag 720 tgcttaccac cagttctctt atgtctcaat tcagtttgtt gtctttcgac ttctgggtca 780 aagttaatga attcatccaa acctgaacca ccagcaacca taggcaagac tggaaccttc 840 ttatcaactt caacttccaa caagacagga cccttagtag aaacgaattc tttcaactta 900 gcgtccaatt cttcttgctt tttgactctc aaacctttta aacccatggc ttcagccaac 960 ttaatgaaat ctgggttcaa ttgatgggta tgggagtatc tatgttcgta gaacaaactt 1020 tgccattgtg tgaccatacc ttgttcttcg ttgttcaaga tcaaaatctt aactggagta 1080 ccagcttgaa cagcggaaga taattcagtc aaggtcatgt tgaaagaggc atcaccatca 1140 atatcaataa ccaaggattc tggtttagca acttgagcac caatagcagc tggcaaacca 1200 taacccatag tacccaaacc accagatgta atgaaagtat gaggatttct ccaagtccaa 1260 tgttgagcag cccacatttg atgttgacca acaccagtag taacgataac atgtctaccg 1320 gtatcgttag caaccttaga caacttcttg ataacggttt gtggcttgat tttagaacct 1380 ggagtttctt ccatgtaggc gtatgggtat tctttcttcc acttgttgat ttgagcgaac 1440 cattcagatc tttctttgac tgggaagatc ttagacatca tcttacccaa attagtagtt 1500 gcatcacctt caacggcgat ttgggtttga acaaccttgt tgatattctt tggggagact 1560 tcaaaatgaa taataccacc tctaccttca gcagcagctc tcctagcttc tggagcaaac 1620 ttggaaatgt taccagtgac tctatcatca aatctagcac caacagcaat aatcaagtcg 1680 gcgttttgaa cagccaaatt agcagtagca caaccatgca tacccaacat gtccaaggat 1740 tttggatctt cttgatcgaa ggaacccaaa ccttgtaaag tagtagtaac tggaatttgg 1800 gctctgtcgg acaattcttt caataatctt ggaccatcag catgattcaa aataccggca 1860 ccaacataca agactggttt ttttgccaag ttgatcaaat cggcagcctt gttaatagat 1920 tgcatgacga attcatcttg ggctctagaa gtcaattgat tcaaggcatt ggatggcaag 1980 gtagtcttag ttggaattgg atttctcaaa atggcggcag taacatcttt aggcaaatca 2040 accaaaactg gacctggtct acctgatgta gcaatttcga aagcttcgtt gattctcaat 2100 ggcaattctt caacggactt aaccatgacg ttccacttag tacaagatct agaaatacca 2160 acaacgtcag cttcttgaaa agcatctgta ccaatagcgg atgttggaac ttgaccagta 2220 aaaacaacca ttggaatacc atcagcgaaa gcatcagcca ttggagtaac aacattagta 2280 gcacctggac cagaagtaac caaaacaaca cctggtttac cagaagctct agcataacct 2340 tcagccatat gaccagcacc ttgttcatgt tttggcaaaa cgaagttgaa cttgtcggag 2400 ttgtgaatag catcataaac tggcaaaata gcaccacctg gataaccaaa aacggtatca 2460 acgttttgtc tggacatcat ttcgttgaag atttgaccac cagtcaaacc aacaaaagaa 2520 gtatccatat ctggttcggc tctcaacttt ttagccaatt tagatggttc agctggttgt 2580 tccaatggat caacgttaaa agatggagct ggttctggtc ttttagaagc tggcaatgga 2640 gaagcagagt aatatctgga ggatgaggag taaaatcttt gagccaaagc aacagatctc 2700 atggctggag tatttctgta agcgatatgt tggaagcatc tcttaatagc gaagttcttc 2760 aaggtggatt gtctgatcat taagtgaatt tactttaaat cttgcattta aataaatttt 2820 ctttttatag ctttatgact tagtttcaat ttatatacta ttttaatgac attttcgatt 2880 cattgattga aagctttgtg ttttttcttg atgcgctatt gcattgttct tgtctttttc 2940 gccacatgta atatctgtag tagatacctg atacattgtg gatgctgagt gaaattttag 3000 ttaataatgg aggcgctctt aataattttg gggatattgg cttttttttt taaagtttac 3060 aaatgaattt tttccgccag gatggcctta gtggcc 3096 <210> 24 <211> 1816 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 24 ggccttagtg gccgccgtac cacttcaaaa cacccaagca cagcatacta aatttcccct 60 ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag 120 accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt 180 ttcttgaaaa tttttttttt tgattttttt ctctttcgat gacctcccat tgatatttaa 240 gttaataaac ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac 300 tttttttact tcttgctcat tagaaagaaa gcatagcaat ctaatctaag ttttaattac 360 aaaatgttag gaagaagcag atctagaagc aacgaattcc aaacccttgt caatgttctt 420 cttcaattgg gagacacaga ttggcaacat ttgatttctt tccatatcgt tcattctgtt 480 gacaatatcg taatcaacgt aggaaacacc cttggtagta atagtcaatg gaatagcgaa 540 gtaatcagca ccatcaacca atggcaataa ttgatcagca cctggagcaa ttgggaaatt 600 gttagcatcc ttcaatggaa cgtagtaagt accatggatt tgttcgatgt tacccaacaa 660 caaggaaacg aattgaacaa cgcatttgta accagcatga gccatagaca aagtagcaga 720 acccttacca tttttagcct taacaacttc atcaccaccg tattgaactc tgtggatcaa 780 gtacttcaat tgatcttcgt tcaatctgga caagaagtta gattgggaga acaaagggat 840 aatggtttca ccagaatgac caccaataac aggaacatct ggcatagaat tgactcttgg 900 agtcaaacca gattcgatgt tgatttctct caagaaggta gaagctctaa cgatatccaa 960 cttggtaaca cccataattc ttctttcgat accggagttt ctagattgtg gatggttctt 1020 caagatgtta ctgaccataa ctggaaccaa agagttaact gggttggaga taaccaaaac 1080 gaaaacctta gacaaatcgc agcattcagc aatagaatca cccaattgag aaatgatacc 1140 ggcgttaacg ttgaacaaat catctctagt catacctggt tttcttggaa caccagctgg 1200 aataacaacg atggaagcat tatgcaagca attttctata ccaccggctg gagaatgtga 1260 agaaacggag attggggtat caatatgaga caaatcagcg gtaacaccgt taatggcttc 1320 ttgattaaca tcgtacaagg ccaaatgaat atgggtgacg gatctattgg attctttcaa 1380 ttggtattgc aattgggcct tcaacaacaa agacaaagat tgaccaatac caccagcagc 1440 acccaaaata gcaatcttca aggaatcttg ttcaatggat ggggtaacag aatgtggcat 1500 taaggagatt gataagactt ttctagttgc atatctttta tatttaaatc ttatctatta 1560 gttaattttt tgtaatttat ccttatatat agtctggtta ttctaaaata tcatttcagt 1620 atctaaaaat tcccctcttt tttcagttat atcttaacag gcgacagtcc aaatgttgat 1680 ttatcccagt ccgattcatc agggttgtga agcattttgt caatggtcga aatcacatca 1740 gtaatagtgc ctcttacttg cctcatagaa tttctttctc ttaacgtcac cgtttggtct 1800 tttggcctac ttggcc 1816 <210> 25 <211> 3112 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 25 ggcctacttg gccgggcgcc ataaccaagg tatctataga ccgccaatca gcaaactacc 60 tccgtacatt catgttgcac ccacacattt atacacccag accgcgacaa attacccata 120 aggttgtttg tgacggcgtc gtacaagaga acgtgggaac tttttaggct caccaaaaaa 180 gaaagaaaaa atacgagttg ctgacagaag cctcaagaaa aaaaaaattc ttcttcgact 240 atgctggagg cagagatgat cgagccggta gttaactata tatagctaaa ttggttccat 300 caccttcttt tctggtgtcg ctccttctag tgctatttct ggcttttcct attttttttt 360 ttccattttt ctttctctct ttctaatata taaattctct tgcattttct atttttctct 420 ctatctattc tacttgttta ttcccttcaa ggtttttttt taaggagtac ttgtttttag 480 aatatacggt caacgaacta taattaacta aacatgttac aatggttgag tttgagcttc 540 aacaacggcc aaagcaacca tattaacgat tcttctaacg gaggcaattg gagtcaaaac 600 atgaactggt ttagcaacac ccatcaaaac tggaccaaca gttacacctt cactggaaga 660 gactctcaac aagttgtaag aaattctggc agcttccata tttggcatga ccaaaatgtt 720 agcagaacct ttcaatgagg agtctggcat tctatcattt ctaatagctt caaccaaagc 780 agcatcacca tgcatttcac catcaatcat caattctggt gctctttctc tgaccaattc 840 caaagcttgt ctcatttttg aagaggatgg gcagtctgaa gaaccaaaat tagaatggga 900 caacaaggca actctaggtt caataccaaa tcttctaacg gtttcagcag ccatcaaagt 960 aatttcagcc aattcttcag catctggttc atcgttaacg taagtatcag caatgaaggt 1020 gttaccagat ggcaacaaca aagcattcat agcaccagca gtatgaacac catctctata 1080 accgaaaacg ttcttgacaa cagagaagtg ttcatggtaa tcaccaacag taccacaaat 1140 catagcgtca gcttcacctc tttgaaccat gatggcacca ataacagttg ggttagaaat 1200 caaagctctt tgagcttgtt cttgagtgac acctcttctc ttcatgattt ggaagtattc 1260 ggtccagtat tctttgaatc ttgggtcaga ttcattgtta acgatttcga agtcaacacc 1320 ggccttgatt tgtaaaccta acttttggat tctcatttcg atgacgtttg gtctaccaat 1380 caaaattggc ttagccaaac ccaaggtaac taattcttga gtagcgtgta aaactctagc 1440 ttcttcacct tctggcaaaa caactctctt tggagccttt ctagcttgtg agaaaattgg 1500 cttcatgaac aagttggtct tgtaaacgaa ttcggtcaac ttgtcgatgt aaacatcgaa 1560 atcagcaatt ggtctagtag caacaccaga ttccatagca gctttagcaa cagctggagc 1620 aatcttaacg atcaatcttg gatcgaatgg ctttgggatg atatattctg gaccaaaaga 1680 caaatcttga tcaccataag cagatgcaac aacttctgat tgttcagcat gagccaattc 1740 agcaatagct ctaacagcag ccaacttcat ttcttcgtta atagcggtag caccaacatc 1800 caaagcacct ctaaaaatga atgggaagca caagacgttg ttaacttgat ttgggtaatc 1860 agatctaccg gtacagataa tagcgtctgg tctaacttct ttagccaatg gtggcaagat 1920 ttctggttct ggattagcta aagccaaaat cattggggct ctagccattt tcttaaccat 1980 ttcttgagtc aagacttttg gaccagaaca acccaagaaa atatcggcac cttcaataac 2040 atcatccaag gttctcttac catcatcaac aacagcataa gcagcttttg tttcagccat 2100 gttaggttct ctaccttggt agataacacc tttggaatcg caaacaacga tgttgtgctt 2160 ttgtaaaccc aaggcaacca acaaattcat acaagcaata gcagcagcac cagcaccaga 2220 aacaaccatt ctgacatcgg agatgttctt ttcaacaact ctcaaaccgt tcaaaatagc 2280 agcggtagaa ataatagcag taccatgttg atcatcgtgg aaaactggga tgttcattct 2340 ttctctcaac ttttgttcga tgtagaagca ttctggagcc ttaatatctt ccaagttaat 2400 accaccgaaa gtaggttcca aagcagcaac aacttcaatg aacttgtctg gatccaattc 2460 atcaacttcg atgtcgaaaa catcgatacc ggcgaacttt ttgaacaaaa cacctttacc 2520 ttccataact ggtttaccag ccaaagcacc aatattaccc aaacccaaaa cggcagtacc 2580 attagaaata acggcaacca aattacctct agcagtgtac ttgtaagcct tcaatggatc 2640 tttttcaatt tccaaacatg gagcagcaac acctggagaa taagccaaag ccaaatctct 2700 ttgggtagcc aatggttttg ttggagaaac ttggatctta cctggaactg gaaattcatg 2760 gaaatccaag gcagattgct tcaattgatc atccattaag agtaataatt attgcttcca 2820 tataatattt ttatatacct cttattttta tgtattagtt aattaagtat ttttatctat 2880 ctgcttatca ttttcttttc atataggggg ggttggtgtt ttcttgccca tcagattgat 2940 gtcctccaac tcggcactat tttacaaagg gtttttttgt aagagaagga gaagacagat 3000 actaaaccat acgttactcg aaacaaaaaa aaaaaaaatg gaaaaagctg ctatcaacaa 3060 aagacggcct catcaaacct aaagaaacca tgtcagcgtg gcctgtatgg cc 3112 <210> 26 <211> 2705 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <400> 26 ggcctgtatg gccctactta ttcccttcga gattatatct aggaacccat caggttggtg 60 gaagattacc cgttctaaga cttttcagct tcctctattg atgttacacc tggacacccc 120 ttttctggca tccagttttt aatcttcagt ggcatgtgag attctccgaa attaattaaa 180 gcaatcacac aattctctcg gataccacct cggttgaaac tgacaggtgg tttgttacgc 240 atgctaatgc aaaggagcct atataccttt ggctcggctg ctgtaacagg gaatataaag 300 ggcagcataa tttaggagtt tagtgaactt gcaacattta ctattttccc ttcttacgta 360 aatatttttc tttttaattc taaatcaatc tttttcaatt ttttgtttgt attcttttct 420 tgcttaaatc tataactaca aaaaacacat acataaacta aaaatgttac aattgattgg 480 tgtgaacgga tggatcgtgt tgaaccttaa tcattggtct gtaaactggt tcccacattt 540 gagccttaac ccattgcaag cattcgtcaa aatctcttgg aaccttaaca gtttcacctg 600 gagcaccacc tggaacttgt tcttgttcga ttctggcagt accttcttcc aaagcttgta 660 aaataacggc agttgccaat ctagcagagg tattagtaat ggtatccaaa cctggcaata 720 aacctggtct agaatcacct tctctcaatg gagacaattc agccaattga tcaacggcag 780 cagaaatcat cttgtcggta attgtagtag ctctagacaa aacagcaccc aaaccaatac 840 ctggaaagga gtagcagttg ttgttttcag agattctgta accatcaact ggtggaaatg 900 gagaaccagt agcaaccaaa gcattgttgt tagtccactt catcaaatca gctggaacag 960 cttcatgcaa tctagttggg ttagacaatg ggaagatgat aggtcttgga ttgtgcttat 1020 gcatttcttc aacgacatct tgtgtaaaag caccagcttg agtagaacaa ccaaccaaac 1080 aagtaggctt aacgttttcg acaacatcgt gcaatgatct agtgttaata ccagcccatt 1140 cagcatcaga tttagcgtaa acatgttgag ctggggtaga attagcttcg taggattgca 1200 atatcaaacc tcttctgtcc atcaagaaga tcttttttct ggcttcttct ttgtcgacac 1260 catgagtaac catgtggtta acgatttgat ctgcaatacc taaaccagca gaaccagcac 1320 catagatcaa gactctggta tctttcaaat ctctgttagt gtgcttcaat gcagcaatca 1380 aagaagccat aacaacagca ccagtacctt gaatgtcatc gttgaaggat ggcaattcgt 1440 atctgtactt ttctaataat cttctggcgt tcttaacacc gaaatcttcg aagtgtaaaa 1500 cagcggatgg ataaaccttc ttaacggcct tgatgaactt ttccaagaaa tcgtcgtatt 1560 gcttacctct gattctggag aacttgttac ccatgtacaa ttcatctctg gccaactttt 1620 tgttgtttgt accaacatcc aaacaaactg gcaaaactct acctggatga ataccaccac 1680 acaaggtcat caaagccaac ttagaaatag caattctgac accacctata ccttgatcac 1740 caatacccaa aataccttcg gagtcggaaa caacgatgta atcaacatcc ttatcaccac 1800 cataagtagc caatctacat tcaatggaat ctggttcggt gatatccaaa aagacacctt 1860 ctggttttct gaatctgtga gaataagcag caatagcatc accttcagtt ggagtgtaga 1920 tgattggaac caattctttg atgtgtcttc tgatcaaggc gaagtacaag accttgtttt 1980 gaactctcaa agaagtcatg aaatcgttct tggccaatgg agttttcaag tagcacaatt 2040 gcttgtagga tctttccaat tgttcatcca aagtgttaac ttgtggtggc aacaaagctt 2100 ccaagttgaa agcttctctt tcttcttgag tgaaagcaga acccttgttg aacaaaggtg 2160 agttcaataa ttggaaggat tccaatgggc attcaatagc accttcaaca gtcaatctag 2220 tagcatgtgg atgtggagct tcaaaaatct ttctggctct agaaccaact ggagtcttag 2280 taacttcttc atcggagtat ggcttttgga aggtgttttc tctagtagta gtagccttat 2340 gagatctggt gttagaagag tataatctgg attgttggat tggccacatt aagattaata 2400 taattatata aaaatattat cttcttttct ttatatctag tgttatgtaa aataaattga 2460 tgactacgga aagctttttt atattgtttc tttttcattc tgagccactt aaatttcgtg 2520 aatgttcttg taagggacgg tagatttaca agtgatacaa caaaaagcaa ggcgcttttt 2580 ctaataaaaa gaagaaaagc atttaacaat tgaacacctc tatatcaacg aagaatatta 2640 ctttgtctct aaatccttgt aaaatgtgta cgatctctat atgggttact caggcctctt 2700 tggcc 2705 <210> 27 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 gtttgctgtc ttgctatcaa gtataaatag a 31 <210> 28 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 gatttaaacc ttgggcacca ca 22 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 gatgatcgct atggttaagg ct 22 <210> 30 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 30 ctaacggatt tctgcacttg at 22 <210> 31 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 cgataccaac ttgggctttc t 21 <210> 32 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 32 gcatgctggt gatgttgct 19 <210> 33 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 33 gccaatactt cacaatgttc gaatct 26 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 34 cgatcaatct tggagacttt gga 23 <210> 35 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 35 gggctattgc agctgct 17 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 36 caaggctctt tcactctcct 20 <210> 37 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 37 gcgttcaatt cgttagcatt acca 24 <210> 38 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 38 gctgacaaag aatctagaca cttgt 25 <210> 39 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 39 cttgcataaa ttggtcaatg caagaaatac a 31 <210> 40 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 40 cttctttctt gaaaccagta gcataca 27 <210> 41 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 41 gttgttgtca ttagatatga aggtcca 27 <210> 42 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 42 gccctctttt gaactgtcat ataaatac 28 <210> 43 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 43 gatttgcttc aaacctctgg tagt 24 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 gatgggtggt attcatggta tgt 23 <210> 45 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 45 gacaatatat tttcacacaa tgagatttgt agt 33 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 46 caatgaatat cggaaccgca aaca 24 <210> 47 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 47 gctactttgg aagaaggtga ct 22 <210> 48 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 48 gtaggtttgg aagaatatat aaaggttgca 30 <210> 49 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 gggagtagat agcaatagtt ctca 24 <210> 50 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 gatcattaag ttgcaagcag ttggt 25 <210> 51 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 ctaataagta tataaagacg gtaggtattg attgt 35 <210> 52 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 gctggcaatg gagaagca 18 <210> 53 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 cgctgttcaa gctggtact 19 <210> 54 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 54 cgatgacctc ccattgatat ttaagt 26 <210> 55 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 cggatctatt ggattctttc aattggt 27 <210> 56 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 gtgatgaagt tgttaaggct aaaaatggt 29 <210> 57 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 catttttctt tctctctttc taatatataa attctcttgc 40 <210> 58 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 gcagcaacac ctggaga 17 <210> 59 <211> 28 <212> DNA <213> Artificial <220> <223> primer <400> 59 gttgtcccat tctaattttg gttcttca 28 <210> 60 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 60 ggagtttagt gaacttgcaa catttact 28 <210> 61 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 61 ggagcttcaa aaatctttct ggct 24 <210> 62 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 62 ctttccaggt attggtttgg gt 22

Claims (9)

  1. 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
    (A) 특정한 연결 순서로 연결할 수 있는, 복수 종류의 단위 DNA를 연결시킨, 삽입 DNA 유닛을 포함하는 플라스미드를, OGAB법에 의해 복수 종류 조제하는 공정,
    (B) 공정 (A)에서 조제한 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
    (C) 공정 (B)에서 얻어진 복수 종류의 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정
    을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  2. 제1항에 있어서, 공정 (B)에서 얻어지는 단위 DNA 혼합액에 있어서의, 모든 DNA 단편의 몰 농도 비율이 0.8 내지 1.2인 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  3. 제1항 또는 제2항에 있어서, 공정 (A)에 있어서, 한가지 종류의 삽입 DNA 유닛이 포함하는 단위 DNA의 종류가, 3 내지 60종류인 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 공정 (B)에서 사용하는 제한 효소가 3종 이하인, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제한 효소가, 돌출 말단을 생성하는 제한 효소인, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 기재된 조제 방법에 의해 얻어진 미생물 세포 형질 전환용 DNA 단편을 포함하는 플라스미드.
  7. 숙주 미생물 중에서 유효한 복제 개시점을 포함하는 DNA와, 단위 DNA가 연결된 삽입 DNA를 포함하는 삽입 DNA 유닛을, 적어도 하나 갖는 미생물 세포 형질 전환용 DNA 단편의 조제 방법으로서,
    (B') 제6항에 기재된 복수 종류의 플라스미드를, 각각에게 적합한 제한 효소로 처리하여, 단위 DNA로 분해하고, 복수 종류의 단위 DNA 혼합액을 조제하는 공정, 및
    (C) 공정 (B')에서 얻어진 단위 DNA 혼합액을 사용하여, OGAB법에 의해 단위 DNA를 재집적시켜, 장쇄 DNA 단편을 조제하는 공정
    을 포함하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  8. 제7항에 있어서, 얻어진 장쇄 DNA 단편을 포함하는 플라스미드를 복수 종류 선택하고, 공정 (B')에 있어서의 플라스미드로서 재이용하는 것을 특징으로 하는, 미생물 세포 형질 전환용 DNA 단편의 조제 방법.
  9. 제1항 내지 제5항, 제7항, 및 제8항 중 어느 한 항에 기재된 미생물 세포 형질 전환용 DNA 단편의 조제 방법을 사용하는 키메라 플라스미드 라이브러리의 구축 방법.
KR1020217034567A 2019-04-01 2020-03-24 키메라 플라스미드 라이브러리의 구축 방법 KR20210144816A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019069798 2019-04-01
JPJP-P-2019-069798 2019-04-01
PCT/JP2020/013133 WO2020203496A1 (ja) 2019-04-01 2020-03-24 キメラプラスミドライブラリーの構築方法

Publications (1)

Publication Number Publication Date
KR20210144816A true KR20210144816A (ko) 2021-11-30

Family

ID=72668045

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217034567A KR20210144816A (ko) 2019-04-01 2020-03-24 키메라 플라스미드 라이브러리의 구축 방법

Country Status (11)

Country Link
US (2) US11643648B2 (ko)
EP (1) EP3951028A4 (ko)
JP (2) JP7101431B2 (ko)
KR (1) KR20210144816A (ko)
CN (1) CN113728130A (ko)
AU (1) AU2020254537A1 (ko)
CA (1) CA3135856A1 (ko)
EA (1) EA202192652A1 (ko)
IL (1) IL286823A (ko)
SG (1) SG11202110872XA (ko)
WO (1) WO2020203496A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022124302A1 (ko) * 2020-12-08 2022-06-16
JP7370121B2 (ja) 2021-05-25 2023-10-27 Spiber株式会社 プラスミドの製造方法及びプラスミド
TW202400802A (zh) * 2022-05-02 2024-01-01 日商新博基股份有限公司 源自病毒之構築物質體
WO2023214578A1 (ja) * 2022-05-02 2023-11-09 株式会社シンプロジェン ウイルス由来構築物プラスミドライブラリーおよびその構築
WO2024024966A1 (ja) * 2022-07-29 2024-02-01 国立大学法人神戸大学 ペプチド合成酵素ライブラリー構築法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129654A (ja) 2002-09-19 2004-04-30 Mitsubishi Chemicals Corp 挿入dnaユニットを含むプラスミドの製造方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1157131A2 (en) * 1999-02-22 2001-11-28 Lynx Therapeutics, Inc. Polymorphic dna fragments and uses thereof
GB9913694D0 (en) * 1999-06-11 1999-08-11 Simper Adrian M DNA manipulation methods and applications for synthetic enzymes
US6828098B2 (en) * 2000-05-20 2004-12-07 The Regents Of The University Of Michigan Method of producing a DNA library using positional amplification based on the use of adaptors and nick translation
GB0019049D0 (en) * 2000-08-04 2000-09-27 Neutec Pharma Plc Combinatorial chemistry method
CN1511948A (zh) * 2002-12-30 2004-07-14 中国科学院遗传与发育生物学研究所 一种构建基因组文库的方法
MX2011005195A (es) * 2008-11-19 2011-09-01 Amyris Inc Composiciones y metodos para el ensamblaje de polinucleotidos.
CN101550605B (zh) * 2009-05-15 2012-04-18 江南大学 一种基于体内同源重组构建酵母整合型基因突变文库的方法
CN101619323B (zh) * 2009-08-14 2011-01-05 中国人民解放军军事医学科学院生物工程研究所 Dna分子片段与载体连接的方法及在大容量抗体库构建中的应用
CN102533738B (zh) * 2012-03-15 2013-07-31 田敬东 一种基因合成方法、基因芯片及试剂盒
CN103088434B (zh) * 2012-11-23 2014-06-04 江南大学 树干毕赤酵母大片段dna基因组文库的构建方法及其应用
CN104232676B (zh) * 2013-06-09 2018-08-07 上海市儿童医院 一种获得微环dna的亲本质粒及其应用
US10655133B2 (en) * 2014-01-21 2020-05-19 Synplogen Co., Ltd. Method for preparing DNA unit composition, and method for creating concatenated DNA

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129654A (ja) 2002-09-19 2004-04-30 Mitsubishi Chemicals Corp 挿入dnaユニットを含むプラスミドの製造方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
de Kok, S. et al. ACS Synth. Biol., 2014
Engler, C. et al. PLoS ONE, 2008
Gibson, D. G., et al. Nat. Methods, 6, 343-345., 2009
Gibson, D. G., et al. Proc. Nat.Acad. Sci. USA 6, 105, 20404-20409, 2008
Li MZ, Elledge SJ, Nature Methods 4:251-256, 2007
Tsuge, K., et al., Nucleic Acids Res. 31, e133, 2003

Also Published As

Publication number Publication date
EA202192652A1 (ru) 2022-01-12
JP2022132307A (ja) 2022-09-08
EP3951028A1 (en) 2022-02-09
SG11202110872XA (en) 2021-10-28
JPWO2020203496A1 (ko) 2020-10-08
US20230272369A1 (en) 2023-08-31
IL286823A (en) 2021-12-01
EP3951028A4 (en) 2023-01-18
US11643648B2 (en) 2023-05-09
JP7101431B2 (ja) 2022-07-15
US20220177871A1 (en) 2022-06-09
CN113728130A (zh) 2021-11-30
AU2020254537A1 (en) 2021-11-18
WO2020203496A1 (ja) 2020-10-08
CA3135856A1 (en) 2020-10-08

Similar Documents

Publication Publication Date Title
KR20210144816A (ko) 키메라 플라스미드 라이브러리의 구축 방법
KR101511639B1 (ko) 재조합 미생물 및 이의 사용 방법
CN107828671B (zh) 用于生产3-羟基丙酸的组合物和方法
DK2630247T3 (en) PREPARATION OF BUTANOL FROM CARBON MONOXIDE BY A RECOMBINANT MICROORGANISM
KR102121886B1 (ko) 재조합 미생물 및 이의 용도
KR102056250B1 (ko) 재조합 세포, 및 이소프렌의 생산 방법
KR20150132310A (ko) 아세틸-코엔자임 a 유래 화합물을 생산하기 위한 포스포케톨라제 및 포스포트랜스아세틸라제의 용도
CN107406821B (zh) 用于生产3-羟基丙酸的突变宿主细胞
KR20210018219A (ko) 발효 및 생산 중 곰팡이 형태를 제어하기 위한 신호 전달에 포함된 유전자의 조작
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
CN116368233A (zh) 通过发酵生产4-氨基苯乙胺的工程化生物合成途径
KR20200010285A (ko) 증가된 nadph를 유도하는 생합성 경로의 게놈 공학
CN114958627A (zh) 一株高产生育酚的重组裂殖壶菌工程菌的构建方法及应用
CN110195075B (zh) 一种链球菌基因诱导表达系统及其应用
KR102308556B1 (ko) 변경된 일산화탄소 탈수소효소(codh) 활성을 가지는 유전자 조작된 박테리아
KR102320074B1 (ko) 재조합 미생물의 생산 방법
KR101534221B1 (ko) (a) wabG 유전자가 불활성화 되어 있고 (b) budR 유전자가 과발현된 2,3-부탄다이올 생산용 재조합 균주
KR101249460B1 (ko) 젖산균으로부터 유래된 신규 플라스미드 및 이를 포함하는 젖산균-대장균 셔틀 벡터
KR20200023450A (ko) 기능적 dna 서열의 안정화된 카피 수를 갖는 미생물 및 관련 방법
KR20110118554A (ko) 에탄올―저항성 효모 균주 및 이의 유전자
CN109689871B (zh) 突变丝状菌和使用其制造c4二羧酸的方法
WO2016016805A1 (en) Gene construct for the transformation of yeast strains
Ganesan Developing Next-Generation Tools for Metabolic Engineering in Non-conventional Yeast Yarrowia lipolytica
CN113677795A (zh) 新型dahp合成酶
JP5963538B2 (ja) モーレラ属細菌の遺伝子組換え法