KR20100118973A - 이소프렌을 생성하기 위한 조성물 및 방법 - Google Patents

이소프렌을 생성하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20100118973A
KR20100118973A KR1020107015437A KR20107015437A KR20100118973A KR 20100118973 A KR20100118973 A KR 20100118973A KR 1020107015437 A KR1020107015437 A KR 1020107015437A KR 20107015437 A KR20107015437 A KR 20107015437A KR 20100118973 A KR20100118973 A KR 20100118973A
Authority
KR
South Korea
Prior art keywords
isoprene
cell
cells
polypeptide
hour
Prior art date
Application number
KR1020107015437A
Other languages
English (en)
Inventor
마게리트 커빈
그레고리 엠 화이티드
고팔 케이 초타니
페르난도 발레
캐롤 피오레시
칼 제이 산포드
조셉 씨 매콜리프
프랭크 제이 페헤르
아론 에스 푸하라
안드레이 미아스니코브
일라나 에스 알도르
두카 리차드 제이 라
Original Assignee
다니스코 유에스 인크.
더 굿이어 타이어 앤드 러버 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니스코 유에스 인크., 더 굿이어 타이어 앤드 러버 캄파니 filed Critical 다니스코 유에스 인크.
Publication of KR20100118973A publication Critical patent/KR20100118973A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1229Phosphotransferases with a phosphate group as acceptor (2.7.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01009Acetyl-CoA C-acetyltransferase (2.3.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01036Mevalonate kinase (2.7.1.36)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01033Diphosphomevalonate decarboxylase (4.1.1.33), i.e. mevalonate-pyrophosphate decarboxylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03027Isoprene synthase (4.2.3.27)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/03Intramolecular oxidoreductases (5.3) transposing C=C bonds (5.3.3)
    • C12Y503/03002Isopentenyl-diphosphate DELTA-isomerase (5.3.3.2)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel

Abstract

본 발명은 배양된 세포로부터 이소프렌을 생성하는 방법을 특징으로 한다. 본 발명은 또한 이들 배양된 세포를 포함하는 조성물을 제공한다.

Description

이소프렌을 생성하기 위한 조성물 및 방법 {COMPOSITIONS AND METHODS FOR PRODUCING ISOPRENE}
관련 출원에 대한 교차 참조
본 출원은 2007년 12월 13일에 출원한 미국 가출원 제 61/013,574 호에 대해 우선권을 주장한다. 상기 출원의 본문은 그 전문이 본원에 참고문헌으로 포함된다.
본 발명은 일반적으로, 배양된 세포에서 이소프렌을 생성하기 위한 방법 및 이러한 배양된 세포를 포함하는 조성물에 관한 것이다.
이소프렌 (2-메틸-1,3-부타디엔)은 다양한 합성 중합체, 가장 특히 합성 고무에 대한 중요한 출발 물질이다. 이소프렌은 다양한 미생물, 식물 및 동물 종류에 의해 자연적으로 생성된다. 특히, 이소프렌의 생합성에 대한 두 가지 경로가 확인되었다: 메발로네이트 (MVA) 경로 및 비-메발로네이트 (DXP) 경로 (도 19A 및 19B). 그러나, 자연 발생적 유기체로부터의 이소프렌의 수율은 상업적으로 주목받지 못하고 있다. 1년 당 약 800,000 톤의 시스-폴리이소프렌이 이소프렌의 중합에서 생성되며; 이러한 폴리이소프렌의 대부분은 타이어 및 고무 산업에서 사용된다. 이소프렌은 또한 신발류, 기계 제품, 의료 제품, 스포츠 상품 및 라텍스와 같은 기타 제품에서 합성 엘라스토머로서 사용하기 위해 공중합된다.
최근, 타이어 및 고무 산업은 천연 및 합성 고무의 사용을 바탕으로 한다. 천연 고무는 고무 나무 또는 아프리카의 열대 우림에서 발견되는 식물의 유액성 즙에서 수득된다. 합성 고무는 주로 부타디엔 중합체를 기초로 한다. 이들 중합체에 대하여, 부타디엔은 에틸렌 및 프로필렌 제조로부터 공동-생성물로서 수득된다.
이소프렌이 석유 분류에 의해 수득될 수 있는 한편, 이러한 물질의 정제는 값이 비싸고 시간 소비적이다. 탄화수소의 C5 스트림의 석유 크래킹은 단지 약 15% 이소프렌을 생성해낸다. 따라서, 이소프렌을 생성하기 위한 보다 경제적인 방법이 필요하다. 특히, 확고한 상업적 공정의 요구를 충족하기에 충분한 속도, 역가 및 순도로 이소프렌을 생성하는 방법이 바람직하다. 또한, 비싸지 않은 출발 물질로부터 이소프렌을 생성하기 위한 시스템이 바람직하다.
발명의 요약
한 측면에서는, 본 발명은 이소프렌을 생성하는 배양물 내 세포를 특징으로 한다. 일부 구현예에서는, 본 발명은 이소프렌의 세포/시간의 습식 중량에 대해 약 400 nmol 초과의 이소프렌/세포 g을 생성하는 (nmol/gwcm/시간) 배양물 내 세포를 제공한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 (biomass) 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
일부 구현예에서는, 본 발명은 약 0.1 mg/L브로쓰/시간 초과의, 이소프렌의 평균 체적 생산성을 갖는 배양물 내 세포를 제공한다. 일부 구현예에서는, 본 발명은 약 0.5 mg/L브로쓰/시간 초과의, 이소프렌의 피크 체적 생산성을 갖는 배양물 내 세포를 제공한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
일부 구현예에서는, 본 발명은 세포 배양 배지에서 약 0.002% 초과의 탄소를 이소프렌으로 변환시키는 배양물 내 세포를 제공한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
일부 구현예에서는, 본 발명은 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 배양물 내 세포를 제공한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
한 측면에서는, 본 발명은 본원에서 이소프렌을 생성하기 위해 기재된 임의 세포를 사용하는 방법과 같은, 이소프렌을 생성하는 방법을 특징으로 한다. 일부 구현예에서는, 상기 방법은 약 400 nmol/gwcm/시간 초과의 이소프렌을 생성하기에 충분한 조건 하에서 세포를 배양하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 또한 세포에 의해 생성된 이소프렌을 회수하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 세포에 의해 생성된 이소프렌을 정제하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 이소프렌을 중합하는 것을 포함한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
한 측면에서는, 본 발명은 본원에서 이소프렌을 생성하기 위해 기재된 임의 세포를 사용하는 방법과 같은, 이소프렌을 생성하는 방법을 특징으로 한다. 일부 구현예에서는, 상기 방법은 약 0.1 mg/L브로쓰/시간 초과의, 이소프렌의 평균 체적 생산성을 야기하는 조건 하에 세포를 배양하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 약 0.5 mg/L브로쓰/시간 초과의, 이소프렌의 피크 체적 생산성을 야기하는 조건 하에 세포를 배양하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 또한 세포에 의해 생성된 이소프렌을 회수하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 세포에 의해 생성된 이소프렌을 정제하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 이소프렌을 중합하는 것을 포함한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
일부 구현예에서는, 상기 방법은 세포 배양 배지에서 약 0.002% 초과의 탄소를 이소프렌으로 변환시키기에 충분한 조건 하에 세포를 배양하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 또한 세포에 의해 생성된 이소프렌을 회수하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 세포에 의해 생성된 이소프렌을 정제하는 것을 포함한다. 일부 구현예에서는, 상기 방법은 이소프렌을 중합하는 것을 포함한다. 일부 구현예에서는, 세포는 (i) 이소프렌 신타아제 폴리펩티드를 인코딩하고 (ii) 프로모터에 작동가능하게 연결되는 이종 핵산을 갖는다. 일부 구현예에서는, 세포는 비제한적으로 탄수화물 (예를 들어, 자일로오스 또는 글루코오스), 아세테이트, 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원 (예를 들어, 가수분해된 바이오매스 탄소원), 폴리펩티드 (예를 들어, 미생물 또는 식물 단백질 또는 펩티드), 효모 추출물, 효모 추출물로부터의 성분, 또는 전술한 것 중 둘 이상의 임의 조합과 같은 탄소원을 포함하는 배양 배지에서 배양된다.
본 발명의 임의의 측면의 일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 12,500, 20,000, 30,000, 40,000, 50,000, 75,000, 100,000, 125,000, 150,000, 188,000 nmol/gwcm/시간 이상으로 이소프렌을 생성한다. 일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 0.1, 1.0, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1100, 1200, 1300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,100, 2,200, 2,300, 2,400, 2,500, 2,600, 2,700, 2,800, 2,900, 3,000, 3,100, 3,200, 3,300, 3,400, 3,500 이상의 이소프렌 mg/브로쓰 L/시간 (mg/L브로쓰/시간, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)의, 이소프렌의 평균 체적 생산성을 갖는다. 일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 0.5, 1.0, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1100, 1200, 1300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,100, 2,200, 2,300, 2,400, 2,500, 2,600, 2,700, 2,800, 2,900, 3,000, 3,100, 3,200, 3,300, 3,400, 3,500, 3,750, 4,000, 4,250, 4,500, 4,750, 5,000, 5,250, 5,500, 5,750, 6,000, 6,250, 6,500, 6,750, 7,000, 7,250, 7,500, 7,750, 8,000, 8,250, 8,500, 8,750, 9,000, 9,250, 9,500, 9,750, 10,000, 12,500, 15,000 이상의 이소프렌 mg/브로쓰 L/시간 (mg/L브로쓰/시간, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)의, 이소프렌의 피크 체적 생산성을 갖는다. 본 발명의 임의 측면의 일부 구현예에서는, 배양물 내 세포는 세포 배양 배지에서 초과로 또는 약 0.002, 0.005, 0.01, 0.02, 0.05, 0.1, 0.12, 0.14, 0.16, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.4, 1.6, 2.0, 2.2, 2.4, 2.6, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 23.2, 23.4, 23.6, 23.8, 24.0, 25.0, 30.0, 31.0, 32.0, 33.0, 35.0, 37.5, 40.0, 45.0, 47.5, 50.0, 55.0, 60.0, 65.0, 70.0, 75.0, 80.0, 85.0, 90.0 몰% 이상의 탄소를 이소프렌으로 변환시킨다. 본 발명의 임의 측면의 일부 구현예에서는, 배양물 내 세포는 세포/시간의 습식 중량에 대해 초과로 또는 약 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 100,000 이상의 이소프렌 ng/세포 g (ng/gwcm/시간)으로 이소프렌을 생성한다. 본 발명의 임의 측면의 일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 50,000, 100,000 이상의 이소프렌 mg/브로쓰 L (mg/L브로쓰, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)로 이소프렌의 누적 역가 (총량)를 생성한다. 이소프렌 생성의 기타 예시적 속도 및 이소프렌 생성의 총량은 본원에 개시된다.
본 발명의 임의 측면의 일부 구현예에서는, 세포는 IDI 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 IDI 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 DXS 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, DXS 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 한 핵산은 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩한다. 본 발명의 임의 측면의 일부 구현예에서는, 한 벡터는 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩한다. 일부 구현예에서는, 상기 벡터는 항생제 내성 핵산과 같은 선택 마커를 포함한다.
본 발명의 임의 측면의 일부 구현예에서는, 이종 이소프렌 신타아제 핵산은 중간 또는 높은 카피 플라스미드에 포함된 T7 프로모터와 같은 T7 프로모터에 작동가능하게 연결된다. 본 발명의 임의 측면의 일부 구현예에서는, 이종 이소프렌 신타아제 핵산은 중간 또는 높은 카피 플라스미드에 포함된 Trc 프로모터와 같은 Trc 프로모터에 작동가능하게 연결된다. 본 발명의 임의 측면의 일부 구현예에서는, 이종 이소프렌 신타아제 핵산은 낮은 카피 플라스미드에 포함된 Lac 프로모터와 같은 Lac 프로모터에 작동가능하게 연결된다. 본 발명의 임의 측면의 일부 구현예에서는, 이종 이소프렌 신타아제 핵산은 내인성 알칼리 세린 프로테아제 프로모터와 같은 내인성 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, 이종 이소프렌 신타아제 핵산이 선택 마커 없이 세포의 염색체에 융합된다.
본 발명의 임의 측면의 일부 구현예에서는, 적어도 일부의 세포가 연속 배양 (희석하지 않는 연속 배양과 같은)에서 이종 이소프렌 신타아제 핵산을 적어도 또는 약 5, 10, 20, 40, 50, 60, 65회 이상의 세포 분열 동안 유지시킨다. 본 발명의 임의 측면의 일부 구현예에서는, 이소프렌 신타아제, IDI 또는 DXS 핵산을 포함하는 핵산은 또한 항생제 내성 핵산과 같은 선택 마커를 포함한다.
본 발명의 임의 측면의 일부 구현예에서는, 세포는 MVA 경로 폴리펩티드 (사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 메타노사르키나 마제이 (Methanosarcina mazei) 또는 엔테로코쿠스 파에칼리스 (Enterococcus faecalis)로부터의 MVA 경로 폴리펩티드와 같은)를 인코딩하는 이종 핵산을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 MVA 경로 폴리펩티드 (사카로마이세스 세레비지에, 메타노사르키나 마제이 또는 엔테로코쿠스 파에칼리스로부터의 MVA 경로 폴리펩티드와 같은)를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 이소프렌 신타아제, DXS 및 MVA 경로 핵산을 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 이소프렌 신타아제 핵산, DXS 핵산, IDI 핵산 및 MVA 경로 핵산 (IDI 핵산에 추가로)을 포함한다.
본 발명의 임의 측면의 일부 구현예에서는, 이소프렌 신타아제 폴리펩티드는 푸에라리아 (Pueraria) (예를 들어, 푸에라리아 몬타나 (Pueraria montana)) 또는 포풀루스 (Populus) (예를 들어, 포풀루스 트레물로이데스 (Populus tremuloides), 포풀루스 알바 (Populus alba (P. alba)), 포풀루스 니그라 (Populus nigra), 포풀루스 트리코카르파 (Populus trichocarpa) 또는 하이브리드, 포풀루스 알바 x 포풀루스 트레물라 (Populus tremula))와 같은 식물로부터의 자연 발생적 폴리펩티드이다.
본 발명의 임의 측면의 일부 구현예에서는, 세포는 그람-양성 세균 세포(예를 들어, 바실러스 서브틸리스 (Bacillus subtilis) 세포와 같은 바실러스 세포, 또는 스트렙토마이세스 리비단스 (Streptomyces lividans), 스트렙토마이세스 코에리콜로르 (Streptomyces coelicolor), 스트렙토마이세스 알부스 (Streptomyces albus) 또는 스트렙토마이세스 그리세우스 (Streptomyces griseus) 세포와 같은 스트렙토마이세스 세포)와 같은 세균 세포이다. 본 발명의 임의 측면의 일부 구현예에서는, 세포는 그람-음성 세균 세포 (예를 들어, 에스케리키아 콜리 (Escherichia coli, 대장균) 세포와 같은 에스케리키아 세포, 또는 판토에아 시트레아 (Pantoea citrea) 세포와 같은 판토에아 세포)이다. 일부 구현예에서는, 대장균 세포는 대장균 FadR atoC 돌연변이체 세포이다. 일부 구현예에서는, 대장균 세포는 ybhE (또한 pgl로서 알려짐)를 발현한다 (예를 들어 항시적으로 발현). 본 발명의 임의 측면의 일부 구현예에서는, 세포는 필라멘트성 진균 세포 (예를 들어, 트리코데르마 레에세이 (Trichoderma reesei) 세포와 같은 트리코데르마 세포, 또는 아스페르길루스 오리자에 (Aspergillus oryzae) 및 아스페르길루스 니게르 (Aspergillus niger)와 같은 아스페르길루스 세포) 또는 효모 세포 (예를 들어, 야로위야 리포리티카 (Yarrowia lipolytica) 세포와 같은 야로위야 세포)와 같은 진균 세포이다.
본 발명의 임의 측면의 일부 구현예에서는, 미생물 폴리펩티드 탄소원은 효모 또는 세균으로부터의 하나 이상의 폴리펩티드를 포함한다. 본 발명의 임의 측면의 일부 구현예에서는, 식물 폴리펩티드 탄소원은 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵 (palm kernel), 올리브, 잇꽃, 참깨 또는 아마인으로부터의 하나 이상의 폴리펩티드를 포함한다.
한 측면에서는, 본 발명은 폴리이소프렌을 포함하는 타이어를 제공한다. 일부 구현예에서는, 폴리이소프렌은 (i) 본원에 기재된 임의의 조성물 또는 방법으로부터 이소프렌을 중합하거나 (ii) 본원에 기재된 임의의 조성물 또는 방법에서 회수된 이소프렌을 중합하여 생성된다. 일부 구현예에서는, 폴리이소프렌은 시스-1,4-폴리이소프렌을 포함한다.
한 측면에서는, 본 발명은 본 발명의 임의의 조성물 또는 방법에 의해 제조된 생성물 (예를 들어 타이어)을 특징으로 한다.
본원에 기재된 다양한 구현예의 특성 중 하나, 일부 또는 전부가 조합되어 본 발명의 다른 구현예를 형성할 수 있음이 이해될 것이다. 본 발명의 이러한 측면 및 기타 측면은 당업자에게 명백할 것이다.
발명의 상세한 설명
본 발명은 증가된 양의 이소프렌의 생성을 위한 방법 및 조성물을 특징으로 한다. 특히, 이들 조성물 및 방법은 이소프렌 생성 속도를 증가시키고, 생성된 이소프렌의 총량을 증가시킨다. 예를 들어, 4.8 x 104 nmol/gwcm/시간의 이소프렌을 생성하는 세포 배양 시스템이 만들어졌다 (표 1). 이들 시스템의 효율은 세포 배양 배지로부터 세포가 소비하는 탄소의 약 23.6 몰% 수율 (10.7 중량% 수율)의 이소프렌으로의 변환 (탄소 수율%)에 의해 입증된다. 실시예 및 표 2에서 나타내는 바와 같이, 브로쓰 ℓ 당 약 60.5 g의 이소프렌이 발생되었다. 이소프렌은 1.88 x 105 nmol/OD/시간의 피크 특이적 속도 (1.88 x 105 nmol/gwcm/시간)에서 생성되었다. 필요하다면, 본원에 기재된 것들과 같은 다른 조건을 사용하여 더 큰 양의 이소프렌을 수득할 수 있다. 일부 구현예에서는, 재생가능 탄소원이 이소프렌의 생성에 사용된다. 본 발명의 조성물 및 방법은, 세포 당 높은 이소프렌 수율, 높은 탄소 수율, 높은 이소프렌 순도, 높은 생산성, 낮은 에너지 사용, 낮은 제조 가격 및 투자 비용, 및 최소의 부반응을 허용하기 때문에 바람직하다. 이러한 이소프렌 생성을 위한 효율적이고 대규모인 생합성 공정은 합성 이소프렌계 고무에 대한 이소프렌 공급원을 제공하며, 천연 고무를 사용하는 것에 대해 바람직하고 낮은 비용 대체물을 제공한다.
하기에 추가로 토의되는 바와 같이, 세포에 의해 생성된 이소프렌의 양은 이소프렌 신타아제 폴리펩티드 (예를 들어, 식물 이소프렌 신타아제 폴리펩티드)를 인코딩하는 이종 핵산을 세포에 도입함으로써 크게 증가될 수 있다. 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP)를 이소프렌으로 변환시킨다. 실시예에서 나타내는 바와 같이, 이종 푸에라리아 몬타나 (Pueraria Montana) (쿠주) 또는 포풀루스 알바 (Populus alba) (포플러) 이소프렌 신타아제 폴리펩티드는 에스케리키아 콜리 (Escherichia coli, 대장균), 판토에아 시트레아 (Pantoea citrea), 바실러스 서브틸리스 (Bacillus subtilis), 야로위야 리포리티카 (Yarrowia lipolytica) 및 트리코데르마 레에세이 (Trichoderma reesei)와 같은 다양한 숙주 세포에서 발현되었다. 실시예에서 나타내는 바와 같이, 이종 메타노사르키나 마제이 (Methanosarcina mazei) (M. 마제이) 메발로네이트 키나아제 (MVK)는 대장균과 같은 숙주 세포에서 발현되어 이소프렌 생성을 증가시켰다. 이들 세포 모두는 이종 이소프렌 신타아제 폴리펩티드를 갖지 않는 상응하는 세포들보다 더 많은 이소프렌을 생성하였다. 표 1 및 2에서 설명하는 바와 같이, 본원에서 기재된 방법을 사용하여 다량의 이소프렌이 생성된다. 예를 들어, 이종 이소프렌 신타아제 핵산을 갖는 B. 서브틸리스 세포는 이종 핵산을 갖지 않는 상응하는 대조군 B. 서브틸리스 세포보다 14ℓ 발효기에서 약 10배 더 많은 이소프렌을 생성한다 (표 2). 발효기 내에서 대장균에 의한 브로쓰의 ℓ 당 이소프렌 (mg/L, 브로쓰의 부피에는 세포의 부피 및 세포 배지의 부피가 모두 포함됨) 60.5 g, 및 B. 서브틸리스에 의한 30 mg/L의 생성은 유의한 양의 이소프렌이 생성될 수 있다는 것을 나타낸다 (표 2). 필요하다면, 이소프렌의 양을 추가적으로 증가시키는데 사용될 수 있는 본원에 기재된 다른 조건 또는 보다 더 큰 규모에서 이소프렌을 생성할 수 있다. 벡터를 표 1 및 2에 열거하고, 실험적 조건을 하기 및 실시예 부분에서 보다 상세히 기재한다.
표 1: 본 발명의 방법 및 세포 배양물을 사용하는 진탕 플라스크로부터의 이소프렌의 예시적 수율
이소프렌 생성을 측정하기 위한 검정법을 실시예 1, II 부분에서 기재한다. 상기 검정을 위해, 진탕 플라스크로부터 하나 이상의 시간 지점에서 샘플을 제거하고 30분 동안 배양하였다. 상기 샘플에서 생성된 이소프렌의 양을 이후 측정하였다. 이소프렌 생성의 특이적 속도 및 상부공간 농도를 표 1에 열거하고 본원에서 추가적으로 기재한다.
[표 1]
Figure pct00001
* 1:19의 액체 대 상부공간 부피 비율로 밀봉 상부공간 바이알에서 1시간 동안 배양된, 1의 OD60O의 1 ㎖에 대해 정상화됨.
표 2: 본 발명의 방법 및 세포 배양물을 사용하는 발효기에서의 이소프렌의 예시적 수율
이소프렌 생성을 측정하기 위한 검정법을 실시예 1, II 부분에서 기재한다. 상기 검정을 위해, 발효기의 배출 기체 (off-gas) 샘플을 취하고 이소프렌의 양에 대해 분석하였다. 피크 상부공간 농도 (발효 동안 가장 높은 상부공간 농도), 역가 (브로쓰의 ℓ 당 생성된 이소프렌의 누적 총량) 및 이소프렌 생성의 피크 특이적 속도 (발효 동안 가장 높은 특이적 속도)를 표 2에 열거하고 본원에서 추가적으로 기재한다.
[표 2]
Figure pct00002
**1 vvm (분 당 1 L브로쓰 당 1 부피 배출 기체)의 배출 기체 유속에 대해 정상화됨.
추가적으로, 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌 생성은 세포에 의해 발현되는 1-데옥시-D-자일루로오스-5-포스페이트 신타아제 (DXS) 폴리펩티드 및/또는 이소펜테닐 디포스페이트 이성화효소 (IDI) 폴리펩티드의 양을 증가시킴으로써 증강될 수 있다. 예를 들어 DXS 핵산 및/또는 IDI 핵산은 세포에 도입될 수 있다. DXS 핵산은 이종 핵산, 또는 내인성 핵산의 이중 카피일 수 있다. 유사하게, IDI 핵산은 이종 핵산, 또는 내인성 핵산의 이중 카피일 수 있다. 일부 구현예에서는, DXS 및/또는 IDI 폴리펩티드의 양은 내인성 DXS 및/또는 IDI 프로모터 또는 조절 부위를 DXS 및/또는 IDI 핵산의 더 큰 전사를 야기하는 다른 프로모터 및/또는 조절 부위로 대체함으로써 증가된다. 일부 구현예에서는, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예를 들어 식물 이소프렌 신타아제 핵산) 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 이중 카피를 모두 함유한다.
인코딩된 DXS 및 IDI 폴리펩티드는 이소프렌의 생합성을 위한 DXP 경로의 일부이다 (도 19A). DXS 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일루로오스-5-포스페이트로 변환시킨다. 어떠한 특정 이론에도 얽매이지 않는 것으로 의도되지만, DXS 폴리펩티드의 양을 증가시키는 것은 DXP 경로를 통한 탄소의 흐름을 증가시켜 더 많은 이소프렌 생성을 야기하는 것으로 믿어진다. IDI 폴리펩티드는 이소펜테닐 디포스페이트 (IPP) 및 디메틸 알릴 디포스페이트 (DMAPP)의 상호변환을 촉진한다. 어떠한 특정 이론에도 얽매이지 않는 것으로 의도되지만, 세포 내의 IDI 폴리펩티드의 양을 증가시키는 것은 IPP의 양을 증가시켜 이는 DMAPP로 변환되고, 다음에는 이소프렌으로 변환되는 것으로 믿어진다.
예를 들어, 쿠주 (kudzu) 이소프렌 신타아제, S. 세레비지에 (S. cerevisiae) IDI, 및 대장균 DXS 핵산을 갖는 대장균 세포의 발효가 이소프렌을 생성하는데 사용된다. 이소프렌의 수준은 15시간의 기간에 걸쳐 50 내지 300 ㎍/L로 가변적이다 (실시예 7, VII 부분). 또 다른 예로서, M. 마제이 메발로네이트 키나아제 (MVK), P. 알바 이소프렌 신타아제, 상위 MVA 경로 및 융합된 하위 MVA 경로를 갖는 대장균 세포의 발효가 이소프렌을 생성하는데 사용된다. 이소프렌의 수준은 67시간의 기간에 걸쳐 32 내지 35.6 g/L로 가변적이다 (실시예 10, III 부분).
또 다른 예에서, M. 마제이 메발로네이트 키나아제 (MVK), P. 알바 이소프렌 신타아제, pgl 과발현 (RHM111608-2), 상위 MVA 경로 및 융합된 하위 MVA 경로를 갖는 대장균의 발효가 이소프렌을 생성하는데 사용된다. 이소프렌의 수준은 40시간의 기간에 걸쳐 33.2 g/L 내지 40.0 g/L, 또는 59시간의 기간에 걸쳐 48.6 g/L 내지 60.5 g/L로 가변적이다 (실시예 13, (ii) 부분).
일부 구현예에서는, 이종 또는 특별 내인성 이소프렌 신타아제, IDI 및 DXS 핵산의 존재는 세포가 오직 하나 또는 둘의 이들 이종 또는 특별 내인성 핵산을 갖는 상응하는 세포와 비교하여 보다 재생가능하게 성장하거나 더 길게 생존하도록 유발한다. 예를 들어 이종 이소프렌 신타아제, IDI 및 DXS 핵산을 함유하는 세포는 오직 이종 이소프렌 신타아제 및 DXS 핵산을 갖거나 오직 이종 이소프렌 신타아제 핵산만을 갖는 세포보다 더 양호하게 성장한다. 또한 이종 이소프렌 신타아제, IDI 및 DXS 핵산은 세포에 과량의 독성을 일으키지 않고 세포에서 발현될 수 있는 다량의 폴리펩티드를 제시하는, 대장균에서 유지된 높은 카피 플라스미드 상의 강력한 프로모터에 성공적으로 작동가능하게 연결된다. 특정 이론에 얽매이지 않는 것으로 의도되지만, 이종 또는 특별 내인성 이소프렌 신타아제 및 IDI 핵산의 존재는 이종 또는 특별 내인성 DXS 핵산이 세포 내에 존재하기만 한다면 축적되는 하나 이상의 잠재적 독성 중간체의 양을 감소시킬 수 있는 것으로 믿어진다.
일부 구현예에서는, 이종 이소프렌 신타아제 핵산을 함유하는 세포에 의한 이소프렌의 생성은 세포에 의해 발현되는 MVA 폴리펩티드의 양을 증가시킴으로써 증대된다 (도 19A 및 19B). 예시적 MVA 경로 폴리펩티드는 하기 폴리펩티드 중 임의의 것을 포함한다: 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-하이드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-하이드록시-3-메틸글루타릴-CoA 환원효소 (HMG-CoA 환원효소) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, 포스포메발로네이트 데카르복실라아제 (PMDC) 폴리펩티드, 이소펜테닐 포스페이트 키나아제 (IPK) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예를 들어, 융합 폴리펩티드). 예를 들어, 하나 이상의 MVA 경로 핵산이 세포에 도입될 수 있다. 일부 구현예에서는, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제 및 HMG-CoA 환원효소 핵산을 포함하는 상위 MVA 경로를 함유한다. 일부 구현예에서는, 세포는 MVK, PMK, MVD 및 IDI 핵산을 포함하는 하위 MVA 경로를 함유한다. 일부 구현예에서는, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, HMG-CoA 환원효소, MVK, PMK, MVD 및 IDI 핵산을 포함하는 전체 MVA 경로를 함유한다. 일부 구현예에서는, 세포는 AA-CoA 티올라아제, HMG-CoA 신타아제, HMG-CoA 환원효소, MVK, PMDC, IPK 및 IDI 핵산을 포함하는 전체 MVA 경로를 함유한다. MVA 경로 핵산은 이종 핵산, 또는 내인성 핵산의 이중 카피일 수 있다. 일부 구현예에서는, 하나 이상의 MVA 경로 폴리펩티드는 MVA 경로 핵산에 대한 내인성 프로모터 또는 조절 부위를 MVA 경로 핵산의 더 큰 전사를 야기하는 다른 프로모터 및/또는 조절 부위로 대체함으로써 증가된다. 일부 구현예에서는, 세포는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산 (예를 들어 식물 이소프렌 신타아제 핵산), 및 이소프렌 신타아제 폴리펩티드를 인코딩하는 내인성 핵산의 이중 카피를 모두 함유한다.
예를 들어, 쿠주 이소프렌 신타아제 폴리펩티드를 인코딩하는 핵산 및 사카로마이세스 세레비지에 MVK, PMK, MVD 및 IDI 폴리펩티드를 인코딩하는 핵산을 함유하는 대장균 세포는 6.67 x 104 nmol/L브로쓰/OD600/시간의 속도로 이소프렌을 생성한다 (실시예 8 참조). 추가적으로, 엔테로코쿠스 파에칼리스 (Enterococcus faecalis) AA-CoA 티올라아제, HMG-CoA 신타아제 및 HMG-CoA 환원효소 폴리펩티드를 인코딩하는 핵산을 갖는 대장균 세포의 14ℓ 발효로 22 g의 메발론산 (MVA 경로의 중간체)이 생성된다. 이들 세포의 진탕 플라스크에서 ℓ 당 2~4 g의 메발론산이 생성된다. 이들 결과는 이종 MVA 경로 핵산이 대장균에서 활성이라는 것을 나타낸다. 상위 MVA 경로 및 하위 MVA 경로 뿐 아니라 쿠주 이소프렌 신타아제를 모두 함유하는 대장균 세포 (균주 MCM 127)는 오직 하위 MVA 경로 및 쿠주 이소프렌 신타아제에 대한 핵산만을 갖는 대장균 (균주 MCM 131)에 비해 유의하게 더 많은 이소프렌 (874 ㎍/L브로쓰/시간/OD)을 생성한다 (표 3 및 실시예 8, VIII 부분 참조).
또 다른 예로서, P. 알바 이소프렌 신타아제 폴리펩티드를 인코딩하는 핵산 및 M. 마제이 MVK 폴리펩티드를 인코딩하는 핵산을 함유하는 대장균 세포는 효모 추출물의 공급 없이 67시간 발효 동안 320.6 g (9.54 x 104 nmol/L브로쓰/OD600/시간의 피크 특이적 속도에서 (즉 9.5 x 10-5 mol/L브로쓰/OD600/시간))의 이소프렌을 생성하거나, 효모 추출물을 공급하여 68시간 발효 동안 395.5 g (8.66 x 104 nmol/L브로쓰/OD600/시간의 피크 특이적 속도에서)의 이소프렌을 생성한다 (실시예 10 참조).
일부 구현예에서는, 세포의 적어도 일부는 연속 배양 (예를 들어 희석하지 않는 연속 배양)에서 이종 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산을 약 5, 10, 20, 50, 75, 100, 200, 300회 이상의 세포 분열 동안 유지한다. 본 발명의 임의 측면의 일부 구현예에서는, 이종 또는 내인성 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산의 이중 카피를 포함하는 핵산은 또한 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그로마이신, 플레오마이신, 블레오마이신, 네오마이신, 또는 클로람페니콜 항생제 내성 핵산과 같은 선택 마커를 포함한다.
실시예 7, VI 부분에서 나타내는 바와 같이, 생성된 이소프렌의 양은 이소프렌이 생성되도록 쿠주 이소프렌 신타아제, S. 세레비지에 IDI 및 대장균 DXS 핵산을 갖는 대장균 세포를 사용하는 세포 배양 배지에 효모 추출물을 첨가함으로써 추가로 증가될 수 있다. 특히, 생성된 이소프렌의 양은 시험된 농도에 대한 세포 배지 내의 효모 추출물의 양에 대해 선형으로 비례한다 (도 48C). 추가적으로, 브로쓰의 ℓ 당 약 0.11 g의 이소프렌이 효모 추출물 및 글루코오스를 갖는 세포 배지에서 생성되었다 (실시예 7, VIII 부분). 글루코오스의 존재 하에 효모 추출물의 양을 증가시키는 것은, 효모 추출물의 존재 하에 글루코오스의 양을 증가시키는 것보다 더 많은 이소프렌이 생성되게 한다. 또한 효모 추출물의 양을 증가시켜, 세포가 더 긴 시간 동안 높은 수준의 이소프렌을 생성하게 하고 세포의 건강이 개선되게 한다.
탄소원으로서 세 가지 유형의 가수분해된 바이오매스 (바가스, 옥수수대 및 침엽수 펄프)를 사용하여 이소프렌 생성을 또한 입증한다 (도 46A~C 및 도 69A 및 69B). 쿠주 이소프렌 신타아제, S. 세레비지에 IDI 및 대장균 DXS 핵산을 갖는 대장균 세포는 동량의 글루코오스 (예를 들어 1% 글루코오스, w/v)로부터의 이소프렌 양만큼, 가수분해된 바이오매스 탄소원으로부터 이소프렌을 생성한다. P. 알바 이소프렌 신타아제 및 MVA 경로를 발현하는 대장균 세포는 동량의 글루코오스로부터보다 암모니아 섬유 팽창 (AFEX) 사전처리된 옥수수대로부터 더 높은 초기 성장 속도로 이소프렌을 생성한다 (도 69 A 및 69B). 필요하다면, 임의 다른 바이오매스 탄소원이 본 발명의 조성물 및 방법에 사용될 수 있다. 많은 통상적 세포 배지보다 더 싸고, 그에 따라 이소프렌의 경제적 제조가 촉진되기 때문에, 상기 바이오매스 탄소원이 바람직하다.
추가적으로, 반전당 (invert sugar)은 이소프렌의 생성을 위한 탄소원으로서 역할하는 것으로 나타난다 (도 47D).
추가적으로, 자일로오스, 아세테이트 및 글리세롤이 또한 이소프렌의 생성을 위한 탄소원으로서 역할하는 것으로 나타난다 (도 69A~69D). 예를 들어 유일한 탄소원으로서 아세테이트 상에서 성장한, P. 알바 이소프렌 신타아제 및 MVA 경로를 갖는 대장균 세포는 글루코오스 상에서 성장하는 동안의 약 2배 더 높은 이소프렌의 특이적 생산성을 가진다 (실시예 10, IV 부분; 도 69A 및 69B).
일부 구현예에서는, 오일이 세포 배지에 포함된다. 예를 들어, 쿠주 이소프렌 신타아제 핵산을 함유하는 B. 서브틸리스 세포는 오일 및 글루코오스의 공급원을 함유하는 세포 배지에서 배양되는 경우 이소프렌을 생성한다 (실시예 4, III 부분). 또 다른 예로서, 상위 및 하위 MVA 경로 + 쿠주 이소프렌 신타아제를 함유하는 대장균 fadR atoC 돌연변이체 세포는 야자유 및 글루코오스 공급원을 함유하는 세포 배지에서 배양되는 경우 이소프렌을 생성한다 (실시예 12, II 부분). 일부 구현예에서는, 하나 초과의 오일 (예를 들어 2, 3, 4, 5개 이상의 오일)이 세포 배지에 포함된다. 어떠한 특정 이론에도 얽매이지 않는 것으로 의도되지만, (i) 오일이 이소프렌으로의 변환에 활용가능한 세포 내의 탄소량을 증가시킬 수 있고, (ii) 오일이 세포 내의 아세틸-CoA의 양을 증가시킴으로써 MVA 통로를 통한 탄소 흐름을 증가시킬 수 있고/있거나 (iii) 오일이 세포에 여분의 영양분을 제공할 수 있다고 믿어지는데, 이는 세포 내의 많은 탄소가 다른 생성물보다는 이소프렌으로 변환되기 때문에 바람직하다. 일부 구현예에서는, 오일을 함유하는 세포 배지에서 배양되는 세포는 이소프렌이 생성되도록 자연적으로 MVA 경로를 사용하거나, 전체 MVA 통로에 대한 핵산을 함유하도록 유전적으로 변형된다. 일부 구현예에서는, 오일이 세포 배양 배지에 첨가되기 전에 부분적으로 또는 완전히 가수분해되어 숙주 세포에 의한 오일의 사용이 촉진된다.
예시적 폴리펩티드 및 핵산
다양한 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산이 본 발명의 조성물 및 방법에 사용될 수 있다.
본원에서 사용되는 바와 같이, "폴리펩티드"는 폴리펩티드, 단백질, 펩티드, 폴리펩티드의 절편, 및 제 1 폴리펩티드의 일부 또는 전부 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드) 및 제 2 폴리펩티드의 일부 또는 전부 (예를 들어 His-표지와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드)를 포함하는 융합 폴리펩티드를 포함한다. 일부 구현예에서는, 융합 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드 (AA-CoA 티올라아제 및 HMG-CoA 환원효소 폴리펩티드와 같은)의 활성을 갖는다. 일부 구현예에서는, 폴리펩티드는 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 자연 발생적 폴리펩티드 (예를 들어 엔테로코쿠스 파에칼리스 mvaE 핵산에 의해 인코딩되는 폴리펩티드)이다.
다양한 구현예에서, 폴리펩티드는 적어도 또는 약 50, 100, 150, 175, 200, 250, 300, 350, 400개 이상의 아미노산을 갖는다. 일부 구현예에서는, 폴리펩티드 절편은 전체 길이 폴리펩티드로부터 적어도 또는 약 25, 50, 75, 100, 150, 200, 300개 이상의 연속 아미노산을 함유하며, 상응하는 전체 길이 폴리펩티드의 활성의 적어도 또는 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%를 갖는다. 특정 구현예에서, 폴리펩티드는 임의 자연 발생적 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 전체 아미노산 서열 또는 단편을 포함한다. 일부 구현예에서는, 폴리펩티드는 야생형 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 서열 (즉, 자연적으로 발생하는 서열)과 비교하여 하나 이상의 돌연변이를 갖는다.
일부 구현예에서는, 폴리펩티드는 단리된 폴리펩티드이다. 본원에서 사용되는 바와 같이, "단리된 폴리펩티드"는 2, 5, 10, 20, 50개 이상의 상이한 폴리펩티드의 라이브러리와 같은 폴리펩티드의 라이브러리의 일부가 아니며, 자연적으로 발생하는 하나 이상의 성분으로부터 분리된다. 단리된 폴리펩티드는, 예를 들어 폴리펩티드를 인코딩하는 재조합 핵산의 발현에 의해 수득될 수 있다.
일부 구현예에서는, 폴리펩티드는 이종 폴리펩티드이다. "이종 폴리펩티드"는 동일한 숙주 세포에서 자연적으로 발현되는 또 다른 폴리펩티드의 서열과 아미노산 서열이 동일하지 않은 폴리펩티드를 의미한다.
본원에서 사용되는 바와 같이, "핵산"은 단일 또는 이중 가닥 형태인 둘 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드를 나타낸다. 일부 구현예에서는, 핵산은 재조합 핵산이다. "재조합 핵산"은 관심 핵산이 유래하는 유기체의 자연 발생적 게놈에서, 관심 핵산의 측면에 위치하는 하나 이상의 핵산 (예를 들어 유전자)이 없는 관심 핵산을 의미한다. 그러므로 상기 용어는 예를 들어 벡터, 자체 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA 내에 통합되거나, 다른 서열에 독립적인 별개의 분자 (예를 들어 cDNA, 게놈 DNA 절편, 또는 PCR 또는 제한 엔도뉴클레아제 소화에 의해 생성되는 cDNA 절편)로서 존재하는 재조합 DNA를 포함한다. 일부 구현예에서 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은, 또 다른 폴리펩티드의 전부 또는 일부를 인코딩하는 또 다른 핵산에 작동가능하게 연결되어, 재조합 핵산이 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 포함하는 융합 폴리펩티드, 및 또 다른 폴리펩티드 (예를 들어 His-표지와 같은, 융합 폴리펩티드의 정제 또는 검출을 촉진하는 펩티드)의 전부 또는 일부를 인코딩한다. 일부 구현예에서는, 재조합 핵산의 일부 또는 전부가 화학적으로 합성된다.
일부 구현예에서는, 핵산은 이종 핵산이다. "이종 핵산"은 동일한 숙주 세포에서 자연적으로 발견되는 또 다른 핵산의 서열과 동일하지 않은 핵산 서열의 핵산을 의미한다.
특정 구현예에서는, 핵산은 임의의 자연 발생적 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 전체 핵산 서열 또는 단편을 포함한다. 일부 구현예에서는, 핵산은 자연 발생적 이소프렌 신타아제 핵산 DXS, IDI 또는 MVA 경로 핵산으로부터 적어도 또는 약 50, 100, 150, 200, 300, 400, 500, 600, 700, 800개 이상의 연속 뉴클레오티드를 포함한다. 일부 구현예에서는, 핵산은 야생형 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 서열 (즉, 자연적으로 발생하는 서열)과 비교하여 하나 이상의 돌연변이를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 전사 또는 번역을 증가시키는 하나 이상의 돌연변이 (예를 들어 침묵 돌연변이)를 갖는다. 일부 구현예에서는, 핵산은 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 인코딩하는 임의 핵산의 변이체를 퇴화시킨다.
"코돈 퇴화성"은 인코딩된 폴리펩티드의 아미노산 서열에 영향을 주지 않고 뉴클레오티드 서열의 변이를 허용하는 유전적 코드에서의 차이 (divergence)를 나타낸다. 숙련된 기술자는 주어진 아미노산을 구체화하기 위한 뉴클레오티드 코돈의 이용에서 특정 숙주 세포에 의해 나타나는 "코돈-바이어스 (codon-bias)"를 잘 인지한다. 그러므로, 숙주 세포 내의 개선된 발현을 위해 핵산을 합성하는 경우 핵산을 설계하기 위한 일부 구현예에서 코돈 이용의 빈도가 숙주 세포의 바람직한 코돈 이용의 빈도에 도달하는 것이 바람직하다.
예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 기탁 번호를 부록 1에 열거하였다 (부록 1의 기탁 번호 및 이의 상응하는 서열은, 특히 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 아미노산 및 핵산 서열에 대해 그 전체가 본원에 참고문헌으로 포함됨). Kegg 데이터베이스는 또한 수많은 예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 아미노산 및 핵산 서열을 포함한다 (예를 들어 "www.genome.jp/kegg/pathway/map/map00100.html" 및 그의 서열 참조; 특히 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산의 아미노산 및 핵산 서열에 대해 그 전체가 본원에 참고문헌으로 포함됨). 일부 구현예에서는, 하나 이상의 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및/또는 핵산은 부록 1에서의 임의 기탁 번호 또는 Kegg 데이터베이스에 존재하는 임의 서열에 상응하는 임의의 서열과 같은 2007년 12월 12일 또는 2008년 12월 11일에 공식적으로 활용가능한 서열과 동일한 서열을 갖는다. 추가적인 예시적 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드 및 핵산은 하기에서 추가적으로 기재된다.
예시적 이소프렌 신타아제 폴리펩티드 및 핵산
상기 언급된 바와 같이, 이소프렌 신타아제 폴리펩티드는 디메틸알릴 디포스페이트 (DMAPP)를 이소프렌으로 변환시킨다. 예시적 이소프렌 신타아제 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 DMAPP를 이소프렌으로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법을 사용하여 폴리펩티드가 이소프렌 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 검정에서, 실시예 1에서 기재된 바와 같은 진탕 플라스크 방법으로 균주 (예를 들어 본원에 기재된 대장균/pTrcKudzu 균주)를 성장시켜 세포 추출물을 제조한다. 유도가 완료된 후, 약 10 ㎖의 세포를 7000 x g에서 10분 동안 원심분리하여 펠릿화시키고 글리세롤이 없는 5 ㎖의 PEB에 재현탁한다. 표준 절차를 사용하여 세포 파쇄기 (French Pressure cell)로 세포를 용해한다. 대안적으로는, -80℃에서 동결/해동 후 리소자임 (Ready-Lyse 리소자임 용액; Epicentre)으로 세포를 처리한다.
세포 추출물 내의 이소프렌 신타아제 폴리펩티드 활성은 예를 들어 [Silver 등, J. Biol. Chem. 270:13010-13016, 1995 및 그의 참고문헌 (특히 이소프렌 신타아제 폴리펩티드 활성에 대한 검정에 대해, 각각 그 전문이 참고문헌으로 포함됨)에 기재된 바와 같이 측정될 수 있다. DMAPP (Sigma)를 질소 흐름 하에 건조되도록 증발시키고, 100 mM 인산 칼륨 완충액 (pH 8.2) 중 100 mM의 농도로 재수화하고 -20℃에서 보관한다. 검정을 수행하기 위해, 5 ㎕의 1M MgCl2, 1 mM (250 ㎍/㎖) DMAPP, 65 ㎕의 식물 추출 완충액 (PEB) (50 mM Tris-HCl, pH 8.0, 20 mM MgCl2, 5% 글리세롤 및 2 mM DTT)의 용액을 금속 나사 덮개 및 테플론 코팅된 규소 격막 (Agilent Technologies)을 갖는 20 ㎖ 상부공간 바이알 내의 25 ㎕의 세포 추출물에 첨가하고 37℃에서 15분 동안 진탕하면서 배양한다. 200 ㎕의 250 mM EDTA를 첨가하여 반응을 켄칭하고, 실시예 1, II 부분에서 기재된 바와 같이 GC/MS로 정량한다.
예시적 이소프렌 신타아제 핵산은 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 이소프렌 신타아제 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 이소프렌 신타아제 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
일부 구현예에서는, 이소프렌 신타아제 폴리펩티드 또는 핵산은 콩아과 (Faboideae subfamily)와 같은 콩과 (family Fabaceae)로부터의 것이다. 일부 구현예에서는, 이소프렌 신타아제 폴리펩티드 또는 핵산은 푸에라리아 몬타나 (Pueraria montana (쿠주)) (Sharkey 등, Plant Physiology 137:700-712, 2005), 푸에라리아 로바타 (Pueraria lobata), 포플러 (예를 들어 포풀루스 알바 (Populus alba), 포풀루스 니가라 (Populus nigra), 포풀루스 트리코카르파 (Populus trichocarpa), 포풀루스 알바 x 트레물라 (tremula) (CAC35696), 또는 포풀루스 알바) (Sasaki 등, FEBS Letters 579(11): 2514-2518, 2005; Miller 등, Planta 213: 483-487, 2001), 아스펜 (aspen) (예를 들어 포풀루스 트레물로이데스 (Populus tremuloides)) (Silver 등, JBC 270(22): 13010-1316, 1995), 또는 잉글리시 오크 (English Oak) (쿠에르쿠스 로부르 (Quercus robur)) (Zimmer 등, WO 98/02550) (특히 이소프렌 신타아제 핵산, 및 이소프렌 신타아제 폴리펩티드의 발현에 대해 그 전문이 참고문헌으로 각각 포함됨)로부터의 폴리펩티드 또는 핵산이다. 적합한 이소프렌 신타아제는 비제한적으로, 특히 이소프렌 신타아제 핵산 및 폴리펩티드의 서열에 대해 그 전문이 참고문헌으로 각각 포함되는 Genbank 기탁 번호 AY341431, AY316691, AY279379, AJ457070 및 AY182241에 의해 확인되는 것들을 포함한다. 일부 구현예에서는, 이소프렌 신타아제 폴리펩티드 또는 핵산은 쿠에르쿠스 로부르 (Quercus robur)로부터의 자연 발생적 폴리펩티드 또는 핵산이 아니다 (즉, 이소프렌 신타아제 폴리펩티드 또는 핵산은 쿠에르쿠스 로부르로부터의 자연 발생적 폴리펩티드 또는 핵산 외의 이소프렌 신타아제 폴리펩티드 또는 핵산임). 일부 구현예에서는, 이소프렌 신타아제 핵산 또는 폴리펩티드는 포플러로부터의 자연 발생적 폴리펩티드 또는 핵산이다. 일부 구현예에서는, 이소프렌 신타아제 핵산 또는 폴리펩티드는 포플러로부터의 자연 발생적 폴리펩티드 또는 핵산이 아니다.
예시적 DXS 폴리펩티드 및 핵산
상기 나타내는 바와 같이, 1-데옥시-D-자일루로오스-5-포스페이트 신타아제 (DXS) 폴리펩티드는 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일루로오스-5-포스페이트로 변환시킨다. 예시적 DXS 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 DXS 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 피루베이트 및 D-글리세르알데히드-3-포스페이트를 1-데옥시-D-자일루로오스-5-포스페이트로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 DXS 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 DXS 핵산은 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 DXS 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 DXS 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
예시적 IDI 폴리펩티드 및 핵산
이소펜테닐 디포스페이트 이성화효소 폴리펩티드 (이소펜테닐-디포스페이트 델타- 이성화효소 또는 IDI)는 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP)의 상호변환 (예를 들어, IPP를 DMAPP로 변환시키고/시키거나 DMAPP를 IPP로 변환시킴)을 촉진한다. 예시적 IDI 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 IDI 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 세포 추출물 내에서 시험관내, 또는 생체내에서 IPP 및 DMAPP를 상호변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 IDI 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다. 예시적 IDI 핵산은 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 IDI 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 IDI 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
예시적 MVA 경로 폴리펩티드 및 핵산
예시적 MVA 경로 폴리펩티드는 아세틸-CoA 아세틸트랜스퍼라아제 (AA-CoA 티올라아제) 폴리펩티드, 3-하이드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제) 폴리펩티드, 3-하이드록시-3-메틸글루타릴-CoA 환원효소 (HMG-CoA 환원효소) 폴리펩티드, 메발로네이트 키나아제 (MVK) 폴리펩티드, 포스포메발로네이트 키나아제 (PMK) 폴리펩티드, 디포스포메발로네이트 데카르복실라아제 (MVD) 폴리펩티드, 포스포메발로네이트 데카르복실라아제 (PMDC) 폴리펩티드, 이소펜테닐 포스페이트 키나아제 (IPK) 폴리펩티드, IDI 폴리펩티드, 및 둘 이상의 MVA 경로 폴리펩티드의 활성을 갖는 폴리펩티드 (예를 들어 융합 폴리펩티드)를 포함한다. 특히, MVA 경로 폴리펩티드는 폴리펩티드, 폴리펩티드의 절편, 펩티드, 및 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 포함한다. 예시적 MVA 경로 핵산은 폴리펩티드, 폴리펩티드의 절편, 펩티드, 또는 MVA 경로 폴리펩티드의 하나 이상의 활성을 갖는 융합 폴리펩티드를 인코딩하는 핵산을 포함한다. 예시적 MVA 경로 폴리펩티드 및 핵산은 본원에 기재된 임의의 공급원 유기체로부터의 자연 발생적 폴리펩티드 및 핵산 뿐 아니라 본원에 기재된 임의의 공급원 유기체에서 유래한 돌연변이체 폴리펩티드 및 핵산을 포함한다.
특히, 아세틸-CoA 아세틸트랜스퍼라아제 폴리펩티드 (AA-CoA 티올라아제 또는 AACT)는 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 변환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 두 분자의 아세틸-CoA를 아세토아세틸-CoA로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 AA-CoA 티올라아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
3-하이드록시-3-메틸글루타릴-CoA 신타아제 (HMG-CoA 신타아제 또는 HMGS) 폴리펩티드는 아세토아세틸-CoA를 3-하이드록시-3-메틸글루타릴-CoA로 변환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 아세토아세틸-CoA를 3-하이드록시-3-메틸글루타릴-CoA로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 HMG-CoA 신타아제 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
3-하이드록시-3-메틸글루타릴-CoA 환원효소 (HMG-CoA 환원효소 또는 HMGR) 폴리펩티드는 3-하이드록시-3-메틸글루타릴-CoA를 메발로네이트로 변환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 3-하이드록시-3-메틸글루타릴-CoA를 메발로네이트로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 HMG-CoA 환원효소 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
메발로네이트 키나아제 (MVK) 폴리펩티드는 메발로네이트를 인산화하여 메발로네이트-5-포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트를 메발로네이트-5-포스페이트로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 MVK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
포스포메발로네이트 키나아제 (PMK) 폴리펩티드는 메발로네이트-5-포스페이트를 인산화하여 메발로네이트-5-디포스페이트를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-포스페이트를 메발로네이트-5-디포스페이트로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 PMK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
디포스포메발로네이트 데카르복실라아제 (MVD 또는 DPMDC) 폴리펩티드는 메발로네이트-5-디포스페이트를 이소펜테닐 디포스페이트 (IPP)로 변환시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-디포스페이트를 IPP로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 MVD 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
포스포메발로네이트 데카르복실라아제 (PMDC) 폴리펩티드는 메발로네이트-5-포스페이트를 이소펜테닐 포스페이트 (IP)로 변화시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 메발로네이트-5-포스페이트를 IP로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 PMDC 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
이소펜테닐 포스페이트 키나아제 (IPK) 폴리펩티드는 이소펜틸 포스페이트 (IP)를 인산화하여 이소펜테닐 디포스페이트 (IPP)를 형성시킨다. 세포 추출물 내에서 시험관내, 또는 생체내에서 IP를 IPP로 변환시키는 폴리펩티드의 능력을 측정함으로써, 표준 방법 (본원에 기재된 것들과 같은)을 사용하여 폴리펩티드가 IPK 폴리펩티드 활성을 갖는지 여부를 측정할 수 있다.
예시적 IDI 폴리펩티드 및 핵산이 상기에 기재된다.
핵산을 단리하기 위한 예시적 방법
이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산은 표준 방법을 사용하여 단리될 수 있다. 관심 공급원 유기체 (예를 들어 세균 게놈)으로부터 원하는 핵산을 수득하는 방법은 통상적인 것이며 분자 생물학계에 잘 알려져 있다 (예를 들어, 특히 관심 핵산의 단리에 대해 각각 그 전문이 참고문헌으로 포함된 WO 2004/033646 및 그에 인용된 참고문헌들 참조). 예를 들어, 핵산의 서열이 알려져 있다면 (예를 들어 본원에 기재된 임의의 알려진 핵산), 제한 엔도뉴클레아제 소화에 의해 적합한 게놈 라이브러리가 생성될 수 있으며, 원하는 핵산 서열에 상보적인 프로브로 스크리닝될 수 있다. 서열이 단리되고 나면, 적절한 벡터를 사용하는 형질전환에 적합한 양의 DNA가 수득되도록 중합효소 연쇄 반응 (PCR)과 같은 표준 프라이머 지정 증폭 방법을 사용하여 DNA를 증폭할 수 있다 (미국 특허 제 4,683,202 호; 특히 PCR 방법에 대해 그 전문이 참고문헌으로 포함됨).
대안적으로는, 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 (예를 들어 알려진 핵산 서열을 갖는 임의 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산)은 표준 방법을 사용하여 화학적으로 합성될 수 있다.
본원에 기재된 조성물 및 방법에 사용하기에 적합할 수 있는 추가적인 이소프렌 신타아제, DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산은 표준 방법을 사용하여 확인될 수 있다. 예를 들어, 이소프렌을 자연적으로 생성하는 것으로 알려진 유기체의 염색체 DNA의 코스미드 라이브러리는 대장균과 같은 유기체에서 구성된 후 이소프렌 생성에 대해 스크리닝될 수 있다. 특히, 큰 단편의 게놈 DNA (35~45 kb)가 벡터 내에 패키징되는 코스미드 라이브러리가 생성되며 적절한 숙주를 형질전환시키는데 사용될 수 있다. 코스미드 벡터는 다량의 DNA를 수용할 수 있다는 점에 있어서 고유하다. 일반적으로 코스미드 벡터는 이종 DNA의 패키징 및 후속적 원형화에 필요한 cos DNA 서열의 하나 이상의 카피를 갖는다. cos 서열에 추가적으로, 이들 벡터는 또한 ColEI과 같은 복제 기원, 및 암피실린 또는 네오마이신에 내성인 핵산과 같은 약물 내성 마커를 포함한다. 적합한 세균 숙주의 형질전환을 위해 코스미드 벡터를 사용하는 방법은 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 포함되는 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989]에 잘 기재된다.
클론 코스미드에 대해 전형적으로, 이종 DNA는 적절한 제한 엔도뉴클레아제를 사용하여 단리되며, 적절한 리가아제를 사용하여 코스미드 벡터의 cos 부위에 인접하게 라이게이션된다. 선형화된 이종 DNA를 함유하는 코스미드 벡터는 이후 박테리오파지와 같은 DNA 패키징 비히클과 반응한다. 패키징 과정 동안 cos 위치가 절단되고 이종 DNA가 세균 바이러스성 입자의 헤드 부위 내에 패키징된다. 이후 이들 입자는 대장균과 같은 적합한 숙주 세포를 트랜스펙션시키는데 사용된다. 세포에 주입되고 나면, 이종 DNA는 cos 점착성 말단의 영향 하에 원형화된다. 이러한 방식으로, 이종 DNA의 큰 단편이 숙주 세포에 도입되고 발현될 수 있다.
이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산을 수득하기 위한 추가적인 방법은 검정 (예를 들어 본원에 기재된 상부공간 검정), 또는 보존된 길이의 아미노산 (예를 들어 3 이상의 보존된 아미노산)을 인코딩하는 뉴클레오티드에 대해 지정된 프라이머를 사용하는 PCR에 의한 메타게놈 라이브러리 스크리닝을 포함한다. 보존된 아미노산은 알려진 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 아미노산 서열을 정렬함으로써 확인될 수 있다. 이소프렌 신타아제 폴리펩티드에 대한 보존된 아미노산은 알려진 이소프렌 신타아제 폴리펩티드의 정렬된 서열을 기초로 하여 확인될 수 있다. 이소프렌을 자연적으로 생성하는 것으로 발견된 유기체는 표준 단백질 정제 방법 (당업계에 잘 알려진)에 적용될 수 있으며, 생성된 정제 폴리펩티드는 표준 방법을 사용하여 서열분석될 수 있다. 다른 방법이 문헌에서 발견된다 (예를 들어, Julsing 등, Applied. Microbiol. Biotechnol. 75: 1377-84, 2007; Withers 등, Appl Environ Microbiol. 73(19):6277-83, 2007 참조; 특히 이소프렌의 합성에 포함된 핵산의 확인에 대해 그 전문이 참고문헌으로 각각 포함됨).
추가적으로, 표준 서열 정렬 및/또는 구조 예측 프로그램을 사용하여, 제 1차 및/또는 예측된 폴리펩티드 제 2차 구조와 알려진 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산의 구조와의 유사성을 기초로 하여 추가적인 DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 확인할 수 있다. swissprot-trembl 데이터베이스 ("www.expasy.org", Swiss Institute of Bioinformatics Swiss-Prot group CMU - 1 rue Michel Servet CH- 1211 Geneva 4, Switzerland)와 같은 표준 데이터베이스를 또한 사용하여 이소프렌 신타아제, DXS, IDI, 또는 MVA 경로 폴리펩티드 및 핵산을 확인할 수 있다. PredictProtein (630 West, 168 Street, BB217, New York, N.Y. 10032, USA)과 같은 표준 구조 예측 프로그램의 디폴트 설정을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 제 2차 및/또는 제 3차 구조를 예측할 수 있다. 대안적으로, 표준 방법을 사용하여 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 실제적인 제 2차 및/또는 제 3차 구조가 측정될 수 있다. 알려진 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 생성된 프로브에 대한 하이브리드화에 의해 추가적인 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 또한 확인될 수 있다.
예시적 프로모터 및 벡터
본원에 기재된 임의의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 하나 이상의 벡터에 포함될 수 있다. 따라서, 발명자는 또한 본원에서 기재된 임의의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 핵산을 갖는 벡터를 나타낸다. 본원에서 사용되는 바와 같이, "벡터"는 숙주 세포에서 하나 이상의 관심 핵산을 전달하고 바람직하게는 발현시킬 수 있는 구성물을 의미한다. 벡터의 예에는 비제한적으로, 플라스미드, 바이러스 벡터, DNA 또는 RNA 발현 벡터, 코스미드 및 파지 벡터가 포함된다. 일부 구현예에서는, 벡터는 발현 조절 서열의 조절 하에 핵산을 함유한다.
본원에서 사용되는 바와 같이, "발현 조절 서열"은 관심 핵산의 전사를 지시하는 핵산 서열을 의미한다. 발현 조절 서열은 항시성 또는 유도성 프로모터와 같은 프로모터, 또는 인핸서일 수 있다. "유도성 프로모터"는 환경 또는 발달 조절 하에 활성인 프로모터이다. 발현 조절 서열은 전사될 핵산 단편에 작동가능하게 연결된다.
일부 구현예에서는, 벡터는 선택 마커를 포함한다. 용어 "선택 마커"는 도입된 핵산 또는 벡터를 포함하는 이들 숙주 세포의 선택을 용이하게 하는 숙주 세포에서 발현될 수 있는 핵산을 나타낸다. 선택가능한 마커의 예에는 비제한적으로, 항생제 내성 핵산 (예를 들어 카나마이신, 암피실린, 카르베니실린, 겐타마이신, 하이그로마이신, 플레오마이신, 블레오마이신, 네오마이신 또는 클로람페니콜) 및/또는 숙주 세포에 영양 이득과 같은 대사작용 이득을 부여하는 핵산이 포함된다. 예시적 영양 선택 마커는 amdS, argB 및 pyr4로서 당업계에 공지된 마커를 포함한다. 트리코데르마의 형질전환을 위한 벡터 시스템에서 유용한 마커가 당업계에 알려져 있다 (예를 들어, Finkelstein, Chapter 6 in Biotechnology of Filamentous Fungi, Finkelstein 등, Eds. Butterworth-Heinemann, Boston, MA, Chap. 6., 1992; 및 Kinghorn 등, Applied Molecular Genetics of Filamentous Fungi, Blackie Academic and Professional, Chapman and Hall, London, 1992 참조; 특히 선택 마커에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 선택 마커는 형질전환된 세포가 질소원으로서 아세트아미드 상에서 성장하도록 하는 효소 아세트아미다아제를 인코딩하는 amdS 핵산이다. A. 니둘란스 (A. nidulans) amdS 핵산을 선택 마커로서 사용하는 것은 [Kelley 등, EMBO J. 4:475-479, 1985] 및 [Penttila 등, Gene 61 :155-164, 1987] (특히 선택 마커에 대해 그 전문이 참고문헌으로 각각 포함됨)에서 기재된다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 선택 마커 없이 세포의 염색체에 융합된다.
적합한 벡터는 사용되는 숙주 세포와 호환 가능한 것들이다. 적합한 벡터는, 예를 들어 세균, 바이러스 (예를 들어 박테리오파지 T7 또는 M-13 유래 파지), 코스미드, 효모 또는 식물에서 유래할 수 있다. 이러한 벡터를 수득하고 사용하기 위한 프로토콜은 당업자에게 알려져 있다 (예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989 참조; 특히 벡터의 사용에 대해 그 전문이 참고문헌으로 포함됨).
프로모터는 당업계에 잘 알려져 있다. 숙주 세포에서 기능하는 임의의 프로모터는 숙주 세포 내의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현에 사용될 수 있다. 다양한 숙주 세포에서 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 발현을 유발하는데 유용한 개시 조절 부위 또는 프로모터가 많이 존재하며 이는 당업자에게 익숙한 것이다 (예를 들어, WO 2004/033646 및 그의 참고문헌들 참조; 특히 관심 핵산의 발현을 위한 벡터에 대해 그 전문이 참고문헌으로 각각 포함됨). 이들 핵산을 유발할 수 있는 사실상 임의의 프로모터가 본 발명에 적합하며 비제한적으로 CYC1, HIS3, GAL1, GAL10, ADH1, PGK, PHO5, GAPDH, ADCI, TRP1, URA3, LEU2, ENO 및 TPI (사카로마이세스에서의 발현에 유용함); AOX1 (피키아 (Pichia)에서의 발현에 유용함); 및 lac, trp, λPL, λPR, T7, tac 및 trc (대장균에서의 발현에 유용함)를 포함한다.
일부 구현예에서는, 글루코오스 이성화효소 프로모터가 사용된다 (예를 들어 미국 특허 제 7,132,527 호 및 그에 인용된 참고문헌들 참조; 특히 관심 폴리펩티드를 발현시키기 위한 플라스미드 시스템 및 프로모터에 대해 그 전문이 참고문헌으로 각각 포함됨). 보고된 글루코오스 이성화효소 프로모터 돌연변이체는 글루코오스 이성화효소 프로모터에 작동가능하게 연결된 핵산에 의해 인코딩되는 폴리펩티드의 발현 수준을 다양하게 하는데 사용될 수 있다 (미국 특허 제 7,132,527 호). 다양한 구현예에서는 글루코오스 이성화효소 프로모터가 낮은, 중간 또는 높은 카피 플라스미드 내에 포함된다 (미국 특허 제 7,132,527 호).
다양한 구현예에서는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 낮은 카피 플라스미드 (예를 들어, 세포 당 약 1 내지 약 4 카피로 유지되는 플라스미드), 중간 카피 플라스미드 (예를 들어, 세포 당 약 10 내지 약 15 카피로 유지되는 플라스미드) 또는 높은 카피 플라스미드 (예를 들어, 세포 당 약 50 이상의 카피로 유지되는 플라스미드) 내에 포함된다. 일부 구현예에서는, 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 T7 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, T7 프로모터에 작동가능하게 연결되는 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중간 또는 높은 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Trc 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Trc 프로모터에 작동가능하게 연결되는 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 중간 또는 높은 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 Lac 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, Lac 프로모터에 작동가능하게 연결되는 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 낮은 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 내인성 에스케리키아, 판토에아, 바실러스, 야로위야, 스트렙토마이세스 또는 트리코데르마 프로모터, 또는 내인성 알칼리 세린 프로테아제, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 프로모터와 같은 내인성 프로모터에 작동가능하게 연결된다. 일부 구현예에서는, 내인성 프로모터에 작동가능하게 연결되는 이종 또는 특별 내인성 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 높은 카피 플라스미드 내에 포함된다. 일부 구현예에서는, 벡터는 세포 내의 염색체에 융합되지 않는 복제 플라스미드이다. 일부 구현예에서는, 벡터의 일부 또는 전부가 세포 내의 염색체에 융합된다.
일부 구현예에서는, 벡터는 진균 숙주 세포에 도입되는 경우 숙주 세포 게놈에 융합되고 복제되는 임의의 벡터이다. 벡터 목록에 대해서는 [Fungal Genetics Stock Center Catalogue of Strains] (FGSC, "www.fgsc.net" 및 그에 인용된 참고문헌들; 특히 벡터에 대해 그 전문이 참고문헌으로 각각 포함됨)를 참고로 한다. 적합한 발현 및/또는 융합 벡터의 추가적인 예가 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989, Current Protocols in Molecular Biology (F. M. Ausubel 등 (eds) 1987, Supplement 30, section 7.7.18); van den Hondel et al. in Bennett and Lasure (Eds.) More Gene Manipulations in Fungi, Academic Press pp. 396-428, 1991; 및 미국 특허 제 5,874,276 호] (특히 벡터에 대해 그 전문이 참고문헌으로 각각 포함됨)에서 제공된다. 특히 유용한 벡터는 pFB6, pBR322, PUC18, pUC100 및 pENTR/D를 포함한다.
일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 진균 숙주 세포에서 전사 활성을 나타내는 적합한 프로모터에 작동가능하게 연결된다. 프로모터는 숙주 세포에 대해 내인성 또는 이종인 폴리펩티드를 인코딩하는 하나 이상의 핵산에서 유래할 수 있다. 일부 구현예에서는, 프로모터는 트리코데르마 숙주에서 유용하다. 프로모터의 적합한 비제한적 예는 cbh1, cbh2, egl1, egl2, pepA, hfb1, hfb2, xyn1 및 amy를 포함한다. 일부 구현예에서는, 프로모터는 숙주 세포에 대해 선천적인 것이다. 예를 들어 일부 구현예에서 T. 레에세이가 숙주인 경우, 프로모터는 선천적 T. 레에세이 프로모터이다. 일부 구현예에서는, 프로모터는 T. 레에세이 cbh1이며 이는 유도성 프로모터이고 기탁 번호 D86235로 GenBank에 수탁된다 (특히 프로모터에 대해 그 전문이 참고문헌으로 포함됨). 일부 구현예에서는, 프로모터는 진균 숙주 세포에 이종인 것이다. 유용한 프로모터의 또 다른 예는 A. 아와모리 (A. awamori) 및 A. 니게르 (A. niger) 글루코아밀라아제 (glaA) (Nunberg 등, Mol. Cell Biol. 4:2306-2315, 1984 및 Boel 등, EMBO J. 3: 1581-1585, 1984; 특히 프로모터에 대해 그 전문이 참고문헌으로 각각 포함됨); 아스페르길루스 니게르 알파 아밀라아제, 아스페르길루스 오리자에 (Aspergillus oryzae) TAKA 아밀라아제, T. 레에세이 xln1, 및 T. 레에세이 셀로바이오하이드롤라아제 1 (EP 137280, 특히 프로모터에 대해 그 전문이 참고문헌으로 포함됨)의 유전자로부터의 프로모터를 포함한다.
일부 구현예에서는, 발현 벡터는 또한 종결 서열을 포함한다. 종결 조절 부위는 또한 숙주 세포에 대해 선천적인 다양한 유전자에서 유래할 수 있다. 일부 구현예에서는, 종결 서열 및 프로모터 서열은 동일한 근원에서 유래한다. 또 다른 구현예에서는, 종결 서열은 숙주 세포에 대해 내인성이다. 특히 적합한 터미네이터 서열은 트리코데르마 균주 (예를 들어 T. 레에세이)에서 유래하는 cbh1이다. 다른 유용한 진균 터미네이터는 A. 니게르 또는 A. 아와모리 글루코아밀라아제 핵산으로부터의 터미네이터를 포함한다 (Nunberg 등, Mol. Cell Biol. 4:2306-2315, 1984 및 Boel 등, EMBO J. 3:1581-1585, 1984; 특히 진균 터미네이터에 대해 그 전문이 참고문헌으로 각각 포함됨). 임의로는, 종결 위치가 포함될 수 있다. 폴리펩티드의 효과적 발현을 위하여, 폴리펩티드를 인코딩하는 DNA는 개시 코돈을 통해 발현이 적절한 메신저 RNA의 형성을 야기하도록 선택된 발현 조절 부위에 작동가능하게 연결된다.
일부 구현예에서는, 프로모터, 코딩 부위, 및 터미네이터는 모두 발현될 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산으로부터 기원한다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산에 대한 코딩 부위는 발현 구성 프로모터 및 터미네이터 서열의 전사적 조절 하에 있도록 범용 발현 벡터에 삽입된다. 일부 구현예에서는, 유전자 또는 이의 부분은 강력한 cbh1 프로모터의 삽입된 하류이다.
이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산은 표준 기술을 사용하여 발현 벡터와 같은 벡터에 통합될 수 있다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1982; 특히 적절한 DNA 서열의 스크리닝 및 벡터의 구성에 대해 그 전문이 참고문헌으로 포함됨). 관심 핵산 (예를 들어 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산), 프로모터, 터미네이터 및 기타 서열을 포함하는 DNA 구성물을 라이게이션하고 이들을 적합한 벡터에 삽입하는 방법은 당업계에 잘 알려져 있다. 예를 들어, 제한 효소는 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 및 벡터를 절단하는데 사용될 수 있다. 이후, 절단된 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산, 및 절단된 벡터의 양립성 말단이 라이게이션될 수 있다. 일반적으로, 편리한 제한 위치에서의 라이게이션에 의해 연결이 일어난다. 이러한 위치가 존재하지 않는다면, 통상적인 실행에 따라 합성 올리고뉴클레오티드 링커를 사용한다 (Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989, 및 Bennett and Lasure, More Gene Manipulations in Fungi, Academic Press, San Diego, pp 70-76, 1991; 특히 올리고뉴클레오티드 링커에 대해 그 전문이 참고문헌으로 각각 포함됨). 추가적으로, 벡터는 알려진 재조합 기술을 사용하여 구성될 수 있다 (예를 들어, Invitrogen Life Technologies, Gateway Technology).
일부 구현예에서는, 자연 발생적 세포에서 현재 발견되는 것보다 더 높은 수준으로 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산을 과발현시키는 것이 바람직할 수 있다. 이러한 결과는 이들 폴리펩티드를 인코딩하는 핵산을 멀티카피 플라스미드 내로 선택적으로 클로닝하거나 이들 핵산을 강력한 유도성 또는 항시성 프로모터 하에 둠으로써 성취될 수 있다. 바람직한 폴리펩티드를 과발현시키는 방법은 통상적이고 분자 생물학계에 잘 알려져 있으며, 그 예를 [Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989] (특히 클로닝 기술에 대해 그 전문이 참고문헌으로 포함됨)에서 발견할 수 있다.
하기의 원천은 본 발명에 따른 유용한 추가적인 일반적 방법론의 설명을 포함한다: Kreigler, Gene Transfer and Expression; A Laboratory Manual, 1990 및 Ausubel 등, Eds. Current Protocols in Molecular Biology, 1994 (특히 분자 생물학 및 클로닝 기술에 대해 그 전문이 참고문헌으로 각각 포함됨).
예시적 공급원 유기체
이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 (및 이의 인코딩된 폴리펩티드)는 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산을 자연적으로 함유하는 임의 유기체로부터 수득될 수 있다. 상기 나타낸 바와 같이, 이소프렌은 세균, 효모, 식물 및 동물과 같은 다양한 유기체에 의해 자연적으로 형성된다. 유기체는 이소프렌을 생성하기 위해 MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함한다 (도 19). 따라서 DXS 핵산은 예를 들어, DXP 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의 유기체로부터 수득될 수 있다. IDI 및 이소프렌 신타아제 핵산은 예를 들어, MVA 경로, DXP 경로, 또는 MVA 및 DXP 경로 모두를 포함하는 임의 유기체로부터 수득될 수 있다. MVA 경로 핵산은 예를 들어, MVA 경로를 포함하거나 MVA 및 DXP 경로를 모두 포함하는 임의의 유기체로부터 수득될 수 있다.
일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산의 핵산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 핵산의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드의 아미노산 서열은 자연에서의 하기 임의의 유기체에 의해 생성되는 폴리펩티드의 서열과 동일하다. 일부 구현예에서는, 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산 또는 폴리펩티드는 본원에서 기재된 임의 유기체에서 유래하는 돌연변이체 핵산 또는 폴리펩티드이다. 본원에서 사용되는 바와 같이, "~에서 유래하는"은 하나 이상의 돌연변이가 도입되는 핵산 또는 폴리펩티드의 공급원을 나타낸다. 예를 들어, "식물 폴리펩티드에서 유래하는" 폴리펩티드는 하나 이상의 돌연변이가 야생형 식물 폴리펩티드의 서열 (즉 자연적으로 발생하는 서열)에 도입되어 야기되는 관심 폴리펩티드를 나타낸다.
일부 구현예에서는, 공급원 유기체는 진균이며 이의 예는 A. 오리자에 및 A. 니게르와 같은 아스페르길루스 종, S. 세레비지에 (S. cerevisiae)와 같은 사카로마이세스 종, S. 폼베 (S. pombe)와 같은 시조사카로마이세스 (Schizosaccharomyces) 종, 및 T. 레에세이와 같은 트리코데르마 종이다. 일부 구현예에서는, 공급원 유기체는 필라멘트성 진균 세포이다. 용어 "필라멘트성 진균"은 유미코티나 아문 (subdivision Eumycotina)의 모든 필라멘트성 형태를 나타낸다 (Alexopoulos, C. J. (1962), Introductory Mycology, Wiley, New York 참조). 이들 진균은 키틴, 셀룰로오스 및 기타 복합 다당류로 이루어지는 세포벽을 갖는 영양 (vegetative) 균사체를 특징으로 한다. 필라멘트성 진균은 형태학적, 생리학적 및 유전적으로 효모와 구별된다. 필라멘트성 진균의 영양 성장은 균사 연장에 의한 것이며 탄소 이화작용은 절대 호기성이다. 필라멘트성 진균 모세포는 비제한적으로 트리코데르마 (예를 들어 트리코데르마 레에세이, 이전에 T. 롱기브라키아툼 (T. longibrachiatum)으로 분류되었던 무성형 하이포크레아 제코리나 (Hypocrea jecorina), 트리코데르마 비리데 (Trichoderma viride), 트리코데르마 코닌지 (Trichoderma koningii), 트리코데르마 하르지아눔 (Trichoderma harzianum)) (Sheir-Neirs 등., Appl. Microbiol. Biotechnol 20: 46-53, 1984; ATCC No. 56765 및 ATCC No. 26921); 페니실리움 종 (Penicillium sp.), 후미콜라 종 (Humicola sp.) (예를 들어 H. 인솔렌스 (H. insolens), H. 라누기노세 (H. lanuginose) 또는 H. 그리세아 (H. grisea)); 크리소스포리움 종 (Chrysosporium sp.) (예를 들어 C. 루크노웬세 (C. lucknowense)), 글리오클라디움 종 (Gliocladium sp.), 아스페르길루스 종 (예를 들어 A. 오리자에, A. 니게르, A. 소자에 (A. sojae), A. 자포니쿠스 (A. japonicus), A. 니둘란스 또는 A. 아와모리) (Ward 등, Appl. Microbiol. Biotechnol. 39: 7380743, 1993, 및 Goedegebuur 등, Genet 41: 89-98, 2002), 푸사리움 종 (Fusarium sp.) (예를 들어 F. 로세움 (F. roseum), F. 그라미눔 (F. graminum), F. 세레알리스 (F. cerealis), F. 옥시스포리움 (F. oxysporuim) 또는 F. 베네나툼 (F. venenatum)), 뉴로스포라 종 (Neurospora sp.) (예를 들어 N. 크라사 (N. crassa)), 하이포크레아 종 (Hypocrea sp.), 무코르 종 (Mucor sp.) (예를 들어 M. 미에헤이 (M. miehei)), 리조푸스 종 (Rhizopus sp.) 및 에메리셀라 종 (Emericella sp.) (또한 Innis 등, Sci. 228: 21-26, 1985 참조)의 종의 세포일 수 있다. 용어 "트리코데르마" 또는 "트리코데르마 종 (sp. 또는 spp.)"은 트리코데르마로 이전에 또는 현재 분류된 임의의 진균 속을 나타낸다.
일부 구현예에서는, 진균은 A. 니둘란스, A. 아와모리, A. 오리자에, A. 아쿠레아투스 (A. aculeatus), A. 니게르, A. 자포니쿠스, T. 레에세이, T. 비리데, F. 옥시스포룸 (F. oxysporum) 또는 F. 솔라니 (F. solani)이다. 아스페르길루스 종은 특히 진균에 대해 그 전문이 참고문헌으로 각각 포함되는 [Ward 등, Appl. Microbiol. Biotechnol. 39:738-743, 1993] 및 [Goedegebuur 등, Curr Gene 41: 89-98, 2002]에 개시된다. 특정 구현예에서는, 진균은 T. 레에세이의 종과 같은 트리코데르마 종이다. T. 레에세이의 종은 알려져 있으며 비제한적 예로 ATCC 번호 13631, ATCC 번호 26921, ATCC 번호 56764, ATCC 번호 56765, ATCC 번호 56767 및 NRRL 15709 (특히 T. 레에세이에 대해 그 전문이 참고문헌으로 각각 포함됨)를 포함한다. 일부 구현예에서는, 숙주 종은 RL-P37의 유도체이다. RL-P37은 특히 T. 레에세이 종에 대해 그 전문이 참고문헌으로 포함되는 [Sheir-Neiss 등, Appl. Microbiol. Biotechnology 20:46-53, 1984]에 개시된다.
일부 구현예에서는, 공급원 유기체는 사카로마이세스 종, 시조사카로마이세스 종, 피키아 종 또는 칸디다 종 (Candida sp.)과 같은 효모이다.
일부 구현예에서는, 공급원 유기체는 B. 리체니포르미스 (B. licheniformis) 또는 B. 서브틸리스와 같은 바실러스 종, P. 시트레아 (P. citrea)와 같은 판토에아 종, P. 알칼리게네스 (P. alcaligenes)와 같은 슈도모나스 (Pseudomonas) 종, S. 알부스, S. 리비단스 또는 S. 루비기노수스 (S. rubiginosus)와 같은 스트렙토마이세스 종, 또는 대장균과 같은 에스케리키아 종이다.
본원에서 사용되는 바와 같이, "바실러스 속"은 당업자에게 알려진 바와 같은 "바실러스" 속 내의 모든 종을 포함하며 비제한적으로 B. 서브틸리스, B. 리체니포르미스, B. 렌투스 (B. lentus), B. 브레비스 (B. brevis), B. 스테아로써모필루스 (B. stearothermophilus), B. 알칼로필루스 (B. alkalophilus), B. 아밀로리쿠에파시엔스 (B. amyloliquefaciens), B. 클라우시 (B. clausii), B. 할로두란스 (B. halodurans), B. 메가테리움 (B. megaterium), B. 코아굴란스 (B. coagulans), B. 써쿨란스 (B. circulans), B. 라우투스 (B. lautus) 및 B. 투링기엔시스 (B. thuringiensis)를 포함한다. 바실러스 속이 분류학적 개편을 계속하여 거치고 있다는 것이 인지된다. 따라서, 속에는 현재 "지오바실러스 스테아로써모필루스 (Geobacillus stearothermophilus)"로 명명되는 B. 스테아로써모필루스와 같은 유기체를 비제한적으로 포함하는 재분류된 종이 포함되는 것으로 의도된다. 산소의 존재 하에 내성 내생포자가 생성되는 것은 바실러스 속의 특징을 정의하는 것으로 고려되지만, 이러한 특징은 또한 최근 명명된 알리시클로바실러스 (Alicyclobacillus), 암피바실러스 (Amphibacillus), 아뉴리니바실러스 (Aneurinibacillus), 아녹시바실러스 (Anoxybacillus), 브레비바실러스 (Brevibacillus), 필로바실러스 (Filobacillus), 그라실리바실러스 (Gracilibacillus), 할로바실러스 (Halobacillus), 파에니바실러스 (Paenibacillus), 살리바실러스 (Salibacillus), 써모바실러스 (Thermobacillus), 우레이바실러스 (Ureibacillus) 및 비르기바실러스 (Virgibacillus)에 적용된다.
일부 구현예에서는, 공급원 유기체는 그람 양성 세균이다. 비제한적인 예에는 스트렙토마이세스 종 (예를 들어 S. 알부스, S. 리비단스, S. 코에리콜로르 (S. coelicolor) 또는 S. 그리세우스 (S. griseus)) 및 바실러스 종이 포함된다. 일부 구현예에서는, 공급원 유기체는 대장균 또는 슈도모나스 종과 같은 그람 음성 세균이다.
일부 구현예에서는, 공급원 유기체는 콩아과와 같은 콩과 식물과 같은 식물이다. 일부 구현예에서는, 공급원 유기체는 쿠주, 포플러 (포풀루스 알바 x 트레물라 CAC35696 또는 포풀루스 알바) (Sasaki 등, FEBS Letters 579(11): 2514-2518, 2005), 아스펜 (예를 들어 포풀루스 트레물로이데스) 또는 쿠에르쿠스 로부르이다.
일부 구현예에서는, 공급원 유기체는 녹조류, 홍조류, 글라우코피트 (glaucophyte), 클로라라크니오피트 (chlorarachniophyte), 유글레니드 (euglenid), 크로미스타 (chromista) 또는 디노플라젤레이트 (dinoflagellate)와 같은 조류이다.
일부 구현예에서는, 공급원 유기체는 형태학을 기준으로 임의의 하기 군으로 분류되는 남세균 (cyanobacteria)과 같은 남세균이다: 크로오코칼레스 (Chroococcales), 플레우로캅살레스 (Pleurocapsales), 오스실라토리알레스 (Oscillatoriales), 노스토칼레스 (Nostocales) 또는 스티고네마탈레스 (Stigonematales).
예시적 숙주 세포
다양한 숙주 세포가 사용되어 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드를 발현시키고 발명에 청구된 방법으로 이소프렌을 생성시킬 수 있다. 예시적 숙주 세포는 제목 "예시적 공급원 유기체" 하의 이전 부분에 열거된 임의의 유기체로부터의 세포를 포함한다. 숙주 세포는 자연적으로 이소프렌을 생성하는 세포 또는 자연적으로 이소프렌을 생성하지 않는 세포일 수 있다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제, DXS 및/또는 IDI 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 MVA 경로를 사용하여 자연적으로 이소프렌을 생성하고, 이러한 경로를 사용하는 이소프렌의 생성이 강화되도록 이소프렌 신타아제 및/또는 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 경로를 사용하여 자연적으로 이소프렌을 생성하고, MVA 경로 뿐 아니라 DXP 경로의 일부 또는 전부를 사용하여 이소프렌이 생성되도록 하나 이상의 MVA 경로 핵산이 첨가된다. 일부 구현예에서는, 숙주 세포는 DXP 및 MVA 경로 모두를 사용하여 자연적으로 이소프렌을 생성하고, 이들 경로 중 하나 또는 둘 모두에 의한 이소프렌의 생성이 강화되도록 하나 이상의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산이 첨가된다.
예시적 형질전환 방법
이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산 또는 이를 함유하는 벡터는 인코딩된 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 위한 표준 기술을 사용하여 숙주 세포 (예를 들어 본원에 기재된 식물 세포, 진균 세포, 효모 세포 또는 세균 세포)에 삽입될 수 있다. DNA 구성물 또는 벡터를 숙주 세포에 도입하는 것은 형질전환, 전기천공, 핵 미량주사, 형질도입, 트랜스펙션 (예를 들어, 리포펙틴 매개 또는 DEAE-덱스트린 매개 트랜스펙션 또는 재조합 파지 바이러스를 사용하는 트랜스펙션), 인산칼슘 DNA 침전물로의 인큐베이션, DNA-코팅된 미세사출물로의 고속 충격 및 원형질체 융합과 같은 기술을 사용하여 수행될 수 있다. 일반적인 형질전환 기술은 당업계에 알려져 있다 (예를 들어, Current Protocols in Molecular Biology (F. M. Ausubel 등. (eds) Chapter 9, 1987; Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989; 및 Campbell 등, Curr. Genet. 16:53-56, 1989 참조; 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 트리코데르마에서의 이종 폴리펩티드의 발현은 미국 특허 제 6,022,725 호; 미국 특허 제 6,268,328 호; 미국 특허 제 7,262,041 호; WO 2005/001036; Harkki 등; Enzyme Microb. Technol. 13:227-233, 1991; Harkki 등, Bio Technol. 7:596-603, 1989; EP 244,234; EP 215,594; 및 Nevalainen 등, "The Molecular Biology of Trichoderma and its Application to the Expression of Both Homologous and Heterologous Genes" in Molecular Industrial Mycology, Eds. Leong and Berka, Marcel Dekker Inc., NY pp. 129-148, 1992 에 기재되며, 이는 특히 형질전환 및 발현 방법에 대해 그 전문이 참고문헌으로 각각 포함된다. 또한, 아스페르길루스 종의 형질전환에 대해 [Cao 등, (Sci. 9:991-1001, 2000; EP 238023; 및 Yelton 등, Proceedings. Natl. Acad. Sci. USA 81:1470-1474, 1984] (특히 형질전환 방법에 대해 그 전문이 참고문헌으로 각각 포함됨)이 참고된다. 도입된 핵산은 염색체 DNA에 융합되거나 염색체외 복제 서열로서 유지된다.
당업계에 알려진 임의 방법이 형질전환체를 선택하는데 사용될 수 있다. 비제한적인 한 예에서 amdS 마커를 포함하는 안정적 형질전환체는, 아세트아미드를 함유하는 고체 배양 배지에서 불완전한 외형보다는 매끄러운 외형을 갖는 원형 콜로니의 형성 및 빠른 성장 속도에 의해 불안정적 형질전환체와 구별된다. 추가적으로 일부 경우에서는, 고체 비선택 배지 (예를 들어 아세트아미드가 결여된 배지)에서의 형질전환체의 성장, 이러한 배양 배지로부터의 포자 수확, 및 이후 아세트아미드를 함유하는 선택 배지에서 발아 및 성장하는 이들 포자의 %의 측정에 의해 안정성의 추가적인 시험이 수행된다.
일부 구현예에서는, 진균 세포는 원형질체 형성 및 원형질체의 형질전환, 이후 알려진 방식으로의 세포벽 재생을 포함하는 방법에 의해 형질전환된다. 한 특정 구현예에서, 형질전환을 위한 트리코데르마 종의 제조는 진균 균사체로부터의 원형질체의 제조를 포함한다 (Campbell 등, Curr. Genet. 16:53-56, 1989; 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 포함됨). 일부 구현예에서는, 균사체는 발아된 영양 포자로부터 수득된다. 균사체는 세포벽을 소화하여 원형질체를 야기하는 효소로 처리된다. 이후 원형질체는 현탁 배지에서 삼투압 안정화제의 존재에 의해 보호된다. 이들 안정화제는 소르비톨, 만니톨, 염화칼륨, 황화마그네슘 등을 포함한다. 통상적으로 이들 안정화제의 농도는 0.8 M 내지 1.2 M로 가변적이다. 현탁 배지에서 약 1.2 M 용액의 소르비톨을 사용하는 것이 바람직하다.
DNA를 숙주 트리코데르마 종에 흡수시키는 것은 칼슘 이온 농도에 의존적이다. 일반적으로 약 10 mM CaCl2 내지 50 mM CaCl2가 흡수 용액에 사용된다. 흡수 용액에서의 칼슘 이온에 추가로, 일반적으로 포함되는 다른 화합물은 TE 완충액 (10 mM Tris, pH 7.4; 1 mM EDTA) 또는 10 mM MOPS, pH 6.0 완충액 (몰포린프로판설폰산) 및 폴리에틸렌 글리콜 (PEG)과 같은 완충 시스템이다. 어떠한 특정 이론에도 얽매이지 않는 것으로 의도되지만, 폴리에틸렌 글리콜이 세포막이 융합하도록 작용함으로써 배지의 내용물이 트리코데르마 종의 세포질에 전달되고 플라스미드 DNA가 핵에 전달된다고 믿어진다. 이러한 융합은 종종 숙주 염색체에 융합된 다수 카피의 플라스미드 DNA를 남긴다.
통상적으로 105 내지 107/㎖ (예를 들어 2 x 106/㎖)의 밀도로 투과성 처리된 트리코데르마 종 원형질체 또는 세포를 함유하는 현탁액이 형질전환에 사용된다. 적절한 용액 (예를 들어 1.2 M 소르비톨 및 50 mM CaCl2) 내의 이들 원형질체 또는 세포의 100 ㎕ 부피를 원하는 DNA와 혼합한다. 일반적으로, 높은 농도의 PEG가 흡수 용액에 첨가된다. 0.1 내지 1 부피의 25% PEG 4000이 원형질체 현탁액에 첨가될 수 있다. 일부 구현예에서는, 약 0.25 부피가 원형질체 현탁액에 첨가된다. 디메틸 설폭시드, 헤파린, 스페르미딘, 염화칼륨 등과 같은 첨가제가 또한 흡수 용액에 첨가되고 형질전환을 보조할 수 있다. 유사한 절차가 다른 진균 숙주 세포에 대해서 활용가능하다 (예를 들어 미국 특허 제 6,022,725 및 6,268,328; 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 각각 포함됨).
일반적으로, 혼합물은 이후 10분 내지 30분의 기간 동안 약 0℃에서 배양된다. 이후 추가적인 PEG를 혼합물에 첨가하여 원하는 핵산 서열의 흡수를 추가적으로 강화시킨다. 25% PEG 4000은 일반적으로 형질전환 혼합물 부피의 5 내지 15배의 부피로 첨가되지만; 더 크고 적은 부피가 적합할 수 있다. 25% PEG 4000은 바람직하게는 형질전환 혼합물 부피의 약 10배이다. PEG가 첨가된 후, 형질전환 혼합물은 소르비톨 및 CaCl2 용액을 첨가하기 전에 실온 또는 얼음 상에서 배양된다. 이후 원형질체 현탁액을 성장 배지의 용융 분취액에 추가로 첨가한다. 성장 배지가 성장 선택물 (예를 들어 아세트아미드 또는 항생제)을 포함하는 경우, 이는 형질전환체만이 성장하게 한다.
세균 세포의 형질전환은 예를 들어 특히 형질전환 방법에 대해 그 전문이 참고문헌으로 포함되는 [Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1982]에 기재된 바와 같은 통상적인 방법에 따라 수행될 수 있다.
예시적 세포 배양 배지
본 발명은 또한 이소프렌을 생성하는 배양물 내의 세포 집단 또는 세포를 포함한다. "배양물 내의 세포"는 세포가 하나 이상의 세포 분열을 거치도록 하는 용액 (예를 들어 세포 배지) 내의 둘 이상의 세포를 의미한다. "배양물 내의 세포"에는 식물 조직으로 분화된 세포를 함유하는 살아있는 다세포성 식물의 일부인 식물 세포가 포함되지 않는다. 다양한 구현예에서, 세포 배양물에는 적어도 또는 약 10, 20, 50, 100, 200, 500, 1,000, 5,000, 10,000개 이상의 세포가 포함된다.
임의의 탄소원이 숙주 세포를 배양하는데 사용될 수 있다. 용어 "탄소원"은 숙주 세포 또는 유기체에 의해 신진 대사될 수 있는 하나 이상의 탄소-함유 화합물을 나타낸다. 예를 들어, 숙주 세포를 배양하는데 사용되는 세포 배지는 숙주 세포의 생존성 또는 성장을 유지시키기에 적합한 임의의 탄소원을 포함할 수 있다.
일부 구현예에서는, 탄소원은 탄수화물 (예를 들어 단당류, 이당류, 올리고당류 또는 다당류), 반전당 (예를 들어 효소적으로 처리된 수크로오스 시럽), 글리세롤, 글리세린 (예를 들어 바이오디젤 또는 비누-제조 공정의 글리세린 부산물), 디하이드록시아세톤, 1-탄소원, 오일 (예를 들어 옥수수유, 야자유 또는 콩기름과 같은 식물 또는 야채 오일), 아세테이트, 동물성 지방, 동물성 오일, 지방산 (예를 들어 포화 지방산, 불포화 지방산 또는 다중불포화 지방산), 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드), 재생가능 탄소원 (예를 들어 가수분해된 바이오매스 탄소원과 같은 바이오매스 탄소원), 효모 추출물, 효모 추출물로부터의 성분, 중합체, 산, 알코올, 알데히드, 케톤, 아미노산, 숙시네이트, 락테이트, 아세테이트, 에탄올 또는 전술한 것 중 둘 이상의 임의 조합이다. 일부 구현예에서는, 탄소원은 비제한적으로 글루코오스를 포함하는 광합성의 산물이다. 일부 구현예에서, 탄수화물은 자일로오스 또는 글루코오스이다.
예시적 단당류는 글루코오스 및 프룩토오스를 포함한다; 예시적 올리고당류는 락토오스 및 수크로오스를 포함하고, 예시적 다당류는 녹말 및 셀룰로오스를 포함한다. 예시적 탄수화물은 C6 당 (예를 들어 프룩토오스, 만노오스, 갈락토오스 또는 글루코오스) 및 C5 당 (예를 들어 자일로오스 또는 아라비노오스)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 탄수화물 외의 탄소원 (예를 들어 글리세롤, 글리세린, 디하이드록시아세톤, 1-탄소원, 오일, 동물성 지방, 동물성 오일, 지방산, 지질, 인지질, 글리세롤지질, 모노글리세리드, 디글리세리드, 트리글리세리드, 재생가능 탄소원, 또는 효모 추출물로부터의 성분)을 포함한다. 일부 구현예에서는, 세포 배지는 탄수화물 뿐 아니라 폴리펩티드 (예를 들어 미생물 또는 식물 단백질 또는 펩티드)를 포함한다. 일부 구현예에서는, 미생물 폴리펩티드는 효모 또는 세균으로부터의 폴리펩티드이다. 일부 구현예에서는, 식물 폴리펩티드는 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 폴리펩티드이다.
일부 구현예에서는, 탄수화물의 농도는 적어도 또는 약 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 ℓ 당 적어도 또는 약 5 g 이상이다 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨). 일부 구현예에서는, 탄수화물의 농도는 약 50 내지 약 400 g/L, 예를 들어 약 100 내지 약 360 g/L, 약 120 내지 약 360 g/L, 또는 약 200 내지 약 300 g/L이다. 일부 구현예에서는, 탄수화물의 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 탄수화물 총량을 포함한다.
예시적 지질은 포화, 불포화 또는 분지된 C4 및 초과의 지방산인 하나 이상의 지방산을 함유하는 임의의 물질이다.
예시적 오일은 실온에서 액체인 지질이다. 일부 구현예에서는, 지질은 하나 이상의 C4 또는 초과의 지방산을 함유한다 (예를 들어, 4개 이상의 탄소를 갖는 하나 이상의 포화, 불포화 또는 분지된 지방산을 함유). 일부 구현예에서는, 오일은 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨, 아마인, 유질 미생물 세포, 중국 수지 (Chinese tallow), 또는 전술한 것 중 둘 이상의 임의 조합으로부터 수득된다.
예시적 지방산은 "R"이 탄화수소인 화학식 RCOOH의 화합물을 포함한다. 예시적 불포화 지방산은 "R"이 하나 이상의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 불포화 지방산은 비제한적으로, 올레산, 박센산, 리놀렌산, 팔미텔라이딘산 및 아라키돈산을 포함한다. 예시적 다중불포화 지방산은 "R"이 다수의 탄소-탄소 이중 결합을 포함하는 화합물을 포함한다. 예시적 포화 지방산은 "R"이 포화 지방족기인 화합물을 포함한다. 일부 구현예에서는, 탄소원은 하나 이상의 C12-C22 지방산, 예를 들어 C12 포화 지방산, C14 포화 지방산, C16 포화 지방산, C18 포화 지방산, C20 포화 지방산 또는 C22 포화 지방산을 포함한다. 예시적 구현예에서는 지방산이 팔미트산이다. 일부 구현예에서는, 탄소원은 지방산 (예를 들어 불포화 지방산)의 염, 지방산 (예를 들어 불포화 지방산)의 유도체 또는 지방산 (예를 들어 불포화 지방산)의 유도체의 염이다. 적합한 염은 비제한적으로 리튬 염, 칼륨 염, 나트륨 염 등을 포함한다. 디- 및 트리글리세롤은 글리세롤의 지방산 에스테르이다.
일부 구현예에서는, 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300, 400 g/L 이상과 같은 브로쓰 ℓ 당 적어도 또는 약 1 g (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 농도는 약 10 내지 약 400 g/L, 예를 들어 약 25 내지 약 300 g/L, 약 60 내지 약 180 g/L, 또는 약 75 내지 약 150 g/L이다. 일부 구현예에서는, 농도는 숙주 세포 배양 전 및/또는 배양 동안 첨가되는 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 총량을 포함한다. 일부 구현예에서는, 탄소원은 (i) 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 및 (ii) 글루코오스와 같은 탄수화물을 모두 포함한다. 일부 구현예에서는, 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 대 탄수화물의 비율은 탄소 기준으로 약 1:1이다 (즉, 탄수화물 탄소 당 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드 내의 하나의 탄소). 특정 구현예에서, 지질, 오일, 지방, 지방산, 모노글리세리드, 디글리세리드 또는 트리글리세리드의 양은 약 60 내지 180 g/L이고, 탄수화물의 양은 약 120 내지 360 g/L이다.
예시적 미생물 폴리펩티드 탄소원은 효모 또는 세균으로부터의 하나 이상의 폴리펩티드를 포함한다. 예시적 식물 폴리펩티드 탄소원은 콩, 옥수수, 카놀라, 자트로파, 야자, 땅콩, 해바라기, 코코넛, 겨자, 평지씨, 목화씨, 야자 핵, 올리브, 잇꽃, 참깨 또는 아마인으로부터의 하나 이상의 폴리펩티드를 포함한다.
예시적 재생가능 탄소원은 치즈 유장 투과물, 옥수수 침지수, 사탕무 당밀, 보리 맥아, 및 전술한 임의의 것으로부터의 성분을 포함한다. 예시적 재생가능 탄소원은 또한 옥수수, 지팽이풀 (switchgrass), 사탕수수, 발효 공정의 세포 폐기물, 및 콩, 옥수수 또는 밀의 제분으로부터의 단백질 부산물과 같은 바이오매스 내에 존재하는 아세테이트, 글루코오스, 헥소오스, 펜토오스 및 자일로오스를 포함한다. 일부 구현예에서는, 바이오매스 탄소원은 비제한적으로 풀, 밀, 밀짚, 바가스, 사탕수수 바가스, 침엽수 펄프, 옥수수, 옥수수 속대 또는 껍질 (husk), 옥수수 핵 (corn kernel), 옥수수 핵으로부터의 섬유, 옥수수대, 지팽이풀, 벼 외피 산물, 또는 곡물 (예를 들어 옥수수, 수수, 호밀, 트리티케이트 (triticate), 보리, 밀, 및/또는 증류 곡물)의 습식 또는 건식 제분으로부터의 부산물과 같은 리그노셀룰로오스, 헤미셀룰로오스 또는 셀룰로오스 물질이다. 예시적 셀룰로오스 물질은 목재, 종이 및 펄프 폐기물, 초본 식물 및 과일 펄프를 포함한다. 일부 구현예에서는, 탄소원은 줄기, 낟알, 뿌리 또는 덩이줄기와 같은 임의 식물 부분을 포함한다. 일부 구현예에서는, 임의의 하기 식물의 전부 또는 일부가 탄소원으로서 사용된다: 옥수수, 밀, 호밀, 수수, 트리티테케이트, 쌀, 기장, 보리, 카사바, 콩, 완두와 같은 콩류, 감자, 고구마, 바나나, 사탕수수 및/또는 타피오카. 일부 구현예에서는, 탄소원은 자일로오스 및 글루코오스를 모두 포함하거나 수크로오스 및 글루코오스를 모두 포함하는 바이오매스 가수분해물과 같은 바이오매스 가수분해물이다.
일부 구현예에서는, 재생가능 탄소원 (예를 들어 바이오매스)은 세포 배양 배지에 첨가되기 전 사전처리된다. 일부 구현예에서는, 사전처리는 효소적 사전처리, 화학적 사전처리 또는 효소적 및 화학적 사전처리 모두의 조합을 포함한다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005; 미국 특허 제 6,176,176 호; 미국 특허 제 6,106,888 호; 특히 재생가능 탄소원의 사전처리에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 재생가능 탄소원은 세포 배양 배지에 첨가되기 전 부분적으로 또는 완전히 가수분해된다.
일부 구현예에서는, 재생가능 탄소원 (예를 들어 옥수수대)은 세포 배양 배지에 첨가되기 전 암모니아 섬유 팽창 (AFEX) 사전처리를 거친다 (예를 들어 Farzaneh 등, Bioresource Technology 96 (18): 2014-2018, 2005). AFEX 사전처리 동안, 재생가능 탄소원은 온건한 온도 (예를 들어 약 60 내지 약 100℃) 및 고압 (예를 들어 약 250 내지 약 300 psi)에서 약 5분 동안 액체 무수 암모니아로 처리된다. 이후, 압력을 빠르게 해제시킨다. 이러한 방법에서, 리그닌 용해화, 헤미셀룰로오스 가수분해, 셀룰로오스 탈결정화 및 증가된 표면적의 조합된 화학적 및 물리적 효과는 셀룰로오스 및 헤미셀룰로오스가 발효가능 당으로 거의 완전하게 효소적으로 변환되게 한다. AFEX 사전처리는 거의 모든 암모니아가 회수되고 재사용될 수 있는 한편, 하류 방법에서 미생물에 대한 질소원으로서 역할하는 것으로 남아있다는 이점을 갖는다. 또한, 세척 흐름은 AFEX 사전처리에 필요하지 않다. 따라서, AFEX 처리 이후 건조 물질 회수는 본질적으로 100%이다. AFEX는 기본적으로 건조 대 건조 방법이다. 처리된 재생가능 탄소원은 장기간에 적합하며, 효소적 가수분해 또는 발효 방법에서 매우 높은 고체 적재로 공급될 수 있다. 셀룰로오스 및 헤미셀룰로오스는 분해가 없거나 거의 없이 AFEX 방법에서 잘 보존된다. AFEX 사전처리를 거친 재생가능 탄소원의 효소적 가수분해 전에 중화할 필요는 없다. AFEX-처리된 탄소원의 효소적 가수분해는 후속 발효 사용을 위한 깨끗한 당 흐름을 만들어낸다.
일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 적어도 또는 약 0.1, 0.5, 1, 1.5, 2, 3, 4, 5, 10, 15, 20, 30, 40 또는 50% 글루코오스 (w/v)와 동등하다. 탄소원으로부터 생성된 글루코오스의 양을 측정하기 위해 참조로서 글루코오스를 사용하는 표준 HPLC 방법을 사용하여 동량의 글루코오스를 측정할 수 있다. 일부 구현예에서는, 탄소원 (예를 들어 재생가능 탄소원)의 농도는 약 0.1 내지 약 20% 글루코오스, 예를 들어 약 0.1 내지 약 10% 글루코오스, 약 0.5 내지 약 10% 글루코오스, 약 1 내지 약 10% 글루코오스, 약 1 내지 약 5% 글루코오스, 또는 약 1 내지 약 2% 글루코오스와 동등하다.
일부 구현예에서는, 탄소원은 효모 추출물 또는 효모 추출물의 하나 이상의 성분을 포함한다. 일부 구현예에서는, 효모 추출물의 농도는 적어도 또는 약 5, 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 300 g/L 이상과 같은 브로쓰의 ℓ 당 효모 추출물 1 g 이상 (g/L, 브로쓰의 부피에는 세포 배지의 부피 및 세포의 부피가 모두 포함됨)이다. 일부 구현예에서는, 효모 추출물의 농도는 약 1 내지 약 300 g/L, 예를 들어 약 1 내지 약 200 g/L, 약 5 내지 약 200 g/L, 약 5 내지 약 100 g/L, 또는 약 5 내지 약 60 g/L이다. 일부 구현예에서는, 농도는 숙주 세포의 배양 전 및/또는 배양 동안에 첨가되는 효모 추출물 총량을 포함한다. 일부 구현예에서는, 탄소원은 효모 추출물 (또는 이의 하나 이상의 성분) 및 글루코오스와 같은 또 다른 탄소원을 모두 포함한다. 일부 구현예에서는, 효모 추출물 대 다른 탄소원의 비율은 약 1:5, 약 1:10 또는 약 1:20 (w/w)이다.
추가적으로 탄소원은 또한 이산화탄소 또는 메탄올과 같은 1-탄소원 기질일 수 있다. 단일 탄소원 (예를 들어 메탄올, 포름알데히드 또는 포르메이트)로부터 글리세롤을 생성하는 것은 메탄올자화 (methylotrophic) 효모 (Yamada 등, Agric. Biol. Chem., 53(2) 541-543, 1989; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨) 및 세균 (Hunter 등, Biochemistry, 24, 4148-4155, 1985; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨)에서 보고된 바 있다. 이들 유기체는 메탄에서 포르메이트로의 산화 상태 범위에 있는 단일 탄소 화합물을 동화시키고 글리세롤을 생성시킬 수 있다. 탄소 동화의 경로는 리불로오스 모노포스페이트, 세린, 또는 자일루로오스-모노포스페이트를 통한 것일 수 있다 (Gottschalk, Bacterial Metabolism, Second Edition, Springer-Verlag: New York, 1986; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 리불로오스 모노포스페이트 경로는 포르메이트와 리불로오스-5-포스페이트와의 축합으로 6개 탄소 당이 형성되어 이것이 프룩토오스가 되고 마침내 3탄소 산물 글리세르알데히드-3-포스페이트가 되는 것을 포함한다. 마찬가지로, 세린 경로는 메틸렌테트라하이드로폴레이트를 통해 1-탄소 화합물을 당분해 경로에 동화시킨다.
1 또는 2개의 탄소 기질에 추가로, 메탄올자화 유기체는 메틸아민, 글루코사민 및 대사작용 활성을 위한 다양한 아미노산과 같은 화합물을 함유하는 많은 다른 탄소를 이용하는 것으로 또한 알려져 있다. 예를 들어, 메탄올자화 효모는 메틸아민으로부터의 탄소를 이용하여 트레할로오스 또는 글리세롤을 형성시키는 것으로 알려져 있다 (Bellion 등, Microb. Growth Cl Compd, [Int. Symp.], 7th ed., 415-32. Editors: Murrell 등, Publisher: Intercept, Andover, UK, 1993; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨). 유사하게, 다양한 칸디다 종은 알라닌 또는 올레산을 신진 대사시킨다 (Suiter 등, Arch. Microbiol. 153(5), 485-9, 1990; 특히 탄소원에 대해 그 전문이 참고문헌으로 포함됨).
일부 구현예에서는, 세포는 생리적 염 및 영양을 함유하는 표준 배지에서 배양된다 (예를 들어 [Pourquie, J. 등, Biochemistry and Genetics of Cellulose Degradation, eds. Aubert 등, Academic Press, pp. 71-86, 1988] 및 [Ilmen 등, Appl. Environ. Microbiol. 63: 1298-1306, 1997]; 특히 세포 배지에 대해 그 전문이 참고문헌으로 각각 포함됨). 예시적 성장 배지는 루리아 베르타니 (Luria Bertani, LB) 브로쓰, 사브로 덱스트로오스 (Sabouraud Dextrose, SD) 브로쓰, 또는 효모 배지 (Yeast medium, YM) 브로쓰와 같은 상업적으로 제조된 통상적 배지이다. 다른 한정 또는 합성 성장 배지가 또한 사용될 수 있고, 특정 숙주 세포의 성장을 위한 적절한 배지는 미생물 또는 발효 과학계의 당업자에게 알려져 있다.
적절한 탄소원에 추가로, 세포 배지는 바람직하게는 적합한 미네랄, 염, 공동 인자, 완충액, 및 배양물의 성장 또는 이소프렌 생성의 증진에 적합한 당업자에게 알려져 있는 기타 성분을 함유한다 (예를 들어 WO 2004/033646 및 그에 인용된 참고문헌, 및 WO 96/35796 및 그에 인용된 참고문헌; 특히 세포 배지 및 세포 배양 조건에 대해 그 전문이 참고문헌으로 각각 포함됨). 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 핵산이 유도성 프로모터의 조절 하에 있는 일부 구현예에서는 유도제 (예를 들어 당, 금속 염 또는 살균제)를 이소프렌 신타아제, DXS, IDI 및/또는 MVA 경로 폴리펩티드의 발현을 유도하기에 효과적인 농도로 배지에 첨가하는 것이 바람직하다. 일부 구현예에서는, 세포 배지는 하나 이상의 DXS, IDI 또는 MVA 경로 핵산을 갖는 벡터 상의 항생제 내성 핵산 (예를 들어 카나마이신 내성 핵산)에 상응하는 항생제 (예를 들어 카나마이신)를 갖는다.
예시적 세포 배양 조건
세균 배양물의 유지 및 성장에 적합한 재료 및 방법은 당업계에 잘 알려져 있다. 예시적 기술이 [Manual of Methods for General Bacteriology Gerhardt 등, eds), American Society for Microbiology, Washington, D.C. (1994) 또는 Brock in Biotechnology: A Textbook of Industrial Microbiology,초 Edition (1989) Sinauer Associates, Inc., Sunderland, MA] (특히 세포 배양 기술에 대해 그 전문이 참고문헌으로 각각 포함됨)에서 발견될 수 있다. 일부 구현예에서는, 세포는 숙주 세포에 삽입된 핵산에 의해 인코딩되는 하나 이상의 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 폴리펩티드가 발현되게 하는 조건 하에 배양 배지에서 배양된다.
표준 세포 배양 조건이 세포를 배양하는데 사용될 수 있다 (예를 들어 WO 2004/033646 및 그에 인용된 참고문헌; 특히 세포 배양 및 발효 조건에 대해 그 전문이 참고문헌으로 포함됨). 세포는 적절한 온도, 기체 혼합물 및 pH에서 (예를 들어 약 20 내지 약 37℃, 약 6% 내지 약 84% CO2, 및 pH 약 5 내지 약 9에서) 성장하고 유지된다. 일부 구현예에서는, 세포는 적절한 세포 배지에서 35℃에서 성장한다. 일부 구현예에서는, 예를 들어 배양물은 진탕 배양물 또는 발효기 내의 적절한 배지에서 원하는 양의 이소프렌 생성이 달성될 때까지 약 28℃에서 배양된다. 일부 구현예에서는, 발효를 위한 pH 범위는 약 pH 5.0 내지 약 pH 9.0 (예를 들어 약 pH 6.0 내지 약 pH 8.0, 또는 약 6.5 내지 약 7.0)이다. 반응은 숙주 세포의 필요 사항을 기초로 하여 호기성, 무산소 또는 혐기성 조건 하에 수행될 수 있다. 주어진 필라멘트성 진균의 예시적 배양 조건은 당업계에 공지되어 있으며 과학 문헌 및/또는 미국 미생물 보존 센터 (American Type Culture Collection) 및 진균 저장 센터 (Fungal Genetics Stock Center)와 같은 진균 공급원으로부터 발견될 수 있다.
다양한 구현예에서 세포는 회분식 (batch), 유가식 (fed-batch), 또는 연속 공정과 같은 임의 공지된 발효 방식을 사용하여 성장한다. 일부 구현예에서는, 발효의 회분식 방법이 사용된다. 고전적 회분식 발효는 배지의 조성물이 발효의 시작점에서 정해지고 발효 동안 인공적 변경이 가해지지 않는 폐쇄 시스템이다. 따라서, 발효의 시작점에서 세포 배지를 원하는 숙주 세포로 접종하고 발효는 시스템에 아무것도 첨가되지 않도록 한다. 그러나 전형적으로 "회분식" 발효는 탄소원의 첨가에 대한 회분이며 pH 및 산소 농도와 같은 조절 인자에서 이루어지도록 종종 시도된다. 회분식 시스템에서, 시스템의 대사산물 및 바이오매스 조성물은 발효가 중단되는 시간까지 끊임없이 변화한다. 회분식 배양물 내에서, 세포는 정적 지연상에서 고성장 로그상, 및 최종적으로는 성장 속도가 감소되거나 정지하는 정지상을 통해 적절하게 된다. 일부 구현예에서는, 로그상의 세포는 대량의 이소프렌 생성에 책임이 있다. 일부 구현예에서는, 정지상의 세포는 이소프렌을 생성한다.
일부 구현예에서는, 표준 회분식 시스템에 대해 유가식 시스템과 같은 변형이 사용된다. 유가식 발효 방법은 탄소원이 발효 진행으로서의 증가량으로 첨가된다는 것을 제외하고는 전형적인 회분식 시스템을 포함한다. 유가식 발효는 이화 작용 산물 억제가 세포의 신진 대사를 억제하는 경향이 있고 세포 배지 내에 제한된 양의 탄소원을 갖는 것이 바람직한 경우 유용하다. 유가식 발효는 제한된 양 또는 과량의 탄소원 (예를 들어 글루코오스)으로 수행될 수 있다. 유가식 시스템에서의 실제적 탄소원 농도를 측정하는 것은 어려우며, 그러므로 pH, 용존 산소 및 CO2와 같은 폐기 기체의 부분 압력과 같은 측정가능한 요소의 변화를 기준으로 추정된다. 회분식 및 유가식 발효는 통상적이며 당업계에 잘 알려져 있고, 그 예들이 [Brock, Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc.] (특히 세포 배양 및 발효 조건에 대해 그 전문이 참고문헌으로 포함됨)에서 발견될 수 있다.
일부 구현예에서는, 연속 발효 방법이 사용된다. 연속 발효는 한정된 발효 배지가 생물반응기에 연속적으로 첨가되고 동량의 조건화된 배지가 절차 동안 동시에 제거되는 개방형 시스템이다. 연속 발효는 일반적으로, 세로가 주로 로그상 성장에 있는 일정한 고밀도에서 배양물을 유지시킨다.
연속 발효에서는 세포 성장 또는 이소프렌 생성에 영향을 미치는 한 인자 또는 임의 수의 인자들의 조정이 가능하다. 예를 들어, 한 방법은 고정된 속도에서의 질소 수준 또는 탄소원과 같은 제한 영양을 유지하며 모든 다른 매개변수가 조정되게 한다. 다른 시스템에서, 성장에 영향을 주는 많은 수의 인자가 연속적으로 변경되는 한편 세포 농도 (예를 들어 배지 탁도에 의해 측정되는 농도)는 일정하게 유지된다. 연속 시스템은 항정 상태 성장 조건을 유지하고자 한다. 따라서, 배지의 배수로 인한 세포 유실은 발효에서의 세포 성장 속도에 대해 평형화된다. 연속 발효 방법에 대한 성장 인자 및 영양분을 조정하는 방법 뿐 아니라 생성물 형성 속도를 최대화하는 기술은 산업 미생물학계에 잘 알려져 있으며 다양한 방법들이 [Brock, Biotechnology: A Textbook of Industrial Microbiology,초 Edition (1989) Sinauer Associates, Inc.] (특히 세포 배양 및 발효 조건에 대해 그 전문이 참고문헌으로 포함됨)에 상세히 기재된다.
일부 구현예에서 세포는 전체 세포 촉매로서 기질 상에 고정되며, 이소프렌 생성에 대한 발효 조건에 가해진다.
일부 구현예에서는, 산소를 액체에 도입하고 배양물의 균일성을 유지하기 위해 액체 배양물 병을 진탕기에 넣는다. 일부 구현예에서는, 인큐베이터가 온도, 습도, 진탕 속도 및/또는 배양물이 성장하는 기타 조건을 조절하는데 사용된다. 가장 단순한 인큐베이터는 전형적으로 약 65℃까지 상승하는 조정가능한 가열기를 갖는 절연 상자이다. 보다 정교한 인큐베이터는 또한 (냉장을 통해) 온도를 낮추는 능력, 또는 습도 또는 CO2 수준을 조절하는 능력을 포함한다. 대부분의 인큐베이터는 타이머를 포함하며; 일부는 또한 상이한 온도, 습도 수준 등을 통해 순환하도록 프로그래밍될 수 있다. 인큐베이터는 탁상용에서 소규모 방 크기의 유닛까지 그 크기가 다양할 수 있다.
필요하다면, 세포 배지의 일부 또는 전부를 바꾸어 영양분을 다시 채우고/채우거나 잠재적으로 유해한 대사작용 부산물 및 사멸 세포의 축적을 피할 수 있다. 현탁 배양물의 경우, 세포는 현탁 배양물의 원심분리 또는 여과, 및 이후 새로운 배지에 세포를 재현탁함으로써 배지로부터 분리될 수 있다. 점착성 배양물의 경우, 배지를 흡인에 의해 직접적으로 제거하고 대체할 수 있다. 일부 구현예에서는, 세포 배지는 연속 배양물 (예를 들어 희석하지 않은 연속 배양물)에서 적어도 또는 약 5, 10, 20, 40, 50, 60, 65회 이상의 세포 분열 동안 세포의 적어도 일부가 분열되게 한다.
일부 구현예에서는, 항시 또는 누출 프로모터 (예를 들어 Trc 프로모터)가 사용되며 프로모터에 작동가능하게 연결되는 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산(들)의 발현이 유도되도록 화합물 (예를 들어 IPTG)이 첨가되지 않는다. 일부 구현예에서는, 프로모터에 작동가능하게 연결되는 이소프렌 신타아제, DXS, IDI 또는 MVA 경로 핵산(들)의 발현이 유도되도록 화합물 (예를 들어 IPTG)이 첨가된다.
이소프렌의 예시적 생성
일부 구현예에서는, 세포는 세포에 의해 이소프렌이 생성되게 하는 조건 하에 배양 배지에서 배양된다. "피크 절대 생산성"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 배출 기체 내에 있는 이소프렌의 최대 절대량을 의미한다. "피크 절대 생산성 시간 지점"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안 배출 기체 내의 이소프렌의 절대량이 최대일 때 발효 런 동안의 시간 지점을 의미한다. 일부 구현예에서는, 이소프렌 양은 피크 절대 생산성 시간 지점에서 측정된다. 일부 구현예에서는, 세포에 대한 피크 절대 생산성은 본원에 개시된 임의의 대략적 이소프렌 양이다.
"피크 특이적 생산성"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 세포 당 생성된 이소프렌의 최대량을 의미한다. "피크 특이적 생산성 시간 지점"은 세포 당 생성된 이소프렌의 양이 최대일 때 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 시간 지점을 의미한다. 피크 특이적 생산성은, 600 nm에서의 광학 밀도 (OD600)에 의해 측정되는 바와 같이 총 생산성을 세포량으로 나누어 측정된다. 일부 구현예에서는, 이소프렌 양은 피크 특이적 생산성 시간 지점에서 측정된다. 일부 구현예에서는, 세포에 대한 피크 특이적 생산성은 본원에 개시된 임의의 대략적인 세포 당 이소프렌 양이다.
"피크 체적 생산성"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 브로쓰의 부피 (세포 및 세포 배지의 부피를 포함) 당 생성된 이소프렌의 최대량을 의미한다. "피크 특이적 체적 생산성 시간 지점"은 브로쓰의 부피 당 생성된 이소프렌의 양이 최대일 때 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 시간 지점을 의미한다. 피크 특이적 체적 생산성은 총 생산성을 브로쓰의 부피 및 시간량으로 나누어 측정된다. 일부 구현예에서는, 이소프렌 양은 피크 특이적 체적 생산성 시간 지점에서 측정된다. 일부 구현예에서는, 세포에 대한 피크 특이적 체적 생산성은 본원에 개시된 임의의 대략적인 시간 당 부피 당 이소프렌 양이다.
"피크 농도"는 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안 생성된 이소프렌의 최대량을 의미한다. "피크 농도 시간 지점"은 세포 당 생성된 이소프렌의 양이 최대일 때 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안의 시간 지점을 의미한다. 일부 구현예에서는, 이소프렌 양은 피크 농도 시간 지점에서 측정된다. 일부 구현예에서는, 세포에 대한 피크 농도는 본원에 개시된 임의의 대략적 이소프렌 양이다.
"평균 체적 생산성"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안 브로쓰의 부피 (세포 및 세포 배지의 부피를 포함) 당 생성된 이소프렌의 평균량을 의미한다. 평균 체적 생산성은 총 생산성을 브로쓰의 부피 및 시간량으로 나누어 측정된다. 일부 구현예에서는, 세포에 대한 평균 특이적 체적 생산성은 본원에 개시된 임의의 대략적인 시간 당 부피 당 이소프렌 양이다.
"누적 총 생산성"은 특정 기간의 시간 동안 세포를 배양 (예를 들어 특정 발효 런 동안 세포를 배양)하는 동안 생성된 이소프렌의 누적 총량을 의미한다. 일부 구현예에서는 이소프렌의 누적 총량이 측정된다. 일부 구현예에서는, 세포에 대 한 누적 총 생산성은 본원에 개시된 임의의 대략적인 이소프렌 양이다.
일부 구현예에서는, 배양물 내의 세포는 초과로 또는 약 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 12,500, 20,000, 30,000, 40,000, 50,000, 75,000, 100,000, 125,000, 150,000, 188,000 이상의 이소프렌 nmol/세포의 습식 중량에 대한 세포 g/시간 (nmol/gwcm/시간)으로 이소프렌을 생성한다. 일부 구현예에서는, 이소프렌의 양은 약 2 내지 약 200,000 nmol/gwcm/시간, 예를 들어 약 2 내지 약 100 nmol/gwcm/시간, 약 100 내지 약 500 nmol/gwcm/시간, 약 150 내지 약 500 nmol/gwcm/시간, 약 500 내지 약 1,000 nmol/gwcm/시간, 약 1,000 내지 약 2,000 nmol/gwcm/시간, 약 2,000 내지 약 5,000 nmol/gwcm/시간, 약 5,000 내지 약 10,000 nmol/gwcm/시간, 약 10,000 내지 약 50,000 nmol/gwcm/시간, 약 50,000 내지 약 100,000 nmol/gwcm/시간, 약 100,000 내지 약 150,000 nmol/gwcm/시간, 또는 약 150,000 내지 약 200,000 nmol/gwcm/시간이다. 일부 구현예에서는, 이소프렌의 양은 약 20 내지 약 200,000 nmol/gwcm/시간, 약 100 내지 약 5,000 nmol/gwcm/시간, 약 200 내지 약 2,000 nmol/gwcm/시간, 약 200 내지 약 1,000 nmol/gwcm/시간, 약 300 내지 약 1,000 nmol/gwcm/시간, 약 400 내지 약 1,000 nmol/gwcm/시간, 약 1,000 내지 약 5,000 nmol/gwcm/시간, 약 2,000 내지 약 20,000 nmol/gwcm/시간, 약 5,000 내지 약 50,000 nmol/gwcm/시간, 약 10,000 내지 약 100,000 nmol/gwcm/시간, 약 20,000 내지 약 150,000 nmol/gwcm/시간, 또는 약 20,000 내지 약 200,000 nmol/gwcm/시간이다.
nmol/gwcm/시간 단위의 이소프렌 양은 특히 이소프렌 생성의 측정에 대해 그 전문이 참고문헌으로 포함되는 미국 특허 제 5,849,970 호에서 개시된 바와 같이 측정될 수 있다. 예를 들어 2 ㎖의 상부공간 (예를 들어, 밀봉된 바이알에서 32℃에서 200 rpm에서 진탕하면서 약 3시간 동안 배양된 2 ㎖의 배양물과 같은 배양물로부터의 상부공간)은, n-옥탄/포라실 C 컬럼 (Alltech Associates, Inc., Deerfield, I11.)을 가지며 RGD2 산화수은 환원 기체 검출기 (Trace Analytical, Menlo Park, CA)와 결합된 등온선상 (85℃) 작동 시스템과 같은 표준 기체 크로마토그래피 시스템을 사용하여 이소프렌에 대해 분석된다 (예를 들어 Greenberg 등, Atmos. Environ. 27A: 2689-2692, 1993; Silver 등, Plant Physiol. 97:1588-1591, 1991 참조; 특히 이소프렌 생성의 측정에 대해 그 전문이 참고문헌으로 각각 포함됨). 기체 크로마토그래피 영역 단위는 표준 이소프렌 농도 교정 곡선을 통해 nmol 이소프렌으로 변환된다. 일부 구현예에서는, 세포의 습식 중량에 대한 세포의 g 에 대한 값은 세포 배양물의 세포에 대한 A600 값을 수득한 후, 알려진 A600 값을 갖는 세포 배양물에 대한 습식 중량의 교정 곡선을 기준으로 하여 상기 A600 값을 세포의 g으로 변환함으로써 계산된다. 일부 구현예에서는, 세포의 g은 1의 A600 값을 갖는 1 ℓ의 브로쓰 (세포 배지 및 세포를 포함)가 1 g의 습식 세포 중량을 갖는다고 가정함으로써 추정된다. 상기 값은 또한 인큐베이션된 배양물의 시간 수 (예를 들어 3시간)로 나누어진다.
일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 100,000 이상의 이소프렌 ng/세포의 습식 중량에 대한 세포의 g/시간 (ng/gwcm/시간)으로 이소프렌을 생성한다. 일부 구현예에서는, 이소프렌의 양은 약 2 내지 약 5,000 ng/gwcm/시간, 예를 들어 약 2 내지 약 100 ng/gwcm/시간, 약 100 내지 약 500 ng/gwcm/시간, 약 500 내지 약 1,000 ng/gwcm/시간, 약 1,000 내지 약 2,000 ng/gwcm/시간, 또는 약 2,000 내지 약 5,000 ng/gwcm/시간이다. 일부 구현예에서는, 이소프렌의 양은 약 20 내지 약 5,000 ng/gwcm/시간, 약 100 내지 약 5,000 ng/gwcm/시간, 약 200 내지 약 2,000 ng/gwcm/시간, 약 200 내지 약 1,000 ng/gwcm/시간, 약 300 내지 약 1,000 ng/gwcm/시간, 또는 약 400 내지 약 1,000 ng/gwcm/시간이다. ng/gwcm/시간으로의 이소프렌 양은 상기 토의된 nmol/gwcm/시간 단위에서의 이소프렌 생성에 대한 값을 68.1로 곱하여 계산될 수 있다 (하기 방정식 5에서 기재된 바와 같음).
일부 구현예에서는, 배양물 내의 세포는 초과로 또는 약 1, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1,250, 1,500, 1,750, 2,000, 2,500, 3,000, 4,000, 5,000, 10,000, 50,000, 100,000 이상의 이소프렌 mg/브로쓰 L (mg/L브로쓰, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)로 이소프렌의 누적 역가 (총량)을 생성한다. 일부 구현예에서는, 이소프렌의 양은 약 2 내지 약 5,000 mg/L브로쓰, 예를 들어 약 2 내지 약 100 mg/L브로쓰, 약 100 내지 약 500 mg/L브로쓰, 약 500 내지 약 1,000 mg/L브로쓰, 약 1,000 내지 약 2,000 mg/L브로쓰, 또는 약 2,000 내지 약 5,000 mg/L브로쓰이다. 일부 구현예에서는, 이소프렌의 양은 약 20 내지 약 5,000 mg/L브로쓰, 약 100 내지 약 5,000 mg/L브로 , 약 200 내지 약 2,000 mg/L브로쓰, 약 200 내지 약 1,000 mg/L브로쓰, 약 300 내지 약 1,000 mg/L브로쓰, 또는 약 400 내지 약 1,000 mg/L브로쓰이다.
진탕 플라스크 또는 유사한 배양물로부터의 이소프렌 mg/상부공간 L로의 이소프렌의 특이적 생산성은 약 1.0의 OD600 값의 세포 배양물로부터 1 ㎖ 샘플을 취하고 30분 동안 인큐베이션한 후 상부공간 내의 이소프렌의 양을 측정함으로써 측정될 수 있다 (예를 들어 실시예 1, II 부분에서 기재된 바와 같음). OD600 값이 1.0이 아니라면, OD600 값으로 나누어 1.0의 OD600 값에 대해 측정을 정상화시킬 수 있다. 이소프렌 mg/상부공간 L의 값은 38의 인자로 곱하여 배양물 브로쓰의 mg/L브로쓰/시간/OD600으로 변환될 수 있다. mg/L브로쓰/시간/OD600 단위의 값을 시간 수 및 OD600 값으로 곱하여 이소프렌 mg/브로쓰 L 단위의 누적 역가를 수득할 수 있다.
일부 구현예에서는, 배양물 내의 세포는 초과의 또는 약 0.1, 1.0, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1100, 1200, 1300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,100, 2,200, 2,300, 2,400, 2,500, 2,600, 2,700, 2,800, 2,900, 3,000, 3,100, 3,200, 3,300, 3,400, 3,500 이상의 이소프렌 mg/브로쓰 L/시간 (mg/L브로쓰/시간, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)으로 이소프렌의 평균 체적 생산성을 갖는다. 일부 구현예에서는, 이소프렌의 평균 체적 생산성은 약 0.1 내지 약 3,500 mg/L브로쓰/시간, 예를 들어 약 0.1 내지 약 100 mg/L브로쓰/시간, 약 100 내지 약 500 mg/L브로쓰/시간, 약 500 내지 약 1,000 mg/L브로쓰/시간, 약 1,000 내지 약 1,500 mg/L브로쓰/시간, 약 1,500 내지 약 2,000 mg/L브로쓰/시간, 약 2,000 내지 약 2,500 mg/L브로쓰/시간, 약 2,500 내지 약 3,000 mg/L브로쓰/시간, 또는 약 3,000 내지 약 3,500 mg/L브로쓰/시간이다. 일부 구현예에서는, 이소프렌의 평균 체적 생산성은 약 10 내지 약 3,500 mg/L브로쓰/시간, 약 100 내지 약 3,500 mg/L브로쓰/시간, 약 200 내지 약 1,000 mg/L브로쓰/시간, 약 200 내지 약 1,500 mg/L브로쓰/시간, 약 1,000 내지 약 3,000 mg/L브로쓰/시간, 또는 약 1,500 내지 약 3,000 mg/L브로쓰/시간이다.
일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 0.5, 1.0, 10, 25, 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1,000, 1100, 1200, 1300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,100, 2,200, 2,300, 2,400, 2,500, 2,600, 2,700, 2,800, 2,900, 3,000, 3,100, 3,200, 3,300, 3,400, 3,500, 3,750, 4,000, 4,250, 4,500, 4,750, 5,000, 5,250, 5,500, 5,750, 6,000, 6,250, 6,500, 6,750, 7,000, 7,250, 7,500, 7,750, 8,000, 8,250, 8,500, 8,750, 9,000, 9,250, 9,500, 9,750, 10,000, 12,500, 15,000 이상의 이소프렌 mg/브로쓰 L/시간 (mg/L브로쓰/시간, 브로쓰의 부피에는 세포 및 세포 배지의 부피가 포함됨)으로 이소프렌의 피크 체적 생산성을 갖는다. 일부 구현예에서는, 이소프렌의 피크 체적 생산성은 약 0.5 내지 약 15,000 mg/L브로쓰/시간, 예를 들어 약 0.5 내지 약 10 mg/L브로쓰/시간, 약 1.0 내지 약 100 mg/L브로쓰/시간, 약 100 내지 약 500 mg/L브로 /시간, 약 500 내지 약 1,000 mg/L브로쓰/시간, 약 1,000 내지 약 1,500 mg/L브로쓰/시간, 약 1,500 내지 약 2,000 mg/L브로쓰/시간, 약 2,000 내지 약 2,500 mg/L브로쓰/시간, 약 2,500 내지 약 3,000 mg/L브로쓰/시간, 약 3,000 내지 약 3,500 mg/L브로쓰/시간, 약 3,500 내지 약 5,000 mg/L브로쓰/시간, 약 5,000 내지 약 7,500 mg/L브로쓰/시간, 약 7,500 내지 약 10,000 mg/L브로쓰/시간, 약 10,000 내지 약 12,500 mg/L브로쓰/시간, 또는 약 12,500 내지 약 15,000 mg/L브로쓰/시간이다. 일부 구현예에서는, 이소프렌의 피크 체적 생산성은 약 10 내지 약 15,000 mg/L브로쓰/시간, 약 100 내지 약 2,500 mg/L브로쓰/시간, 약 1,000 내지 약 5,000 mg/L브로쓰/시간, 약 2,500 내지 약 7,500 mg/L브로쓰/시간, 약 5,000 내지 약 10,000 mg/L브로쓰/시간, 약 7,500 내지 약 12,500 mg/L브로쓰/시간, 또는 약 10,000 내지 약 15,000 mg/L브로쓰/시간이다.
발효기 내의 mg/L브로쓰/시간으로의 순간 이소프렌 생성 속도는 발효기 배출 기체의 샘플을 취하고, 예를 들어 실시예 1, II 부분에서 기재된 바와 같이 이소프렌의 양에 대해 이를 분석하고 (예를 들어 L기체 당 이소프렌 mg의 단위로) 상기 값을 배출 기체가 브로쓰 각각의 ℓ를 통해 지나가는 속도 (예를 들어, 1 vvm (공기 부피/브로쓰 부피/분)에서 이는 시간 당 60 L기체임)로 곱하여 측정될 수 있다. 따라서, 1 mg/L기체의 배출 기체 수준은 1 vvm의 공기 흐름에서 60 mg/L브로쓰/시간의 순간 생성 속도에 상응한다. 필요하다면, mg/L브로쓰/시간 단위의 값을 OD600 값으로 나누어 mg/L브로쓰/시간/OD 단위의 특이적 속도를 수득할 수 있다. 이소프렌 mg/L기체의 평균 값은 상기 평균 배출 기체 이소프렌 농도에 발효 동안의 발효 브로쓰의 ℓ 당 살포된 배출 기체의 총량을 곱하여 총 생성물 생산성 (발효 브로쓰 ℓ 당 이소프렌 g, mg/L브로쓰)으로 변환될 수 있다. 따라서, 1 vvm에서 10시간에 걸친 0.5 mg/L브로쓰/시간의 평균 배출 기체 이소프렌 농도는 300 mg 이소프렌/L브로쓰의 총 생성물 농도에 상응한다.
일부 구현예에서는, 배양물 내 세포는 초과로 또는 약 0.0015, 0.002, 0.005, 0.01, 0.02, 0.05, 0.1, 0.12, 0.14, 0.16, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.4, 1.6, 2.0, 2.2, 2.4, 2.6, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 23.2, 23.4, 23.6, 23.8, 24.0, 25.0, 30.0, 31.0, 32.0, 33.0, 35.0, 37.5, 40.0, 45.0, 47.5, 50.0, 55.0, 60.0, 65.0, 70.0, 75.0, 80.0, 85.0, 또는 90.0 몰%의 세포 배양 배지 내 탄소를 이소프렌으로 변환시킨다. 일부 구현예에서는, 탄소의 이소프렌으로의 변환 %는 약 0.002 내지 약 90.0 몰%, 예를 들어 약 0.002 내지 약 0.005 몰%, 약 0.005 내지 약 0.01 몰%, 약 0.01 내지 약 0.05 몰%, 약 0.05 내지 약 0.15 몰%, 0.15 내지 약 0.2 몰%, 약 0.2 내지 약 0.3 몰%, 약 0.3 내지 약 0.5 몰%, 약 0.5 내지 약 0.8 몰%, 약 0.8 내지 약 1.0 몰%, 약 1.0 내지 약 1.6 몰%, 약 1.6 내지 약 3.0 몰%, 약 3.0 내지 약 5.0 몰%, 약 5.0 내지 약 8.0 몰%, 약 8.0 내지 약 10.0 몰%, 약 10.0 내지 약 15.0 몰%, 약 15.0 내지 약 20.0 몰%, 약 20.0 내지 약 25.0 몰%, 약 25.0 내지 30.0 몰%, 약 30.0 내지 35.0 몰%, 약 35.0 내지 40.0 몰%, 약 45.0 내지 50.0 몰%, 약 50.0 내지 55.0 몰%, 약 55.0 내지 60.0 몰%, 약 60.0 내지 65.0 몰%, 약 65.0 내지 70.0 몰%, 약 75.0 내지 80.0 몰%, 약 80.0 내지 85.0 몰%, 또는 약 85.0 내지 90.0 몰%이다. 일부 구현예에서는, 탄소의 이소프렌으로의 변환 %는 약 0.002 내지 약 0.4 몰%, 0.002 내지 약 0.16 몰%, 0.04 내지 약 0.16 몰%, 약 0.005 내지 약 0.3 몰%, 약 0.01 내지 약 0.3 몰%, 약 0.05 내지 약 0.3 몰%, 약 0.1 내지 0.3 몰%, 약 0.3 내지 약 1.0 몰%, 약 1.0 내지 약 5.0 몰%, 약 2 내지 약 5.0 몰%, 약 5.0 내지 약 10.0 몰%, 약 7 내지 약 10.0 몰%, 약 10.0 내지 약 20.0 몰%, 약 12 내지 약 20.0 몰%, 약 16 내지 약 20.0 몰%, 약 18 내지 약 20.0 몰%, 약 18 내지 23.2 몰%, 약 18 내지 23.6 몰%, 약 18 내지 약 23.8 몰%, 약 18 내지 약 24.0 몰%, 약 18 내지 약 25.0 몰%, 약 20 내지 약 30.0 몰%, 약 30 내지 약 40.0 몰%, 약 30 내지 약 50.0 몰%, 약 30 내지 약 60.0 몰%, 약 30 내지 약 70.0 몰%, 약 30 내지 약 80.0 몰%, 또는 약 30 내지 약 90.0 몰%이다.
탄소의 이소프렌으로의 변환 % (또한 "탄소 수율 %"로서 나타냄)는 생성된 이소프렌 내의 탄소 mol을 탄소원 내 탄소 mol (예를 들어 회분식 및 공급된 글루코오스 및 효모 추출물에서의 탄소 mol)로 나누어 측정될 수 있다. 이러한 수를 100%로 곱하여 % 값을 수득한다 (방정식 1에 나타낸 바와 같음).
방정식 1
탄소 수율% = (생성된 이소프렌 내의 탄소 mol)/(탄소원 내의 탄소 mol) * 100
상기 계산을 위해, 효모 추출물이 50% w/w 탄소를 함유하는 것으로 가정할 수 있다. 예로서, 실시예 7, VIII 부분에 기재된 500 ℓ에 대해, 탄소의 이소프렌으로의 변환%는 하기 방정식 2에 나타낸 바와 같이 계산될 수 있다.
방정식 2
탄소 수율% = (39.1 g 이소프렌 * 1/68.1 mol/g * 5 C/mol)/[(181221 g 글루코오스 * 1/180 mol/g * 6 C/mol) + (17780 g 효모 추출물 * 0.5 * 1/12 mol/g)] * 100 = 0.042%
본원에 기재된 두 가지 500 ℓ 발효에 대해 (실시예 7, VII 및 VIII 부분), 탄소의 이소프렌으로의 변환 %는 0.04~0.06%였다. 본원에 기재된 바와 같이 14ℓ 시스템을 사용하여 0.11~0.16 탄소 수율%를 수득하였다.
당업자는 이소프렌 생성 속도 및 생성된 이소프렌의 양을 어떠한 다른 단위로도 용이하게 변환할 수 있다. 단위 사이의 상호변환에 대한 예시적 방정식을 하기에 열거한다.
이소프렌 생성 속도에 대한 단위 ("총합 및 특이적")
방정식 3
1 g 이소프렌/L브로쓰/시간 = 14.7 mmol 이소프렌/L브로쓰/시간 (총 체적 속도)
방정식 4
1 nmol 이소프렌/gwcm/시간 = 1 nmol 이소프렌/L브로쓰/시간/OD600 (이러한 변환은 1의 OD600 값을 갖는 1ℓ의 브로쓰가 1 g의 습식 세포 중량을 갖는다고 가정함)
방정식 5
1 nmol 이소프렌/gwcm/시간 = 68.1 ng 이소프렌/gwcm/시간 (이소프렌 분자량이 주어짐)
방정식 6
1 nmol 이소프렌/L기체 02/시간 = 90 nmol 이소프렌/L브로쓰/시간 (브로쓰 L 당 90 L/시간의 02 유속에서)
방정식 7
1 ug 이소프렌/배출 기체 중 L기체 이소프렌 = L브로쓰 당 60 L기체의 유속에서 60 ug 이소프렌/L브로쓰/시간 (1 vvm)
역가에 대한 단위 (총합 및 특이적)
방정식 8
1 nmol 이소프렌/mg 세포 단백질 = 150 nmol 이소프렌/L브로쓰/OD600 (이러한 변환은 1의 OD600 값을 갖는 1ℓ의 브로쓰가 약 150 mg의 총 세포 단백질을 갖는다고 가정함) (특이적 생산성)
방정식 9
1 g 이소프렌/L브로쓰 = 14.7 mmol 이소프렌/L브로쓰 (총 역가)
필요하다면, 방정식 10을 사용하여 세포의 습식 중량을 포함하는 임의의 단위를 세포의 건식 중량을 포함하는 상응하는 단위로 변환할 수 있다.
방정식 10
세포의 건식 중량 = (세포의 습식 중량)/3.3
본 발명에 의해 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포가, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2배, 3배, 5배, 10배, 25배, 50배, 100배, 150배, 200배, 400배 이상의 이소프렌 양을 생성한다.
본 발명에 의해 포함되는 일부 구현예에서는 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산, 및 DXS, IDI 및/또는 MVA 경로 폴리펩티드를 인코딩하는 하나 이상의 이종 핵산을 포함하는 세포가, 이종 핵산을 갖지 않는 본질적으로 동일한 조건 하에 성장한 상응하는 세포에서 생성된 이소프렌의 양보다 적어도 또는 약 2배, 3배, 5배, 10배, 25배, 50배, 100배, 150배, 200배, 400배 이상의 이소프렌의 양을 생성한다.
예시적 이소프렌 정제 방법
일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 회수하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 기체 스트리핑, 분획화, 흡수/탈착, 투과증발, 고체상으로부터의 이소프렌의 열 또는 진공 탈착, 또는 고정 또는 흡수된 이소프렌을 용매를 사용하여 고체상으로 추출하는 것과 같은 표준 기술을 사용하여 회수될 수 있다 (예를 들어 미국 특허 제 4,703,007 호 및 제 4,570,029 호 참조; 특히 이소프렌 회수 및 정제 방법에 대해 그 전문이 참고문헌으로 각각 포함됨). 일부 구현예에서는, 이소프렌의 회수는 액체 형태의 이소프렌 (예를 들어 용매 중 이소프렌의 용액 또는 이소프렌의 순 용액)의 단리를 포함한다. 기체 스트리핑은 연속 방식으로 발효 배출 기체 흐름으로부터 이소프렌 증기를 제거하는 것을 포함한다. 이러한 제거는 고체상으로의 흡수, 액체상으로의 분할, 또는 직접 축합을 비제한적으로 포함하는 여러 상이한 방법으로 달성될 수 있다. 일부 구현예에서는, 희석 이소프렌 증기 흐름의 막 풍부함은 액체 이소프렌의 축합을 야기하는 증기의 이슬점을 초과한다.
이소프렌의 회수는 한 단계 또는 다중 단계를 포함할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 변환은 동시에 수행된다. 예를 들어, 이소프렌은 배출 기체 흐름으로부터 직접적으로 축합되어 액체를 형성할 수 있다. 일부 구현예에서는, 발효 배출 기체로부터의 이소프렌 증기의 제거 및 이소프렌의 액체상으로의 변환은 연속적으로 수행된다. 예를 들어, 이소프렌은 고체상으로 흡수된 후 용매로 고체상으로부터 추출될 수 있다.
일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 정제하는 것을 추가로 포함한다. 예를 들어, 본 발명의 조성물 및 방법을 사용하여 생성된 이소프렌은 표준 기술을 사용하여 정제될 수 있다. 정제는, 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 이소프렌이 분리되는 과정을 나타낸다. 일부 구현예에서는, 이소프렌은 실제적으로 순수한 액체로서 수득된다. 정제 방법의 예에는 (i) 액체 추출용 용제 중의 용액으로부터의 증류 및 (ii) 크로마토그래피가 포함된다. 본원에서 사용되는 바와 같이, "정제된 이소프렌"은 이소프렌이 생성되는 경우 존재하는 하나 이상의 성분으로부터 분리된 이소프렌을 의미한다. 일부 구현예에서 이소프렌은, 이소프렌이 생성되는 경우 존재하는 기타 성분 없이, 약 20 중량%이다. 다양한 구현예에서는, 이소프렌은 적어도 또는 약 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 또는 99 중량% 순수하다. 순도는 적절한 방법, 예를 들어 컬럼 크로마토그래피, HPLC 분석 또는 GC- MS 분석에 의해 검정될 수 있다.
일부 구현예에서는, 본원에 기재된 임의의 방법은 이소프렌을 중합하는 것을 추가로 포함한다. 예를 들어, 정제된 이소프렌을 중합하는데 표준 방법을 사용하여 시스-폴리이소프렌을 형성시키거나, 표준 방법을 사용하여 다른 하위 스트림을 형성시킬 수 있다.
추가적인 방법 및 조성물이 미국 가출원 제 61/097,186 호 (2008년 9월 15일에 출원), 미국 가출원 제 61/097,189 호 (2008년 9월 15일에 출원), 및 미국 가출원 제 61/097,163 호 (2008년 9월 15일에 출원)에 기재되며, 이들 모두 특히 이소프렌을 생성하기 위한 조성물 및 방법에 대해 그 전문이 참고문헌으로 포함된다.
도 1은 대장균에서의 발현을 위해 코돈-최적화된 쿠주 (kudzu) 이소프렌 신타아제 유전자의 뉴클레오티드 서열이다 (SEQ ID NO:1). atg 시작 코돈은 이탤릭체이고, 정지 코돈은 굵은 글씨이며, 첨가된 PstI 위치는 밑줄 그은 부분이다.
도 2는 pTrcKudzu의 지도이다.
도 3은 pTrcKudzu의 뉴클레오티드 서열이다 (SEQ ID NO:2). RBS는 밑줄 그은 부분이며, 쿠주 이소프렌 신타아제 시작 코돈은 굵은 대문자체이고 정지 코돈은 굵은 대문자 이탤릭체이다. 벡터 골격은 pTrcHis2B이다.
도 4는 pETNHisKudzu의 지도이다.
도 5는 pETNHisKudzu의 뉴클레오티드 서열이다 (SEQ ID NO:5).
도 6은 pCL-lac-Kudzu의 지도이다.
도 7은 pCL-lac-Kudzu의 뉴클레오티드 서열이다 (SEQ ID NO:7).
도 8A는 벡터를 갖지 않는 대장균 BL21 세포에서의 이소프렌 생성을 나타내는 그래프이다.
도 8B는 pCL-lac-Kudzu를 갖는 대장균 BL21 세포에서의 이소프렌 생성을 나타내는 그래프이다.
도 8C는 pTrcKudzu를 갖는 대장균 BL21 세포에서의 이소프렌 생성을 나타내는 그래프이다.
도 8D는 pETN-HisKudzu를 갖는 대장균 BL21 세포에서의 이소프렌 생성을 나타내는 그래프이다.
도 9A는 14ℓ 유가식 (fed-batch) 발효에서 대장균 BL21/pTrcKudzu의 발효 시간에 걸친 OD를 나타내는 그래프이다.
도 9B는 14ℓ 유가식 발효에서 대장균 BL21/pTrcKudzu의 발효 시간에 걸친 이소프렌 생성을 나타내는 그래프이다.
도 1OA는 판토에아 시트레아 (Panteoa citrea)에서의 이소프렌의 생성을 나타내는 그래프이다. 대조군 세포는 재조합 쿠주 이소프렌 신타아제를 갖지 않는다. 회색 다이아몬드는 이소프렌 합성을 나타내고, 흑색 사각형은 OD600을 나타낸다.
도 1OB는 pCL-lac Kudzu를 발현하는 판토에아 시트레아에서의 이소프렌의 생성을 나타내는 그래프이다. 회색 다이아몬드는 이소프렌 합성을 나타내고, 흑색 사각형은 OD600을 나타낸다.
도 1OC는 pTrcKudzu를 발현하는 판토에아 시트레아에서의 이소프렌의 생성을 나타내는 그래프이다. 회색 다이아몬드는 이소프렌 합성을 나타내고, 흑색 사각형은 OD600을 나타낸다.
도 11은 재조합 이소프렌 신타아제를 발현하는 바실러스 서브틸리스 (Bacillus subtilis)에서의 이소프렌의 생성을 나타내는 그래프이다. BG3594comK는 플라스미드가 없는 B. 서브틸리스이다 (선천적 이소프렌 생성). CF443-BG3594comK는 pBSKudzu를 갖는 B. 서브틸리스이다 (재조합 이소프렌 생성). y축의 IS는 이소프렌을 나타낸다.
도 12는 pBS Kudzu #2의 뉴클레오티드 서열이다 (SEQ ID NO:57).
도 13은 야로위야 (Yarrowia)에서의 발현을 위해 코돈-최적화된 쿠주 이소프렌 신타아제의 뉴클레오티드 서열이다 (SEQ ID NO:8).
도 14는 야로위야에서의 발현을 위해 코돈-최적화된 쿠주 이소프렌 신타아제 유전자를 포함하는 pTrex3g의 지도이다.
도 15는 벡터 pSPZ 1 (MAP29Spb)의 뉴클레오티드 서열이다 (SEQ ID NO:11).
도 16은 야로위야에서의 발현을 위해 코돈-최적화된 합성 쿠주 (푸에라리아 몬타나 (Pueraria montana)) 이소프렌 유전자의 뉴클레오티드 서열이다 (SEQ ID NO:12).
도 17은 합성 하이브리드 포플러 (포풀루스 알바 (Populus alba) x 포풀루스 트레물라 (Populus tremula)) 이소프렌 신타아제 유전자의 뉴클레오티드 서열이다 (SEQ ID NO:13). ATG 시작 코돈은 굵은 글씨체이고, 정지 코돈은 밑줄 그은 부분이다.
도 18A는 벡터 pYLA 1, pYL1 및 pYL2의 도식적인 개략적 구성을 나타낸다.
도 18B는 벡터 pYLA(POP1)의 도식적인 개략적 구성을 나타낸다.
도 18C는 벡터 pYLA(KZ1)의 도식적인 개략적 구성을 나타낸다.
도 18D는 벡터 pYLI(KZ1)의 도식적인 개략적 구성을 나타낸다.
도 18E는 벡터 pYLI(MAP29)의 도식적인 개략적 구성을 나타낸다.
도 18F는 벡터 pYLA(MAP29)의 도식적인 개략적 구성을 나타낸다.
도 19A는 이소프렌에 대한 MVA 및 DXP 대사작용 경로를 나타낸다 (F. Bouvier 등, Progress in Lipid Res. 44:357-429, 2005를 근거로 함). 하기의 설명은 경로에서의 각각의 폴리펩티드의 대안적 명칭, 및 표시된 폴리펩티드의 활성을 측정하기 위한 검정을 개시하는 참고문헌을 포함한다 (이들 각각의 참고문헌은 그 전문이, 특히 MVA 및 DXP 경로에서의 폴리펩티드에 대한 폴리펩티드 활성에 대한 검정에 대해서 본원에 참고로 포함됨). 메발로네이트 경로: AACT; 아세틸-CoA 아세틸트랜스퍼라아제, MvaE, EC 2.3.1.9. 검정: J. Bacteriol, 184: 2116-2122, 2002; HMGS; 하이드록시메틸글루타릴-CoA 신타아제, MvaS, EC 2.3.3.10. 검정: J. Bacteriol, 184: 4065-4070, 2002; HMGR; 3-하이드록시-3-메틸글루타릴-CoA 환원효소, MvaE, EC 1.1.1.34. 검정: J. Bacteriol, 184: 2116-2122, 2002; MVK; 메발로네이트 키나아제, ERG12, EC 2.7.1.36. 검정: Curr Genet 19:9-14, 1991. PMK; 포스포메발로네이트 키나아제, ERG8, EC 2.7.4.2, 검정: Mol Cell Biol., 11:620-631, 1991; DPMDC; 디포스포메발로네이트 데카르복실라아제, MVD1, EC 4.1.1.33. 검정: Biochemistry, 33:13355-13362, 1994; IDI; 이소펜테닐-디포스페이트 델타-이성화효소, IDI1, EC 5.3.3.2. 검정: J. Biol. Chem. 264:19169-19175, 1989. DXP 경로: DXS; 1-데옥시자일루로오스-5-포스페이트 신타아제, dxs, EC 2.2.1.7. 검정: PNAS, 94:12857-62, 1997; DXR; 1-데옥시-D-자일루로오스 5-포스페이트 환원이성화효소, dxr, EC 2.2.1.7. 검정: Eur. J. Biochem. 269:4446-4457, 2002; MCT; 4-디포스포시티딜-2C-메틸-D-에리트리톨 신타아제, IspD, EC 2.7.7.60. 검정: PNAS, 97:6451-6456, 2000; CMK; 4-디포스포시티딜-2-C-메틸-D-에리트리톨 키나아제, IspE, EC 2.7.1.148. 검정: PNAS, 97:1062- 1067, 2000; MCS; 2C-메틸-D-에리트리톨 2,4-시클로디포스페이트 신타아제, IspF, EC 4.6.1.12. 검정: PNAS, 96:11758-11763, 1999; HDS; 1-하이드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 신타아제, ispG, EC 1.17.4.3. 검정: J. Org. Chem., 70:9168 -9174, 2005; HDR; 1-하이드록시-2-메틸-2-(E)-부테닐 4-디포스페이트 환원효소, IspH, EC 1.17.1.2. 검정: JACS, 126:12847- 12855, 2004.
도 19B는 고전적, 및 변형된 MVA 경로를 설명한다. 1, 아세틸-CoA 아세틸트랜스퍼라아제 (AACT); 2, HMG-CoA 신타아제 (HMGS); 3, HMG-CoA 환원효소 (HMGR); 4, 메발로네이트 키나아제 (MVK); 5, 포스포메발로네이트 키나아제 (PMK); 6, 디포스포메발로네이트 데카르복실라아제 (MVD 또는 DPMDC); 7, 이소펜테닐 디포스페이트 이성화효소 (IDI); 8, 포스포메발로네이트 데카르복실라아제 (PMDC); 9, 이소펜테닐 포스페이트 키나아제 (IPK). 고전적 MVA 경로는 반응 1에서부터 반응 5 및 6을 통해 반응 7로 진행되는 반면, 변형된 MVA 경로는 반응 8 및 9를 통해 반응 7로 진행된다. 구조식에서 P 및 PP는 각각 포스페이트 및 피로포스페이트이다. 상기 도면은 특히 변형된 MVA 경로의 핵산 및 폴리펩티드에 대해 그 전문이 참고문헌으로 포함된 [Koga 및 Morii, Microbiology and Mol. Biology Reviews, 71:97-120, 2007]에서 취해졌다. 변형된 MVA 경로는, 예를 들어 메타노사르키나 마제이와 같은 일부 고세균성 유기체에 존재한다.
도 20은 쿠주 이소프렌 신타아제 유전자가 없거나 (좌측) 있는 (우측) 재조합 Y. 리포리티카 (Y. lipolytica) 균주에 의한 이소프렌의 GC-MS 분석의 결과를 나타내는 그래프를 보여준다. 화살표는 본래 이소프렌 표준의 용리 시간을 나타낸다.
도 21은 pTrcKudzu yIDI DXS Kan의 지도이다.
도 22는 pTrcKudzu yIDI DXS Kan의 뉴클레오티드 서열이다 (SEQ ID NO:20).
도 23A는 BL21/pTrcKudzukan에서 글루코오스로부터의 이소프렌의 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23B는 BL21/pTrcKudzu yIDI kan에서 글루코오스로부터의 이소프렌 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23C는 BL21/pTrcKudzu DXS kan에서 글루코오스로부터의 이소프렌 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23D는 BL21/pTrcKudzu yIDI DXS kan에서 글루코오스로부터의 이소프렌 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23E는 BL21/pCL PtrcKudzu에서 글루코오스로부터의 이소프렌의 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23F는 BL21/pCL PtrcKudzu yIDI에서 글루코오스로부터의 이소프렌의 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23G는 BL21/pCL PtrcKudzu DXS에서 글루코오스로부터의 이소프렌의 생성을 나타내는 그래프이다. 시간 0은 IPTG (400 ㎛ol)로의 유도 시간이다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 다이아몬드형은 OD600을 나타내고, 원형은 총 이소프렌 생산성 (㎍/L)을 나타내며 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 23H는 BL21/pTrcKudzuIDIDXSkan에서 글루코오스로부터의 이소프렌의 생성을 나타내는 그래프이다. 화살표는 IPTG (400 ㎛ol)로의 유도 시간을 나타낸다. x축은 유도 후 시간이고; y축은 OD600이고 y2축은 이소프렌의 총 생산성 (㎍/상부공간 L) 또는 특이적 생산성 (㎍/상부공간 L/OD)이다. 흑색 다이아몬드형은 OD600을 나타내고, 흑색 삼각형은 이소프렌 생산성 (㎍/L)을 나타내고, 백색 사각형은 이소프렌의 특이적 생산성을 나타낸다 (㎍/L/OD).
도 24는 pTrcKKDyIkIS kan의 지도이다.
도 25는 pTrcKKDyIkIS kan의 뉴클레오티드 서열이다 (SEQ ID NO:33).
도 26은 pCL PtrcUpperPathway의 지도이다.
도 27은 pCL PtrcUpperPathway의 뉴클레오티드 서열이다 (SEQ ID NO:46).
도 28은 nprE 유전자 자리에 B. 서브틸리스 염색체 내 융합을 위한 효모 idi 및 하위 MVA 경로를 함유하는 카세트의 지도를 나타낸다. nprE 상류/하류는 융합을 위한 nprE 유전자 자리로부터의 각각의 서열 1kb를 나타낸다. aprE 프로모터 (알칼리 세린 프로테아제 프로모터)는 aprE 유전자의 프로모터 (-35, -10, +1 전사 시작 위치, RBS)를 나타낸다. MVK1은 효모 메발로네이트 키나아제 유전자를 나타낸다. RBS-PMK는 시작 위치의 바실러스 RBS 상류를 갖는 효모 포스포메발로네이트 키나아제 유전자를 나타낸다. RBS-MPD는 시작 위치의 바실러스 RBS 상류를 갖는 효모 디포스포메발로네이트 데카르복실라아제 유전자를 나타낸다. RBS-IDI는 시작 위치의 바실러스 RBS 상류를 갖는 효모 idi 유전자를 나타낸다. 터미네이터는 B. 아밀로리쿠에파시엔스 (B. amyloliquefaciens)로부터의 알칼리 세린 프로테아제 전사 터미네이터를 나타낸다. SpecR은 스펙티노마이신 내성 마커를 나타낸다. "증폭을 위한 nprE 상류 반복 부분"은 증폭에 사용되는 상류 부위의 직렬 반복을 나타낸다.
도 29는 nprE 유전자 자리에 B. 서브틸리스 염색체 내 융합을 위한 효모 idi 및 하위 MVA 경로를 함유하는 카세트의 뉴클레오티드 서열이다 (SEQ ID NO:47).
도 30은 p9796-poplar의 지도이다.
도 31은 p9796-poplar의 뉴클레오티드 서열이다 (SEQ ID NO:48).
도 32는 pTrcPoplar의 지도이다.
도 33은 pTrcPoplar의 뉴클레오티드 서열이다 (SEQ ID NO:49).
도 34는 pTrcKudzu yIDI Kan의 지도이다.
도 35는 pTrcKudzu yIDI Kan의 뉴클레오티드 서열이다 (SEQ ID NO:50).
도 36은 pTrcKudzuDXS Kan의 지도이다.
도 37은 pTrcKudzuDXS Kan의 뉴클레오티드 서열이다 (SEQ ID NO:51).
도 38은 pCL PtrcKudzu의 지도이다.
도 39는 pCL PtrcKudzu의 뉴클레오티드 서열이다 (SEQ ID NO:52).
도 40은 pCL PtrcKudzu A3의 지도이다.
도 41은 pCL PtrcKudzu A3의 뉴클레오티드 서열이다 (SEQ ID NO:53).
도 42는 pCL PtrcKudzu yIDI의 지도이다.
도 43은 pCL PtrcKudzu yIDI의 뉴클레오티드 서열이다 (SEQ ID NO:54).
도 44는 pCL PtrcKudzu DXS의 지도이다.
도 45는 pCL PtrcKudzu DXS의 뉴클레오티드 서열이다 (SEQ ID NO:55).
도 46은 바이오매스 공급원료로부터의 이소프렌 생성을 나타내는 그래프를 보여준다. 패널 A는 옥수수대로부터의 이소프렌 생성을 나타내고, 패널 B는 바가스로부터의 이소프렌 생성을 나타내고, 패널 C는 침엽수 (softwood) 펄프로부터의 이소프렌 생성을 나타내고, 패널 D는 글루코오스로부터의 이소프렌 생성을 나타내며, 패널 E는 추가적인 공급원료를 갖지 않는 세포로부터의 이소프렌 생성을 나타낸다. 회색 사각형은 표시된 접종 후 시간에서의 배양물의 OD600 측정을 나타내고, 흑색 삼각형은 표시된 접종 후 시간에서의 이소프렌 생성을 나타낸다.
도 47A는 글루코오스가 첨가되지 않은 배양물에서 BL21 (λDE3) pTrcKudzu yIDI DXS (kan)에 의한 이소프렌 생성을 나타내는 그래프를 보여준다. 사각형은 OD600을 나타내고, 삼각형은 생성된 이소프렌을 나타낸다 (㎍/㎖).
도 47B는 BL21 (λDE3) pTrcKudzu yIDI DXS (kan)에 의한 1% 글루코오스 공급원료 반전당으로부터의 이소프렌 생성을 나타내는 그래프를 보여준다. 사각형은 OD600을 나타내고, 삼각형은 생성된 이소프렌을 나타낸다 (㎍/㎖).
도 47C는 BL21 (λDE3) pTrcKudzu yIDI DXS (kan)에 의한 1% 반전당 공급원료로부터의 이소프렌 생성을 나타내는 그래프를 보여준다. 사각형은 OD600을 나타내고, 삼각형은 생성된 이소프렌을 나타낸다 (㎍/㎖).
도 47D는 BL21 (λDE3) pTrcKudzu yIDI DXS (kan)에 의한 1% AFEX 옥수수대 공급원료로부터의 이소프렌 생성을 나타내는 그래프를 보여준다. 사각형은 OD600을 나타내고, 삼각형은 생성된 이소프렌을 나타낸다 (㎍/㎖).
도 48은 이소프렌 생성에 대한 효모 추출물의 효과를 입증하는 그래프를 보여준다. 패널 A는 가변적 양의 효모 추출물이 공급된 발효기 내의 광학 밀도의 시간 추이를 나타낸다. 패널 B는 가변적 양의 효모 추출물이 공급된 발효기 내의 이소프렌 역가의 시간 추이를 나타낸다. 역가는 발효 브로쓰의 ℓ당 생성된 이소프렌의 양으로서 정의된다. 패널 C는 유가식 배양물에서 성장시킨 대장균에서 이소프렌 생성에 대한 효모 추출물의 효과를 나타낸다.
도 49는 pTrcKudzu 및 yIDI 및 DXS 플라스미드를 함유하는 대장균 세포로 500ℓ 생물반응기에서 이소프렌을 생성하는 것을 입증하는 그래프를 나타낸다. 패널 A는 글루코오스 및 효모 추출물이 공급된 500ℓ 생물반응기 내의 광학 밀도의 시간 추이를 나타낸다. 패널 B는 글루코오스 및 효모 추출물이 공급된 500ℓ 생물반응기 내의 이소프렌 역가의 시간 추이를 나타낸다. 역가는 발효 브로쓰의 ℓ당 생성된 이소프렌의 양으로서 정의된다. 패널 C는 글루코오스 및 효모 추출물이 공급된 500ℓ 생물반응기로부터 생성된 총 이소프렌의 시간 추이를 나타낸다.
도 50은 pJMupperpathway2의 지도이다.
도 51은 pJMupperpathway2의 뉴클레오티드 서열이다 (SEQ ID NO:56).
도 52는 pBS Kudzu #2의 지도이다.
도 53A는 14ℓ 유가식 발효에서 재조합 쿠주 이소프렌 신타아제를 발현하는 바실러스의 발효 시간 동안의 성장을 나타내는 그래프이다. 흑색 다이아몬드형은 재조합 이소프렌 신타아제를 갖지 않는 대조군 균주 (BG3594comK) (선천적 이소프렌 생성)를 나타내고, 회색 삼각형은 pBSKudzu를 갖는 바실러스 (재조합 이소프렌 생성)를 나타낸다.
도 53B는 14ℓ 유가식 발효에서 재조합 쿠주 이소프렌 신타아제를 발현하는 바실러스의 발효 시간 동안의 이소프렌 생성을 나타내는 그래프이다. 흑색 다이아몬드형은 재조합 이소프렌 신타아제를 갖지 않는 대조군 균주 (BG3594comK) (선천적 이소프렌 생성)를 나타내고, 회색 삼각형은 pBSKudzu를 갖는 바실러스 (재조합 이소프렌 생성)를 나타낸다.
도 54는 플라스미드 pET24 P.alba HGS의 지도이다.
도 55A 및 55B는 플라스미드 pET24 P.alba HGS의 뉴클레오티드 서열이다 (SEQ ID NO:87).
도 56은 플라스미드 EWL230을 구성하기 위한 엔도뉴클레아제 소화에 사용된 제한 위치, 및 BspHI과 NcoI 위치 사이의 부착 말단을 나타내는 도식적 그림이다.
도 57은 플라스미드 EWL230의 지도이다.
도 58A 및 58B는 플라스미드 EWL230의 뉴클레오티드 서열이다 (SEQ ID NO:88).
도 59는 플라스미드 EWL244를 구성하기 위한 엔도뉴클레아제 소화에 사용된 제한 위치, 및 NsiI과 PstI 위치 사이의 부착 말단을 나타내는 도식적 그림이다.
도 60은 EWL244의 지도이다.
도 61A 및 61B는 플라스미드 EWL244의 뉴클레오티드 서열이다 (SEQ ID NO:89).
도 62는 플라스미드 MCM484-487의 지도이다.
도 63A~63C는 플라스미드 MCM484의 뉴클레오티드 서열이다 (SEQ ID NO:90).
도 64A~64C는 플라스미드 MCM485의 뉴클레오티드 서열이다 (SEQ ID NO:91).
도 65A~65C는 플라스미드 MCM486의 뉴클레오티드 서열이다 (SEQ ID NO:92).
도 66A~66C는 플라스미드 MCM487의 뉴클레오티드 서열이다 (SEQ ID NO:93).
도 67A~67D는 MVA 경로로부터의 유전자를 발현하고, 효모 추출물 공급 없이 15ℓ 규모의 유가식 배양에서 성장하는 대장균 균주 (EWL256)에 의한 이소프렌 생성의 그래프이다. 도 67A는 글루코오스가 공급된 15ℓ 생물반응기 내의 광학 밀도의 시간 추이를 나타낸다. 도 67B는 글루코오스가 공급된 15ℓ 생물반응기 내의 이소프렌 역가의 시간 추이를 나타낸다. 역가는 발효 브로쓰의 ℓ당 생성된 이소프렌의 양으로서 정의된다. 도 67C는 글루코오스가 공급된 15ℓ 생물반응기로부터 생성된 총 이소프렌의 시간 추이를 나타낸다. 도 67D는 글루코오스가 공급된 15ℓ 생물반응기 내의 총 이산화탄소 발생 속도 (TCER), 또는 대사작용 활성 프로필을 나타낸다.
도 68A~68E는 MVA 경로로부터의 유전자를 발현하며, 효모 추출물이 공급된 15ℓ 규모의 유가식 배양에서 성장한 대장균 균주 (EWL256)에 의한 이소프렌 생성의 그래프이다. 도 68A는 글루코오스가 공급된 15ℓ 생물반응기 내의 광학 밀도의 시간 추이를 나타낸다. 도 68B는 글루코오스가 공급된 15ℓ 생물반응기 내의 이소프렌 역가의 시간 추이를 나타낸다. 역가는 발효 브로쓰의 ℓ당 생성된 이소프렌의 양으로서 정의된다. 도 68C는 글루코오스가 공급된 15ℓ 생물반응기로부터 생성된 총 이소프렌의 시간 추이를 나타낸다. 도 68D는 글루코오스가 공급된 15ℓ 생물반응기 내의 체적 생산성을 나타낸다. 1.1 g/L/시간의 평균값은 효모 추출물 공급과 함께 40시간의 기간 (23~63시간) 동안 유지되었다. 도 68E는 글루코오스가 공급된 15ℓ 생물반응기 내의 이산화탄소 발생 속도 (CER), 또는 대사작용 활성 프로필을 나타낸다.
도 69A~69D는 MVA (경로)를 통한 상이한 탄소원으로부터의 이소프렌의 생성을 나타낸다. 도 69A는 유일한 탄소원으로서 글루코오스, 바이오매스 가수분해물, 글리세롤 또는 아세테이트에서, MVA 경로 및 이소프렌 신타아제를 모두 함유하는 대장균 EWL256의 성장을 나타낸다. 상이한 탄소원을 배지 중 1%의 농도로 첨가하였다. 탄소원이 첨가되지 않은 음성 대조군을 포함시켰다. 600 nM에서 광학 밀도로서 성장을 측정하였다. 도 69B는 유일한 탄소원으로서 글루코오스, 바이오매스 가수분해물, 글리세롤 또는 아세테이트에서 성장하는 경우, MVA 경로 및 이소프렌 신타아제를 모두 함유하는 대장균 EWL256으로부터의 이소프렌의 특이적 생산성을 나타낸다. 상이한 탄소원을 배지 중 1%의 농도로 첨가하였다. 탄소원이 첨가되지 않은 음성 대조군을 포함시켰다. 접종 190분 후, 255분 후 및 317분 후 샘플을 취하고, GC-MS를 사용하여 세균에 의해 생성된 이소프렌을 측정하였다. 도 69C는 유일한 탄소원으로서 글루코오스 또는 자일로오스에서 대장균 EWL256의 성장을 나타낸다. 상이한 탄소원을 배지 중 1%의 농도로 첨가하였다. 탄소원이 첨가되지 않은 음성 대조군을 포함시켰다. 60O nM에서 광학 밀도로서 성장을 측정하였다. 도 69D는 유일한 탄소원으로서 글루코오스 또는 자일로오스에서 성장하는 경우 대장균 EWL256으로부터의 이소프렌의 특이적 생산성을 나타낸다. 탄소원을 배지 중 1%의 농도로 첨가하였다. 탄소원이 첨가되지 않은 음성 대조군을 포함시켰다. 접종 260분 후, 322분 후 및 383분 후 샘플을 취하고, GC-MS를 사용하여 세균에 의해 생성된 이소프렌을 측정하였다.
도 7OA 및 7OB는 각각 글루코오스 및 지방산으로부터 대장균에 의한 이소프렌의 생성을 나타낸다. 도 7OA에 대하여, WW4를 pMCM118 (하위 메발론산 통로를 포함하는 플라스미드)로 형질전환한 것으로부터의 11개 콜로니를 골라 하위 통로의 존재를 확인하였다. 콜로니로부터의 세포를 0.1% 효모 추출물 및 2% 글루코오스를 함유하는 TM3 배지에서 배양하였다. 유도된 배양물의 분취액을, 유도 4시간 후 이소프렌 생성에 대해 검정하였다. 모든 콜로니가 이소프렌의 생성을 나타내었다. 50에서 900 uM 농도의 유도제에 대해 3에서 4.6배 감소된 세포 밀도에서 명백한 바와 같이, 유도제 IPTG는 강력한 성장 억제 효과를 가졌다 (데이터는 나타내지 않음). 그래프는 더 높은 유도로 이소프렌의 더 높은 특이적 역가가 수득된다는 것을 나타낸다. 도 7OB에 대하여, 생성 배양물은 세척된 하룻밤 배양물로부터 1 내지 10배 희석물로 접종되었다. 배양물은 수 시간 동안 성장하였고, 50 uM IPTG로 유도되었다. 좌측 막대는 유도 4시간 후, 뒤이어 1시간 이소프렌 축적 검정의 이소프렌 검정 결과를 나타낸다. 가운대 막대는 동일한 유도 기간을 가지지만 12시간 이소프렌 축적 검정에 의해 분석된, 동일한 배양물에 대한 1시간 정상화된 값을 나타낸다. 좌측 막대는 13시간 동안 유도된 배양물의 1시간 이소프렌 축적 검정에 대한 값을 나타낸다.
도 71은 Kudzu. Tsr, 티오스트렙톤 내성 유전자로부터 이소프렌 신타아제를 클로닝하는데 사용되는 대장균-스트렙토마이세스 셔틀 벡터 pUWL201PW (6400 bp)의 지도이다. 그림은 [Doumith 등, Mol. Gen. Genet. 264: 477-485, 2000]에서 가져온 것이다.
도 72는 스트렙토마이세스 알부스 (Streptomyces albus) 야생형 균주 ("wt"), 및 플라스미드 pUWL201PW (음성 대조군) 또는 pUWL201_iso (Kudzu로부터 이소프렌 신타아제를 인코딩함)를 갖는 균주에 의한 이소프렌 형성을 나타낸다.
도 73A는 M. 마제이 (M. mazei) 고세균성 하위 경로 오페론의 지도이다.
도 73B 및 73C는 M. 마제이 고세균성 하위 경로 오페론의 뉴클레오티드 서열이다 (SEQ ID NO:113).
도 74A는 M. 마제이 고세균성 Lowerin pET200D로부터의 MCM376 - MVK의 지도이다.
도 74B 및 74C는 M. 마제이 고세균성 Lowerin pET200D로부터의 MCM376 - MVK의 뉴클레오티드 서열이다 (SEQ ID NO:114).
도 75A~75D는 RM11608-2와 비교하여 EWL256에 대한 이소프렌 생성의 특이적 생산성 및 성장을 나타낸다. 성장 (OD550)은 백색 다이아몬드형으로 나타내고; 이소프렌의 특이적 생산성은 고체 막대로 나타낸다. x축은 200 (도 75A 및 75B) 또는 400 (도 75C 및 75D) uM IPTG로의 유도 후 시간 (hr)이다. Y-1축은 이소프렌의 생산성 (ug/L/OD/시간)이고 Y-2축은 550의 파장에서 광학 밀도의 임의 단위 (arbitrary unit)이다. OD550에 대한 이들 값에 6.66을 곱하여 배양물의 실제 OD를 수득하였다.
도 76은 플라스미드 pBBRCMPGI1.5-pgl의 지도이다.
도 77A 및 77B는 플라스미드 pBBRCMPGI1.5-pgl의 뉴클레오티드 서열이다 (SEQ ID NO:122).
도 78A~78F는 M. 마제이 메발로네이트 키나아제, P. 알바 이소프렌 신타아제 및 pgl (RHM111608-2)을 발현하며, 15ℓ 규모의 유가식 배양에서 성장하는 대장균 균주에 의한 이소프렌 생성의 그래프이다. 도 78A는 글루코오스가 공급된 15ℓ 생물반응기 내의 광학 밀도의 시간 추이를 나타낸다. 도 78B는 글루코오스가 공급된 15ℓ 생물반응기 내의 이소프렌 역가의 시간 추이를 나타낸다. 역가는 발효 브로쓰의 ℓ당 생성된 이소프렌의 양으로서 정의된다. 이소프렌을 계산하기 위한 방법: 59시간에서 생성된 축적 이소프렌, 59시간에서의 발효기 부피 당 g, L [=] g/브로쓰 L. 도 78C는 또한 글루코오스가 공급된 15ℓ 생물반응기 내의 이소프렌 역가의 시간 추이를 나타낸다. 이소프렌을 계산하기 위한 방법: ∫(순간 이소프렌 생성 속도, g/L/시간)dt, t = 0 내지 59시간 [=] g/브로쓰 L. 도 78D는 글루코오스가 공급된 15ℓ 생물반응기로부터 생성된 총 이소프렌의 시간 추이를 나타낸다. 도 78E는 글루코오스가 공급된 15ℓ 생물반응기 내의 체적 생산성을 나타낸다. 도 78F는 글루코오스가 공급된 15ℓ 생물반응기 내의 이산화탄소 발생 속도 (CER) 또는 대사작용 활성 프로필을 나타낸다.
도 79A는 플라스미드 pJ201:19813의 지도이다.
도 79B 및 79C는 pJ201:19813의 뉴클레오티드 서열이다 (SEQ ID NO:123).
본 발명의 단지 예시로서 의도되며, 따라서 어떠한 방식으로도 본 발명을 제한하는 것으로 고려되어서는 안 되는 실시예가 또한 기재되며, 상기 토의된 본 발명의 측면 및 구현예가 상술된다. 다르게 나타내지 않는 한, 온도는 섭씨 온도이며 압력은 대기압 또는 대기압에 가깝다. 전술한 예 및 상세한 설명은 실례로서 제공되며, 제한하는 것으로서 제공되지 않는다. 본 명세서에 인용된 모든 발행물, 특허 출원 및 특허는 각각의 개별적 발행물, 특허 출원 또는 특허가 참고문헌으로 포함되는 것으로 구체적이고 개별적으로 나타내어지는 것처럼 참고문헌으로 본원에 포함된다. 특히, 본원에 인용된 모든 발행물은 발명과 관련하여 사용될 수 있는 조성물 및 방법론을 기재하고 개시하기 위해 본원에 명백히 포함된다. 전술한 발명이 명쾌한 이해를 위한 실례 및 예시로서 일부 상세히 기재되지만, 본 발명의 교시의 관점에 있어서 첨부된 청구항의 취지 및 범주에서 벗어나지 않고 특정 변화 및 변경이 발명에 대해 만들어질 수 있다는 것이 당업자에게 용이하게 명백할 것이다.
실시예 1: 재조합 쿠주 이소프렌 신타아제를 발현하는 대장균에서의 이소프렌의 생성
I. 대장균에서 쿠주 이소프렌 신타아제를 발현하기 위한 벡터의 구성
쿠주 (푸에라리아 몬타나) 이소프렌 신타아제 유전자 (IspS)에 대한 단백질 서열을 GenBank (AAQ84170)에서 수득하였다. 대장균 코돈 사용을 위해 최적화된 쿠주 이소프렌 신타아제 유전자를 DNA2.0에서 구매하였다 (SEQ ID NO:1). BspLU11I/PstI으로 제한 엔도뉴클레아제 소화시켜 이소프렌 신타아제 유전자를 공급 플라스미드로부터 제거하고, 겔-정제하고, NcoI/PstI으로 소화된 pTrcHis2B (Invitrogen)에 라이게이션하였다. 이소프렌 신타아제 유전자 내의 정지 코돈이 PstI 위치에 대해 5'가 되도록 구성물을 설계하였다. 결과로서, 구성물이 발현되는 경우 His-표지가 이소프렌 신타아제 단백질에 결합하지 않는다. 생성된 플라스미드, pTrcKudzu를 서열분석으로 확인하였다 (도 2 및 3).
이소프렌 신타아제 유전자를 pET16b (Novagen)에 클로닝하였다. 이러한 경우, 재조합 이소프렌 신타아제 단백질이 N-말단 His 표지를 함유하도록 이소프렌 신타아제 유전자를 pET16b에 삽입하였다. 프라이머 세트 pET-His-Kudzu-2F: 5'-CGTGAGATCATATGTGTGCGACCTCTTCTCAATTTAC (SEQ ID NO:3) 및 pET-His-Kudzu-R: 5'-CGGTCGACGGATCCCTGCAGTTAGACATACATCAGCTG (SEQ ID NO:4)를 사용하여 PCR로 pTrcKudzu로부터 이소프렌 신타아제 유전자를 증폭하였다. 이들 프라이머는 각각 유전자의 5'-말단에서 NdeI 위치, 및 3'-말단에서 BamHI 위치를 첨가한다. 상기 기재된 플라스미드 pTrcKudzu를 주형 DNA로서 사용하고, Herculase 중합효소 (Stratagene)를 제조사의 지시에 따라 사용하고, 프라이머를 10 pMol의 농도로 첨가하였다. PCR를 25 ㎕의 총 부피로 실행하였다. PCR 생성물을 NdeI/BamHI으로 소화시키고, 동일한 효소로 소화된 pET16b에 클로닝하였다. 라이게이션 믹스를 대장균 Top 10 (Invitrogen)에 형질전환하고 서열분석으로 올바른 클론을 선별하였다. 쿠주 이소프렌 신타아제 유전자가 T7 프로모터로부터 발현된 생성된 플라스미드를 pETNHisKudzu로 지정하였다 (도 4 및 5).
또한 쿠주 이소프렌 신타아제 유전자를 낮은 카피 수 플라스미드 pCL1920에 클로닝하였다. 프라이머를 사용하여 상기 기재된 pTrcKudzu로부터 쿠주 이소프렌 신타아제 유전자를 증폭하였다. 정방향 프라이머는 HindIII 위치 및 대장균 공통 (consensus) RBS를 5' 말단에 첨가하였다. PstI 클로닝 위치는 이미 pTrcKudzu 정지 코돈의 바로 3'에 존재하며, 따라서 역방향 프라이머를 최종 PCR 생성물이 PstI 위치를 포함하도록 구성하였다. 프라이머의 서열은 하기와 같다: HindIII-rbs-Kudzu F: 5'-CATATGAAAGCTTGTATCGATTAAATAAGGAGGAATAAACC (SEQ ID NO:6) 및 BamHI-Kudzu R: 5'-CGGTCGACGGATCCCTGCAGTTAGACATACATCAGCTG (SEQ ID NO:4). 10 pmol 농도의 프라이머 및 1 ng의 주형 DNA (pTrcKudzu)와 함께 Herculase 중합효소를 사용하여 PCR 생성물을 증폭하였다. 증폭 프로토콜에는 [95℃에서 1분, 60℃에서 1분, 72℃에서 2분]의 30 사이클이 포함되었다. 생성물을 HindIII 및 PstI으로 소화시키고, HindIII 및 PstI으로 또한 소화된 pCL1920에 라이게이션시켰다. 라이게이션 믹스를 대장균 Top 10에 형질전환하였다. 여러 형질전환체를 서열분석으로 확인하였다. 생성된 플라스미드를 pCL-lac-Kudzu로 지정하였다 (도 6 및 7).
II. 이소프렌 생성의 측정
진탕 플라스크 배양물에 대해, 1 ㎖의 배양물을 진탕 플라스크로부터 20 ㎖ CTC 상부공간 바이알 (Agilent 바이알 카탈로그 번호 5188 2753; 마개 카탈로그 번호 5188 2759)로 옮겼다. 마개를 단단히 조이고, 바이알을 250 rpm에서 진탕하면서 동등한 온도에서 인큐베이션하였다. 30분 후 바이알을 인큐베이터에서 제거하고 하기 기재한 바와 같이 분석하였다 (이러한 검정으로부터의 일부 실험적 값에 대하여 표 1 참조).
발효기 내의 이소프렌 생성이 측정된 경우, 발효기의 배출 기체로부터 샘플을 취하고 하기 기재된 바와 같이 직접적으로 분석하였다 (이러한 검정으로부터의 일부 실험적 값에 대하여 표 2 참조).
상부공간 방식으로 작동하는 CTC Analytics (Switzerland) CombiPAL 오토샘플러가 연결된 Agilent 6890 GC/MS 시스템을 사용하여 분석을 수행하였다. Agilent HP-5MS GC/MS 컬럼 (30 m x 0.25 mm; 0.25 ㎛ 필름 두께)을 분석물을 분리하는데 사용하였다. 샘플러를 500 ㎕의 상부공간 기체가 주입되도록 설정하였다. GC/MS 방법은 1 ㎖/분의 흐름으로 담체로서 헬륨을 이용하였다. 주입 포트를 50:1의 살포 비율로 250℃에서 고정하였다. 분석하는 동안 오븐 온도를 37℃에서 2분 동안 고정하였다. Agilent 5793N 질량 선택 검출기를 m/z 67 상 단일 이온 모니터링 (SIM) 방식으로 실행시켰다. 검출기를 1.4 내지 1.7분에서 스위치를 꺼서 영구 기체가 용리되게 하였다. 이들 조건 하에 이소프렌 (2-메틸-1,3-부타디엔)이 관찰되어 1.78분에서 용리하였다. 교정 표를 사용하여 이소프렌의 절대량을 정량하였고, 1 ㎍/L 내지 200 ㎍/L로 선형인 것으로 발견되었다. 검출 한계는 이러한 방법을 사용하여 50 내지 100 ng/L인 것으로 추정되었다.
III. 재조합 이소프렌 신타아제를 발현하는 대장균 세포를 함유하는 진탕 플라스크에서의 이소프렌 생성
상기 기재된 벡터를 대장균 균주 BL21 (Novagen)에 도입하여 균주 BL21/ptrcKudzu, BL21/pCL-lac-Kudzu 및 BL21/pETHisKudzu를 생성시켰다. 단리를 위해 상기 균주를 LA (루리아 한천) 및 카르베니실린 (50 ㎍/㎖) 상에 스프레딩하고 37℃에서 하룻밤 동안 인큐베이션하였다. 단일 콜로니를 20 ㎖ 루리아 베르타니 브로쓰 (LB) 및 카르베니실린 (100 ㎍/㎖)을 함유하는 250 ㎖ 배플드 (baffled) 진탕 플라스크에 접종하였다. 배양물을 200 rpm에서 진탕하면서 20℃에서 하룻밤 동안 성장시켰다. 하룻밤 배양물의 OD600을 측정하고 배양물을 30 ㎖ MagicMedia (Invitrogen) 및 카르베니실린 (100 ㎍/㎖)을 함유하는 250 ㎖ 배플드 진탕 플라스크 내로 OD600 약 0.05가 되도록 희석하였다. 배양물을 200 rpm에서 진탕하면서 30℃에서 인큐베이션하였다. OD60O 약 0.5~0.8일 때 400 μM IPTG를 첨가하고 세포를 추가 6시간 동안 200 rpm에서 진탕하면서 30℃에서 인큐베이션하였다. IPTG로 유도한 0, 2, 4 및 6시간 후, 배양물의 1 ㎖ 분취액을 수집하고, OD600을 측정하고 생성된 이소프렌의 양을 상기 기재된 바와 같이 측정하였다. 결과를 도 8에 나타내었다.
IV. 14ℓ 발효에서 BL21/ptrcKudzu로부터 이소프렌의 생성
재조합 쿠주 이소프렌 신타아제 유전자를 함유하는 대장균으로부터의 이소프렌의 대규모 생성이 유가식 배양에서 측정되었다. 발효 배지의 ℓ 당 발효 배지 (TM2)의 제조 방법은 하기와 같다: K2HPO4 13.6 g, KH2PO4 13.6 g, MgSO4 * 7H2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, (NH4)2SO4 3.2 g, 효모 추출물 5 g, 1000X 변형 미량 금속 용액 1 ㎖. 모든 성분을 diH2O에 함께 첨가하고 용해하였다. 수산화칼륨 (KOH)으로 pH를 6.8로 조정하고 부피에 대해 충분량이 되게 하였다. 최종 생성물을 0.22 μ 필터 (단독, 오토클레이브하지 않은)로 여과 멸균하였다. 1000X 변형 미량 금속 용액에 대한 제조 방법은 하기와 같다: 시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 diH2O에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0이 되게 하고, 부피에 대해 충분량이 되게 하고 0.22 μ 필터로 여과 멸균하였다.
이러한 실험을 14ℓ 생물반응기에서 실행하여 원하는 발효, pH 6.7 및 온도 34℃에서 글루코오스로부터 이소프렌이 형성되는 것을 모니터링하였다. 동결 바이알에서 취한 대장균 균주 BL21/ptrcKudzu의 접종물을 소이톤-효모 추출물-글루코오스 배지에서 제조하였다. 접종물이 OD550 = 0.6으로 성장한 후, 두 개의 600 ㎖ 플라스크를 원심분리하고, 세포 펠릿을 생물반응기에 옮기기 위해 내용물을 70 ㎖ 상청액에 재현탁하였다 (70 ㎖의 OD 3.1 물질). 접종 후 다양한 시간 지점에서, 샘플을 제거하고 생성된 이소프렌의 양을 상기 기재한 바와 같이 측정하였다. 결과를 도 9에 나타내었다.
실시예 2: 재조합 포플러 이소프렌 신타아제를 발현하는 대장균에서의 이소프렌의 생성
포플러 (포풀루스 알바 x 포풀루스 트레물라) 이소프렌 신타아제에 대한 단백질 서열 (Schnitzler, J-P, 등. (2005) Planta 222:777-786)을 GenBank (CAC35696)에서 수득하였다. 대장균에 대해 코돈 최적화된 유전자를 DNA2.0d에서 구매하였다 (p9796-poplar, 도 30 및 31). BspLU11I/PstI으로 제한 엔도뉴클레아제 소화시켜 이소프렌 신타아제 유전자를 공급 플라스미드로부터 제거하고, 겔-정제하고, NcoI/PstI으로 소화된 pTrcHis2B에 라이게이션하였다. 이소프렌 신타아제 유전자를 공급 플라스미드로부터 제거하였다. 삽입물 내의 정지 코돈이 PstI 위치 전에 있도록 구성물을 클로닝하여, His-표지가 이소프렌 신타아제 단백질에 결합하지 않게 하였다. 생성된 플라스미드 pTrcPoplar (도 32 및 33)를 서열분석으로 확인하였다.
실시예 3: 재조합 쿠주 이소프렌 신타아제를 발현하는 판토에아 시트레아에서의 이소프렌의 생성
실시예 1에서 기재된 pTrcKudzu 및 pCL-lac Kudzu 플라스미드를 P. 시트레아 내로 전기천공하였다 (미국 특허 제 7,241,587 호). 각각 카르베니실린 (200 ㎍/㎖) 또는 스펙티노마이신 (50 ㎍/㎖)을 함유하는 LA에서 형질전환체를 선별하였다. 진탕 플라스크로부터의 이소프렌의 생성 및 생성된 이소프렌 양의 측정을 재조합 쿠주 이소프렌 신타아제를 발현하는 대장균 균주에 대해 실시예 1에서 기재된 바와 같이 수행하였다. 결과를 도 10에 나타내었다.
실시예 4: 재조합 쿠주 이소프렌 신타아제를 발현하는 바실러스 서브틸리스에서의 이소프렌의 생성
I. 쿠주 이소프렌 신타아제의 발현을 위한 B. 서브틸리스 복제 플라스미드의 구성
aprE 프로모터의 조절 하에 복제 플라스미드 (클로람페니콜 내성 카세트를 갖는 pBS19)를 사용하여 쿠주 이소프렌 신타아제 유전자를 바실러스 서브틸리스 aprEnprE Pxyl-comK 균주 (BG3594comK)에서 발현시켰다. 이소프렌 신타아제 유전자, aprE 프로모터 및 전사 터미네이터를 PCR을 사용하여 개별적으로 증폭하고 융합하였다. 구성물을 이후 pBS19에 클로닝하고 B. 서브틸리스에 형질전환시켰다.
a) aprE 프로모터의 증폭
하기의 프라이머를 사용하여 바실러스 서브틸리스의 염색체 DNA에서 aprE 프로모터를 증폭하였다:
CF 797 (+) 시작 aprE 프로모터 MfeI
5'-GACATCAATTGCTCCATTTTCTTCTGCTATC (SEQ ID NO:58)
CF 07-43 (-) Kudzu ispS에 대한 aprE 프로모터 융합
5'-ATTGAGAAGAGGTCGCACACACTCTTTACCCTCTCCTTTTA (SEQ ID NO:59)
b) 이소프렌 신타아제 유전자의 증폭
쿠주 이소프렌 신타아제 유전자를 플라스미드 pTrcKudzu로부터 증폭하였다 (SEQ ID NO:2). 유전자를 대장균에 대해 코돈 최적화하고 DNA 2.0으로 합성하였다. 하기 프라이머를 사용하였다:
CF 07-42 (+) 쿠주 이소프렌 신타아제 유전자에 대한 aprE 프로모터 융합 (GTG 시작 코돈)
5'-TAAAAGGAGAGGGTAAAGAGTGTGTGCGACCTCTTCTCAAT (SEQ ID NO:60)
CF 07-45 (-) 터미네이터에 대한 쿠주 이소프렌 신타아제의 3' 말단 융합
5'-CCAAGGCCGGTTTTTTTTAGACATACATCAGCTGGTTAATC (SEQ ID NO:61)
c) 전사 터미네이터의 증폭
하기의 프라이머를 사용하여, 바실러스 아밀로리쿠에파시엔스의 알칼리 세린 프로테아제로부터의 터미네이터를 이전에 서열분석된 플라스미드 pJHPms382로부터 증폭하였다:
CF 07-44 (+) 터미네이터에 대한 쿠주 이소프렌 신타아제의 3' 말단 융합
5'-GATTAACCAGCTGATGTATGTCTAAAAAAAACCGGCCTTGG (SEQ ID NO:62)
CF 07-46 (-) B. 아밀로리쿠에파시엔스 터미네이터의 말단 (BamHI)
5'-GACATGACGGATCCGATTACGAATGCCGTCTC (SEQ ID NO:63)
하기의 프라이머로 PCR을 사용하여 쿠주 절편을 터미네이터 절편에 융합하였다:
CF 07-42 (+) 쿠주 이소프렌 신타아제 유전자에 대한 aprE 프로모터 융합 (GTG 시작 코돈)
5'-TAAAAGGAGAGGGTAAAGAGTGTGTGCGACCTCTTCTCAAT (SEQ ID NO:61)
CF 07-46 (-) B. 아밀로리쿠에파시엔스 터미네이터의 말단 (BamHI)
5'-GACATGACGGATCCGATTACGAATGCCGTCTC (SEQ ID NO:63)
하기의 프라이머로 PCR을 사용하여 쿠주-터미네이터 절편을 프로모터 절편에 융합하였다:
CF 797 (+) 시작 aprE 프로모터 MfeI
5'-GACATCAATTGCTCCATTTTCTTCTGCTATC (SEQ ID NO:64)
CF 07-46 (-) B. 아밀로리쿠에파시엔스 터미네이터의 말단 (BamHI)
5'-GACATGACGGATCCGATTACGAATGCCGTCTC (SEQ ID NO:63)
Qiagen 키트를 사용하여 융합 PCR 절편을 정제하고 제한 효소 MfeI 및 BamHI으로 소화시켰다. 이러한 소화된 DNA 절편을 Qiagen 키트를 사용하여 겔 정제하고, EcoRI 및 BamHI으로 소화된 pBS19으로 알려진 벡터에 라이게이션하고 겔 정제하였다.
라이게이션 믹스를 대장균 Top 10 세포에 형질전환시키고, LA 및 50 카르베니실린 플레이트 상에서 콜로니를 선별하였다. 총 6개 콜로니를 선택하고 LB 및 50 카르베니실린에서 하룻밤 동안 성장시킨 후, Qiagen 키트를 사용하여 플라스미드를 단리하였다. 플라스미드를 EcoRI 및 BamHI으로 소화시켜 삽입물에 대해 확인하고, 하기의 프라이머로의 서열분석을 위해 3개의 올바른 플라스미드를 발송하였다:
CF 149 (+) aprE 프로모터의 EcoRI 출발
5'-GACATGAATTCCTCCATTTTCTTCTGC (SEQ ID NO:65)
CF 847 (+) pXX 049에서의 서열 (aprE 프로모터의 말단)
5'-AGGAGAGGGTAAAGAGTGAG (SEQ ID NO:66)
CF 07-45 (-) 터미네이터에 대한 쿠주 이소프렌 신타아제의 3' 말단 융합
5'-CCAAGGCCGGTTTTTTTTAGACATACATCAGCTGGTTAATC (SEQ ID NO:61)
CF 07-48 (+) 쿠주 이소프렌 신타아제에 대한 서열분석 프라이머
5'-CTTTTCCATCACCCACCTGAAG (SEQ ID NO:67)
CF 07-49 (+) 쿠주 이소프렌 신타아제에서의 서열분석
5'-GGCGAAATGGTCCAACAACAAAATTATC (SEQ ID NO:68)
pBS Kudzu #2로 지정된 플라스미드 (도 52 및 12)를 서열분석으로 바로잡고, BG 3594 comK, 바실러스 서브틸리스 숙주 균주에 형질전환시켰다. LA 및 5 클로람페니콜 플레이트 상에서 선별하였다. 형질전환체를 LA 및 5 클로람페니콜 상에서 선택하고 단일 콜로니를 분리한 후, 1.5의 OD600이 될 때까지 LB 및 5 클로람페니콜에서 성장시켰다. 글리세롤의 존재 하에 -80℃에서 바이알 내에 동결 보관하였다. 생성된 균주를 CF 443으로 지정하였다.
II. 재조합 이소프렌 신타아제를 발현하는 B. 서브틸리스 세포를 함유하는 진탕 플라스크에서의 이소프렌의 생성
하룻밤 배양물에 LA 및 클로람페니콜 (Cm, 25 ㎍/㎖)로부터의 CF 443의 단일 콜로니를 접종하였다. 배양물을 LB 및 Cm에서 200 rpm에서 진탕하면서 37℃에서 성장시켰다. 이들 하룻밤 배양물 (1 ㎖)을, 25 ㎖ Grants II 배지 및 클로람페니콜을 함유하는 250 ㎖ 배플드 진탕 플라스크에 25 ㎍/㎖의 최종 농도로 접종하는데 사용하였다. Grants II 배지의 제조 방법은 하기와 같고: 10 g 소이톤, 3 ㎖ 1M K2HPO4, 75 g 글루코오스, 3.6 g 우레아, 100 ㎖ 10X MOPS, 1ℓ가 되게 하는 충분량의 H2O, pH 7.2; 10X MOPS 제조 방법은 하기와 같으며: 83.72 g MOPS, 7.17 g 트리신 (tricine), 12 g KOH 펠릿, 10 ㎖ 0.276M K2SO4 용액, 10 ㎖ 0.528M MgCl2 용액, 29.22 g NaCl, 100 ㎖ 100X 미량영양소, 1ℓ가 되게 하는 충분량의 H2O; 100X 미량영양소의 제조 방법은 하기와 같다: 1.47 g CaCl2*2H2O, 0.4 g FeSO4*7H20, 0.1 g MnSO4*H20, 0.1 g ZnSO4*H2O, 0.05 g CuCl2*2H2O, 0.1 g CoCl2*6H2O, 0.1 g Na2MoO4*2H2O, 1ℓ가 되게 하는 충분량의 H2O. 진탕 플라스크를 37℃에서 인큐베이션하고, 샘플을 18, 24 및 44시간에 취하였다. 18시간에서, CF443 및 대조군 균주의 상부공간을 샘플링하였다. 이는 이소프렌의 18시간의 축적을 나타내었다. 이소프렌의 양을 실시예 1에서 기재한 바와 같이 기체 크로마토그래피로 측정하였다. 이소프렌의 생성은 재조합 이소프렌 신타아제를 발현시킴으로써 유의하게 증강되었다 (도 11).
III. 14ℓ 발효에서 CF443에 의한 이소프렌의 생성
복제 플라스미드 상에서 재조합 쿠주 이소프렌 신타아제 유전자를 함유하는 B. 서브틸리스로부터의 이소프렌의 대규모 생성이 유가식 배양에서 측정되었다. 쿠주 이소프렌 신타아제 유전자를 발현하는 바실러스 균주 CF 443, 또는 쿠주 이소프렌 신타아제 유전자를 발현하지 않는 대조군 균주를 대두박 (Cargill), 인산나트륨 및 인산 칼륨, 황화마그네슘 및 시트르산 용액, 염화 제2철 및 염화망간을 함유하는 영양 배지에서의 통상적인 유가식 발효에 의해 배양하였다. 발효 전, 배지를 셀룰라아제, 헤미셀룰라아제 및 펙티나아제를 포함하는 효소의 혼합물을 사용하여 90분 동안 연화시켰다 (WO95/04134 참조). 14ℓ 회분식 발효에 60% wt/wt 글루코오스 (Cargill DE99 덱스트로오스, ADM Versadex greens 또는 Danisco 반전당) 및 99% wt/wt 오일 (Western Family 콩기름, 99% wt/wt는 세포 배양 배지에 첨가되기 전 오일의 농도임)을 공급하였다. 회분 내의 글루코오스가 측정불가할 때 공급을 시작하였다. 공급 속도는 몇 시간에 걸쳐 사면화하였고, 동일한 탄소 기준에서 오일이 첨가되어 조정되었다. 28% w/v 수산화암모늄을 사용하여 pH를 6.8~7.4로 조절하였다. 거품의 경우에는 항거품제를 배지에 첨가하였다. 발효 온도를 37℃에서 조절하고, 발효 배양물을 750 rpm에서 휘저었다. pH, DO%, 공기흐름 및 압력과 같은 다양한 기타 매개변수를 전체 절차 동안 내내 모니터링하였다. DO%를 20 초과로 유지하였다. 샘플을 36시간의 시간 추이에 걸쳐 취하고, 세포 성장 (OD550) 및 이소프렌 생성에 대해 분석하였다. 이들 실험의 결과를 도 53A 및 53B에 나타내었다.
IV. B. 서브틸리스에서 쿠주 이소프렌 신타아제 (ispS)의 융합
쿠주 이소프렌 신타아제 유전자를 aprE 프로모터의 조절 하에 융합 플라스미드 (pJH101-cmpR)에서 클로닝하였다. 시험한 조건 하에서는 이소프렌이 검출되지 않았다.
실시예 5: 트리코데르마에서의 이소프렌의 생성
I. 트리코데르마 레에세이에서의 쿠주 이소프렌 신타아제의 발현을 위한 벡터의 구성
야로위야 리포리티카 코돈-최적화된 쿠주 IS 유전자를 DNA 2.0에 의해 합성하였다 (SEQ ID NO:8) (도 13). 상기 플라스미드는 하기의 PCR 증폭 반응을 위한 주형으로서 역할하였다: 1 ㎕ 플라스미드 주형 (20 ng/ul), 1 ㎕ 프라이머 EL-945 (10 uM) 5'-GCTTATGGATCCTCTAGACTATTACACGTACATCAATTGG (SEQ ID NO:9), 1 ㎕ 프라이머 EL-965 (10 uM) 5'-CACCATGTGTGCAACCTCCTCCCAGTTTAC (SEQ ID NO:10), 1 ㎕ dNTP (10 mM), 5 ㎕ 10x PfuUltra II 융합 HS DNA 중합효소 완충액, 1 ㎕ PfuUltra II 융합 HS DNA 중합효소, 40 ㎕ 물 (총 반응 부피 50 ㎕). 정방향 프라이머에는 Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 유전자에 상응하지 않지만 pENTR/D-TOPO 벡터에 클로닝하기 위해 필요한 추가적인 4개 뉴클레오티드가 5'-말단에 포함되었다. 역방향 프라이머에는 Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 유전자에 상응하지 않지만 다른 벡터 골격에 클로닝하기 위해 삽입된 추가적인 21개 뉴클레오티드가 5'-말단에 포함되었다. MJ Research PTC-200 써모사이클러를 사용하여, 하기와 같이 PCR 반응을 수행하였다: 95℃에서 2분 (첫 사이클에서만), 95℃에서 30초, 55℃에서 30초, 72℃에서 30초 (27 사이클 동안 반복), 마지막 사이클 후 72℃에서 1분. PCR 생성물을 1.2% E-겔 상에서 분석하여 Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 유전자의 성공적인 증폭을 확인하였다.
이후, 제조사의 프로토콜에 따라 TOPO pENTR/D-TOPO 클로닝 키트를 사용하여 PCR 생성물을 클로닝하였다: 1 ㎕ PCR 반응, 1 ㎕ 염 용액, 1 ㎕ TOPO pENTR/D-TOPO 벡터 및 3 ㎕ 물 (총 반응 부피 6 ㎕). 반응물을 실온에서 5분 동안 인큐베이션하였다. 1 ㎕의 TOPO 반응물을 TOP 10 화학적 수용성 (competent) 대장균 세포에 형질전환시켰다. 형질전환체를 LA 및 50 ㎍/㎖ 카나마이신 플레이트 상에서 선별하였다. 여러 콜로니를 고르고, 각각을 LB 및 50 ㎍/㎖ 카나마이신을 함유하는 5 ㎖ 튜브에 접종하고, 배양물을 200 rpm에서 진탕하면서 37℃에서 하룻밤 동안 성장시켰다. 제조사의 프로토콜에 따라, QIAprep Spin Miniprep 키트를 사용하여 하룻밤 배양 튜브에서 플라스미드를 단리하였다. 여러 플라스미드를 서열분석하여 DNA 서열이 올바른지 확인하였다.
Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 유전자를 인코딩하는 단일 pENTR/D-TOPO 플라스미드를, 주문 제작된 pTrex3g 벡터에 게이트웨이 클로닝 (Gateway Cloning)하는데 사용하였다. pTrex3g의 구성은 WO 2005/001036 A2에 기재되어 있다. 게이트웨이 LR 클로나아제 (Clonase) II 효소 믹스 키트 (Invitrogen)에 대한 제조사의 프로토콜에 따라 반응을 수행하였다: 1 ㎕ Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 유전자 pENTR/D-TOPO 공여자 벡터, 1 ㎕ pTrex3g 목적지 벡터, 6 ㎕ TE 완충액, pH 8.0 (총 반응 부피 8 ㎕). 반응물을 실온에서 1시간 동안 인큐베이션한 후, 1 ㎕ 프로테이나아제 K 용액을 첨가하고 37℃에서 10분 동안 인큐베이션을 지속하였다. 이후 1 ㎕의 반응물을 TOP 10 화학적 수용성 대장균 세포에 형질전환시켰다. 형질전환체를 LA 및 50 ㎍/㎖ 카르베니실린 플레이트 상에서 선별하였다. 여러 콜로니를 고르고, 각각을 LB 및 50 ㎕g/㎖ 카르베니실린을 함유하는 5 ㎖ 튜브에 접종하고 배양물을 200 rpm에서 진탕하면서 37℃에서 하룻밤 동안 성장시켰다. 제조사의 프로토콜에 따라, QIAprep Spin Miniprep 키트 (Qiagen, Inc.)를 사용하여 하룻밤 배양 튜브에서 플라스미드를 단리하였다. 여러 플라스미드를 서열분석하여 DNA 서열이 올바른지 확인하였다.
Y. 리포리티카 코돈-최적화된 쿠주 이소프렌 신타아제 pTrex3g 플라스미드 (도 14)의 쿼드 삭제 트리코데르마 레에세이 균주로의 유전자총 (Biolistic) 형질전환을 유전자총 PDS-1000/HE 입자 전달 시스템을 사용하여 수행하였다 (WO 2005/001036 A2 참조). 특허 출원 WO 2005/001036 A2의 실시예 11에 열거된 프로토콜을 사용하여 안정적인 형질전환체의 단리 및 진탕 플라스크 평가를 수행하였다.
II. T. 레에세이의 재조합 균주에서의 이소프렌의 생성
상기 기재된 이소프렌 신타아제의 15 및 36시간 배양물 1 ㎖를 상부공간 바이알에 옮겼다. 바이알을 밀봉하고 30℃에서 5시간 동안 인큐베이션하였다. 상부공간 기체를 측정하고, 실시예 1에서 기재된 방법으로 이소프렌을 확인하였다. 형질전환체 중 2개가 미량의 이소프렌을 나타내었다. 이소프렌의 양은 14시간 인큐베이션에 의해 증가될 수 있었다. 2개의 양성 샘플은 14시간 인큐베이션에 대해 약 0.5 ㎍/L의 수준으로 이소프렌을 나타내었다. 미형질전환된 대조군은 검출가능한 수준의 이소프렌을 나타내지 않았다. 상기 실험은 외생 이소프렌 신타아제가 공급되는 경우 T. 레에세이가 내인성 전구체로부터 이소프렌을 생성할 수 있다는 것을 나타낸다.
실시예 6: 야로위야에서의 이소프렌의 생성
I. 야로위야 리포리티카에서의 쿠주 이소프렌 신타아제의 발현을 위한 벡터의 구성
야로위야 리포리티카에서 쿠주 이소프렌 신타아제 유전자를 발현하기 위한 벡터의 구성을 위한 시작점은 벡터 pSPZ1 (MAP29Spb)이었다. 상기 벡터의 완전한 서열 (SEQ ID No:11)을 도 15에 나타내었다.
주형으로서 Y. 리포리티카 균주 GICC 120285의 염색체 DNA를 사용하여 PCR로 하기 절편을 증폭하였다: URA3 유전자의 프로모터 없는 형태, 18S 리보솜 RNA 유전자, Y. 리포리티카 XPR2 유전자의 전사 터미네이터, 및 XPR2 및 ICL1 유전자의 프로모터를 함유하는 두 DNA 절편. 하기의 PCR 프라이머를 사용하였다:
ICL13
5'-GGTGAATTCAGTCTACTGGGGATTCCCAAATCTATATATACTGCAGGTGAC (SEQ ID NO:69)
ICL15
5'-GCAGGTGGGAAACTATGCACTCC (SEQ ID NO:70)
XPR3
5'-CCTGAATTCTGTTGGATTGGAGGATTGGATAGTGGG (SEQ ID NO:71)
XPR5
5'-GGTGTCGACGTACGGTCGAGCTTATTGACC (SEQ ID NO:72)
XPRT3
5'-GGTGGGCCCGCATTTTGCCACCTACAAGCCAG (SEQ ID NO:73)
XPRT5
5'-GGTGAATTCTAGAGGATCCCAACGCTGTTGCCTACAACGG (SEQ ID NO:74)
Y18S3
5'-GGTGCGGCCGCTGTCTGGACCTGGTGAGTTTCCCCG (SEQ ID NO:75)
Y18S5
5'-GGTGGGCCCATTAAATCAGTTATCGTTTATTTGATAG (SEQ ID NO:76)
YURA3
5'-GGTGACCAGCAAGTCCATGGGTGGTTTGATCATGG (SEQ ID NO:77)
YURA50
5'-GGTGCGGCCGCCTTTGGAGTACGACTCCAACTATG (SEQ ID NO:78)
YURA51
5'-GCGGCCGCAGACTAAATTTATTTCAGTCTCC (SEQ ID NO:79)
PCR 증폭을 위해 PfuUltraII 중합효소 (Stratagene), 공급자-제공된 완충액 및 dNTP, 2.5 ㎛ 프라이머 및 표시된 주형 DNA를 제조사의 지시사항에 따라 사용하였다. 하기의 사이클을 사용하여 증폭을 수행하였다: 95℃에서 1분; 34x (95℃에서 30초; 55℃에서 30초; 72℃에서 3분) 및 72℃에서 10분 후 4℃ 인큐베이션.
야로위야에서의 발현을 위해 코돈-최적화된 쿠주 이소프렌 신타아제 유전자를 인코딩하는 합성 DNA 분자를 DNA 2.0에서 수득하였다 (도 16; SEQ ID NO:12). 각각 XPR2 및 ICL1 프로모터의 조절 하에 합성 쿠주 이소프렌 신타아제 유전자를 수반하는 플라스미드 pYLA(KZ1) 및 pYLI(KZ1)의 구성 도식의 전체 세부사항을 도 18에 나타내었다. 접합 인자 유전자 (MAP29)가 이소프렌 신타아제 유전자 대신에 삽입된 대조군 플라스미드를 또한 구성하였다 (도 18E 및 18F).
유사한 클로닝 절차를 사용하여 포플러 (포풀루스 알바 x 포풀루스 트레물라) 이소프렌 신타아제 유전자를 발현시켰다. 포플러 이소프렌의 서열은 [Miller B. 등. (2001) Planta 213, 483-487]에서 기재되며, 이를 도 17에 나타내었다 (SEQ ID NO:13). 각각 XPR2 및 ICL1 프로모터의 조절 하에 합성 포플러 이소프렌 신타아제 유전자를 수반하는 플라스미드 pYLA(POP1) 및 pYLI(POP1)을 생성하기 위한 구성 도식을 도 18A 및 B에 나타내었다.
II. Y. 리포리티카의 재조합 균주에 의한 이소프렌의 생성
벡터 pYLA(KZ1), pYLI(KZ1), pYLA(MAP29) 및 pYLI (MAP29)를 SacII로 소화시키고, 우리딘 원영양성 (prototrophy)에 대한 표준 리튬 아세테이트/폴리에틸렌 글리콜 절차에 의해 균주 Y. 리포리티카 CLIB 122를 형질전환하는데 사용하였다. 간략하게는, YEPD (1% 효모 추출물, 2% 펩톤, 2% 글루코오스)에서 하룻밤 동안 성장시킨 효모 세포를 원심분리 (4000 rpm, 10분)로 수집하고, 멸균수로 1회 세척하고 0.1 M 리튬 아세테이트 (pH 6.0)에 현탁하였다. 세포 현탁액의 200 ㎕ 분취액을 선형화 플라스미드 DNA 용액 (10~20 ㎍)과 혼합하고, 실온에서 10분 동안 인큐베이션하고, 동일한 완충액에서의 50% PEG 4000 1 ㎖과 혼합하였다. 현탁액을 실온에서 1시간 동안 추가로 인큐베이션한 후 42℃에서 2분 열 충격을 주었다. 이후 세포를 SC his leu 플레이트 (0.67% 효모 질소 베이스, 2% 글루코오스, 류신 및 히스티딘 각각 100 mg/L) 상에서 플레이팅하였다. 30℃에서 3~4일 인큐베이션한 후 형질전환체가 나타났다.
pYLA(KZ1) 형질전환에서의 3개 단리물, pYLI(KZ1) 형질전환에서의 3개 단리물, pYLA(MAP29) 형질전환에서의 2개 단리물 및 pYLI(MAP29) 형질전환에서의 2개 단리물을 진탕하면서 30℃에서 YEP7 배지 (1% 효모 추출물, 2% 펩톤, pH 7.0)에서 24시간 동안 성장시켰다. 10 ㎖의 배양물에서의 세포를 원심분리로 수집하고, 3 ㎖의 새로운 YEP7에 재현탁하고 15 ㎖ 나사 마개 바이알에 넣었다. 바이알을 부드럽게 (60 rpm) 진탕하면서 실온에서 하룻밤 동안 인큐베이션하였다. 이들 바이알의 상부공간 내의 이소프렌 함량을 실시예 1에서 기재된 바와 같이 질량-분석 검출기를 사용하여 기체 크로마토그래피로 분석하였다. pYLA(KZ1) 및 pYLI(KZ1)로 수득된 모든 형질전환체는 쉽게 검출가능한 양의 이소프렌을 생성하였다 (0.5 ㎍/L 내지 1 ㎍/L, 도 20). 이소프렌은 이소프렌 신타아제 유전자 대신 피타아제 유전자를 수반하는 대조군 균주의 상부공간에서 검출되지 않았다.
실시예 7: 쿠주 이소프렌 신타아제 idi , 또는 dxs , 또는 idi dxs 를 발현하는 대장균에서의 이소프렌의 생성
I. 대장균에서 이소프렌의 생성을 위한 쿠주 이소프렌 신타아제 및 idi, 또는 dxs, 또는 idi 및 dxs를 인코딩하는 벡터의 구성
i) pTrcKudzuKan의 구성
pTrcKudzu (실시예 1에서 기재된)의 bla 유전자를 카나마이신 내성을 부여하는 유전자로 대체하였다. bla 유전자를 제거하기 위해 pTrcKudzu를 BspHI로 소화시키고, 쉬림프 알칼리 포스파타아제 (SAP)로 처리하고 65℃에서 열 사멸시킨 후, Klenow 절편 및 dNTP로 말단을 채웠다 (end-filled). 5 kbp 크기 절편을 아가로오스 겔에서 정제하고, 프라이머 MCM22 5'-GATCAAGCTTAACCGGAATTGCCAGCTG (SEQ ID NO:14) 및 MCM23 5'-GATCCGATCGTCAGAAGAACTCGTCAAGAAGGC (SEQ ID NO:15)를 사용하여 pCR-Blunt-II-TOPO로부터 PCR 증폭된 kanr 유전자에 라이게이션하고, HindIII 및 PvuI으로 소화시키고, 말단을 채웠다. 카나마이신 내성을 부여하는 플라스미드를 수반하는 형질전환체 (pTrcKudzuKan)를 카나마이신 50 ㎍/㎖ 함유 LA 상에서 선별하였다.
ii) pTrcKudzu yIDI Kan의 구성
pTrcKudzuKan을 PstI으로 소화시키고, SAP으로 처리하고, 열 사멸시키고 겔 정제하였다. 이를 합성 RBS를 갖는 S. 세레비지에로부터의 idi를 인코딩하는 PCR 생성물에 라이게이션하였다. PCR용 프라이머는 NsiI-YIDI 1 F 5'-CATCAATGCATCGCCCTTAGGAGGTAAAAAAAAATGAC (SEQ ID NO:16) 및 PstI-YIDI 1 R 5'-CCTTCTGCAGGACGCGTTGTTATAGC (SEQ ID NO:17)이고; 주형은 S. 세레비지에 게놈 DNA였다. PCR 생성물을 NsiI 및 PstI으로 소화시키고, 라이게이션하기 전에 겔 정제하였다. 라이게이션 혼합물을 화학적 수용성 TOP 10 세포에 형질전환하고, 50 ㎍/㎖ 카나마이신을 함유하는 LA 상에서 선별하였다. 여러 형질전환체를 선별하고 서열분석하고, 생성된 플라스미드를 pTrcKudzu-yIDI(kan)로 지칭하였다 (도 34 및 35).
iii) pTrcKudzu DXS Kan의 구성
플라스미드 pTrcKudzuKan을 PstI으로 소화시키고, SAP으로 처리하고, 열 사멸시키고 겔 정제하였다. 이를 합성 RBS를 갖는 대장균으로부터의 dxs를 인코딩하는 PCR 생성물에 라이게이션하였다. PCR용 프라이머는 MCM 13 5'-GATCATGCATTCGCCCTTAGGAGGTAAAAAAACATGAGTTTTGATATTGCCAAATACCCG (SEQ ID NO:18) 및 MCM14 5'-CATGCTGCAGTTATGCCAGCCAGGCCTTGAT (SEQ ID NO:19)이고; 주형은 대장균 게놈 DNA였다. PCR 생성물을 NsiI 및 PstI으로 소화시키고, 라이게이션하기 전에 겔 정제하였다. 생성된 형질전환 반응물을 TOP 10 세포에 형질전환하고, 카나마이신 50 ㎍/㎖을 갖는 LA 상에서 선별하였다. 여러 형질전환체를 단리하고 서열분석하고, 생성된 플라스미드를 pTrcKudzu-DXS(kan)로 지칭하였다 (도 36 및 37).
iv) pTrcKudzu-yIDI-dxs (kan)의 구성
pTrcKudzu-yIDI(kan)을 PstI으로 소화시키고, SAP으로 처리하고, 열 사멸시키고 겔 정제하였다. 이를 합성 RBS를 갖는 대장균 dxs를 인코딩하는 PCR 생성물에 라이게이션 (프라이머 MCM13 5'-GATCATGCATTCGCCCTTAGGAGGTAAAAAAACATGAGTTTTGATATTGCCAAATACCCG (SEQ ID NO:18) 및 MCM14 5'-CATGCTGCAGTTATGCCAGCCAGGCCTTGAT (SEQ ID NO:19); 주형 TOP 10 세포) (NsiI 및 PstI으로 소화됨)하고 겔 정제하였다. 최종 플라스미드를 pTrcKudzu-yIDI-dxs (kan)로 지칭하였다 (도 21 및 22).
v) pCL PtrcKudzu의 구성
상기 실시예 1로부터의 프로모터, 구조적 유전자 및 터미네이터를 함유하는 DNA 절편을 SspI을 사용하여 pTrcKudzu로부터 소화시키고 겔 정제하였다. 이를 PvuII로 소화시킨 pCL1920에 라이게이션하고, SAP으로 처리하고 열 사멸시켰다. 생성된 라이게이션 혼합물을 TOP 10 세포에 형질전환하고, 스펙티노마이신 50 ㎍/㎖을 함유하는 LA 상에서 선별하였다. 여러 콜로니를 단리하고 서열분석하고, 두 개를 선별하였다. pCL PtrcKudzu 및 pCL PtrcKudzu (A3)는 반대 위치에서 삽입물을 가졌다 (도 38~41).
vi) pCL PtrcKudzu yIDI의 구성
NsiI-PstI 소화된, 젤 정제된 상기 (ii)로부터의 IDI PCR 암플리콘 (amplicon)을 PstI으로 소화된 pCL PtrcKudzu에 라이게이션하고, SAP으로 처리하고 열 사멸시켰다. 라이게이션 혼합물을 TOP 10 세포에 형질전환하고, 스펙티노마이신 50 ㎍/㎖를 함유하는 LA에서 선별하였다. 여러 클론을 단리하고 서열분석하고, 생성된 플라스미드를 pCL PtrcKudzu yIDI로 지칭하였다 (도 42 및 43).
vii) pCL PtrcKudzu DXS의 구성
NsiI-PstI 소화된, 겔 정제된 상기 (iii)로부터의 DXS PCR 암플리콘을 PstI으로 소화된 pCL PtrcKudzu (A3)에 라이게이션하고, SAP으로 처리하고, 열 사멸시켰다. 라이게이션 혼합물을 TOP 10 세포에 형질전환하고 스펙티노마이신 50 ㎍/㎖을 함유하는 LA에서 선별하였다. 여러 클론을 단리하고 서열분석하고, 생성된 플라스미드를 pCL PtrcKudzu DXS로 지칭하였다 (도 44 및 45).
II. 상이한 카피 수로 쿠주 이소프렌 신타아제, idi 및/또는 dxs를 발현하는 배양물로부터의 상부공간에서의 이소프렌의 측정
플라스미드 pTrcKudzu(kan) (A), pTrcKudzu-yIDI kan (B), pTrcKudzu-DXS kan (C), pTrcKudzu-ylDI-DXS kan (D)로 이미 형질전환된 대장균 BL21 (λDE3)의 배양물을 LB 카나마이신 50 ㎍/㎖에서 성장시켰다. pCL PtrcKudzu (E), pCL PtrcKudzu, pCL PtrcKudzu-yIDI (F) 및 pCL PtrcKudzu-DXS (G)를 LB 스펙티노마이신 50 ㎍/㎖에서 성장시켰다. 400 μM IPTG로 시간 0 (OD600 약 0.5)에서 배양물을 유도하고 및 샘플을 이소프렌 상부공간 측정을 위해 취하였다 (실시예 1 참조). 결과를 도 23A~23G에서 나타내었다.
플라스미드 pTrcKudzu-yIDI-dxs (kan)을 형질전환으로 대장균 균주 BL21에 도입하였다. 생성된 균주 BL21/pTrc Kudzu IDI DXS를 카나마이신 (50 ㎍/㎖) 함유 LB에서 20℃에서 하룻밤 동안 성장시키고, 1% 글루코오스를 함유하는 TM3 (13.6 g K2PO4, 13.6 g KH2PO4, 2.0 g MgSO4*7H2O, 2.0 g 시트르산 일수화물, 0.3 g 구연산 철 암모늄, 3.2 g (NH4)2SO4, 0.2 g 효모 추출물, 1.0 ㎖ 1000x 변형 미량 금속 용액 (pH 6.8로 조정됨) 및 H2O 충분량, 및 여과 멸균됨)의 진탕 플라스크에 접종하는데 사용하였다. 0.8의 OD600에 도달할 때까지 플라스크를 30℃에서 인큐베이션한 후, 400 μM IPTG로 유도하였다. 유도 후 다양한 시간에서 샘플을 취하고, 상부공간 내의 이소프렌의 양을 실시예 1에서 기재된 바와 같이 측정하였다. 결과를 도 23H에 나타내었다.
III. 대장균/pTrcKudzu yIDI DXS에서의 바이오매스로부터의 이소프렌의 생성
균주 BL21 pTrcKudzuIDIDXS를 하기 세 유형의 바이오매스로부터 이소프렌을 생성하는 능력에 대해 시험하였다; 바가스, 옥수수대 및 침엽수 펄프 (대조군으로서 글루코오스). 바이오매스의 가수분해물을 효소적 가수분해에 의해 제조하고 (Brown, L 및 Torget, R., 1996, NREL standard assay method Lap-009 "Enzymatic Saccharification of Lignocellulosic Biomass") 글루코오스 동등물을 기초로 희석에 사용하였다. 상기 실시예에서, 글루코오스 동등물은 1% 글루코오스와 동등하였다. BL21 (DE3) pTrcKudzu yIDI DXS (kan)의 새로이 형질전환된 세포 플레이트로부터의 단일 콜로니를 사용하여 5 ㎖의 LB + 카나마이신 (50 ㎍/㎖)에 접종하였다. 배양물을 진탕하면서 25℃에서 하룻밤 동안 인큐베이션하였다. 다음날 하룻밤 배양물을 25 ㎖의 TM3 및 0.2% YE 및 1% 공급원료에서 0.05의 OD600으로 희석하였다. 공급원료는 옥수수대, 바가스 또는 침엽수 펄프였다. 글루코오스를 양성 대조군으로 사용하고, 글루코오스가 없는 것을 음성 대조군으로 사용하였다. 배양물을 180 rpm에서 진탕하면서 30℃에서 인큐베이션하였다. 배양물이 약 0.8의 OD600에 도달할 때 이를 OD600에 대해 모니터링하고, 배양물을 실시예 1에서 기재한 바와 같이 이소프렌 생성에 대해 1 및 3시간에서 분석하였다. 배양물은 유도되지 않았다. 첨가된 공급원료를 함유하는 모든 배양물은 글루코오스 양성 대조군과 동등하게 이소프렌을 생성하였다. 실험을 2 반복하여 수행하였고, 도 46에 나타내었다.
IV. 대장균/pTrcKudzuIDIDXS에서의 반전당으로부터의 이소프렌의 생성
BL21 (λDE3)/pTrcKudzu yIDI DXS (kan)의 새로이 형질전환된 세포 플레이트로부터의 단일 콜로니를 사용하여 5 ㎖의 LB 및 카나마이신 (50 ㎍/㎖)에 접종하였다. 배양물을 진탕하면서 25℃에서 하룻밤 동안 인큐베이션하였다. 다음날 하룻밤 배양물을 25 ㎖의 TM3 및 0.2% YE 및 1% 공급원료에서 0.05의 OD600으로 희석하였다. 공급원료는 글루코오스, 반전 글루코오스 또는 옥수수대였다. 반전당 공급원료 (Danisco Invert Sugar)를 효소적 처리 수크로오스 시럽에 의해 제조하였다. AFEX 옥수수대를 하기 기재한 바와 같이 제조하였다 (V 부분). 세포를 30℃에서 성장시키고, 배양물이 약 0.8~1.0의 OD600에 도달할 때 (0시간) 제 1 샘플을 측정하였다. 배양물을, OD600을 측정함으로써 성장에 대해, 및 실시예 1에서와 같이 0, 1 및 3시간에서 이소프렌 생성에 대해 분석하였다. 결과를 도 47에 나타내었다.
V. AFEX 사전처리된 옥수수대로부터의 가수분해물의 제조
AFEX 사전처리된 옥수수대를 Michigan Biotechnology Institute에서 수득하였다. 사전처리 조건은 60% 수분, 1:1 암모니아 로딩, 및 90℃에서 30분 후 자연 건조시켰다. AFEX 사전처리된 옥수수대 내의 수분 함량은 21.27%였다. AFEX 사전처리된 옥수수대 내의 글루칸 및 자일란의 함량은 각각 31.7% 및 19.1% (건조량 기준)였다. 당화 과정은 하기와 같다; 20 g의 AFEX 사전처리된 옥수수대를 5 ㎖의 1 M 나트륨 시트레이트 완충액 pH 4.8, 2.25 ㎖의 Accellerase 1000, 0.1 ㎖의 Grindamyl H121 (제빵 산업용 아스페르길루스 니게르로부터의 Danisco xylanase 제품), 및 72.65 ㎖의 DI 수를 갖는 500 ㎖ 플라스크에 첨가하였다. 플라스크를 궤도 진탕기에 넣고, 96시간 동안 50℃에서 인큐베이션하였다. 진탕기에서 1개의 샘플을 취하고 HPLC를 사용하여 분석하였다. 가수분해물은 38.5 g/L의 글루코오스, 21.8 g/L의 자일로오스, 및 10.3 g/L의 글루코오스 및/또는 자일로오스 올리고머를 함유하였다.
VI. 유가식 배양에서 성장한 대장균에서의 이소프렌 생성에 대한 효모 추출물의 효과
상기 기재된 pTrcKudzu yIDI DXS 플라스미드를 함유하는 대장균 세포로 이전에 기재된 바와 같이 14ℓ 규모에서 발효를 수행하였다. 효모 추출물 (Bio Springer, Montreal, Quebec, Canada)를 지수 증대 속도 (exponential rate)에서 공급하였다. 발효기에 전달된 효모 추출물의 총량은 40시간 발효 동안 70~830 g으로 가변적이었다. 발효 브로쓰의 광학 밀도를 550 nm의 파장에서 측정하였다. 발효기 내의 최종 광학 밀도는 첨가된 효모 추출물의 양에 대해 비례하였다 (도 48A). 발효기로부터의 배출 기체 내의 이소프렌 수준을 이전에 기재된 바와 같이 측정하였다. 이소프렌 역가는 발효의 과정에 걸쳐 증가하였다 (도 48B). 생성된 이소프렌의 양은 공급 효모 추출물의 양에 대해 선형으로 비례하였다 (도 48C).
VII. pTrcKudzu DXS yIDI의 500ℓ 발효에서의 이소프렌의 생성
쿠주 이소프렌 신타아제, S. 세레비지에 IDI 및 대장균 DXS 핵산 (대장균 BL21 (λDE3) pTrc Kudzu dxs yidi)를 갖는 대장균 세포의 500ℓ 발효를 사용하여 이소프렌을 생성하였다. 이소프렌의 수준은 15시간 동안의 시간에 걸쳐 50 내지 300 ㎍/L로 가변적이었다. 평균 이소프렌 농도, 장치를 통한 평균 흐름 및 이소프렌 급등의 함량을 기준으로, 수집된 이소프렌의 양을 약 17 g인 것으로 계산하였다.
VIII. 유가식 배양에서 성장한 대장균의 500ℓ 발효에서의 이소프렌의 생성
배지 제조 방법 (발효 배지 ℓ 당):
K2HPO4 7.5 g, MgSO4 * 7H2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, 효모 추출물 0.5 g, 1000X 변형 미량 금속 용액 1 ㎖. 모든 성분을 diH2O에 함께 첨가하고 용해하였다. 상기 용액을 오토클레이브하였다. 암모늄 기체 (NH3)로 pH를 7.0으로 조정하고 부피에 대해 충분량이 되게 하였다. 글루코오스 10 g, 티아민 * HCl 0.1 g, 및 항생제를 멸균 및 pH 조정 후 첨가하였다.
1000X 변형 미량 금속 용액:
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO4 * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 한번에 하나씩 DI H2O에 용해하고, HCl/NaOH로 pH를 3.0으로 조정한 후 부피에 대해 충분량이 되게 하고, 0.22 마이크론 필터로 여과 멸균하였다.
pTrcKudzu yIDI DXS 플라스미드를 함유하는 대장균 세포를 갖는 500ℓ 생물반응기에서 발효를 수행하였다. 상기 실험을 실행하여 원하는 발효 pH 7.0 및 온도 30℃에서 글루코오스 및 효모 추출물로부터의 이소프렌 형성을 모니터링하였다. 동결 바이알에서 취한 대장균 균주의 접종물을 소이톤-효모 추출물-글루코오스 배지에서 제조하였다. 접종물을 OD 0.15으로 성장시키고 (550 nm에서 측정), 20 ㎖를 사용하여 2.5ℓ 소이톤-효모 추출물-글루코오스 배지를 함유하는 생물반응기에 접종하였다. 2.5ℓ 생물반응기를 30℃에서 OD 1.0로 성장시키고, 2.0ℓ를 500ℓ 생물반응기에 옮겼다.
효모 추출물 (Bio Springer, Montreal, Quebec, Canada) 및 글루코오스를 지수 증대 속도에서 공급하였다. 50시간 발효 동안 생물반응기에 전달된 글루코오스 및 효모 추출물의 총량은 각각 181.2 kg 및 17.6 kg이었다. 시간에 걸친 생물반응기 내의 광학 밀도를 도 49A에 나타내었다. 생물반응기로부터의 배출 기체 내의 이소프렌 수준은 이전에 기재된 바와 같이 측정되었다. 이소프렌 역가는 발효의 과정에 걸쳐 증가하였다 (도 49B). 50시간 발효 동안 생성된 이소프렌의 총량은 55.1 g이고, 생성의 시간 추이를 도 49C에 나타내었다.
실시예 8: 쿠주 이소프렌 신타아제 및 재조합 메발론산 경로 유전자를 발현하는 대장균에서의 이소프렌의 생성
I. 하위 MVA 경로 클로닝
하위 메발론산 경로를 클로닝하기 위한 전략은 하기와 같다. 메발론산 생합성 통로의 네 가지 유전자; 메발로네이트 키나아제 (MVK), 포스포메발로네이트 키나아제 (PMK), 디포스포메발로네이트 데카르복실라아제 (MVD) 및 이소펜테닐 디포스페이트 이성화효소 유전자를 S. 세레비지에 염색체 DNA로부터 PCR로 증폭하고 pCR BluntII TOPO 플라스미드 (Invitrogen) 내에 개별적으로 클로닝하였다. 일부 경우에서, idi 유전자를 대장균 염색체 DNA로부터 증폭하였다. 대장균 공통 RBS (AGGAGGT (SEQ ID NO:80) 또는 AAGGAGG (SEQ ID NO:81))가 5' 말단에 삽입되고, 시작 코돈의 8 bp 상류 및 PstI 위치가 3' 말단에 첨가되도록 프라이머를 설계하였다. 이후, 전체 경로가 어셈블링될 때까지 유전자를 하나씩 pTrcHis2B 벡터에 클로닝하였다.
S. 세레비지에 S288C로부터의 염색체 DNA를 ATCC (ATCC 204508D)에서 수득하였다. 제조사의 지시사항에 따라 PfuTurbo를 사용하여 프라이머 MVKF (5'-AGGAGGTAAAAAAACATGTCATTACCGTTCTTAACTTCTGC, SEQ ID NO:21) 및 MVK-PstI-R (5'-ATGGCTGCAGGCCTATCGCAAATTAGCTTATGAAGTCCATGGTAAATTCGTG, SEQ ID NO:22)을 사용하여 S. 세레비지에의 염색체로부터 MVK 유전자를 증폭하였다. 1.2% E-겔 (Invitrogen)을 통한 전기영동으로 올바른 크기의 PCR 생성물 (1370 bp)을 확인하고 pZeroBLUNT TOPO 내에 클로닝하였다. 생성된 플라스미드를 pMVK1로 지정하였다. 플라스미드 pMVK1을 SacI 및 Taq 1 제한 엔도뉴클레아제로 소화시키고 절편을 겔 정제하고, SacI 및 BstBI으로 소화된 pTrcHis2B에 라이게이션하였다. 생성된 플라스미드를 pTrcMVK1로 지칭하였다.
메발론산 생합성 경로 내의 제 2 유전자, PMK를 하기 프라이머를 사용하여 증폭하였다: PstI-PMK1 R (5'-GAATTCGCCCTTCTGCAGCTACC, SEQ ID NO:23) 및 BsiHKA I-PMK1 F (5'-CGACTGGTGCACCCTTAAGGAGGAAAAAAACATGTCAG, SEQ ID NO:24). 제조사의 지시사항에 따라 Pfu Turbo 중합효소 (Stratagene)를 사용하여 PCR 반응을 수행하였다. 올바른 크기의 생성물 (1387 bp)을 PstI 및 BsiHKI로 소화시키고, PstI로 소화된 pTrcMVK1에 라이게이션하였다. 생성된 플라스미드를 pTrcKK로 지칭하였다. MVD 및 idi 유전자를 동일한 방식으로 클로닝하였다. 프라이머 쌍 PstI-MVD 1 R (5'-GTGCTGGAATTCGCCCTTCTGCAGC, SEQ ID NO:25) 및 NsiI-MVD 1 F (5'-GTAGATGCATGCAGAATTCGCCCTTAAGGAGG, SEQ ID NO:26)를 사용하여 PCR을 실행하여 MVD 유전자 및 PstI- YIDI 1 R (5'-CCTTCTGCAGGACGCGTTGTTATAGC, SEQ ID NO:27) 및 NsiI-YIDI 1 F (5'-CATCAATGCATCGCCCTTAGGAGGTAAAAAAAAATGAC, SEQ ID NO:28)를 증폭하여 yIDI 유전자를 증폭하였다. 일부 경우에서 IPP 이성화효소 유전자, 대장균으로부터의 idi를 사용하였다. 대장균으로부터의 idi를 증폭하기 위해, 하기의 프라이머 세트를 사용하였다: PstI-CIDI 1 R (5'-GTGTGATGGATATCTGCAGAATTCG, SEQ ID NO:29) 및 NsiI-CIDI 1 F (5'-CATCAATGCATCGCCCTTAGGAGGTAAAAAAACATG, SEQ ID NO:30). 주형 DNA는 대장균 FM5로부터 표준 방법에 의해 단리된 염색체 DNA였다 (WO 96/35796 및 WO 2004/033646; 특히 핵산의 단리에 대해 그 전문이 참고문헌으로 각각 포함됨). 최종 플라스미드를, 호모 idi 유전자를 인코딩하는 구성물에 대해서는 pKKDIy로, 또는 대장균 idi 유전자를 인코딩하는 구성물에 대해서는 pKKDIc로 지칭하였다. 플라스미드를 후속적 분석을 위해 대장균 숙주 BL21에 형질전환하였다. 일부 경우에서 쿠주로부터의 이소프렌 신타아제를 pKKDIy에 클로닝하여 플라스미드 pKKDIyIS를 수득하였다.
하위 MVA 경로를 또한 카나마이신 항생제 내성 마커를 함유하는 pTrc에 클로닝하였다. 플라스미드 pTrcKKDIy를 제한 엔도뉴클레아제 ApaI 및 PstI으로 소화시키고, 5930 bp 절편을 1.2% 아가로오스 E-겔 상에서 분리시키고, 제조사의 지시사항에 따라 Qiagen Gel Purification 키트를 사용하여 정제하였다. 실시예 7에서 기재된 플라스미드 pTrcKudzuKan을 제한 엔도뉴클레아제 ApaI 및 PstI로 소화시키고, 벡터를 함유하는 3338 bp 절편을 Qiagen Gel Purification 키트를 사용하여 1.2% E-겔에서 정제하였다. 3338 bp 벡터 절편 및 5930 bp 하위 MVA 경로 절편를 Roche Quick Ligation 키트를 사용하여 라이게이션하였다. 라이게이션 혼합물을 대장균 TOP 10 세포에 형질전환하고, 형질전환체를 카나마이신 (50 ㎍/㎖) 함유 LA 상에서 선별하면서 37℃에서 하룻밤 동안 성장시켰다. 형질전환체를 제한 효소 소화로 확인하고, 하나를 저장물로서 동결시켰다. 플라스미드를 pTrcKanKKDIy로 지정하였다.
II. 쿠주 이소프렌 신타아제 유전자의 pTrcKanKKDIy 내로의 클로닝
프라이머 MCM50 5'-GATCATGCATTCGCCCTTAGGAGGTAAAAAAACATGTGTGCGACCTCTTCTCAATTTACT (SEQ ID NO:31) 및 MCM53 5'-CGGTCGACGGATCCCTGCAGTTAGACATACATCAGCTG (SEQ ID NO:32)를 사용하여 실시예 1에서 기재된 pTrcKudzu로부터 쿠주 이소프렌 신타아제 유전자를 PCR로 증폭하였다. 생성된 PCR 절편을 pCR2.1에 클로닝하고, 대장균 TOP 10에 형질전환시켰다. 상기 절편은 쿠주 이소프렌 신타아제에 대한 코딩 서열 및 대장균에서의 RBS를 함유하는 상류 부위를 포함한다. 형질전환체를 카르베니실린 (50 ㎍/㎖) 함유 LA 상에서 선별하면서 37℃에서 하룻밤 동안 인큐베이션하였다. 절편의 올바른 삽입물을 서열분석으로 확인하고, 상기 균주를 MCM93으로 지정하였다.
균주 MCM93으로부터의 플라스미드를 제한 엔도뉴클레아제 NsiI 및 PstI으로 소화시켜 RBS 및 쿠주 이소프렌 신타아제를 함유하는 1724 bp 삽입물을 유리시켰다. 1724 bp 절편을 1.2% 아가로오스 E-겔에서 분리하고, 제조사의 지시사항에 따라 Qiagen Gel Purification 키트를 사용하여 정제하였다. 플라스미드 pTrcKanKKDIy를 제한 엔도뉴클레아제 PstI으로 소화시키고, 37℃에서 30분 동안 SAP으로 처리하고, Qiagen PCR cleanup 키트를 사용하여 정제하였다. 플라스미드 및 쿠주 이소프렌 신타아제를 인코딩하는 DNA 절편을 Roche Quick Ligation 키트를 사용하여 라이게이션하였다. 라이게이션 믹스를 대장균 TOP 10 세포에 형질전환하고, 형질전환체를 카나마이신 (50 ㎍/㎖) 함유 LA 상에서 선별하면서 37℃에서 하룻밤 동안 성장시켰다. 올바른 형질전환체를 제한 소화로 확인하고, 플라스미드를 pTrcKKDyIkISKan (도 24 및 25)로 지정하였다. 상기 플라스미드를 BL21(λDE3) 세포 (Invitrogen)에 형질전환하였다.
III. 쿠주로부터의 이소프렌 신타아제 및 재조합 하위 메발로네이트 경로를 발현하는 대장균에서의 메발로네이트로부터의 이소프렌 생성
균주 BL21/pTrcKKDyIkISKan를 pH 7.1로 조정되고 0.5% 글루코오스 및 0.5% 메발론산으로 보충된 MOPS 배지에서 배양하였다 (Neidhardt 등, (1974) J. Bacteriology 119:736-747). 동일한 조건이지만 0.5% 메발론산이 첨가되지 않은 대조군 배양물을 또한 설정하였다. 배양물이 0.3 내지 0.5의 OD600에 도달할 때, 1% 접종물을 갖는 하룻밤 종자 배양물로부터 배양을 시작하고 500 μM IPTG로 유도하였다. 배양물을 250 rpm에서 진탕하면서 30℃에서 성장시켰다. 실시예 1에서 기재한 상부공간 검정을 사용하여 이소프렌의 생성을 유도 3시간 후 분석하였다. 이소프렌의 최대 생성은 6.67 x 104 nmol/L브로쓰/OD600/시간이었다 (L브로쓰는 브로쓰의 부피이며, 세포 배지의 부피 및 세포의 부피가 모두 포함됨). 메발론산이 보충되지 않은 대조군 배양물은 측정가능한 이소프렌을 생성하지 않았다.
IV. 상위 MVA 경로 클로닝
3가지 효소적 활성을 인코딩하는 두 유전자를 포함하는 상위 메발로네이트 생합성 경로를 엔테로코쿠스 파에칼리스로부터 클로닝하였다. mvaE 유전자는 경로에서의 제 1 및 제 3 단백질인 아세틸-CoA 아세틸트랜스퍼라아제 및 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA) 환원효소 모두의 효소적 활성을 갖는 단백질을 인코딩하며, mvaS 유전자는 상기 경로에서의 제 2 효소, HMG-CoA 신타아제를 인코딩한다. 하기의 프라이머를 사용하여, 대장균 리보솜 결합 위치 및 전방에 스페이서를 갖는 E. 파이칼리스 게놈 DNA (ATCC 700802D-5)로부터 mvaE 유전자를 증폭하였다:
CF 07-60 (+) mvaE w/ RBS + ATG 시작 코돈 SacI의 시작
5'-GAGACATGAGCTCAGGAGGTAAAAAAACATGAAAACAGTAGTTATTATTG (SEQ ID NO:34)
CF 07-62 (-) 중간에서 RBS를 갖는 mvaS에 대한 mvaE 융합
5'-TTTATCAATCCCAATTGTCATGTTTTTTTACCTCCTTTATTGTTTTCTTAAATC (SEQ ID NO:35)
하기의 프라이머를 사용하여 전방에 대장균으로부터의 스페이서 및 RBS를 갖는 E. 파에칼리스 게놈 DNA (ATCC 700802D-5)로부터 mvaS 유전자를 증폭하였다:
CF 07-61 (+) 중간에서 RBS를 갖는 mvaS에 대한 mvaE 융합
5'-GATTTAAGAAAACAATAAAGGAGGTAAAAAAACATGACAATTGGGATTGATAAA (SEQ ID NO:36)
CF 07-102 (-) mvaS 유전자 BglII의 말단
5'-GACATGACATAGATCTTTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:37)
하기의 프라이머를 사용하여 PCR 절편을 PCR과 함께 융합하였다:
CF 07-60 (+) mvaE w/ RBS + ATG 시작 코돈 SacI의 시작
5'-GAGACATGAGCTCAGGAGGTAAAAAAACATGAAAACAGTAGTTATTATTG (SEQ ID NO:34)
CF 07-102 (-) mvaS 유전자 BglII의 말단
5'-GACATGACATAGATCTTTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:37)
Qiagen 키트를 사용하여 융합 PCR 절편을 정제하고, 제한 효소 SacI 및 BglII로 소화시켰다. 상기 소화된 DNA 절편을 Qiagen 키트를 사용하여 겔 정제하고, Sac I 및 BglII으로 소화된 시판되는 벡터 pTrcHis2A에 라이게이션하였다.
라이게이션 믹스를 대장균 Top 10 세포에 형질전환하고, 콜로니를 LA 및 50 ㎍/㎖ 카르베니실린 플레이트 상에서 선별하였다. 총 6개의 콜로니를 선택하고, LB 및 50 ㎍/㎖ 카르베니실린에서 하룻밤 동안 성장시키고, 플라스미드를 Qiagen 키트를 사용하여 단리하였다. 플라스미드를 SacI 및 BglII로 소화시켜 삽입물을 확인하고, 한 올바른 플라스미드를 하기의 프라이머로 서열분석하였다:
CF 07-58 (+) mvaE 유전자의 시작
5'-ATGAAAACAGTAGTTATTATTGATGC (SEQ ID NO:38)
CF 07-59 (-) mvaE 유전자의 말단
5'-ATGTTATTGTTTTCTTAAATCATTTAAAATAGC (SEQ ID NO:39)
CF 07-82 (+) mvaS 유전자의 시작
5'-ATGACAATTGGGATTGATAAAATTAG (SEQ ID NO:40)
CF 07-83 (-) mvaS 유전자의 말단
5'-TTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:41)
CF 07-86 (+) mvaE에서의 서열
5'-GAAATAGCCCCATTAGAAGTATC (SEQ ID NO:42)
CF 07-87 (+) mvaE에서의 서열
5'-TTGCCAATCATATGATTGAAAATC (SEQ ID NO:43)
CF 07-88 (+) mvaE에서의 서열
5'-GCTATGCTTCATTAGATCCTTATCG (SEQ ID NO:44)
CF 07-89 (+) 서열 mvaS
5'-GAAACCTACATCCAATCTTTTGCCC (SEQ ID NO:45)
pTrcHis2AUpperPathway#1으로 지칭되는 플라스미드를 서열분석으로 바로잡고, 시판되는 대장균 균주 BL21에 형질전환하였다. LA 및 50 ㎍/㎖ 카르베니실린 상에서 선별하였다. 두 형질전환체를 선택하고, 1.5의 OD600에 도달할 때까지 LB 및 50 ㎍/㎖ 카르베니실린에서 성장시켰다. 두 균주 모두를 글리세롤의 존재 하에 -80℃에서 바이알 내에서 동결시켰다. 균주를 BL21에서의 pTrcHis2AUpperPathway#1, 단리물#1에 대해 CF 449로, BL21에서의 pTrcHis2AUpperPathway#1, 단리물#2에 대해 CF 450으로 지정하였다. 분석한 경우, 두 클론 모두 동일하게 행동하는 것으로 발견되었다.
V. UpperMVA 경로의 pCL1920 내로의 클로닝
플라스미드 pTrcHis2AUpperPathway를 제한 엔도뉴클레아제 SspI로 소화시켜 pTrc-mvaE-mvaS-(His 표지)-터미네이터를 함유하는 절편을 방출시켰다. 상기 절편에서, his-표지는 번역되지 않았다. Qiagen Gel Purification 키트를 사용하여, 상기 무딘 말단 4.5 kbp 절편을 1.2% E-겔에서 정제하였다. 제한 엔도뉴클레아제 PvuII로 벡터를 소화시키고, SAP로 처리하고, Qiagen Gel Purification 키트를 사용하여 1.2% E-겔로부터 겔 정제하여 pCL1920으로부터의 탈인산화된, 무딘 말단 4.2 kbp 절편을 제조하였다. Roche Quick Ligation 키트를 사용하여 두 절편을 라이게이션하고, TOP 10 화학적 수용성 세포에 형질전환시켰다. 형질전환체를 스펙티노마이신 (50 ㎍/㎖) 함유 LA 상에서 선별하였다. PCR에 의해, 삽입물의 존재에 대해 스크리닝하여 올바른 콜로니를 확인하였다. 플라스미드를 pCL PtrcUpperPathway로 지정하였다 (도 26 및 27).
VI. 조합된 상위 및 하위 메발론산 경로를 발현하는 균주
완전한 메발론산 경로와 함께 쿠주 이소프렌 신타아제를 수득하기 위해서, 플라스미드 pTrcKKDyIkISkan 및 pCLpTrcUpperPathway를 모두 BL21(λDE3) 수용성 세포 (Invitrogen)에 형질전환하고, 형질전환체를 카나마이신 (50 ㎍/㎖) 및 스펙티노마이신 (50 ㎍/㎖)을 함유하는 LA 상에서 선별하였다. 형질전환체를 플라스미드 프렙으로 확인하여, 플라스미드 모두가 숙주 내에서 유지되는지를 확실하게 하였다. 균주를 MCM127로 지정하였다.
VII. 대장균/pUppeerpathway에서의 글루코오스로부터 메발론산의 생성
BL21/pTrcHis2A-mvaE/mvaS 또는 FM5/p pTrcHis2A-mvaE/mvaS를 LB 및 카르베니실린 (100 ㎍/㎖)에 접종하고, 200 rpm에서 진탕하면서 37℃에서 하룻밤 동안 성장시켰다. 이들 배양물을 250 ㎖ 배플드 플라스크 내의 50 ㎖ 배지로 0.1의 OD600이 되도록 희석하였다. 배지는 TM3, 1 또는 2% 글루코오스, 카르베니실린 (100 ug/㎖) 또는 TM3, 1% 글루코오스, 가수분해된 콩기름, 및 카르베니실린 (100 ug/㎖) 또는 TM3 및 바이오매스 (제조된 바가스, 옥수수대 또는 지팽이풀)였다. 배앙물을 OD600이 0.4에 도달할 때까지 약 2~3시간 동안 200 rpm에서 진탕하면서 30℃에서 성장시켰다. 이 시점에서, IPTG (400 μM)을 첨가하여 mvaE mvaS 구성물로부터의 발현을 유도하였다. 2시간 주기 내지 유도 후 6시간, 이후 필요시 24, 36 및 48시간 후에 취한 샘플로 추가 20 또는 40시간 동안 배양물을 인큐베이션하였다. 1 ㎖의 배양물을 제거하고, OD60O을 측정하고, 마이크로퓨즈 (microfuge)에서 세포를 펠릿화고 상청액을 제거하고, 메발론산에 대해 이를 분석하여 샘플링을 수행하였다.
엔테로코쿠스 파에칼리스 AA-CoA 티올라아제, HMG-CoA 신타아제, 및 HMG-CoA 환원효소 폴리펩티드를 인코딩하는 핵산을 갖는 대장균 세포의 14ℓ 발효로, 세포 배지로서 TM3 배지 및 2% 글루코오스를 사용하여 22 g의 메발론산이 생성되었다. 이들 세포의 진탕 플라스크에서는 세포 배양 배지로서 LB 배지 및 1% 글루코오스를 사용하여 ℓ 당 2~4 g의 메발론산이 생성되었다. 이들 균주에서의 메발론산의 생성은 MVA 경로가 대장균에서 기능한다는 것을 나타내었다.
VIII. 상위 및 하위 MVA 경로 + 쿠주 이소프렌 신타아제를 함유하는 대장균 BL21로부터의 이소프렌의 생성
상기 기재한 바와 같은 상위 및 하위 MVA 경로 및 쿠주 이소프렌 신타아제 유전자를 함유하는 플라스미드, 및 실시예 7에서 기재된 idi, dxs 및 dxr 및 이소프렌 신타아제 유전자를 함유하는 플라스미드의 다양한 조합에서의 형질전환으로써 하기의 균주를 제작하였다. 사용된 숙주 세포는 화학적 수용성 BL21(λDE3)이고, 표준 방법으로 형질전환을 수행하였다. 카나마이신 (50 ㎍/㎖) 또는 카나마이신 + 스펙티노마이신 (둘 모두 50 ㎍/㎖의 농도)을 함유하는 L 한천에서 형질전환체를 선별하였다. 플레이트를 37℃에서 성장시켰다. 생성된 균주를 하기와 같이 지정하였다:
카나마이신 + 스펙티노마이신 (각각 50 ㎍/㎖)에서 성장시킴
MCM127 - BL21(λDE3) 내의 pCL Upper MVA 및 pTrcKKDyIkIS (kan)
MCM131 - BL21(λDE3) 내의 pCL1920 및 pTrcKKDyIkIS (kan)
MCM125 - BL21(λDE3) 내의 pCL Upper MVA 및 pTrcHis2B (kan)
카나마이신 (50 ㎍/㎖)에서 성장시킴
MCM64 - BL21(λDE3) 내의 pTrcKudzu yIDI DXS (kan)
MCM50 - BL21(λDE3) 내의 pTrcKudzu (kan)
MCM123 - BL21(λDE3) 내의 pTrcKudzu yIDI DXS DXR (kan)
상기 균주를 냉동기 저장물로부터 LA 및 적절한 항생제에 스트리킹하고, 37℃에서 하룻밤 동안 성장시켰다. 각각의 플레이트로부터의 단일 콜로니를 진탕 플라스크 (25 ㎖ LB 및 적절한 항생제)에 접종하는데 사용하였다. 플라스크를 200 rpm에서 진탕하면서 22℃에서 하룻밤 동안 인큐베이션하였다. 다음날 아침에 플라스크를 37℃ 인큐베이터에 옮기고 200 rpm에서 진탕하면서 추가 4.5시간 동안 성장시켰다. 25 ㎖ 배양물을 원심분리하여 세포를 펠릿화시키고, 세포를 5 ㎖ LB 및 적절한 항생제에 재현탁하였다. 배양물을 이후 25 ㎖ LB, % 글루코오스, 및 적절한 항생제로 0.1의 OD600이 되도록 희석하였다. 각각의 균주에 대해 두 개 플라스크를 설정하고, 첫 번째 세트는 IPTG (800 μM)로 유도하고, 두 번째 세트는 유도하지 않았다. 배양물을 250 rpm에서 진탕하면서 37℃에서 인큐베이션하였다. 배양물의 한 세트를 1.50시간 후에 유도하였다 (샘플링 시간 지점 1의 직후). 각각의 샘플링 시간 지점에서, OD600을 측정하고 실시예 1에서 기재된 바와 같이 이소프렌의 양을 측정하였다. 결과를 표 3에 나타내었다. 생성된 이소프렌의 양을 특정 균주에 대한 피크 생성에서의 양으로서 나타내었다.
표 3. 대장균 균주에서의 이소프렌의 생성
Figure pct00003
ND: 미검출
미량: 피크가 존재하나 적분가능하지 않음
IX. 메발론산의 분석
메발로놀아세톤 (1.0 g, 7.7 mmol) (CAS# 503-48-0)을 메발론산의 칼륨염을 생성시키기 위해 물 (7.7 ㎖)에 용해하고 수산화칼륨 (7.7 mmol)으로 처리한 시럽으로서 Sigma-Aldrich (WI, USA)에서 공급받았다. 메발론산으로의 변환을 1H NMR 분석으로 확증하였다. 14,000 rpm에서 5분 동안 원심분리하여 세포를 제거한 후 상청액의 300 ㎕ 분취액을 900 ㎕의 H2O에 첨가하여 HPLC 분석을 위한 샘플을 제조하였다. 이후 과염소산 (70% 용액의 36 ㎕)을 첨가한 후, 얼음 상에서 5분 동안 혼합 및 냉각하였다. 이후 샘플을 다시 원심분리하고 (14,000 rpm에서 5분), 상청액을 HPLC에 옮겼다. 메발론산 표준물 (20, 10, 5, 1 및 0.5 g/L)을 동일한 방식으로 제조하였다. 5 mM 황산으로 0.6 ㎖/분에서 용리된 BioRad Aminex 87-H+ 컬럼 (300 mm, 7.0 mm)을 사용하여 굴절률 (RI) 검출을 갖는 HPLC에 의해 메발론산의 분석 (20 uL 주입 부피)을 수행하였다. 이들 조건 하에 18.5분에서 락톤 형태로서 메발론산을 용리하였다.
실시예 9. 바실러스 서브틸리스로의 융합을 위한 상위 및 하위 MVA 경로의 구성
I. 바실러스 서브틸리스에서의 상위 MVA 경로의 구성
엔테로코쿠스 파에칼리스로부터의 상위 경로를 aprE 프로모터의 조절 하에 B. 서브틸리스에 융합하였다. 상위 경로는 하기 두 유전자로 이루어진다; AACT 및 HMGR를 인코딩하는 mvaE, 및 HMGS를 인코딩하는 mvaS. 두 유전자는 중간에서, mvaS 앞의 RBS 위치에서 정지 코돈과 함께 융합되고, aprE 프로모터의 조절 하에 있다. 터미네이터는 mvaE 유전자 뒤에 위치한다. 클로람페니콜 내성 마커는 mvaE 유전자 뒤에 클로닝되며, 구성물은 상동성의 측면 부위를 사용하여 이중 교차에 의해 aprE 유전자 자리에서 융합된다.
PCR 반응에 의해 함께 융합되게 할 돌출물 (overhang)을 함유하도록 네 개의 DNA 절편을 PCR로 증폭하였다. 제조사의 지시사항에 따라 Herculase 중합효소를 사용하여 PCR 증폭을 실행하였다.
1: PaprE
CF 07-134 (+) aprE 프로모터 PstI의 시작
5'-GACATCTGCAGCTCCATTTTCTTCTGC (SEQ ID NO:82)
CF 07-94 (-) mvaE에 대한 PaprE 융합
5'-CAATAATAACTACTGTTTTCACTCTTTACCCTCTCCTTTTAA (SEQ ID NO:83)
주형: 바실러스 서브틸리스 염색체 DNA
2: mvaE
CF 07-93 (+) aprE 프로모터에 대한 mvaE 융합 (GTG 시작 코돈)
5'-TTAAAAGGAGAGGGTAAAGAGTGAAAACAGTAGTTATTATTG (SEQ ID NO:84)
CF 07-62 (-) 중간에서 RBS를 갖는 mvaS에 대한 mvaE 융합
5'-TTTATCAATCCCAATTGTCATGTTTTTTTACCTCCTTTATTGTTTTCTTAAATC (SEQ ID NO:35)
주형: 엔테로코쿠스 파에칼리스 염색체 DNA (ATCC)
3. mvaS
CF 07-61 (+) 중간에서 RBS를 갖는 mvaS에 대한 mvaE 융합
5'-GATTTAAGAAAACAATAAAGGAGGTAAAAAAACATGACAATTGGGATTGATAAA (SEQ ID NO:36)
CF 07-124 (-) 터미네이터에 대한 mvaS의 말단 융합
5'-CGGGGCCAAGGCCGGTTTTTTTTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:85)
주형: 엔테로코쿠스 파에칼리스 염색체 DNA
4. B. 아밀로리쿠에파시엔스 알칼리 세린 프로테아제 터미네이터
CF 07-123 (+) 터미네이터에 대한 mvaS의 말단 융합
5'-ACCGTTCGTTCTTATCGAAACTAAAAAAAACCGGCCTTGGCCCCG (SEQ ID NO:86)
CF 07-46 (-) B. 아밀로리쿠에파시엔스 터미네이터 BamHI의 말단
5'-GACATGACGGATCCGATTACGAATGCCGTCTC (SEQ ID NO:63)
주형: 바실러스 아밀로리쿠에파시엔스 염색체 DNA
PCR 융합 반응
5. mvaS에 대한 mvaE 융합
CF 07-93 (+) aprE 프로모터에 대한 mvaE 융합 (GTG 시작 코돈)
5'-TTAAAAGGAGAGGGTAAAGAGTGAAAACAGTAGTTATTATTG (SEQ ID NO:84)
CF 07-124 (-) 터미네이터에 대한 mvaS의 말단 융합
5'-CGGGGCCAAGGCCGGTTTTTTTTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:85)
주형: 상기로부터의 #2 및 3
6. aprE 프로모터에 대한 mvaE-mvaS 융합
CF 07-134 (+) aprE 프로모터 PstI의 시작
5'-GACATCTGCAGCTCCATTTTCTTCTGC (SEQ ID NO:82)
CF 07-124 (-) 터미네이터에 대한 mvaS의 말단 융합
5'-CGGGGCCAAGGCCGGTTTTTTTTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:85)
주형: 상기로부터의 #1 및 #4
7. 터미네이터에 대한 PaprE-mvaE-mvaS 융합
CF 07-134 (+) aprE 프로모터 PstI의 시작
5'-GACATCTGCAGCTCCATTTTCTTCTGC (SEQ ID NO:82)
CF 07-46 (-) B. 아밀로리쿠에파시엔스 터미네이터 BamHI의 말단
5'-GACATGACGGATCCGATTACGAATGCCGTCTC (SEQ ID NO:63)
주형: #4 및 #6
생성물을 제한 엔도뉴클레아제 PstI/BamHI으로 소화시키고, PstI/BamHI으로 소화시킨 pJM102에 라이게이션하였다 (Perego, M. 1993. Integrational vectors for genetic manipulation in Bacillus subtilis, p. 615-624. In A. L. Sonenshein, J. A. Hoch, and R. Losick (ed.), Bacillus subtilis and other gram-positive bacteria: biochemistry, physiology, and molecular genetics. American Society for Microbiology, Washington, D.C.). 라이게이션물을 대장균 TOP 10 화학적 수용성 세포에 형질전환하고, 형질전환체를 카르베니실린 (50 ㎍/㎖) 함유 LA 상에서 선별하였다. 올바른 플라스미드를 서열분석으로 확인하고, pJMUpperpathway2로 지정하였다 (도 50 및 51). 정제된 플라스미드 DNA를 바실러스 서브틸리스 aprEnprE Pxyl-comK에 형질전환하고, 형질전환체를 클로람페니콜 (5 ㎍/㎖) 함유 L 한천에서 선별하였다. 올바른 콜로니를 선별하고, 클로람페니콜 10, 15 및 25 ㎍/㎖를 함유하는 L 한천 상에서 순차적으로 플레이팅하여 상위 경로를 함유하는 카세트의 카피 수를 증폭시켰다.
1% 글루코오스를 함유하는 LB에서 성장시켜, 생성된 균주를 메발론산 생성에 대해 시험하였다. 메발론산의 생성에 대해 배양물을 GC로 분석하였다.
상기 균주를 하위 메발론산 경로의 융합에 대한 숙주로서 이후 사용하였다.
하기 프라이머를 사용하여 상기 다양한 구성물을 서열분석하였다.
서열분석 프라이머:
CF 07-134 (+) aprE 프로모터 PstI의 시작
5'-GACATCTGCAGCTCCATTTTCTTCTGC (SEQ ID NO:82)
CF 07-58 (+) mvaE 유전자의 시작
5'-ATGAAAACAGTAGTTATTATTGATGC (SEQ ID NO:38)
CF 07-59 (-) mvaE 유전자의 말단
5'-ATGTTATTGTTTTCTTAAATCATTTAAAATAGC (SEQ ID NO:39)
CF 07-82 (+) mvaS 유전자의 시작
5'-ATGACAATTGGGATTGATAAAATTAG (SEQ ID NO:40)
CF 07-83 (-) mvaS 유전자의 말단
5'-TTAGTTTCGATAAGAACGAACGGT (SEQ ID NO:41)
CF 07-86 (+) mvaE에서의 서열
5'-GAAATAGCCCCATTAGAAGTATC (SEQ ID NO:42)
CF 07-87 (+) mvaE에서의 서열
5'-TTGCCAATCATATGATTGAAAATC (SEQ ID NO:43)
CF 07-88 (+) mvaE에서의 서열
5'-GCTATGCTTCATTAGATCCTTATCG (SEQ ID NO:44)
CF 07-89 (+) 서열 mvaS
5'-GAAACCTACATCCAATCTTTTGCCC (SEQ ID NO:45)
형질전환체를 5 ㎍/㎖의 농도로 클로람페니콜을 함유하는 LA 상에서 선별하였다. 한 콜로니가 서열분석에 의해 올바른 융합을 갖는 것을 확증하고, 수 일에 걸쳐 25 ㎍/㎖의 최종 수준까지 증가하는 농도로 클로람페니콜을 함유하는 LA 상에서 플레이팅하였다. 이는 관심 유전자를 포함하는 카세트의 증폭을 야기하였다. 생성된 균주를 CF 455: pJMupperpathway#1 X 바실러스 서브틸리스 aprEnprE Pxyl comK (클로람페니콜 25 ㎍/㎖을 함유하는 LA 상에서 성장하도록 증폭됨)로 지정하였다.
II. 바실러스 서브틸리스에서의 하위 MVA 경로의 구성
mvk1, pmk, mpd 및 idi로 이루어지는 하위 MVA 경로는 B. 서브틸리스 염색체의 nprE 부위로부터의 측면 DNA 부위 (융합 위치), aprE 프로모터, 및 스펙티노마이신 내성 마커로 이루어지는 카세트에서 조합된다 (도 28 및 29 참조). 상기 카세트를 DNA2.0에 의해 합성하고, aprE 유전자 자리에서 융합된 상위 MVA 경로를 함유하는 B. 서브틸리스의 염색체에 융합하였다. 쿠주 이소프렌 신타아제 유전자를 실시예 4에서 기재된 복제 플라스미드로부터 발현시키고, 상위 및 하위 경로가 모두 융합된 균주에 형질전환하였다.
실시예 10: M. 마제이 메발로네이트 키나아제 및 P. 알바 이소프렌 신타아제를 발현하는 대장균에서의 이소프렌의 생성
I. M. 마제이 메발로네이트 키나아제 (MVK) 및 P. 알바 이소프렌 신타아제를 인코딩하는 균주 및 벡터의 구성
(i) 균주 EWL201 (BL21, Cm-GI1.2-KKDyI)의 구성
대장균 BL21 (Novagen brand, EMD Biosciences, Inc.)은 수용 균주로서, MCM331 P1 용해물 ([Ausubel, 등, Current Protocols in Molecular Biology. John Wiley and Sons, Inc.]에서 기재된 방법에 따라 제조된 용해물)로 형질도입되었다. L 한천 및 20 ㎍/㎕ 클로람페니콜 상에 세포를 스프레딩하여 형질도입체를 선별하였다. 플레이트를 30℃에서 하룻밤 동안 인큐베이션하였다. 형질도입체의 분석으로, 대조군 플레이트 (역전에 대한 물 + 세포 대조군 플레이트, 및 용해물 오염에 대한 물 및 P1 용해물 대조군 플레이트) 상에서는 콜로니가 나타나지 않았다.
네 개의 형질도입체를 고르고, 5 ㎖ L 브로쓰 및 20 ㎍/㎕ 클로람페니콜을 접종하는데 사용하였다. 배양물을 200 rpm에서 진탕하면서 30℃에서 하룻밤 동안 성장시켰다. PCR 분석을 위한 각각의 형질도입체의 게놈 DNA 프렙을 만들기 위해, 1.5㎖의 하룻밤 세포 배양물을 원심분리하였다. 세포 펠릿을 400 ㎕ 재현탁 완충액 (2O mM Tris, 1 mM EDTA, 5O mM NaCl, pH 7.5)으로 재현탁하고, 4 ㎕ RNase (무-DNase) (Roche)를 첨가하였다. 튜브를 30분 동안 37℃에서 인큐베이션한 후, 4 ㎕ 10% SDS 및 4 ㎕의 10 mg/㎖ 프로테이나아제 K 저장액 (Sigma- Aldrich)을 첨가하였다. 튜브를 1시간 동안 37℃에서 인큐베이션하였다. 세포 용해물을 2 ㎖ Phase Lock Light Gel 튜브 (Eppendorf)에 옮기고, 각각 200 ㎕의 포화 페놀 (pH 7.9) (Ambion Inc.) 및 클로로포름을 첨가하였다. 튜브를 잘 혼합시키고, 5분 동안 미세원심분리 (microcentrifuge)하였다. 400 ㎕ 클로로포름으로 두 번째 추출을 수행하고, 수성층을 새로운 에펜도르프 튜브에 옮겼다. 1 ㎖의 100% 에탄올을 첨가하고 5분 동안 원심분리하여 게놈 DNA를 침전시켰다. 게놈 DNA 펠릿을 1 ㎖의 70% 에탄올로 세척하였다. 에탄올을 제거하고 게놈 DNA 펠릿을 짧게 자연 건조시켰다. 게놈 DNA 펠릿을 200 ㎕ TE로 재현탁하였다.
PfU Ultra II DNA 중합효소 (Stratagene) 및 주형으로 200 ng/㎕의 게놈 DNA를 사용하여, 제조사의 프로토콜에 따라 2개의 상이한 세트의 PCR 반응 튜브를 제조하였다. 세트 1에 대해, 프라이머 MCM 130 및 GB Cm-Rev (표 4)를 사용하여 형질도입체가 attTn7 유전자 자리에 성공적으로 융합된 것을 확인하였다. 세트 1에 대한 PCR 매개변수는 하기와 같다: 95℃에서 2분 (첫 사이클에서만), 95℃에서 25초, 55℃에서 25초, 72℃에서 25초 (28 사이클 동안 단계 2~4를 반복), 72℃에서 1분. 세트 2에 대해, 프라이머 MVD For 및 MVD Rev (표 4)를 사용하여 gi1.2-KKDyI 오페론이 적절하게 융합된 것을 확인하였다. 세트 2에 대한 PCR 매개변수는 하기와 같다: 95℃에서 2분 (첫 사이클에서만), 95℃에서 25초, 55℃에서 25초, 72℃에서 10초 (28 사이클 동안 단계 2~4를 반복), 72℃에서 1분. 1.2% E-겔 (Invitrogen Corp.)에서의 PCR 암플리콘의 분석으로, 모든 4개의 형질도입체 클론이 올바르다는 것이 나타났다 (하나를 고르고 균주 EWL201로 지정하였음).
ii) 균주 EWL204 (BL21, 루프아웃-GI1.2-KKDyI)의 구성
Datsenko 및 Wanner (2000) (Datsenko 등, Proc Natl. Acad. Sci USA 97:6640-6645, 2000)에 의해 기재된 바와 같이 플라스미드 pCP20을 사용하여 클로람페니콜 마커를 균주 EWL201의 외부로 루프화시켰다. 에스케리키아 콜리 K-12에서의 염색체 유전자의 1-단계 불활성은 PCR 생성물을 사용하였다 (Datsenko 등, PNAS, 97: 6640-6645, 2000). EWL201 세포를 L 브로쓰에서 중간 로그상까지 성장시킨 후 얼음 냉각된 멸균수로 3회 세척하였다. 50 ㎕의 세포 현탁액 분취액을 1 ㎕의 pCP20과 혼합하고, 세포 현탁액 혼합물을 Gene Pulser Electroporator (Bio-Rad Inc.)를 사용하여 2.5 볼트 및 25 uFd에서 2 mm 큐벳 (Invitrogen Corp.)내에서 전기천공하였다. 1 ㎖의 LB를 세포에 즉시 첨가한 후, 금속 마개를 갖는 14 ㎖ 폴리프로필렌 튜브 (Sarstedt)에 옮겼다. 30℃에서 1시간 동안 성장시켜 세포가 회수되게 하였다. 형질전환체를 L 한천 및 20 ㎍/㎕ 클로람페니콜 및 50 ㎍/㎕ 카르베니실린 상에서 선별하고 30℃에서 하룻밤 동안 인큐베이션하였다. 다음날, 단일 콜로니를 초기 로그상이 될 때까지 10 ㎖ L 브로쓰 및 50 ㎍/㎕ 카르베니실린에서 30℃에서 성장시켰다. 이후 성장 배양물의 온도를 2시간 동안 42℃로 변경하였다. 여러 희석물을 제조하고, 세포를 이후 LA 플레이트 (항생제 선택성이 없는) 상에 스프레딩하고, 30℃에서 하룻밤 동안 인큐베이션하였다. 다음날, 20개의 콜로니를 고르고 L 한천 (항생제 없음) 및 LA 및 20 ㎍/㎕ 클로람페니콜 플레이트 상에 적용시켰다. 이후 플레이트를 3O℃에서 하룻밤 동안 인큐베이션하였다. LA 플레이트에서 성장할 수 있으나, LA 및 20 ㎍/㎕ 클로람페니콜 플레이트에서는 성장하지 못하는 세포는 외부에 루프화된 클로람페니콜 마커를 갖는 것으로 간주되었다 (하나를 고르고 균주 EWL204로 지정하였음).
iii) 플라스미드 pEWL230 (pTrc P. alba)의 구성
대장균 발현을 위한 코돈 최적화 방법을 기초로 하여, 포풀루스 알바 이소프렌 신타아제 (P. 알바 HGS)를 인코딩하는 합성 유전자의 생성물을 DNA2.0 Inc. (Menlo Park, CA)에서 외주 제작하였다. 합성 유전자는 플라스미드 pET24a (Novagen brand, EMD Biosciences, Inc.) 내로 주문식으로 클로닝되었고, 동결건조되어 전달되었다 (도 54, 55A 및 55B).
제조사의 프로토콜에 따라 주형으로서 pET24 P. alba HGS, 프라이머 MCM182 및 MCM192, 및 Herculase II 융합 DNA 중합효소 (Stratagene)를 사용하여 PCR 반응을 수행하여 P. 알바 이소프렌 신타아제 (P. 알바 HGS) 유전자를 증폭하였다. PCR 조건은 하기와 같다: 95℃에서 2분 (첫 사이클에서만), 95℃에서 25초, 55℃에서 20초, 72℃에서 1분, 25 사이클 동안 반복, 72℃에서 3분 동안 최종 연장.
QIAquick PCR Purification 키트 (Qiagen Inc.)을 사용하여 P. 알바 이소프렌 신타아제 PCR 생성물을 정제하였다.
P. 알바 이소프렌 신타아제 PCR 생성물을 이후 1 ㎕ BspHI 엔도뉴클레아제 (New England Biolabs)와 함께 2 ㎕ 1OX NEB 완충액 4를 함유하는 20 ㎕ 반응물에서 소화시켰다. 반응물을 37℃에서 2시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 QIAquick PCR Purification 키트를 사용하여 정제하였다. 제 2 제한 소화를 1 ㎕ PstI 엔도뉴클레아제 (Roche)와 함께 2 ㎕ 1OX 완충액 H를 함유하는 20 ㎕ 반응물에서 수행하였다. 반응물을 37℃에서 2시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 QIAquick PCR Purification 키트를 사용하여 정제하였다. 플라스미드 pTrcHis2B (Invitrogen Corp.)를 1 ㎕ NcoI 엔도뉴클레아제 (Roche), 1 ㎕ PstI 엔도뉴클레아제, 및 2 ㎕ 10X 완충액 H를 함유하는 20 ㎕ 반응물에서 소화시켰다. 반응물을 37℃에서 2시간 동안 인큐베이션하였다. 소화된 pTrcHis2B 벡터를 1.2% E-겔 (Invitrogen Corp.)을 사용하여 겔 정제하고, QIAquick Gel Extraction 키트 (Qiagen)를 사용하여 추출하였다 (도 56). BspHI 및 NcoI 위치의 양립성 부착 말단을 사용하여, 5 ㎕ P. 알바 이소프렌 신타아제 삽입물, 2 ㎕ pTrc 벡터, 1 ㎕ T4 DNA 리가아제 (New England Biolabs), 2 ㎕ 10X 리가아제 완충액 및 10 ㎕ ddH2O를 함유하는 20 ㎕ 라이게이션 반응물을 제조하였다. 라이게이션 혼합물을 실온에서 40분 동안 인큐베이션하였다. ddH2O의 페트리 접시에 0.025 ㎛ 니트로셀룰로오스 막 필터 (Millipore)를 띄우고 실온에서 30분 동안 라이게이션 혼합물을 니트로셀룰로오스 막 필터 상부에 조심스럽게 도포시켜 라이게이션 혼합물을 탈염시켰다. MCM446 세포 (II 부분 참조)를 LB에서 중간 로그상까지 성장시킨 후 얼음 냉각된 멸균수로 3회 세척하였다. 50 ㎕의 세포 현탁액 분취액을 5 ㎕의 탈염된 pTrc P. alba HGS 라이게이션 믹스와 혼합하였다. 세포 현탁액 혼합물을 Gene Pulser Electroporator를 사용하여 2.5 볼트 및 25 uFd에서 2 mm 큐벳 내에서 전기천공하였다. 1 ㎖의 LB를 세포에 즉시 첨가한 후, 금속 마개를 갖는 14 ㎖ 폴리프로필렌 튜브 (Sarstedt)에 옮겼다. 30℃에서 2시간 동안 성장시켜 세포가 회수되게 하였다. 형질전환체를 L 한천 및 50 ㎍/㎕ 카르베니실린 및 10 mM 메발론산 상에서 선별하고, 30℃에서 인큐베이션하였다. 다음날, 6개의 형질전환체를 고르고, 5 ㎖ L 브로쓰 및 50 ㎍/㎕ 카르베니실린 튜브에서 30℃에서 하룻밤 동안 성장시켰다. 플라스미드 프렙을 QIAquick Spin Miniprep 키트 (Qiagen)를 사용하여 하룻밤 배양물에서 수행하였다. 플라스미드를 증식시키기 위한 BL21 세포의 사용으로 인해, 고품질 플라스미드 DNA를 수득하기 위하여 PB 완충액 5X 및 PE 완충액 3X를 사용한 스핀 컬럼 세척의 변경을 표준 제조사의 프로토콜에 포함시켰다. 플라스미드를 20 ㎕ 반응물에서 PstI로 소화시켜 올바른 크기의 선형 절편을 보증하였다. 모든 6개의 플라스미드는 올바른 크기였고, 프라이머 MCM65, MCM66, EL1000로 서열분석하기 위해 Quintara Biosciences (Berkeley, CA)로 수송하였다 (표 4). DNA 서열분석 결과는 모든 6개의 플라스미드가 올바르다는 것을 나타냈다. 하나를 고르고 플라스미드를 EWL230으로 지정하였다 (도 57, 58A 및 58B).
iv) 플라스미드 pEWL244 (pTrc P. alba-mMVK)의 구성
PCR 반응을 수행하여, 제조사의 프로토콜에 따라 주형으로서 MCM376 (v 부분 참조), 프라이머 MCM165 및 MCM177 (표 4 참조), 및 Pfu Ultra II 융합 DNA 중합효소 (Stratagene)를 사용하여 메타노사르키나 마제이 (M. 마제이) MVK 유전자를 증폭하였다. PCR 조건은 하기와 같다: 95℃에서 2분 (첫 사이클에서만), 95℃에서 25초, 55℃에서 25초, 72℃에서 18초, 28 사이클 동안 반복, 72℃에서 1분 동안 최종 연장. M. 마제이 MVK PCR 생성물을 QIAquick PCR Purification 키트 (Qiagen Inc.,)를 사용하여 정제하였다.
이후, M. 마제이 MVK PCR 생성물을 8 ㎕ PCR 생성물, 2 ㎕ PmeI 엔도뉴클레아제 (New England Biolabs), 4 ㎕ 10X NEB 완충액 4, 4 ㎕ 10X NEB BSA 및 22 ㎕ 의 ddH2O를 함유하는 40 ㎕ 반응물에서 소화시켰다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 QIAquick PCR Purification 키트를 사용하여 정제하였다. 제 2 제한 소화를 2 ㎕ NsiI 엔도뉴클레아제 (Roche), 4.7 ㎕ 10X 완충액 H 및 40 ㎕의 PmeI 소화된 M. 마제이 MVK 절편을 함유하는 47 ㎕ 반응물에서 수행하였다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 1.2% E-겔을 사용하여 겔 정제하고, QIAquick Gel Extraction 키트를 사용하여 추출하였다. 플라스미드 EWL230을 10 ㎕ 플라스미드, 2 ㎕ PmeI 엔도뉴클레아제, 4 ㎕ 10X NEB 완충액 4, 4 ㎕ 10X NEB BSA 및 20 ㎕의 ddH2O를 함유하는 40 ㎕ 반응물에서 소화시켰다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 QIAquick PCR Purification 키트를 사용하여 정제하였다. 제 2 제한 소화를 2 ㎕ PstI 엔도뉴클레아제, 4.7 ㎕ 10X 완충액 H 및 40 ㎕의 PmeI 소화된 EWL230 선형 절편을 함유하는 47 ㎕ 반응물에서 수행하였다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 소화된 PCR 절편을 이후 1.2% E-겔을 사용하여 겔 정제하고, QIAquick Gel Extraction 키트를 사용하여 추출하였다 (도 59). NsiI 및 PstI 위치의 양립성 부착 말단을 사용하여, 8 ㎕ M. 마제이 MVK 삽입물, 3 ㎕ EWL230 플라스미드, 1 ㎕ T4 DNA 리가아제, 2 ㎕ 10X 리가아제 완충액 및 6 ㎕ ddH2O를 함유하는 20 ㎕ 라이게이션 반응물을 제조하였다. 라이게이션 혼합물을 16℃에서 하룻밤 동안 인큐베이션하였다. 다음날, ddH2O의 페트리 접시에 0.025 ㎛ 니트로셀룰로오스 막 필터를 띄우고 실온에서 30분 동안 라이게이션 혼합물을 니트로셀룰로오스 막 필터의 상부에 조심스럽게 도포시켜 라이게이션 혼합물을 탈염시켰다. MCM446 세포를 LB에서 중간 로그상까지 성장시킨 후 얼음 냉각된 멸균수로 3회 세척하였다. 50 ㎕의 세포 현탁액 분취액을 5 ㎕의 탈염된 pTrc P.alba-mMVK 라이게이션 믹스와 혼합하였다. 세포 현탁액 혼합물을 Gene Pulser Electroporator를 사용하여 2.5 볼트 및 25 uFd에서 2 mm 큐벳 내에서 전기천공하였다. 1 ㎖의 LB를 세포에 즉시 첨가한 후, 금속 마개를 갖는 14 ㎖ 폴리프로필렌 튜브에 세포를 옮겼다. 30℃에서 2시간 동안 성장시켜 세포가 회수되게 하였다. 형질전환체를 LA 및 50 ㎍/㎕ 카르베니실린 및 5 mM 메발론산 플레이트 상에서 선별하고, 30℃에서 인큐베이션하였다. 다음날, 6개의 형질전환체를 고르고, 5 ㎖ LB 및 50 ㎍/㎕ 카르베니실린 튜브에서 3O℃에서 하룻밤 동안 성장시켰다. 플라스미드 프렙을 QIAquick Spin Miniprep 키트를 사용하여 하룻밤 배양물에서 수행하였다. 플라스미드를 증식시키기 위한 BL21 세포의 사용으로 인해, 고품질 플라스미드 DNA를 수득하기 위하여 PB 완충액 5X 및 PE 완충액 3X를 사용한 스핀 컬럼 세척의 변경을 표준 제조사의 프로토콜에 포함시켰다. 플라스미드를 20 ㎕ 반응물에서 PstI로 소화시켜 올바른 크기의 선형 절편을 보증하였다. 6개의 플라스미드 중 3개는 올바른 크기였고, 프라이머 MCM65, MCM66, EL1000, EL1003 및 EL1006으로 서열분석하기 위해 Quintara Biosciences로 수송하였다 (표 4). DNA 서열분석 결과는 모든 3개의 플라스미드가 올바르다는 것을 나타냈다. 하나를 고르고 플라스미드를 EWL244로 지정하였다 (도 60, 61A~B).
v) pET200D에서의 M. 마제이 고세균성 하위로부터의 플라스미드 MCM376 - MVK의 구성
Invitrogen Platinum HiFi PCR 믹스를 사용하고 프라이머 MCM161 및 MCM162 (표 4)를 사용하여 M. 마제이 고세균성 하위 경로 오페론으로부터의 MVK ORF (도 73A~C)를 PCR 증폭하였다. 45 uL의 PCR 믹스를 1 uL 주형, 10 uM의 각 프라이머 1 uL, 및 2 uL 물과 조합하였다. 하기의 사이클과 같은 반응을 수행하였다: 94℃에서 2:00분; 94℃에서 0:30분, 55℃에서 0:30분 및 68℃에서 1:15분의 30 사이클; 및 이후 72℃에서 7:00분, 및 냉각될 때까지 4℃. 3 uL의 상기 PCR 반응물을 제조사의 프로토콜에 따라 Invitrogen pET200D 플라스미드에 라이게이션시켰다. 3 uL의 상기 라이게이션물을 Invitrogen TOP 10 세포에 도입하고, 형질전환체를 LA/kan50 상에서 선별하였다. 형질전환체로부터의 플라스미드를 단리하고 삽입물을 서열분석하여, MCM376이 야기되었다 (도 74A~C).
vi) 균주 EWL251 (BL21(DE3), Cm-GI1.2-KKDyI, pTrc P.alba-mMVK)의 구성
MCM331 세포 (S. 세레비지에 메발로네이트 키나아제, 메발로네이트 포스페이트 키나아제, 메발로네이트 피로포스페이트 데카르복실라아제 및 IPP 이성화효소를 인코딩하는 염색체 구성물 gi1.2KKDyI를 함유함)를 LB에서 중간 로그상까지 성장시킨 후 얼음 냉각된 멸균수로 3회 세척하였다. 50 ㎕의 세포 현탁액을 1 ㎕의 플라스미드 EWL244와 혼합하였다. 세포 현탁액 혼합물을 Gene Pulser Electroporator를 사용하여 2.5 볼트 및 25 uFd에서 2 mm 큐벳 내에서 전기천공하였다. 1 ㎖의 LB를 세포에 즉시 첨가한 후, 금속 마개를 갖는 14 ㎖ 폴리프로필렌 튜브에 옮겼다. 30℃에서 2시간 동안 성장시켜 세포가 회수되게 하였다. 형질전환체를 LA 및 50 ㎍/㎕ 카르베니실린 및 5 mM 메발론산 플레이트 상에서 선별하고 37℃에서 인큐베이션하였다. 한 콜로니를 선별하고 균주 EWL251로 지정하였다.
vii) 균주 EWL256 (BL2(DE3), Cm-GI1.2-KKDvI, pTrc P.alba-mMVK, pCL Upper MVA)의 구성
EWL251 세포를 LB에서 중간 로그상까지 성장시킨 후, 얼음 냉각된 멸균수로 3회 세척하였다. 50 ㎕의 세포 현탁액을 1 ㎕의 플라스미드 MCM82 (E. 파에칼리스 mvaE 및 mvaS를 인코딩하는 pCL PtrcUpperPathway)와 혼합하였다. 세포 현탁액 혼합물을 Gene Pulser Electroporator를 사용하여 2.5 볼트 및 25 uFd에서 2 mm 큐벳 내에서 전기천공하였다. 1 ㎖의 LB를 세포에 즉시 첨가한 후, 금속 마개를 갖는 14 ㎖ 폴리프로필렌 튜브에 옮겼다. 30℃에서 2시간 동안 성장시켜 세포가 회수되게 하였다. 형질전환체를 LA 및 50 ㎍/㎕ 카르베니실린 및 50 ㎍/㎕ 스펙티노마이신 플레이트 상에서 선별하고 37℃에서 인큐베이션하였다. 한 콜로니를 고르고 균주 EWL256으로 지정하였다.
[표 4: 프라이머 서열]
Figure pct00004
II. MCM442-449의 구성: FRT-cmR-FRT-gi1.x-mKKDyI를 갖는 BL21 및 BL21(DE3)
i) 재조합을 위한 주형의 구성
FRT-기준 재조합 카세트, 및 Red/ET-매개 융합용 플라스미드 및 항생제 마커 루프아웃을 Gene Bridges GmbH (Germany)에서 수득하였다. 이들 재료를 사용하는 절차를 Gene Bridges 프로토콜에 따라 실행하였다. 프라이머 MCM193 및 MCM 195를 사용하여, 제조사의 프로토콜에 따라 Stratagene Herculase II Fusion 키트를 사용하여 FRT-gb2-Cm-FRT 주형으로부터 내성 카세트를 증폭하였다. 5O uL 반응물을 하기와 같은 사이클에 적용하였다: 95℃, 2분; (95℃, 20초, 55℃, 20초, 72℃, 1분) x 5, (95℃, 20초, 60℃, 20초, 72℃, 1분) x 25; 72℃, 3분; 냉각될 때까지 4℃. 제조사의 프로토콜에 따라 Qiagen PCR 컬럼으로 암플리콘을 정제하고, 3O uL EB (용리 완충액)에서 용리하였다. 1x Roche H 완충액 및 0.5 uL BSA를 갖는 2O uL 반응물 내에서 NdeI 및 PciI로 DNA를 소화시켰다. 각각 1 uL의 NdeI, NcoI, 및 Roche H 완충액을 함유하는 10 uL 반응물 내에서 플라스미드 MCM376을 소화시켰다. 반응을 37℃에서 하룻밤 동안 진행시킨 후, 절단된 DNA를 Qiagen PCR 컬럼 상에서 정제하고 3O uL EB에서 용리하였다. 1 uL 벡터, 3 uL PCR 생성물, 1 uL Roche Quick 리가아제 완충액 2, 5 uL 완충액 1, 및 1 uL 리가아제를 함유하는 반응물 내에서 PCR 생성물을 MCM376에 라이게이션하였다. 반응을 실온에서 3시간 동안 진행시킨 후, 제조사의 프로토콜에 따라 5 uL를 Invitrogen TOP 10 세포에 형질전환하였다. 형질전환체를 L 한천 (LA) 및 클로람페니콜 (10 ug/㎖) 상에서 37℃에서 하룻밤 동안 선별하였다.
보관을 위해 형질전환체 콜로니를 클로람페니콜 (30 ug/㎖) 및 카나마이신 (50 ug/㎖) 함유 LA에 적용하고, 서열분석을 위해 Quintara (Berkeley, CA)에 보냈다. 프라이머 MCM195 내의 "N"에서의 네 가지 상이한 뉴클레오티드를 각각 갖는 네 개의 콜로니가, 삽입된 프로모터에 대해 올바른 서열을 갖는 것으로 발견되었다. 클론을 클로람페니콜 (30 ug/㎖) 및 카나마이신 (50 ug/㎖) 함유 LB 5 ㎖에서 성장시키고, 플라스미드 DNA의 제조에 사용하였다. 상기 플라스미드를 TOP 10 세포에 재형질전환하고, 균주를 하기와 같이 동결하였다:
[표 5: MCM484-487]
Figure pct00005
ii) 재조합 표적 균주 MCM349 및 MCM441의 생성
제조사의 지시사항에 따라 플라스미드 pGB706 (GeneBridges)을 사용하여 클로람페니콜 내성 (cmR) 마커를 균주 MCM331의 외부로 루프화시켰다. MCM331 세포를 LB에서 중간 로그상까지 성장시킨 후, 얼음 냉각된 멸균수로 3회 세척하였다. pGB706 DNA의 1 uL 분취액을 5O uL의 세포 현탁액에 첨가하고, 상기 혼합물을 2.5 볼트, 25 uFd에서 2 mm 큐벳 내에서 전기천공한 직후 3O℃에서 1시간 동안 50O uL LB에서 회수하였다. 형질전환체를 3O℃에서, 테트라사이클린 (5 ug/㎖) 함유 LB 상에서 선별하였다. 다음날, 눈에 띄게 탁해질 때까지 (약 0.5~0.8의 OD600) 클론을 테트라사이클린 (5 ug/㎖) 함유 LB에서 3O℃에서 성장시켰다. 상기 배앙물을 LB에 스트리킹하고 37℃에서 하룻밤 동안 성장시켰다. 클로람페니콜 (10 ug/㎖) 함유 LB 또는 테트라사이클린 (5 ug/㎖) 함유 LB에서 성장할 수 없는 클론을 MCM348로서 동결하였다. 플라스미드 MCM356 (pRedET 카르벤실린; GeneBridges)을 상기 기재된 바와 같이 전기천공하고, 형질전환체를 카르베니실린 (50 ug/㎖) 함유 LB 상에서 30℃에서 선별하였다. 클론을 LB 카르베니실린 (50 ug/㎖)에서 30℃에서 성장시키고 MCM349로서 동결하였다.
상기와 같이 플라스미드 MCM356를 EWL204에 전기형질전환 (electrotransformation)하여 균주 MCM441을 제작하였다.
iii) FRT-cmR-FRT-gi1.x-mMVK의 MCM349 및 MCM441 내로의 재조합
제조사의 프로토콜에 따라, 프라이머 MCM120 및 MCM196 및 Herculase II Fusion 키트와 함께 PCR 증폭을 위한 주형으로서 플라스미드 MCM484-487을 사용하였다. 0, 1 또는 3 uL DMSO로, 주형 당 세 반응을 실행하였다. 5O uL 반응물을 하기와 같은 사이클에 적용하였다: 95℃, 2분; 5 사이클 동안 (95℃, 20초; 55℃, 20초; 72℃, 1.5분); 25 사이클 동안 (95℃, 20초; 6O℃, 20초; 72℃, 1.5분); 72℃에서 3분; 하룻밤 동안 4℃. 주어진 주형으로부터의 세 반응물을 모으고 Qiagen PCR 컬럼 상에서 정제하고, 60℃에서 30 uL EB로 용리하였다. 37℃에서 3시간 동안 1x Roche 완충액 A에서 5 uL DNA를 1 uL DpnI으로 소화시켰다. 상기 DNA를 이후 30분 동안 과량의 물에 대해 미세투석하였다.
새로이 스트리킹한 균주를 30℃에서 약 0.5의 OD600으로 카르베니실린 (50 ug/㎖) 함유 LB 5 ㎖에서 성장시켰다. 4O mM L-아라비노오스를 첨가하고, 배양물을 37℃에서 1.5시간 동안 인큐베이션하였다. 세포를 수확하고 상기 3 uL 투석된 암플리콘으로 전기천공한 후, 50O uL SOC에서 37℃에서 1.5~3시간 동안 회수하였다. 형질전환체를 클로람페니콜 (5 ug/㎖) 함유 LA 플레이트 상에서 37℃에서 선별하였다.
카나마이신 감수성 클론을 암플리콘의 삽입을 위한 PCR에 의해 스크리닝하였다. 양성 클론으로부터의 PCR 생성물을 서열분석하여 삽입된 DNA의 서열을 확인하였다. 암플리콘은 FRT-cmR-FRT-gi1.x-mKKDyI로 대체되는 MCM441 및 348 내 attTn7에서의 FRT-gi1.2-yKKDyI와 일치하였다 (yK 및 mK 지정은 각각 사카로마이세스 세레비지에 및 메타노사르키나 마제이로부터의 메발로네이트 키나아제를 나타냄).
[표 6A: 하기의 균주를 클로람페니콜 (5 ug/㎖) 함유 LB에서 성장시키고 동결하였음]
Figure pct00006
[표 6B: 프라이머]
Figure pct00007
III. 메발론산 경로로부터의 유전자를 발현하며 15ℓ 규모에서의 유가식 배양물에서 성장하는 대장균에서의 이소프렌 생성에 대한 효모 추출물의 효과
배지 제조 방법 (발효 배지 ℓ 당):
K2HPO4 7.5 g, MgSO4 * 7H2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, 효모 추출물 0.5 g, 1000X 변형 미량 금속 용액 1 ㎖. 모든 성분을 diH2O에 함께 첨가하고 용해하였다. 상기 용액을 오토클레이브하였다. 수산화암모늄 (30%)으로 pH를 7.0으로 조정하고 부피에 대해 충분량이 되게 하였다. 글루코오스 1O g, 티아민 * HCl 0.1 g, 및 항생제를 멸균 및 pH 조정 후 첨가하였다.
1000X 변형 미량 금속 용액:
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO4 * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 Di H2O에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0이 되게 하고, 부피에 대해 충분량이 되게 하고 0.22 마이크론 필터로 여과 멸균하였다.
상위 메발론산 (MVA) 경로 (pCL Upper), 융합된 하위 MVA 경로 (gi1.2KKDyI), 및 M. 마제이로부터의 메발로네이트 키나아제 및 P. 알바로부터의 이소프렌 신타아제 (pTrcAlba-mMVK)의 고발현물을 포함하는 BL21 (DE3) 대장균 세포를 갖는 15ℓ 생물반응기에서 발효를 실행하였다. 이러한 실험을 실행하여 원하는 발효 pH 7.0 및 온도 30℃에서 글루코오스로부터 이소프렌이 형성되는 것을 모니터링하였다. 대장균 균주의 동결 바이알을 해동시키고, 트립톤-효모 추출물 배지에 접종하였다. 접종물이 OD 1.0 (550 nm에서 측정됨)으로 성장한 후, 초기 부피를 5ℓ로 하는 15ℓ생물반응기에 접종하는데 500 ㎖를 사용하였다.
i) 효모 추출물 공급 없이 유가식 배양에서 성장한 대장균 세포 (EL256)에서의 이소프렌의 생성
세포가 정지상에 도달할 때까지 지수 증대 속도로 글루코오스를 공급하였다. 이후, 글루코오스 공급을 감소시켜 대사작용 요구를 충족시켰다. 67시간 발효 동안 생물반응기로 전달된 글루코오스의 총량은 3.9 ㎏이었다. 이소프로필-베타-D-1-티오갈락토피라노시드 (IPTG)를 첨가하여 유도하였다. 550 nm에서의 광학 밀도 (OD550)가 9의 값에 도달했을 때 IPTG 농도는 102 uM이었다. OD55O이 140에 도달했을 때 IPTG 농도는 192 uM으로 상승하였다. 시간에 걸친 생물반응기 내의 OD550 프로파일을 도 67A에 나타내었다. 생물반응기로부터의 배출 기체 중 이소프렌 수준을 Hiden 질량 분석기를 사용하여 측정하였다. 이소프렌 역가는 발효의 과정에 걸쳐 35.6 g/L의 최종 값으로 증가하였다 (도 67B). 67시간 발효 동안 생성된 이소프렌의 총량은 320.6 g이었고, 생성의 시간 추이를 도 67C에 나타내었다. TCER로 측정된 바와 같은 대사작용 활성 프로파일을 도 67D에 나타내었다. 발효 동안 이소프렌을 생성하는데 이용된 탄소의 몰 수율은 17.9%였다. 글루코오스로부터의 이소프렌의 중량% 수율은 8.1%였다.
효모 추출물을 공급하는 유가식 배양에서 성장한 대장균 세포 (EL256)에서의 이소프렌의 생성
세포가 정지상에 도달할 때까지 지수 증대 속도로 글루코오스를 공급하였다. 이후, 글루코오스 공급을 감소시켜 대사작용 요구를 충족시켰다. 68시간 발효 동안 생물반응기로 전달된 글루코오스의 총량은 7.1 ㎏이었다. 총 1.06 ㎏의 효모 추출물을 또한 발효 동안 공급하였다. IPTG를 첨가하여 유도하였다. 550 nm에서의 광학 밀도 (OD550)가 7의 값에 도달했을 때 IPTG 농도는 208 uM이었다. OD55O이 180에 도달했을 때 IPTG 농도는 193 uM으로 상승하였다. 시간에 걸친 생물반응기 내의 OD550 프로파일을 도 68A에 나타내었다. 생물반응기로부터의 배출 기체 중 이소프렌 수준을 Hiden 질량 분석기를 사용하여 측정하였다. 이소프렌 역가는 발효의 과정에 걸쳐 32.2 g/L의 최대값으로 증가하였다 (도 68B). 68시간 발효 동안 생성된 이소프렌의 총량은 395.5 g이었고, 생성의 시간 추이를 도 68C에 나타내었다. 체적 생산성의 시간 추이를 도 68D에 나타내었고, 이는 1.1 g/L/시간의 평균 속도를 23 내지 63시간 동안 유지하였다는 것을 나타낸다. CER로 측정된 바와 같은 대사작용 활성 프로파일을 도 68E에 나타내었다. 발효 동안 이소프렌을 생성하는데 이용된 탄소의 몰 수율은 10.3%였다. 글루코오스로부터의 이소프렌의 중량% 수율은 5.2%였다.
IV. 메발론산 (MVA) 경로 및 이소프렌 신타아제를 갖는 대장균 (EWL256)에서의 상이한 탄소원으로부터의 이소프렌의 생성
배지 제조 방법 (발효 배지 ℓ 당):
K2HPO4 13.6 g, KH2PO4 13.6 g, MgSO4 * 7H2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, (NH4)2SO4 3.2 g, 효모 추출물 0.2 g, 1000X 변형 미량 금속 용액 1 ㎖. 모든 성분을 순차적으로 diH2O에 용해하였다. 수산화암모늄 (30%)으로 pH를 6.8로 조정하고, 부피에 대해 충분량이 되게 하였다. 배지를 0.22 마이크론 필터로 여과 멸균하였다. 탄소원을 1%의 최종 농도로 첨가하였다. 멸균 및 pH 조정 후에 필요한 항생제를 첨가하였다.
1000X 미량 금속 용액 (발효 배지 ℓ 당):
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO4 * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 diH2O에 한번에 하나씩 용해하고, HCl/NaOH로 pH를 3.0이 되게 하고, 부피에 대해 충분량이 되게 하고 0.22 마이크론 필터로 여과 멸균하였다.
i) AFEX 바이오매스 가수분해물의 제조
AFEX 사전처리된 옥수수대를 가수분해하여 자일로오스, 글루코오스 및 아세테이트를 모두 함유하는 바이오매스 가수분해물을 제조하였다.
[Michigan Biotechnology Institute]에서 제공된 AFEX 사전처리 옥수수대를 사용하였다. 사전처리 조건은 60% 수분, 1:1 암모니아 적하량, 및 90℃에서 30분 동안이었고, 그 후 자연 건조하였다. AFEX 사전처리 옥수수대 중의 수분 함량은 21.27%였다. AFEX 사전처리 옥수수대 중의 글루칸 및 자일란의 함량은 각각 31.7% 및 19.1% (건조량 기준)였다. 사용되는 효소는 Accellerase 1000, Grindamyl H121 (제빵용 아스페르길루스 니게르로부터의 Danisco 자일라나아제 제품)이었다.
당화의 경우, 20 g의 AFEX 사전처리 옥수수대를 500 ㎖ 플라스크 내에, 5 ㎖의 1 M pH 4.8 나트륨 시트레이트 완충액, 2.25 ㎖의 Accellerase 1000, 0.1 ㎖의 Grindamyl H121, 및 72.65 ㎖의 DI 물과 함께 첨가하였다. 플라스크를 궤도 진탕기에 넣고, 50℃에서 96시간 동안 인큐베이션하였다.
분석을 위해, 진탕기에서 하나의 샘플을 취하여, HPLC를 사용하여 분석하였다. 가수분해물에는 37.2 g/L의 글루코오스 및 24.3 g/L의 자일로오스, 및 7.6 g/L의 글루코오스 및/또는 자일로오스의 올리고머가 함유되어 있었다. 추가적으로는, 가수분해물에는 또한 1.17 g/L 아세테이트가 함유되어 있었다.
ii) 실험 절차
MVA 경로 및 이소프렌 신타아제를 함유하는 대장균 균주 EWL256의 접종물을 동결 바이알로부터 취하고 스펙티노마이신 (50 ug/㎖) 및 카르비니클린 (50 ug/㎖)을 함유하는 LB 브로쓰 한천 플레이트에 스트리킹하고 30℃에서 하룻밤 동안 인큐베이션하였다. 단일 콜로니를 유일한 탄소원으로서 글루코오스, 자일로오스, 글리세롤, 아세테이트 또는 바이오매스를 함유하는 TM3 배지에 접종하고, 30℃에서 하룻밤 동안 성장시켰다. 아세테이트 상에서 성장한 세포는 유의하게 낮은 광학 밀도에 도달하였다. 글루코오스, 글리세롤, 바이오매스 가수분해물 또는 아세테이트 상에서 성장한 세포를 각각의 탄소원을 함유하는 TM3 배지 20 ㎖에 희석하여 60O nM에서 측정된 0.1 사이의 광학 밀도에 도달하도록 하였다. 임의의 탄소원을 함유하지 않는 음성 대조군을 글루코오스 하룻밤 배양물로부터 제조하였다. 글루코오스 및 자일로오스로 별도의 실험을 수행하였고, 이때 배양물을 0.05의 광학 밀도로 희석하였다. 모든 배양 조건 (아세테이트 및 글리세롤의 경우를 제외함)을 2 반복으로 시험하고, 제시된 결과는 이들 배양물 사이의 평균으로 정하였다. 시험 시작시 200 μM IPTG로 이소프렌의 생성을 유도하였다. 플라스크를 궤도 진탕기 (200 rpm)에서 30℃에서 인큐베이션하고, 광학 밀도 측정에 의해 성장을 확인하였다. 글루코오스 공급 배양물이 약 0.4의 광학 밀도에 도달한 후, 샘플을 3시간 동안 매 시간 모든 시험된 탄소원으로부터의 이소프렌 생성에 대해 분석하였다. 100 ㎕의 샘플을 2 ㎖ 유리 바이알로 2 반복으로 옮기고, 밀봉하고 30분 동안 30℃에서 인큐베이션하였다. 이후 80℃에서 8분 동안의 인큐베이션에 의해 세균을 열 사멸시켰다. GC-MS를 사용하여 생성된 이소프렌의 양을 측정하고 특이적 생산성 (㎍/L*시간)을 계산하였다.
iii) 결과
모든 시험된 탄소원 상에서의 성장 동안 유의한 이소프렌 생성이 입증될 수 있었다. 이러한 탄소원은 통상의 알코올, 유기산, 5 또는 6 (C5 또는 C6) 탄당, 및 바이오매스 가수분해물의 예이다.
바이오매스 가수분해물 상에서의 초기 성장 속도는 글루코오스 상에서의 성장 속도에 필적하였다 (도 69A). 바이오매스 가수분해물 상에서의 성장 동안의 초기 특이적 생산성은 글루코오스 상에서의 성장 동안의 것보다 유의하게 높았다. 이것은 바이오매스 가수분해물이 이소프렌 생성을 위한 효율적인 탄소원으로서 사용될 수 있다는 것을 입증한다. 특이적 생산성은 바이오매스 가수분해물 상에서의 성장 255분 후 감소하였다 (도 69B). 세균는 글루코오스와 비교하였을 때 유일한 탄소원으로서 자일로오스를 사용하여 낮은 성장 속도를 보였으나 (도 69C), 유의한 특이적 이소프렌 생산성이 측정되었다 (도 69D). 이는 C5 및 C6 당 모두가 메발로네이트 산 경로를 통한 이소프렌의 생성에 이용될 수 있다는 것을 보여준다.
놀랍게도, 유일한 탄소원으로서의 아세테이트 상에서 성장한 세균은 글루코오스 상에서의 성장 동안 약 2배 높은 이소프렌의 특이적 생산성을 가졌다 (도 69A). 세균은 글루코오스와 비교하였을 때 아세테이트 상에서 더 느리게 성장하지만 (도 69B), 수행된 실험은 아세테이트가 또한 이소프렌의 생성을 위한 탄소원으로서 사용될 수 있다는 것을 입증한다. 아세테이트는 또한 HPLC에 의해 측정된 바와 같이 바이오매스 가수분해물 내에 존재하였다.
세균은 유일한 탄소원으로서의 글리세롤로 잘 성장하였고 (도 69A), 유의한 이소프렌 생성이 입증되었다 (도 69B). 이는 통상의 알코올도 또한 메발로네이트 산 경로를 통한 이소프렌의 생성을 위한 탄소원으로서 사용될 수 있다는 것을 보여준다.
실시예 11: 스트렙토마이세스 종에서의 식물로부터의 이소프렌- 신타아제의 발현
이소프렌 신타아제 Kudzu에 대한 유전자는 플라스미드 pJ201:19813으로부터 수득되었다. 플라스미드 pJ201:19813은 푸에라이아 로바타 (Pueraia lobata) (Kudzu 식물)로부터의 이소프렌 신타아제를 인코딩하고, 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 슈도모나스 푸티다 (Pseudomonas putida), 로도슈도모나스 팔루스트리스 (Rhodopseudomonas palustris) 및 코리네박테리움 (Corynebacterium)에 대해 코돈-최적화되어 있다 (도 79A~79C (SEQ ID NO:123)). 플라스미드 pJ201:19813를 제한 효소 NdeI 및 BamHI로 소화시키면 유전자 isol9813이 방출되고, 이를 스트렙토마이세스-대장균 셔틀 벡터 pUWL201PW (Doumith 등, Mol. Gen. Genet. 264: 477-485, 2000; 도 71) 내로 라이게이션시켜 pUWL201_iso를 생성시킨다. pUWL201_iso의 제한 분석에 의해 성공적인 클로닝을 확인하였다. 이소프렌 신타아제 isol9813의 발현은, 스트렙토마이세스 종에서의 항시적 발현은 허용하나, 대장균에서의 발현은 허용하지 않는 erm-프로모터의 조절 하에서 이루어졌다.
PUWL201PW (삽입물 없음) 및 pUWL201_iso를 [Hopwood 등., The John innes foundation, Norwich, 1985]에 의해 기재되는 바와 같이 원형질체의 형질전환에 의해 스트렙토마이세스 알부스 J1074 (Sanchez 등., Chem. Biol. 9:519-531, 2002) 내로 도입하였다.
원형질체 현탁액의 200 ㎕ 분취액을 1.9 ㎍ pUWL201PW 또는 2.9 ㎍ pUWL201_iso로 형질전환시켰다. 비-선별성 R5-한천 플레이트 상에서 28℃에서 하룻밤 동안 인큐베이션한 후, 티오스트렙톤 (250 ㎍/㎖)을 함유하는 R3-오버레이 한천에서 4일 동안 추가 인큐베이션하여 양성 형질전환체를 선별하였다. 티오스트렙톤 내성 형질전환체를 Plasmid Mini 키트 (Qiagen)를 사용하는 플라스미드 제제에 의해 pUWL-플라스미드의 존재 하에서 시험하였다. 준비된 플라스미드 DNA를 대장균 DH5α 내로 재도입하여, 제한 분석으로 분석하기에 충분한 양의 플라스미드 DNA를 생성시켰다. 양성 형질전환체를 암피실린-함유 L-한천 플레이트 상에서 선별하고 NdeI 및 BamHI 엔도뉴클레아제로 플라스미드 DNA를 소화시켜 삽입물 분석을 수행하였다. 이소프렌 신타아제를 양성 pUWL201 iso 클론에서 1.7 kb 절편으로서 확인하였으나, 대조군 균주 (pUWL201PW)에서는 이러한 절편이 관찰되지 않았다.
대조군 플라스미드 pUWL201PW 또는 이소프렌 신타아제 인코딩 pUWL201_iso를 함유하는 S. 알부스의 형질전환체 및 야생형 균주를 이소프렌 형성에 대해 분석하였다. 티오스트렙톤 (200 ㎍/㎖)의 존재 또는 부재 하의 고체 배지 (트립신 콩 브로쓰 한천, TSB; 2.5 ㎖) 상에서 균주를 2 반복으로 배양하고, 밀봉된 상부공간 바이알 (총 부피 20 ㎖) 내에 28℃에서 4일 동안 인큐베이션하였다. SIM-방식으로 GC-MS에 의해 500 ㎕ 상부공간 샘플 (종결 지점 측정)을 분석하고, 이소프렌을 참조 지체 시간 및 분자량 (67 m/z)에 따라 확인하였다. 상부공간 샘플 내에 존재하는 이소프렌을 이전에 생성된 검정 곡선에 의해 정량화하였다. 야생형 S. 알부스 및 pUWL201PW를 갖는 대조군 균주가 이소프렌을 검출 한계 (0.04~0.07 ppm) 보다 약간 높은 농도로 생성하는 반면, pUWL201_iso를 갖는 S. 알부스는 대조군에 비해 10배 이상 초과량으로 이소프렌을 생성하였다 (0.75 ppm; 도 72). 상기 결과는 악티노마이세테스 (Actinomycetes) 군의 원핵세포 유기체 내 식물 유래 이소프렌 신타아제의 성공적인 발현을 입증한다.
실시예 12: 상위 또는 상위 및 하위 메발론산 경로, 및 쿠주 이소프렌 신타아제를 함유하는 대장균 fadR atoC LS5218 내에서의 지방산 또는 야자유로부터 이소프렌 또는 메발로네이트의 생성
에스케리키아 콜라이 (대장균) fadR atoC 균주 LS5218 (#6966)은 [Coli Genetic Stock Center]로부터 수득하였다. FadR은 지방산 분해 효소를 인코딩하는 유전자의 발현을 하향 조절하는 전사 억제자를 인코딩한다 (Campbell 등, J. Bacteriol. 183: 5982-5990, 2001). AtoC는 AtoS와 함께 2 성분 조절 시스템에서의 반응 조절자로서, 아세토락테이트 신진 대사를 조절한다. fadR atoC 균주는 지방산 분해 유전자의 구조적 발현을 허용하고 장쇄 지방산을 장쇄 길이 폴리하이드록시알카노에이트 내로 도입시킨다. 야자유가 메발로네이트 또는 이소프렌 생성을 위한 탄소원으로서 사용되는 경우, 야자유는 글리세롤과 지방산으로 변환되었다. 이에 대한 방법은 당업계에 잘 알려져 있고, 이는 리파아제 (예를 들어, 돼지 (Porcine) 췌장 리파아제, 칸디다 루고사 (Candida rugosa) 리파아제, 또는 기타 유사한 리파아제)로의 인큐베이션에 의해 효소적으로 또는 수산화나트륨과 같은 염기로의 비누화에 의해 화학적으로 수행될 수 있다.
i) 상위 메발론산 경로를 발현하는 대장균 fadR atoC 균주
표준 방법 (Sambrooke 등, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor, 1989)을 사용하여 pCLPtrcUpperPathway를 LS5218 내로 전기천공하여 균주 WW4를 제작하였다. 탄소원으로서 C12 지방산 (FA) 또는 야자유가 보충된 TM3 배지에서 세포를 배양한 경우 메발론산 (MVA) 생성에 의해 플라스미드의 도입이 입증되었다. 지방산으로부터 WW4에 의한 MVA의 생성을 입증하기 위해, 하룻밤 배양액으로부터의 세포를 0.25% C12 FA (Sigma 카탈로그 번호 L9755)가 보충된 변형 TM3 배지 (효모 추출물이 없는 TM3) 5 ㎖ 내로 1 내지 100 배 희석시켰다. MVA 생성 (24 mg/L)의 첫 번째 징후는 IPTG 유도 배양액의 3O℃에서의 하룻밤 동안의 인큐베이션 후 명백하였다. 생성된 MVA의 194 mg/L의 최종 수준으로 3일에 걸쳐 생성이 증가하였다. 오일로부터 WW4에 의한 MVA의 생성을 입증하기 위해, 하룻밤 배양액으로부터의 세포를 TM3 배지 5 ㎖ 당 200 mg의 소화된 야자유가 보충된 변형 TM3 배지 내로 1 내지 100배 희석시켰다. MVA 생성 (50 mg/L)의 첫 번째 징후는 IPTG 유도 배양액의 3O℃에서의 하룻밤 동안의 인큐베이션 후 명백하였다. 생성된 MVA의 500 mg/L의 최종 수준으로 3일에 걸쳐 생성이 증가하였다.
ii) 상위 및 하위 MVA 경로 및 쿠주 이소프렌 신타아제를 발현하는 대장균 fadR atoC 균주
에스케리키아 콜라이 (대장균) 균주 WW4 (LS5218 fadR atoC pCLPtrcUpperPathway)를 pMCM118 [pTrcKKDyIkIS]로 형질전환시켜 WW10을 수득하였다. 균주를 TM3 및 글루코오스에서 배양하고 IPTG (100, 300 또는 900 uM)로 유도한 경우 이소프렌의 생성이라는 증거에 의해 플라스미드의 도입이 입증되었다. 균주는 IPTG에 비교적 민감성이었고, 100 uM IPTG에서도 유의한 성장 결핍을 보였다. 이러한 결과를 도 7OA에 나타내었다.
도데칸산으로부터의 이소프렌 생성을 시험하기 위해, WW10을 스펙티노마이신 (50 ug/㎖), 및 카나마이신 (50 ug/㎖) 함유 L 브로쓰에서 200 rpm에서 진탕하면서 37℃에서 하룻밤 동안 배양하였다. 변형 TM3 배지로의 본래 배양 부피에서의 원심분리 및 재현탁에 의해 세포를 변형 TM3 배지로 세척하였다. 상기 종균 배양물 (starter culture)로부터 세척되고 재현탁된 세포를 0.125% C12 지방산 (Sigma 카탈로그 번호 L9755) 함유 변형 TM3 배지 5 ㎖ 내로 1 내지 100배 및 1 내지 10배 희석하였다.
야자유로부터의 메발로네이트의 생성을 입증하기 위하여, 37℃ 및 250 rpm에서 수일 동안 리파아제로 오일을 사전소화시켜 지방산을 방출시켰다 (튜브가 진탕될 때 형성된 거품에 의해 가수분해가 증명되는 것으로 판단됨).
추가로, 야자유와 함께 시험 튜브에 함유된 변형 TM3 매질에서 세척된 세포를 1 내지 10배 희석시킴으로써 배양물을 제조하였다. 추가 희석 없이 세척된 세포의 잔여물 (2.5 ㎖)에 0.125% C12FA를 첨가함으로써 추가 튜브를 제조하였다 (생물변환 (bioconversion)). 250 rpm에서 진탕하면서 30℃에서 3.75시간 성장시킨 후, 50 uM IPTG를 첨가하여 배양물 모두를 유도하였다. 변형된 상부공간 검정법 (500 rpm에서 진탕하면서 30℃에서 1시간 축적)을 이용하여 이소프렌 축적에 대해 각각의 배양물 200 uL를 검정한 후 4시간 동안 인큐베이션을 지속하였다. 추가적인 이소프렌 검정법을 GCMS 분석 전에 검정법 유리 블록의 12시간 인큐베이션으로 수행하였다. 유도된 배양물의 인큐베이션을 하룻밤 동안 유지하고, 다음날 아침 200 uL 분취량을 이소프렌 생성에 대해 다시 검정하였다 (1시간, 30 deg, 500 rpm Shel-Lab 진탕기). 상기 배양물의 분석을 통해 유의한 수준의 이소프렌의 생성이 나타났다. 하룻밤 동안 인큐베이션되고 유도된 후 하룻밤 종균 배양물로부터의 1/10 희석물로 접종된 배양물에서 최고 수준의 이소프렌이 관찰되었다. 이러한 결과는 상기 배양물이 지속적으로 성장하고 세포 밀도를 증가시킨다는 것을 제안한다. 이러한 결과를 도 70B에 나타내었다. 지방산 현탁액의 외관이 탁하기 때문에 세포 밀도를 직접 측정할 수 없다. 그러므로 상기 배양물의 분취량을 플레이팅하여 상기 배양물의 세포 밀도를 측정하였고, 8xl07 콜로니 형성 단위가 나타났다. 이는 0.1의 OD600에 거의 상응한다. 그럼에도, 상기 배양물은 유의한 이소프렌 생성을 제공하였고; 본 실시예에 기재된 경로 없이는 유사한 균주에 대해서 이소프렌이 관찰되지 않는다.
실시예 13: 대장균에서 ybhE 의 항시적 발현에 의한 이소프렌 생성의 향상
본 실시예는 야생형 ybhE를 갖는 대조군 균주와 비교하여 ybhE (pgl)을 항시적으로 발현하는 균주에서의 이소프렌 생성을 나타낸다. 유전자 ybhE (pgl)는 이종으로 발현되는 단백질의 변역 후 글루코닐화를 억제하고, 생성물 용해도 및 수율을 향상시키면서 펜토오스 포스페이트 경로를 통해 바이오매스 수율 및 플럭스를 또한 개선시키는 6-포스포글루코노락토나아제를 인코딩한다 (Aon 등, Applied and Environmental Microbiology, 74(4): 950-958, 2008).
이소프렌을 생성하는 대장균의 BL21 균주 (EWL256)는 복제 플라스미드 pBBR1MCS5 (겐타마이신) (Dr. K. Peterson, Louisiana State University 로부터 수득함) 상의 ybhE 유전자의 항시적 발현으로 구성된다.
FRT-기준 재조합 카세트, 및 Red/ET-매개 융합용 플라스미드 및 항생제 마커 루프아웃을 Gene Bridges GmbH (독일)에서 수득하였다. 이들 재료를 사용하는 절차를 Gene Bridges 프로토콜에 따라 실행하였다. 프라이머 Pgl-F 및 PglGI1.5-R을 사용하여, 제조사의 프로토콜에 따라 Stratagene Herculase II Fusion 키트를 사용하여 FRT-gb2-Cm-FRT 주형으로부터 내성 카세트를 증폭하였다. PCR 반응물 (최종 부피 50 uL)은 5 uL 완충액, 1 uL 주형 DNA (Gene Bridges로부터의 FRT-gb2-Cm-F), 각 프라이머 10 pmol, 및 1.5 uL 25 mM dNTP 믹스를 함유하였고, dH2O를 사용하여 50 uL로 제조하였다. 반응물을 하기와 같은 사이클에 적용하였다: 1 x 2분, 95℃, 이후 (95℃에서 30초; 63℃에서 30초; 72℃에서 3분)의 30 사이클.
생성된 PCR 생성물을 QiaQick PCR 정제 키트 (Qiagen)를 사용하여 정제하고, 하기와 같이 pRed-ET 재조합효소-함유 플라스미드를 갖는 전기수용성 (electrocompetent) MG1655 세포 내로 전기천공하였다. 5 ㎖의 L 브로쓰를 약 0.6의 OD600으로 30℃에서 성장시켜 세포를 제조하였다. 4% 아라비노오스를 첨가함으로써 재조합 효소 발현을 위해 세포를 유도하였고, 30분 동안 30℃, 이어서 30분 동안 37℃에서 성장시켰다. 1.5 ㎖의 세포 분취량을 얼음 냉각된 dH2O로 3~4회 세척하였다. 최종 세포 펠릿을 40 uL의 얼음 냉각된 dH2O에 재현탁시키고, 2~5 uL의 PCR 생성물을 첨가하였다. Gene Pulser Electroporator (Bio-Rad Inc.)로 1.3 kV에서 1-mm 갭 큐벳 내에서 전기천공을 수행하였다. 세포를 30℃에서 1~2시간 동안 회수하고, 클로람페니콜 (5 ug/㎖)을 함유하는 L 한천 상에 플레이팅하였다. 융합 부위 측면에 위치한 (flanking) 프라이머 (2 프라이머 세트: pgl 및 49 rev 및 3' EcoRV-pglstop; Bottom Pgb2 및 Top GB's CMP (946))를 사용하여 PCR 및 서열분석으로 5개의 형질전환체를 분석하였다. 올바른 형질전환체를 선별하고, 이러한 균주를 MG1655 GI1.5-pgl::CMP로 지정하였다.
MG1655 GI1.5-pgl::CMP의 염색체 DNA를 주형으로 사용하여 FRT-CMP-FRT-GI 1.5-ybhE 구성물을 함유하는 PCR 절편을 생성하였다. 이러한 구성물은 하기와 같이 pBBR1MCS5 (겐타마이신)으로 클로닝되었다. 본원에서 CMP-GI1.5-pgl로 지칭되는 절편을, 5' 프라이머 Pglconfirm-F 및 3' 프라이머 3' EcoRV-pglstop을 사용하여 증폭시켰다. 제조사가 제시한 바와 같이, Invitrogen TOPO-Blunt 클로닝 키트를 사용하여 플라스미드 벡터 pCR-Blunt II-TOPO 내로 생성된 절편을 클로닝하였다. CMP-GI1.5-pgl 절편을 갖는 NsiI 절편을 pBBR1MCS5 (겐타마이신)의 PstI 위치로 클로닝하였다. 5 ㎕ CMP-GI1.5-pgl 삽입물, 2 ㎕ pBBR1MCS5 (겐타마이신) 벡터, 1 ㎕ T4 DNA 리가아제 (New England Biolabs), 2 ㎕ 1OX 리가아제 완충액, 및 lO ㎕ ddH2O를 함유하는 20 ㎕ 라이게이션 반응물을 제조하였다. 라이게이션 혼합물을 실온에서 40분 동안 인큐베이션한 후, 상기 개시된 매개변수를 사용하여 전기수용성 Top 10 세포 (Invitrogen) 내로 2~4 uL를 전기천공하였다. 10 ug/㎖ 클로람페니콜 및 5 ug/㎖ 겐타마이신을 함유하는 L 한천 상에서 형질전환체를 선별하였다. 선별된 클론의 서열을 상기 기재된 다수의 프라이머 뿐만 아니라 Sequetech, CA 에 의해 제공되는 역방향 프라이머 및 사내 (in-house) T3을 사용하여 측정하였다. 이러한 플라스미드를 pBBRCMPGI1.5-pgl로 지정하였다 (도 77A~B 및 SEQ ID NO:122).
실시예 10에서 상기 기재한 바와 같이 플라스미드 pBBRCMPGI1.5-pgl를 EWL256 내로 전기천공하고, 클로람페니콜 (10 ug/㎖), 겐타마이신 (5 ug/㎖), 스펙티노마이신 (50 ug/㎖) 및 카르베니실린 (50 ug/㎖)을 함유하는 L 한천 상에 형질전환체를 플레이팅하였다. 하나의 형질전환체를 선별하여 RM11608-2로 지정하였다.
프라이머:
Figure pct00008
Figure pct00009
i) 소규모 분석
배지 제조 방법 (발효 배지 ℓ 당):
K2HPO4 13.6 g, KH2PO4 13.6 g, MgSO4 * 7H2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, (NH4)2SO4 3.2 g, 효모 추출물 1 g, 1000X 미량 금속 용액 1 ㎖. 모든 성분을 diH2O에 함께 첨가하고 용해하였다. 수산화암모늄 (30%)을 사용하여 pH를 6.8로 조정하고, 부피에 대해 충분량이 되게 하였다. 0.22 마이크론 필터를 사용하여 배지를 여과 멸균하였다. 글루코오스 5.O g 및 항생제를 멸균 및 pH 조정 후 첨가하였다.
100OX 미량 금속 용액 (발효 배지 ℓ 당):
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO4 * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각 성분을 한번에 하나씩 diH2O에 용해하였다. HCl/NaOH로 pH를 3.0으로 조정한 후, 용액을 부피에 대해 충분량이 되게 하고 0.22 마이크론 필터를 사용하여 여과 멸균하였다.
a) 실험 절차
MicroReactor Technologies, Inc 사제 Cellerator™ 에서 균주를 성장시켜 이소프렌 생성을 분석하였다. 각 24 웰의 작용 부피는 4.5 ㎖였다. 온도를 3O℃로 유지시켰고, pH 설정점은 7.0이었고, 산소 흐름 설정점은 20 sccm이었으며, 교반 속도는 800 rpm이었다. 동결 바이알에서 취한 대장균 균주의 접종물을 LB 브로쓰 한천 플레이트 (항생제 포함) 상에 스트리킹하고, 30℃에서 인큐베이션하였다. 단일 콜로니를 항생제를 갖는 배지에 접종하고, 하룻밤 동안 성장시켰다. 세균을 항생제를 갖는 배지 4.5 ㎖로 희석하여 550 nm에서 측정된 광학 밀도 0.05에 도달시켰다.
기체 크로마토그래프-질량 분석기 (GC-MS) (Agilent) 상부공간 검정법을 사용하여 이소프렌의 배출 기체 분석을 수행하였다. 샘플을 하기와 같이 제조하였다: 100 ㎕의 전체 브로쓰를 밀봉된 GC 바이알에 넣고, 30분의 고정 시간 동안 30℃에서 인큐베이션하였다. 5분 동안 70℃에서의 인큐베이션으로 이루어진 열 사멸 단계에 이어서, 샘플을 GC에 적하시켰다.
실행 과정 동안 마이크로플레이트 판독기 (Spectramax)를 사용하여 파장 550 nm에서 광학 밀도 (OD)를 수득하였다. 이소프렌 농도 (㎍/L)를 OD 판독 및 시간 (hr)으로 나누어 특이적 생산성을 수득하였다.
두 개의 균주 EWL256 및 RM11608-2를 200 및 400 uM IPTG 유도 수준에서 평가하였다. 1, 2.5, 4.75 및 8시간 후-유도 (post-induction)에서 세포 성장 (OD550) 및 이소프렌 생성에 대해 샘플을 분석하였다. 샘플을 2 반복하여 수행하였다.
b) 결과
2개의 상이한 농도의 IPTG에서 ybhE (pgl)를 발현하는 균주가 대조군 균주에 비해 특이적 이소프렌 생산성에 있어서 극적인 2~3배 증가를 갖는다는 것을 실험을 통해 입증하였다.
ii) M. 마제이 메발로네이트 키나아제, P. 알바 이소프렌 신타아제, 및 pgl 과발현물 (RHM111608-2)을 발현하며 15ℓ 규모에서 유가식 배양물에서의 성장하는 대장균으로부터의 이소프렌 발효
배지 제조 방법 (발효 배지 ℓ 당)
K2HPO4 7.5 g, MgSO4 * 7B2O 2 g, 시트르산 일수화물 2 g, 구연산 철 암모늄 0.3 g, 효모 추출물 0.5 g, 1000X 변형 미량 금속 용액 1 ㎖. 모든 성분을 diH2O에 함께 첨가하고 용해하였다. 용액을 오토클레이브하였다. 수산화암모늄 (30%)으로 pH를 7.0으로 조정하고 및 부피에 대해 충분량이 되게 하였다. 글루코오스 10 g, 티아민 * HCl 0.1 g, 및 항생제를 멸균 및 pH 조정 후 첨가하였다.
1000X 변형 미량 금속 용액:
시트르산 * H2O 40 g, MnSO4 * H2O 30 g, NaCl 10 g, FeSO4 * 7H2O 1 g, CoCl2 * 6H2O 1 g, ZnSO4 * 7H2O 1 g, CuSO4 * 5H2O 100 mg, H3BO3 100 mg, NaMoO4 * 2H2O 100 mg. 각각의 성분을 한번에 하나씩 diH2O에 용해하고, HCl/NaOH으로 pH를 3.0으로 조정한 후, 용액을 부피에 대해 충분량이 되게 하고, 0.22 마이크론 필터로 여과 멸균하였다.
상위 메발론산 (MVA) 경로 (pCL Upper), 융합된 하위 MVA 경로 (gi1.2KKDyI), M. 마제이로부터의 메발로네이트 키나아제의 고발현물 및 P. 알바 (pTrcAlba-mMVK)로부터의 이소프렌 신타아제의 고발현물, 및 pgl (pBBR-pgl)의 고발현물을 함유하는 BL21 (DE3) 대장균 세포를 갖는 15ℓ 생물반응기에서 발효를 수행하였다. 상기 실험을 실행하여 원하는 발효 pH 7.0 및 온도 34℃에서 글루코오스로부터의 이소프렌 형성을 모니터링하였다. 대장균 균주의 동결 바이알을 해동시키고, 트립톤-효모 추출물 배지에 접종하였다. 접종물을 550 nm에서 측정된 OD 1.0으로 성장시킨 후, 500 ㎖를 사용하여 15ℓ 생물반응기에 접종하여 초기 부피를 5ℓ가 되게 하였다.
세포가 정지상에 도달할 때까지 지수 증대 속도로 글루코오스를 공급하였다. 이때 이후, 글루코오스 공급을 감소시켜 대사작용 요구를 충족시켰다. 40시간 (59시간) 발효 동안 생물반응기에 전달된 글루코오스 총량은 3.1 kg (59시간에 4.2 kg)이었다. IPTG를 첨가하여 유도하였다. 550 nm에서 광학 밀도 (OD550)가 4 값에 도달할 때 IPTG 농도는 110 uM이었다. OD550이 150에 도달할 때 IPTG 농도는 192 uM으로 상승하였다. 시간에 따른 생물반응기 내에서의 OD550 프로파일을 도 78A에 나타내었다. 생물반응기로부터의 배출 기체 내의 이소프렌 수준을 Hiden 질량 분석기를 사용하여 측정하였다. 이소프렌 역가는 발효 과정에 걸쳐 40시간에서 33.2 g/L (59시간에서 48.6 g/L)의 최대값으로 증가하였다 (도 78B). 이소프렌 역가는 발효 과정에 걸쳐 40시간에서 40.0 g/L (59시간에서 60.5 g/L)의 최대값으로 증가하였다 (도 78C). 40시간 (59시간) 발효 동안 생성된 이소프렌의 총량은 281.3 g (59시간에서 451.0 g)이었고, 생성의 시간 추이를 도 78D에 나타내었다. 체적 생산성의 시간 추이를 도 78E에 나타내었고, 평균 속도 1.0 g/L/시간을 0 내지 40시간 유지한 것을 나타내었다 (19 내지 59시간에서 1.4 g/L/시간). CER로 측정한 바와 같은 대사작용 활성 프로파일을 도 78F에 나타내었다. 발효 동안 이소프렌을 생성하는데 이용된 탄소의 몰 수율은 40시간에서 19.6% (59시간에서 23.6%)였다. 글루코오스로부터의 이소프렌의 중량%는 40시간에서 8.9% (59시간에서 10.7%)였다.
다르게 정의하지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 당업자에 의해 통상적으로 이해되는 것들이다. [Singleton, 등, Dictionary of Microbiology and Molecular Biology, 2nd ed., John Wiley and Sons, New York (1994), 및 Hale & Marham, The Harper Collins Dictionary of Biology, Harper Perennial, N.Y. (1991)]은 본 발명에서 사용되는 많은 용어의 일반적 일람을 갖는 지식 중 하나를 제공한다. 본 발명이 다양할 수 있는 특정 방법론, 프로토콜, 및 기재된 시약에 제한되지 않는다는 것이 이해될 것이다. 당업자는 또한 본원에 기재된 것과 유사 또는 동등한 임의 방법 및 재료가 본 발명을 실행 또는 시험하는데 또한 사용될 수 있다는 것을 이해할 것이다.
본원에 제공된 표제는 전체로서 본 명세서에 참고문헌으로 포함될 수 있는 발명의 다양한 측면 또는 구현예의 제한이 아니다.
본원에서 사용하기 위해, 달리 명백하게 나타내지 않는 한, 단수형 표현은 복수형 표현을 나타낸다.
본원의 값 또는 매개변수에 대한 표현 "약"은 자체적 값 또는 매개변수를 지시하는 구현예를 포함 (및 설명)한다. 예를 들어, "약 X"를 나타내는 설명은 "X"의 설명을 포함한다. 수치적 범위는 범위를 한정하는 수치를 포함한다.
본원에 기재된 발명의 측면 및 구현예가 측면 및 구현예를 "포함하고", "구성하고" 및 "본질적으로 이로 이루어지는" 것이 이해된다.
부록 1
예시적 1- 데옥시 -D- 자일루로오스 -5- 포스페이트 신타아제 핵산 및 폴리펩티드
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
예시적 아세틸- CoA - 아세틸트랜스퍼라아제 핵산 및 폴리펩티드
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
예시적 HMG - CoA 신타아제 핵산 및 폴리펩티드
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
예시적 하이드록시메틸글루타릴 - CoA 환원효소 핵산 및 폴리펩티드
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
예시적 메발로네이트 키나아제 핵산 및 폴리펩티드
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
예시적 포스포메발로네이트 키나아제 핵산 및 폴리펩티드
Figure pct00049
Figure pct00050
Figure pct00051
예시적 디포스포메발로네이트 데카르복실라아제 핵산 및 폴리펩티드
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
예시적 이소펜테닐 포스페이트 키나아제 ( IPK ) 핵산 및 폴리펩티드
메타노박테리움 써모오토프로티쿰 (Methanobacterium thermoautotrophicum) gi|2621082
메타노코쿠스 잔나스치이 (Methanococcus jannaschii) DSM 2661 gi|1590842
메타노칼도코쿠스 잔나스치이 (Methanocaldococcus jannaschii) gi|1590842
메타노써보박터 써마우토트로피쿠스 (Methanothermobacter thermautotrophicus) gi|2621082
피크로필루스 토리두스 (Picrophilus torridus) DSM9790 (IG-57) gi|48477569
피로코쿠스 아비시 (Pyrococcus abyssi) gi|14520758
피로코쿠스 호리코시이 (Pyrococcus horikoshii) OT3 gi|3258052
아카에오글로부스 풀기두스 (Archaeoglobus fulgidus) DSM4304 gi|2648231
예시적 이소펜테닐 - 디포스페이트 델타-이성화효소 ( IDI ) 핵산 및 폴리펩티
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
예시적 이소프렌 신타아제 핵산 및 폴리펩티드
Genbank 기탁 번호
AY341431
AY316691
AY279379
AJ457070
AY182241
<110> DANISCO US INC. THE GOOD YEAR TIRE & RUBBER COMPANY CERVIN, Marguerite WHITED, Gregory M. CHOTANI, Gopal K. VALLE, Fernando FIORESI, Carol SANFORD, Karl J. MCAULIFFE, Jospeh C. FEHER, Frank J. PUHALA, Aaron S. MIASNIKOV, Andrei ALDOR, Ilana S. <120> COMPOSITIONS AND METHODS FOR PRODUCING ISOPRENE <130> 643842000249 <150> PCT/US2008/086869 <151> 2008-12-15 <150> US 61/013,574 <151> 2007-12-13 <160> 123 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1701 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 atgtgtgcga cctcttctca atttactcag attaccgagc ataattcccg tcgttccgca 60 aactatcagc caaacctgtg gaatttcgaa ttcctgcaat ccctggagaa cgacctgaaa 120 gtggaaaagc tggaggagaa agcgaccaaa ctggaggaag aagttcgctg catgatcaac 180 cgtgtagaca cccagccgct gtccctgctg gagctgatcg acgatgtgca gcgcctgggt 240 ctgacctaca aatttgaaaa agacatcatt aaagccctgg aaaacatcgt actgctggac 300 gaaaacaaaa agaacaaatc tgacctgcac gcaaccgctc tgtctttccg tctgctgcgt 360 cagcacggtt tcgaggtttc tcaggatgtt tttgagcgtt tcaaggataa agaaggtggt 420 ttcagcggtg aactgaaagg tgacgtccaa ggcctgctga gcctgtatga agcgtcttac 480 ctgggtttcg agggtgagaa cctgctggag gaggcgcgta ccttttccat cacccacctg 540 aagaacaacc tgaaagaagg cattaatacc aaggttgcag aacaagtgag ccacgccctg 600 gaactgccat atcaccagcg tctgcaccgt ctggaggcac gttggttcct ggataaatac 660 gaaccgaaag aaccgcatca ccagctgctg ctggagctgg cgaagctgga ttttaacatg 720 gtacagaccc tgcaccagaa agagctgcaa gatctgtccc gctggtggac cgagatgggc 780 ctggctagca aactggattt tgtacgcgac cgcctgatgg aagtttattt ctgggcactg 840 ggtatggcgc cagacccgca gtttggtgaa tgtcgcaaag ctgttactaa aatgtttggt 900 ctggtgacga tcatcgatga cgtgtatgac gtttatggca ctctggacga actgcaactg 960 ttcaccgatg ctgtagagcg ctgggacgtt aacgctatta acaccctgcc ggactatatg 1020 aaactgtgtt tcctggcact gtacaacacc gttaacgaca cgtcctattc tattctgaaa 1080 gagaaaggtc ataacaacct gtcctatctg acgaaaagct ggcgtgaact gtgcaaagcc 1140 tttctgcaag aggcgaaatg gtccaacaac aaaattatcc cggctttctc caagtacctg 1200 gaaaacgcca gcgtttcctc ctccggtgta gcgctgctgg cgccgtctta cttttccgta 1260 tgccagcagc aggaagacat ctccgaccac gcgctgcgtt ccctgaccga cttccatggt 1320 ctggtgcgtt ctagctgcgt tatcttccgc ctgtgcaacg atctggccac ctctgcggcg 1380 gagctggaac gtggcgagac taccaattct atcattagct acatgcacga aaacgatggt 1440 accagcgagg aacaggcccg cgaagaactg cgtaaactga tcgacgccga atggaaaaag 1500 atgaatcgtg aacgcgttag cgactccacc ctgctgccta aagcgttcat ggaaatcgca 1560 gttaacatgg cacgtgtttc ccactgcacc taccagtatg gcgatggtct gggtcgccca 1620 gactacgcga ctgaaaaccg catcaaactg ctgctgattg accctttccc gattaaccag 1680 ctgatgtatg tctaactgca g 1701 <210> 2 <211> 6080 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgtgtgc 420 gacctcttct caatttactc agattaccga gcataattcc cgtcgttccg caaactatca 480 gccaaacctg tggaatttcg aattcctgca atccctggag aacgacctga aagtggaaaa 540 gctggaggag aaagcgacca aactggagga agaagttcgc tgcatgatca accgtgtaga 600 cacccagccg ctgtccctgc tggagctgat cgacgatgtg cagcgcctgg gtctgaccta 660 caaatttgaa aaagacatca ttaaagccct ggaaaacatc gtactgctgg acgaaaacaa 720 aaagaacaaa tctgacctgc acgcaaccgc tctgtctttc cgtctgctgc gtcagcacgg 780 tttcgaggtt tctcaggatg tttttgagcg tttcaaggat aaagaaggtg gtttcagcgg 840 tgaactgaaa ggtgacgtcc aaggcctgct gagcctgtat gaagcgtctt acctgggttt 900 cgagggtgag aacctgctgg aggaggcgcg taccttttcc atcacccacc tgaagaacaa 960 cctgaaagaa ggcattaata ccaaggttgc agaacaagtg agccacgccc tggaactgcc 1020 atatcaccag cgtctgcacc gtctggaggc acgttggttc ctggataaat acgaaccgaa 1080 agaaccgcat caccagctgc tgctggagct ggcgaagctg gattttaaca tggtacagac 1140 cctgcaccag aaagagctgc aagatctgtc ccgctggtgg accgagatgg gcctggctag 1200 caaactggat tttgtacgcg accgcctgat ggaagtttat ttctgggcac tgggtatggc 1260 gccagacccg cagtttggtg aatgtcgcaa agctgttact aaaatgtttg gtctggtgac 1320 gatcatcgat gacgtgtatg acgtttatgg cactctggac gaactgcaac tgttcaccga 1380 tgctgtagag cgctgggacg ttaacgctat taacaccctg ccggactata tgaaactgtg 1440 tttcctggca ctgtacaaca ccgttaacga cacgtcctat tctattctga aagagaaagg 1500 tcataacaac ctgtcctatc tgacgaaaag ctggcgtgaa ctgtgcaaag cctttctgca 1560 agaggcgaaa tggtccaaca acaaaattat cccggctttc tccaagtacc tggaaaacgc 1620 cagcgtttcc tcctccggtg tagcgctgct ggcgccgtct tacttttccg tatgccagca 1680 gcaggaagac atctccgacc acgcgctgcg ttccctgacc gacttccatg gtctggtgcg 1740 ttctagctgc gttatcttcc gcctgtgcaa cgatctggcc acctctgcgg cggagctgga 1800 acgtggcgag actaccaatt ctatcattag ctacatgcac gaaaacgatg gtaccagcga 1860 ggaacaggcc cgcgaagaac tgcgtaaact gatcgacgcc gaatggaaaa agatgaatcg 1920 tgaacgcgtt agcgactcca ccctgctgcc taaagcgttc atggaaatcg cagttaacat 1980 ggcacgtgtt tcccactgca cctaccagta tggcgatggt ctgggtcgcc cagactacgc 2040 gactgaaaac cgcatcaaac tgctgctgat tgaccctttc ccgattaacc agctgatgta 2100 tgtctaactg cagctggtac catatgggaa ttcgaagctt tctagaacaa aaactcatct 2160 cagaagagga tctgaatagc gccgtcgacc atcatcatca tcatcattga gtttaaacgg 2220 tctccagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 2280 agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 2340 acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 2400 tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 2460 actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 2520 cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 2580 cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 2640 cgtttctaca aactcttttt gtttattttt ctaaatacat tcaaatatgt atccgctcat 2700 gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 2760 acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 2820 cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 2880 catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 2940 tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 3000 cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3060 accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3120 cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 3180 ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 3240 accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 3300 ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 3360 attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 3420 ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 3480 tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 3540 tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 3600 gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 3660 tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 3720 ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 3780 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 3840 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 3900 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 3960 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4020 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4080 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4140 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 4200 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 4260 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 4320 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 4380 cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 4440 gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 4500 ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat 4560 gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 4620 tacaatctgc tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac 4680 tgggtcatgg ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 4740 ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 4800 aggttttcac cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg cgcgaaggcg 4860 aagcggcatg catttacgtt gacaccatcg aatggtgcaa aacctttcgc ggtatggcat 4920 gatagcgccc ggaagagagt caattcaggg tggtgaatgt gaaaccagta acgttatacg 4980 atgtcgcaga gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg aaccaggcca 5040 gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag ctgaattaca 5100 ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc gttgctgatt ggcgttgcca 5160 cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa tctcgcgccg 5220 atcaactggg tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc gaagcctgta 5280 aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt aactatccgc 5340 tggatgacca ggatgccatt gctgtggaag ctgcctgcac taatgttccg gcgttatttc 5400 ttgatgtctc tgaccagaca cccatcaaca gtattatttt ctcccatgaa gacggtacgc 5460 gactgggcgt ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg ttagcgggcc 5520 cattaagttc tgtctcggcg cgtctgcgtc tggctggctg gcataaatat ctcactcgca 5580 atcaaattca gccgatagcg gaacgggaag gcgactggag tgccatgtcc ggttttcaac 5640 aaaccatgca aatgctgaat gagggcatcg ttcccactgc gatgctggtt gccaacgatc 5700 agatggcgct gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt ggtgcggata 5760 tctcggtagt gggatacgac gataccgaag acagctcatg ttatatcccg ccgtcaacca 5820 ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg ctgcaactct 5880 ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg aaaagaaaaa 5940 ccaccctggc gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 6000 agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 6060 agttagcgcg aattgatctg 6080 <210> 3 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 cgtgagatca tatgtgtgcg acctcttctc aatttac 37 <210> 4 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 4 cggtcgacgg atccctgcag ttagacatac atcagctg 38 <210> 5 <211> 7404 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 5 ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa 60 ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg 120 caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt 180 gcgggatatc cggatatagt tcctcctttc agcaaaaaac ccctcaagac ccgtttagag 240 gccccaaggg gttatgctag ttattgctca gcggtggcag cagccaactc agcttccttt 300 cgggctttgt tagcagccgg atccctgcag ttagacatac atcagctggt taatcgggaa 360 agggtcaatc agcagcagtt tgatgcggtt ttcagtcgcg tagtctgggc gacccagacc 420 atcgccatac tggtaggtgc agtgggaaac acgtgccatg ttaactgcga tttccatgaa 480 cgctttaggc agcagggtgg agtcgctaac gcgttcacga ttcatctttt tccattcggc 540 gtcgatcagt ttacgcagtt cttcgcgggc ctgttcctcg ctggtaccat cgttttcgtg 600 catgtagcta atgatagaat tggtagtctc gccacgttcc agctccgccg cagaggtggc 660 cagatcgttg cacaggcgga agataacgca gctagaacgc accagaccat ggaagtcggt 720 cagggaacgc agcgcgtggt cggagatgtc ttcctgctgc tggcatacgg aaaagtaaga 780 cggcgccagc agcgctacac cggaggagga aacgctggcg ttttccaggt acttggagaa 840 agccgggata attttgttgt tggaccattt cgcctcttgc agaaaggctt tgcacagttc 900 acgccagctt ttcgtcagat aggacaggtt gttatgacct ttctctttca gaatagaata 960 ggacgtgtcg ttaacggtgt tgtacagtgc caggaaacac agtttcatat agtccggcag 1020 ggtgttaata gcgttaacgt cccagcgctc tacagcatcg gtgaacagtt gcagttcgtc 1080 cagagtgcca taaacgtcat acacgtcatc gatgatcgtc accagaccaa acattttagt 1140 aacagctttg cgacattcac caaactgcgg gtctggcgcc atacccagtg cccagaaata 1200 aacttccatc aggcggtcgc gtacaaaatc cagtttgcta gccaggccca tctcggtcca 1260 ccagcgggac agatcttgca gctctttctg gtgcagggtc tgtaccatgt taaaatccag 1320 cttcgccagc tccagcagca gctggtgatg cggttctttc ggttcgtatt tatccaggaa 1380 ccaacgtgcc tccagacggt gcagacgctg gtgatatggc agttccaggg cgtggctcac 1440 ttgttctgca accttggtat taatgccttc tttcaggttg ttcttcaggt gggtgatgga 1500 aaaggtacgc gcctcctcca gcaggttctc accctcgaaa cccaggtaag acgcttcata 1560 caggctcagc aggccttgga cgtcaccttt cagttcaccg ctgaaaccac cttctttatc 1620 cttgaaacgc tcaaaaacat cctgagaaac ctcgaaaccg tgctgacgca gcagacggaa 1680 agacagagcg gttgcgtgca ggtcagattt gttctttttg ttttcgtcca gcagtacgat 1740 gttttccagg gctttaatga tgtctttttc aaatttgtag gtcagaccca ggcgctgcac 1800 atcgtcgatc agctccagca gggacagcgg ctgggtgtct acacggttga tcatgcagcg 1860 aacttcttcc tccagtttgg tcgctttctc ctccagcttt tccactttca ggtcgttctc 1920 cagggattgc aggaattcga aattccacag gtttggctga tagtttgcgg aacgacggga 1980 attatgctcg gtaatctgag taaattgaga agaggtcgca cacatatgac gaccttcgat 2040 atggccgctg ctgtgatgat gatgatgatg atgatgatga tggcccatgg tatatctcct 2100 tcttaaagtt aaacaaaatt atttctagag gggaattgtt atccgctcac aattccccta 2160 tagtgagtcg tattaatttc gcgggatcga gatctcgatc ctctacgccg gacgcatcgt 2220 ggccggcatc accggcgcca caggtgcggt tgctggcgcc tatatcgccg acatcaccga 2280 tggggaagat cgggctcgcc acttcgggct catgagcgct tgtttcggcg tgggtatggt 2340 ggcaggcccc gtggccgggg gactgttggg cgccatctcc ttgcatgcac cattccttgc 2400 ggcggcggtg ctcaacggcc tcaacctact actgggctgc ttcctaatgc aggagtcgca 2460 taagggagag cgtcgagatc ccggacacca tcgaatggcg caaaaccttt cgcggtatgg 2520 catgatagcg cccggaagag agtcaattca gggtggtgaa tgtgaaacca gtaacgttat 2580 acgatgtcgc agagtatgcc ggtgtctctt atcagaccgt ttcccgcgtg gtgaaccagg 2640 ccagccacgt ttctgcgaaa acgcgggaaa aagtggaagc ggcgatggcg gagctgaatt 2700 acattcccaa ccgcgtggca caacaactgg cgggcaaaca gtcgttgctg attggcgttg 2760 ccacctccag tctggccctg cacgcgccgt cgcaaattgt cgcggcgatt aaatctcgcg 2820 ccgatcaact gggtgccagc gtggtggtgt cgatggtaga acgaagcggc gtcgaagcct 2880 gtaaagcggc ggtgcacaat cttctcgcgc aacgcgtcag tgggctgatc attaactatc 2940 cgctggatga ccaggatgcc attgctgtgg aagctgcctg cactaatgtt ccggcgttat 3000 ttcttgatgt ctctgaccag acacccatca acagtattat tttctcccat gaagacggta 3060 cgcgactggg cgtggagcat ctggtcgcat tgggtcacca gcaaatcgcg ctgttagcgg 3120 gcccattaag ttctgtctcg gcgcgtctgc gtctggctgg ctggcataaa tatctcactc 3180 gcaatcaaat tcagccgata gcggaacggg aaggcgactg gagtgccatg tccggttttc 3240 aacaaaccat gcaaatgctg aatgagggca tcgttcccac tgcgatgctg gttgccaacg 3300 atcagatggc gctgggcgca atgcgcgcca ttaccgagtc cgggctgcgc gttggtgcgg 3360 atatctcggt agtgggatac gacgataccg aagacagctc atgttatatc ccgccgttaa 3420 ccaccatcaa acaggatttt cgcctgctgg ggcaaaccag cgtggaccgc ttgctgcaac 3480 tctctcaggg ccaggcggtg aagggcaatc agctgttgcc cgtctcactg gtgaaaagaa 3540 aaaccaccct ggcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 3600 tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 3660 gtaagttagc tcactcatta ggcaccggga tctcgaccga tgcccttgag agccttcaac 3720 ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 3780 ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tctgggtcat tttcggcgag 3840 gaccgctttc gctggagcgc gacgatgatc ggcctgtcgc ttgcggtatt cggaatcttg 3900 cacgccctcg ctcaagcctt cgtcactggt cccgccacca aacgtttcgg cgagaagcag 3960 gccattatcg ccggcatggc ggccgacgcg ctgggctacg tcttgctggc gttcgcgacg 4020 cgaggctgga tggccttccc cattatgatt cttctcgctt ccggcggcat cgggatgccc 4080 gcgttgcagg ccatgctgtc caggcaggta gatgacgacc atcagggaca gcttcaagga 4140 tcgctcgcgg ctcttaccag cctaacttcg atcactggac cgctgatcgt cacggcgatt 4200 tatgccgcct cggcgagcac atggaacggg ttggcatgga ttgtaggcgc cgccctatac 4260 cttgtctgcc tccccgcgtt gcgtcgcggt gcatggagcc gggccacctc gacctgaatg 4320 gaagccggcg gcacctcgct aacggattca ccactccaag aattggagcc aatcaattct 4380 tgcggagaac tgtgaatgcg caaaccaacc cttggcagaa catatccatc gcgtccgcca 4440 tctccagcag ccgcacgcgg cgcatctcgg gcagcgttgg gtcctggcca cgggtgcgca 4500 tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt actggttagc 4560 agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa acgtctgcga 4620 cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg gaaacgcgga 4680 agtcagcgcc ctgcaccatt atgttccgga tctgcatcgc aggatgctgc tggctaccct 4740 gtggaacacc tacatctgta ttaacgaagc gctggcattg accctgagtg atttttctct 4800 ggtcccgccg catccatacc gccagttgtt taccctcaca acgttccagt aaccgggcat 4860 gttcatcatc agtaacccgt atcgtgagca tcctctctcg tttcatcggt atcattaccc 4920 ccatgaacag aaatccccct tacacggagg catcagtgac caaacaggaa aaaaccgccc 4980 ttaacatggc ccgctttatc agaagccaga cattaacgct tctggagaaa ctcaacgagc 5040 tggacgcgga tgaacaggca gacatctgtg aatcgcttca cgaccacgct gatgagcttt 5100 accgcagctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc 5160 cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg 5220 cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg 5280 gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 5340 atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc 5400 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 5460 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 5520 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 5580 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 5640 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 5700 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 5760 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 5820 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 5880 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 5940 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 6000 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 6060 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 6120 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 6180 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 6240 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 6300 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 6360 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 6420 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 6480 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 6540 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 6600 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tgcaggcatc 6660 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 6720 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 6780 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 6840 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 6900 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aacacgggat 6960 aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 7020 cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 7080 cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 7140 aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 7200 ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 7260 tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 7320 ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 7380 acgaggccct ttcgtcttca agaa 7404 <210> 6 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 catatgaaag cttgtatcga ttaaataagg aggaataaac c 41 <210> 7 <211> 6266 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 7 cccgtcttac tgtcgggaat tcgcgttggc cgattcatta atgcagctgg cacgacaggt 60 ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag ctcactcatt 120 aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga attgtgagcg 180 gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt gtatcgatta 240 aataaggagg aataaaccat gtgtgcgacc tcttctcaat ttactcagat taccgagcat 300 aattcccgtc gttccgcaaa ctatcagcca aacctgtgga atttcgaatt cctgcaatcc 360 ctggagaacg acctgaaagt ggaaaagctg gaggagaaag cgaccaaact ggaggaagaa 420 gttcgctgca tgatcaaccg tgtagacacc cagccgctgt ccctgctgga gctgatcgac 480 gatgtgcagc gcctgggtct gacctacaaa tttgaaaaag acatcattaa agccctggaa 540 aacatcgtac tgctggacga aaacaaaaag aacaaatctg acctgcacgc aaccgctctg 600 tctttccgtc tgctgcgtca gcacggtttc gaggtttctc aggatgtttt tgagcgtttc 660 aaggataaag aaggtggttt cagcggtgaa ctgaaaggtg acgtccaagg cctgctgagc 720 ctgtatgaag cgtcttacct gggtttcgag ggtgagaacc tgctggagga ggcgcgtacc 780 ttttccatca cccacctgaa gaacaacctg aaagaaggca ttaataccaa ggttgcagaa 840 caagtgagcc acgccctgga actgccatat caccagcgtc tgcaccgtct ggaggcacgt 900 tggttcctgg ataaatacga accgaaagaa ccgcatcacc agctgctgct ggagctggcg 960 aagctggatt ttaacatggt acagaccctg caccagaaag agctgcaaga tctgtcccgc 1020 tggtggaccg agatgggcct ggctagcaaa ctggattttg tacgcgaccg cctgatggaa 1080 gtttatttct gggcactggg tatggcgcca gacccgcagt ttggtgaatg tcgcaaagct 1140 gttactaaaa tgtttggtct ggtgacgatc atcgatgacg tgtatgacgt ttatggcact 1200 ctggacgaac tgcaactgtt caccgatgct gtagagcgct gggacgttaa cgctattaac 1260 accctgccgg actatatgaa actgtgtttc ctggcactgt acaacaccgt taacgacacg 1320 tcctattcta ttctgaaaga gaaaggtcat aacaacctgt cctatctgac gaaaagctgg 1380 cgtgaactgt gcaaagcctt tctgcaagag gcgaaatggt ccaacaacaa aattatcccg 1440 gctttctcca agtacctgga aaacgccagc gtttcctcct ccggtgtagc gctgctggcg 1500 ccgtcttact tttccgtatg ccagcagcag gaagacatct ccgaccacgc gctgcgttcc 1560 ctgaccgact tccatggtct ggtgcgttct agctgcgtta tcttccgcct gtgcaacgat 1620 ctggccacct ctgcggcgga gctggaacgt ggcgagacta ccaattctat cattagctac 1680 atgcacgaaa acgatggtac cagcgaggaa caggcccgcg aagaactgcg taaactgatc 1740 gacgccgaat ggaaaaagat gaatcgtgaa cgcgttagcg actccaccct gctgcctaaa 1800 gcgttcatgg aaatcgcagt taacatggca cgtgtttccc actgcaccta ccagtatggc 1860 gatggtctgg gtcgcccaga ctacgcgact gaaaaccgca tcaaactgct gctgattgac 1920 cctttcccga ttaaccagct gatgtatgtc taactgcagg tcgactctag aggatccccg 1980 ggtaccgagc tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 2040 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 2100 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 2160 gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 2220 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 2280 tgacgagctt agtaaagccc tcgctagatt ttaatgcgga tgttgcgatt acttcgccaa 2340 ctattgcgat aacaagaaaa agccagcctt tcatgatata tctcccaatt tgtgtagggc 2400 ttattatgca cgcttaaaaa taataaaagc agacttgacc tgatagtttg gctgtgagca 2460 attatgtgct tagtgcatct aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt 2520 gaacgaattg ttagacatta tttgccgact accttggtga tctcgccttt cacgtagtgg 2580 acaaattctt ccaactgatc tgcgcgcgag gccaagcgat cttcttcttg tccaagataa 2640 gcctgtctag cttcaagtat gacgggctga tactgggccg gcaggcgctc cattgcccag 2700 tcggcagcga catccttcgg cgcgattttg ccggttactg cgctgtacca aatgcgggac 2760 aacgtaagca ctacatttcg ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt 2820 aaggtttcat ttagcgcctc aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc 2880 gccgctggac ctaccaaggc aacgctatgt tctcttgctt ttgtcagcaa gatagccaga 2940 tcaatgtcga tcgtggctgg ctcgaagata cctgcaagaa tgtcattgcg ctgccattct 3000 ccaaattgca gttcgcgctt agctggataa cgccacggaa tgatgtcgtc gtgcacaaca 3060 atggtgactt ctacagcgcg gagaatctcg ctctctccag gggaagccga agtttccaaa 3120 aggtcgttga tcaaagctcg ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc 3180 aaatcaatat cactgtgtgg cttcaggccg ccatccactg cggagccgta caaatgtacg 3240 gccagcaacg tcggttcgag atggcgctcg atgacgccaa ctacctctga tagttgagtc 3300 gatacttcgg cgatcaccgc ttccctcatg atgtttaact ttgttttagg gcgactgccc 3360 tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct 3420 tgctgcttgg atgcccgagg catagactgt accccaaaaa aacagtcata acaagccatg 3480 aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt 3540 gagcgcatac gctacttgca ttacagctta cgaaccgaac aggcttatgt ccactgggtt 3600 cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc 3660 gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag 3720 gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt 3780 caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa 3840 gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca gcttctgtat 3900 ggaacgggca tgcggatcag tgagggtttg caactgcggg tcaaggatct ggatttcgat 3960 cacggcacga tcatcgtgcg ggagggcaag ggctccaagg atcgggcctt gatgttaccc 4020 gagagcttgg cacccagcct gcgcgagcag gggaattaat tcccacgggt tttgctgccc 4080 gcaaacgggc tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcagcc 4140 ggtttgccgg ctgaaagcgc tatttcttcc agaattgcca tgattttttc cccacgggag 4200 gcgtcactgg ctcccgtgtt gtcggcagct ttgattcgat aagcagcatc gcctgtttca 4260 ggctgtctat gtgtgactgt tgagctgtaa caagttgtct caggtgttca atttcatgtt 4320 ctagttgctt tgttttactg gtttcacctg ttctattagg tgttacatgc tgttcatctg 4380 ttacattgtc gatctgttca tggtgaacag ctttgaatgc accaaaaact cgtaaaagct 4440 ctgatgtatc tatctttttt acaccgtttt catctgtgca tatggacagt tttccctttg 4500 atatgtaacg gtgaacagtt gttctacttt tgtttgttag tcttgatgct tcactgatag 4560 atacaagagc cataagaacc tcagatcctt ccgtatttag ccagtatgtt ctctagtgtg 4620 gttcgttgtt tttgcgtgag ccatgagaac gaaccattga gatcatactt actttgcatg 4680 tcactcaaaa attttgcctc aaaactggtg agctgaattt ttgcagttaa agcatcgtgt 4740 agtgtttttc ttagtccgtt atgtaggtag gaatctgatg taatggttgt tggtattttg 4800 tcaccattca tttttatctg gttgttctca agttcggtta cgagatccat ttgtctatct 4860 agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc gcttatcaac caccaatttc 4920 atattgctgt aagtgtttaa atctttactt attggtttca aaacccattg gttaagcctt 4980 ttaaactcat ggtagttatt ttcaagcatt aacatgaact taaattcatc aaggctaatc 5040 tctatatttg ccttgtgagt tttcttttgt gttagttctt ttaataacca ctcataaatc 5100 ctcatagagt atttgttttc aaaagactta acatgttcca gattatattt tatgaatttt 5160 tttaactgga aaagataagg caatatctct tcactaaaaa ctaattctaa tttttcgctt 5220 gagaacttgg catagtttgt ccactggaaa atctcaaagc ctttaaccaa aggattcctg 5280 atttccacag ttctcgtcat cagctctctg gttgctttag ctaatacacc ataagcattt 5340 tccctactga tgttcatcat ctgagcgtat tggttataag tgaacgatac cgtccgttct 5400 ttccttgtag ggttttcaat cgtggggttg agtagtgcca cacagcataa aattagcttg 5460 gtttcatgct ccgttaagtc atagcgacta atcgctagtt catttgcttt gaaaacaact 5520 aattcagaca tacatctcaa ttggtctagg tgattttaat cactatacca attgagatgg 5580 gctagtcaat gataattact agtccttttc ctttgagttg tgggtatctg taaattctgc 5640 tagacctttg ctggaaaact tgtaaattct gctagaccct ctgtaaattc cgctagacct 5700 ttgtgtgttt tttttgttta tattcaagtg gttataattt atagaataaa gaaagaataa 5760 aaaaagataa aaagaataga tcccagccct gtgtataact cactacttta gtcagttccg 5820 cagtattaca aaaggatgtc gcaaacgctg tttgctcctc tacaaaacag accttaaaac 5880 cctaaaggct taagtagcac cctcgcaagc tcgggcaaat cgctgaatat tccttttgtc 5940 tccgaccatc aggcacctga gtcgctgtct ttttcgtgac attcagttcg ctgcgctcac 6000 ggctctggca gtgaatgggg gtaaatggca ctacaggcgc cttttatgga ttcatgcaag 6060 gaaactaccc ataatacaag aaaagcccgt cacgggcttc tcagggcgtt ttatggcggg 6120 tctgctatgt ggtgctatct gactttttgc tgttcagcag ttcctgccct ctgattttcc 6180 agtctgacca cttcggatta tcccgtgaca ggtcattcag actggctaat gcacccagta 6240 aggcagcggt atcatcaaca ggctta 6266 <210> 8 <211> 1695 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 atgtgtgcaa cctcctccca gtttactcag attaccgagc ataattctcg acgatctgct 60 aactaccagc cgaacctttg gaactttgag tttctccagt ctctcgaaaa tgacctgaag 120 gtggaaaagc tcgaggagaa ggcgaccaaa ctcgaggagg aggtgcgatg tatgatcaac 180 agagttgaca cccaacccct gtctttgctg gagctgatcg acgatgtgca gcggttgggt 240 ttgacttata aattcgagaa ggacattatc aaggcactgg agaacattgt gctcctcgac 300 gagaacaaga agaacaagtc tgatcttcac gctaccgctc tctctttccg acttcttcga 360 caacacggct tcgaggtgtc gcaggacgtc ttcgagagat ttaaggacaa ggagggagga 420 tttagcggcg agctgaaggg agacgttcag ggtcttctct ccttgtacga ggcgtcctac 480 ctgggattcg agggagagaa cctcctggag gaagctcgta cattttccat cactcacctt 540 aagaataacc ttaaggaggg aattaacacc aaggtggccg agcaggtttc tcacgccctg 600 gagctcccct accaccaacg gctccataga ctggaggctc gttggttcct ggacaaatat 660 gagccaaagg agcctcatca tcagttgctg ttggagttgg ccaagctgga cttcaatatg 720 gttcagacgc tgcaccaaaa ggagttgcag gacctgtctc gatggtggac cgagatggga 780 ttggcctcga agctggattt tgtccgtgac cgacttatgg aggtctattt ttgggccctt 840 ggaatggcgc ctgaccccca gttcggagag tgccggaagg cggtgacgaa gatgttcggt 900 cttgtgacta tcatcgacga cgtctacgat gtctacggca cactcgacga gttgcagctg 960 ttcactgacg ccgtcgagcg atgggatgtg aacgccatta atactctccc tgactatatg 1020 aagctgtgct tcctggctct gtacaacact gtcaacgata cctcgtactc tatcctcaag 1080 gagaagggac acaacaatct ctcctacttg accaaatcct ggcgagaact gtgcaaggct 1140 tttctgcagg aggctaaatg gtccaataac aagatcattc ctgctttttc taaatacctg 1200 gaaaatgcct cggtgtcgag ctctggcgtc gcccttctgg ccccttccta cttctccgtc 1260 tgccagcagc aggaggatat ttccgatcat gctcttagat cgctgaccga ttttcacggc 1320 ctcgtgcgat cttcctgcgt gatttttcgg ttgtgtaatg accttgcgac ctctgctgct 1380 gagctggaac gaggcgagac tacaaattcc attatttctt acatgcacga aaacgatgga 1440 acatctgaag aacaggctag agaggaactg cgaaagttga tcgacgccga gtggaagaag 1500 atgaacagag agcgggtgtc cgactctacc ctgcttccca aggccttcat ggagatcgcc 1560 gtgaacatgg ctcgagtttc ccattgtact taccagtacg gtgacggcct gggtcgtccg 1620 gactacgcta cagagaaccg aatcaagctg ctgctcatcg accccttccc tatcaaccaa 1680 ttgatgtacg tgtaa 1695 <210> 9 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 9 gcttatggat cctctagact attacacgta catcaattgg 40 <210> 10 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 caccatgtgt gcaacctcct cccagtttac 30 <210> 11 <211> 8191 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 tcgaccggtg agaagaacag catcgggaca agggaaggaa gaacaaagac aaagaaaaca 60 aaagaaagca attgaaaaca aaacaaaaca attttcattc cttctcttat cattcctttt 120 cttttctttt ctctcattca acgcactcca tcgtatccgt attcctctta ttttttctct 180 ttctctatat ccatttcttt ctctctaggt gtgtcctctc tctctcttca atttctctac 240 tccgcattcc aacgcatcct tcccccaacc tcccatttcc tccttacggc ccgatagcga 300 tcgtctttcc ctcgctatca ctcgctaccg gcccctcctc tgcaccgtaa cctcctacgt 360 atttaccata tcataaagtt ttttccgacg cttatcgctg accccctgtc gccctcctat 420 tggcttccgg attatcttct tgtccataag gtgatccatg cttcctgaag attcccgaaa 480 tgtgtccact ttggcgggga atcattccat ccacttcttt ctctctcgct ttcctcattc 540 ggcgctcccc ttccgcgtct cattggtctt ccgctccgtt tttgctttgc cgatgttact 600 tggggagagg tgcgataatc ctttcgcaaa aactcggttt gacgcctccc atggtataaa 660 tagtgggtgg tggacaggtg ccttcgcttt tctttaagca agagaatccc attgtcttga 720 ctatcacgaa ttcacataca ttatgaagat caccgctgtc attgcccttt tattctcact 780 tgctgctgcc tcacctattc cagttgccga tcctggtgtg gtttcagtta gcaagtcata 840 tgctgatttc cttcgtgttt accaaagttg gaacactttt gctaatcctg atagacccaa 900 ccttaagaag agaaatgata cacctgcaag tggatatcaa gttgaaaaag tcgtaatttt 960 gtcacgtcac ggtgttaggg cccctacaaa aatgactcaa accatgcgtg atgtcactcc 1020 taatacatgg ccagaatggc ccgttaaatt aggatatatt acaccaagag gtgaacactt 1080 gatatcactt atgggcggtt tttaccgtca aaaattccag caacaaggaa tcctttctca 1140 gggctcctgt cctactccta actccatata tgtctgggct gacgtcgatc agcgtacttt 1200 aaaaactggt gaagcattcc ttgctggttt ggcaccacaa tgtggcttga caattcatca 1260 ccaacaaaat cttgagaaag ctgatcctct ttttcatccc gttaaagctg gaacctgctc 1320 tatggataaa actcaagttc aacaagctgt tgagaaggag gcacaaactc ctatagataa 1380 tttgaatcaa cattacatcc cctttttagc tttaatgaat acaacattaa attttagtac 1440 ttctgcctgg tgccaaaaac actctgctga taaatcctgt gacctaggtt tatccatgcc 1500 ttctaaattg tccataaaag ataatggtaa caaggtcgca ttggatggag ctattggtct 1560 atcctctact ttggccgaga tttttcttct tgaatatgct caaggcatgc ctcaagctgc 1620 ttggggtaac atccactcag agcaagagtg ggcttccttg ctaaagttgc ataatgttca 1680 attcgatttg atggcccgaa caccttatat tgctcgacat aacggtactc ctttattgca 1740 agctatatca aatgccctta atcccaacgc cactgaatca aaacttccag atatttcacc 1800 tgataacaaa atattgttca ttgcaggtca tgacacaaat attgctaata tagccggcat 1860 gttaaatatg cgttggacat taccaggtca accagataat actcctccag gtggtgccct 1920 agtatttgaa cgtcttgctg ataaaagtgg aaaacaatat gtttctgtat ctatggttta 1980 tcaaacacta gaacaacttc gatcacagac tcccctttct ctaaatcagc ctgccggatc 2040 tgttcaactt aaaattccag gttgcaatga tcaaacagcc gagggttact gtcctctttc 2100 cacttttaca agagttgttt cccaatctgt tgaacctgga tgccaacttc aataatgagg 2160 atccaagtaa gggaatgaga atgtgatcca cttttaattc ctaatgaata catgcctata 2220 gttcttttct tttgttcttt atgtcgtttt tcgatggtac ggccgttgtc aatctcagtt 2280 tgtgtgcttg gttgcagctt ggtttcaaat ctgttcatct catgaatctt ttaccatttc 2340 accacacgtt tataccattc tctcatagaa tcttcatcaa accatctcgg ggttagagtg 2400 gaaagaaagt cttgttcttt tatttccttt tttccatctt caaggctttt cttttcttcc 2460 tcctcctcgt tcatcttgag gtttgacgtg tctgtttaga attttgagct gttgcagcat 2520 cttatttttt gttttgcgaa aacgaagcgc tttactctct tcatcagttg gacgattgta 2580 cctttgaaaa ccaactactt ttgcatgttt tgtatagaaa tcaatgatat tagaatccca 2640 tcctttaatt tctttcaaag tagttgagct atagttaagt gtaagggccc tactgcgaaa 2700 gcatttgcca aggatgtttt cattaatcaa gaacgaaagt taggggatcg aagacgatca 2760 gataccgtcg tagtcttaac cataaactat gccgactagg gatcgggcaa tgtttcattt 2820 atcgacttgc tcggcacctt acgagaaatc aaagtctttg ggttccgggg ggagtatggt 2880 cgcaaggctg aaacttaaag gaattgacgg aagggcacca caatggagtg gagcctgcgg 2940 cttaatttga ctcaacacgg ggaaactcac caggtccaga catagtaagg attgacagat 3000 tgagagctct ttcttgattc tatgggtggt ggtgcatggc cgttcttagt tggtggagtg 3060 atttgtctgc ttaattgcga taacgaacga gaccttaacc tgctaaatag ctggatcagc 3120 cattttggct gatcattagc ttcttagagg gactattggc ataaagccaa tggaagtttg 3180 aggcaataac aggtctgtga tgcccttaga tgttctgggc cgcacgcgcg ctacactgac 3240 ggagccaacg agttgaaaaa aatcttttga ttttttatcc ttggccggaa ggtctgggta 3300 atcttgttaa actccgtcgt gctggggata gagcattgca attattgcgg ccgctcctca 3360 attcgatgtt gcagatttta caagttttta aaatgtattt cattattact ttttatatgc 3420 ctaataaaaa agccatagtt taatctatag ataacttttt ttccagtgca ctaacggacg 3480 ttacattccc atacaaaact gcgtagttaa agctaaggaa aagttaatat catgttaatt 3540 aaatacgcta tttacaataa gacattgaac tcatttatat cgttgaatat gaataaccaa 3600 tttcagcgaa tttttaacaa acatcgttca cctcgtttaa ggatatcttg tgtatggggt 3660 gttgacttgc tttatcgaat aattaccgta cctgtaattg gcttgctgga tatagcggta 3720 gtctaatatc tagcaaaaat cttttgggtg aaaaggcttg caatttcacg acaccgaact 3780 atttgtcatt ttttaataag gaagttttcc ataaattcct gtaattctcg gttgatctaa 3840 ttgaaaagag tagttttgca tcacgatgag gagggctttt gtagaaagaa atacgaacga 3900 aacgaaaatc agcgttgcca tcgctttgga caaagctccc ttacctgaag agtcgaattt 3960 tattgatgaa cttataactt ccaagcatgc aaaccaaaag ggagaacaag taatccaagt 4020 agacacggga attggattct tggatcacat gtatcatgca ctggctaaac atgcaggctg 4080 gagcttacga ctttactcaa gaggtgattt aatcatcgat gatcatcaca ctgcagaaga 4140 tactgctatt gcacttggta ttgcattcaa gcaggctatg ggtaactttg ccggcgttaa 4200 aagatttgga catgcttatt gtccacttga cgaagctctt tctagaagcg tagttgactt 4260 gtcgggacgg ccctatgctg ttatcgattt gggattaaag cgtgaaaagg ttggggaatt 4320 gtcctgtgaa atgatccctc acttactata ttccttttcg gtagcagctg gaattacttt 4380 gcatgttacc tgcttatatg gtagtaatga ccatcatcgt gctgaaagcg cttttaaatc 4440 tctggctgtt gccatgcgcg cggctactag tcttactgga agttctgaag tcccaagcac 4500 gaagggagtg ttgtaaagat gaattggatt atgtcaggaa aagaacgaca attttgcatc 4560 caaattgtct aaattttaga gttgcttgaa aacaatagaa ccttacttgc tttataatta 4620 cgttaattag aagcgttatc tcgtgaagga atatagtacg tagccgtata aattgaattg 4680 aatgttcagc ttatagaata gagacacttt gctgttcaat gcgtcgtcac ttaccatact 4740 cactttatta tacgacttta agtataaact ccgcggttat ggtaaaatta atgatgcaca 4800 aacgtccgat tccatatggg tacactacaa ttaaatactt ttaagctgat cccccacaca 4860 ccatagcttc aaaatgtttc tactcctttt ttactcttcc agattttctc ggactccgcg 4920 catcgccgta ccacttcaaa acacccaagc acagcatact aaattttccc tctttcttcc 4980 tctagggtgt cgttaattac ccgtactaaa ggtttggaaa agaaaaaaga gaccgcctcg 5040 tttctttttc ttcgtcgaaa aaggcaataa aaatttttat cacgtttctt tttcttgaaa 5100 tttttttttt tagttttttt ctctttcagt gacctccatt gatatttaag ttaataaacg 5160 gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact ttttttactt 5220 cttgttcatt agaaagaaag catagcaatc taatctaagg gcggtgttga caattaatca 5280 tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac catggccaag 5340 ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 5400 accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 5460 gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 5520 gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 5580 acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 5640 cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 5700 gactgacacg tccgacggcg gcccacgggt cccaggcctc ggagatccgt cccccttttc 5760 ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc cccccacatc 5820 cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 5880 tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt tttttctgta 5940 cagacgcgag cttcccagta aatgtgccat ctcgtaggca gaaaacggtt cccccgtagg 6000 gtctctctct tggcctcctt tctaggtcgg gctgattgct cttgaagctc tctagggggg 6060 ctcacaccat aggcagataa cgttccccac cggctcgcct cgtaagcgca caaggactgc 6120 tcccaaagat cctaggcggg attttgccga tttcggccta aaggaaccgg aacacgtaga 6180 aagccagtcc gcagaaacgg tgctgacccc ggatgaatgt cagctactgg gctatctgga 6240 caagggaaaa cgcaagcgca aagagaaagc aggtagcttg cagtgggctt acatggcgat 6300 agctagactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct 6360 ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttcttgccg ccaaggatct 6420 gatggcgcag gggatcaaga tctgatcaag agacaggatg aggatcgttt cgcatgattg 6480 aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 6540 actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 6600 ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg 6660 aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 6720 ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 6780 tgtcatctcg ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 6840 tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 6900 gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 6960 aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg 7020 atctcgtcgt gatccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 7080 tttctggatt caacgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 7140 tggatacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 7200 tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 7260 tcttctgaat tgaaaaaggt accaagttta ctcatatata ctttagattg atttaaaact 7320 tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat 7380 cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 7440 ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 7500 accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 7560 cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 7620 cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 7680 tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 7740 taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 7800 gacctacacc gaactgagat acctacagcg tgagcattga gaaagcgcca cgcttcccga 7860 agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 7920 ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 7980 acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 8040 caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 8100 tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 8160 tcgccgcagc cgaacgaccg agcgcagcga g 8191 <210> 12 <211> 1724 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 gaattcaaaa caaaatgtgt gcaacctcct cccagtttac tcagattacc gagcataatt 60 ctcgacgatc tgctaactac cagccgaacc tttggaactt tgagtttctc cagtctctcg 120 aaaatgacct gaaggtggaa aagctcgagg agaaggcgac caaactcgag gaggaggtgc 180 gatgtatgat caacagagtt gacacccaac ccctgtcttt gctggagctg atcgacgatg 240 tgcagcggtt gggtttgact tataaattcg agaaggacat tatcaaggca ctggagaaca 300 ttgtgctcct cgacgagaac aagaagaaca agtctgatct tcacgctacc gctctctctt 360 tccgacttct tcgacaacac ggcttcgagg tgtcgcagga cgtcttcgag agatttaagg 420 acaaggaggg aggatttagc ggcgagctga agggagacgt tcagggtctt ctctccttgt 480 acgaggcgtc ctacctggga ttcgagggag agaacctcct ggaggaagct cgtacatttt 540 ccatcactca ccttaagaat aaccttaagg agggaattaa caccaaggtg gccgagcagg 600 tttctcacgc cctggagctc ccctaccacc aacggctcca tagactggag gctcgttggt 660 tcctggacaa atatgagcca aaggagcctc atcatcagtt gctgttggag ttggccaagc 720 tggacttcaa tatggttcag acgctgcacc aaaaggagtt gcaggacctg tctcgatggt 780 ggaccgagat gggattggcc tcgaagctgg attttgtccg tgaccgactt atggaggtct 840 atttttgggc ccttggaatg gcgcctgacc cccagttcgg agagtgccgg aaggcggtga 900 cgaagatgtt cggtcttgtg actatcatcg acgacgtcta cgatgtctac ggcacactcg 960 acgagttgca gctgttcact gacgccgtcg agcgatggga tgtgaacgcc attaatactc 1020 tccctgacta tatgaagctg tgcttcctgg ctctgtacaa cactgtcaac gatacctcgt 1080 actctatcct caaggagaag ggacacaaca atctctccta cttgaccaaa tcctggcgag 1140 aactgtgcaa ggcttttctg caggaggcta aatggtccaa taacaagatc attcctgctt 1200 tttctaaata cctggaaaat gcctcggtgt cgagctctgg cgtcgccctt ctggcccctt 1260 cctacttctc cgtctgccag cagcaggagg atatttccga tcatgctctt agatcgctga 1320 ccgattttca cggcctcgtg cgatcttcct gcgtgatttt tcggttgtgt aatgaccttg 1380 cgacctctgc tgctgagctg gaacgaggcg agactacaaa ttccattatt tcttacatgc 1440 acgaaaacga tggaacatct gaagaacagg ctagagagga actgcgaaag ttgatcgacg 1500 ccgagtggaa gaagatgaac agagagcggg tgtccgactc taccctgctt cccaaggcct 1560 tcatggagat cgccgtgaac atggctcgag tttcccattg tacttaccag tacggtgacg 1620 gcctgggtcg tccggactac gctacagaga accgaatcaa gctgctgctc atcgacccct 1680 tccctatcaa ccaattgatg tacgtgtaat agtctagagg atcc 1724 <210> 13 <211> 1701 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 13 gaattcaaca aaaatgtgct ctgtttccac tgagaacgtg tcctttactg agactgagac 60 tgaagcacgt agaagcgcca actacgaacc caactcctgg gattatgact ttctgctgtc 120 ttctgacacc gacgagtcga tcgaggttta taaggataag gccaagaaac ttgaggccga 180 ggtcagacga gagattaaca acgagaaggc cgagttcctg acccttcttg agctgatcga 240 caacgttcaa cgacttggtc ttggttaccg tttcgaatcc gatatccgac gtgcattgga 300 tcgatttgtc tcgtccggag gtttcgatgg tgtgactaag acgtcgctgc acgccacagc 360 tctttccttc agactgttgc ggcagcatgg atttgaggtt tcccaggaag ccttttctgg 420 tttcaaggat cagaacggaa actttttgga gaatctcaag gaggacacca aggccatcct 480 gtcgttgtat gaggcctcgt tcctggctct tgagggcgag aatattctgg atgaggctcg 540 ggttttcgct atttcgcacc tgaaggagtt gtcggaggaa aagatcggaa aggaactggc 600 cgagcaggtc aaccatgcac ttgaacttcc cctgcatcga cgtacccagc gactggaggc 660 cgtgtggagc atcgaggcgt acagaaaaaa ggaggatgct aatcaggttc tgctcgaact 720 cgctatcctc gactataaca tgattcagag cgtgtaccag cgtgacttgc gagagacaag 780 ccggtggtgg cgacgggtgg gactggccac gaagctccac tttgctaaag atcgattgat 840 tgagtcgttc tactgggcag tgggtgtggc ctttgagcct cagtactccg actgccgaaa 900 ctccgttgca aagatgtttt cttttgtcac tatcatcgac gacatctacg atgtttacgg 960 cactctcgat gaactcgaac tcttcacgga cgctgtcgag cgatgggatg tgaatgccat 1020 taatgatctg ccagattata tgaagttgtg tttcttggcg ctctacaaca caattaatga 1080 aattgcctac gacaacctca aggacaaggg agagaacatt ctgccctacc ttactaaagc 1140 ctgggccgac ctgtgtaacg cctttttgca ggaagccaag tggctctata acaaatctac 1200 tcctacattt gatgactact tcggcaacgc ttggaagtct tccagcggcc ctctccagtt 1260 gatcttcgct tactttgcag tggtccagaa catcaagaaa gaggagattg agaacctcca 1320 gaagtatcac gacatcatct cccgaccttc gcacatcttt cgactgtgca atgaccttgc 1380 ctccgcatcc gctgagattg cccgaggaga aacagccaat tctgtgtcgt gttacatgcg 1440 tacaaagggc atctccgagg agctggctac cgagtctgtg atgaacctga tcgatgaaac 1500 ctgtaagaag atgaacaaag agaaactggg cggttctctg ttcgccaaac catttgttga 1560 aaccgcgatc aatctggctc gtcagtctca ttgtacttac cataacggtg acgcgcacac 1620 ttcgccggac gaattgaccc gtaagcgtgt gctttcggtg attaccgagc cgatcctgcc 1680 gttcgaaaga taataggatc c 1701 <210> 14 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 gatcaagctt aaccggaatt gccagctg 28 <210> 15 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 15 gatccgatcg tcagaagaac tcgtcaagaa ggc 33 <210> 16 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 16 catcaatgca tcgcccttag gaggtaaaaa aaaatgac 38 <210> 17 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 17 ccttctgcag gacgcgttgt tatagc 26 <210> 18 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 gatcatgcat tcgcccttag gaggtaaaaa aacatgagtt ttgatattgc caaatacccg 60 60 <210> 19 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 19 catgctgcag ttatgccagc caggccttga 30 <210> 20 <211> 8804 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 20 gctggtacca tatgggaatt cgaagctttc tagaacaaaa actcatctca gaagaggatc 60 tgaatagcgc cgtcgaccat catcatcatc atcattgagt ttaaacggtc tccagcttgg 120 ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 180 cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 240 gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 300 agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 360 gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg 420 atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg 480 ccaggcatca aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa 540 ctctttttgt ttatttttct aaatacattc aaatatgtat ccgcttaacc ggaattgcca 600 gctggggcgc cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttctcg 660 ccgccaagga tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg 720 tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg 780 ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 840 ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 900 gaactgcaag acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca 960 gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 1020 gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 1080 gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 1140 catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 1200 gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg 1260 cccgacggcg aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg 1320 gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat 1380 caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 1440 cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc 1500 cttcttgacg agttcttctg acatgaccaa aatcccttaa cgtgagtttt cgttccactg 1560 agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 1620 aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 1680 agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 1740 tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 1800 atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 1860 taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 1920 gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 1980 gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 2040 aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 2100 tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 2160 gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 2220 cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 2280 ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 2340 cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc ttacgcatct 2400 gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg atgccgcata 2460 gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc gccccgacac 2520 ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga 2580 caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa 2640 cgcgcgaggc agcagatcaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca 2700 ccatcgaatg gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat 2760 tcagggtggt gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct 2820 cttatcagac cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg 2880 aaaaagtgga agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac 2940 tggcgggcaa acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc 3000 cgtcgcaaat tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg 3060 tgtcgatggt agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg 3120 cgcaacgcgt cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg 3180 tggaagctgc ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca 3240 tcaacagtat tattttctcc catgaagacg gtacgcgact gggcgtggag catctggtcg 3300 cattgggtca ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc 3360 tgcgtctggc tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac 3420 gggaaggcga ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg 3480 gcatcgttcc cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg 3540 ccattaccga gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata 3600 ccgaagacag ctcatgttat atcccgccgt caaccaccat caaacaggat tttcgcctgc 3660 tggggcaaac cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca 3720 atcagctgtt gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa 3780 ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 3840 tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt gatctggttt 3900 gacagcttat catcgactgc acggtgcacc aatgcttctg gcgtcaggca gccatcggaa 3960 gctgtggtat ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac 4020 tcccgttctg gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa 4080 atgagctgtt gacaattaat catccggctc gtataatgtg tggaattgtg agcggataac 4140 aatttcacac aggaaacagc gccgctgaga aaaagcgaag cggcactgct ctttaacaat 4200 ttatcagaca atctgtgtgg gcactcgacc ggaattatcg attaacttta ttattaaaaa 4260 ttaaagaggt atatattaat gtatcgatta aataaggagg aataaaccat gtgtgcgacc 4320 tcttctcaat ttactcagat taccgagcat aattcccgtc gttccgcaaa ctatcagcca 4380 aacctgtgga atttcgaatt cctgcaatcc ctggagaacg acctgaaagt ggaaaagctg 4440 gaggagaaag cgaccaaact ggaggaagaa gttcgctgca tgatcaaccg tgtagacacc 4500 cagccgctgt ccctgctgga gctgatcgac gatgtgcagc gcctgggtct gacctacaaa 4560 tttgaaaaag acatcattaa agccctggaa aacatcgtac tgctggacga aaacaaaaag 4620 aacaaatctg acctgcacgc aaccgctctg tctttccgtc tgctgcgtca gcacggtttc 4680 gaggtttctc aggatgtttt tgagcgtttc aaggataaag aaggtggttt cagcggtgaa 4740 ctgaaaggtg acgtccaagg cctgctgagc ctgtatgaag cgtcttacct gggtttcgag 4800 ggtgagaacc tgctggagga ggcgcgtacc ttttccatca cccacctgaa gaacaacctg 4860 aaagaaggca ttaataccaa ggttgcagaa caagtgagcc acgccctgga actgccatat 4920 caccagcgtc tgcaccgtct ggaggcacgt tggttcctgg ataaatacga accgaaagaa 4980 ccgcatcacc agctgctgct ggagctggcg aagctggatt ttaacatggt acagaccctg 5040 caccagaaag agctgcaaga tctgtcccgc tggtggaccg agatgggcct ggctagcaaa 5100 ctggattttg tacgcgaccg cctgatggaa gtttatttct gggcactggg tatggcgcca 5160 gacccgcagt ttggtgaatg tcgcaaagct gttactaaaa tgtttggtct ggtgacgatc 5220 atcgatgacg tgtatgacgt ttatggcact ctggacgaac tgcaactgtt caccgatgct 5280 gtagagcgct gggacgttaa cgctattaac accctgccgg actatatgaa actgtgtttc 5340 ctggcactgt acaacaccgt taacgacacg tcctattcta ttctgaaaga gaaaggtcat 5400 aacaacctgt cctatctgac gaaaagctgg cgtgaactgt gcaaagcctt tctgcaagag 5460 gcgaaatggt ccaacaacaa aattatcccg gctttctcca agtacctgga aaacgccagc 5520 gtttcctcct ccggtgtagc gctgctggcg ccgtcttact tttccgtatg ccagcagcag 5580 gaagacatct ccgaccacgc gctgcgttcc ctgaccgact tccatggtct ggtgcgttct 5640 agctgcgtta tcttccgcct gtgcaacgat ctggccacct ctgcggcgga gctggaacgt 5700 ggcgagacta ccaattctat cattagctac atgcacgaaa acgatggtac cagcgaggaa 5760 caggcccgcg aagaactgcg taaactgatc gacgccgaat ggaaaaagat gaatcgtgaa 5820 cgcgttagcg actccaccct gctgcctaaa gcgttcatgg aaatcgcagt taacatggca 5880 cgtgtttccc actgcaccta ccagtatggc gatggtctgg gtcgcccaga ctacgcgact 5940 gaaaaccgca tcaaactgct gctgattgac cctttcccga ttaaccagct gatgtatgtc 6000 taactgcatc gcccttagga ggtaaaaaaa aatgactgcc gacaacaata gtatgcccca 6060 tggtgcagta tctagttacg ccaaattagt gcaaaaccaa acacctgaag acattttgga 6120 agagtttcct gaaattattc cattacaaca aagacctaat acccgatcta gtgagacgtc 6180 aaatgacgaa agcggagaaa catgtttttc tggtcatgat gaggagcaaa ttaagttaat 6240 gaatgaaaat tgtattgttt tggattggga cgataatgct attggtgccg gtaccaagaa 6300 agtttgtcat ttaatggaaa atattgaaaa gggtttacta catcgtgcat tctccgtctt 6360 tattttcaat gaacaaggtg aattactttt acaacaaaga gccactgaaa aaataacttt 6420 ccctgatctt tggactaaca catgctgctc tcatccacta tgtattgatg acgaattagg 6480 tttgaagggt aagctagacg ataagattaa gggcgctatt actgcggcgg tgagaaaact 6540 agatcatgaa ttaggtattc cagaagatga aactaagaca aggggtaagt ttcacttttt 6600 aaacagaatc cattacatgg caccaagcaa tgaaccatgg ggtgaacatg aaattgatta 6660 catcctattt tataagatca acgctaaaga aaacttgact gtcaacccaa acgtcaatga 6720 agttagagac ttcaaatggg tttcaccaaa tgatttgaaa actatgtttg ctgacccaag 6780 ttacaagttt acgccttggt ttaagattat ttgcgagaat tacttattca actggtggga 6840 gcaattagat gacctttctg aagtggaaaa tgacaggcaa attcatagaa tgctataaca 6900 acgcgtcctg cattcgccct taggaggtaa aaaaacatga gttttgatat tgccaaatac 6960 ccgaccctgg cactggtcga ctccacccag gagttacgac tgttgccgaa agagagttta 7020 ccgaaactct gcgacgaact gcgccgctat ttactcgaca gcgtgagccg ttccagcggg 7080 cacttcgcct ccgggctggg cacggtcgaa ctgaccgtgg cgctgcacta tgtctacaac 7140 accccgtttg accaattgat ttgggatgtg gggcatcagg cttatccgca taaaattttg 7200 accggacgcc gcgacaaaat cggcaccatc cgtcagaaag gcggtctgca cccgttcccg 7260 tggcgcggcg aaagcgaata tgacgtatta agcgtcgggc attcatcaac ctccatcagt 7320 gccggaattg gtattgcggt tgctgccgaa aaagaaggca aaaatcgccg caccgtctgt 7380 gtcattggcg atggcgcgat taccgcaggc atggcgtttg aagcgatgaa tcacgcgggc 7440 gatatccgtc ctgatatgct ggtgattctc aacgacaatg aaatgtcgat ttccgaaaat 7500 gtcggcgcgc tcaacaacca tctggcacag ctgctttccg gtaagcttta ctcttcactg 7560 cgcgaaggcg ggaaaaaagt tttctctggc gtgccgccaa ttaaagagct gctcaaacgc 7620 accgaagaac atattaaagg catggtagtg cctggcacgt tgtttgaaga gctgggcttt 7680 aactacatcg gcccggtgga cggtcacgat gtgctggggc ttatcaccac gctaaagaac 7740 atgcgcgacc tgaaaggccc gcagttcctg catatcatga ccaaaaaagg tcgtggttat 7800 gaaccggcag aaaaagaccc gatcactttc cacgccgtgc ctaaatttga tccctccagc 7860 ggttgtttgc cgaaaagtag cggcggtttg ccgagctatt caaaaatctt tggcgactgg 7920 ttgtgcgaaa cggcagcgaa agacaacaag ctgatggcga ttactccggc gatgcgtgaa 7980 ggttccggca tggtcgagtt ttcacgtaaa ttcccggatc gctacttcga cgtggcaatt 8040 gccgagcaac acgcggtgac ctttgctgcg ggtctggcga ttggtgggta caaacccatt 8100 gtcgcgattt actccacttt cctgcaacgc gcctatgatc aggtgctgca tgacgtggcg 8160 attcaaaagc ttccggtcct gttcgccatc gaccgcgcgg gcattgttgg tgctgacggt 8220 caaacccatc agggtgcttt tgatctctct tacctgcgct gcataccgga aatggtcatt 8280 atgaccccga gcgatgaaaa cgaatgtcgc cagatgctct ataccggcta tcactataac 8340 gatggcccgt cagcggtgcg ctacccgcgt ggcaacgcgg tcggcgtgga actgacgccg 8400 ctggaaaaac taccaattgg caaaggcatt gtgaagcgtc gtggcgagaa actggcgatc 8460 cttaactttg gtacgctgat gccagaagcg gcgaaagtcg ccgaatcgct gaacgccacg 8520 ctggtcgata tgcgttttgt gaaaccgctt gatgaagcgt taattctgga aatggccgcc 8580 agccatgaag cgctggtcac cgtagaagaa aacgccatta tgggcggcgc aggcagcggc 8640 gtgaacgaag tgctgatggc ccatcgtaaa ccagtacccg tgctgaacat tggcctgccg 8700 gacttcttta ttccgcaagg aactcaggaa gaaatgcgcg ccgaactcgg cctcgatgcc 8760 gctggtatgg aagccaaaat caaggcctgg ctggcataac tgca 8804 <210> 21 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 21 aggaggtaaa aaaacatgtc attaccgttc ttaacttctg c 41 <210> 22 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 22 atggctgcag gcctatcgca aattagctta tgaagtccat ggtaaattcg tg 52 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 gaattcgccc ttctgcagct acc 23 <210> 24 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 cgactggtgc acccttaagg aggaaaaaaa catgtcag 38 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 25 gtgctggaat tcgcccttct gcagc 25 <210> 26 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 26 gtagatgcat gcagaattcg cccttaagga gg 32 <210> 27 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 27 ccttctgcag gacgcgttgt tatagc 26 <210> 28 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 28 catcaatgca tcgcccttag gaggtaaaaa aaaatgac 38 <210> 29 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 29 gtgtgatgga tatctgcaga attcg 25 <210> 30 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 30 catcaatgca tcgcccttag gaggtaaaaa aacatg 36 <210> 31 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 31 gatcatgcat tcgcccttag gaggtaaaaa aacatgtgtg cgacctcttc tcaatttact 60 60 <210> 32 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 32 cggtcgacgg atccctgcag ttagacatac atcagctg 38 <210> 33 <211> 10992 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 33 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatggatcc 420 gagctcggat ccactagtaa cggccgccag tgtgctggaa ttcgccctta ggaggtaaaa 480 aaacatgtca ttaccgttct taacttctgc accgggaaag gttattattt ttggtgaaca 540 ctctgctgtg tacaacaagc ctgccgtcgc tgctagtgtg tctgcgttga gaacctacct 600 gctaataagc gagtcatctg caccagatac tattgaattg gacttcccgg acattagctt 660 taatcataag tggtccatca atgatttcaa tgccatcacc gaggatcaag taaactccca 720 aaaattggcc aaggctcaac aagccaccga tggcttgtct caggaactcg ttagtctttt 780 ggatccgttg ttagctcaac tatccgaatc cttccactac catgcagcgt tttgtttcct 840 gtatatgttt gtttgcctat gcccccatgc caagaatatt aagttttctt taaagtctac 900 tttacccatc ggtgctgggt tgggctcaag cgcctctatt tctgtatcac tggccttagc 960 tatggcctac ttgggggggt taataggatc taatgacttg gaaaagctgt cagaaaacga 1020 taagcatata gtgaatcaat gggccttcat aggtgaaaag tgtattcacg gtaccccttc 1080 aggaatagat aacgctgtgg ccacttatgg taatgccctg ctatttgaaa aagactcaca 1140 taatggaaca ataaacacaa acaattttaa gttcttagat gatttcccag ccattccaat 1200 gatcctaacc tatactagaa ttccaaggtc tacaaaagat cttgttgctc gcgttcgtgt 1260 gttggtcacc gagaaatttc ctgaagttat gaagccaatt ctagatgcca tgggtgaatg 1320 tgccctacaa ggcttagaga tcatgactaa gttaagtaaa tgtaaaggca ccgatgacga 1380 ggctgtagaa actaataatg aactgtatga acaactattg gaattgataa gaataaatca 1440 tggactgctt gtctcaatcg gtgtttctca tcctggatta gaacttatta aaaatctgag 1500 cgatgatttg agaattggct ccacaaaact taccggtgct ggtggcggcg gttgctcttt 1560 gactttgtta cgaagagaca ttactcaaga gcaaattgac agcttcaaaa agaaattgca 1620 agatgatttt agttacgaga catttgaaac agacttgggt gggactggct gctgtttgtt 1680 aagcgcaaaa aatttgaata aagatcttaa aatcaaatcc ctagtattcc aattatttga 1740 aaataaaact accacaaagc aacaaattga cgatctatta ttgccaggaa acacgaattt 1800 accatggact tcataagcta atttgcgata ggcctgcacc cttaaggagg aaaaaaacat 1860 gtcagagttg agagccttca gtgccccagg gaaagcgtta ctagctggtg gatatttagt 1920 tttagataca aaatatgaag catttgtagt cggattatcg gcaagaatgc atgctgtagc 1980 ccatccttac ggttcattgc aagggtctga taagtttgaa gtgcgtgtga aaagtaaaca 2040 atttaaagat ggggagtggc tgtaccatat aagtcctaaa agtggcttca ttcctgtttc 2100 gataggcgga tctaagaacc ctttcattga aaaagttatc gctaacgtat ttagctactt 2160 taaacctaac atggacgact actgcaatag aaacttgttc gttattgata ttttctctga 2220 tgatgcctac cattctcagg aggatagcgt taccgaacat cgtggcaaca gaagattgag 2280 ttttcattcg cacagaattg aagaagttcc caaaacaggg ctgggctcct cggcaggttt 2340 agtcacagtt ttaactacag ctttggcctc cttttttgta tcggacctgg aaaataatgt 2400 agacaaatat agagaagtta ttcataattt agcacaagtt gctcattgtc aagctcaggg 2460 taaaattgga agcgggtttg atgtagcggc ggcagcatat ggatctatca gatatagaag 2520 attcccaccc gcattaatct ctaatttgcc agatattgga agtgctactt acggcagtaa 2580 actggcgcat ttggttgatg aagaagactg gaatattacg attaaaagta accatttacc 2640 ttcgggatta actttatgga tgggcgatat taagaatggt tcagaaacag taaaactggt 2700 ccagaaggta aaaaattggt atgattcgca tatgccagaa agcttgaaaa tatatacaga 2760 actcgatcat gcaaattcta gatttatgga tggactatct aaactagatc gcttacacga 2820 gactcatgac gattacagcg atcagatatt tgagtctctt gagaggaatg actgtacctg 2880 tcaaaagtat cctgaaatca cagaagttag agatgcagtt gccacaatta gacgttcctt 2940 tagaaaaata actaaagaat ctggtgccga tatcgaacct cccgtacaaa ctagcttatt 3000 ggatgattgc cagaccttaa aaggagttct tacttgctta atacctggtg ctggtggtta 3060 tgacgccatt gcagtgatta ctaagcaaga tgttgatctt agggctcaaa ccgctaatga 3120 caaaagattt tctaaggttc aatggctgga tgtaactcag gctgactggg gtgttaggaa 3180 agaaaaagat ccggaaactt atcttgataa ataacttaag gtagctgcat gcagaattcg 3240 cccttaagga ggaaaaaaaa atgaccgttt acacagcatc cgttaccgca cccgtcaaca 3300 tcgcaaccct taagtattgg gggaaaaggg acacgaagtt gaatctgccc accaattcgt 3360 ccatatcagt gactttatcg caagatgacc tcagaacgtt gacctctgcg gctactgcac 3420 ctgagtttga acgcgacact ttgtggttaa atggagaacc acacagcatc gacaatgaaa 3480 gaactcaaaa ttgtctgcgc gacctacgcc aattaagaaa ggaaatggaa tcgaaggacg 3540 cctcattgcc cacattatct caatggaaac tccacattgt ctccgaaaat aactttccta 3600 cagcagctgg tttagcttcc tccgctgctg gctttgctgc attggtctct gcaattgcta 3660 agttatacca attaccacag tcaacttcag aaatatctag aatagcaaga aaggggtctg 3720 gttcagcttg tagatcgttg tttggcggat acgtggcctg ggaaatggga aaagctgaag 3780 atggtcatga ttccatggca gtacaaatcg cagacagctc tgactggcct cagatgaaag 3840 cttgtgtcct agttgtcagc gatattaaaa aggatgtgag ttccactcag ggtatgcaat 3900 tgaccgtggc aacctccgaa ctatttaaag aaagaattga acatgtcgta ccaaagagat 3960 ttgaagtcat gcgtaaagcc attgttgaaa aagatttcgc cacctttgca aaggaaacaa 4020 tgatggattc caactctttc catgccacat gtttggactc tttccctcca atattctaca 4080 tgaatgacac ttccaagcgt atcatcagtt ggtgccacac cattaatcag ttttacggag 4140 aaacaatcgt tgcatacacg tttgatgcag gtccaaatgc tgtgttgtac tacttagctg 4200 aaaatgagtc gaaactcttt gcatttatct ataaattgtt tggctctgtt cctggatggg 4260 acaagaaatt tactactgag cagcttgagg ctttcaacca tcaatttgaa tcatctaact 4320 ttactgcacg tgaattggat cttgagttgc aaaaggatgt tgccagagtg attttaactc 4380 aagtcggttc aggcccacaa gaaacaaacg aatctttgat tgacgcaaag actggtctac 4440 caaaggaata agatcaattc gctgcatcgc ccttaggagg taaaaaaaaa tgactgccga 4500 caacaatagt atgccccatg gtgcagtatc tagttacgcc aaattagtgc aaaaccaaac 4560 acctgaagac attttggaag agtttcctga aattattcca ttacaacaaa gacctaatac 4620 ccgatctagt gagacgtcaa atgacgaaag cggagaaaca tgtttttctg gtcatgatga 4680 ggagcaaatt aagttaatga atgaaaattg tattgttttg gattgggacg ataatgctat 4740 tggtgccggt accaagaaag tttgtcattt aatggaaaat attgaaaagg gtttactaca 4800 tcgtgcattc tccgtcttta ttttcaatga acaaggtgaa ttacttttac aacaaagagc 4860 cactgaaaaa ataactttcc ctgatctttg gactaacaca tgctgctctc atccactatg 4920 tattgatgac gaattaggtt tgaagggtaa gctagacgat aagattaagg gcgctattac 4980 tgcggcggtg agaaaactag atcatgaatt aggtattcca gaagatgaaa ctaagacaag 5040 gggtaagttt cactttttaa acagaatcca ttacatggca ccaagcaatg aaccatgggg 5100 tgaacatgaa attgattaca tcctatttta taagatcaac gctaaagaaa acttgactgt 5160 caacccaaac gtcaatgaag ttagagactt caaatgggtt tcaccaaatg atttgaaaac 5220 tatgtttgct gacccaagtt acaagtttac gccttggttt aagattattt gcgagaatta 5280 cttattcaac tggtgggagc aattagatga cctttctgaa gtggaaaatg acaggcaaat 5340 tcatagaatg ctataacaac gcgtcctgca ttcgccctta ggaggtaaaa aaacatgtgt 5400 gcgacctctt ctcaatttac tcagattacc gagcataatt cccgtcgttc cgcaaactat 5460 cagccaaacc tgtggaattt cgaattcctg caatccctgg agaacgacct gaaagtggaa 5520 aagctggagg agaaagcgac caaactggag gaagaagttc gctgcatgat caaccgtgta 5580 gacacccagc cgctgtccct gctggagctg atcgacgatg tgcagcgcct gggtctgacc 5640 tacaaatttg aaaaagacat cattaaagcc ctggaaaaca tcgtactgct ggacgaaaac 5700 aaaaagaaca aatctgacct gcacgcaacc gctctgtctt tccgtctgct gcgtcagcac 5760 ggtttcgagg tttctcagga tgtttttgag cgtttcaagg ataaagaagg tggtttcagc 5820 ggtgaactga aaggtgacgt ccaaggcctg ctgagcctgt atgaagcgtc ttacctgggt 5880 ttcgagggtg agaacctgct ggaggaggcg cgtacctttt ccatcaccca cctgaagaac 5940 aacctgaaag aaggcattaa taccaaggtt gcagaacaag tgagccacgc cctggaactg 6000 ccatatcacc agcgtctgca ccgtctggag gcacgttggt tcctggataa atacgaaccg 6060 aaagaaccgc atcaccagct gctgctggag ctggcgaagc tggattttaa catggtacag 6120 accctgcacc agaaagagct gcaagatctg tcccgctggt ggaccgagat gggcctggct 6180 agcaaactgg attttgtacg cgaccgcctg atggaagttt atttctgggc actgggtatg 6240 gcgccagacc cgcagtttgg tgaatgtcgc aaagctgtta ctaaaatgtt tggtctggtg 6300 acgatcatcg atgacgtgta tgacgtttat ggcactctgg acgaactgca actgttcacc 6360 gatgctgtag agcgctggga cgttaacgct attaacaccc tgccggacta tatgaaactg 6420 tgtttcctgg cactgtacaa caccgttaac gacacgtcct attctattct gaaagagaaa 6480 ggtcataaca acctgtccta tctgacgaaa agctggcgtg aactgtgcaa agcctttctg 6540 caagaggcga aatggtccaa caacaaaatt atcccggctt tctccaagta cctggaaaac 6600 gccagcgttt cctcctccgg tgtagcgctg ctggcgccgt cttacttttc cgtatgccag 6660 cagcaggaag acatctccga ccacgcgctg cgttccctga ccgacttcca tggtctggtg 6720 cgttctagct gcgttatctt ccgcctgtgc aacgatctgg ccacctctgc ggcggagctg 6780 gaacgtggcg agactaccaa ttctatcatt agctacatgc acgaaaacga tggtaccagc 6840 gaggaacagg cccgcgaaga actgcgtaaa ctgatcgacg ccgaatggaa aaagatgaat 6900 cgtgaacgcg ttagcgactc caccctgctg cctaaagcgt tcatggaaat cgcagttaac 6960 atggcacgtg tttcccactg cacctaccag tatggcgatg gtctgggtcg cccagactac 7020 gcgactgaaa accgcatcaa actgctgctg attgaccctt tcccgattaa ccagctgatg 7080 tatgtctaac tgcagctggt accatatggg aattcgaagc tttctagaac aaaaactcat 7140 ctcagaagag gatctgaata gcgccgtcga ccatcatcat catcatcatt gagtttaaac 7200 ggtctccagc ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa 7260 tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc 7320 ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg 7380 tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa 7440 agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa 7500 tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg 7560 cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 7620 tgcgtttcta caaactcttt ttgtttattt ttctaaatac attcaaatat gtatccgctt 7680 aaccggaatt gccagctggg gcgccctctg gtaaggttgg gaagccctgc aaagtaaact 7740 ggatggcttt ctcgccgcca aggatctgat ggcgcagggg atcaagctct gatcaagaga 7800 caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 7860 cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 7920 ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 7980 ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg gccacgacgg 8040 gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 8100 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 8160 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 8220 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 8280 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 8340 tcaaggcgag catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 8400 cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 8460 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 8520 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 8580 tcgccttcta tcgccttctt gacgagttct tctgacgcat gaccaaaatc ccttaacgtg 8640 agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 8700 ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 8760 tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 8820 cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 8880 ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 8940 gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 9000 ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 9060 aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 9120 cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 9180 ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 9240 gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 9300 ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 9360 ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 9420 gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt 9480 ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 9540 gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 9600 ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 9660 ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 9720 accgtcatca ccgaaacgcg cgaggcagca gatcaattcg cgcgcgaagg cgaagcggca 9780 tgcatttacg ttgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc 9840 ccggaagaga gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca 9900 gagtatgccg gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt 9960 tctgcgaaaa cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac 10020 cgcgtggcac aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt 10080 ctggccctgc acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg 10140 ggtgccagcg tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg 10200 gtgcacaatc ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac 10260 caggatgcca ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc 10320 tctgaccaga cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc 10380 gtggagcatc tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt 10440 tctgtctcgg cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt 10500 cagccgatag cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg 10560 caaatgctga atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg 10620 ctgggcgcaa tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta 10680 gtgggatacg acgataccga agacagctca tgttatatcc cgccgtcaac caccatcaaa 10740 caggattttc gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc 10800 caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg 10860 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 10920 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagcg 10980 cgaattgatc tg 10992 <210> 34 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 34 gagacatgag ctcaggaggt aaaaaaacat gaaaacagta gttattatt 49 <210> 35 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 35 tttatcaatc ccaattgtca tgttttttta cctcctttat tgttttctta aatc 54 <210> 36 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 36 gatttaagaa aacaataaag gaggtaaaaa aacatgacaa ttgggattga taaa 54 <210> 37 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 37 gacatgacat agatctttag tttcgataag aacgaacggt 40 <210> 38 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 38 atgaaaacag tagttattat tgatgc 26 <210> 39 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 39 atgttattgt tttcttaaat catttaaaat agc 33 <210> 40 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 40 atgacaattg ggattgataa aattag 26 <210> 41 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 41 ttagtttcga taagaacgaa cggt 24 <210> 42 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 42 gaaatagccc cattagaagt atc 23 <210> 43 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 43 ttgccaatca tatgattgaa aatc 24 <210> 44 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 44 gctatgcttc attagatcct tatcg 25 <210> 45 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 45 gaaacctaca tccaatcttt tgccc 25 <210> 46 <211> 8703 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 46 cccgtcttac tgtcgggaat tcgcgttggc cgattcatta atgcagattc tgaaatgagc 60 tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc 120 acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa caatttatca 180 gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta aaaattaaag 240 aggtatatat taatgtatcg attaaataag gaggaataaa ccatggatcc gagctcagga 300 ggtaaaaaaa catgaaaaca gtagttatta ttgatgcatt acgaacacca attggaaaat 360 ataaaggcag cttaagtcaa gtaagtgccg tagacttagg aacacatgtt acaacacaac 420 ttttaaaaag acattccact atttctgaag aaattgatca agtaatcttt ggaaatgttt 480 tacaagctgg aaatggccaa aatcccgcac gacaaatagc aataaacagc ggtttgtctc 540 atgaaattcc cgcaatgacg gttaatgagg tctgcggatc aggaatgaag gccgttattt 600 tggcgaaaca attgattcaa ttaggagaag cggaagtttt aattgctggc gggattgaga 660 atatgtccca agcacctaaa ttacaacgtt ttaattacga aacagaaagc tacgatgcgc 720 ctttttctag tatgatgtat gatggattaa cggatgcctt tagtggtcag gcaatgggct 780 taactgctga aaatgtggcc gaaaagtatc atgtaactag agaagagcaa gatcaatttt 840 ctgtacattc acaattaaaa gcagctcaag cacaagcaga agggatattc gctgacgaaa 900 tagccccatt agaagtatca ggaacgcttg tggagaaaga tgaagggatt cgccctaatt 960 cgagcgttga gaagctagga acgcttaaaa cagtttttaa agaagacggt actgtaacag 1020 cagggaatgc atcaaccatt aatgatgggg cttctgcttt gattattgct tcacaagaat 1080 atgccgaagc acacggtctt ccttatttag ctattattcg agacagtgtg gaagtcggta 1140 ttgatccagc ctatatggga atttcgccga ttaaagccat tcaaaaactg ttagcgcgca 1200 atcaacttac tacggaagaa attgatctgt atgaaatcaa cgaagcattt gcagcaactt 1260 caatcgtggt ccaaagagaa ctggctttac cagaggaaaa ggtcaacatt tatggtggcg 1320 gtatttcatt aggtcatgcg attggtgcca caggtgctcg tttattaacg agtttaagtt 1380 atcaattaaa tcaaaaagaa aagaaatatg gagtggcttc tttatgtatc ggcggtggct 1440 taggactcgc tatgctacta gagagacctc agcaaaaaaa aaacagccga ttttatcaaa 1500 tgagtcctga ggaacgcctg gcttctcttc ttaatgaagg ccagatttct gctgatacaa 1560 aaaaagaatt tgaaaatacg gctttatctt cgcagattgc caatcatatg attgaaaatc 1620 aaatcagtga aacagaagtg ccgatgggcg ttggcttaca tttaacagtg gacgaaactg 1680 attatttggt accaatggcg acagaagagc cctcagttat tgcggctttg agtaatggtg 1740 caaaaatagc acaaggattt aaaacagtga atcaacaacg cttaatgcgt ggacaaatcg 1800 ttttttacga tgttgcagat cccgagtcat tgattgataa actacaagta agagaagcgg 1860 aagtttttca acaagcagag ttaagttatc catctatcgt taaacggggc ggcggcttaa 1920 gagatttgca atatcgtact tttgatgaat catttgtatc tgtcgacttt ttagtagatg 1980 ttaaggatgc aatgggggca aatatcgtta acgctatgtt ggaaggtgtg gccgagttgt 2040 tccgtgaatg gtttgcggag caaaagattt tattcagtat tttaagtaat tatgccacgg 2100 agtcggttgt tacgatgaaa acggctattc cagtttcacg tttaagtaag gggagcaatg 2160 gccgggaaat tgctgaaaaa attgttttag cttcacgcta tgcttcatta gatccttatc 2220 gggcagtcac gcataacaaa ggaatcatga atggcattga agctgtagtt ttagctacag 2280 gaaatgatac acgcgctgtt agcgcttctt gtcatgcttt tgcggtgaag gaaggtcgct 2340 accaaggctt gactagttgg acgctggatg gcgaacaact aattggtgaa atttcagttc 2400 cgcttgcttt agccacggtt ggcggtgcca caaaagtctt acctaaatct caagcagctg 2460 ctgatttgtt agcagtgacg gatgcaaaag aactaagtcg agtagtagcg gctgttggtt 2520 tggcacaaaa tttagcggcg ttacgggcct tagtctctga aggaattcaa aaaggacaca 2580 tggctctaca agcacgttct ttagcgatga cggtcggagc tactggtaaa gaagttgagg 2640 cagtcgctca acaattaaaa cgtcaaaaaa cgatgaacca agaccgagcc atggctattt 2700 taaatgattt aagaaaacaa taaaggaggt aaaaaaacat gacaattggg attgataaaa 2760 ttagtttttt tgtgccccct tattatattg atatgacggc actggctgaa gccagaaatg 2820 tagaccctgg aaaatttcat attggtattg ggcaagacca aatggcggtg aacccaatca 2880 gccaagatat tgtgacattt gcagccaatg ccgcagaagc gatcttgacc aaagaagata 2940 aagaggccat tgatatggtg attgtcggga ctgagtccag tatcgatgag tcaaaagcgg 3000 ccgcagttgt cttacatcgt ttaatgggga ttcaaccttt cgctcgctct ttcgaaatca 3060 aggaagcttg ttacggagca acagcaggct tacagttagc taagaatcac gtagccttac 3120 atccagataa aaaagtcttg gtcgtagcgg cagatattgc aaaatatggc ttaaattctg 3180 gcggtgagcc tacacaagga gctggggcgg ttgcaatgtt agttgctagt gaaccgcgca 3240 ttttggcttt aaaagaggat aatgtgatgc tgacgcaaga tatctatgac ttttggcgtc 3300 caacaggcca cccgtatcct atggtcgatg gtcctttgtc aaacgaaacc tacatccaat 3360 cttttgccca agtctgggat gaacataaaa aacgaaccgg tcttgatttt gcagattatg 3420 atgctttagc gttccatatt ccttacacaa aaatgggcaa aaaagcctta ttagcaaaaa 3480 tctccgacca aactgaagca gaacaggaac gaattttagc ccgttatgaa gaaagtatcg 3540 tctatagtcg tcgcgtagga aacttgtata cgggttcact ttatctggga ctcatttccc 3600 ttttagaaaa tgcaacgact ttaaccgcag gcaatcaaat tggtttattc agttatggtt 3660 ctggtgctgt cgctgaattt ttcactggtg aattagtagc tggttatcaa aatcatttac 3720 aaaaagaaac tcatttagca ctgctggata atcggacaga actttctatc gctgaatatg 3780 aagccatgtt tgcagaaact ttagacacag acattgatca aacgttagaa gatgaattaa 3840 aatatagtat ttctgctatt aataataccg ttcgttctta tcgaaactaa gagatctgca 3900 gctggtacca tatgggaatt cgaagcttgg gcccgaacaa aaactcatct cagaagagga 3960 tctgaatagc gccgtcgacc atcatcatca tcatcattga gtttaaacgg tctccagctt 4020 ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc agaacgcaga 4080 agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc acctgacccc 4140 atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc tccccatgcg 4200 agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 4260 tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgggagc 4320 ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc cgccataaac 4380 tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg cgtttctaca 4440 aactcttttt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 4500 ccctgataaa tgcttcaata atctggcgta atagcgaaga ggcccgcacc gatcgccctt 4560 cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc 4620 atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg 4680 catagttaag ccagccccga cacccgccaa cacccgctga cgagcttagt aaagccctcg 4740 ctagatttta atgcggatgt tgcgattact tcgccaacta ttgcgataac aagaaaaagc 4800 cagcctttca tgatatatct cccaatttgt gtagggctta ttatgcacgc ttaaaaataa 4860 taaaagcaga cttgacctga tagtttggct gtgagcaatt atgtgcttag tgcatctaac 4920 gcttgagtta agccgcgccg cgaagcggcg tcggcttgaa cgaattgtta gacattattt 4980 gccgactacc ttggtgatct cgcctttcac gtagtggaca aattcttcca actgatctgc 5040 gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc tgtctagctt caagtatgac 5100 gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc 5160 gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc 5220 atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa 5280 tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac 5340 gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc 5400 gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc 5460 tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag 5520 aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatca aagctcgccg 5580 cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa tcaatatcac tgtgtggctt 5640 caggccgcca tccactgcgg agccgtacaa atgtacggcc agcaacgtcg gttcgagatg 5700 gcgctcgatg acgccaacta cctctgatag ttgagtcgat acttcggcga tcaccgcttc 5760 cctcatgatg tttaactttg ttttagggcg actgccctgc tgcgtaacat cgttgctgct 5820 ccataacatc aaacatcgac ccacggcgta acgcgcttgc tgcttggatg cccgaggcat 5880 agactgtacc ccaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc 5940 accgctgcgt tcggtcaagg ttctggacca gttgcgtgag cgcatacgct acttgcatta 6000 cagcttacga accgaacagg cttatgtcca ctgggttcgt gccttcatcc gtttccacgg 6060 tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag gcatttctgt cctggctggc 6120 gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca ttggcggcct tgctgttctt 6180 ctacggcaag gtgctgtgca cggatctgcc ctggcttcag gagatcggaa gacctcggcc 6240 gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg gttcgcatcc tcggttttct 6300 ggaaggcgag catcgtttgt tcgcccagct tctgtatgga acgggcatgc ggatcagtga 6360 gggtttgcaa ctgcgggtca aggatctgga tttcgatcac ggcacgatca tcgtgcggga 6420 gggcaagggc tccaaggatc gggccttgat gttacccgag agcttggcac ccagcctgcg 6480 cgagcagggg aattaattcc cacgggtttt gctgcccgca aacgggctgt tctggtgttg 6540 ctagtttgtt atcagaatcg cagatccggc ttcagccggt ttgccggctg aaagcgctat 6600 ttcttccaga attgccatga ttttttcccc acgggaggcg tcactggctc ccgtgttgtc 6660 ggcagctttg attcgataag cagcatcgcc tgtttcaggc tgtctatgtg tgactgttga 6720 gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta gttgctttgt tttactggtt 6780 tcacctgttc tattaggtgt tacatgctgt tcatctgtta cattgtcgat ctgttcatgg 6840 tgaacagctt tgaatgcacc aaaaactcgt aaaagctctg atgtatctat cttttttaca 6900 ccgttttcat ctgtgcatat ggacagtttt ccctttgata tgtaacggtg aacagttgtt 6960 ctacttttgt ttgttagtct tgatgcttca ctgatagata caagagccat aagaacctca 7020 gatccttccg tatttagcca gtatgttctc tagtgtggtt cgttgttttt gcgtgagcca 7080 tgagaacgaa ccattgagat catacttact ttgcatgtca ctcaaaaatt ttgcctcaaa 7140 actggtgagc tgaatttttg cagttaaagc atcgtgtagt gtttttctta gtccgttatg 7200 taggtaggaa tctgatgtaa tggttgttgg tattttgtca ccattcattt ttatctggtt 7260 gttctcaagt tcggttacga gatccatttg tctatctagt tcaacttgga aaatcaacgt 7320 atcagtcggg cggcctcgct tatcaaccac caatttcata ttgctgtaag tgtttaaatc 7380 tttacttatt ggtttcaaaa cccattggtt aagcctttta aactcatggt agttattttc 7440 aagcattaac atgaacttaa attcatcaag gctaatctct atatttgcct tgtgagtttt 7500 cttttgtgtt agttctttta ataaccactc ataaatcctc atagagtatt tgttttcaaa 7560 agacttaaca tgttccagat tatattttat gaattttttt aactggaaaa gataaggcaa 7620 tatctcttca ctaaaaacta attctaattt ttcgcttgag aacttggcat agtttgtcca 7680 ctggaaaatc tcaaagcctt taaccaaagg attcctgatt tccacagttc tcgtcatcag 7740 ctctctggtt gctttagcta atacaccata agcattttcc ctactgatgt tcatcatctg 7800 agcgtattgg ttataagtga acgataccgt ccgttctttc cttgtagggt tttcaatcgt 7860 ggggttgagt agtgccacac agcataaaat tagcttggtt tcatgctccg ttaagtcata 7920 gcgactaatc gctagttcat ttgctttgaa aacaactaat tcagacatac atctcaattg 7980 gtctaggtga ttttaatcac tataccaatt gagatgggct agtcaatgat aattactagt 8040 ccttttcctt tgagttgtgg gtatctgtaa attctgctag acctttgctg gaaaacttgt 8100 aaattctgct agaccctctg taaattccgc tagacctttg tgtgtttttt ttgtttatat 8160 tcaagtggtt ataatttata gaataaagaa agaataaaaa aagataaaaa gaatagatcc 8220 cagccctgtg tataactcac tactttagtc agttccgcag tattacaaaa ggatgtcgca 8280 aacgctgttt gctcctctac aaaacagacc ttaaaaccct aaaggcttaa gtagcaccct 8340 cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg cacctgagtc 8400 gctgtctttt tcgtgacatt cagttcgctg cgctcacggc tctggcagtg aatgggggta 8460 aatggcacta caggcgcctt ttatggattc atgcaaggaa actacccata atacaagaaa 8520 agcccgtcac gggcttctca gggcgtttta tggcgggtct gctatgtggt gctatctgac 8580 tttttgctgt tcagcagttc ctgccctctg attttccagt ctgaccactt cggattatcc 8640 cgtgacaggt cattcagact ggctaatgca cccagtaagg cagcggtatc atcaacaggc 8700 tta 8703 <210> 47 <211> 9371 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 47 tgtaaccttt gctttcaaat gagtagaaat aatgcacatc catgtttgta tcgtgcaaat 60 aaagtgtttc atccgtagga aaaaatgact ttagtatctg ttccgctttt tctgatgaaa 120 tgtgctcccc gacaaaattg aatgaatcat ggacatttgc tggctttgat acagcgaaag 180 cagccgttcc tatgttatat atcggattta acagcaggac aaaaaacacc atgacagcca 240 tcgtcaccca cttattcaca cgcacataaa cctttcctga cttttggaac agatgatagc 300 tcatcaaaaa tcccgccatt gccaaataaa tcgtatatgg cattactgca ccataatctt 360 ttgagatttg attgggatat ggcgcaagca gcaagacaag cagtccgata atcagcgtat 420 aaaataagcc tagtaagatc ttatccgttc tccaatacag cttgaaaaac actacattca 480 acgcaatggg aagagtgatg atgaaaaaca gaaacacgaa tgcaatcggc tccatcccat 540 ccgggtattc cttccaatac gaaaagaaac taaaaatcat ttgtacgatc ggcaaactga 600 caacagcaag gtcgaacgta taaaacttac cctttccgcc atgatcacgc ggcatcagca 660 tatagtgaaa agccgtcagc agcacatatc cgtataacaa aaaatgcagc agcggcagca 720 gttcttttcc gtcctctctt aagtaagcgc tggtgaagtt tgttgattgc acctggtgaa 780 taagttcaac agacactccc gccagcagca caatccgcaa tataacaccc gccaagaaca 840 ttgtgcgctg ccggtttatt ttgggatgat gcaccaaaag atataagccc gccagaacaa 900 caattgacca ttgaatcagc agggtgcttt gtctgcttaa tataaaataa cgttcgaaat 960 gcaatacata atgactgaat aactccaaca cgaacaacaa ctccattttc ttctgctatc 1020 aaaataacag actcgtgatt ttccaaacga gctttcaaaa aagcctctgc cccttgcaaa 1080 tcggatgcct gtctataaaa ttcccgatat tggttaaaca gcggcgcaat ggcggccgca 1140 tctgatgtct ttgcttggcg aatgttcatc ttatttcttc ctccctctca ataatttttt 1200 cattctatcc cttttctgta aagtttattt ttcagaatac ttttatcatc atgctttgaa 1260 aaaatatcac gataatatcc attgttctca cggaagcaca cgcaggtcat ttgaacgaat 1320 tttttcgaca ggaatttgcc gggactcagg agcatttaac ctaaaaaagc atgacatttc 1380 agcataatga acatttactc atgtctattt tcgttctttt ctgtatgaaa atagttattt 1440 cgagtctcta cggaaatagc gagagatgat atacctaaat agagataaaa tcatctcaaa 1500 aaaatgggtc tactaaaata ttattccatc tattacaata aattcacaga atagtctttt 1560 aagtaagtct actctgaatt tttttaaaag gagagggtaa agagtgtcat taccgttctt 1620 aacttctgca ccgggaaagg ttattatttt tggtgaacac tctgctgtgt acaacaagcc 1680 tgccgtcgct gctagtgtgt ctgcgttgag aacctacctg ctaataagcg agtcatctgc 1740 accagatact attgaattgg acttcccgga cattagcttt aatcataagt ggtccatcaa 1800 tgatttcaat gccatcaccg aggatcaagt aaactcccaa aaattggcca aggctcaaca 1860 agccaccgat ggcttgtctc aggaactcgt tagtcttttg gatccgttgt tagctcaact 1920 atccgaatcc ttccactacc atgcagcgtt ttgtttcctg tatatgtttg tttgcctatg 1980 cccccatgcc aagaatatta agttttcttt aaagtctact ttacccatcg gtgctgggtt 2040 gggctcaagc gcctctattt ctgtatcact ggccttagct atggcctact tgggggggtt 2100 aataggatct aatgacttgg aaaagctgtc agaaaacgat aagcatatag tgaatcaatg 2160 ggccttcata ggtgaaaagt gtattcacgg taccccttca ggaatagata acgctgtggc 2220 cacttatggt aatgccctgc tatttgaaaa agactcacat aatggaacaa taaacacaaa 2280 caattttaag ttcttagatg atttcccagc cattccaatg atcctaacct atactagaat 2340 tccaaggtct acaaaagatc ttgttgctcg cgttcgtgtg ttggtcaccg agaaatttcc 2400 tgaagttatg aagccaattc tagatgccat gggtgaatgt gccctacaag gcttagagat 2460 catgactaag ttaagtaaat gtaaaggcac cgatgacgag gctgtagaaa ctaataatga 2520 actgtatgaa caactattgg aattgataag aataaatcat ggactgcttg tctcaatcgg 2580 tgtttctcat cctggattag aacttattaa aaatctgagc gatgatttga gaattggctc 2640 cacaaaactt accggtgctg gtggcggcgg ttgctctttg actttgttac gaagagacat 2700 tactcaagag caaattgaca gcttcaaaaa gaaattgcaa gatgatttta gttacgagac 2760 atttgaaaca gacttgggtg ggactggctg ctgtttgtta agcgcaaaaa atttgaataa 2820 agatcttaaa atcaaatccc tagtattcca attatttgaa aataaaacta ccacaaagca 2880 acaaattgac gatctattat tgccaggaaa cacgaattta ccatggactt cataaaagga 2940 gagggtgtca gagttgagag ccttcagtgc cccagggaaa gcgttactag ctggtggata 3000 tttagtttta gatacaaaat atgaagcatt tgtagtcgga ttatcggcaa gaatgcatgc 3060 tgtagcccat ccttacggtt cattgcaagg gtctgataag tttgaagtgc gtgtgaaaag 3120 taaacaattt aaagatgggg agtggctgta ccatataagt cctaaaagtg gcttcattcc 3180 tgtttcgata ggcggatcta agaacccttt cattgaaaaa gttatcgcta acgtatttag 3240 ctactttaaa cctaacatgg acgactactg caatagaaac ttgttcgtta ttgatatttt 3300 ctctgatgat gcctaccatt ctcaggagga tagcgttacc gaacatcgtg gcaacagaag 3360 attgagtttt cattcgcaca gaattgaaga agttcccaaa acagggctgg gctcctcggc 3420 aggtttagtc acagttttaa ctacagcttt ggcctccttt tttgtatcgg acctggaaaa 3480 taatgtagac aaatatagag aagttattca taatttagca caagttgctc attgtcaagc 3540 tcagggtaaa attggaagcg ggtttgatgt agcggcggca gcatatggat ctatcagata 3600 tagaagattc ccacccgcat taatctctaa tttgccagat attggaagtg ctacttacgg 3660 cagtaaactg gcgcatttgg ttgatgaaga agactggaat attacgatta aaagtaacca 3720 tttaccttcg ggattaactt tatggatggg cgatattaag aatggttcag aaacagtaaa 3780 actggtccag aaggtaaaaa attggtatga ttcgcatatg ccagaaagct tgaaaatata 3840 tacagaactc gatcatgcaa attctagatt tatggatgga ctatctaaac tagatcgctt 3900 acacgagact catgacgatt acagcgatca gatatttgag tctcttgaga ggaatgactg 3960 tacctgtcaa aagtatcctg aaatcacaga agttagagat gcagttgcca caattagacg 4020 ttcctttaga aaaataacta aagaatctgg tgccgatatc gaacctcccg tacaaactag 4080 cttattggat gattgccaga ccttaaaagg agttcttact tgcttaatac ctggtgctgg 4140 tggttatgac gccattgcag tgattactaa gcaagatgtt gatcttaggg ctcaaaccgc 4200 taatgacaaa agattttcta aggttcaatg gctggatgta actcaggctg actggggtgt 4260 taggaaagaa aaagatccgg aaacttatct tgataaataa aaggagaggg tgaccgttta 4320 cacagcatcc gttaccgcac ccgtcaacat cgcaaccctt aagtattggg ggaaaaggga 4380 cacgaagttg aatctgccca ccaattcgtc catatcagtg actttatcgc aagatgacct 4440 cagaacgttg acctctgcgg ctactgcacc tgagtttgaa cgcgacactt tgtggttaaa 4500 tggagaacca cacagcatcg acaatgaaag aactcaaaat tgtctgcgcg acctacgcca 4560 attaagaaag gaaatggaat cgaaggacgc ctcattgccc acattatctc aatggaaact 4620 ccacattgtc tccgaaaata actttcctac agcagctggt ttagcttcct ccgctgctgg 4680 ctttgctgca ttggtctctg caattgctaa gttataccaa ttaccacagt caacttcaga 4740 aatatctaga atagcaagaa aggggtctgg ttcagcttgt agatcgttgt ttggcggata 4800 cgtggcctgg gaaatgggaa aagctgaaga tggtcatgat tccatggcag tacaaatcgc 4860 agacagctct gactggcctc agatgaaagc ttgtgtccta gttgtcagcg atattaaaaa 4920 ggatgtgagt tccactcagg gtatgcaatt gaccgtggca acctccgaac tatttaaaga 4980 aagaattgaa catgtcgtac caaagagatt tgaagtcatg cgtaaagcca ttgttgaaaa 5040 agatttcgcc acctttgcaa aggaaacaat gatggattcc aactctttcc atgccacatg 5100 tttggactct ttccctccaa tattctacat gaatgacact tccaagcgta tcatcagttg 5160 gtgccacacc attaatcagt tttacggaga aacaatcgtt gcatacacgt ttgatgcagg 5220 tccaaatgct gtgttgtact acttagctga aaatgagtcg aaactctttg catttatcta 5280 taaattgttt ggctctgttc ctggatggga caagaaattt actactgagc agcttgaggc 5340 tttcaaccat caatttgaat catctaactt tactgcacgt gaattggatc ttgagttgca 5400 aaaggatgtt gccagagtga ttttaactca agtcggttca ggcccacaag aaacaaacga 5460 atctttgatt gacgcaaaga ctggtctacc aaaggaataa aaggagaggg tgactgccga 5520 caacaatagt atgccccatg gtgcagtatc tagttacgcc aaattagtgc aaaaccaaac 5580 acctgaagac attttggaag agtttcctga aattattcca ttacaacaaa gacctaatac 5640 ccgatctagt gagacgtcaa atgacgaaag cggagaaaca tgtttttctg gtcatgatga 5700 ggagcaaatt aagttaatga atgaaaattg tattgttttg gattgggacg ataatgctat 5760 tggtgccggt accaagaaag tttgtcattt aatggaaaat attgaaaagg gtttactaca 5820 tcgtgcattc tccgtcttta ttttcaatga acaaggtgaa ttacttttac aacaaagagc 5880 cactgaaaaa ataactttcc ctgatctttg gactaacaca tgctgctctc atccactatg 5940 tattgatgac gaattaggtt tgaagggtaa gctagacgat aagattaagg gcgctattac 6000 tgcggcggtg agaaaactag atcatgaatt aggtattcca gaagatgaaa ctaagacaag 6060 gggtaagttt cactttttaa acagaatcca ttacatggca ccaagcaatg aaccatgggg 6120 tgaacatgaa attgattaca tcctatttta taagatcaac gctaaagaaa acttgactgt 6180 caacccaaac gtcaatgaag ttagagactt caaatgggtt tcaccaaatg atttgaaaac 6240 tatgtttgct gacccaagtt acaagtttac gccttggttt aagattattt gcgagaatta 6300 cttattcaac tggtgggagc aattagatga cctttctgaa gtggaaaatg acaggcaaat 6360 tcatagaatg ctataaaaaa aaccggcctt ggccccgccg gttttttatt atttttcttc 6420 ctccgcatgt tcaatccgct ccataatcga cggatggctc cctctgaaaa ttttaacgag 6480 aaacggcggg ttgacccggc tcagtcccgt aacggccaag tcctgaaacg tctcaatcgc 6540 cgcttcccgg tttccggtca gctcaatgcc gtaacggtcg gcggcgtttt cctgataccg 6600 ggagacggca ttcgtaattt gaatacatac gaacaaatta ataaagtgaa aaaaatactt 6660 cggaaacatt taaaaaataa ccttattggt acttacatgt ttggatcagg agttgagagt 6720 ggactaaaac caaatagtga tcttgacttt ttagtcgtcg tatctgaacc attgacagat 6780 caaagtaaag aaatacttat acaaaaaatt agacctattt caaaaaaaat aggagataaa 6840 agcaacttac gatatattga attaacaatt attattcagc aagaaatggt accgtggaat 6900 catcctccca aacaagaatt tatttatgga gaatggttac aagagcttta tgaacaagga 6960 tacattcctc agaaggaatt aaattcagat ttaaccataa tgctttacca agcaaaacga 7020 aaaaataaaa gaatatacgg aaattatgac ttagaggaat tactacctga tattccattt 7080 tctgatgtga gaagagccat tatggattcg tcagaggaat taatagataa ttatcaggat 7140 gatgaaacca actctatatt aactttatgc cgtatgattt taactatgga cacgggtaaa 7200 atcataccaa aagatattgc gggaaatgca gtggctgaat cttctccatt agaacatagg 7260 gagagaattt tgttagcagt tcgtagttat cttggagaga atattgaatg gactaatgaa 7320 aatgtaaatt taactataaa ctatttaaat aacagattaa aaaaattata atgtaacctt 7380 tgctttcaaa tgagtagaaa taatgcacat ccatgtttgt atcgtgcaaa taaagtgttt 7440 catccgtagg aaaaaatgac tttagtatct gttccgcttt ttctgatgaa atgtgctccc 7500 cgacaaaatt gaatgaatca tggacatttg ctggctttga tacagcgaaa gcagccgttc 7560 ctatgttata tatcggattt aacagcagga caaaaaacac catgacagcc atcgtcaccc 7620 acttattcac acgcacataa acctttcctg acttttggaa cagatgatag ctcatcaaaa 7680 atcccgccat tgccaaataa atcgtatatg gcattactgc accataatct tttgagattt 7740 gattgggata tggcgcaagc agcaagacaa gcagtccgat aatcagcgta taaaataagc 7800 ctagtaagat cttatccgtt ctccaataca gcttgaaaaa cactacattc aacgcaatgg 7860 gaagagtgat gatgaaaaac agaaacacga atgcaatcgg ctccatccca tccgggtatt 7920 ccttccaata cgaaaagaaa ctaaaaatca tttgtacgat cggcaaactg acaacagcaa 7980 ggtcgaacgt ataaaactta ccctttccgc catgatcacg cggcatcagc atatagtgaa 8040 aagccgtcag cagcacatat ccgtataaca aaaaatgcag cagcggcagc agttcttttc 8100 cgtcctctct taagtaagcg ctggtgaagt ttgttgattg cacctggtga ataagttcaa 8160 cagacactcc cgccagcagc acaatccgca atataacacc cgccaagaac attgtgcgct 8220 gccggtttat tttgggatga tgcaccaaaa gatataagcc cgccagaaca acaattgacc 8280 attgaatcag cagggtgctt tgtctgctta atataaaata acgttcgaaa tgcaatacat 8340 aatgactgaa taactccaac acgaacaaca aaagtgcgca ttttataaaa gctaatgatt 8400 cagtccacat aattgataga cgaattctgc tacaggtcac gtggctatgt gaaggatcgc 8460 gcgtccagtt aagagcaaaa acattgacaa aaaaatttat ttatgctaaa atttactatt 8520 aatatatttg tatgtataat aagattctcc tggccagggg aatcttattt tttgtggagg 8580 atcatttcat gaggaaaaat gagtccagct taacgtctct aatttcagct tttgcccgtg 8640 catatcacag ccgatatgac acacctctta tttttgatga ttttatcgca aaagatctca 8700 ttaacgaaaa agagtttatc gacatcagta aaaatatgat tcaagaaata tcgtttttca 8760 acaaagagat cgccgaacgt cttcaaaatg atcctgaaaa aatattaaaa tgggttgcac 8820 aaatccagct gtctccaacg cccctagcac gtgcttctta ttgtgaaaaa gtcttgcaca 8880 acgaattaat cctgggggca aaacagtatg tcattcttgg agcgggactg gatactttct 8940 gctttcggca tccagaatta gaaaacagct tacaggtttt cgaggttgat catccggcca 9000 cacagcaatt gaaaaaaaat aagctgaagg atgcaaatct gacaattccg ggtcatcttc 9060 attttgttcc tatggatttc accaaaacgt tttcgtatga tcctctctta gatgaaggat 9120 ttaaaaacac aaaaacattc ttcagccttc tcggagtgtc ttattatgta acacgggaag 9180 aaaatgcaag cttgatcagc aatttatttt ctcatgtccc gcctggaagc tctattgttt 9240 ttgattatgc ggacgaaaca ctttttacag caaaagggac gtcgaatcga gttgaacata 9300 tggtgaagat ggctgccgca agcggggaac cgatgaaatc atgtttcact tatcaagaga 9360 ttgaacatct g 9371 <210> 48 <211> 4339 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 48 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttta gtcgctgaac atgtgctctg 1200 tttctaccga gaacgtttcc ttcactgaga cggaaaccga ggcacgtcgt agcgcgaact 1260 acgagccgaa tagctgggac tacgatttcc tgctgtcttc cgatactgac gaatctattg 1320 aggtgtacaa agacaaagca aagaaactgg aggctgaagt gcgccgcgaa attaacaacg 1380 agaaagctga attcctgact ctgctggagc tgatcgataa cgtacagcgc ctgggtctgg 1440 gttaccgctt cgaatctgat atccgtcgcg cactggatcg tttcgtaagc agcggcggtt 1500 tcgatggcgt gaccaaaacg agcctgcacg ctaccgcgct gtccttccgt ctgctgcgtc 1560 agcacggctt cgaagtttct caggaagcat tctccggttt caaagatcaa aacggtaact 1620 tcctggaaaa cctgaaagaa gacactaagg cgatcctgag cctgtatgag gcaagctttc 1680 tggccctgga gggtgagaac atcctggatg aggcgcgcgt attcgccatc tcccatctga 1740 aagagctgtc tgaagagaaa atcggtaagg aactggcaga gcaggttaat cacgcactgg 1800 aactgccgct gcatcgtcgt acccagcgtc tggaggcggt ttggtccatc gaagcgtacc 1860 gcaaaaagga ggatgctaac caggttctgc tggaactggc catcctggac tacaacatga 1920 tccagtccgt ttaccagcgt gatctgcgtg aaacctcccg ttggtggcgc cgtgtgggcc 1980 tggcgaccaa actgcacttc gctaaggacc gcctgattga gtctttttac tgggcagtcg 2040 gcgttgcgtt cgaacctcag tattctgact gccgtaacag cgttgcgaaa atgttcagct 2100 tcgttactat tatcgacgac atctacgacg tttacggtac tctggacgag ctggaactgt 2160 ttaccgacgc tgtcgaacgt tgggatgtta acgccatcaa cgatctgcct gactacatga 2220 aactgtgctt cctggcactg tataacacga tcaacgaaat tgcatacgac aacctgaaag 2280 acaaaggtga aaacatcctg ccgtacctga ctaaagcgtg ggcggatctg tgtaacgctt 2340 ttctgcaaga agcgaaatgg ctgtataaca aatccactcc gacctttgac gattatttcg 2400 gcaatgcctg gaaatccagc tctggcccgc tgcaactgat cttcgcttat tttgcggttg 2460 tccaaaacat caaaaaggag gaaattgaaa acctgcaaaa ataccacgat atcattagcc 2520 gtccttctca tatctttcgc ctgtgcaacg acctggcaag cgcgtccgca gagatcgcac 2580 gtggcgaaac cgctaactct gtttcctgct acatgcgcac caagggcatt tccgaagagc 2640 tggcaaccga gagcgtaatg aatctgatcg acgaaacctg taagaaaatg aacaaagaaa 2700 aactgggtgg ctccctgttc gctaaaccgt tcgtagagac tgctattaac ctggcacgtc 2760 agagccactg cacctaccac aatggtgacg cacatactag cccggatgaa ctgactcgta 2820 aacgtgtact gtctgttatc accgaaccga ttctgccgtt cgaacgttaa ctgcagcgtc 2880 aatcgaaagg gcgacacaaa atttattcta aatgcataat aaatactgat aacatcttat 2940 agtttgtatt atattttgta ttatcgttga catgtataat tttgatatca aaaactgatt 3000 ttccctttat tattttcgag atttattttc ttaattctct ttaacaaact agaaatattg 3060 tatatacaaa aaatcataaa taatagatga atagtttaat tataggtgtt catcaatcga 3120 aaaagcaacg tatcttattt aaagtgcgtt gcttttttct catttataag gttaaataat 3180 tctcatatat caagcaaagt gacaggcgcc cttaaatatt ctgacaaatg ctctttccct 3240 aaactccccc cataaaaaaa cccgccgaag cgggttttta cgttatttgc ggattaacga 3300 ttactcgtta tcagaaccgc ccagggggcc cgagcttaag actggccgtc gttttacaac 3360 acagaaagag tttgtagaaa cgcaaaaagg ccatccgtca ggggccttct gcttagtttg 3420 atgcctggca gttccctact ctcgccttcc gcttcctcgc tcactgactc gctgcgctcg 3480 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 3540 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 3600 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 3660 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3720 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3780 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3840 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3900 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3960 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4020 gctacagagt tcttgaagtg gtgggctaac tacggctaca ctagaagaac agtatttggt 4080 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 4140 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 4200 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 4260 gacgcgcgcg taactcacgt taagggattt tggtcatgag cttgcgccgt cccgtcaagt 4320 cagcgtaatg ctctgcttt 4339 <210> 49 <211> 6065 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 49 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgtgctc 420 tgtttctacc gagaacgttt ccttcactga gacggaaacc gaggcacgtc gtagcgcgaa 480 ctacgagccg aatagctggg actacgattt cctgctgtct tccgatactg acgaatctat 540 tgaggtgtac aaagacaaag caaagaaact ggaggctgaa gtgcgccgcg aaattaacaa 600 cgagaaagct gaattcctga ctctgctgga gctgatcgat aacgtacagc gcctgggtct 660 gggttaccgc ttcgaatctg atatccgtcg cgcactggat cgtttcgtaa gcagcggcgg 720 tttcgatggc gtgaccaaaa cgagcctgca cgctaccgcg ctgtccttcc gtctgctgcg 780 tcagcacggc ttcgaagttt ctcaggaagc attctccggt ttcaaagatc aaaacggtaa 840 cttcctggaa aacctgaaag aagacactaa ggcgatcctg agcctgtatg aggcaagctt 900 tctggccctg gagggtgaga acatcctgga tgaggcgcgc gtattcgcca tctcccatct 960 gaaagagctg tctgaagaga aaatcggtaa ggaactggca gagcaggtta atcacgcact 1020 ggaactgccg ctgcatcgtc gtacccagcg tctggaggcg gtttggtcca tcgaagcgta 1080 ccgcaaaaag gaggatgcta accaggttct gctggaactg gccatcctgg actacaacat 1140 gatccagtcc gtttaccagc gtgatctgcg tgaaacctcc cgttggtggc gccgtgtggg 1200 cctggcgacc aaactgcact tcgctaagga ccgcctgatt gagtcttttt actgggcagt 1260 cggcgttgcg ttcgaacctc agtattctga ctgccgtaac agcgttgcga aaatgttcag 1320 cttcgttact attatcgacg acatctacga cgtttacggt actctggacg agctggaact 1380 gtttaccgac gctgtcgaac gttgggatgt taacgccatc aacgatctgc ctgactacat 1440 gaaactgtgc ttcctggcac tgtataacac gatcaacgaa attgcatacg acaacctgaa 1500 agacaaaggt gaaaacatcc tgccgtacct gactaaagcg tgggcggatc tgtgtaacgc 1560 ttttctgcaa gaagcgaaat ggctgtataa caaatccact ccgacctttg acgattattt 1620 cggcaatgcc tggaaatcca gctctggccc gctgcaactg atcttcgctt attttgcggt 1680 tgtccaaaac atcaaaaagg aggaaattga aaacctgcaa aaataccacg atatcattag 1740 ccgtccttct catatctttc gcctgtgcaa cgacctggca agcgcgtccg cagagatcgc 1800 acgtggcgaa accgctaact ctgtttcctg ctacatgcgc accaagggca tttccgaaga 1860 gctggcaacc gagagcgtaa tgaatctgat cgacgaaacc tgtaagaaaa tgaacaaaga 1920 aaaactgggt ggctccctgt tcgctaaacc gttcgtagag actgctatta acctggcacg 1980 tcagagccac tgcacctacc acaatggtga cgcacatact agcccggatg aactgactcg 2040 taaacgtgta ctgtctgtta tcaccgaacc gattctgccg ttcgaacgtt aactgcagct 2100 ggtaccatat gggaattcga agctttctag aacaaaaact catctcagaa gaggatctga 2160 atagcgccgt cgaccatcat catcatcatc attgagttta aacggtctcc agcttggctg 2220 ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 2280 tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 2340 gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt 2400 agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 2460 ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt 2520 tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca 2580 ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc 2640 tttttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 2700 ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 2760 ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 2820 gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 2880 caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 2940 ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact 3000 cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 3060 gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 3120 taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 3180 tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 3240 agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 3300 caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 3360 ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 3420 tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc 3480 agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 3540 tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 3600 agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 3660 gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 3720 gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 3780 tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 3840 gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 3900 accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 3960 accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 4020 gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 4080 ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 4140 atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 4200 gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 4260 cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 4320 gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 4380 gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc 4440 tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac 4500 cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt attttctcct 4560 tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 4620 tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt catggctgcg 4680 ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc 4740 gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca 4800 tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcattt 4860 acgttgacac catcgaatgg tgcaaaacct ttcgcggtat ggcatgatag cgcccggaag 4920 agagtcaatt cagggtggtg aatgtgaaac cagtaacgtt atacgatgtc gcagagtatg 4980 ccggtgtctc ttatcagacc gtttcccgcg tggtgaacca ggccagccac gtttctgcga 5040 aaacgcggga aaaagtggaa gcggcgatgg cggagctgaa ttacattccc aaccgcgtgg 5100 cacaacaact ggcgggcaaa cagtcgttgc tgattggcgt tgccacctcc agtctggccc 5160 tgcacgcgcc gtcgcaaatt gtcgcggcga ttaaatctcg cgccgatcaa ctgggtgcca 5220 gcgtggtggt gtcgatggta gaacgaagcg gcgtcgaagc ctgtaaagcg gcggtgcaca 5280 atcttctcgc gcaacgcgtc agtgggctga tcattaacta tccgctggat gaccaggatg 5340 ccattgctgt ggaagctgcc tgcactaatg ttccggcgtt atttcttgat gtctctgacc 5400 agacacccat caacagtatt attttctccc atgaagacgg tacgcgactg ggcgtggagc 5460 atctggtcgc attgggtcac cagcaaatcg cgctgttagc gggcccatta agttctgtct 5520 cggcgcgtct gcgtctggct ggctggcata aatatctcac tcgcaatcaa attcagccga 5580 tagcggaacg ggaaggcgac tggagtgcca tgtccggttt tcaacaaacc atgcaaatgc 5640 tgaatgaggg catcgttccc actgcgatgc tggttgccaa cgatcagatg gcgctgggcg 5700 caatgcgcgc cattaccgag tccgggctgc gcgttggtgc ggatatctcg gtagtgggat 5760 acgacgatac cgaagacagc tcatgttata tcccgccgtc aaccaccatc aaacaggatt 5820 ttcgcctgct ggggcaaacc agcgtggacc gcttgctgca actctctcag ggccaggcgg 5880 tgaagggcaa tcagctgttg cccgtctcac tggtgaaaag aaaaaccacc ctggcgccca 5940 atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg 6000 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gcgcgaattg 6060 atctg 6065 <210> 50 <211> 6912 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 50 ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 60 tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 120 ggcgaagcgg catgcattta cgttgacacc atcgaatggt gcaaaacctt tcgcggtatg 180 gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc agtaacgtta 240 tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt ggtgaaccag 300 gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc ggagctgaat 360 tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct gattggcgtt 420 gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat taaatctcgc 480 gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg cgtcgaagcc 540 tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat cattaactat 600 ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt tccggcgtta 660 tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca tgaagacggt 720 acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc gctgttagcg 780 ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa atatctcact 840 cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat gtccggtttt 900 caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct ggttgccaac 960 gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg cgttggtgcg 1020 gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat cccgccgtca 1080 accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg cttgctgcaa 1140 ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact ggtgaaaaga 1200 aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1260 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1320 tgtgagttag cgcgaattga tctggtttga cagcttatca tcgactgcac ggtgcaccaa 1380 tgcttctggc gtcaggcagc catcggaagc tgtggtatgg ctgtgcaggt cgtaaatcac 1440 tgcataattc gtgtcgctca aggcgcactc ccgttctgga taatgttttt tgcgccgaca 1500 tcataacggt tctggcaaat attctgaaat gagctgttga caattaatca tccggctcgt 1560 ataatgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcgc cgctgagaaa 1620 aagcgaagcg gcactgctct ttaacaattt atcagacaat ctgtgtgggc actcgaccgg 1680 aattatcgat taactttatt attaaaaatt aaagaggtat atattaatgt atcgattaaa 1740 taaggaggaa taaaccatgt gtgcgacctc ttctcaattt actcagatta ccgagcataa 1800 ttcccgtcgt tccgcaaact atcagccaaa cctgtggaat ttcgaattcc tgcaatccct 1860 ggagaacgac ctgaaagtgg aaaagctgga ggagaaagcg accaaactgg aggaagaagt 1920 tcgctgcatg atcaaccgtg tagacaccca gccgctgtcc ctgctggagc tgatcgacga 1980 tgtgcagcgc ctgggtctga cctacaaatt tgaaaaagac atcattaaag ccctggaaaa 2040 catcgtactg ctggacgaaa acaaaaagaa caaatctgac ctgcacgcaa ccgctctgtc 2100 tttccgtctg ctgcgtcagc acggtttcga ggtttctcag gatgtttttg agcgtttcaa 2160 ggataaagaa ggtggtttca gcggtgaact gaaaggtgac gtccaaggcc tgctgagcct 2220 gtatgaagcg tcttacctgg gtttcgaggg tgagaacctg ctggaggagg cgcgtacctt 2280 ttccatcacc cacctgaaga acaacctgaa agaaggcatt aataccaagg ttgcagaaca 2340 agtgagccac gccctggaac tgccatatca ccagcgtctg caccgtctgg aggcacgttg 2400 gttcctggat aaatacgaac cgaaagaacc gcatcaccag ctgctgctgg agctggcgaa 2460 gctggatttt aacatggtac agaccctgca ccagaaagag ctgcaagatc tgtcccgctg 2520 gtggaccgag atgggcctgg ctagcaaact ggattttgta cgcgaccgcc tgatggaagt 2580 ttatttctgg gcactgggta tggcgccaga cccgcagttt ggtgaatgtc gcaaagctgt 2640 tactaaaatg tttggtctgg tgacgatcat cgatgacgtg tatgacgttt atggcactct 2700 ggacgaactg caactgttca ccgatgctgt agagcgctgg gacgttaacg ctattaacac 2760 cctgccggac tatatgaaac tgtgtttcct ggcactgtac aacaccgtta acgacacgtc 2820 ctattctatt ctgaaagaga aaggtcataa caacctgtcc tatctgacga aaagctggcg 2880 tgaactgtgc aaagcctttc tgcaagaggc gaaatggtcc aacaacaaaa ttatcccggc 2940 tttctccaag tacctggaaa acgccagcgt ttcctcctcc ggtgtagcgc tgctggcgcc 3000 gtcttacttt tccgtatgcc agcagcagga agacatctcc gaccacgcgc tgcgttccct 3060 gaccgacttc catggtctgg tgcgttctag ctgcgttatc ttccgcctgt gcaacgatct 3120 ggccacctct gcggcggagc tggaacgtgg cgagactacc aattctatca ttagctacat 3180 gcacgaaaac gatggtacca gcgaggaaca ggcccgcgaa gaactgcgta aactgatcga 3240 cgccgaatgg aaaaagatga atcgtgaacg cgttagcgac tccaccctgc tgcctaaagc 3300 gttcatggaa atcgcagtta acatggcacg tgtttcccac tgcacctacc agtatggcga 3360 tggtctgggt cgcccagact acgcgactga aaaccgcatc aaactgctgc tgattgaccc 3420 tttcccgatt aaccagctga tgtatgtcta actgcatcgc ccttaggagg taaaaaaaaa 3480 tgactgccga caacaatagt atgccccatg gtgcagtatc tagttacgcc aaattagtgc 3540 aaaaccaaac acctgaagac attttggaag agtttcctga aattattcca ttacaacaaa 3600 gacctaatac ccgatctagt gagacgtcaa atgacgaaag cggagaaaca tgtttttctg 3660 gtcatgatga ggagcaaatt aagttaatga atgaaaattg tattgttttg gattgggacg 3720 ataatgctat tggtgccggt accaagaaag tttgtcattt aatggaaaat attgaaaagg 3780 gtttactaca tcgtgcattc tccgtcttta ttttcaatga acaaggtgaa ttacttttac 3840 aacaaagagc cactgaaaaa ataactttcc ctgatctttg gactaacaca tgctgctctc 3900 atccactatg tattgatgac gaattaggtt tgaagggtaa gctagacgat aagattaagg 3960 gcgctattac tgcggcggtg agaaaactag atcatgaatt aggtattcca gaagatgaaa 4020 ctaagacaag gggtaagttt cactttttaa acagaatcca ttacatggca ccaagcaatg 4080 aaccatgggg tgaacatgaa attgattaca tcctatttta taagatcaac gctaaagaaa 4140 acttgactgt caacccaaac gtcaatgaag ttagagactt caaatgggtt tcaccaaatg 4200 atttgaaaac tatgtttgct gacccaagtt acaagtttac gccttggttt aagattattt 4260 gcgagaatta cttattcaac tggtgggagc aattagatga cctttctgaa gtggaaaatg 4320 acaggcaaat tcatagaatg ctataacaac gcgtcctgca gctggtacca tatgggaatt 4380 cgaagctttc tagaacaaaa actcatctca gaagaggatc tgaatagcgc cgtcgaccat 4440 catcatcatc atcattgagt ttaaacggtc tccagcttgg ctgttttggc ggatgagaga 4500 agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 4560 tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 4620 gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 4680 caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 4740 gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa 4800 cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag 4860 aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctctttttgt ttatttttct 4920 aaatacattc aaatatgtat ccgcttaacc ggaattgcca gctggggcgc cctctggtaa 4980 ggttgggaag ccctgcaaag taaactggat ggctttctcg ccgccaagga tctgatggcg 5040 caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga 5100 tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 5160 acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 5220 ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag acgaggcagc 5280 gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 5340 tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 5400 tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 5460 gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 5520 tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 5580 cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg aggatctcgt 5640 cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 5700 attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 5760 ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 5820 tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 5880 acatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 5940 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 6000 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 6060 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 6120 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 6180 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 6240 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 6300 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 6360 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 6420 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 6480 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 6540 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 6600 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 6660 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 6720 cggaagagcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 6780 tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc 6840 gctatcgcta cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc 6900 gccctgacgg gc 6912 <210> 51 <211> 7902 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 51 ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 60 tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 120 ggcgaagcgg catgcattta cgttgacacc atcgaatggt gcaaaacctt tcgcggtatg 180 gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc agtaacgtta 240 tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt ggtgaaccag 300 gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc ggagctgaat 360 tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct gattggcgtt 420 gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat taaatctcgc 480 gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg cgtcgaagcc 540 tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat cattaactat 600 ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt tccggcgtta 660 tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca tgaagacggt 720 acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc gctgttagcg 780 ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa atatctcact 840 cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat gtccggtttt 900 caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct ggttgccaac 960 gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg cgttggtgcg 1020 gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat cccgccgtca 1080 accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg cttgctgcaa 1140 ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact ggtgaaaaga 1200 aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1260 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1320 tgtgagttag cgcgaattga tctggtttga cagcttatca tcgactgcac ggtgcaccaa 1380 tgcttctggc gtcaggcagc catcggaagc tgtggtatgg ctgtgcaggt cgtaaatcac 1440 tgcataattc gtgtcgctca aggcgcactc ccgttctgga taatgttttt tgcgccgaca 1500 tcataacggt tctggcaaat attctgaaat gagctgttga caattaatca tccggctcgt 1560 ataatgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcgc cgctgagaaa 1620 aagcgaagcg gcactgctct ttaacaattt atcagacaat ctgtgtgggc actcgaccgg 1680 aattatcgat taactttatt attaaaaatt aaagaggtat atattaatgt atcgattaaa 1740 taaggaggaa taaaccatgt gtgcgacctc ttctcaattt actcagatta ccgagcataa 1800 ttcccgtcgt tccgcaaact atcagccaaa cctgtggaat ttcgaattcc tgcaatccct 1860 ggagaacgac ctgaaagtgg aaaagctgga ggagaaagcg accaaactgg aggaagaagt 1920 tcgctgcatg atcaaccgtg tagacaccca gccgctgtcc ctgctggagc tgatcgacga 1980 tgtgcagcgc ctgggtctga cctacaaatt tgaaaaagac atcattaaag ccctggaaaa 2040 catcgtactg ctggacgaaa acaaaaagaa caaatctgac ctgcacgcaa ccgctctgtc 2100 tttccgtctg ctgcgtcagc acggtttcga ggtttctcag gatgtttttg agcgtttcaa 2160 ggataaagaa ggtggtttca gcggtgaact gaaaggtgac gtccaaggcc tgctgagcct 2220 gtatgaagcg tcttacctgg gtttcgaggg tgagaacctg ctggaggagg cgcgtacctt 2280 ttccatcacc cacctgaaga acaacctgaa agaaggcatt aataccaagg ttgcagaaca 2340 agtgagccac gccctggaac tgccatatca ccagcgtctg caccgtctgg aggcacgttg 2400 gttcctggat aaatacgaac cgaaagaacc gcatcaccag ctgctgctgg agctggcgaa 2460 gctggatttt aacatggtac agaccctgca ccagaaagag ctgcaagatc tgtcccgctg 2520 gtggaccgag atgggcctgg ctagcaaact ggattttgta cgcgaccgcc tgatggaagt 2580 ttatttctgg gcactgggta tggcgccaga cccgcagttt ggtgaatgtc gcaaagctgt 2640 tactaaaatg tttggtctgg tgacgatcat cgatgacgtg tatgacgttt atggcactct 2700 ggacgaactg caactgttca ccgatgctgt agagcgctgg gacgttaacg ctattaacac 2760 cctgccggac tatatgaaac tgtgtttcct ggcactgtac aacaccgtta acgacacgtc 2820 ctattctatt ctgaaagaga aaggtcataa caacctgtcc tatctgacga aaagctggcg 2880 tgaactgtgc aaagcctttc tgcaagaggc gaaatggtcc aacaacaaaa ttatcccggc 2940 tttctccaag tacctggaaa acgccagcgt ttcctcctcc ggtgtagcgc tgctggcgcc 3000 gtcttacttt tccgtatgcc agcagcagga agacatctcc gaccacgcgc tgcgttccct 3060 gaccgacttc catggtctgg tgcgttctag ctgcgttatc ttccgcctgt gcaacgatct 3120 ggccacctct gcggcggagc tggaacgtgg cgagactacc aattctatca ttagctacat 3180 gcacgaaaac gatggtacca gcgaggaaca ggcccgcgaa gaactgcgta aactgatcga 3240 cgccgaatgg aaaaagatga atcgtgaacg cgttagcgac tccaccctgc tgcctaaagc 3300 gttcatggaa atcgcagtta acatggcacg tgtttcccac tgcacctacc agtatggcga 3360 tggtctgggt cgcccagact acgcgactga aaaccgcatc aaactgctgc tgattgaccc 3420 tttcccgatt aaccagctga tgtatgtcta actgcattcg cccttaggag gtaaaaaaac 3480 atgagttttg atattgccaa atacccgacc ctggcactgg tcgactccac ccaggagtta 3540 cgactgttgc cgaaagagag tttaccgaaa ctctgcgacg aactgcgccg ctatttactc 3600 gacagcgtga gccgttccag cgggcacttc gcctccgggc tgggcacggt cgaactgacc 3660 gtggcgctgc actatgtcta caacaccccg tttgaccaat tgatttggga tgtggggcat 3720 caggcttatc cgcataaaat tttgaccgga cgccgcgaca aaatcggcac catccgtcag 3780 aaaggcggtc tgcacccgtt cccgtggcgc ggcgaaagcg aatatgacgt attaagcgtc 3840 gggcattcat caacctccat cagtgccgga attggtattg cggttgctgc cgaaaaagaa 3900 ggcaaaaatc gccgcaccgt ctgtgtcatt ggcgatggcg cgattaccgc aggcatggcg 3960 tttgaagcga tgaatcacgc gggcgatatc cgtcctgata tgctggtgat tctcaacgac 4020 aatgaaatgt cgatttccga aaatgtcggc gcgctcaaca accatctggc acagctgctt 4080 tccggtaagc tttactcttc actgcgcgaa ggcgggaaaa aagttttctc tggcgtgccg 4140 ccaattaaag agctgctcaa acgcaccgaa gaacatatta aaggcatggt agtgcctggc 4200 acgttgtttg aagagctggg ctttaactac atcggcccgg tggacggtca cgatgtgctg 4260 gggcttatca ccacgctaaa gaacatgcgc gacctgaaag gcccgcagtt cctgcatatc 4320 atgaccaaaa aaggtcgtgg ttatgaaccg gcagaaaaag acccgatcac tttccacgcc 4380 gtgcctaaat ttgatccctc cagcggttgt ttgccgaaaa gtagcggcgg tttgccgagc 4440 tattcaaaaa tctttggcga ctggttgtgc gaaacggcag cgaaagacaa caagctgatg 4500 gcgattactc cggcgatgcg tgaaggttcc ggcatggtcg agttttcacg taaattcccg 4560 gatcgctact tcgacgtggc aattgccgag caacacgcgg tgacctttgc tgcgggtctg 4620 gcgattggtg ggtacaaacc cattgtcgcg atttactcca ctttcctgca acgcgcctat 4680 gatcaggtgc tgcatgacgt ggcgattcaa aagcttccgg tcctgttcgc catcgaccgc 4740 gcgggcattg ttggtgctga cggtcaaacc catcagggtg cttttgatct ctcttacctg 4800 cgctgcatac cggaaatggt cattatgacc ccgagcgatg aaaacgaatg tcgccagatg 4860 ctctataccg gctatcacta taacgatggc ccgtcagcgg tgcgctaccc gcgtggcaac 4920 gcggtcggcg tggaactgac gccgctggaa aaactaccaa ttggcaaagg cattgtgaag 4980 cgtcgtggcg agaaactggc gatccttaac tttggtacgc tgatgccaga agcggcgaaa 5040 gtcgccgaat cgctgaacgc cacgctggtc gatatgcgtt ttgtgaaacc gcttgatgaa 5100 gcgttaattc tggaaatggc cgccagccat gaagcgctgg tcaccgtaga agaaaacgcc 5160 attatgggcg gcgcaggcag cggcgtgaac gaagtgctga tggcccatcg taaaccagta 5220 cccgtgctga acattggcct gccggacttc tttattccgc aaggaactca ggaagaaatg 5280 cgcgccgaac tcggcctcga tgccgctggt atggaagcca aaatcaaggc ctggctggca 5340 taactgcagc tggtaccata tgggaattcg aagctttcta gaacaaaaac tcatctcaga 5400 agaggatctg aatagcgccg tcgaccatca tcatcatcat cattgagttt aaacggtctc 5460 cagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat taaatcagaa 5520 cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt ggtcccacct 5580 gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc 5640 catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 5700 ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 5760 gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc 5820 ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt 5880 tctacaaact ctttttgttt atttttctaa atacattcaa atatgtatcc gcttaaccgg 5940 aattgccagc tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg 6000 ctttctcgcc gccaaggatc tgatggcgca ggggatcaag ctctgatcaa gagacaggat 6060 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 6120 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 6180 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 6240 ccctgaatga actgcaagac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 6300 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 6360 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 6420 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 6480 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 6540 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 6600 cgagcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 6660 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 6720 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 6780 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 6840 tctatcgcct tcttgacgag ttcttctgac gcatgaccaa aatcccttaa cgtgagtttt 6900 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 6960 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7020 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7080 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7140 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 7200 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 7260 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 7320 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 7380 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 7440 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 7500 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 7560 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 7620 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 7680 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 7740 ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg 7800 atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc 7860 gccccgacac ccgccaacac ccgctgacgc gccctgacgg gc 7902 <210> 52 <211> 6783 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 52 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 60 tggcgaatgg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 120 catatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca 180 cccgccaaca cccgctgacg agcttagtaa agccctcgct agattttaat gcggatgttg 240 cgattacttc gccaactatt gcgataacaa gaaaaagcca gcctttcatg atatatctcc 300 caatttgtgt agggcttatt atgcacgctt aaaaataata aaagcagact tgacctgata 360 gtttggctgt gagcaattat gtgcttagtg catctaacgc ttgagttaag ccgcgccgcg 420 aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg 480 cctttcacgt agtggacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct 540 tcttgtccaa gataagcctg tctagcttca agtatgacgg gctgatactg ggccggcagg 600 cgctccattg cccagtcggc agcgacatcc ttcggcgcga ttttgccggt tactgcgctg 660 taccaaatgc gggacaacgt aagcactaca tttcgctcat cgccagccca gtcgggcggc 720 gagttccata gcgttaaggt ttcatttagc gcctcaaata gatcctgttc aggaaccgga 780 tcaaagagtt cctccgccgc tggacctacc aaggcaacgc tatgttctct tgcttttgtc 840 agcaagatag ccagatcaat gtcgatcgtg gctggctcga agatacctgc aagaatgtca 900 ttgcgctgcc attctccaaa ttgcagttcg cgcttagctg gataacgcca cggaatgatg 960 tcgtcgtgca caacaatggt gacttctaca gcgcggagaa tctcgctctc tccaggggaa 1020 gccgaagttt ccaaaaggtc gttgatcaaa gctcgccgcg ttgtttcatc aagccttacg 1080 gtcaccgtaa ccagcaaatc aatatcactg tgtggcttca ggccgccatc cactgcggag 1140 ccgtacaaat gtacggccag caacgtcggt tcgagatggc gctcgatgac gccaactacc 1200 tctgatagtt gagtcgatac ttcggcgatc accgcttccc tcatgatgtt taactttgtt 1260 ttagggcgac tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc 1320 acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacccc aaaaaaacag 1380 tcataacaag ccatgaaaac cgccactgcg ccgttaccac cgctgcgttc ggtcaaggtt 1440 ctggaccagt tgcgtgagcg catacgctac ttgcattaca gcttacgaac cgaacaggct 1500 tatgtccact gggttcgtgc cttcatccgt ttccacggtg tgcgtcaccc ggcaaccttg 1560 ggcagcagcg aagtcgaggc atttctgtcc tggctggcga acgagcgcaa ggtttcggtc 1620 tccacgcatc gtcaggcatt ggcggccttg ctgttcttct acggcaaggt gctgtgcacg 1680 gatctgccct ggcttcagga gatcggaaga cctcggccgt cgcggcgctt gccggtggtg 1740 ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg aaggcgagca tcgtttgttc 1800 gcccagcttc tgtatggaac gggcatgcgg atcagtgagg gtttgcaact gcgggtcaag 1860 gatctggatt tcgatcacgg cacgatcatc gtgcgggagg gcaagggctc caaggatcgg 1920 gccttgatgt tacccgagag cttggcaccc agcctgcgcg agcaggggaa ttaattccca 1980 cgggttttgc tgcccgcaaa cgggctgttc tggtgttgct agtttgttat cagaatcgca 2040 gatccggctt cagccggttt gccggctgaa agcgctattt cttccagaat tgccatgatt 2100 ttttccccac gggaggcgtc actggctccc gtgttgtcgg cagctttgat tcgataagca 2160 gcatcgcctg tttcaggctg tctatgtgtg actgttgagc tgtaacaagt tgtctcaggt 2220 gttcaatttc atgttctagt tgctttgttt tactggtttc acctgttcta ttaggtgtta 2280 catgctgttc atctgttaca ttgtcgatct gttcatggtg aacagctttg aatgcaccaa 2340 aaactcgtaa aagctctgat gtatctatct tttttacacc gttttcatct gtgcatatgg 2400 acagttttcc ctttgatatg taacggtgaa cagttgttct acttttgttt gttagtcttg 2460 atgcttcact gatagataca agagccataa gaacctcaga tccttccgta tttagccagt 2520 atgttctcta gtgtggttcg ttgtttttgc gtgagccatg agaacgaacc attgagatca 2580 tacttacttt gcatgtcact caaaaatttt gcctcaaaac tggtgagctg aatttttgca 2640 gttaaagcat cgtgtagtgt ttttcttagt ccgttatgta ggtaggaatc tgatgtaatg 2700 gttgttggta ttttgtcacc attcattttt atctggttgt tctcaagttc ggttacgaga 2760 tccatttgtc tatctagttc aacttggaaa atcaacgtat cagtcgggcg gcctcgctta 2820 tcaaccacca atttcatatt gctgtaagtg tttaaatctt tacttattgg tttcaaaacc 2880 cattggttaa gccttttaaa ctcatggtag ttattttcaa gcattaacat gaacttaaat 2940 tcatcaaggc taatctctat atttgccttg tgagttttct tttgtgttag ttcttttaat 3000 aaccactcat aaatcctcat agagtatttg ttttcaaaag acttaacatg ttccagatta 3060 tattttatga atttttttaa ctggaaaaga taaggcaata tctcttcact aaaaactaat 3120 tctaattttt cgcttgagaa cttggcatag tttgtccact ggaaaatctc aaagccttta 3180 accaaaggat tcctgatttc cacagttctc gtcatcagct ctctggttgc tttagctaat 3240 acaccataag cattttccct actgatgttc atcatctgag cgtattggtt ataagtgaac 3300 gataccgtcc gttctttcct tgtagggttt tcaatcgtgg ggttgagtag tgccacacag 3360 cataaaatta gcttggtttc atgctccgtt aagtcatagc gactaatcgc tagttcattt 3420 gctttgaaaa caactaattc agacatacat ctcaattggt ctaggtgatt ttaatcacta 3480 taccaattga gatgggctag tcaatgataa ttactagtcc ttttcctttg agttgtgggt 3540 atctgtaaat tctgctagac ctttgctgga aaacttgtaa attctgctag accctctgta 3600 aattccgcta gacctttgtg tgtttttttt gtttatattc aagtggttat aatttataga 3660 ataaagaaag aataaaaaaa gataaaaaga atagatccca gccctgtgta taactcacta 3720 ctttagtcag ttccgcagta ttacaaaagg atgtcgcaaa cgctgtttgc tcctctacaa 3780 aacagacctt aaaaccctaa aggcttaagt agcaccctcg caagctcggg caaatcgctg 3840 aatattcctt ttgtctccga ccatcaggca cctgagtcgc tgtctttttc gtgacattca 3900 gttcgctgcg ctcacggctc tggcagtgaa tgggggtaaa tggcactaca ggcgcctttt 3960 atggattcat gcaaggaaac tacccataat acaagaaaag cccgtcacgg gcttctcagg 4020 gcgttttatg gcgggtctgc tatgtggtgc tatctgactt tttgctgttc agcagttcct 4080 gccctctgat tttccagtct gaccacttcg gattatcccg tgacaggtca ttcagactgg 4140 ctaatgcacc cagtaaggca gcggtatcat caacaggctt acccgtctta ctgtcgggaa 4200 ttcgcgttgg ccgattcatt aatgcagatt ctgaaatgag ctgttgacaa ttaatcatcc 4260 ggctcgtata atgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagcgccgc 4320 tgagaaaaag cgaagcggca ctgctcttta acaatttatc agacaatctg tgtgggcact 4380 cgaccggaat tatcgattaa ctttattatt aaaaattaaa gaggtatata ttaatgtatc 4440 gattaaataa ggaggaataa accatgtgtg cgacctcttc tcaatttact cagattaccg 4500 agcataattc ccgtcgttcc gcaaactatc agccaaacct gtggaatttc gaattcctgc 4560 aatccctgga gaacgacctg aaagtggaaa agctggagga gaaagcgacc aaactggagg 4620 aagaagttcg ctgcatgatc aaccgtgtag acacccagcc gctgtccctg ctggagctga 4680 tcgacgatgt gcagcgcctg ggtctgacct acaaatttga aaaagacatc attaaagccc 4740 tggaaaacat cgtactgctg gacgaaaaca aaaagaacaa atctgacctg cacgcaaccg 4800 ctctgtcttt ccgtctgctg cgtcagcacg gtttcgaggt ttctcaggat gtttttgagc 4860 gtttcaagga taaagaaggt ggtttcagcg gtgaactgaa aggtgacgtc caaggcctgc 4920 tgagcctgta tgaagcgtct tacctgggtt tcgagggtga gaacctgctg gaggaggcgc 4980 gtaccttttc catcacccac ctgaagaaca acctgaaaga aggcattaat accaaggttg 5040 cagaacaagt gagccacgcc ctggaactgc catatcacca gcgtctgcac cgtctggagg 5100 cacgttggtt cctggataaa tacgaaccga aagaaccgca tcaccagctg ctgctggagc 5160 tggcgaagct ggattttaac atggtacaga ccctgcacca gaaagagctg caagatctgt 5220 cccgctggtg gaccgagatg ggcctggcta gcaaactgga ttttgtacgc gaccgcctga 5280 tggaagttta tttctgggca ctgggtatgg cgccagaccc gcagtttggt gaatgtcgca 5340 aagctgttac taaaatgttt ggtctggtga cgatcatcga tgacgtgtat gacgtttatg 5400 gcactctgga cgaactgcaa ctgttcaccg atgctgtaga gcgctgggac gttaacgcta 5460 ttaacaccct gccggactat atgaaactgt gtttcctggc actgtacaac accgttaacg 5520 acacgtccta ttctattctg aaagagaaag gtcataacaa cctgtcctat ctgacgaaaa 5580 gctggcgtga actgtgcaaa gcctttctgc aagaggcgaa atggtccaac aacaaaatta 5640 tcccggcttt ctccaagtac ctggaaaacg ccagcgtttc ctcctccggt gtagcgctgc 5700 tggcgccgtc ttacttttcc gtatgccagc agcaggaaga catctccgac cacgcgctgc 5760 gttccctgac cgacttccat ggtctggtgc gttctagctg cgttatcttc cgcctgtgca 5820 acgatctggc cacctctgcg gcggagctgg aacgtggcga gactaccaat tctatcatta 5880 gctacatgca cgaaaacgat ggtaccagcg aggaacaggc ccgcgaagaa ctgcgtaaac 5940 tgatcgacgc cgaatggaaa aagatgaatc gtgaacgcgt tagcgactcc accctgctgc 6000 ctaaagcgtt catggaaatc gcagttaaca tggcacgtgt ttcccactgc acctaccagt 6060 atggcgatgg tctgggtcgc ccagactacg cgactgaaaa ccgcatcaaa ctgctgctga 6120 ttgacccttt cccgattaac cagctgatgt atgtctaact gcagctggta ccatatggga 6180 attcgaagct ttctagaaca aaaactcatc tcagaagagg atctgaatag cgccgtcgac 6240 catcatcatc atcatcattg agtttaaacg gtctccagct tggctgtttt ggcggatgag 6300 agaagatttt cagcctgata cagattaaat cagaacgcag aagcggtctg ataaaacaga 6360 atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac tcagaagtga 6420 aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg aactgccagg 6480 catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 6540 tcggtgaacg ctctcctgag taggacaaat ccgccgggag cggatttgaa cgttgcgaag 6600 caacggcccg gagggtggcg ggcaggacgc ccgccataaa ctgccaggca tcaaattaag 6660 cagaaggcca tcctgacgga tggccttttt gcgtttctac aaactctttt tgtttatttt 6720 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 6780 aat 6783 <210> 53 <211> 6783 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 53 cccgtcttac tgtcgggaat tcgcgttggc cgattcatta atgcagatta ttgaagcatt 60 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 120 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 180 gcctggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 240 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 300 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 360 cctactctcg catggggaga ccccacacta ccatcggcgc tacggcgttt cacttctgag 420 ttcggcatgg ggtcaggtgg gaccaccgcg ctactgccgc caggcaaatt ctgttttatc 480 agaccgcttc tgcgttctga tttaatctgt atcaggctga aaatcttctc tcatccgcca 540 aaacagccaa gctggagacc gtttaaactc aatgatgatg atgatgatgg tcgacggcgc 600 tattcagatc ctcttctgag atgagttttt gttctagaaa gcttcgaatt cccatatggt 660 accagctgca gttagacata catcagctgg ttaatcggga aagggtcaat cagcagcagt 720 ttgatgcggt tttcagtcgc gtagtctggg cgacccagac catcgccata ctggtaggtg 780 cagtgggaaa cacgtgccat gttaactgcg atttccatga acgctttagg cagcagggtg 840 gagtcgctaa cgcgttcacg attcatcttt ttccattcgg cgtcgatcag tttacgcagt 900 tcttcgcggg cctgttcctc gctggtacca tcgttttcgt gcatgtagct aatgatagaa 960 ttggtagtct cgccacgttc cagctccgcc gcagaggtgg ccagatcgtt gcacaggcgg 1020 aagataacgc agctagaacg caccagacca tggaagtcgg tcagggaacg cagcgcgtgg 1080 tcggagatgt cttcctgctg ctggcatacg gaaaagtaag acggcgccag cagcgctaca 1140 ccggaggagg aaacgctggc gttttccagg tacttggaga aagccgggat aattttgttg 1200 ttggaccatt tcgcctcttg cagaaaggct ttgcacagtt cacgccagct tttcgtcaga 1260 taggacaggt tgttatgacc tttctctttc agaatagaat aggacgtgtc gttaacggtg 1320 ttgtacagtg ccaggaaaca cagtttcata tagtccggca gggtgttaat agcgttaacg 1380 tcccagcgct ctacagcatc ggtgaacagt tgcagttcgt ccagagtgcc ataaacgtca 1440 tacacgtcat cgatgatcgt caccagacca aacattttag taacagcttt gcgacattca 1500 ccaaactgcg ggtctggcgc catacccagt gcccagaaat aaacttccat caggcggtcg 1560 cgtacaaaat ccagtttgct agccaggccc atctcggtcc accagcggga cagatcttgc 1620 agctctttct ggtgcagggt ctgtaccatg ttaaaatcca gcttcgccag ctccagcagc 1680 agctggtgat gcggttcttt cggttcgtat ttatccagga accaacgtgc ctccagacgg 1740 tgcagacgct ggtgatatgg cagttccagg gcgtggctca cttgttctgc aaccttggta 1800 ttaatgcctt ctttcaggtt gttcttcagg tgggtgatgg aaaaggtacg cgcctcctcc 1860 agcaggttct caccctcgaa acccaggtaa gacgcttcat acaggctcag caggccttgg 1920 acgtcacctt tcagttcacc gctgaaacca ccttctttat ccttgaaacg ctcaaaaaca 1980 tcctgagaaa cctcgaaacc gtgctgacgc agcagacgga aagacagagc ggttgcgtgc 2040 aggtcagatt tgttcttttt gttttcgtcc agcagtacga tgttttccag ggctttaatg 2100 atgtcttttt caaatttgta ggtcagaccc aggcgctgca catcgtcgat cagctccagc 2160 agggacagcg gctgggtgtc tacacggttg atcatgcagc gaacttcttc ctccagtttg 2220 gtcgctttct cctccagctt ttccactttc aggtcgttct ccagggattg caggaattcg 2280 aaattccaca ggtttggctg atagtttgcg gaacgacggg aattatgctc ggtaatctga 2340 gtaaattgag aagaggtcgc acacatggtt tattcctcct tatttaatcg atacattaat 2400 atatacctct ttaattttta ataataaagt taatcgataa ttccggtcga gtgcccacac 2460 agattgtctg ataaattgtt aaagagcagt gccgcttcgc tttttctcag cggcgctgtt 2520 tcctgtgtga aattgttatc cgctcacaat tccacacatt atacgagccg gatgattaat 2580 tgtcaacagc tcatttcaga atctggcgta atagcgaaga ggcccgcacc gatcgccctt 2640 cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc 2700 atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg 2760 catagttaag ccagccccga cacccgccaa cacccgctga cgagcttagt aaagccctcg 2820 ctagatttta atgcggatgt tgcgattact tcgccaacta ttgcgataac aagaaaaagc 2880 cagcctttca tgatatatct cccaatttgt gtagggctta ttatgcacgc ttaaaaataa 2940 taaaagcaga cttgacctga tagtttggct gtgagcaatt atgtgcttag tgcatctaac 3000 gcttgagtta agccgcgccg cgaagcggcg tcggcttgaa cgaattgtta gacattattt 3060 gccgactacc ttggtgatct cgcctttcac gtagtggaca aattcttcca actgatctgc 3120 gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc tgtctagctt caagtatgac 3180 gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc 3240 gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc 3300 atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa 3360 tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac 3420 gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc 3480 gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc 3540 tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag 3600 aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatca aagctcgccg 3660 cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa tcaatatcac tgtgtggctt 3720 caggccgcca tccactgcgg agccgtacaa atgtacggcc agcaacgtcg gttcgagatg 3780 gcgctcgatg acgccaacta cctctgatag ttgagtcgat acttcggcga tcaccgcttc 3840 cctcatgatg tttaactttg ttttagggcg actgccctgc tgcgtaacat cgttgctgct 3900 ccataacatc aaacatcgac ccacggcgta acgcgcttgc tgcttggatg cccgaggcat 3960 agactgtacc ccaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc 4020 accgctgcgt tcggtcaagg ttctggacca gttgcgtgag cgcatacgct acttgcatta 4080 cagcttacga accgaacagg cttatgtcca ctgggttcgt gccttcatcc gtttccacgg 4140 tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag gcatttctgt cctggctggc 4200 gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca ttggcggcct tgctgttctt 4260 ctacggcaag gtgctgtgca cggatctgcc ctggcttcag gagatcggaa gacctcggcc 4320 gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg gttcgcatcc tcggttttct 4380 ggaaggcgag catcgtttgt tcgcccagct tctgtatgga acgggcatgc ggatcagtga 4440 gggtttgcaa ctgcgggtca aggatctgga tttcgatcac ggcacgatca tcgtgcggga 4500 gggcaagggc tccaaggatc gggccttgat gttacccgag agcttggcac ccagcctgcg 4560 cgagcagggg aattaattcc cacgggtttt gctgcccgca aacgggctgt tctggtgttg 4620 ctagtttgtt atcagaatcg cagatccggc ttcagccggt ttgccggctg aaagcgctat 4680 ttcttccaga attgccatga ttttttcccc acgggaggcg tcactggctc ccgtgttgtc 4740 ggcagctttg attcgataag cagcatcgcc tgtttcaggc tgtctatgtg tgactgttga 4800 gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta gttgctttgt tttactggtt 4860 tcacctgttc tattaggtgt tacatgctgt tcatctgtta cattgtcgat ctgttcatgg 4920 tgaacagctt tgaatgcacc aaaaactcgt aaaagctctg atgtatctat cttttttaca 4980 ccgttttcat ctgtgcatat ggacagtttt ccctttgata tgtaacggtg aacagttgtt 5040 ctacttttgt ttgttagtct tgatgcttca ctgatagata caagagccat aagaacctca 5100 gatccttccg tatttagcca gtatgttctc tagtgtggtt cgttgttttt gcgtgagcca 5160 tgagaacgaa ccattgagat catacttact ttgcatgtca ctcaaaaatt ttgcctcaaa 5220 actggtgagc tgaatttttg cagttaaagc atcgtgtagt gtttttctta gtccgttatg 5280 taggtaggaa tctgatgtaa tggttgttgg tattttgtca ccattcattt ttatctggtt 5340 gttctcaagt tcggttacga gatccatttg tctatctagt tcaacttgga aaatcaacgt 5400 atcagtcggg cggcctcgct tatcaaccac caatttcata ttgctgtaag tgtttaaatc 5460 tttacttatt ggtttcaaaa cccattggtt aagcctttta aactcatggt agttattttc 5520 aagcattaac atgaacttaa attcatcaag gctaatctct atatttgcct tgtgagtttt 5580 cttttgtgtt agttctttta ataaccactc ataaatcctc atagagtatt tgttttcaaa 5640 agacttaaca tgttccagat tatattttat gaattttttt aactggaaaa gataaggcaa 5700 tatctcttca ctaaaaacta attctaattt ttcgcttgag aacttggcat agtttgtcca 5760 ctggaaaatc tcaaagcctt taaccaaagg attcctgatt tccacagttc tcgtcatcag 5820 ctctctggtt gctttagcta atacaccata agcattttcc ctactgatgt tcatcatctg 5880 agcgtattgg ttataagtga acgataccgt ccgttctttc cttgtagggt tttcaatcgt 5940 ggggttgagt agtgccacac agcataaaat tagcttggtt tcatgctccg ttaagtcata 6000 gcgactaatc gctagttcat ttgctttgaa aacaactaat tcagacatac atctcaattg 6060 gtctaggtga ttttaatcac tataccaatt gagatgggct agtcaatgat aattactagt 6120 ccttttcctt tgagttgtgg gtatctgtaa attctgctag acctttgctg gaaaacttgt 6180 aaattctgct agaccctctg taaattccgc tagacctttg tgtgtttttt ttgtttatat 6240 tcaagtggtt ataatttata gaataaagaa agaataaaaa aagataaaaa gaatagatcc 6300 cagccctgtg tataactcac tactttagtc agttccgcag tattacaaaa ggatgtcgca 6360 aacgctgttt gctcctctac aaaacagacc ttaaaaccct aaaggcttaa gtagcaccct 6420 cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg cacctgagtc 6480 gctgtctttt tcgtgacatt cagttcgctg cgctcacggc tctggcagtg aatgggggta 6540 aatggcacta caggcgcctt ttatggattc atgcaaggaa actacccata atacaagaaa 6600 agcccgtcac gggcttctca gggcgtttta tggcgggtct gctatgtggt gctatctgac 6660 tttttgctgt tcagcagttc ctgccctctg attttccagt ctgaccactt cggattatcc 6720 cgtgacaggt cattcagact ggctaatgca cccagtaagg cagcggtatc atcaacaggc 6780 tta 6783 <210> 54 <211> 7687 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 54 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 60 tggcgaatgg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 120 catatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca 180 cccgccaaca cccgctgacg agcttagtaa agccctcgct agattttaat gcggatgttg 240 cgattacttc gccaactatt gcgataacaa gaaaaagcca gcctttcatg atatatctcc 300 caatttgtgt agggcttatt atgcacgctt aaaaataata aaagcagact tgacctgata 360 gtttggctgt gagcaattat gtgcttagtg catctaacgc ttgagttaag ccgcgccgcg 420 aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg 480 cctttcacgt agtggacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct 540 tcttgtccaa gataagcctg tctagcttca agtatgacgg gctgatactg ggccggcagg 600 cgctccattg cccagtcggc agcgacatcc ttcggcgcga ttttgccggt tactgcgctg 660 taccaaatgc gggacaacgt aagcactaca tttcgctcat cgccagccca gtcgggcggc 720 gagttccata gcgttaaggt ttcatttagc gcctcaaata gatcctgttc aggaaccgga 780 tcaaagagtt cctccgccgc tggacctacc aaggcaacgc tatgttctct tgcttttgtc 840 agcaagatag ccagatcaat gtcgatcgtg gctggctcga agatacctgc aagaatgtca 900 ttgcgctgcc attctccaaa ttgcagttcg cgcttagctg gataacgcca cggaatgatg 960 tcgtcgtgca caacaatggt gacttctaca gcgcggagaa tctcgctctc tccaggggaa 1020 gccgaagttt ccaaaaggtc gttgatcaaa gctcgccgcg ttgtttcatc aagccttacg 1080 gtcaccgtaa ccagcaaatc aatatcactg tgtggcttca ggccgccatc cactgcggag 1140 ccgtacaaat gtacggccag caacgtcggt tcgagatggc gctcgatgac gccaactacc 1200 tctgatagtt gagtcgatac ttcggcgatc accgcttccc tcatgatgtt taactttgtt 1260 ttagggcgac tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc 1320 acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacccc aaaaaaacag 1380 tcataacaag ccatgaaaac cgccactgcg ccgttaccac cgctgcgttc ggtcaaggtt 1440 ctggaccagt tgcgtgagcg catacgctac ttgcattaca gcttacgaac cgaacaggct 1500 tatgtccact gggttcgtgc cttcatccgt ttccacggtg tgcgtcaccc ggcaaccttg 1560 ggcagcagcg aagtcgaggc atttctgtcc tggctggcga acgagcgcaa ggtttcggtc 1620 tccacgcatc gtcaggcatt ggcggccttg ctgttcttct acggcaaggt gctgtgcacg 1680 gatctgccct ggcttcagga gatcggaaga cctcggccgt cgcggcgctt gccggtggtg 1740 ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg aaggcgagca tcgtttgttc 1800 gcccagcttc tgtatggaac gggcatgcgg atcagtgagg gtttgcaact gcgggtcaag 1860 gatctggatt tcgatcacgg cacgatcatc gtgcgggagg gcaagggctc caaggatcgg 1920 gccttgatgt tacccgagag cttggcaccc agcctgcgcg agcaggggaa ttaattccca 1980 cgggttttgc tgcccgcaaa cgggctgttc tggtgttgct agtttgttat cagaatcgca 2040 gatccggctt cagccggttt gccggctgaa agcgctattt cttccagaat tgccatgatt 2100 ttttccccac gggaggcgtc actggctccc gtgttgtcgg cagctttgat tcgataagca 2160 gcatcgcctg tttcaggctg tctatgtgtg actgttgagc tgtaacaagt tgtctcaggt 2220 gttcaatttc atgttctagt tgctttgttt tactggtttc acctgttcta ttaggtgtta 2280 catgctgttc atctgttaca ttgtcgatct gttcatggtg aacagctttg aatgcaccaa 2340 aaactcgtaa aagctctgat gtatctatct tttttacacc gttttcatct gtgcatatgg 2400 acagttttcc ctttgatatg taacggtgaa cagttgttct acttttgttt gttagtcttg 2460 atgcttcact gatagataca agagccataa gaacctcaga tccttccgta tttagccagt 2520 atgttctcta gtgtggttcg ttgtttttgc gtgagccatg agaacgaacc attgagatca 2580 tacttacttt gcatgtcact caaaaatttt gcctcaaaac tggtgagctg aatttttgca 2640 gttaaagcat cgtgtagtgt ttttcttagt ccgttatgta ggtaggaatc tgatgtaatg 2700 gttgttggta ttttgtcacc attcattttt atctggttgt tctcaagttc ggttacgaga 2760 tccatttgtc tatctagttc aacttggaaa atcaacgtat cagtcgggcg gcctcgctta 2820 tcaaccacca atttcatatt gctgtaagtg tttaaatctt tacttattgg tttcaaaacc 2880 cattggttaa gccttttaaa ctcatggtag ttattttcaa gcattaacat gaacttaaat 2940 tcatcaaggc taatctctat atttgccttg tgagttttct tttgtgttag ttcttttaat 3000 aaccactcat aaatcctcat agagtatttg ttttcaaaag acttaacatg ttccagatta 3060 tattttatga atttttttaa ctggaaaaga taaggcaata tctcttcact aaaaactaat 3120 tctaattttt cgcttgagaa cttggcatag tttgtccact ggaaaatctc aaagccttta 3180 accaaaggat tcctgatttc cacagttctc gtcatcagct ctctggttgc tttagctaat 3240 acaccataag cattttccct actgatgttc atcatctgag cgtattggtt ataagtgaac 3300 gataccgtcc gttctttcct tgtagggttt tcaatcgtgg ggttgagtag tgccacacag 3360 cataaaatta gcttggtttc atgctccgtt aagtcatagc gactaatcgc tagttcattt 3420 gctttgaaaa caactaattc agacatacat ctcaattggt ctaggtgatt ttaatcacta 3480 taccaattga gatgggctag tcaatgataa ttactagtcc ttttcctttg agttgtgggt 3540 atctgtaaat tctgctagac ctttgctgga aaacttgtaa attctgctag accctctgta 3600 aattccgcta gacctttgtg tgtttttttt gtttatattc aagtggttat aatttataga 3660 ataaagaaag aataaaaaaa gataaaaaga atagatccca gccctgtgta taactcacta 3720 ctttagtcag ttccgcagta ttacaaaagg atgtcgcaaa cgctgtttgc tcctctacaa 3780 aacagacctt aaaaccctaa aggcttaagt agcaccctcg caagctcggg caaatcgctg 3840 aatattcctt ttgtctccga ccatcaggca cctgagtcgc tgtctttttc gtgacattca 3900 gttcgctgcg ctcacggctc tggcagtgaa tgggggtaaa tggcactaca ggcgcctttt 3960 atggattcat gcaaggaaac tacccataat acaagaaaag cccgtcacgg gcttctcagg 4020 gcgttttatg gcgggtctgc tatgtggtgc tatctgactt tttgctgttc agcagttcct 4080 gccctctgat tttccagtct gaccacttcg gattatcccg tgacaggtca ttcagactgg 4140 ctaatgcacc cagtaaggca gcggtatcat caacaggctt acccgtctta ctgtcgggaa 4200 ttcgcgttgg ccgattcatt aatgcagatt ctgaaatgag ctgttgacaa ttaatcatcc 4260 ggctcgtata atgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagcgccgc 4320 tgagaaaaag cgaagcggca ctgctcttta acaatttatc agacaatctg tgtgggcact 4380 cgaccggaat tatcgattaa ctttattatt aaaaattaaa gaggtatata ttaatgtatc 4440 gattaaataa ggaggaataa accatgtgtg cgacctcttc tcaatttact cagattaccg 4500 agcataattc ccgtcgttcc gcaaactatc agccaaacct gtggaatttc gaattcctgc 4560 aatccctgga gaacgacctg aaagtggaaa agctggagga gaaagcgacc aaactggagg 4620 aagaagttcg ctgcatgatc aaccgtgtag acacccagcc gctgtccctg ctggagctga 4680 tcgacgatgt gcagcgcctg ggtctgacct acaaatttga aaaagacatc attaaagccc 4740 tggaaaacat cgtactgctg gacgaaaaca aaaagaacaa atctgacctg cacgcaaccg 4800 ctctgtcttt ccgtctgctg cgtcagcacg gtttcgaggt ttctcaggat gtttttgagc 4860 gtttcaagga taaagaaggt ggtttcagcg gtgaactgaa aggtgacgtc caaggcctgc 4920 tgagcctgta tgaagcgtct tacctgggtt tcgagggtga gaacctgctg gaggaggcgc 4980 gtaccttttc catcacccac ctgaagaaca acctgaaaga aggcattaat accaaggttg 5040 cagaacaagt gagccacgcc ctggaactgc catatcacca gcgtctgcac cgtctggagg 5100 cacgttggtt cctggataaa tacgaaccga aagaaccgca tcaccagctg ctgctggagc 5160 tggcgaagct ggattttaac atggtacaga ccctgcacca gaaagagctg caagatctgt 5220 cccgctggtg gaccgagatg ggcctggcta gcaaactgga ttttgtacgc gaccgcctga 5280 tggaagttta tttctgggca ctgggtatgg cgccagaccc gcagtttggt gaatgtcgca 5340 aagctgttac taaaatgttt ggtctggtga cgatcatcga tgacgtgtat gacgtttatg 5400 gcactctgga cgaactgcaa ctgttcaccg atgctgtaga gcgctgggac gttaacgcta 5460 ttaacaccct gccggactat atgaaactgt gtttcctggc actgtacaac accgttaacg 5520 acacgtccta ttctattctg aaagagaaag gtcataacaa cctgtcctat ctgacgaaaa 5580 gctggcgtga actgtgcaaa gcctttctgc aagaggcgaa atggtccaac aacaaaatta 5640 tcccggcttt ctccaagtac ctggaaaacg ccagcgtttc ctcctccggt gtagcgctgc 5700 tggcgccgtc ttacttttcc gtatgccagc agcaggaaga catctccgac cacgcgctgc 5760 gttccctgac cgacttccat ggtctggtgc gttctagctg cgttatcttc cgcctgtgca 5820 acgatctggc cacctctgcg gcggagctgg aacgtggcga gactaccaat tctatcatta 5880 gctacatgca cgaaaacgat ggtaccagcg aggaacaggc ccgcgaagaa ctgcgtaaac 5940 tgatcgacgc cgaatggaaa aagatgaatc gtgaacgcgt tagcgactcc accctgctgc 6000 ctaaagcgtt catggaaatc gcagttaaca tggcacgtgt ttcccactgc acctaccagt 6060 atggcgatgg tctgggtcgc ccagactacg cgactgaaaa ccgcatcaaa ctgctgctga 6120 ttgacccttt cccgattaac cagctgatgt atgtctaact gcatcgccct taggaggtaa 6180 aaaaaaatga ctgccgacaa caatagtatg ccccatggtg cagtatctag ttacgccaaa 6240 ttagtgcaaa accaaacacc tgaagacatt ttggaagagt ttcctgaaat tattccatta 6300 caacaaagac ctaatacccg atctagtgag acgtcaaatg acgaaagcgg agaaacatgt 6360 ttttctggtc atgatgagga gcaaattaag ttaatgaatg aaaattgtat tgttttggat 6420 tgggacgata atgctattgg tgccggtacc aagaaagttt gtcatttaat ggaaaatatt 6480 gaaaagggtt tactacatcg tgcattctcc gtctttattt tcaatgaaca aggtgaatta 6540 cttttacaac aaagagccac tgaaaaaata actttccctg atctttggac taacacatgc 6600 tgctctcatc cactatgtat tgatgacgaa ttaggtttga agggtaagct agacgataag 6660 attaagggcg ctattactgc ggcggtgaga aaactagatc atgaattagg tattccagaa 6720 gatgaaacta agacaagggg taagtttcac tttttaaaca gaatccatta catggcacca 6780 agcaatgaac catggggtga acatgaaatt gattacatcc tattttataa gatcaacgct 6840 aaagaaaact tgactgtcaa cccaaacgtc aatgaagtta gagacttcaa atgggtttca 6900 ccaaatgatt tgaaaactat gtttgctgac ccaagttaca agtttacgcc ttggtttaag 6960 attatttgcg agaattactt attcaactgg tgggagcaat tagatgacct ttctgaagtg 7020 gaaaatgaca ggcaaattca tagaatgcta taacgacgcg tcctgcagct ggtaccatat 7080 gggaattcga agctttctag aacgaaaact catctcagaa gaggatctga atagcgccgt 7140 cgaccatcat catcatcatc attgagttta aacggtctcc agcttggctg ttttggcgga 7200 tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg tctgataaaa 7260 cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc gaactcagaa 7320 gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt agggaactgc 7380 caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg 7440 tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt tgaacgttgc 7500 gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca ggcatcaaat 7560 taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc tttttgttta 7620 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 7680 caataat 7687 <210> 55 <211> 8675 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 55 cccgtcttac tgtcgggaat tcgcgttggc cgattcatta atgcagatta ttgaagcatt 60 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 120 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 180 gcctggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 240 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 300 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 360 cctactctcg catggggaga ccccacacta ccatcggcgc tacggcgttt cacttctgag 420 ttcggcatgg ggtcaggtgg gaccaccgcg ctactgccgc caggcaaatt ctgttttatc 480 agaccgcttc tgcgttctga tttaatctgt atcaggctga aaatcttctc tcatccgcca 540 aaacagccaa gctggagacc gtttaaactc aatgatgatg atgatgatgg tcgacggcgc 600 tattcagatc ctcttctgag atgagttttt gttctagaaa gcttcgaatt cccatatggt 660 accagctgca gttatgccag ccaggccttg attttggctt ccataccagc ggcatcgagg 720 ccgagttcgg cgcgcatttc ttcctgagtt ccttgcggaa taaagaagtc cggcaggcca 780 atgttcagca cgggtactgg tttacgatgg gccatcagca cttcgttcac gccgctgcct 840 gcgccgccca taatggcgtt ttcttctacg gtgaccagcg cttcatggct ggcggccatt 900 tccagaatta acgcttcatc aagcggtttc acaaaacgca tatcgaccag cgtggcgttc 960 agcgattcgg cgactttcgc cgcttctggc atcagcgtac caaagttaag gatcgccagt 1020 ttctcgccac gacgcttcac aatgcctttg ccaattggta gtttttccag cggcgtcagt 1080 tccacgccga ccgcgttgcc acgcgggtag cgcaccgctg acgggccatc gttatagtga 1140 tagccggtat agagcatctg gcgacattcg ttttcatcgc tcggggtcat aatgaccatt 1200 tccggtatgc agcgcaggta agagagatca aaagcaccct gatgggtttg accgtcagca 1260 ccaacaatgc ccgcgcggtc gatggcgaac aggaccggaa gcttttgaat cgccacgtca 1320 tgcagcacct gatcataggc gcgttgcagg aaagtggagt aaatcgcgac aatgggtttg 1380 tacccaccaa tcgccagacc cgcagcaaag gtcaccgcgt gttgctcggc aattgccacg 1440 tcgaagtagc gatccgggaa tttacgtgaa aactcgacca tgccggaacc ttcacgcatc 1500 gccggagtaa tcgccatcag cttgttgtct ttcgctgccg tttcgcacaa ccagtcgcca 1560 aagatttttg aatagctcgg caaaccgccg ctacttttcg gcaaacaacc gctggaggga 1620 tcaaatttag gcacggcgtg gaaagtgatc gggtcttttt ctgccggttc ataaccacga 1680 ccttttttgg tcatgatatg caggaactgc gggcctttca ggtcgcgcat gttctttagc 1740 gtggtgataa gccccagcac atcgtgaccg tccaccgggc cgatgtagtt aaagcccagc 1800 tcttcaaaca acgtgccagg cactaccatg cctttaatat gttcttcggt gcgtttgagc 1860 agctctttaa ttggcggcac gccagagaaa acttttttcc cgccttcgcg cagtgaagag 1920 taaagcttac cggaaagcag ctgtgccaga tggttgttga gcgcgccgac attttcggaa 1980 atcgacattt cattgtcgtt gagaatcacc agcatatcag gacggatatc gcccgcgtga 2040 ttcatcgctt caaacgccat gcctgcggta atcgcgccat cgccaatgac acagacggtg 2100 cggcgatttt tgccttcttt ttcggcagca accgcaatac caattccggc actgatggag 2160 gttgatgaat gcccgacgct taatacgtca tattcgcttt cgccgcgcca cgggaacggg 2220 tgcagaccgc ctttctgacg gatggtgccg attttgtcgc ggcgtccggt caaaatttta 2280 tgcggataag cctgatgccc cacatcccaa atcaattggt caaacggggt gttgtagaca 2340 tagtgcagcg ccacggtcag ttcgaccgtg cccagcccgg aggcgaagtg cccgctggaa 2400 cggctcacgc tgtcgagtaa atagcggcgc agttcgtcgc agagtttcgg taaactctct 2460 ttcggcaaca gtcgtaactc ctgggtggag tcgaccagtg ccagggtcgg gtatttggca 2520 atatcaaaac tcatgttttt ttacctccta agggcgaatg cagttagaca tacatcagct 2580 ggttaatcgg gaaagggtca atcagcagca gtttgatgcg gttttcagtc gcgtagtctg 2640 ggcgacccag accatcgcca tactggtagg tgcagtggga aacacgtgcc atgttaactg 2700 cgatttccat gaacgcttta ggcagcaggg tggagtcgct aacgcgttca cgattcatct 2760 ttttccattc ggcgtcgatc agtttacgca gttcttcgcg ggcctgttcc tcgctggtac 2820 catcgttttc gtgcatgtag ctaatgatag aattggtagt ctcgccacgt tccagctccg 2880 ccgcagaggt ggccagatcg ttgcacaggc ggaagataac gcagctagaa cgcaccagac 2940 catggaagtc ggtcagggaa cgcagcgcgt ggtcggagat gtcttcctgc tgctggcata 3000 cggaaaagta agacggcgcc agcagcgcta caccggagga ggaaacgctg gcgttttcca 3060 ggtacttgga gaaagccggg ataattttgt tgttggacca tttcgcctct tgcagaaagg 3120 ctttgcacag ttcacgccag cttttcgtca gataggacag gttgttatga cctttctctt 3180 tcagaataga ataggacgtg tcgttaacgg tgttgtacag tgccaggaaa cacagtttca 3240 tatagtccgg cagggtgtta atagcgttaa cgtcccagcg ctctacagca tcggtgaaca 3300 gttgcagttc gtccagagtg ccataaacgt catacacgtc atcgatgatc gtcaccagac 3360 caaacatttt agtaacagct ttgcgacatt caccaaactg cgggtctggc gccataccca 3420 gtgcccagaa ataaacttcc atcaggcggt cgcgtacaaa atccagtttg ctagccaggc 3480 ccatctcggt ccaccagcgg gacagatctt gcagctcttt ctggtgcagg gtctgtacca 3540 tgttaaaatc cagcttcgcc agctccagca gcagctggtg atgcggttct ttcggttcgt 3600 atttatccag gaaccaacgt gcctccagac ggtgcagacg ctggtgatat ggcagttcca 3660 gggcgtggct cacttgttct gcaaccttgg tattaatgcc ttctttcagg ttgttcttca 3720 ggtgggtgat ggaaaaggta cgcgcctcct ccagcaggtt ctcaccctcg aaacccaggt 3780 aagacgcttc atacaggctc agcaggcctt ggacgtcacc tttcagttca ccgctgaaac 3840 caccttcttt atccttgaaa cgctcaaaaa catcctgaga aacctcgaaa ccgtgctgac 3900 gcagcagacg gaaagacaga gcggttgcgt gcaggtcaga tttgttcttt ttgttttcgt 3960 ccagcagtac gatgttttcc agggctttaa tgatgtcttt ttcaaatttg taggtcagac 4020 ccaggcgctg cacatcgtcg atcagctcca gcagggacag cggctgggtg tctacacggt 4080 tgatcatgca gcgaacttct tcctccagtt tggtcgcttt ctcctccagc ttttccactt 4140 tcaggtcgtt ctccagggat tgcaggaatt cgaaattcca caggtttggc tgatagtttg 4200 cggaacgacg ggaattatgc tcggtaatct gagtaaattg agaagaggtc gcacacatgg 4260 tttattcctc cttatttaat cgatacatta atatatacct ctttaatttt taataataaa 4320 gttaatcgat aattccggtc gagtgcccac acagattgtc tgataaattg ttaaagagca 4380 gtgccgcttc gctttttctc agcggcgctg tttcctgtgt gaaattgtta tccgctcaca 4440 attccacaca ttatacgagc cggatgatta attgtcaaca gctcatttca gaatctggcg 4500 taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga 4560 atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 4620 gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc 4680 aacacccgct gacgagctta gtaaagccct cgctagattt taatgcggat gttgcgatta 4740 cttcgccaac tattgcgata acaagaaaaa gccagccttt catgatatat ctcccaattt 4800 gtgtagggct tattatgcac gcttaaaaat aataaaagca gacttgacct gatagtttgg 4860 ctgtgagcaa ttatgtgctt agtgcatcta acgcttgagt taagccgcgc cgcgaagcgg 4920 cgtcggcttg aacgaattgt tagacattat ttgccgacta ccttggtgat ctcgcctttc 4980 acgtagtgga caaattcttc caactgatct gcgcgcgagg ccaagcgatc ttcttcttgt 5040 ccaagataag cctgtctagc ttcaagtatg acgggctgat actgggccgg caggcgctcc 5100 attgcccagt cggcagcgac atccttcggc gcgattttgc cggttactgc gctgtaccaa 5160 atgcgggaca acgtaagcac tacatttcgc tcatcgccag cccagtcggg cggcgagttc 5220 catagcgtta aggtttcatt tagcgcctca aatagatcct gttcaggaac cggatcaaag 5280 agttcctccg ccgctggacc taccaaggca acgctatgtt ctcttgcttt tgtcagcaag 5340 atagccagat caatgtcgat cgtggctggc tcgaagatac ctgcaagaat gtcattgcgc 5400 tgccattctc caaattgcag ttcgcgctta gctggataac gccacggaat gatgtcgtcg 5460 tgcacaacaa tggtgacttc tacagcgcgg agaatctcgc tctctccagg ggaagccgaa 5520 gtttccaaaa ggtcgttgat caaagctcgc cgcgttgttt catcaagcct tacggtcacc 5580 gtaaccagca aatcaatatc actgtgtggc ttcaggccgc catccactgc ggagccgtac 5640 aaatgtacgg ccagcaacgt cggttcgaga tggcgctcga tgacgccaac tacctctgat 5700 agttgagtcg atacttcggc gatcaccgct tccctcatga tgtttaactt tgttttaggg 5760 cgactgccct gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg 5820 taacgcgctt gctgcttgga tgcccgaggc atagactgta ccccaaaaaa acagtcataa 5880 caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac 5940 cagttgcgtg agcgcatacg ctacttgcat tacagcttac gaaccgaaca ggcttatgtc 6000 cactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc 6060 agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg 6120 catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg 6180 ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc 6240 ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag 6300 cttctgtatg gaacgggcat gcggatcagt gagggtttgc aactgcgggt caaggatctg 6360 gatttcgatc acggcacgat catcgtgcgg gagggcaagg gctccaagga tcgggccttg 6420 atgttacccg agagcttggc acccagcctg cgcgagcagg ggaattaatt cccacgggtt 6480 ttgctgcccg caaacgggct gttctggtgt tgctagtttg ttatcagaat cgcagatccg 6540 gcttcagccg gtttgccggc tgaaagcgct atttcttcca gaattgccat gattttttcc 6600 ccacgggagg cgtcactggc tcccgtgttg tcggcagctt tgattcgata agcagcatcg 6660 cctgtttcag gctgtctatg tgtgactgtt gagctgtaac aagttgtctc aggtgttcaa 6720 tttcatgttc tagttgcttt gttttactgg tttcacctgt tctattaggt gttacatgct 6780 gttcatctgt tacattgtcg atctgttcat ggtgaacagc tttgaatgca ccaaaaactc 6840 gtaaaagctc tgatgtatct atctttttta caccgttttc atctgtgcat atggacagtt 6900 ttccctttga tatgtaacgg tgaacagttg ttctactttt gtttgttagt cttgatgctt 6960 cactgataga tacaagagcc ataagaacct cagatccttc cgtatttagc cagtatgttc 7020 tctagtgtgg ttcgttgttt ttgcgtgagc catgagaacg aaccattgag atcatactta 7080 ctttgcatgt cactcaaaaa ttttgcctca aaactggtga gctgaatttt tgcagttaaa 7140 gcatcgtgta gtgtttttct tagtccgtta tgtaggtagg aatctgatgt aatggttgtt 7200 ggtattttgt caccattcat ttttatctgg ttgttctcaa gttcggttac gagatccatt 7260 tgtctatcta gttcaacttg gaaaatcaac gtatcagtcg ggcggcctcg cttatcaacc 7320 accaatttca tattgctgta agtgtttaaa tctttactta ttggtttcaa aacccattgg 7380 ttaagccttt taaactcatg gtagttattt tcaagcatta acatgaactt aaattcatca 7440 aggctaatct ctatatttgc cttgtgagtt ttcttttgtg ttagttcttt taataaccac 7500 tcataaatcc tcatagagta tttgttttca aaagacttaa catgttccag attatatttt 7560 atgaattttt ttaactggaa aagataaggc aatatctctt cactaaaaac taattctaat 7620 ttttcgcttg agaacttggc atagtttgtc cactggaaaa tctcaaagcc tttaaccaaa 7680 ggattcctga tttccacagt tctcgtcatc agctctctgg ttgctttagc taatacacca 7740 taagcatttt ccctactgat gttcatcatc tgagcgtatt ggttataagt gaacgatacc 7800 gtccgttctt tccttgtagg gttttcaatc gtggggttga gtagtgccac acagcataaa 7860 attagcttgg tttcatgctc cgttaagtca tagcgactaa tcgctagttc atttgctttg 7920 aaaacaacta attcagacat acatctcaat tggtctaggt gattttaatc actataccaa 7980 ttgagatggg ctagtcaatg ataattacta gtccttttcc tttgagttgt gggtatctgt 8040 aaattctgct agacctttgc tggaaaactt gtaaattctg ctagaccctc tgtaaattcc 8100 gctagacctt tgtgtgtttt ttttgtttat attcaagtgg ttataattta tagaataaag 8160 aaagaataaa aaaagataaa aagaatagat cccagccctg tgtataactc actactttag 8220 tcagttccgc agtattacaa aaggatgtcg caaacgctgt ttgctcctct acaaaacaga 8280 ccttaaaacc ctaaaggctt aagtagcacc ctcgcaagct cgggcaaatc gctgaatatt 8340 ccttttgtct ccgaccatca ggcacctgag tcgctgtctt tttcgtgaca ttcagttcgc 8400 tgcgctcacg gctctggcag tgaatggggg taaatggcac tacaggcgcc ttttatggat 8460 tcatgcaagg aaactaccca taatacaaga aaagcccgtc acgggcttct cagggcgttt 8520 tatggcgggt ctgctatgtg gtgctatctg actttttgct gttcagcagt tcctgccctc 8580 tgattttcca gtctgaccac ttcggattat cccgtgacag gtcattcaga ctggctaatg 8640 cacccagtaa ggcagcggta tcatcaacag gctta 8675 <210> 56 <211> 8032 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 56 tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 60 cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 120 aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 180 gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 240 agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 300 cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 360 cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 420 ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 480 gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 540 tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 600 acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 660 tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 720 attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 780 gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 840 ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 900 taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 960 ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 1020 ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 1080 gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 1140 ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 1200 gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 1260 tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 1320 atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 1380 gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 1440 tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 1500 atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 1560 agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 1620 ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 1680 tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 1740 aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 1800 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 1860 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 1920 accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 1980 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2040 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2100 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2160 catagatctg gagctgtaat ataaaaacct tcttcaacta acggggcagg ttagtgacat 2220 tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa gccagtcatt 2280 aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat aaccatcaca 2340 aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt tattaatgaa 2400 ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat ttaagttaaa 2460 cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag gtataggtgt 2520 tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt ataaatcata 2580 aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt tagatacacc 2640 atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc cgtcgctatt 2700 gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga aaataaatgc 2760 agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa tatcaatttc 2820 tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct cttttctctt 2880 ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa tttttatcta 2940 aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc ttttttaaaa 3000 gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ccaattttcg 3060 tttgttgaac taatgggtgc tttagttgaa gaataaaaga cctatgcggt gtgaaatacc 3120 gcacagatgc gtaaggagaa aataccgcat caggcgccat tcgccattca ggctgcgcaa 3180 ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg 3240 atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa 3300 aacgacggcc agtgccaagc ttgcatgcct gcactccatt ttcttctgct atcaaaataa 3360 cagactcgtg attttccaaa cgagctttca aaaaagcctc tgccccttgc aaatcggatg 3420 cctgtctata aaattcccga tattggttaa acagcggcgc aatggcggcc gcatctgatg 3480 tctttgcttg gcgaatgttc atcttatttc ttcctccctc tcaataattt tttcattcta 3540 tcccttttct gtaaagttta tttttcagaa tacttttatc atcatgcttt gaaaaaatat 3600 cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 3660 acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 3720 tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 3780 ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 3840 gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 3900 tctactctga atttttttaa aaggagaggg taaagagtga aaacagtagt tattattgat 3960 gcattacgaa caccaattgg aaaatataaa ggcagcttaa gtcaagtaag tgccgtagac 4020 ttaggaacac atgttacaac acaactttta aaaagacatt ccactatttc tgaagaaatt 4080 gatcaagtaa tctttggaaa tgttttacaa gctggaaatg gccaaaatcc cgcacgacaa 4140 atagcaataa acagcggttt gtctcatgaa attcccgcaa tgacggttaa tgaggtctgc 4200 ggatcaggaa tgaaggccgt tattttggcg aaacaattga ttcaattagg agaagcggaa 4260 gttttaattg ctggcgggat tgagaatatg tcccaagcac ctaaattaca acgttttaat 4320 tacgaaacag aaagctacga tgcgcctttt tctagtatga tgtatgatgg attaacggat 4380 gcctttagtg gtcaggcaat gggcttaact gctgaaaatg tggccgaaaa gtatcatgta 4440 actagagaag agcaagatca attttctgta cattcacaat taaaagcagc tcaagcacaa 4500 gcagaaggga tattcgctga cgaaatagcc ccattagaag tatcaggaac gcttgtggag 4560 aaagatgaag ggattcgccc taattcgagc gttgagaagc taggaacgct taaaacagtt 4620 tttaaagaag acggtactgt aacagcaggg aatgcatcaa ccattaatga tggggcttct 4680 gctttgatta ttgcttcaca agaatatgcc gaagcacacg gtcttcctta tttagctatt 4740 attcgagaca gtgtggaagt cggtattgat ccagcctata tgggaatttc gccgattaaa 4800 gccattcaaa aactgttagc gcgcaatcaa cttactacgg aagaaattga tctgtatgaa 4860 atcaacgaag catttgcagc aacttcaatc gtggtccaaa gagaactggc tttaccagag 4920 gaaaaggtca acatttatgg tggcggtatt tcattaggtc atgcgattgg tgccacaggt 4980 gctcgtttat taacgagttt aagttatcaa ttaaatcaaa aagaaaagaa atatggagtg 5040 gcttctttat gtatcggcgg tggcttagga ctcgctatgc tactagagag acctcagcaa 5100 aaaaaaaaca gccgatttta tcaaatgagt cctgaggaac gcctggcttc tcttcttaat 5160 gaaggccaga tttctgctga tacaaaaaaa gaatttgaaa atacggcttt atcttcgcag 5220 attgccaatc atatgattga aaatcaaatc agtgaaacag aagtgccgat gggcgttggc 5280 ttacatttaa cagtggacga aactgattat ttggtaccaa tggcgacaga agagccctca 5340 gttattgcgg ctttgagtaa tggtgcaaaa atagcacaag gatttaaaac agtgaatcaa 5400 caacgcttaa tgcgtggaca aatcgttttt tacgatgttg cagatcccga gtcattgatt 5460 gataaactac aagtaagaga agcggaagtt tttcaacaag cagagttaag ttatccatct 5520 atcgttaaac ggggcggcgg cttaagagat ttgcaatatc gtacttttga tgaatcattt 5580 gtatctgtcg actttttagt agatgttaag gatgcaatgg gggcaaatat cgttaacgct 5640 atgttggaag gtgtggccga gttgttccgt gaatggtttg cggagcaaaa gattttattc 5700 agtattttaa gtaattatgc cacggagtcg gttgttacga tgaaaacggc tattccagtt 5760 tcacgtttaa gtaaggggag caatggccgg gaaattgctg aaaaaattgt tttagcttca 5820 cgctatgctt cattagatcc ttatcgggca gtcacgcata acaaaggaat catgaatggc 5880 attgaagctg tagttttagc tacaggaaat gatacacgcg ctgttagcgc ttcttgtcat 5940 gcttttgcgg tgaaggaagg tcgctaccaa ggcttgacta gttggacgct ggatggcgaa 6000 caactaattg gtgaaatttc agttccgctt gctttagcca cggttggcgg tgccacaaaa 6060 gtcttaccta aatctcaagc agctgctgat ttgttagcag tgacggatgc aaaagaacta 6120 agtcgagtag tagcggctgt tggtttggca caaaatttag cggcgttacg ggccttagtc 6180 tctgaaggaa ttcaaaaagg acacatggct ctacaagcac gttctttagc gatgacggtc 6240 ggagctactg gtaaagaagt tgaggcagtc gctcaacaat taaaacgtca aaaaacgatg 6300 aaccaagacc gagccatggc tattttaaat gatttaagaa aacaataaaa ggagagggtg 6360 acaattggga ttgataaaat tagttttttt gtgccccctt attatattga tatgacggca 6420 ctggctgaag ccagaaatgt agaccctgga aaatttcata ttggtattgg gcaagaccaa 6480 atggcggtga acccaatcag ccaagatatt gtgacatttg cagccaatgc cgcagaagcg 6540 atcttgacca aagaagataa agaggccatt gatatggtga ttgtcgggac tgagtccagt 6600 atcgatgagt caaaagcggc cgcagttgtc ttacatcgtt taatggggat tcaacctttc 6660 gctcgctctt tcgaaatcaa ggaagcttgt tacggagcaa cagcaggctt acagttagct 6720 aagaatcacg tagccttaca tccagataaa aaagtcttgg tcgtagcggc agatattgca 6780 aaatatggct taaattctgg cggtgagcct acacaaggag ctggggcggt tgcaatgtta 6840 gttgctagtg aaccgcgcat tttggcttta aaagaggata atgtgatgct gacgcaagat 6900 atctatgact tttggcgtcc aacaggccac ccgtatccta tggtcgatgg tcctttgtca 6960 aacgaaacct acatccaatc ttttgcccaa gtctgggatg aacataaaaa acgaaccggt 7020 cttgattttg cagattatga tgctttagcg ttccatattc cttacacaaa aatgggcaaa 7080 aaagccttat tagcaaaaat ctccgaccaa actgaagcag aacaggaacg aattttagcc 7140 cgttatgaag aaagtatcgt ctatagtcgt cgcgtaggaa acttgtatac gggttcactt 7200 tatctgggac tcatttccct tttagaaaat gcaacgactt taaccgcagg caatcaaatt 7260 ggtttattca gttatggttc tggtgctgtc gctgaatttt tcactggtga attagtagct 7320 ggttatcaaa atcatttaca aaaagaaact catttagcac tgctggataa tcggacagaa 7380 ctttctatcg ctgaatatga agccatgttt gcagaaactt tagacacaga cattgatcaa 7440 acgttagaag atgaattaaa atatagtatt tctgctatta ataataccgt tcgttcttat 7500 cgaaactaaa aaaaaccggc cttggccccg ccggtttttt attatttttc ttcctccgca 7560 tgttcaatcc gctccataat cgacggatgg ctccctctga aaattttaac gagaaacggc 7620 gggttgaccc ggctcagtcc cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc 7680 cggtttccgg tcagctcaat gccgtaacgg tcggcggcgt tttcctgata ccgggagacg 7740 gcattcgtaa tcgggatccc cgggtaccga gctcgaattc gtaatcatgt catagctgtt 7800 tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 7860 gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 7920 gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 7980 ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg ac 8032 <210> 57 <211> 6592 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 57 gaattgctcc attttcttct gctatcaaaa taacagactc gtgattttcc aaacgagctt 60 tcaaaaaagc ctctgcccct tgcaaatcgg atgcctgtct ataaaattcc cgatattggt 120 taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180 ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240 gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300 agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360 tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420 tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480 ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540 acaataaatt cacagaatag tcttttaagt aagtctactc tgaatttttt taaaaggaga 600 gggtaaagag tgtgtgcgac ctcttctcaa tttactcaga ttaccgagca taattcccgt 660 cgttccgcaa actatcagcc aaacctgtgg aatttcgaat tcctgcaatc cctggagaac 720 gacctgaaag tggaaaagct ggaggagaaa gcgaccaaac tggaggaaga agttcgctgc 780 atgatcaacc gtgtagacac ccagccgctg tccctgctgg agctgatcga cgatgtgcag 840 cgcctgggtc tgacctacaa atttgaaaaa gacatcatta aagccctgga aaacatcgta 900 ctgctggacg aaaacaaaaa gaacaaatct gacctgcacg caaccgctct gtctttccgt 960 ctgctgcgtc agcacggttt cgaggtttct caggatgttt ttgagcgttt caaggataaa 1020 gaaggtggtt tcagcggtga actgaaaggt gacgtccaag gcctgctgag cctgtatgaa 1080 gcgtcttacc tgggtttcga gggtgagaac ctgctggagg aggcgcgtac cttttccatc 1140 acccacctga agaacaacct gaaagaaggc attaatacca aggttgcaga acaagtgagc 1200 cacgccctgg aactgccata tcaccagcgt ctgcaccgtc tggaggcacg ttggttcctg 1260 gataaatacg aaccgaaaga accgcatcac cagctgctgc tggagctggc gaagctggat 1320 tttaacatgg tacagaccct gcaccagaaa gagctgcaag atctgtcccg ctggtggacc 1380 gagatgggcc tggctagcaa actggatttt gtacgcgacc gcctgatgga agtttatttc 1440 tgggcactgg gtatggcgcc agacccgcag tttggtgaat gtcgcaaagc tgttactaaa 1500 atgtttggtc tggtgacgat catcgatgac gtgtatgacg tttatggcac tctggacgaa 1560 ctgcaactgt tcaccgatgc tgtagagcgc tgggacgtta acgctattaa caccctgccg 1620 gactatatga aactgtgttt cctggcactg tacaacaccg ttaacgacac gtcctattct 1680 attctgaaag agaaaggtca taacaacctg tcctatctga cgaaaagctg gcgtgaactg 1740 tgcaaagcct ttctgcaaga ggcgaaatgg tccaacaaca aaattatccc ggctttctcc 1800 aagtacctgg aaaacgccag cgtttcctcc tccggtgtag cgctgctggc gccgtcttac 1860 ttttccgtat gccagcagca ggaagacatc tccgaccacg cgctgcgttc cctgaccgac 1920 ttccatggtc tggtgcgttc tagctgcgtt atcttccgcc tgtgcaacga tctggccacc 1980 tctgcggcgg agctggaacg tggcgagact accaattcta tcattagcta catgcacgaa 2040 aacgatggta ccagcgagga acaggcccgc gaagaactgc gtaaactgat cgacgccgaa 2100 tggaaaaaga tgaatcgtga acgcgttagc gactccaccc tgctgcctaa agcgttcatg 2160 gaaatcgcag ttaacatggc acgtgtttcc cactgcacct accagtatgg cgatggtctg 2220 ggtcgcccag actacgcgac tgaaaaccgc atcaaactgc tgctgattga ccctttcccg 2280 attaaccagc tgatgtatgt ctaaaaaaaa ccggccttgg ccccgccggt tttttattat 2340 ttttcttcct ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt 2400 ttaacgagaa acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc 2460 tcaatcgccg cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc 2520 tgataccggg agacggcatt cgtaatcgga tcctctagag tcgacctgca ggcatgcaag 2580 ctttgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 2640 acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca 2700 gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg 2760 tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt 2820 gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct 2880 cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 2940 aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 3000 aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 3060 tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 3120 caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 3180 cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 3240 ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 3300 gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 3360 agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 3420 gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 3480 acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 3540 gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 3600 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 3660 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 3720 caaaaaggat cgaagtcggt tcagaaaaag aaggatatgg atctggagct gtaatataaa 3780 aaccttcttc aactaacggg gcaggttagt gacattagaa aaccgactgt aaaaagtaca 3840 gtcggcatta tctcatatta taaaagccag tcattaggcc tatctgacaa ttcctgaata 3900 gagttcataa acaatcctgc atgataacca tcacaaacag aatgatgtac ctgtaaagat 3960 agcggtaaat atattgaatt acctttatta atgaattttc ctgctgtaat aatgggtaga 4020 aggtaattac tattattatt gatatttaag ttaaacccag taaatgaagt ccatggaata 4080 atagaaagag aaaaagcatt ttcaggtata ggtgttttgg gaaacaattt aaaagaacca 4140 ttatatttct ctacatcaga aaggtataaa tcataaaact ctttgaagtc attctttaca 4200 ggagtccaaa taccagagaa tgttttagat acaccatcaa aaattgtata aagtggctct 4260 aacttatccc aataacctaa ctctccgtcg ctattgtaac cagttctaaa agctgtattt 4320 gagtttatca cccttgtcac taagaaaata aatgcagggt aaaatttata tccttcttgt 4380 tttatgtttc ggtataaaac actaatatca atttctgtgg ttatactaaa agtcgtttgt 4440 tggttcaaat aatgattaaa tatctctttt ctcttccaat tgtctaaatc aattttatta 4500 aagttcattt gatatgcctc ctaaattttt atctaaagtg aatttaggag gcttacttgt 4560 ctgctttctt cattagaatc aatccttttt taaagtcaat attactgtaa cataaatata 4620 tattttaaaa atatcccact ttatccaatt ttcgtttgtt gaactaatgg gtgctttagt 4680 tgaagaataa agaccacatt aaaaaatgtg gtcttttgtg tttttttaaa ggatttgagc 4740 gtacgcgaaa aatccttttc tttctttctt atcttgataa taagggtaac tattgccggt 4800 tgtccattca tggctgaact ctgcttcctc tgttgacatg acacacatca tctcaatatc 4860 cgaatagggc ccatcagtct gacgaccaag agagccataa acaccaatag ccttaacatc 4920 atccccatat ttatccaata ttcgttcctt aatttcatga acaatcttca ttctttcttc 4980 tctagtcatt attattggtc cattcactat tctcattccc ttttcagata attttagatt 5040 tgcttttcta aataagaata tttggagagc accgttctta ttcagctatt aataactcgt 5100 cttcctaagc atccttcaat ccttttaata acaattatag catctaatct tcaacaaact 5160 ggcccgtttg ttgaactact ctttaataaa ataatttttc cgttcccaat tccacattgc 5220 aataatagaa aatccatctt catcggcttt ttcgtcatca tctgtatgaa tcaaatcgcc 5280 ttcttctgtg tcatcaaggt ttaatttttt atgtatttct tttaacaaac caccatagga 5340 gattaacctt ttacggtgta aaccttcctc caaatcagac aaacgtttca aattcttttc 5400 ttcatcatcg gtcataaaat ccgtatcctt tacaggatat tttgcagttt cgtcaattgc 5460 cgattgtata tccgatttat atttattttt cggtcgaatc atttgaactt ttacatttgg 5520 atcatagtct aatttcattg cctttttcca aaattgaatc cattgttttt gattcacgta 5580 gttttctgtt attctaaaat aagttggttc cacacatacc attacatgca tgtgctgatt 5640 ataagaatta tctttattat ttattgtcac atccgttgca cgcataaaac caacaagatt 5700 tttattaatt tttttatatt gcatcattcg gcgaaatcct tgagccatat ctgtcaaact 5760 cttatttaat tcttcgccat cataaacatt tttaactgtt aatgtgagaa acaaccaacg 5820 aactgttggc ttttgtttaa taacttcagc aacaaccttt tgtgactgaa tgccatgttt 5880 cattgctctc ctccagttgc acattggaca aagcctggat ttgcaaaacc acactcgata 5940 ccactttctt tcgcctgttt cacgattttg tttatactct aatatttcag cacaatcttt 6000 tactctttca gcctttttaa attcaagaat atgcagaagt tcaaagtaat caacattagc 6060 gattttcttt tctctccatg gtctcacttt tccacttttt gtcttgtcca ctaaaaccct 6120 tgatttttca tctgaataaa tgctactatt aggacacata atattaaaag aaacccccat 6180 ctatttagtt atttgtttag tcacttataa ctttaacaga tggggttttt ctgtgcaacc 6240 aattttaagg gttttcaata ctttaaaaca catacatacc aacacttcaa cgcacctttc 6300 agcaactaaa ataaaaatga cgttatttct atatgtatca agataagaaa gaacaagttc 6360 aaaaccatca aaaaaagaca ccttttcagg tgcttttttt attttataaa ctcattccct 6420 gatctcgact tcgttctttt tttacctctc ggttatgagt tagttcaaat tcgttctttt 6480 taggttctaa atcgtgtttt tcttggaatt gtgctgtttt atcctttacc ttgtctacaa 6540 accccttaaa aacgttttta aaggctttta agccgtctgt acgttcctta ag 6592 <210> 58 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 58 gacatcaatt gctccatttt cttctgctat c 31 <210> 59 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 59 attgagaaga ggtcgcacac actctttacc ctctccttt 39 <210> 60 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 60 taaaaggaga gggtaaagag tgtgtgcgac ctcttctcaa t 41 <210> 61 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 61 ccaaggccgg ttttttttag acatacatca gctggttaat c 41 <210> 62 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 62 gattaaccag ctgatgtatg tctaaaaaaa accggccttg g 41 <210> 63 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 63 gacatgacgg atccgattac gaatgccgtc tc 32 <210> 64 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 64 gacatcaatt gctccatttt cttctgctat c 31 <210> 65 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 65 gacatgaatt cctccatttt cttctgc 27 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 66 aggagagggt aaagagtgag 20 <210> 67 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 67 cttttccatc acccacctga ag 22 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 68 ggcgaaatgg tccaacaaca aaattatc 28 <210> 69 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 69 ggtgaattca gtctactggg gattcccaaa tctatatata ctgcaggtga c 51 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 70 gcaggtggga aactatgcac tcc 23 <210> 71 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 71 cctgaattct gttggattgg aggattggat agtggg 36 <210> 72 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 72 ggtgtcgacg tacggtcgag cttattgacc 30 <210> 73 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 73 ggtgggcccg cattttgcca cctacaagcc ag 32 <210> 74 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 74 ggtgaattct agaggatccc aacgctgttg cctacaacgg 40 <210> 75 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 75 ggtgcggccg ctgtctggac ctggtgagtt tccccg 36 <210> 76 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 76 ggtgggccca ttaaatcagt tatcgtttat ttgatag 37 <210> 77 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 77 ggtgaccagc aagtccatgg gtggtttgat catgg 35 <210> 78 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 78 ggtgcggccg cctttggagt acgactccaa ctatg 35 <210> 79 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 79 gcggccgcag actaaattta tttcagtctc c 31 <210> 80 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 80 aggaggt 7 <210> 81 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 81 aaggagg 7 <210> 82 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 82 gacatctgca gctccatttt cttctgc 27 <210> 83 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 83 caataataac tactgttttc actctttacc ctctcctttt aa 42 <210> 84 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 84 ttaaaaggag agggtaaaga gtgaaaacag tagttattat tg 42 <210> 85 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 85 cggggccaag gccggttttt tttagtttcg ataagaacga acggt 45 <210> 86 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 86 accgttcgtt cttatcgaaa ctaaaaaaaa ccggccttgg ccccg 45 <210> 87 <211> 6957 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 87 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatctc gatcccgcga 4980 aattaatacg actcactata ggggaattgt gagcggataa caattcccct ctagaaataa 5040 ttttgtttaa ctttaagaag gagatataca tatgcgttgt agcgtgtcca ccgaaaatgt 5100 gtctttcacc gaaactgaaa ccgaagctcg tcgttctgcg aactacgaac ctaacagctg 5160 ggactatgat tacctgctgt cctccgacac ggacgagtcc atcgaagtat acaaagacaa 5220 agcgaaaaag ctggaagccg aagttcgtcg cgagattaat aacgaaaaag cagaatttct 5280 gaccctgctg gaactgattg acaacgtcca gcgcctgggc ctgggttacc gtttcgagtc 5340 tgatatccgt ggtgcgctgg atcgcttcgt ttcctccggc ggcttcgatg cggtaaccaa 5400 gacttccctg cacggtacgg cactgtcttt ccgtctgctg cgtcaacacg gttttgaggt 5460 ttctcaggaa gcgttcagcg gcttcaaaga ccaaaacggc aacttcctgg agaacctgaa 5520 ggaagatatc aaagctatcc tgagcctgta cgaggccagc ttcctggctc tggaaggcga 5580 aaacatcctg gacgaggcga aggttttcgc aatctctcat ctgaaagaac tgtctgaaga 5640 aaagatcggt aaagagctgg cagaacaggt gaaccatgca ctggaactgc cactgcatcg 5700 ccgtactcag cgtctggaag cagtatggtc tatcgaggcc taccgtaaaa aggaggacgc 5760 gaatcaggtt ctgctggagc tggcaattct ggattacaac atgatccagt ctgtatacca 5820 gcgtgatctg cgtgaaacgt cccgttggtg gcgtcgtgtg ggtctggcga ccaaactgca 5880 ctttgctcgt gaccgcctga ttgagagctt ctactgggcc gtgggtgtag cattcgaacc 5940 gcaatactcc gactgccgta actccgtcgc aaaaatgttt tctttcgtaa ccattatcga 6000 cgatatctac gatgtatacg gcaccctgga cgaactggag ctgtttactg atgcagttga 6060 gcgttgggac gtaaacgcca tcaacgacct gccggattac atgaaactgt gctttctggc 6120 tctgtataac actattaacg aaatcgccta cgacaacctg aaagataaag gtgagaacat 6180 cctgccgtat ctgaccaaag cctgggctga cctgtgcaac gctttcctgc aagaagccaa 6240 gtggctgtac aacaaatcta ctccgacctt tgacgactac ttcggcaacg catggaaatc 6300 ctcttctggc ccgctgcaac tggtgttcgc ttacttcgct gtcgtgcaga acattaaaaa 6360 ggaagagatc gaaaacctgc aaaaatacca tgacaccatc tctcgtcctt cccatatctt 6420 ccgtctgtgc aatgacctgg ctagcgcgtc tgcggaaatt gcgcgtggtg aaaccgcaaa 6480 tagcgtttct tgttacatgc gcactaaagg tatctccgaa gaactggcta ccgaaagcgt 6540 gatgaatctg atcgatgaaa cctggaaaaa gatgaacaag gaaaaactgg gtggtagcct 6600 gttcgcgaaa ccgttcgtgg aaaccgcgat caacctggca cgtcaatctc actgcactta 6660 tcataacggc gacgcgcata cctctccgga tgagctgacc cgcaaacgcg ttctgtctgt 6720 aatcactgaa ccgattctgc cgtttgaacg ctaaggatcc gaattcgagc tccgtcgaca 6780 agcttgcggc cgcactcgag caccaccacc accaccactg agatccggct gctaacaaag 6840 cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 6900 gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 6957 <210> 88 <211> 6068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 88 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgagatg 420 tagcgtgtcc accgaaaatg tgtctttcac cgaaactgaa accgaagctc gtcgttctgc 480 gaactacgaa cctaacagct gggactatga ttacctgctg tcctccgaca cggacgagtc 540 catcgaagta tacaaagaca aagcgaaaaa gctggaagcc gaagttcgtc gcgagattaa 600 taacgaaaaa gcagaatttc tgaccctgct ggaactgatt gacaacgtcc agcgcctggg 660 cctgggttac cgtttcgagt ctgatatccg tggtgcgctg gatcgcttcg tttcctccgg 720 cggcttcgat gcggtaacca agacttccct gcacggtacg gcactgtctt tccgtctgct 780 gcgtcaacac ggttttgagg tttctcagga agcgttcagc ggcttcaaag accaaaacgg 840 caacttcctg gagaacctga aggaagatat caaagctatc ctgagcctgt acgaggccag 900 cttcctggct ctggaaggcg aaaacatcct ggacgaggcg aaggttttcg caatctctca 960 tctgaaagaa ctgtctgaag aaaagatcgg taaagagctg gcagaacagg tgaaccatgc 1020 actggaactg ccactgcatc gccgtactca gcgtctggaa gcagtatggt ctatcgaggc 1080 ctaccgtaaa aaggaggacg cgaatcaggt tctgctggag ctggcaattc tggattacaa 1140 catgatccag tctgtatacc agcgtgatct gcgtgaaacg tcccgttggt ggcgtcgtgt 1200 gggtctggcg accaaactgc actttgctcg tgaccgcctg attgagagct tctactgggc 1260 cgtgggtgta gcattcgaac cgcaatactc cgactgccgt aactccgtcg caaaaatgtt 1320 ttctttcgta accattatcg acgatatcta cgatgtatac ggcaccctgg acgaactgga 1380 gctgtttact gatgcagttg agcgttggga cgtaaacgcc atcaacgacc tgccggatta 1440 catgaaactg tgctttctgg ctctgtataa cactattaac gaaatcgcct acgacaacct 1500 gaaagataaa ggtgagaaca tcctgccgta tctgaccaaa gcctgggctg acctgtgcaa 1560 cgctttcctg caagaagcca agtggctgta caacaaatct actccgacct ttgacgacta 1620 cttcggcaac gcatggaaat cctcttctgg cccgctgcaa ctggtgttcg cttacttcgc 1680 tgtcgtgcag aacattaaaa aggaagagat cgaaaacctg caaaaatacc atgacaccat 1740 ctctcgtcct tcccatatct tccgtctgtg caatgacctg gctagcgcgt ctgcggaaat 1800 tgcgcgtggt gaaaccgcaa atagcgtttc ttgttacatg cgcactaaag gtatctccga 1860 agaactggct accgaaagcg tgatgaatct gatcgatgaa acctggaaaa agatgaacaa 1920 ggaaaaactg ggtggtagcc tgttcgcgaa accgttcgtg gaaaccgcga tcaacctggc 1980 acgtcaatct cactgcactt atcataacgg cgacgcgcat acctctccgg atgagctgac 2040 ccgcaaacgc gttctgtctg taatcactga accgattctg ccgtttgaac gctaactgca 2100 gctggtacca tatgggaatt cgaagctttc tagaacaaaa actcatctca gaagaggatc 2160 tgaatagcgc cgtcgaccat catcatcatc atcattgagt ttaaacggtc tccagcttgg 2220 ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 2280 cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 2340 gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 2400 agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 2460 gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg 2520 atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg 2580 ccaggcatca aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa 2640 ctctttttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 2700 ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 2760 cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 2820 ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 2880 tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 2940 cacttttaaa gttctgctat gtggcgcggt attatcccgt gttgacgccg ggcaagagca 3000 actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 3060 aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 3120 tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 3180 ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 3240 tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 3300 gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 3360 gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 3420 tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 3480 gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 3540 ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 3600 gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 3660 aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 3720 ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 3780 ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 3840 tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 3900 gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 3960 agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 4020 taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 4080 gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 4140 gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 4200 caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 4260 aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 4320 tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 4380 acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 4440 ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 4500 gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct 4560 ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc 4620 tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg ggtcatggct 4680 gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 4740 tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 4800 tcatcaccga aacgcgcgag gcagcagatc aattcgcgcg cgaaggcgaa gcggcatgca 4860 tttacgttga caccatcgaa tggtgcaaaa cctttcgcgg tatggcatga tagcgcccgg 4920 aagagagtca attcagggtg gtgaatgtga aaccagtaac gttatacgat gtcgcagagt 4980 atgccggtgt ctcttatcag accgtttccc gcgtggtgaa ccaggccagc cacgtttctg 5040 cgaaaacgcg ggaaaaagtg gaagcggcga tggcggagct gaattacatt cccaaccgcg 5100 tggcacaaca actggcgggc aaacagtcgt tgctgattgg cgttgccacc tccagtctgg 5160 ccctgcacgc gccgtcgcaa attgtcgcgg cgattaaatc tcgcgccgat caactgggtg 5220 ccagcgtggt ggtgtcgatg gtagaacgaa gcggcgtcga agcctgtaaa gcggcggtgc 5280 acaatcttct cgcgcaacgc gtcagtgggc tgatcattaa ctatccgctg gatgaccagg 5340 atgccattgc tgtggaagct gcctgcacta atgttccggc gttatttctt gatgtctctg 5400 accagacacc catcaacagt attattttct cccatgaaga cggtacgcga ctgggcgtgg 5460 agcatctggt cgcattgggt caccagcaaa tcgcgctgtt agcgggccca ttaagttctg 5520 tctcggcgcg tctgcgtctg gctggctggc ataaatatct cactcgcaat caaattcagc 5580 cgatagcgga acgggaaggc gactggagtg ccatgtccgg ttttcaacaa accatgcaaa 5640 tgctgaatga gggcatcgtt cccactgcga tgctggttgc caacgatcag atggcgctgg 5700 gcgcaatgcg cgccattacc gagtccgggc tgcgcgttgg tgcggatatc tcggtagtgg 5760 gatacgacga taccgaagac agctcatgtt atatcccgcc gtcaaccacc atcaaacagg 5820 attttcgcct gctggggcaa accagcgtgg accgcttgct gcaactctct cagggccagg 5880 cggtgaaggg caatcagctg ttgcccgtct cactggtgaa aagaaaaacc accctggcgc 5940 ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 6000 aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagcgcgaa 6060 ttgatctg 6068 <210> 89 <211> 6906 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 89 gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60 ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120 gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180 tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240 taacaatttc acacaggaaa cagcgccgct gagaaaaagc gaagcggcac tgctctttaa 300 caatttatca gacaatctgt gtgggcactc gaccggaatt atcgattaac tttattatta 360 aaaattaaag aggtatatat taatgtatcg attaaataag gaggaataaa ccatgagatg 420 tagcgtgtcc accgaaaatg tgtctttcac cgaaactgaa accgaagctc gtcgttctgc 480 gaactacgaa cctaacagct gggactatga ttacctgctg tcctccgaca cggacgagtc 540 catcgaagta tacaaagaca aagcgaaaaa gctggaagcc gaagttcgtc gcgagattaa 600 taacgaaaaa gcagaatttc tgaccctgct ggaactgatt gacaacgtcc agcgcctggg 660 cctgggttac cgtttcgagt ctgatatccg tggtgcgctg gatcgcttcg tttcctccgg 720 cggcttcgat gcggtaacca agacttccct gcacggtacg gcactgtctt tccgtctgct 780 gcgtcaacac ggttttgagg tttctcagga agcgttcagc ggcttcaaag accaaaacgg 840 caacttcctg gagaacctga aggaagatat caaagctatc ctgagcctgt acgaggccag 900 cttcctggct ctggaaggcg aaaacatcct ggacgaggcg aaggttttcg caatctctca 960 tctgaaagaa ctgtctgaag aaaagatcgg taaagagctg gcagaacagg tgaaccatgc 1020 actggaactg ccactgcatc gccgtactca gcgtctggaa gcagtatggt ctatcgaggc 1080 ctaccgtaaa aaggaggacg cgaatcaggt tctgctggag ctggcaattc tggattacaa 1140 catgatccag tctgtatacc agcgtgatct gcgtgaaacg tcccgttggt ggcgtcgtgt 1200 gggtctggcg accaaactgc actttgctcg tgaccgcctg attgagagct tctactgggc 1260 cgtgggtgta gcattcgaac cgcaatactc cgactgccgt aactccgtcg caaaaatgtt 1320 ttctttcgta accattatcg acgatatcta cgatgtatac ggcaccctgg acgaactgga 1380 gctgtttact gatgcagttg agcgttggga cgtaaacgcc atcaacgacc tgccggatta 1440 catgaaactg tgctttctgg ctctgtataa cactattaac gaaatcgcct acgacaacct 1500 gaaagataaa ggtgagaaca tcctgccgta tctgaccaaa gcctgggctg acctgtgcaa 1560 cgctttcctg caagaagcca agtggctgta caacaaatct actccgacct ttgacgacta 1620 cttcggcaac gcatggaaat cctcttctgg cccgctgcaa ctggtgttcg cttacttcgc 1680 tgtcgtgcag aacattaaaa aggaagagat cgaaaacctg caaaaatacc atgacaccat 1740 ctctcgtcct tcccatatct tccgtctgtg caatgacctg gctagcgcgt ctgcggaaat 1800 tgcgcgtggt gaaaccgcaa atagcgtttc ttgttacatg cgcactaaag gtatctccga 1860 agaactggct accgaaagcg tgatgaatct gatcgatgaa acctggaaaa agatgaacaa 1920 ggaaaaactg ggtggtagcc tgttcgcgaa accgttcgtg gaaaccgcga tcaacctggc 1980 acgtcaatct cactgcactt atcataacgg cgacgcgcat acctctccgg atgagctgac 2040 ccgcaaacgc gttctgtctg taatcactga accgattctg ccgtttgaac gctaactgca 2100 taaaggaggt aaaaaaacat ggtatcctgt tctgcgccgg gtaagattta cctgttcggt 2160 gaacacgccg tagtttatgg cgaaactgca attgcgtgtg cggtggaact gcgtacccgt 2220 gttcgcgcgg aactcaatga ctctatcact attcagagcc agatcggccg caccggtctg 2280 gatttcgaaa agcaccctta tgtgtctgcg gtaattgaga aaatgcgcaa atctattcct 2340 attaacggtg ttttcttgac cgtcgattcc gacatcccgg tgggctccgg tctgggtagc 2400 agcgcagccg ttactatcgc gtctattggt gcgctgaacg agctgttcgg ctttggcctc 2460 agcctgcaag aaatcgctaa actgggccac gaaatcgaaa ttaaagtaca gggtgccgcg 2520 tccccaaccg atacgtatgt ttctaccttc ggcggcgtgg ttaccatccc ggaacgtcgc 2580 aaactgaaaa ctccggactg cggcattgtg attggcgata ccggcgtttt ctcctccacc 2640 aaagagttag tagctaacgt acgtcagctg cgcgaaagct acccggattt gatcgaaccg 2700 ctgatgacct ctattggcaa aatctctcgt atcggcgaac aactggttct gtctggcgac 2760 tacgcatcca tcggccgcct gatgaacgtc aaccagggtc tcctggacgc cctgggcgtt 2820 aacatcttag aactgagcca gctgatctat tccgctcgtg cggcaggtgc gtttggcgct 2880 aaaatcacgg gcgctggcgg cggtggctgt atggttgcgc tgaccgctcc ggaaaaatgc 2940 aaccaagtgg cagaagcggt agcaggcgct ggcggtaaag tgactatcac taaaccgacc 3000 gagcaaggtc tgaaagtaga ttaaagtcta gttaaagttt aaacggtctc cagcttggct 3060 gttttggcgg atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg 3120 gtctgataaa acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc 3180 cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag 3240 tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt 3300 tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat 3360 ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc 3420 aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact 3480 ctttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 3540 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 3600 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 3660 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 3720 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 3780 cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg caagagcaac 3840 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 3900 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 3960 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4020 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4080 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4140 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4200 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4260 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 4320 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 4380 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 4440 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 4500 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 4560 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 4620 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 4680 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 4740 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 4800 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 4860 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 4920 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 4980 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5040 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5100 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5160 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5220 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 5280 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 5340 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 5400 ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg 5460 atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc 5520 gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 5580 cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 5640 atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg aaggcgaagc ggcatgcatt 5700 tacgttgaca ccatcgaatg gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa 5760 gagagtcaat tcagggtggt gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat 5820 gccggtgtct cttatcagac cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg 5880 aaaacgcggg aaaaagtgga agcggcgatg gcggagctga attacattcc caaccgcgtg 5940 gcacaacaac tggcgggcaa acagtcgttg ctgattggcg ttgccacctc cagtctggcc 6000 ctgcacgcgc cgtcgcaaat tgtcgcggcg attaaatctc gcgccgatca actgggtgcc 6060 agcgtggtgg tgtcgatggt agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac 6120 aatcttctcg cgcaacgcgt cagtgggctg atcattaact atccgctgga tgaccaggat 6180 gccattgctg tggaagctgc ctgcactaat gttccggcgt tatttcttga tgtctctgac 6240 cagacaccca tcaacagtat tattttctcc catgaagacg gtacgcgact gggcgtggag 6300 catctggtcg cattgggtca ccagcaaatc gcgctgttag cgggcccatt aagttctgtc 6360 tcggcgcgtc tgcgtctggc tggctggcat aaatatctca ctcgcaatca aattcagccg 6420 atagcggaac gggaaggcga ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg 6480 ctgaatgagg gcatcgttcc cactgcgatg ctggttgcca acgatcagat ggcgctgggc 6540 gcaatgcgcg ccattaccga gtccgggctg cgcgttggtg cggatatctc ggtagtggga 6600 tacgacgata ccgaagacag ctcatgttat atcccgccgt caaccaccat caaacaggat 6660 tttcgcctgc tggggcaaac cagcgtggac cgcttgctgc aactctctca gggccaggcg 6720 gtgaagggca atcagctgtt gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc 6780 aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag 6840 gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt 6900 gatctg 6906 <210> 90 <211> 8123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 90 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgaatt 5640 aaccctcact aaagggcggc cgcgaagttc ctattctcta gaaagtatag gaacttcatt 5700 ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt tagcagcccc 5760 gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca catccaccgg 5820 taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcca ctcctcccct 5880 agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac aaatggaagt 5940 agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga agcgggtagg 6000 cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc agaggctggg 6060 aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg gcgcccgaag 6120 gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg cgctgttctc 6180 ctcttcctca tctccgggcc tttcgacctg cagcagcacg tgttgacaat taatcatcgg 6240 catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gagaaaaaaa 6300 tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat 6360 ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt 6420 taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc 6480 gcctgatgaa tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat 6540 gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc 6600 tctggagtga ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg 6660 cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg 6720 tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca 6780 acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga 6840 tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc 6900 ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaagcg ggactctggg 6960 gttcgaataa agaccgacca agcgacgtct gagagctccc tggcgaattc ggtaccaata 7020 aaagagcttt attttcatga tctgtgtgtt ggtttttgtg tgcggcgcgg aagttcctat 7080 tctctagaaa gtataggaac ttcctcgagc cctatagtga gtcgtattag atcgcggccg 7140 cgcccttgac aatgccacat cctgagcaaa taattcaacc actaattgtg agcggataac 7200 aaaggaggta aaaaaacatg gtatcctgtt ctgcgccggg taagatttac ctgttcggtg 7260 aacacgccgt agtttatggc gaaactgcaa ttgcgtgtgc ggtggaactg cgtacccgtg 7320 ttcgcgcgga actcaatgac tctatcacta ttcagagcca gatcggccgc accggtctgg 7380 atttcgaaaa gcacccttat gtgtctgcgg taattgagaa aatgcgcaaa tctattccta 7440 ttaacggtgt tttcttgacc gtcgattccg acatcccggt gggctccggt ctgggtagca 7500 gcgcagccgt tactatcgcg tctattggtg cgctgaacga gctgttcggc tttggcctca 7560 gcctgcaaga aatcgctaaa ctgggccacg aaatcgaaat taaagtacag ggtgccgcgt 7620 ccccaaccga tacgtatgtt tctaccttcg gcggcgtggt taccatcccg gaacgtcgca 7680 aactgaaaac tccggactgc ggcattgtga ttggcgatac cggcgttttc tcctccacca 7740 aagagttagt agctaacgta cgtcagctgc gcgaaagcta cccggatttg atcgaaccgc 7800 tgatgacctc tattggcaaa atctctcgta tcggcgaaca actggttctg tctggcgact 7860 acgcatccat cggccgcctg atgaacgtca accagggtct cctggacgcc ctgggcgtta 7920 acatcttaga actgagccag ctgatctatt ccgctcgtgc ggcaggtgcg tttggcgcta 7980 aaatcacggg cgctggcggc ggtggctgta tggttgcgct gaccgctccg gaaaaatgca 8040 accaagtggc agaagcggta gcaggcgctg gcggtaaagt gactatcact aaaccgaccg 8100 agcaaggtct gaaagtagat taa 8123 <210> 91 <211> 8123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 91 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgaatt 5640 aaccctcact aaagggcggc cgcgaagttc ctattctcta gaaagtatag gaacttcatt 5700 ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt tagcagcccc 5760 gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca catccaccgg 5820 taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcca ctcctcccct 5880 agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac aaatggaagt 5940 agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga agcgggtagg 6000 cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc agaggctggg 6060 aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg gcgcccgaag 6120 gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg cgctgttctc 6180 ctcttcctca tctccgggcc tttcgacctg cagcagcacg tgttgacaat taatcatcgg 6240 catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gagaaaaaaa 6300 tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat 6360 ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt 6420 taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc 6480 gcctgatgaa tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat 6540 gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc 6600 tctggagtga ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg 6660 cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg 6720 tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca 6780 acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga 6840 tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc 6900 ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaagcg ggactctggg 6960 gttcgaataa agaccgacca agcgacgtct gagagctccc tggcgaattc ggtaccaata 7020 aaagagcttt attttcatga tctgtgtgtt ggtttttgtg tgcggcgcgg aagttcctat 7080 tctctagaaa gtataggaac ttcctcgagc cctatagtga gtcgtattag atcgcggccg 7140 cgcccttgac catgccacat cctgagcaaa taattcaacc actaattgtg agcggataac 7200 aaaggaggta aaaaaacatg gtatcctgtt ctgcgccggg taagatttac ctgttcggtg 7260 aacacgccgt agtttatggc gaaactgcaa ttgcgtgtgc ggtggaactg cgtacccgtg 7320 ttcgcgcgga actcaatgac tctatcacta ttcagagcca gatcggccgc accggtctgg 7380 atttcgaaaa gcacccttat gtgtctgcgg taattgagaa aatgcgcaaa tctattccta 7440 ttaacggtgt tttcttgacc gtcgattccg acatcccggt gggctccggt ctgggtagca 7500 gcgcagccgt tactatcgcg tctattggtg cgctgaacga gctgttcggc tttggcctca 7560 gcctgcaaga aatcgctaaa ctgggccacg aaatcgaaat taaagtacag ggtgccgcgt 7620 ccccaaccga tacgtatgtt tctaccttcg gcggcgtggt taccatcccg gaacgtcgca 7680 aactgaaaac tccggactgc ggcattgtga ttggcgatac cggcgttttc tcctccacca 7740 aagagttagt agctaacgta cgtcagctgc gcgaaagcta cccggatttg atcgaaccgc 7800 tgatgacctc tattggcaaa atctctcgta tcggcgaaca actggttctg tctggcgact 7860 acgcatccat cggccgcctg atgaacgtca accagggtct cctggacgcc ctgggcgtta 7920 acatcttaga actgagccag ctgatctatt ccgctcgtgc ggcaggtgcg tttggcgcta 7980 aaatcacggg cgctggcggc ggtggctgta tggttgcgct gaccgctccg gaaaaatgca 8040 accaagtggc agaagcggta gcaggcgctg gcggtaaagt gactatcact aaaccgaccg 8100 agcaaggtct gaaagtagat taa 8123 <210> 92 <211> 8123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 92 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgaatt 5640 aaccctcact aaagggcggc cgcgaagttc ctattctcta gaaagtatag gaacttcatt 5700 ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt tagcagcccc 5760 gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca catccaccgg 5820 taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcca ctcctcccct 5880 agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac aaatggaagt 5940 agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga agcgggtagg 6000 cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc agaggctggg 6060 aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg gcgcccgaag 6120 gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg cgctgttctc 6180 ctcttcctca tctccgggcc tttcgacctg cagcagcacg tgttgacaat taatcatcgg 6240 catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gagaaaaaaa 6300 tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat 6360 ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt 6420 taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc 6480 gcctgatgaa tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat 6540 gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc 6600 tctggagtga ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg 6660 cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg 6720 tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca 6780 acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga 6840 tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc 6900 ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaagcg ggactctggg 6960 gttcgaataa agaccgacca agcgacgtct gagagctccc tggcgaattc ggtaccaata 7020 aaagagcttt attttcatga tctgtgtgtt ggtttttgtg tgcggcgcgg aagttcctat 7080 tctctagaaa gtataggaac ttcctcgagc cctatagtga gtcgtattag atcgcggccg 7140 cgcccttgac gatgccacat cctgagcaaa taattcaacc actaattgtg agcggataac 7200 aaaggaggta aaaaaacatg gtatcctgtt ctgcgccggg taagatttac ctgttcggtg 7260 aacacgccgt agtttatggc gaaactgcaa ttgcgtgtgc ggtggaactg cgtacccgtg 7320 ttcgcgcgga actcaatgac tctatcacta ttcagagcca gatcggccgc accggtctgg 7380 atttcgaaaa gcacccttat gtgtctgcgg taattgagaa aatgcgcaaa tctattccta 7440 ttaacggtgt tttcttgacc gtcgattccg acatcccggt gggctccggt ctgggtagca 7500 gcgcagccgt tactatcgcg tctattggtg cgctgaacga gctgttcggc tttggcctca 7560 gcctgcaaga aatcgctaaa ctgggccacg aaatcgaaat taaagtacag ggtgccgcgt 7620 ccccaaccga tacgtatgtt tctaccttcg gcggcgtggt taccatcccg gaacgtcgca 7680 aactgaaaac tccggactgc ggcattgtga ttggcgatac cggcgttttc tcctccacca 7740 aagagttagt agctaacgta cgtcagctgc gcgaaagcta cccggatttg atcgaaccgc 7800 tgatgacctc tattggcaaa atctctcgta tcggcgaaca actggttctg tctggcgact 7860 acgcatccat cggccgcctg atgaacgtca accagggtct cctggacgcc ctgggcgtta 7920 acatcttaga actgagccag ctgatctatt ccgctcgtgc ggcaggtgcg tttggcgcta 7980 aaatcacggg cgctggcggc ggtggctgta tggttgcgct gaccgctccg gaaaaatgca 8040 accaagtggc agaagcggta gcaggcgctg gcggtaaagt gactatcact aaaccgaccg 8100 agcaaggtct gaaagtagat taa 8123 <210> 93 <211> 8123 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 93 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgaatt 5640 aaccctcact aaagggcggc cgcgaagttc ctattctcta gaaagtatag gaacttcatt 5700 ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt tagcagcccc 5760 gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca catccaccgg 5820 taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcca ctcctcccct 5880 agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac aaatggaagt 5940 agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga agcgggtagg 6000 cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc agaggctggg 6060 aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg gcgcccgaag 6120 gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg cgctgttctc 6180 ctcttcctca tctccgggcc tttcgacctg cagcagcacg tgttgacaat taatcatcgg 6240 catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gagaaaaaaa 6300 tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat 6360 ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt 6420 taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc 6480 gcctgatgaa tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat 6540 gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc 6600 tctggagtga ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg 6660 cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg 6720 tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca 6780 acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga 6840 tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc 6900 ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaagcg ggactctggg 6960 gttcgaataa agaccgacca agcgacgtct gagagctccc tggcgaattc ggtaccaata 7020 aaagagcttt attttcatga tctgtgtgtt ggtttttgtg tgcggcgcgg aagttcctat 7080 tctctagaaa gtataggaac ttcctcgagc cctatagtga gtcgtattag atcgcggccg 7140 cgcccttgac tatgccacat cctgagcaaa taattcaacc actaattgtg agcggataac 7200 aaaggaggta aaaaaacatg gtatcctgtt ctgcgccggg taagatttac ctgttcggtg 7260 aacacgccgt agtttatggc gaaactgcaa ttgcgtgtgc ggtggaactg cgtacccgtg 7320 ttcgcgcgga actcaatgac tctatcacta ttcagagcca gatcggccgc accggtctgg 7380 atttcgaaaa gcacccttat gtgtctgcgg taattgagaa aatgcgcaaa tctattccta 7440 ttaacggtgt tttcttgacc gtcgattccg acatcccggt gggctccggt ctgggtagca 7500 gcgcagccgt tactatcgcg tctattggtg cgctgaacga gctgttcggc tttggcctca 7560 gcctgcaaga aatcgctaaa ctgggccacg aaatcgaaat taaagtacag ggtgccgcgt 7620 ccccaaccga tacgtatgtt tctaccttcg gcggcgtggt taccatcccg gaacgtcgca 7680 aactgaaaac tccggactgc ggcattgtga ttggcgatac cggcgttttc tcctccacca 7740 aagagttagt agctaacgta cgtcagctgc gcgaaagcta cccggatttg atcgaaccgc 7800 tgatgacctc tattggcaaa atctctcgta tcggcgaaca actggttctg tctggcgact 7860 acgcatccat cggccgcctg atgaacgtca accagggtct cctggacgcc ctgggcgtta 7920 acatcttaga actgagccag ctgatctatt ccgctcgtgc ggcaggtgcg tttggcgcta 7980 aaatcacggg cgctggcggc ggtggctgta tggttgcgct gaccgctccg gaaaaatgca 8040 accaagtggc agaagcggta gcaggcgctg gcggtaaagt gactatcact aaaccgaccg 8100 agcaaggtct gaaagtagat taa 8123 <210> 94 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 94 accaattgca cccggcaga 19 <210> 95 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 95 gctaaagcgc atgctccaga c 21 <210> 96 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 96 gactggcctc agatgaaagc 20 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 97 caaacatgtg gcatggaaag 20 <210> 98 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 98 gggcccgttt aaactttaac tagactctgc agttagcgtt caaacggcag aa 52 <210> 99 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 99 cgcatgcatg tcatgagatg tagcgtgtcc accgaaaa 38 <210> 100 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 100 acaatttcac acaggaaaca gc 22 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 101 ccaggcaaat tctgttttat cag 23 <210> 102 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 102 gcactgtctt tccgtctgct gc 22 <210> 103 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 103 gcgaacgatg cataaaggag gtaaaaaaac atggtatcct gttctgcgcc gggtaagatt 60 tacctg 66 <210> 104 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 104 gggcccgttt aaactttaac tagactttaa tctactttca gaccttgc 48 <210> 105 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 105 gatagtaacg gctgcgctgc tacc 24 <210> 106 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 106 gacagcttat catcgactgc acg 23 <210> 107 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 107 caccatggta tcctgttctg cg 22 <210> 108 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 108 ttaatctact ttcagacctt gc 22 <210> 109 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 109 aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaagcaa 60 ttaaccctca ctaaagggcg g 81 <210> 110 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 110 gatatacata tgaattaacc ctcactaaag g 31 <210> 111 <211> 125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (80) <223> n = A,T,C or G <400> 111 gcatgcatga catgtttttt tacctccttt gttatccgct cacaattagt ggttgaatta 60 tttgctcagg atgtggcatn gtcaagggcg cggccgcgat ctaatacgac tcactatagg 120 gctcg 125 <210> 112 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 112 aggctctcaa ctctgacatg tttttttcct ccttaagggt gcaggcctat cgcaaattag 60 cttaatctac tttcagacct tgctcgg 87 <210> 113 <211> 3913 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 113 gcggccgcgc ccttgacgat gccacatcct gagcaaataa ttcaaccact aattgtgagc 60 ggataacaca aggaggaaac agccatggta tcctgttctg cgccgggtaa gatttacctg 120 ttcggtgaac acgccgtagt ttatggcgaa actgcaattg cgtgtgcggt ggaactgcgt 180 acccgtgttc gcgcggaact caatgactct atcactattc agagccagat cggccgcacc 240 ggtctggatt tcgaaaagca cccttatgtg tctgcggtaa ttgagaaaat gcgcaaatct 300 attcctatta acggtgtttt cttgaccgtc gattccgaca tcccggtggg ctccggtctg 360 ggtagcagcg cagccgttac tatcgcgtct attggtgcgc tgaacgagct gttcggcttt 420 ggcctcagcc tgcaagaaat cgctaaactg ggccacgaaa tcgaaattaa agtacagggt 480 gccgcgtccc caaccgatac gtatgtttct accttcggcg gcgtggttac catcccggaa 540 cgtcgcaaac tgaaaactcc ggactgcggc attgtgattg gcgataccgg cgttttctcc 600 tccaccaaag agttagtagc taacgtacgt cagctgcgcg aaagctaccc ggatttgatc 660 gaaccgctga tgacctctat tggcaaaatc tctcgtatcg gcgaacaact ggttctgtct 720 ggcgactacg catccatcgg ccgcctgatg aacgtcaacc agggtctcct ggacgccctg 780 ggcgttaaca tcttagaact gagccagctg atctattccg ctcgtgcggc aggtgcgttt 840 ggcgctaaaa tcacgggcgc tggcggcggt ggctgtatgg ttgcgctgac cgctccggaa 900 aaatgcaacc aagtggcaga agcggtagca ggcgctggcg gtaaagtgac tatcactaaa 960 ccgaccgagc aaggtctgaa agtagattaa gccttgactt aatagctgct tatttcgccc 1020 ttatggtacc tagtaggagg aaaaaaacat ggaaatgcgt caaccggctg tcgcaggtca 1080 attctaccca ctgcgttgcg agaacctgga aaacgaactg aaacgctgct tcgaaggcct 1140 ggagatccgc gaacaagaag tgctgggcgc agtctgtccg cacgccggtt atatgtactc 1200 tggcaaagtt gcggcgcacg tctatgccac tctgccggaa gctgatacct acgtaatctt 1260 cggcccgaac cacaccggct acggtagccc tgtctctgtg agccgtgaaa cttggaagac 1320 cccgttgggc aatatcgatg ttgacctgga actggcggac ggcttcctgg gttccatcgt 1380 agatgcggat gaactcggtc acaaatacga acactctatc gaagttcagc tgccgtttct 1440 gcaataccgt tttgaacgcg atttcaaaat tctgccaatc tgcatgggta tgcaagacga 1500 agaaaccgcg gtcgaagtag gtaacctgct ggcggatctg atcagcgagt ccggtaaacg 1560 tgctgtgatc atcgcaagct ctgatttcac ccactatgag acggctgaac gtgccaaaga 1620 aatcgattcc gaagttattg attctatcct gaactttgac atctctggca tgtacgatcg 1680 cctgtatcgc cgtaacgcct ctgtttgcgg ttacggcccg atcaccgcta tgctgacggc 1740 aagcaaaaag ctgggcggct ctcgtgcgac tttgctgaaa tacgcaaaca gcggtgacgt 1800 gtccggtgat aaagacgctg tggtgggcta cgccgccatc atcgttgagt aagctgatta 1860 aaggttgaac agataggatt tcgtcatgga tcctacaagg aggaaaaaaa catgaatgct 1920 tctaatgaac cggtgattct gaaactgggt ggctctgcta ttaccgacaa aggtgcctac 1980 gaaggcgtag ttaaggaagc tgatttgctg cgcatcgcac aggaagttag cggtttccgt 2040 ggcaagatga tcgtggttca tggtgctggt agcttcggcc atacgtacgc gaagaaatac 2100 ggcctggacc gtaccttcga cccagagggc gcaattgtta ctcatgaatc tgttaaaaag 2160 ctcgcctcca aagttgtagg tgctctgaat agcttcggcg tgcgtgctat cgcggtgcat 2220 cctatggact gcgcagtatg ccgtaacggt cgtatcgaaa cgatgtatct ggactccatc 2280 aagttaatgc tggaaaaagg tctggtgccg gttctgcacg gcgacgtcgc aatggatatt 2340 gaactgggca cttgtatcct gtccggtgat caaatcgttc cttacctggc caaagaactg 2400 ggtatctccc gcctcggcct gggcagcgca gaggatggtg tgctggatat ggagggcaaa 2460 cctgtaccgg aaatcacccc agaaactttc gaagagttcc gccactgcat cggtggttct 2520 ggttctactg atgtaaccgg tggcatgctg ggcaaagtgc tggaacttct ggaattgagc 2580 aaaaattctt ccattactag ctacattttc aacgctggta aagcagacaa catctaccgc 2640 tttctgaatg gtgagtccat cggcactcgc atcagcccgg acaagcgtgt ttaagctagt 2700 tattaaccta aatgctctaa accagttatg agctctacaa ggaggaaaaa aacatgatta 2760 acactaccag ccgccgcaaa attgaacacc tgaaactctg cgcagaatcc ccggttgaag 2820 cgcgtcaggt atctgccggc tttgaagacg ttactctgat ccaccgcgct ttaccggagc 2880 tgaacatgga tgaactggac ctcagcgttg atttcctggg taaacgcatc aaagcgccgt 2940 tcctgattgc gtctatcacg ggtggtcacc cagataccat cccggttaac gctgcgctgg 3000 cagctgctgc tgaggagctg ggtgttggca tcggcgttgg ctctcagcgc gcggccattg 3060 atgatccgag ccaggaagac agcttccgtg tagtgcgtga tgaagcccca gatgcgtttg 3120 tttatggcaa cgtcggcgca gcacagatcc gtcagtatgg tgttgaaggt gttgaaaaac 3180 tgatcgaaat gattgacgca gatgccttgg caatccacct gaactttctg caagaagcgg 3240 tccaaccgga aggtgaccgc gacgcgaccg gttgcctgga catgattacc gaaatttgct 3300 ctcagattaa aactccggta atcgtgaaag aaaccggtgc aggcattagc cgtgaagatg 3360 cgattctgtt ccagaaagct ggcgtgagcg caatcgacgt tggcggcgcg ggcggcacct 3420 cctgggctgg cgtcgaggtc taccgtgcta aagaaagccg tgactctgtt agcgagcgtt 3480 taggtgagct gttttgggat ttcggcattc cgacggtagc ttctctgatt gaatcccgcg 3540 tttccttgcc gctgatcgca accggcggta tccgtaacgg tctggacatt gctaaaagca 3600 ttgctctcgg cgcaagcgct gccagcgccg ctctgccgtt cgttggtccg tccctggagg 3660 gcaaagaatc cgttgtacgt gtgctgagct gcatgctgga agaatttaaa gcagcaatgt 3720 ttttgtgcgg ttgcggcaac atcaaagacc tgcacaactc tccagtagtg gtaactggtt 3780 ggacccgcga atacctggag cagcgcggtt ttaacgttaa ggacctctcc ctgccgggca 3840 acgctctgta agcttcaacg cgtctacaaa taaaaaaggc acgtcagatg acgtgccttt 3900 tttcttgtct aga 3913 <210> 114 <211> 6648 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 114 aagggcgagc tcaacgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 60 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggagt 120 tttttgctga aaggaggaac tatatccgga tatcccgcaa gaggcccggc agtaccggca 180 taaccaagcc tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat 240 tgttagattt catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 300 attaaagctt atcgatgata agctgtcaaa catgagaatt aattcttgaa gacgaaaggg 360 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 540 aaggaagagt atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 600 gaggctattc ggctatgact gggcacaact gacaatcggc tgctctgatg ccgccgtgtt 660 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 720 gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 780 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 840 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 900 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 960 gaaacatcgc atcgagcggg cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 1020 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg 1080 catgcccgac ggcgaggatc tcgtcgtgac acatggcgat gcctgcttgc cgaatatcat 1140 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 1200 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 1260 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 1320 tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg 1380 acgcctaact gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt 1440 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 1500 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 1560 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 1620 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 1680 gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca 1740 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 1800 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 1860 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 1920 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 1980 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 2040 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 2100 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 2160 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 2220 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 2280 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc 2340 ggtattttct ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac 2400 aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 2460 gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2520 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2580 ttttcaccgt catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg 2640 tgaagcgatt cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga 2700 agcgttaatg tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg 2760 gtcactgatg cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa 2820 cgagagagga tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt 2880 tgtgagggta aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt 2940 caatgccagc gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct 3000 gcgatgcaga tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac 3060 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 3120 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 3180 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 3240 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 3300 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 3360 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 3420 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 3480 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 3540 gtccaatgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 3600 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 3660 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 3720 cgtagcccag cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt 3780 tggtggcggg accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa 3840 gcgacaggcc gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga 3900 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 3960 cgatagtcat gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca 4020 tcggtcgaga tcccggtgcc taatgagtga gctaacttac attaattgcg ttgcgctcac 4080 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4140 cggggagagg cggtttgcgt attgggcgcc agggtggttt ttcttttcac cagtgagacg 4200 ggcaacagct gattgccctt caccgcctgg ccctgagaga gttgcagcaa gcggtccacg 4260 ctggtttgcc ccagcaggcg aaaatcctgt ttgatggtgg ttaacggcgg gatataacat 4320 gagctgtctt cggtatcgtc gtatcccact accgagatat ccgcaccaac gcgcagcccg 4380 gactcggtaa tggcgcgcat tgcgcccagc gccatctgat cgttggcaac cagcatcgca 4440 gtgggaacga tgccctcatt cagcatttgc atggtttgtt gaaaaccgga catggcactc 4500 cagtcgcctt cccgttccgc tatcggctga atttgattgc gagtgagata tttatgccag 4560 ccagccagac gcagacgcgc cgagacagaa cttaatgggc ccgctaacag cgcgatttgc 4620 tggtgaccca atgcgaccag atgctccacg cccagtcgcg taccgtcttc atgggagaaa 4680 ataatactgt tgatgggtgt ctggtcagag acatcaagaa ataacgccgg aacattagtg 4740 caggcagctt ccacagcaat ggcatcctgg tcatccagcg gatagttaat gatcagccca 4800 ctgacgcgtt gcgcgagaag attgtgcacc gccgctttac aggcttcgac gccgcttcgt 4860 tctaccatcg acaccaccac gctggcaccc agttgatcgg cgcgagattt aatcgccgcg 4920 acaatttgcg acggcgcgtg cagggccaga ctggaggtgg caacgccaat cagcaacgac 4980 tgtttgcccg ccagttgttg tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc 5040 gcttccactt tttcccgcgt tttcgcagaa acgtggctgg cctggttcac cacgcgggaa 5100 acggtctgat aagagacacc ggcatactct gcgacatcgt ataacgttac tggtttcaca 5160 ttcaccaccc tgaattgact ctcttccggg cgctatcatg ccataccgcg aaaggttttg 5220 cgccattcga tggtgtccgg gatctcgacg ctctccctta tgcgactcct gcattaggaa 5280 gcagcccagt agtaggttga ggccgttgag caccgccgcc gcaaggaatg gtgcatgcaa 5340 ggagatggcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca 5400 agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 5460 ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 5520 gatcgagatc tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat 5580 aacaattccc ctctagaaat aattttgttt aactttaaga aggagatata catatgcggg 5640 gttctcatca tcatcatcat catggtatgg ctagcatgac tggtggacag caaatgggtc 5700 gggatctgta cgacgatgac gataaggatc atcccttcac catggtatcc tgttctgcgc 5760 cgggtaagat ttacctgttc ggtgaacacg ccgtagttta tggcgaaact gcaattgcgt 5820 gtgcggtgga actgcgtacc cgtgttcgcg cggaactcaa tgactctatc actattcaga 5880 gccagatcgg ccgcaccggt ctggatttcg aaaagcaccc ttatgtgtct gcggtaattg 5940 agaaaatgcg caaatctatt cctattaacg gtgttttctt gaccgtcgat tccgacatcc 6000 cggtgggctc cggtctgggt agcagcgcag ccgttactat cgcgtctatt ggtgcgctga 6060 acgagctgtt cggctttggc ctcagcctgc aagaaatcgc taaactgggc cacgaaatcg 6120 aaattaaagt acagggtgcc gcgtccccaa ccgatacgta tgtttctacc ttcggcggcg 6180 tggttaccat cccggaacgt cgcaaactga aaactccgga ctgcggcatt gtgattggcg 6240 ataccggcgt tttctcctcc accaaagagt tagtagctaa cgtacgtcag ctgcgcgaaa 6300 gctacccgga tttgatcgaa ccgctgatga cctctattgg caaaatctct cgtatcggcg 6360 aacaactggt tctgttctgg cgactacgca tccatcggcc gcctgatgaa cgtcaaccag 6420 ggtctcctgg acgccctggg cgttaacatc ttagaactga gccagctgat ctattccgct 6480 cgtgcggcag gtgcgtttgg cgctaaaatc acgggcgctg gcggcggtgg ctgtatggtt 6540 gcgctgaccg ctccggaaaa atgcaaccaa gtggcagaag cggtagcagg cgctggcggt 6600 aaagtgacta tcactaaacc gaccgagcaa ggtctgaaag tagattaa 6648 <210> 115 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 115 accgccaaaa gcgactaatt ttagctgtta cagtcagttg aattaaccct cactaaaggg 60 cggccgc 67 <210> 116 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 116 gctggcgata taaactgttt gcttcatgaa tgctcctttg ggttacctcc gggaaacgcg 60 gttgatttgt ttagtggttg aattatttgc tcaggatgtg gcatagtcaa gggcgtgacg 120 gctcgctaat acgactcact atagggctcg ag 152 <210> 117 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 117 cttgatatct tagtgtgcgt taaccaccac 30 <210> 118 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 118 cgtgaatttg ctggctctca g 21 <210> 119 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 119 ggtttagttc ctcaccttgt c 21 <210> 120 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 120 actgaaacgt tttcatcgct c 21 <210> 121 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 121 accgccaaaa gcgactaatt ttagct 26 <210> 122 <211> 7519 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 122 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gcctcacggc ggcgagtgcg ggggttccaa gggggcagcg ccaccttggg 1440 caaggccgaa ggccgcgcag tcgatcaaca agccccggag gggccacttt ttgccggagg 1500 gggagccgcg ccgaaggcgt gggggaaccc cgcaggggtg cccttctttg ggcaccaaag 1560 aactagatat agggcgaaat gcgaaagact taaaaatcaa caacttaaaa aaggggggta 1620 cgcaacagct cattgcggca ccccccgcaa tagctcattg cgtaggttaa agaaaatctg 1680 taattgactg ccacttttac gcaacgcata attgttgtcg cgctgccgaa aagttgcagc 1740 tgattgcgca tggtgccgca accgtgcggc accctaccgc atggagataa gcatggccac 1800 gcagtccaga gaaatcggca ttcaagccaa gaacaagccc ggtcactggg tgcaaacgga 1860 acgcaaagcg catgaggcgt gggccgggct tattgcgagg aaacccacgg cggcaatgct 1920 gctgcatcac ctcgtggcgc agatgggcca ccagaacgcc gtggtggtca gccagaagac 1980 actttccaag ctcatcggac gttctttgcg gacggtccaa tacgcagtca aggacttggt 2040 ggccgagcgc tggatctccg tcgtgaagct caacggcccc ggcaccgtgt cggcctacgt 2100 ggtcaatgac cgcgtggcgt ggggccagcc ccgcgaccag ttgcgcctgt cggtgttcag 2160 tgccgccgtg gtggttgatc acgacgacca ggacgaatcg ctgttggggc atggcgacct 2220 gcgccgcatc ccgaccctgt atccgggcga gcagcaacta ccgaccggcc ccggcgagga 2280 gccgcccagc cagcccggca ttccgggcat ggaaccagac ctgccagcct tgaccgaaac 2340 ggaggaatgg gaacggcgcg ggcagcagcg cctgccgatg cccgatgagc cgtgttttct 2400 ggacgatggc gagccgttgg agccgccgac acgggtcacg ctgccgcgcc ggtagcactt 2460 gggttgcgca gcaacccgta agtgcgctgt tccagactat cggctgtagc cgcctcgccg 2520 ccctatacct tgtctgcctc cccgcgttgc gtcgcggtgc atggagccgg gccacctcga 2580 cctgaatgga agccggcggc acctcgctaa cggattcacc gtttttatca ggctctggga 2640 ggcagaataa atgatcatat cgtcaattat tacctccacg gggagagcct gagcaaactg 2700 gcctcaggca tttgagaagc acacggtcac actgcttccg gtagtcaata aaccggtaaa 2760 ccagcaatag acataagcgg ctatttaacg accctgccct gaaccgacga ccgggtcgaa 2820 tttgctttcg aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaccag 2880 gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc 2940 agtcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 3000 aaatattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 3060 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 3120 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 3180 gcgcgcgtaa tacgactcac tatagggcga attggagctc caccgcggtg gcggccgctc 3240 tagaactagt ggatcccccg ggctgcatgc tcgagcggcc gccagtgtga tggatatctg 3300 cagaattcgc ccttcttgat atcttagtgt gcgttaacca ccacccacat tggtccctgc 3360 ccgaccgcat agcggccttt ttcatgcagt agcccctgct cgccaacaat ttcgtatacc 3420 gagatgtggt gagatttttg cccggcggca atcagatact tgccgctgtg atcaacattg 3480 aagccgcgcg gctgggtttc cgttggctgg aagccttctt tactcaacac gctgccatct 3540 tccgaaacgc tgaaaacggt aatcaggctg gcggtacggt cgcaggcgta taaatggcga 3600 ccatccgggg tgatatgaat atcagccgcc caacgggtgt cggagaagtt ttccggcatc 3660 atatccagcg tctggacaca ttcgatatta ccgtgcggat ctttcagttc ccagacatcc 3720 actgagctgt ttaactcatt gacgcaatac gcatattgtt cgtttggatg gaataccata 3780 tgacgcgggc cggccccttc aacggtggtc acttccgcag ggtcctgcgc cacgagatga 3840 ccatcatcgc tgaccgtaaa caggcaaatg cgatcctgct ttaatgccgg aacccacagc 3900 gtacggttgt ccggtgagat attggcggaa tggcaaccgt ccagcccctc gaccacatcg 3960 acgacgccca ctggcaggcc atcttccaga cgcgttacgc tcacgttacc cgcattgtaa 4020 gaacctacaa agacaaactg cccctggtga tcggtggaaa tatgcgtcgg actacccggc 4080 agcgcagact ctgcggcaaa ggtcagtgcg ccatcgtccg gggcgatacg atacgccagg 4140 acgcgaaact cagggcgaac accaacatag agataacgtt tgtccgggct gaccaccatc 4200 ggctgcacct gccccggcac atcgacaacc tgtgtcagcg tcagtgcgcc ttcatgattc 4260 agattccaga cgtgaatttg ctggctctca gggctggcga tataaactgt ttgcttcatg 4320 aatgctcctt tgggttacct ccgggaaacg cggttgattt gtttagtggt tgaattattt 4380 gctcaggatg tggcatagtc aagggcgtga cggctcgcta atacaactca ctatagggct 4440 cgaggaagtt cctatacttt ctagagaata ggaacttccg cgccgcacac aaaaaccaac 4500 acacagatca tgaaaataaa gctcttttat tggtaccgaa ttcgccaggg agctctcaga 4560 cgtcgcttgg tcggtcttta ttcgaacccc agagtcccgc ttacgccccg ccctgccact 4620 catcgcagta ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacaaacgg 4680 catgatgaac ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc 4740 ccatggtgaa aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg 4800 tgaaactcac ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga 4860 aataggccag gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc 4920 ggaaatcgtc gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa 4980 cggtgtaaca agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac 5040 ggaattccgg atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact 5100 tgtgcttatt tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt 5160 tataggtaca ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg 5220 atatatcaac ggtggtatat ccagtgattt ttttctccat ggtttagttc ctcaccttgt 5280 cgtattatac tatgccgata tactatgccg atgattaatt gtcaacacgt gctgctgcag 5340 gtcgaaaggc ccggagatga ggaagaggag aacagcgcgg cagacgtgcg cttttgaagc 5400 gtgcagaatg ccgggcctcc ggaggacctt cgggcgcccg ccccgcccct gagcccgccc 5460 ctgagcccgc ccccggaccc accccttccc agcctctgag cccagaaagc gaaggagcaa 5520 agctgctatt ggccgctgcc ccaaaggcct acccgcttcc attgctcagc ggtgctgtcc 5580 atctgcacga gactagtgag acgtgctact tccatttgtc acgtcctgca cgacgcgagc 5640 tgcggggcgg gggggaactt cctgactagg ggaggagtgg aaggtggcgc gaaggggcca 5700 ccaaagaacg gagccggttg gcgcctaccg gtggatgtgg aatgtgtgcg aggccagagg 5760 ccacttgtgt agcgccaagt gcccagcggg gctgctaaag cgcatgctcc agactgcctt 5820 gggaaaagcg cctcccctac ccggtagaat gaagttccta tactttctag agaataggaa 5880 cttcgcggcc gccctttagt gagggttaat tcaactgact gtaacagcta aaattagtcg 5940 cttttggcgg taagggcgaa ttccagcaca ctggcggccg ttactagtgg atccgagctc 6000 ggtaccaagc ttgatgcagg aattcgatat caagcttatc gataccgtcg acctcgaggg 6060 ggggcccggt acccagcttt tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat 6120 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6180 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6240 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 6300 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgcatgcat aaaaactgtt 6360 gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 6420 tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gacgcacacc 6480 gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta 6540 atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg 6600 taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc 6660 tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag 6720 caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt 6780 taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat 6840 ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc 6900 aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc 6960 ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt 7020 ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga 7080 ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg 7140 cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa 7200 agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac 7260 aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac 7320 gccgccaggt ggcacttttc ggggaaatgt gcgcgcccgc gttcctgctg gcgctgggcc 7380 tgtttctggc gctggacttc ccgctgttcc gtcagcagct tttcgcccac ggccttgatg 7440 atcgcggcgg ccttggcctg catatcccga ttcaacggcc ccagggcgtc cagaacgggc 7500 ttcaggcgct cccgaaggt 7519 <210> 123 <211> 4395 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 123 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttcg attgacggtt acgggatcct 1200 cacacgtaca tcagctggtt gatggggaac gggtcgatga gcagcagctt gatgcggttc 1260 tcggtggcgt aatccgggcg gcccagcccg tccccatatt ggtaggtgca gtggctcacg 1320 cgggccatgt tcacggcgat ctccatgaac gccttcggca gcagggtgct gtccgacacg 1380 cgctcgcggt tcattttctt ccactcggcg tcgatcagct tgcgcagctc ttcgcgggcc 1440 tgttcctcgc tcgtgccgtc gttctcgtgc atgtagctga tgatgctgtt ggtggtttcg 1500 ccgcgttcga gttccgccgc cgaggtcgcc agatcgttgc acagccgaaa gatcacgcag 1560 gacgagcgca ccaggccgtg gaagtcggtc agggagcgga gggcgtggtc cgagatatct 1620 tcctgctgct ggcagaccga gaagtagctc ggcgccagca gcgcgacccc gctggaggac 1680 acgctggcgt tctccaggta cttgctgaag gcggggatga tcttgttatt gctccacttg 1740 gcttcttgca ggaaggcctt gcacagttcg cgccagcttt tggtcagata gctcaggtta 1800 ttgtggccct tctccttcag gatggagtag gacgtgtcgt tcacggtgtt gtacagggcc 1860 aggaagcaca gcttcatata gtcgggcagc gtgttgatgg cgttcacgtc ccagcgttcc 1920 accgcgtcgg tgaagagctg cagttcgtcc agggtaccgt acacgtcata gacgtcatcg 1980 ataatggtga ccagaccgaa catcttggtg acggccttgc ggcattcgcc gaactgcggg 2040 tccggcgcca tgcccagcgc ccagaagtac acttccatca ggcggtcccg cacgaaatcc 2100 agcttgctgg cgaggcccat ctcggtccac caccggctca ggtcctgcag ctctttttgg 2160 tgcagggtct ggaccatgtt gaaatcgagt ttggccagtt ccagcagcag ctggtgatgc 2220 ggctccttgg gttcgtactt gtccagaaac caccgcgcct ccaggcggtg caggcgttga 2280 tgatacggca gctccagcgc gtgggacacc tgctcggcca ccttcgtgtt gatcccctcc 2340 ttgaggttgt tcttcagatg ggtgatgctg aaggtacggg cctcctccag cagattttcg 2400 ccttcgaaac cgagatagct ggcctcgtac aggctcagca ggccctgcac gtcacccttc 2460 agttccccgg agaagccccc ttctttgtcc ttgaagcgct cgaacacgtc ctggctcacc 2520 tcaaagccat gctgccgcag caggcggaag ctcagggcgg tcgcgtgcag atcgcttttg 2580 ttcttcttat tctcgtccag caggacgatg ttctccagcg ccttgatgat atctttctca 2640 aacttgtagg tcaggcccag gcgctgcacg tcgtcgatga gctccagcag gctcaggggc 2700 tgggtgtcca cccggttgat catgcaacgc acctcctcct ccagcttggt ggccttctct 2760 tcgagcttct ccaccttcag gtcgttttcc aggctctgca ggaactcgaa gttccacagg 2820 ttgggctggt agttcgcgga ccgacggcta ttatgctcgg tgatctgggt gaactggctg 2880 ctggtggcgc acatatgtat atctccttct taaagttaaa caagcttaag atgttcagcg 2940 acaagggcga cacaaaattt attctaaatg cataataaat actgataaca tcttatagtt 3000 tgtattatat tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc 3060 ctttattatt ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata 3120 tacaaaaaat cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa 3180 gcaacgtatc ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc 3240 atatatcaag caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac 3300 tccccccata aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac 3360 tcgttatcag aaccgcccag ggggcccgag cttaagactg gccgtcgttt tacaacacag 3420 aaagagtttg tagaaacgca aaaaggccat ccgtcagggg ccttctgctt agtttgatgc 3480 ctggcagttc cctactctcg ccttccgctt cctcgctcac tgactcgctg cgctcggtcg 3540 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 3600 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 3660 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 3720 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 3780 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 3840 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 3900 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 3960 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 4020 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 4080 cagagttctt gaagtggtgg gctaactacg gctacactag aagaacagta tttggtatct 4140 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 4200 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 4260 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgacg 4320 cgcgcgtaac tcacgttaag ggattttggt catgagcttg cgccgtcccg tcaagtcagc 4380 gtaatgctct gcttt 4395

Claims (105)

  1. 약 400 nmol/gwcm/시간 초과의 이소프렌을 생성하는 배양물 내 세포.
  2. 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 배양물 내 세포.
  3. 세포 배양 배지로부터 세포가 소비하는 약 0.002 몰% 초과의 탄소를 이소프렌으로 변환시키는 배양물 내 세포.
  4. 세포가 (i) 약 400 nmol/gwcm/시간 초과의 이소프렌을 생성하고, (ii) 세포 배양 배지로부터 세포가 소비하는 약 0.002 몰% 초과의 탄소를 이소프렌으로 변환시키거나, 또는 (iii) 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 배양물 내 세포.
  5. 이종 핵산이 프로모터에 작동가능하게 연결되며, 세포에 의한 이소프렌의 생성이 약 400 nmol/gwcm/시간 초과인, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 배양물 내 세포.
  6. 이종 핵산이 프로모터에 작동가능하게 연결되며, 세포가 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 배양물 내 세포.
  7. 이종 핵산이 프로모터에 작동가능하게 연결되며, 세포 배양 배지로부터 세포가 소비하는 탄소의 약 0.002 몰% 초과가 이소프렌으로 변환되는, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 배양물 내 세포.
  8. 제 1 항, 제 4 항 또는 제 5 항 중 어느 한 항에 있어서, 약 4.0 x 103 nmol/gwcm/시간 초과의 이소프렌을 생성하는 세포.
  9. 제 8 항에 있어서, 약 4.0 x 104 nmol/gwcm/시간 초과의 이소프렌을 생성하는 세포.
  10. 제 9 항에 있어서, 약 1.5 x 105 nmol/gwcm/시간 초과의 이소프렌을 생성하는 세포.
  11. 제 1 항, 제 4 항 또는 제 5 항 중 어느 한 항에 있어서, 약 400 nmol/gwcm/시간 내지 약 2.0 x 105 nmol/gwcm/시간의 이소프렌을 생성하는 세포.
  12. 제 2 항, 제 4 항 또는 제 6 항 중 어느 한 항에 있어서, 약 100 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 세포.
  13. 제 12 항에 있어서, 약 1,000 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 세포.
  14. 제 13 항에 있어서, 약 1,500 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 세포.
  15. 제 2 항, 제 4 항 또는 제 6 항 중 어느 한 항에 있어서, 약 0.1 내지 약 1,500 mg/L브로쓰/시간의 이소프렌의 평균 체적 생산성을 갖는 세포.
  16. 제 3 항, 제 4 항 또는 제 7 항 중 어느 한 항에 있어서, 약 0.05 몰% 초과의 탄소를 이소프렌으로 변환시키는 세포.
  17. 제 16 항에 있어서, 약 1 몰% 초과의 탄소를 이소프렌으로 변환시키는 세포.
  18. 제 17 항에 있어서, 약 10 몰% 초과의 탄소를 이소프렌으로 변환시키는 세포.
  19. 제 18 항에 있어서, 약 20 몰% 초과의 탄소를 이소프렌으로 변환시키는 세포.
  20. 제 3 항, 제 4 항 또는 제 7 항 중 어느 한 항에 있어서, 약 0.002 내지 약 25 몰%의 탄소를 이소프렌으로 변환시키는 세포.
  21. 제 4 항 내지 제 7 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 식물 이소프렌 신타아제 폴리펩티드인 세포.
  22. 제 1 항 내지 제 21 항 중 어느 한 항에 있어서, IDI 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 세포.
  23. 제 1 항 내지 제 22 항 중 어느 한 항에 있어서, IDI 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함하는 세포.
  24. 제 1 항 내지 제 23 항 중 어느 한 항에 있어서, DXS 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 세포.
  25. 제 1 항 내지 제 24 항 중 어느 한 항에 있어서, DXS 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함하는 세포.
  26. 제 1 항 내지 제 25 항 중 어느 한 항에 있어서, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 세포.
  27. 제 26 항에 있어서, 한 핵산이 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 세포.
  28. 제 27 항에 있어서, 한 플라스미드가 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 세포.
  29. 제 1 항 내지 제 28 항 중 어느 한 항에 있어서, MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 세포.
  30. 제 29 항에 있어서, MVA 경로 폴리펩티드가 메발로네이트 키나아제 (MVK)인 세포.
  31. 제 30 항에 있어서, MVK가 메타노사르키나 (Methanosarcina)로부터의 폴리펩티드인 세포.
  32. 제 31 항에 있어서, MVK가 메타노사르키나 마제이 (Methanosarcina mazei)로부터의 폴리펩티드인 세포.
  33. 제 4 항 내지 제 32 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 푸에라리아 (Pueraria)로부터의 자연 발생적 폴리펩티드인 세포.
  34. 제 33 항에 있어서, 이소프렌 신타아제 폴리펩티드가 푸에라리아 몬타나 (Pueraria montana)로부터의 자연 발생적 폴리펩티드인 세포.
  35. 제 4 항 내지 제 32 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 포풀루스 (Populus)로부터의 자연 발생적 폴리펩티드인 세포.
  36. 제 35 항에 있어서, 이소프렌 신타아제 폴리펩티드가 포풀루스 알바 (Populus alba)로부터의 자연 발생적 폴리펩티드인 세포.
  37. 제 35 항 또는 제 36 항에 있어서, MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 세포.
  38. 제 37 항에 있어서, MVK가 메타노사르키나로부터의 폴리펩티드인 세포.
  39. 제 38 항에 있어서, MVK가 메타노사르키나 마제이로부터의 폴리펩티드인 세포.
  40. 제 1 항 내지 제 39 항 중 어느 한 항에 있어서, 세균 세포인 세포.
  41. 제 40 항에 있어서, 그람-양성 세균 세포인 세포.
  42. 제 41 항에 있어서, 바실러스 (Bacillus) 세포인 세포.
  43. 제 42 항에 있어서, 바실러스 서브틸리스 (Bacillus subtilis) 세포인 세포
  44. 제 40 항에 있어서, 그람-음성 세균 세포인 세포.
  45. 제 44 항에 있어서, 에스케리키아 (Escherichia) 또는 판토에아 (Pantoea) 세포인 세포.
  46. 제 45 항에 있어서, 에스케리키아 콜리 (Escherichia coli) 또는 판토에아 시트레아 (Pantoea citrea) 세포인 세포.
  47. 제 1 항 내지 제 39 항 중 어느 한 항에 있어서, 진균 세포인 세포.
  48. 제 47 항에 있어서, 트리코데르마 (Trichoderma) 세포인 세포.
  49. 제 48 항에 있어서, 트리코데르마 레에세이 (Trichoderma reesei) 세포인 세포.
  50. 제 47 항에 있어서, 효모 세포인 세포.
  51. 제 50 항에 있어서, 야로위야 (Yarrowia) 세포인 세포.
  52. 제 51 항에 있어서, 야로위야 리포리티카 (Yarrowia lipolytica) 세포인 세포.
  53. 약 400 nmol/gwcm/시간 초과의 이소프렌을 생성하기에 충분한 조건 하에서 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  54. 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 야기하는 조건 하에 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  55. 세포 배양 배지로부터 세포가 소비하는 약 0.002 몰% 초과의 탄소를 이소프렌으로 변환시키기에 충분한 조건 하에 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  56. 이종 핵산이 프로모터에 작동가능하게 연결되며 세포에 의한 이소프렌의 생성이 약 400 nmol/gwcm/시간 초과인, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  57. 이종 핵산이 프로모터에 작동가능하게 연결되며 세포가 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  58. 이종 핵산이 프로모터에 작동가능하게 연결되며 세포 배양 배지로부터 세포가 소비하는 약 0.002 몰% 초과의 탄소가 이소프렌으로 변환되는, 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포를 배양하는 것을 포함하는 이소프렌 생성 방법.
  59. 하기를 포함하는 이소프렌 생성 방법:
    (a) 이소프렌을 생성하기에 적합한 배양 조건 하에 이소프렌 신타아제 폴리펩티드를 인코딩하는 이종 핵산을 포함하는 세포 {(i) 약 400 nmol/gwcm/시간 초과의 이소프렌을 생성하며, (ii) 세포 배양 배지로부터 세포가 소비하는 약 0.002 몰% 초과의 탄소를 이소프렌으로 변환시키거나, 또는 (iii) 약 0.1 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 세포}를 배양하고,
    (b) 이소프렌을 생성함.
  60. 제 53 항, 제 56 항 또는 제 59 항 중 어느 한 항에 있어서, 세포가 약 4.0 x 103 nmol/gwcm/시간 초과의 이소프렌을 생성하는 방법.
  61. 제 60 항에 있어서, 세포가 약 4.O x 104 nmol/gwcm/시간 초과의 이소프렌을 생성하는 방법.
  62. 제 61 항에 있어서, 세포가 약 1.5 x 105 nmol/gwcm/시간 초과의 이소프렌을 생성하는 방법.
  63. 제 53 항, 제 56 항 또는 제 59 항 중 어느 한 항에 있어서, 세포가 약 400 nmol/gwcm/시간 내지 약 2.0 x 105 nmol/gwcm/시간의 이소프렌을 생성하는 방법.
  64. 제 54 항, 제 57 항 또는 제 59 항 중 어느 한 항에 있어서, 세포가 약 100 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 방법.
  65. 제 64 항에 있어서, 세포가 약 1,000 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 방법.
  66. 제 65 항에 있어서, 세포가 약 1,500 mg/L브로쓰/시간 초과의 이소프렌의 평균 체적 생산성을 갖는 방법.
  67. 제 54 항, 제 57 항 또는 제 59 항 중 어느 한 항에 있어서, 약 0.1 내지 약 1,500 mg/L브로쓰/시간의 이소프렌의 평균 체적 생산성을 갖는 세포.
  68. 제 55 항, 제 58 항 또는 제 59 항 중 어느 한 항에 있어서, 세포가 약 0.05 몰% 초과의 탄소를 이소프렌으로 변환시키는 방법.
  69. 제 68 항에 있어서, 세포가 약 1 몰% 초과의 탄소를 이소프렌으로 변환시키는 방법.
  70. 제 69 항에 있어서, 세포가 약 10 몰% 초과의 탄소를 이소프렌으로 변환시키는 방법.
  71. 제 70 항에 있어서, 세포가 약 20 몰% 초과의 탄소를 이소프렌으로 변환시키는 방법.
  72. 제 55 항, 제 58 항 또는 제 59 항 중 어느 한 항에 있어서, 세포가 약 0.002 내지 약 25 몰%의 탄소를 이소프렌으로 변환시키는 방법.
  73. 제 53 항 내지 제 72 항 중 어느 한 항에 있어서, 세포에 의해 생성된 이소프렌을 회수하는 것을 추가로 포함하는 방법.
  74. 제 56 항 내지 제 73 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 식물 이소프렌 신타아제 폴리펩티드인 방법.
  75. 제 53 항 내지 제 74 항 중 어느 한 항에 있어서, 세포가 IDI 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 방법.
  76. 제 53 항 내지 제 75 항 중 어느 한 항에 있어서, 세포가 IDI 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함하는 방법.
  77. 제 53 항 내지 제 76 항 중 어느 한 항에 있어서, 세포가 DXS 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 방법.
  78. 제 53 항 내지 제 77 항 중 어느 한 항에 있어서, 세포가 DXS 폴리펩티드를 인코딩하는 내인성 핵산의 카피의 삽입물을 추가로 포함하는 방법.
  79. 제 53 항 내지 제 78 항 중 어느 한 항에 있어서, 세포가 IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 하나 이상의 핵산을 추가로 포함하는 방법.
  80. 제 79 항에 있어서, 한 핵산이 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 방법.
  81. 제 80 항에 있어서, 한 플라스미드가 이소프렌 신타아제 폴리펩티드, IDI 폴리펩티드 및 DXS 폴리펩티드를 인코딩하는 방법.
  82. 제 53 항 내지 제 81 항 중 어느 한 항에 있어서, 세포가 MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 방법.
  83. 제 82 항에 있어서, MVA 경로 폴리펩티드가 메발로네이트 키나아제 (MVK)인 세포.
  84. 제 83 항에 있어서, MVK가 메타노사르키나로부터의 폴리펩티드인 세포.
  85. 제 84 항에 있어서, MVK가 메타노사르키나 마제이로부터의 폴리펩티드인 세포.
  86. 제 56 항 내지 제 85 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 푸에라리아로부터의 자연 발생적 폴리펩티드인 방법.
  87. 제 86 항에 있어서, 이소프렌 신타아제 폴리펩티드가 푸에라리아 몬타나로부터의 자연 발생적 폴리펩티드인 방법.
  88. 제 56 항 내지 제 85 항 중 어느 한 항에 있어서, 이소프렌 신타아제 폴리펩티드가 포풀루스로부터의 자연 발생적 폴리펩티드인 방법.
  89. 제 88 항에 있어서, 이소프렌 신타아제 폴리펩티드가 포풀루스 알바로부터의 자연 발생적 폴리펩티드인 방법.
  90. 제 88 항 또는 제 89 항에 있어서, MVA 경로 폴리펩티드를 인코딩하는 이종 핵산을 추가로 포함하는 방법.
  91. 제 90 항에 있어서, MVK가 메타노사르키나로부터의 폴리펩티드인 세포.
  92. 제 91 항에 있어서, MVK가 메타노사르키나 마제이로부터의 폴리펩티드인 세포.
  93. 제 53 항 내지 제 92 항 중 어느 한 항에 있어서, 세포가 세균 세포인 방법.
  94. 제 93 항에 있어서, 세포가 그람-양성 세균 세포인 방법.
  95. 제 94 항에 있어서, 세포가 바실러스 세포인 방법.
  96. 제 95 항에 있어서, 세포가 바실러스 서브틸리스 세포인 방법.
  97. 제 93 항에 있어서, 세포가 그람-음성 세균 세포인 방법.
  98. 제 97 항에 있어서, 세포가 에스케리키아 또는 판토에아 세포인 방법.
  99. 제 98 항에 있어서, 세포가 에스케리키아 콜리 또는 판토에아 시트레아 세포인 방법.
  100. 제 53 항 내지 제 92 항 중 어느 한 항에 있어서, 세포가 진균 세포인 방법.
  101. 제 100 항에 있어서, 세포가 트리코데르마 세포인 방법.
  102. 제 100 항에 있어서, 세포가 트리코데르마 레에세이 세포인 방법.
  103. 제 100 항에 있어서, 세포가 효모 세포인 방법.
  104. 제 103 항에 있어서, 세포가 야로위야 세포인 방법.
  105. 제 104 항에 있어서, 세포가 야로위야 리포리티카 세포인 방법.
KR1020107015437A 2007-12-13 2008-12-15 이소프렌을 생성하기 위한 조성물 및 방법 KR20100118973A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US1357407P 2007-12-13 2007-12-13
US61/013,574 2007-12-13

Publications (1)

Publication Number Publication Date
KR20100118973A true KR20100118973A (ko) 2010-11-08

Family

ID=40756152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107015437A KR20100118973A (ko) 2007-12-13 2008-12-15 이소프렌을 생성하기 위한 조성물 및 방법

Country Status (13)

Country Link
US (5) US8288148B2 (ko)
EP (2) EP2235190B1 (ko)
JP (3) JP6049982B2 (ko)
KR (1) KR20100118973A (ko)
CN (2) CN102027124B (ko)
AU (1) AU2008334945C1 (ko)
BR (1) BRPI0823506A8 (ko)
CA (1) CA2709107A1 (ko)
DK (1) DK2235190T3 (ko)
MX (1) MX2010006576A (ko)
RU (1) RU2545699C2 (ko)
SG (2) SG191671A1 (ko)
WO (1) WO2009076676A2 (ko)

Families Citing this family (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2152854A2 (en) 2007-05-01 2010-02-17 Acidophil LLC Methods for the direct conversion of carbon dioxide into a hydrocarbon using a metabolically engineered photosynthetic microorganism
AU2008334945C1 (en) 2007-12-13 2013-09-05 Danisco Us Inc. Compositions and methods for producing isoprene
WO2009132220A2 (en) 2008-04-23 2009-10-29 Danisco Us Inc. Isoprene synthase variants for improved microbial production of isoprene
EP2307552B1 (en) * 2008-06-30 2022-10-26 The Goodyear Tire & Rubber Company Polymers of isoprene from renewable resources
MY156256A (en) * 2008-07-02 2016-01-29 Danisco Us Inc Compositions and methods for producing isoprene free of c5 hydrocarbons under decoupling conditions and/or safe operating ranges
EP2334788A1 (en) * 2008-09-15 2011-06-22 Danisco US Inc. Increased isoprene production using the archaeal lower mevalonate pathway
US20100184178A1 (en) * 2008-09-15 2010-07-22 Zachary Quinn Beck Increased isoprene production using mevalonate kinase and isoprene synthase
WO2010031068A1 (en) * 2008-09-15 2010-03-18 Danisco Us Inc. Reduction of carbon dioxide emission during isoprene production by fermentation
WO2010031079A1 (en) * 2008-09-15 2010-03-18 Danisco Us Inc. Systems using cell culture for production of isoprene
CN102333866B (zh) 2008-12-30 2015-04-29 丹尼斯科美国公司 生产异戊二烯和共同产物的方法
US8324442B2 (en) 2009-03-03 2012-12-04 Amyris, Inc. Microbial derived isoprene and methods for making the same
CA2759700A1 (en) 2009-04-23 2010-10-28 Danisco Us Inc. Three-dimensional structure of isoprene synthase and its use thereof for generating variants
TW201120213A (en) 2009-06-17 2011-06-16 Danisco Us Inc Polymerization of isoprene from renewable resources
TWI434921B (zh) * 2009-06-17 2014-04-21 Danisco Us Inc 從生物異戊二烯組合物製造燃料成分之方法及系統
TW201412988A (zh) * 2009-06-17 2014-04-01 Danisco Us Inc 使用dxp及mva途徑之改良之異戊二烯製造
US20110039323A1 (en) * 2009-08-14 2011-02-17 Eric Lawrence Singsaas Isoprene Production
MX2012003091A (es) 2009-09-23 2012-04-30 Danisco Us Inc Enzimas de glicosil hidrolasa novedosas y usos de las mismas.
JP5643838B2 (ja) * 2009-12-18 2014-12-17 ダニスコ・ユーエス・インク 再生可能資源からのイソプレンの精製
CA2785530A1 (en) * 2009-12-22 2011-06-23 Danisco Us Inc. Membrane bioreactor for increased production of isoprene gas
US9102952B2 (en) 2009-12-22 2015-08-11 Global Bioenergies Sa Process for the production of isoprenol from mevalonate employing a diphospho-mevolonate decarboxylase
CA2785480A1 (en) 2009-12-23 2011-06-30 Danisco Us Inc. Compositions and methods of pgl for the increased production of isoprene
AU2010333801B2 (en) 2009-12-23 2015-12-17 Danisco Us Inc. Methods for improving the efficiency of simultaneous saccharification and fermentation reactions
CN103080324B (zh) 2010-05-05 2019-03-08 基因组股份公司 用于丁二烯生物合成的微生物和方法
US8933282B2 (en) 2010-06-17 2015-01-13 Danisco Us Inc. Fuel compositions comprising isoprene derivatives
CA2807558A1 (en) 2010-08-06 2012-02-09 Danisco Us Inc. Production of isoprene under neutral ph conditions
WO2012058494A2 (en) 2010-10-27 2012-05-03 Danisco Us Inc. Isoprene synthase variants for improved production of isoprene
CN102559769B (zh) * 2010-12-20 2014-07-30 中国科学院青岛生物能源与过程研究所 一种制备异戊二烯的重组细胞及其制备方法
BR112013016264A2 (pt) 2010-12-22 2018-06-19 Danisco Us Inc produção biológica de açúcares de pentose com o uso de células recombinantes
BR112013018316A2 (pt) 2010-12-22 2018-09-11 Danisco Us Inc composições e métodos para produção aprimorada de isopreno usando dois tipos de enzimas ispg
AU2012220719A1 (en) * 2011-02-23 2013-03-28 Syngenta Participations Ag Potentiation of enzymatic saccharification
BR112013023757A2 (pt) 2011-03-17 2017-06-06 Danisco Us Inc método para redução de viscosidade no processo de sacarificação
US20140073017A1 (en) 2011-03-17 2014-03-13 Danisco Us Inc. Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars
AU2012249320A1 (en) 2011-04-29 2013-11-14 Danisco Us Inc. Recombinant microorganisms for enhanced production of mevalonate, isoprene, and isoprenoids
AU2012249389A1 (en) 2011-04-29 2013-11-14 Danisco Us Inc. Production of mevalonate, isoprene, and isoprenoids using genes encoding polypeptides having thiolase, HMG-CoA synthase and HMG-CoA reductase enzymatic activities
US9169486B2 (en) 2011-06-22 2015-10-27 Genomatica, Inc. Microorganisms for producing butadiene and methods related thereto
US8951767B2 (en) 2011-08-04 2015-02-10 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
CA2844064A1 (en) 2011-08-04 2013-02-07 Danisco Us Inc. Production of isoprene, isoprenoid precursors, and isoprenoids using acetoacetyl-coa synthase
US8951764B2 (en) 2011-08-05 2015-02-10 Danisco Us Inc. Production of isoprenoids under neutral pH conditions
CA2848972A1 (en) * 2011-09-16 2013-03-21 Genomatica, Inc. Microorganisms and methods for producing alkenes
DK2764084T4 (da) 2011-10-07 2021-12-06 Danisco Us Inc Anvendelse af phosphoketolase i fremstillingen af mevalonat, isoprenoid-udgangsstoffer, og isopren
WO2013052914A2 (en) * 2011-10-07 2013-04-11 Danisco Us Inc. Methods for increasing microbial production of isoprene, isoprenoids, and isoprenoid precursor molecules using glucose and acetate co-metabolism
WO2013053824A1 (en) 2011-10-11 2013-04-18 Metabolic Explorer New biosynthesis pathway for prenol in a recombinant microorganism
WO2013063528A2 (en) 2011-10-27 2013-05-02 Danisco Us Inc. Isoprene synthase variants with improved solubility for production of isoprene
AU2012357857B2 (en) 2011-12-20 2016-01-21 Scientist Of Fortune S.A. Production of 1,3-dienes by enzymatic conversion of 3-hydroxyalk-4-enoates and/or 3-phosphonoxyalk-4-enoates
EP2794876A1 (en) * 2011-12-23 2014-10-29 Danisco US Inc. Production of isoprene under reduced oxygen inlet levels
WO2013096683A2 (en) * 2011-12-23 2013-06-27 Danisco Us Inc. Enhanced production of isoprene using marine bacterial cells
US8975051B2 (en) 2011-12-23 2015-03-10 Danisco Us Inc. Enhanced production of isoprene using host cells having decreased ispA activity
WO2013096863A1 (en) * 2011-12-23 2013-06-27 The Regents Of The University Of California Constructs and methods for improved isoprene biosynthesis
US9315831B2 (en) 2012-03-30 2016-04-19 Danisco Us Inc. Direct starch to fermentable sugar as feedstock for the production of isoprene, isoprenoid precursor molecules, and/or isoprenoids
CA2867980A1 (en) * 2012-04-05 2013-10-10 Global Bioenergies Method for the enzymatic production of isoprenol using mevalonate as a substrate
US8895277B2 (en) 2012-05-02 2014-11-25 Danisco Us Inc. Legume isoprene synthase for production of isoprene
US9163263B2 (en) 2012-05-02 2015-10-20 The Goodyear Tire & Rubber Company Identification of isoprene synthase variants with improved properties for the production of isoprene
JP2015516173A (ja) * 2012-05-16 2015-06-11 グリコス バイオテクノロジーズ インコーポレイテッドGlycos Biotechnologies, Inc. イソプレン生産用微生物およびプロセス
CN104471061B (zh) * 2012-05-30 2018-06-22 株式会社普利司通 异戊二烯合酶和其编码基因以及用于产生异戊二烯单体的方法
US8962296B2 (en) 2012-05-30 2015-02-24 Bridgestone Corporation Isoprene synthase and gene encoding the same, and method for producing isoprene monomer
US20130323820A1 (en) 2012-06-01 2013-12-05 Lanzatech New Zealand Limited Recombinant microorganisms and uses therefor
WO2013181647A2 (en) 2012-06-01 2013-12-05 Danisco Us Inc. Compositions and methods of producing isoprene and/or industrrial bio-products using anaerobic microorganisms
US8703455B2 (en) * 2012-08-29 2014-04-22 Scientist of Fourtune, S.A. Production of volatile dienes by enzymatic dehydration of light alkenols
CA2886137C (en) 2012-10-23 2021-10-19 Sekisui Chemical Co., Ltd. Recombinant cell, and method for producing isoprene
WO2014076232A2 (en) * 2012-11-19 2014-05-22 Novozymes A/S Isopropanol production by recombinant hosts using an hmg-coa intermediate
BR112015014843A2 (pt) 2012-12-21 2017-10-10 Danisco Us Inc produção de isopreno, isoprenoide, e precursores de isoprenoide usando uma via de mevalonato inferior alternativa
CN104884609B (zh) * 2012-12-27 2018-05-08 积水化学工业株式会社 重组细胞、以及异戊二烯的生产方法
AU2014225631A1 (en) * 2013-03-07 2015-08-13 Calysta, Inc. Compositions and methods for biological production of isoprene
WO2014158590A1 (en) * 2013-03-14 2014-10-02 President And Fellows Of Harvard College Genetically modified bacteria
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
JP6439680B2 (ja) 2013-03-29 2018-12-19 味の素株式会社 発酵ガス中のイソプレンの回収方法および精製イソプレンの製造方法
CN105555952A (zh) 2013-04-10 2016-05-04 丹尼斯科美国公司 用于乙酰辅酶a-衍生代谢物、异戊二烯、类异戊二烯前体和类异戊二烯的改善生产的磷酸解酮酶
CN103232986B (zh) * 2013-05-27 2014-06-18 青岛蔚蓝生物集团有限公司 一种异戊二烯生产方法
CN103233044B (zh) * 2013-05-27 2014-08-06 青岛蔚蓝生物集团有限公司 一种异戊二烯的生产方法及其生产菌株
WO2014205355A2 (en) 2013-06-21 2014-12-24 Danisco Us Inc. Compositions and methods for clostridial transformation
RU2013146377A (ru) 2013-10-17 2015-04-27 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО "АГРИ") СПОСОБ ПОЛУЧЕНИЯ ИЗОПРЕНА С ИСПОЛЬЗОВАНИЕМ БАКТЕРИИ РОДА Bacillus
BR112016011006A2 (pt) 2013-11-22 2017-12-05 Ajinomoto Kk isopreno sintase modificada, polinucleotídeo, vetor de expressão, célula hospedeira, métodos para produzir uma isopreno sintase modificada, um monômero de isopreno modificado e um polímero de isopreno, polímero derivado de um monômero de isopreno, composição de borracha, e, pneu
EP3075843B1 (en) 2013-11-28 2019-07-03 Ajinomoto Co., Inc. Method for producing isoprene monomer
JP6744819B2 (ja) 2014-02-20 2020-08-19 ダニスコ・ユーエス・インク メバロン酸、イソプレン、イソプレノイド前駆体、イソプレノイド、およびアセチルCoA由来産物の生産向上のための組換え微生物
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
RU2014112066A (ru) 2014-03-28 2015-10-10 Адзиномото Ко., Инк. Способ получения мономерного изопрена
WO2016015021A1 (en) 2014-07-24 2016-01-28 The Regents Of The University Of California Oxidative starch degradation by a new family of pmos
CN112279744B (zh) * 2014-11-26 2023-08-15 维索利斯有限公司 用于生物学衍生的甲羟戊酸转化的方法
JP6720433B2 (ja) * 2015-02-18 2020-07-08 誠司 仲亀 イソプレンの製造方法
CN106554933A (zh) * 2015-09-30 2017-04-05 中国科学院上海生命科学研究院 异戊二烯基因工程生产菌及其应用
US10287569B2 (en) 2016-02-04 2019-05-14 Institute Of Microbiology, Chinese Academy Of Sciences Enzyme for biosynthesis of isoprene and isopentenyl, and mutant thereof
CN107365758B (zh) * 2016-05-12 2021-03-05 山东常青藤生物科技有限公司 五碳平台化合物合成基因及其应用
KR20190120238A (ko) 2017-02-06 2019-10-23 지머젠 인코포레이티드 발효에 의한 티라민의 제조를 위해 조작된 생합성 경로
WO2018147446A1 (ja) * 2017-02-10 2018-08-16 味の素株式会社 イソプレノイド化合物の製造方法
CN117402799A (zh) 2017-02-27 2024-01-16 积水化学工业株式会社 重组细胞、重组细胞的制备方法以及异戊二烯或萜烯的生产方法
CN110914416B (zh) 2017-04-27 2023-07-21 加州大学董事会 产生大麻素和大麻素衍生物的微生物和方法
US11452967B2 (en) 2017-07-17 2022-09-27 Zymergen Inc. Metal-organic framework materials
CN111699247A (zh) 2017-12-07 2020-09-22 齐默尔根公司 通过发酵产生(6e)-8-羟基香叶醇的经改造的生物合成途径
BR112020012704A8 (pt) 2017-12-21 2022-03-03 Zymergen Inc Nepetalactol oxidorredutases, nepetalactol sintases, e micróbios capazes de produzir nepetalactona
WO2020069142A1 (en) 2018-09-26 2020-04-02 Demetrix, Inc. Optimized expression systems for expressing berberine bridge enzyme and berberine bridge enzyme-like polypeptides
EP3861109A1 (en) 2018-10-05 2021-08-11 Ajinomoto Co., Inc. Method for producing target substance by bacterial fermentation
CN109482064A (zh) * 2018-11-22 2019-03-19 中国科学院北京综合研究中心 医疗废物焚烧烟气汞和二噁英深度处理系统
WO2020181091A1 (en) 2019-03-05 2020-09-10 Bp Corporation North America Inc. Fatty acyl-acp reductases and their uses
CA3140079A1 (en) 2019-05-22 2020-11-26 Demetrix, Inc. Optimized cannabinoid synthase polypeptides
BR112022004797A2 (pt) 2019-09-18 2022-06-21 Demetrix Inc Polipeptídeos otimizados de ácido tetra-hidrocanabinólico (thca) sintase
WO2021183448A1 (en) 2020-03-09 2021-09-16 Demetrix, Inc. Optimized olivetolic acid cyclase polypeptides
US20210340586A1 (en) * 2020-04-30 2021-11-04 Sutro Biopharma, Inc. Methods of Producing Full-Length Antibodies Using E. coli
CN113774092B (zh) * 2021-09-27 2022-11-08 哈尔滨工业大学(深圳) 一种由环境废水合成异戊二烯的方法
CN116121288B (zh) * 2023-03-27 2023-09-01 广东省科学院微生物研究所(广东省微生物分析检测中心) 一组克隆恶臭假单胞菌大片段dna的载体及其应用

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1344713A (en) 1915-12-02 1920-06-29 Westinghouse Electric & Mfg Co Reactance-coil
DE1793254A1 (de) 1968-08-23 1971-12-16 Bayer Ag Verfahren zur Gewinnung von Cyclopenten,Isopren und einem Diolefinstrom aus C?-Crackbenzinschnitten
CA1338400C (en) 1983-08-31 1996-06-18 David H. Gelfand Recombinant fungal cellulases
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
DE3338269A1 (de) 1983-10-21 1985-05-02 Basf Ag, 6700 Ludwigshafen Verfahren zur gewinnung von isopren aus einem c(pfeil abwaerts)5(pfeil abwaerts)-kohlenwasserstoffgemisch
GB8407828D0 (en) 1984-03-27 1984-05-02 Ontario Research Foundation In situ preparation
US4570029A (en) 1985-03-04 1986-02-11 Uop Inc. Process for separating isoprene
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
EP0625577A1 (en) 1985-08-29 1994-11-23 Genencor International, Inc. Heterologous polypeptides expressed in filamentous fungi, processes for their preparation, and vectors for their preparation
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
GB8610600D0 (en) 1986-04-30 1986-06-04 Novo Industri As Transformation of trichoderma
US4846872A (en) 1986-08-11 1989-07-11 Fujisawa Pharmaceutical Co., Ltd. Herbicide
US5322770A (en) 1989-12-22 1994-06-21 Hoffman-Laroche Inc. Reverse transcription with thermostable DNA polymerases - high temperature reverse transcription
US5545816A (en) 1990-03-02 1996-08-13 Amoco Corporation Phytoene biosynthesis in genetically engineered hosts
US5306862A (en) 1990-10-12 1994-04-26 Amoco Corporation Method and composition for increasing sterol accumulation in higher plants
DE69133612D1 (de) 1990-12-10 2009-04-02 Genencor Int Verbesserte Saccharifizierung von Zellulose durch Klonierung und Vervielfältigung des beta-Glukosidase Genes aus Trichoderma
RU2027760C1 (ru) * 1991-02-01 1995-01-27 Казанский институт биологии Способ получения жидких углеводородов
TW261517B (ko) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
WO1995004134A1 (en) 1993-08-02 1995-02-09 Genencor International, Inc. Method of reducing complex carbohydrates in fermentation products
US5861271A (en) 1993-12-17 1999-01-19 Fowler; Timothy Cellulase enzymes and systems for their expressions
US5686276A (en) 1995-05-12 1997-11-11 E. I. Du Pont De Nemours And Company Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
US5849970A (en) 1995-06-23 1998-12-15 The Regents Of The University Of Colorado Materials and methods for the bacterial production of isoprene
US5824774A (en) * 1996-04-12 1998-10-20 Board Of Trustees Of The University Of Kentucky Chimeric isoprenoid synthases and uses thereof
US8106260B2 (en) * 1996-04-12 2012-01-31 The Board Of Trustees Of The University Of Kentucky Chimeric isoprenoid synthases and uses thereof
DE19629568C1 (de) 1996-07-15 1998-01-08 Fraunhofer Ges Forschung Verfahren zur Herstellung von Isopren
WO1998031823A1 (en) 1997-01-17 1998-07-23 The Scripps Research Institute Rna binding protein and binding site useful for expression of recombinant molecules
EP2175025A1 (en) 1998-04-14 2010-04-14 Kyowa Hakko Bio Co., Ltd. Process for producing isoprenoid compounds by using microorganisms
US6176176B1 (en) 1998-04-30 2001-01-23 Board Of Trustees Operating Michigan State University Apparatus for treating cellulosic materials
AR022383A1 (es) 1998-09-18 2002-09-04 Univ Kentucky Res Found Sintasas
US6268328B1 (en) 1998-12-18 2001-07-31 Genencor International, Inc. Variant EGIII-like cellulase compositions
US6442536B1 (en) 2000-01-18 2002-08-27 Praxair Technology, Inc. Method for predicting flammability limits of complex mixtures
WO2001058839A1 (en) 2000-02-07 2001-08-16 Eastman Chemical Company Process to recover condensable gases from oxygen containing mixtures
KR20010084864A (ko) 2000-02-29 2001-09-06 김수언 개똥쑥의 아모파-4,11-디엔 합성효소, 이를 코딩하는유전자, 이 유전자를 포함하는 발현벡터 및, 이발현벡터로 형질전환된 대장균 및 식물체
US6270739B1 (en) 2000-06-16 2001-08-07 Eastman Chemical Company Process for the removal of carbon dioxide from 3,4-epoxy-1-butene process recycle streams
EP2292776A1 (en) 2000-07-31 2011-03-09 Danisco US Inc. Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms
US6553689B2 (en) 2000-09-24 2003-04-29 3M Innovative Properties Company Vapor collection method and apparatus
US6582914B1 (en) 2000-10-26 2003-06-24 Genencor International, Inc. Method for generating a library of oligonucleotides comprising a controlled distribution of mutations
EP1373472B1 (en) * 2001-04-03 2007-06-27 Biocept, Inc. Methods and gel compositions for encapsulating living cells and organic molecules
EP1373480B1 (en) 2001-04-04 2009-01-21 Genencor International, Inc. Uncoupled productive and catabolic host cell pathways
RU2197461C2 (ru) 2001-04-05 2003-01-27 Общество с ограниченной ответственностью "Еврохим-СПб-Трейдинг" Способ получения изопрена
ES2311613T3 (es) 2001-06-06 2009-02-16 Dsm Ip Assets B.V. Produccion mejorada de isoprenoides.
US6998471B2 (en) 2001-07-25 2006-02-14 E.I. Du Pont De Nemours And Company Polynucleotides encoding an acetyl-CoA acetyltransferase from Hevea brasiliensis, related products, and methods
US7192751B2 (en) 2001-12-06 2007-03-20 The Regents Of The University Of California Biosynthesis of amorpha-4,11-diene
US7172886B2 (en) 2001-12-06 2007-02-06 The Regents Of The University Of California Biosynthesis of isopentenyl pyrophosphate
AU2003225123A1 (en) 2002-04-22 2003-11-03 E. I. Du Pont De Nemours And Company Promoter and plasmid system for genetic engineering
US20050287655A1 (en) 2002-05-10 2005-12-29 Kyowa Hakko Kogyo Co., Ltd. Process for producing mevalonic acid
CN100471946C (zh) 2002-10-04 2009-03-25 纳幕尔杜邦公司 高产量生物生产1,3-丙二醇的方法
US20040219629A1 (en) 2002-12-19 2004-11-04 Qiong Cheng Increasing carotenoid production in bacteria via chromosomal integration
FR2850101B1 (fr) 2003-01-22 2007-03-02 Michelin Soc Tech Procede d'obtention d'une coupe c5 "fcc" enrichie en isoprene et polymerisation selective de l'isoprene a partir de cette coupe
DK1862539T3 (da) 2003-05-29 2012-05-14 Danisco Us Inc Nye trichodermagener
ES2323175T3 (es) 2003-06-12 2009-07-08 Dsm Ip Assets B.V. Mevalonato-quinasas resistentes a la retroalimentacion.
PL202927B1 (pl) 2003-07-20 2009-08-31 Carr Daniel R Peptyd i kompozycja farmaceutyczna oraz ich zastosowania medyczne
BRPI0416762A (pt) 2003-11-21 2007-02-27 Genencor Int expressão de enzimas hidrolisantes de amido granular em trinchoderma e processo para produzir glicose a partir de substratos de amido granular
US20070281332A1 (en) 2004-02-13 2007-12-06 Allan Svendsen Protease Variants
EP2365090A1 (en) * 2004-05-21 2011-09-14 The Regents of The University of California Method for enhancing production of isoprenoid compounds
MY140568A (en) 2004-06-18 2009-12-31 Shell Int Research A process for the production of an olefin oxide, a 1,2-diol, a 1,2-diol ether, or an alkanolamine
US8338155B2 (en) 2004-12-14 2012-12-25 Dsm Ip Assets B.V. Modified mevalonate kinase with reduced feedback inhibition
JP4117350B2 (ja) 2005-03-03 2008-07-16 富山県 機能改変フェニルアラニン脱水素酵素、およびこの酵素を用いた生体試料中のアミノ酸の分析方法
JP4446482B2 (ja) 2005-08-10 2010-04-07 独立行政法人産業技術総合研究所 ユーカリ・モノテルペン合成酵素遺伝子
EP1987147B1 (en) 2006-02-14 2010-07-28 Firmenich S.A. Method for producing terpenes and mep-transformed microorganisms therefore
WO2007136847A2 (en) 2006-05-19 2007-11-29 The Regents Of The University Of California Methods for increasing isoprenoid and isoprenoid precursor production by modulating fatty acid levels
AU2007267033B2 (en) 2006-05-26 2012-05-24 Amyris, Inc. Production of isoprenoids
US7947478B2 (en) 2006-06-29 2011-05-24 The Regents Of The University Of California Short chain volatile hydrocarbon production using genetically engineered microalgae, cyanobacteria or bacteria
JP2008035831A (ja) 2006-08-09 2008-02-21 Nitta Ind Corp 有用部分の生産性が高められた植物及びその作製方法
JP2008182950A (ja) 2007-01-30 2008-08-14 Hamamatsu Kagaku Gijutsu Kenkyu Shinkokai 柑橘類酵素遺伝子調製方法
EP2152854A2 (en) 2007-05-01 2010-02-17 Acidophil LLC Methods for the direct conversion of carbon dioxide into a hydrocarbon using a metabolically engineered photosynthetic microorganism
CN101778940B (zh) 2007-06-06 2017-04-05 丹尼斯科美国公司 改进多种蛋白质性质的方法
JP2010538616A (ja) 2007-09-11 2010-12-16 サファイア エナジー,インコーポレイティド 光合成生物による分子生成
WO2009064910A2 (en) 2007-11-13 2009-05-22 Synthetic Genomics, Inc. Dimethyloctane as an advanced biofuel
AU2008334945C1 (en) 2007-12-13 2013-09-05 Danisco Us Inc. Compositions and methods for producing isoprene
WO2009100231A2 (en) 2008-02-06 2009-08-13 The Regents Of The University Of California Short chain volatile isoprene hydrocarbon production using the mevalonic acid pathway in genetically engineered yeast and fungi
JP2009207402A (ja) 2008-03-04 2009-09-17 Shizuokaken Koritsu Daigaku Hojin 組換えサビネン合成酵素及びその利用
WO2009132220A2 (en) 2008-04-23 2009-10-29 Danisco Us Inc. Isoprene synthase variants for improved microbial production of isoprene
EP2307552B1 (en) 2008-06-30 2022-10-26 The Goodyear Tire & Rubber Company Polymers of isoprene from renewable resources
MY156256A (en) 2008-07-02 2016-01-29 Danisco Us Inc Compositions and methods for producing isoprene free of c5 hydrocarbons under decoupling conditions and/or safe operating ranges
EP2340312A2 (en) 2008-09-15 2011-07-06 Danisco US Inc. Conversion of prenyl derivatives to isoprene
WO2010031079A1 (en) 2008-09-15 2010-03-18 Danisco Us Inc. Systems using cell culture for production of isoprene
WO2010031068A1 (en) 2008-09-15 2010-03-18 Danisco Us Inc. Reduction of carbon dioxide emission during isoprene production by fermentation
EP2334788A1 (en) 2008-09-15 2011-06-22 Danisco US Inc. Increased isoprene production using the archaeal lower mevalonate pathway
US20100184178A1 (en) 2008-09-15 2010-07-22 Zachary Quinn Beck Increased isoprene production using mevalonate kinase and isoprene synthase
CN102333866B (zh) * 2008-12-30 2015-04-29 丹尼斯科美国公司 生产异戊二烯和共同产物的方法
CA2759700A1 (en) 2009-04-23 2010-10-28 Danisco Us Inc. Three-dimensional structure of isoprene synthase and its use thereof for generating variants
GB2459392B (en) 2009-05-29 2010-04-07 Softbox Systems Ltd Transport container
US9716308B2 (en) 2012-02-13 2017-07-25 The United States Of America, As Represented By The Secretary Of The Navy Wideband multi-function phased array antenna aperture
WO2014143526A1 (en) 2013-03-15 2014-09-18 Univation Technologies, Llc Polymer products and multi-stage polymerization processes for the production thereof

Also Published As

Publication number Publication date
US8709785B2 (en) 2014-04-29
EP2235190B1 (en) 2018-06-13
RU2010128902A (ru) 2012-01-20
RU2545699C2 (ru) 2015-04-10
US20130071908A1 (en) 2013-03-21
BRPI0823506A8 (pt) 2018-05-15
AU2008334945C1 (en) 2013-09-05
US9909144B2 (en) 2018-03-06
EP2235190A2 (en) 2010-10-06
JP2015091252A (ja) 2015-05-14
JP6049982B2 (ja) 2016-12-21
US10626420B2 (en) 2020-04-21
SG162265A1 (en) 2010-07-29
BRPI0823506A2 (pt) 2012-07-10
CN105368764A (zh) 2016-03-02
EP2235190A4 (en) 2011-07-13
CN105368764B (zh) 2019-03-12
CN102027124A (zh) 2011-04-20
CN102027124B (zh) 2015-11-25
US8288148B2 (en) 2012-10-16
JP6262125B2 (ja) 2018-01-17
US20180273982A1 (en) 2018-09-27
SG191671A1 (en) 2013-07-31
WO2009076676A2 (en) 2009-06-18
US20090203102A1 (en) 2009-08-13
US20130078699A1 (en) 2013-03-28
JP2017123856A (ja) 2017-07-20
JP2011505841A (ja) 2011-03-03
WO2009076676A3 (en) 2009-08-13
CA2709107A1 (en) 2009-06-18
AU2008334945B2 (en) 2013-06-27
MX2010006576A (es) 2010-10-15
DK2235190T3 (en) 2018-07-23
US9260727B2 (en) 2016-02-16
US20160281113A1 (en) 2016-09-29
AU2008334945A1 (en) 2009-06-18
EP3354740A1 (en) 2018-08-01
AU2008334945B8 (en) 2013-07-04

Similar Documents

Publication Publication Date Title
DK2443163T3 (en) POLYMERIZATION OF ISOPREN FROM RENEWABLE RESOURCES
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110038087A (ko) 재생가능 자원으로부터의 이소프렌 중합체
KR20110076868A (ko) 분리 조건 및/또는 안전한 작업 범위 하에서의 c5 탄화수소가 없는 이소프렌의 제조 방법 및 조성물
KR20110122672A (ko) 이소프렌 및 공-산물을 제조하는 방법
AU2016203445B2 (en) Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
KR20120047908A (ko) 이소프렌 유도체들을 포함하는 연료 조성물들
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
AU2021203008A1 (en) Genetically engineered bacterium comprising energy-generating fermentation pathway
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
DK2576605T3 (en) PREPARATION OF METABOLITES
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20130087013A (ko) 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매
KR20130032897A (ko) 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
KR20120117990A (ko) 삼투조절물질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
IL236992A (en) Genetically modified cyanobacteria that produce ethanol

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application