KR20140093981A - 아세틸-코엔자임 a로부터 유래되는 이소프레노이드의 제조 방법 - Google Patents
아세틸-코엔자임 a로부터 유래되는 이소프레노이드의 제조 방법 Download PDFInfo
- Publication number
- KR20140093981A KR20140093981A KR1020147015594A KR20147015594A KR20140093981A KR 20140093981 A KR20140093981 A KR 20140093981A KR 1020147015594 A KR1020147015594 A KR 1020147015594A KR 20147015594 A KR20147015594 A KR 20147015594A KR 20140093981 A KR20140093981 A KR 20140093981A
- Authority
- KR
- South Korea
- Prior art keywords
- coa
- host cell
- enzyme
- genetically modified
- ala
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1288—Transferases for other substituted phosphate groups (2.7.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P23/00—Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01034—Hydroxymethylglutaryl-CoA reductase (NADPH) (1.1.1.34)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0101—Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/08—Transferases for other substituted phosphate groups (2.7.8)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 숙주 세포에서 아세틸-CoA-유래 이소프레노이드를 이종적으로 제조하기 위한 조성물과 방법을 제공한다. 일부 구현예들에서, 숙주 세포는 아세트알데하이드 데하이드로게나제, 아세틸화 (ADA, E.C. 1.2.1.10)를 코딩하는 이종의 뉴클레오티드 서열과 NADH-가용성 HMG-CoA 리덕타제를 포함하는 MEV 경로를 포함하도록 유전자 변형된다. 일부 구현예들에서, 숙주 세포는 ADA를 코딩하는 이종의 뉴클레오티드 서열과 아세토아세틸-CoA 신타제를 포함하는 MEV 경로를 포함하도록 유전자 변형된다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포케톨라제 및 포스포트랜스아세틸라제를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 더 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 천연적인 PDH-바이패스의 기능적 파괴를 더 포함한다. 본원에 기술된 조성물과 방법은 아세틸-CoA-유래 이소프레노이드를 이종적으로 생산하기 위한 에너지 효율적이며 레독스 균형적인 경로를 제공한다.
Description
본 출원은 2011년 11월 9일자 미국 가출원 번호 61/557,893호에 대해 우선권을 주장하며, 이 문헌의 전체 내용이 원용에 의해 본 발명에 포함된다.
본 발명은 조작된 숙주 세포에서 아세틸-CoA 유래 이소프레노이드를 제조하기 위한 조성물 및 방법에 관한 것이다.
아세틸 코엔자임 A (아세틸-CoA)는 폴리케티드, 지방산, 이소프레노이드, 페놀계, 알칼로이드, 비타민 및 아미노산 등의 필수적인 생물학적 화합물의 합성시, 중요한 중간산물이다. 특히 아세틸-CoA로부터 유래된 대사산물들은 공업적으로 유용한 화합물을 비롯하여 일차 및 이차 대사산물이다. 예를 들어, 이소프레노이드는 제약학적 제품에, 그리고 생물 연료로서, 식품 첨가제로서, 그리고 그외 특수 화학제로서 사용된다. 이소프레노이드 산물은, 비규칙적인 이소프레노이드와 폴리테르펜도 보고된 바 있지만, 전형적으로는 5 탄소의 이소펜테닐 다이포스페이트 (IPP) 단위가 반복되어 구성된다. 이소프레노이드는, 천연적으로, 이의 전구체 IPP와 이의 이성질체인 다이메틸알릴 피로포스페이트 (DMAPP)의 연속적인 축합을 통해 합성된다. 이들 전구체에 대해서는 2가지 경로가 알려져 있다. 원핵 생물은, 몇 종을 제외하고는, 전형적으로, 데옥시자일룰로스-5-포스페이트 (DXP) 경로를 사용하여 피루베이트와 글리세르알데하이드 3-포스페이트 (G3P)를 IPP와 DMAPP로 변환한다. 진핵 생물의 경우, 식물을 제외하고는, 일반적으로, 메발로네이트-의존성 (MEV) 경로를 이용하여 아세틸-CoA를 IPP로 변환하며, IPP는 DMAPP로 이성질체화된다.
단세포성 진균인 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)와 이와 비슷한 유기체들은 2가지 내인성 경로를 이용하여 아세틸-CoA를 합성한다. 한가지 경로는 미토콘드리아 매트릭스에서 이루어지는데, PDH 복합체가 당분해 반응을 통해 글루코스로부터 발생된 피루베이트의 산화적 데카르복시화를 촉매함으로써, 아세틸-CoA가 합성된다. PDH 복합체는 60개의 폴리펩타이드 체인, 즉 리포아미드 리덕타제-트랜스아세틸라제 체인 24개, 다이하이드롤리필 데하이드로게나제 체인 12개 및 피루베이트 탈카르복실라제 체인 12개로 이루어져 있다. 이 거대 복합체는 피루베이트를 아세틸-CoA로 변환하면서 부산물로서 NADH를 생성한다. 발생된 아세틸-CoA는 이후 에너지 생산을 위해 시트르산 사이클을 통해 CO2와 H2O로 완전히 산화되거나, 또는 미토콘드리아에서 수행되는 생합성 반응에 이용될 수 있다.
미코콘드리아에서 만들어지는 아세틸-CoA는 미토콘드리아 막을 통해 세포질로 이동할 수 없다. 그래서, 주요 일차 및 이차 대사산물을 생합성하는데 필요한 세포질 아세틸-CoA를 만들어내기 위해, 사카로마이세스 세레비지애는 "PDH-바이패스"라고 하는 세포질에 위치한 독립적인 기전을 이용한다. 이 다단계 경로는 다음과 같은 반응을 촉매한다: (1) 피루베이트 데카르복실라제 (PDC, EC 4.1.1.1)에 의한 피루베이트의 아세트알데하이드로의 데카르복시화; (2) NADP+ 한개를 NADPH 한개로 환원하는 아세트알데하이드 데하이드로게나제 (ACDH, EC 1.2.1.5 및 EC 1.2.1.4)에 의한 아세트알데하이드의 아세테이트로의 변환; 및 (3) 2 ATP를 2 ADP로 가수분해하는 것과 에너지가 동일한, 1 ATP를 1 AMP로 가수분해하는, 아세틸-CoA 신테타제 (ACS, EC 6.2.1.1)에 의한 아세테이트와 CoA로부터 아세틸-CoA의 합성.
자연은 아세틸-CoA로부터 유래되는 다수의 생분자를 추출함에 있어 수율이 낮은 소스만 제공하기 때문에, 유전자 변형된 미생물을 이용한 발효학적 제조 방법에 이들의 제조 방법으로서 유망한 대안책이다. 그러나, 아세틸-CoA 중간산물을 생산하기 위해 천연적인 아세틸-CoA 경로를 이용하는 방법에는 몇가지 한계가 있다. 예를 들어, 천연적인 MEV 경로를 통해 이소프레노이드를 생산하기 위해서는, 도 1에 도시된 바와 같이, 생산되는 메발로네이트 각 분자 당 아세틸-CoA 분자 3개와 NADPH 2개의 산화가 요구된다. PDH-바이패스는 생성되는 아세틸-CoA 당 NADPH 1개를 생성하지만, 이 과정에서 ATP는 2 당량이 소비된다. 그래서, NADPH 생성은 천연적인 MEV 경로의 조인자 요구성 측면에서는 유익하지만, 생성되는 메발로네이트 당 ATP 6개가 소모되고, 예컨대, 생성물의 수율을 희생하면서까지 더 많은 탄소원들을 TCA 사이클 및 산화적 인산화를 통한 ATP 합성에 사용하여야 하므로, 에너지 측면에서 비효율적인 반응이다.
즉, 아세틸-CoA로부터 유래되는 화합물들을 효율적으로 제조하는 생산 숙주를 설계함에 있어, 문제점들 중 하나는 ATP 요구량을 최소화하면서도 생합성 경로의 요건과 조인자를 총족시키도록 아세틸-CoA 생산을 최적화하는 것이다. 본원에 제시된 조성물과 방법은 이러한 과제를 해결하며, 아울러 관련 이점을 제공한다.
본원에 기술된 조성물 및 방법은, 에너지 효율적이고 조인자 측면에서 균형적인, 아세틸-CoA 유래 이소프레노이드의 제조를 제공한다. 아세틸-CoA를 세포질에서 생산하기 위한 PDH-바이패스의 대안으로서, 이종의 아실화 아세트알데하이드 데하이드로게나제 (다른 예로, "아세틸알데하이드 데하이드로게나제, 아세틸화," "아세틸알데하이드 데하이드로게나제, 아실화," 또는 "ADA" (EC 1.2.1.10))를 이용함으로써, 제조되는 아세틸-CoA 분자 당 ATP 2 당량을 절약한다. ADA는 ATP를 소비하지 않고도 아세트알데하이드를 아세틸-CoA로 직접 변환하는데, 이 과정에서 1개의 NAD+가 1개의 NADH로 환원된다.
PDH-바이패스를 ADA로 대체함으로써 달성되는 ATP 절약은 생성물의 수율을 보다 높이는 방향으로 사용될 수 있지만, 천연적인 메발로네이트 경로와 ADA를 조합하여 사용하는 방법에는 잠재적인 문제점들이 존재한다. 첫번째로, 천연 PDH-바이패스의 불활성화는 NADPH 소스 하나를 없애게 되며, ADA에 의해 촉매되는 반응을 통해 NADH가 제조된다. 즉, 추가적인 경로의 변형 없이 PDH-바이패스를 ADA로 치환하면, NADPH를 소비하는 이소프레노이드 합성에 레독스 불균형이 발생하게 된다.
두번째로, ADA는 다음과 같은 가역적인 반응을 촉매한다:
아세트알데하이드 + NAD+ + 코엔자임 A ⇔ 아세틸-CoA + NADH + H+
아세틸-CoA를 형성하는 천연적인 PDH-바이패스 반응은, ATP를 AMP로 가수분해하는 반응과 커플링되어 있어, 열역학적으로 우호적이다. 반면에, ADA 반응은 ATP와 커플링되어 있지 않으며, 아세틸-CoA를 형성함에 있어 천연적인 PDH-바이패스 반응 보다 평형에 훨씬 더 근접해 있다. 따라서, ADA에 의해 촉매되는 반응은 아세트알데하이드를 아세틸-CoA로 변환하는데 보다 낮은 열역학적 구동력을 가지므로, 추가적으로 경로를 변형하지 않으면 ADA에 의한 이론적인 에너지 획득은 실현되지 않을 수 있다.
본원에 기술된 조성물 및 방법은 이런 문제들을 해결한다. 일부 구현예들에서, PDH-바이패스를 ADA로 치환함으로써 발생되는 레독스 불균형을 해결하기 위해, 유전자 변형된 숙주 세포는 이소프레노이드 경로에서 ADA에 의해 생성되는 NADH를 소비하는데 NADH-가용성 효소 (NADH-가용성 효소)를 추가로 활용한다. 따라서, ADA-매개에 의한 아세트알데하이드의 아세틸-CoA로의 변환으로 생성되는 NADH 풀은 이소프레노이드 합성에 직접 활용될 수 있다. 일부 구현예들에서, NADH-가용성 효소는 이소프레노이드 경로에서 비-천연적인 효소이다. 예를 들어, NADH-가용성 효소는 이소프레노이드 경로의 천연적인 NADPH-가용성 효소를 대체할 수 있다. 특정 구현예에서, NADH-가용성 효소는 HMG-CoA를 메발로네이트로 변환하는 NADH-가용성 3-하이드록시-3-메틸글루타릴-CoA 리덕타제 (HMG-CoA 리덕타제)이다.
일부 구현예들에서, ADA 반응에서 낮은 열역학적 구동력을 해결하기 위해, 유전자 변형된 숙주 세포는 메발로네이트 경로에서 제1 단계로서 아세틸-CoA 바로 다음 차례에 열역학적으로 유리한 반응을 추가로 이용하여, ADA 반응에 풀 온 (pull on)을 제공한다. 일부 구현예들에서, 아세틸-CoA로부터 아세토아세틸-CoA의 형성은 아세토아세틸-CoA 신타제 (AACS; 다른 예로, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제로 지칭됨)에 의해 촉매된다. AACS에 의해 촉매되는 반응은, 아세틸-CoA 카르복실라제에 의한 말로닐-CoA 생성으로부터 발생되는 ATP 1 분자의 가수분해로 인해 (도 5), 천연 메발로네이트 경로의 아세틸-CoA 티올라제에 의해 촉매되는 반응 보다 열역학적으로 더 유리하다. 즉, AACS는 ADA 반응을 정방향으로 구동하기 위한 보다 강력한 견인력을 아세틸-CoA에 제공한다.
이러한 변형과 조합하여 이종의 ADA를 이용하는 이점은 MEV 경로를 포함하는 숙주 세포에서의 세스퀴테르펜 파르네센의 이론적인 수율 개선으로 설명된다. 천연적인 메발로네이트 경로를 통한 이소프레노이드 제조는 도 1과 도 2에 예시된다. 도 3에 나타낸 바와 같이, 세포질 아세틸-CoA가 천연적인 효모 대사 네트워크에서 이루어지는 화학 반응만을 이용하여 글루코스로부터 합성되는 경우, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환시 잠재적인 최대 화학량론적 수율은 23.6 wt%이며, 파르네센 1 분자를 합성하는데 글루코스 분자 4.77개가 요구된다. 파르네센 분자 1개 당 ATP 27개가 필요한데, 이 중 18개는 PDH-바이패스를 통해 아세트알데하이드로부터 세포질 아세틸-CoA를 합성하는데 소모된다. 그러나, 도 4에 예시된 바와 같이, ADA와 NADH-가용성 HMG-CoA 리덕타제에 의해 촉매되는 반응을 메발로네이트를 제조하는 대사 네트워크에 도입하면, 최대 이론적인 화학량론적 수율은 25.2 wt%로 개선된다. 특히, ADA는 ATP 투입 없이도 아세트알데하이드를 아세틸-CoA로 변환하는데; 이는 파르네센을 합성하는데 필요한 ATP 당량을 9개로 낮추므로써, 합성되는 파르네센 분자 1개 당 ATP 18 당량을 절약한다 (2 ATP 당량 / 아세틸-CoA x 9 아세틸-CoA / 1 파르네센). 아세틸-CoA 제조 중에 이루어지는 이러한 ATP 소비 절약은 파르네센을 제조하기 위해 TCA 사이클을 구동하기 위한 세포의 산소 요구성을 소거시킨다. 글루코스를 파르네센으로 변환하기 위한 산소 요구량을 글루코스 당 소비되는 O2 분자를 7.8개에서 6개로 감소시킴으로써, 발효기에 산소를 공급하는데 따른 주된 제조 단가를 일정한 규모로 떨어뜨린다. 아울러, 레독스 불균형은 ADA에 의해 생성된 NADH를 소비하는 NADH-가용성 HMG-CoA 리덕타제의 공동-도입에 의해 완화된다.
도 4에 나타낸 바와 같이, ADA 및 NADH-가용성 HMG-CoA 리덕타제 둘다를 포함하는 균주에는 ATP가 화학량론적 과잉으로 발생되며, 세포는 이를 유지와 생육에 이용할 수 있다. 다른 예로, 이러한 과잉의 ATP 중 일부는, 아세토아세틸-CoA 신타제 (AACS)를 도입함으로써, 아세토아세틸-CoA 제조의 카이네틱스를 개선시키는 방향으로 활용할 수 있다. 도 5에 예시된 바와 같이, AACS는 말로닐-CoA 및 아세틸-CoA로부터 아세토아세?-CoA를 합성하는 효소이다. 말로닐-CoA를 합성하는데에는 변환된 아세틸-CoA 1 분자 당 ATP 1개의 에너지 투입이 요구된다 (아세틸-CoA 카르복실라제에 의해 촉매되며, 아세틸-CoA로부터 아세토아세틸-CoA를 합성하기 위한 열역학적 구동력이 개선됨). 중요한 점은, 도 6에 예시된 바와 같이, 이것은 이 균주 설계에서 이용가능한 과잉의 ATP가 여전히 존재하기 때문에, 그 경로의 당 또는 산소 요구량이 파르네센의 최대 화학량론적 수율에 영향을 미치지 않는다는 것이다.
도 7에 나타낸 바와 같이, 부가적인 효과는 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA) 효소의 도입을 통해 달성될 수 있다. PK 및 PTA는 프럭토스-6-포스페이트 (F6P) 또는 자일룰로스-5-포스페이트 (X5P)를 아세틸-CoA로 변환하는 반응을 촉매한다. 이들 이용가능한 대사 경로를 이용하여, 가장 바람직하게는, 반응 네트워크는 최대 이론적인 수율에서 현저하게 증가된 중량 (mass) 수율 29.8 wt% 또는 그 이상에 도달할 수 있다. 이 해법은 탄소를 저 당분해 (lower glycolysis) (G3P → 피루베이트)로부터 전환 (divert)시키는 단계를 포함하며, 이로써 ATP 및 NADH는 적게 생성되지만, 이 둘다 ADA 및 NADH-가용성 HMG-CoA 리덕타제 변형을 포함하는 네트워크에 이미 과량으로 존재한다. 저 당분해를 통한 흐름 (flux)을 줄이는 한가지 이점은, 피루베이트에서 아세트알데하이드로의 변환시 CO2가 적게 발생되며, 따라서, 최종 산물에 더 많은 탄소가 포획됨으로써, 네트워크의 최대 이론적인 수율을 높일 수 있다는 것이다. 두번째 이점은, NADH가 적게 생성되므로, 이를 재산화하는데 산소가 훨씬 적게 필요하다는 것이다. 특히, 가장 바람직한 산소 요구량은 소비되는 글루코스 1 분자 당 O2 분자 1.84개에 불과하다. 글리세롤 생산이 야생형 수준으로 돌아가는 경우, 도 13에 예시된 바와 같이, ADA 백그라운드에 PK 및 PTA를 부가함으로써 발생되는 레독스 충격은 마이크로스케일의 낮은 수율에서도 명백하다.
따라서, 본 발명은 아세틸-CoA-유래 이소프레노이드를 제조하기 위한 유전자 변형된 숙주 세포 및 이의 이용 방법을 제공한다. 일 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; 및 (b) 아실화 아세틸알데하이드 데하이드로게나제를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 만드는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제 (즉, 아세토아세틸-CoA 신타제 (AACS))를 포함한다.
일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 NADH-가용성 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 NADH를 사용하는 HMG-CoA 리덕타제를 포함한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포케톨라제를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 포스포트랜스아세틸라제를 코딩하는 이종의 핵산을 추가로 포함한다.
일부 구현예들에서, ADA의 아미노산 서열은 서열번호 2와 80% 이상 동일하다. 일부 구현예들에서, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제의 아미노산 서열은 서열번호 16과 80% 이상 동일하다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제의 아미노산 서열은 서열번호 20과 80% 이상 동일하다. 일부 구현예들에서, 포스포케톨라제의 아미노산 서열은 서열번호 12와 80% 이상 동일하다. 일부 구현예들에서, 포스포트랜스아세틸라제의 아미노산 서열은 서열번호 14와 80% 이상 동일하다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 천연적인 피루베이트 데하이드로게나제 (PDH)-바이패스의 하나 이상의 효소에 대한 기능적 파괴 (functional disruption)를 추가로 포함한다. 일부 구현예들에서, PDH-바이패스의 하나 이상의 효소는 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로부터 선택된다. 일부 구현예들에서, ACS1이 기능적으로 파괴된다. 일부 구현예들에서, ACS2가 기능적으로 파괴된다. 일부 구현예들에서, ALD6가 기능적으로 파괴된다. 일부 구현예들에서, ACS1 및 ACS2가 기능적으로 파괴된다. 일부 구현예들에서, ACS1, ACS2 및 ALD6가 기능적으로 파괴된다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 알코올 데하이드로게나제 (ADH) 활성을 가진 하나 이상의 효소에 대한 기능적 파괴를 더 포함한다. 일부 구현예들에서, ADH 활성을 가진 하나 이상의 효소는 알코올 데하이드로게나제 1 (ADH1), 알코올 데하이드로게나제 3 (ADH3), 알코올 데하이드로게나제 4 (ADH4) 및 알코올 데하이드로게나제 5 (ADH5)로부터 선택된다.
일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 분자 2개를 축합하여 아세토아세틸-CoA를 합성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 합성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로부터 선택된다.
일부 구현예들에서, 숙주 세포는 MEV 경로의 효소 전체를 코딩하는 복수의 이종의 핵산을 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산은 단일한 전사 조절인자의 통제를 받는다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산은 복수의 이종의 전사 조절인자들의 통제를 받는다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 합성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 합성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다. 일부 구현예들에서, IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 합성할 수 있는 효소는 카렌 신타제, 게라니올 신타제, 리날롤 신타제, 리모넨 신타제, 미르센 신타제, 옥시멘 신타제, α-피넨 신타제, β-피넨 신타제, γ-테르피넨 신타제, 테르피놀렌 신타제, 아모르파디엔 신타제, α-파르네센 신타제, β-파르네센 신타제, 파르네솔 신타제, 네롤리돌 신타제, 패출리올 (patchouliol) 신타제, 노트카톤 (nootkatone) 신타제, 및 아비에타디엔 신타제로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 이소프레노이드는 헤미테르펜, 모노테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 세스퀴테르펜 및 폴리테르펜으로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 이소프레노이드는 C5-C20 이소프레노이드이다. 일부 구현예들에서, 이소프레노이드 아비에타디엔, 아모르파디엔, 카렌, α-파르네센, β-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, β-피넨, 사비넨, γ-테르피넨, 테르피놀렌 및 발렌센으로 이루어진 군으로부터 선택된다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 효모 세포이다. 일부 구현예들에서, 효모는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)이다.
다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 상기 한가지 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및 (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소에 대한 기능적 파괴를 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 상기 한가지 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산으로서, 여기서 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및 (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소에 대한 기능적 파괴를 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
다른 측면에서, 본 발명은, (a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 복수의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 여기서 복수의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제와 NADH-가용성의 HMG-CoA 리덕타제를 포함함; (b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; (c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴; (d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및 (e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는, 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
다른 측면에서, 본 발명은, (a) 이소프레노이드 화합물을 합성하는데 적합한 조건에서 탄소원이 구비된 배지에서 본원에 기술된 유전자 변형된 효모 세포 개체군을 배양하는 단계; 및 (b) 상기 배지로부터 상기 이소프레노이드 화합물을 회수하는 단계를 포함하는, 이소프레노이드 제조 방법을 제공한다.
도 1은 이소펜테닐 다이포스페이트 ("IPP")를 제조하기 위한 메발로네이트 ("MEV") 경로를 개략적으로 도시한 것이다.
도 2는 IPP 및 다이메틸알릴 피로포스페이트 ("DMAPP")를 게라닐 피로포스페이트 ("GPP"), 파르네실 피로포스페이트 ("FPP") 및 게라닐게라닐 피로포스페이트 ("GGPP")로 변환하는 과정을 개략적으로 도시한 것이다.
도 3은 세포질 아세틸-CoA를 "야생형" PDH-바이패스를 통해 합성하는, 메발로네이트 경로를 통한, 글루코스의 파르네센으로의 변환에 있어 탄소 및 대사 요구량의 최적 흐름에 대한 개략적인 도시와 수율을 나타낸 것이다.
도 4는 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 5는 아세토아세틸-CoA (AcAcCoA)가 아세토아세틸-CoA 신타제 (AACS)에 의해 말로닐-CoA와 아세틸-CoA (AcCoA)로부터 합성되는, 아세틸-CoA로부터 파르네센의 합성을 개략적으로 도신한 것이다. 말로닐-CoA 합성에는 변환되는 아세틸-CoA 1 분자 당 ATP 1개의 에너지 투입이 요구된다 (아세틸-CoA 카르복실라제 (ACC1)에 의해 촉매됨).
도 6은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 아세토아세틸-CoA가 아세토아세틸-CoA 신타제에 의해 말로닐-CoA와 아세틸-CoA로부터 합성되는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 7은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)가 프럭토스-6-포스페이트 (F6P)의 아세틸-CoA로의 변환하는 반응을 촉매하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 8은 사카로마이세스 세레비지애 (Sacchormyces cerevisiae) (Sc. tHMG-CoA 리덕타제), 슈도모나스 메발로니 (Pseudomonas mevalonii) (Pm.), 델프티아 액시도보란스 (Delftia acidovorans) (Da.) 및 실리시박터 포메로이 (Silicibacter pomeroyi) (Sp.) 유래 하이드록시메틸글루타릴-CoA 리덕타제의 NADPH-특이적인 또는 NADH-특이적인 활성을 제시한다 (nmol/mg/min로 측정함).
도 9는 야생형 ADH1, 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 각각에서 NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. - 슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 이후의 세포 밀도 (OD600로 측정함)를 나타낸 것이다.
도 10은 야생형 ADH1, 및 ADH1 낫 아웃 백그라운드 각각에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 글리세롤 생산 (g/L로 측정함)을 나타낸 것이다.
도 11은 야생형 ADH1 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 둘다에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 메발로네이트 생산 (g/L로 측정함)을 나타낸 것이다.
도 12는 (A) acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현되는 ADA (Dz.eutE), 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로; (B) 무손상 (야생형) PDH-바이패스, 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주의 파르네센 생산과 세포 밀도를 나타낸 것이다. "Empty"로 표시된 막대는 배지만 (세포 무존재) 존재하는 웰이다.
도 13은 (A) 야생형 균주 (Y968); ADA (Dz.eutE)를 이종적으로 발현하는 균주 (Y12869); 및 (B) ADA (Dz.eutE), 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)를 이종적으로 발현하는 균주 (Y12745)에 의한, 글리세롤 생산 (상단 패널) 및 글루코스 소비 (하단 패널)를 도시한 것이다.
도 14는 무손상 (야생형) PDH-바이패스 또는 acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현된 ADA (Dz.eutE) 중 어느 하나; 및 ERG10 (아세틸-CoA 티올라제) 또는 nphT7 (아세토아세틸-CoA 신타제) 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주에 의한 메발로네이트 생산을 도시한 것이다.
도 2는 IPP 및 다이메틸알릴 피로포스페이트 ("DMAPP")를 게라닐 피로포스페이트 ("GPP"), 파르네실 피로포스페이트 ("FPP") 및 게라닐게라닐 피로포스페이트 ("GGPP")로 변환하는 과정을 개략적으로 도시한 것이다.
도 3은 세포질 아세틸-CoA를 "야생형" PDH-바이패스를 통해 합성하는, 메발로네이트 경로를 통한, 글루코스의 파르네센으로의 변환에 있어 탄소 및 대사 요구량의 최적 흐름에 대한 개략적인 도시와 수율을 나타낸 것이다.
도 4는 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 5는 아세토아세틸-CoA (AcAcCoA)가 아세토아세틸-CoA 신타제 (AACS)에 의해 말로닐-CoA와 아세틸-CoA (AcCoA)로부터 합성되는, 아세틸-CoA로부터 파르네센의 합성을 개략적으로 도신한 것이다. 말로닐-CoA 합성에는 변환되는 아세틸-CoA 1 분자 당 ATP 1개의 에너지 투입이 요구된다 (아세틸-CoA 카르복실라제 (ACC1)에 의해 촉매됨).
도 6은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 아세토아세틸-CoA가 아세토아세틸-CoA 신타제에 의해 말로닐-CoA와 아세틸-CoA로부터 합성되는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 7은 세포질 아세틸-CoA가 ADA를 통해 합성되며 메발로네이트 경로가 NADPH-가용성 HMGr 대신 NADH-가용성 HMGr을 포함하며 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)가 프럭토스-6-포스페이트 (F6P)의 아세틸-CoA로의 변환하는 반응을 촉매하는, 메발로네이트 경로를 통한 글루코스의 파르네센으로의 변환에 있어, 탄소 및 대사 요구량의 최적의 흐름과 수율을 개략적으로 도시한 것이다.
도 8은 사카로마이세스 세레비지애 (Sacchormyces cerevisiae) (Sc. tHMG-CoA 리덕타제), 슈도모나스 메발로니 (Pseudomonas mevalonii) (Pm.), 델프티아 액시도보란스 (Delftia acidovorans) (Da.) 및 실리시박터 포메로이 (Silicibacter pomeroyi) (Sp.) 유래 하이드록시메틸글루타릴-CoA 리덕타제의 NADPH-특이적인 또는 NADH-특이적인 활성을 제시한다 (nmol/mg/min로 측정함).
도 9는 야생형 ADH1, 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 각각에서 NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. - 슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 이후의 세포 밀도 (OD600로 측정함)를 나타낸 것이다.
도 10은 야생형 ADH1, 및 ADH1 낫 아웃 백그라운드 각각에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 이종의 MevT 경로를 구비한, 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 글리세롤 생산 (g/L로 측정함)을 나타낸 것이다.
도 11은 야생형 ADH1 및 ADH1 낫 아웃 (adh1Δ) 백그라운드 둘다에서, NADPH-가용성 HMG-CoA 리덕타제 (Sc. tHMG-CoA 리덕타제) 또는 NADH-가용성 HMG-CoA 리덕타제 (Pm. -슈도모나스 메발로니 (Pseudomonas mevalonii); Da. -- 델프티아 액시도보란스 (Delftia acidovorans); Sp. -- 실리시박터 포메로이 (Silicibacter pomeroyi))를 포함하는 사카로마이세스 세레비지애 (S. cerevisiae)(Sc.)의 24시간 및 48시간 후 메발로네이트 생산 (g/L로 측정함)을 나타낸 것이다.
도 12는 (A) acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현되는 ADA (Dz.eutE), 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로; (B) 무손상 (야생형) PDH-바이패스, 및 NADPH-가용성 HMG-CoA 리덕타제 또는 NADH-가용성 HMG-CoA 리덕타제 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주의 파르네센 생산과 세포 밀도를 나타낸 것이다. "Empty"로 표시된 막대는 배지만 (세포 무존재) 존재하는 웰이다.
도 13은 (A) 야생형 균주 (Y968); ADA (Dz.eutE)를 이종적으로 발현하는 균주 (Y12869); 및 (B) ADA (Dz.eutE), 포스포케톨라제 (PK)와 포스포트랜스아세틸라제 (PTA)를 이종적으로 발현하는 균주 (Y12745)에 의한, 글리세롤 생산 (상단 패널) 및 글루코스 소비 (하단 패널)를 도시한 것이다.
도 14는 무손상 (야생형) PDH-바이패스 또는 acs1Δ acs2 Δ ald6Δ가 커플링된 이종적으로 발현된 ADA (Dz.eutE) 중 어느 하나; 및 ERG10 (아세틸-CoA 티올라제) 또는 nphT7 (아세토아세틸-CoA 신타제) 중 어느 하나를 포함하는 MEV 경로를 포함하는, 사카로마이세스 세레비지애 (S. cerevisiae) 균주에 의한 메발로네이트 생산을 도시한 것이다.
5.
5.1
용어
본원에서, 용어 "이종의"는, 통상 천연적으로 발견되지 않는 것을 지칭한다. 용어 "이종의 뉴클레오티드 서열"은 자연에서 소정의 세포에서 정상적으로 발견되지 않는 뉴클레오티드 서열을 지칭한다. 이와 같이, 이종의 뉴클레오티드 서열은, (a) 이의 숙주 세포에 외래적 (즉, 세포에 "외인성")이거나; (b) 숙주 세포에서 천연적으로 발견되지만 (즉, "내인성"), 세포에서 비천연적인 양으로 존재 (즉, 숙주 세포에서 천연적으로 확인되는 양 보다 많거나 적음)하거나; 또는 (c) 숙주 세포에서 본래 확인되지만 이의 본래의 위치에서 벗어난 위치에 있을 수 있다. 용어 "이종의 효소"는 자연에서 소정의 세포에서 정상적으로는 확인되지 않는 효소를 지칭한다. 이 용어는, (a) 소정의 세포에 외인성이고 (즉, 숙주 세포에 본래 존재하지 않거나 또는 해당 문맥에서 숙주 세포에서 본래 존재하지 않는 뉴클레오티드 서열에 의해 코딩됨); 및 (b) 숙주 세포에서 본래 발견되지만 (예, 효소가 세포에 내인성인 뉴클레오티드 서열에 의해 코딩됨), 숙주 세포에서 비정상적인 양 (예, 본래 확인되는 양 보다 많거나 적게)으로 제조되는 효소를 포괄한다.
한편, 본원에서, 분자, 특히 효소 및 핵산에 대한 "천연적인" 또는 "내인성"이라는 언급의 용어는, 천연 미생물에서 분자의 발현 수준 보다 낮거나, 동일하거나 또는 높을 수 있는 발현 수준과는 무관하게, 자연에서 기원하거나 발견되는 유기체에서 발현되는 분자를 지칭한다. 천연 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변형될 수 있는 것으로 이해된다.
본원에서, 타겟 유전자, 예컨대 PDH-바이패스의 하나 이상의 유전자의, 예컨대 "기능적으로 파괴한다" 또는 "기능적 파괴"는, 타겟 유전자가, 타겟 유전자에 의해 코딩된 단백질의 활성을 숙주 세포에서 낮추는 방식으로 변형되는 것을 의미한다. 마찬가지로, 타겟 단백질, 예를 들어 PDH-바이패스의 하나 이상의 효소를, 예컨대, "기능적으로 파괴한다" 또는 "기능적 파괴"는, 타겟 단백질이 단백질의 활성을 숙주 세포에서 낮추는 방식으로 변형되는 것을 의미한다. 일부 구현예들에서, 타겟 유전자에 의해 코딩되는 타겟 단백질의 활성이 숙주 세포에서 소거된다. 다른 구현예들에서, 타겟 유전자에 의해 코딩되는 타겟 단백질의 활성이 숙주 세포에서 감소된다. 타겟 유전자의 기능적 파괴는, 유전자 발현이 없어지거나 감소되도록, 또는 유전자 산물의 활성이 사라지거나 감소되도록, 유전자 전체 또는 일부를 결손시킴으로써 달성될 수 있다. 또한, 타겟 유전자의 기능적 파괴는, 발현이 소거 또는 감소되도록 유전자의 조절 인자, 예컨대, 유전자의 프로모터를 돌연변이시키거나, 또는 유전자 산물의 활성이 없어지거나 또는 감소되도록 유전자의 코딩 서열을 돌연변이시킴으로써, 달성될 수 있다. 일부 구현예들에서, 타겟 유전자의 기능적 파괴로 타겟 유전자의 오픈 리딩 프레임 전체가 제거된다.
본원에서, 용어 "부모 세포"는, 변형된 숙주 세포에서 조작되는 한가지 이상의 특정 유전자에 대한 변형, 예컨대, ADA의 이종 발현, NADH-가용성 HMG-CoA 리덕타제의 이종 발현, AACS의 이종 발현, 포스포케톨라제의 이종 발현, 포스포트랜스아세틸라제의 이종 발현 및 메발로네이트 경로의 하나 이상의 효소의 이종 발현으로 이루어진 군으로부터 선택되는 한가지 이상의 변형을 포함하지 않는다는 것을 제외하고는, 본원에 언급된 유전자 변형된 숙주 세포와 동일한 유전자 백그라운드를 가지는 세포를 지칭한다.
본원에서, 용어 "생산"은 일반적으로 본원에 제시된 유전자 변형된 숙주 세포에 의해 제조되는 일정량의 이소프레노이드를 지칭한다. 일부 구현예들에서, 생산은 숙주 세포의 이소프레노이드의 수율로서 표시된다. 다른 구현예들에서, 생산은 이소프레노이드 생산에 대한 숙주 세포의 생산성으로 표시된다.
본원에서, 용어 "생산성"은, 숙주 세포를 경시적으로 (시간 당) (부피) 배양한 발효 배지 양 당 제조되는 이소프레노이드 (중량) 양으로 표시되는, 숙주 세포에 의한 이소프레노이드의 생산을 지칭한다.
본원에서, 용어 "수율"은 숙주 세포에 의해 소비되는 탄소원의 양 당 생산되는 이소프레노이드의 양을 중량으로 표시한, 숙주 세포에 의한 이소프레노이드의 생산을 지칭한다.
5.2
아세틸-CoA로부터 이소프레노이드를 제조하는 유전자 변형된 미생물
5.2.1
숙주 세포
본원에 제공되는 숙주 세포에 유용한 조성물과 방법은 고세균 (archae), 원핵생물 또는 진핵생물 세포를 포함한다.
적합한 원핵생물 숙주로는, 비제한적인 예로, 다양한 그람-양성, 그람-음성 또는 그람-가변성 박테리아 모두를 포함한다. 예로는, 비제한적으로, 다음의 속에 속하는 세포를 포함한다: 아그로박테리움 (Agrobacterium), 알리사이클로바실러스 (Alicyclobacillus), 아나바에나 (Anabaena), 아나시스티스 (Anacystis), 아르트로박터 (Arthrobacter), 아조박터 (Azobacter), 바실러스 (Bacillus), 브레비박테리움 (Brevibacterium), 크로마티움 (Chromatium), 클로스트리듐 (Clostridium), 코리네박테리움 (Corynebacterium), 엔테로박터 (Enterobacter), 에르위니아 (Erwinia), 에스케리키아 (Escherichia), 락토바실러스 (Lactobacillus), 락토코커스 (Lactococcus), 메소리조븀 (Mesorhizobium), 메틸로박테리움 (Methylobacterium), 마이크로박테리움 (Microbacterium), 포르미듐 (Phormidium), 슈도모나스 (Pseudomonas), 로도박터 (Rhodobacter), 로도슈도모나스 (Rhodopseudomonas), 로도스피릴룸 (Rhodospirillum), 로도코커스 (Rhodococcus), 살모넬라 (Salmonella), 세네데스문 (Scenedesmun), 세라티아 (Serratia), 시겔라 (Shigella), 스타플로코커스 (Staphlococcus), 스트렙토마이세스 (Strepromyces), 신네코쿠스 (Synnecoccus) 및 자이모모나스 (Zymomonas). 원핵생물 균주의 예로는, 비제한적으로, 바실러스 섭틸리스 (Bacillus subtilis), 바실러스 아밀로리퀘팍시네스 (Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스 (Brevibacterium ammoniagenes), 브레비박테리움 임마리오필럼 (Brevibacterium immariophilum), 클로스트리듐 베이예린키이 (Clostridium beigerinckii), 엔테로박터 사카자키 (Enterobacter sakazakii), 에스케리키아 콜라이 (Escherichia coli), 락토코커스 락티스 (Lactococcus lactis), 메소리조쥼 로티 (Mesorhizobium loti), 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 메발로니 (Pseudomonas mevalonii), 슈도모나스 푸디카 (Pseudomonas pudica), 로도박터 캡슐라투스 (Rhodobacter capsulatus), 로도박터 스페어로이데스 (Rhodobacter sphaeroides), 로도스피릴룸 루브럼 (Rhodospirillum rubrum), 살모넬라 엔테리카 (Salmonella enterica), 살모넬라 티피 (Salmonella typhi), 살모넬라 티피무리움 (Salmonella typhimurium), 시겔라 다이센테리아 (Shigella dysenteriae), 시겔라 플렉스네리 (Shigella flexneri), 시겔라 소네이 (Shigella sonnei) 및 스타필로코커스 아우레우스 (Staphylococcus aureus)를 포함한다. 특정 구현예에서, 숙주 세포는 에스케리키아 콜라이 (Escherichia coli) 세포이다.
적합한 고세균 숙주로는, 비제한적인 예로, 다음과 같은 속에 속하는 세포를 포함한다: 에어로피룸 (Aeropyrum), 아르케글로부스 (Archaeglobus), 할로박테리움 (Halobacterium), 메타노코커스 (Methanococcus), 메타노박테리움 (Methanobacterium), 피로코커스 (Pyrococcus), 설폴로부스 (Sulfolobus), 및 써모플라스마 (Thermoplasma). 고세균 균주의 예로는, 비제한적으로, 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 할로박테리움 (Halobacterium) sp., 메타노코커스 야나스키 (Methanococcus jannaschii), 메타노박테리움 써모오토트로피쿰 (thermoautotrophicum), 써모플라스마 액시도필룸 (Thermoplasma acidophilum), 써모플라스마 볼카늄 (Thermoplasma volcanium), 피로코커스 호리코시 (Pyrococcus horikoshii), 피로코커스 아비시 (Pyrococcus abyssi) 및 에어로피룸 퍼닉스 (Aeropyrum pernix)를 포함한다.
적합한 진핵생물의 숙주로는, 비제한적인 예로, 진균 세포, 해조류 세포, 곤충 세포 및 식물 세포를 포함한다. 일구 구현예에서, 본 발명의 방법에 사용가능한 효모는 미생물 기탁 기관 (예, IFO, ATCC 등)에 기탁되었으며, 다음과 같은 속에 속하는 효모를 포함한다: 특히, 액시쿨로코니듐 (Aciculoconidium), 암브로시오지마 (Ambrosiozyma), 아르트로아스쿠스 (Arthroascus), 아릭시오지마 (Arxiozyma), 아쉬비아 (Ashbya), 바브제비아 (Babjevia), 벤싱토니아 (Bensingtonia), 보트리오아스쿠스 (Botryoascus), 보트리오지마 (Botryozyma), 브레타노마이세스 (Brettanomyces), 불레라 (Bullera), 불레로마이세스 (Bulleromyces), 칸디다 (Candida), 시테로마이세스 (Citeromyces), 클라비스포라 (Clavispora), 크립토코커스 (Cryptococcus), 시스토필로바시듐 (Cystofilobasidium), 데바리오마이세스 (Debaryomyces), 데카라 (Dekkara), 디포다스콥시스 (Dipodascopsis), 디포다스쿠스 (Dipodascus), 에니엘라 (Eeniella), 엔도마이콥셀라 (Endomycopsella), 에레마스쿠스 (Eremascus), 에레모테시움 (Eremothecium), 에리트로바시듐 (Erythrobasidium), 펠로마이세스 (Fellomyces), 필로바시듐 (Filobasidium), 갈락토마이세스 (Galactomyces), 제오트리쿰 (Geotrichum), 귈리리에르몬델라 (Guilliermondella), 한세니아스포라 (Hanseniaspora), 한세눌라 (Hansenula), 하세가와이 (Hasegawaea), 폴터마니아 (Holtermannia), 호르모아스쿠스 (Hormoascus), 하이포피키아 (Hyphopichia), 이사첸티아 (Issatchenkia), 클로엑케라 (Kloeckera), 클로엑케라스포라 (Kloeckeraspora), 클루이베로마이세스 (Kluyveromyces), 콘도아 (Kondoa), 쿠라이시아 (Kuraishia), 쿠르츠마모마이세스 (Kurtzmanomyces), 루코스포리듐 (Leucosporidium), 리포마이세스 (Lipomyces), 로데로마이세스 (Lodderomyces), 말라세지아 (Malassezia), 메츠니코위아 (Metschnikowia), 므라키아 (Mrakia), 믹소지마 (Myxozyma), 나드소니아 (Nadsonia), 나카자와이 (Nakazawaea), 네마토스포라 (Nematospora), 오가타에 (Ogataea), 오스포리디움 (Oosporidium), 파키솔렌 (Pachysolen), 파키티코스포라 (Phachytichospora), 파피아 (Phaffia), 피키아 (Pichia), 로도스포리듐 (Rhodosporidium), 로도토룰라 (Rhodotorula), 사카로마이세스 (Saccharomyces), 사카로마이코데스 (Saccharomycodes), 사카로마이콥시스 (Saccharomycopsis), 사이토엘라 (Saitoella), 사카구키아 (Sakaguchia), 사투라노스포라 (Saturnospora), 스키조블라스토스포리온 (Schizoblastosporion), 스키조사카로마이세스 (Schizosaccharomyces), 슈반니오마이세스 (Schwanniomyces), 스포리디오볼루스 (Sporidiobolus), 스포로볼로마이세스 (Sporobolomyces), 스포로파키더미아 (Sporopachydermia), 스테파노아스쿠스 (Stephanoascus), 스테리그마토마이세스 (Sterigmatomyces), 스테리그마토스포리듐 (Sterigmatosporidium), 심비오타프리나 (Symbiotaphrina), 심포디오마이세스 (Sympodiomyces), 심포디오마이콥시스 (Sympodiomycopsis), 토룰라스포라 (Torulaspora), 트리코스포리엘라 (Trichosporiella), 트리코스포론 (Trichosporon), 트리고놉시스 (Trigonopsis), 츠키야에아 (Tsuchiyaea), 우데니오마이세스 (Udeniomyces), 발토마이세스 (Waltomyces), 윅커하미아 (Wickerhamia), 윅커하미엘라 (Wickerhamiella), 빌리옵시스 (Williopsis), 야마다지마 (Yamadazyma), 야로위니아 (Yarrowia), 자이고아스쿠스 (Zygoascus), 자이고사카로마이세스 (Zygosaccharomyces), 자이고빌리옵시스 (Zygowilliopsis), 및 자이고지마 (Zygozyma).
일부 구현예에서, 숙주 미생물은 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 피키아 패스토리스 (Pichia pastoris), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 데케라 브룩셀렌시스 (Dekkera bruxellensis), 클루이베로마이세스 락티스 (Kluyveromyces lactis) (기존에는 사카로마이세스 락티스 (Saccharomyces lactis)로 지칭됨), 클루이베로마이세스 마르시아누스 (Kluveromyces marxianus), 아르술라 아데니니보란스 (Arxula adeninivorans), 또는 한세눌라 폴리모르파 (Hansenula polymorpha) (피키아 앙구스타 (Pichia angusta)라고도 함)이다. 일부 구현예에서, 숙주 미생물은 칸디다 (Candida) 속의 균주, 예컨대 칸디다 리폴리티카 (Candida lipolytica), 칸디다 길리어몬디이 (Candida guilliermondii), 칸디다 크루세이 (Candida krusei), 칸디다 슈도트로피칼리스 (Candida pseudotropicalis) 또는 칸디다 유틸리스 (Candida utilis)이다.
특정 구현예에서, 숙주 미생물은 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)이다. 일부 구현예들에서, 숙주는 빵 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 및 AL-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주이다. 일부 구현예들에서, 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1 및 SA-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주이다. 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 PE-2이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 CAT-1이다. 다른 특정 구현예에서, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주는 BG-1이다.
일부 구현예들에서, 숙주 미생물은 산업 발효에 적합한 미생물이다. 특정 구현예에서, 미생물은, 산업 발효 환경에서 공인된 스트레스 조건인, 용매 고농도, 고온, 확장된 기질 이용성, 영양 제한, 당 및 염으로 인한 삼투 스트레스, 산도, 설파이트 및 박테리아 오염 또는 이들의 조합 하에 존속하도록 조건화된다.
5.2.2
아세틸-CoA를 제조하기 위한 이종의 ADA
일 측면에서, 본 발명은, 아실화 아세트알데하이드 데하이드로게나제 (이명. "아세틸알데하이드 데하이드로게나제, 아세틸화," "아세틸알데하이드 데하이드로게나제, 아실화," 또는 ADA (EC 1.2.1.10))를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함하는, 아세틸-CoA 유래 이소프레노이드를 제조할 수 있는 유전자 변형된 숙주 세포를 제공한다.
본원에 제공되는 조성물 및 방법에 사용가능한 이 방법을 촉매할 수 있는 단백질은 다음과 같은 4가지 유형의 단백질을 포함한다:
(1) 아세틸-CoA의 아세트알데하이드로의 가역적인 변환과, 후속적인 아세트알데하이드의 에탄올로의 가역적인 변환을 촉매하는, 2가지 기능의 단백질. 이 유형의 단백질의 예는 E. coli의 AdhE 단백질 (Gen Bank No: NP_415757)이다. AdhE는 유전자 융합체의 진화 산물인 것으로 보인다. AdhE 단백질의 NH2-말단 영역은 알데하이드:NAD+ 옥시도리덕타제에 대해 상동성이 높은 반면, COOH-말단 영역은 Fe2+-의존성 에탄올:NAD+ 옥시도리덕타제 패밀리에 상동적이다 (Membrillo-Hernandez et al., (2000) J. Biol. Chem. 275: 33869-33875). E. coli AdhE는 금속-촉매성 산화를 수행하며, 따라서, 산소에 민감하다 (Tamarit et al. (1998) J. Biol. Chem. 273:3027-32).
(2) 엄격 또는 선택적인 혐기성 미생물에서 아세틸-CoA의 아세트알데하이드로의 가역적인 변환을 촉매하지만, 알코올 데하이드로게나제 활성은 가지지 않는, 단백질. 이 유형의 단백질에 대한 예는 클로스트리듐 클루이베리 (Clostridium kluyveri)에서 보고된 바 있다 (Smith et al. (1980) Arch. Biochem. Biophys. 203: 663-675). ADA는 클로스트리듐 클루이베리 (Clostridium kluyveri) DSM 555의 게놈 (등재번호: EDK33116)에 주석으로 달려 있다. 상보적인 단백질 AcdH는 락토바실러스 플라타룸 (Lactobacillus plantarum)의 게놈에서 확인된다 (등재 번호: NP_784141). 이 유형의 단백질에 대한 다른 예는 클로스트리듐 베이예린키이 (Clostridium beijerinckii) NRRL B593의 ald 유전자 산물이다 (Toth et al. (1999) Appl. Environ. Microbiol. 65: 4973-4980, 등재 번호: AAD31841).
(3) 에탄올아민 이화 작용에 참여하는 단백질. 에탄올아민은 다수의 장내세균들이 탄소원 및 질소원으로 이용할 수 있다 (Stojiljkovic et al. (1995) J. Bacteriol. 177: 1357-1366). 에탄올아민은 먼저 에탄올아민 암모니아 리아제에 의해 암모니아와 아세트알데하이드로 변환된 다음, 아세트알데하이드는 ADA에 의해 아세틸-CoA로 변환된다. 이 유형의 ADA의 예가 살모넬라 티피무리움 (Salmonella typhimurium)의 EutE 단백질이다 (Stojiljkovic et al. (1995) J. Bacteriol. 177: 1357-1366, 등재 번호: AAL21357; U18560.1도 참조함). 또한, E. coli는 에탄올아민을 이용할 수 있으며 (Scarlett et al. (1976) J. Gen. Microbiol. 95:173-176), 살모넬라 티피무리움 (S. typhimurium)의 EutE 단백질과 상동적인 EutE 단백질을 가지고 있다 (등재 번호: AAG57564; U897722.1).
(4) 4-하이드록시-2-케토발레레이트 이화작용에 관여하는 2가지 기능의 알돌라제-데하이드로게나제 복합체의 일부인 단백질. 상기한 2가지 기능의 효소는, 다수 박테리아 종들에서 페놀, 톨레이트, 나프탈렌, 바이페닐 및 그외 방향족 화합물의 분해의 중간산물인, 카테콜의 메타-절단 경로의 마지막 2 단계를 촉매한다 (Powlowski and Shingler (1994) Biodegradation 5, 219-236). 4-하이드록시-2-케토발레레이트는 4-하이드록시-2-케토발레레이트 알돌라제에 의해 먼저 피루베이트와 아세트알데하이드로 변환된 다음, ADA에 의해 아세트알데하이드는 아세틸-CoA로 변환된다. 이 유형의 ADA의 예가 슈도모나스 (Pseudomonas) sp CF600의 DmpF 단백질 (등재 번호: CAA43226)이다 (Shingler et al. (1992) J. Bacteriol. 174:71 1-24). E. coli는 슈도모나스 (Pseudomonas) sp. CF600의 DmpF 단백질에 상동적인 MphF 단백질을 가지고 있다 (Ferrandez et al. (1997) J. Bacteriol. 179: 2573-2581, 등재 번호: NP_414885).
일부 구현예들에서, 본원에 기술된 조성물 및 방법에 사용가능한 ADA (또는 이러한 활성을 코딩하는 핵산 서열)는, 국제 출원 공개번호 WO 2009/013159에 기술된 바와 같이, 에스케리키아 콜라이 (Escherichia coli) adhE, 엔타모에바 히스톨리티카 (Entamoeba histolytica) adh2, 스타필로코커스 아우레우스 (Staphylococcus aureus) adhE, 피로마이세스 (Piromyces) sp.E2 adhE, 클로스트리듐 클루이베리 (Clostridium kluyveri) (EDK33116), 락토바실러스 플라타룸 (Lactobacillus plantarum) acdH 및 슈도모나스 푸티타 (Pseudomonas putida) (YP 001268189)로 이루어진 군으로부터 선택되며, 이들은 그 전체가 원용에 의해 본 명세서에 포함된다. 일부 구현예들에서, ADA는 클로스트리디움 보툴리눔 (Clostridium botulinum) eutE (FR745875.1), 데설포탈리에 피크로필라 ( Desulphotalea psychrophila) eutE (CR522870.1), 액시네토박터 (Acinetobacter) sp. HBS-2 eutE (ABQ44511.2), 칼디트릭스 아비시 (Caldithrix abyssi) eutE (ZP_09549576) 및 할로루브룸 라쿠스프로푼디 (Halorubrum lacusprofundi) ATCC 49239 (YP_002565337.1)로 이루어진 군으로부터 선택된다.
특정 구현예에서, 본원에 제공되는 조성물 및 방법에 사용가능한 ADA는 딕케야 지아 (Dickeya zeae)의 eutE이다. 딕케야 지아 (Dickeya zeae)의 대표적인 eutE 뉴클레오티드 서열은 등재 번호 NC_012912.1:1110476..1111855와 본원에 제시된 서열번호 1을 포함한다. 딕케야 지아 (Dickeya zeae)의 대표적인 eutE 단백질 서열은 등재 번호 YP_003003316 및 본원에 제공된 서열번호 2를 포함한다.
또한, 본원에 제공된 조성물 및 방법에 유용한 ADA는 본원에 기술된 임의의 ADA의 "유도체"로 지칭될 수 있는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 본원에 기술된 임의의 ADA와 상당한 상동성을 고유함, (2) 아세트알데하이드의 아세틸-CoA로의 변환을 촉매할 수 있음. ADA의 유도체는, 이 유도체의 아미노산 서열이 본원에 기술된 임의의 ADA와 80% 이상, 85% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, ADA와 "실질적인 상동성"을 공유하는 것으로 지칭된다.
5.2.2.1 기능성 ADA를 동정하는 방법
다른 측면에서, 본 발명은 생체내 성능이 강화된 ADA를 스크리닝하는 방법을 제공한다. 이러한 스크리닝 방법에서, 생체내 성능이 강화된 ADA는 조작된 숙주 세포를 세포 사멸로부터 구제하는 능력으로 동정한다. 조작된 숙주 세포는 세포질 아세틸-CoA 유래 이차 대사산물, 예컨대, 이소프레노이드를 제조하는 이종 경로를 포함한다. 일부 구현예들에서, 조작된 숙주 세포는 기능적으로 파괴된 PDH-바이패스 경로와 활성이 약한 ADA를 추가로 포함하며, 여기서 기능적으로 파괴된 PDH-바이패스 경로와 활성이 약한 ADA의 조합 작용은, (1) 세포질 아세틸-CoA 유래 이차 대사산물; 및 (2) 세포 생존, 건강 및/또는 생육에 필요한 세포질 아세틸-CoA 유래 일차 대사산물의 생산 요구성을 충족시킬 만큼 충분히 세포질 아세틸-CoA를 제조하지 못한다. 생존, 건강 및/또는 생육을 위해, 따라서, 숙주 세포는 세포질 아세틸-CoA를 증가된 풀로 제조할 수 있는 활성형 ADA를 필요로 한다.
일부 구현예들에서, 생체내 성능이 강화된 ADA의 스크리닝 방법은,
(a) 세포질 아세틸-CoA 유래 이차 대사산물을 증가된 수준으로 제조하도록 기능적으로 파괴된 PDH-바이패스 경로를 가진 숙주 세포에서 대조군 ADA를 발현시키는 단계로서, 상기 세포질 아세틸-CoA 유래 이차 대사산물이 증가된 수준으로 제조되면 상기 세포질 아세틸-CoA 유래 이차 대사산물이 증가된 수준으로 제조하지 않는 부모 세포에 비해, 상기 숙주 세포의 생존성 (viability)이 감소되는 것인 단계; 및
(b) 상기 대조군 ADA 대신 테스트 ADA를 상기 숙주 세포에서 발현시키는 단계로서, 이로써 상기 대조군 ADA를 발현하는 상기 숙주 세포에 비해 상기 ADA를 발현하는 상기 숙주 세포의 생존성 증가가, 상기 대조군 ADA에 비해 증가된 생체내 성능을 가지는 것으로서 상기 테스트 ADA를 식별하는 단계를 포함한다.
일부 구현예들에서, 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 수준은 유도 가능하다. 유도는 유도제 (예, 갈락토스) 또는 특이 배양 조건 (예, 배양 온도)에 반응하여 이루어질 수 있다. 유도제가 존재하지 않는 조건에서 배양하면, 숙주 세포의 ADA 활성은 숙주 세포가 생존하는데 필요한 세포질 아세틸-CoA을 생산하는데 충분하다. 그러나, 유도제의 존재 하에 배양하면, 숙주 세포의 ADA 활성은 숙주 세포가 생존하는데 필요한 세포질 아세틸-CoA와 증가된 수준의 세포질 아세틸-CoA로부터 유래된 이차 대사산물을 둘다 생산하기에는 충분하지 않다. 후자의 경우, 숙주 세포는 세포질 아세틸-CoA를 증가된 풀로서 생산할 수 있는 더 강한 활성을 가진 ADA가 생존을 위해 필요로 한다. 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 생산은 부모 세포에서의 세포질 아세틸-CoA 유래 이차 대사산물의 생산에 대해 약 10% 내지 적어도 약 1,000배, 또는 그 보다 높을 수 있다.
부모 세포와 비교하여, 대조군 ADA를 발현하는 숙주 세포의 생존성 감소는 세포 증식 감소 내지 치사 수준일 수 있다. 즉, 일부 구현예에서, 대조군 ADA를 발현하는 숙주 세포는 부모 세포에 비해 액체 배지 또는 아가 플레이트에서 후손 세포를 수적으로 감소된 수로 생산한다. 다른 구현예들에서, 대조군 ADA를 발현하는 숙주 세포는 부모 세포에 비해 액체 배지 또는 아가 플레이트에서 후손 세포를 생산하지 않는다. 즉, 대조군 ADA 대신 테스트 ADA를 발현하는 숙주 세포의 생존성 증가는, 대조군 ADA를 발현하는 숙주 세포에 의해 생산되는 후손 세포의 수 또는 콜로니 크기와 비교하여, 더 많은 수의 후손 세포로 액체 배지에서, 또는 보다 큰 콜로니 크기로 아가 플레이트에서 명백할 수 있다.
숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물 또는 이의 전구체의 생산에 관여하는 효소의 발현 및/또는 활성의 변형을 통해, 숙주 세포에서 세포질 아세틸-CoA로부터 유래되는 증가된 수준의 이차 대사산물의 생산에 영향을 가할 수 있다. 일부 이러한 구현예들에서, MEV 또는 DXP 경로의 효소의 발현 및/또는 활성을 변형시킨다. 일부 이러한 구현예들에서, HMG-CoA 리덕타제 및/또는 메발로네이트 키나제의 발현 및/또는 활성을 변형시킨다.
대조군 ADA 및 테스트 ADA는 천연성 ADA 또는 비-천연성 ADA일 수 있다. 일부 구현예들에서, 테스트 ADA는, 대조군 ADA와 하나 이상의 아미노산의 치환, 결손 및/또는 부가 차이가 있는, 대조군 ADA의 변이체이다. 일부 구현예들에서, 테스트 ADA는 대조군 ADA와 동일한 아미노산을 포함하지만, 이들 아미노산을 코딩하는 코돈들이 테스트 ADA와 대조군 ADA 간에 상이하다. 일부 이러한 구현예들에서, 코돈은 숙주 세포에서의 사용 (usage)을 최적화한다. 일부 구현예들에서, 대조군 ADA ?/또는 테스트 ADA는 피루베이트 데카르복실라제에 융합된다. 일부 구현예들에서, 테스트 ADA의 발현은 강력한 프로모터의 조절성 통제를 받는다. 일부 구현예들에서, 테스트 ADA의 발현은 중간 세기의 프로모터의 조절성 통제를 받는다. 일부 구현예들에서, 테스트 ADA의 발현은 약한 프로모터의 조절성 통제를 받는다.
테스트 ADA의 존재 하에 숙주 세포의 생존성 증가는 대조군 보다 활성이 강한 테스트 ADA 또는 대조군 ADA와 활성이 비슷하거나 낮지만 보다 많이 발현되는 테스트 ADA에 의해 달성될 수 있다. 활성이 증가된 테스트 ADA의 동정은 숙주 세포에서 비슷한 수준으로 대조군 ADA와 테스트 ADA를 발현시킴으로써 달성할 수 있다. 이는, 예를 들어, 동일한 조절 인자들의 통제를 받도록 숙주 세포에서 대조군 ADA와 테스트 ADA를 코딩하는 뉴클레오티드 서열을 위치시킴으로써, 달성할 수 있다. 상기한 방법이, 예를 들어, 원하는 발현 수준을 제공하는 조절 인자 (예, 프로모터)를 동정하기 위해 사용되는, 다른 구현예들에서, 테스트 ADA는 뉴클레오티드 또는 아미노산 서열 상으로는 대조군 ADA와 차이가 없지만 발현 수준에는 차이가 있다. 이러한 구현예들에서, 대조군 ADA와 테스트 ADA를 발현하기 위해 다른 조절 인자들을 사용할 수 있으며, 숙주 세포의 생존성 비교를 통해 테스트 ADA의 활성에 대한 정보는 제공하지 않지만, 테스트 ADA의 발현을 구동하는 조절 인자들의 세기에 대한 정보는 제공할 수 있다.
개선된 ADA 변이체라기 보다는 증식 촉진 돌연변이를 포함하는 빠른 증식성 위 양성 숙주 세포가 숙주 세포 배양물이 되는 경쟁적인 배양 상황을 방지하기 위해, 스크리닝 방법에 대한 일 구현예는 아가-플레이트를 이용한 선별 시스템을 포함한다. 이러한 구현예에서, 숙주 세포를 아가 플레이트 상에 도말하고, 생체내 성능이 향상된 테스트 ADA 변이체를 포함하는 숙주 세포를 콜로니 증식에 의해 동정한다.
본원에 기술된 스크리닝 방법의 실질적인 이점은 단순성과 높은 효율의 구현력이다. ADA 변이체는 단순히 세포 생존성으로 동정하므로, 다른 비용이 많이 들고 시간이 소요되는 스크리닝 방법들이 실제 필요없다. 즉, 일 구현예에서, 본 방법은 생체내 성능이 개선된 ADA 변이체들에 대해 ADA 변이체 콜렉션 (예, 돌연변이 ADA 라이브러리)을 스크리닝하는데 사용된다. 이러한 구현예에서, 숙주 세포는 단일한 테스트 ADA를 발현하진 않지만, 숙주 세포의 콜렉션은 테스트 ADA의 콜렉션을 발현한다. 숙주 세포를 이 후 아가 플레이트에서 배양할 수 있으며, 생체내 성능이 개선된 ADA 변이체를 발현하는 숙주 세포를 콜로닝 배양을 토대로 동정할 수 있다. 일부 구현예들에서, ADA 변이체 콜렉션은 ADA 변이체를 2 - 5, 5 - 10, 10 - 50, 50 - 100, 100 - 500, 500 - 1,000, 1,000 - 10,000, 10,000 - 100,000, 100,000 - 1,000,000개로, 그리고 더 많은 수로 포함한다.
본원에 기술된 스크리닝 방법의 다른 주요 이점인, 반복적인 양상으로 보다 우수한 ADA 변이체를 선별하는 이의 지속적인 역량으로서, 여기서, 반복을 통해 동정된 테스트 ADA는 이후의 반복에서는 대조군 ADA로서 사용된다. 이러한 구현예는, 그러나, 각 반복에서, 숙주 세포에서 세포질 아세틸-CoA 유래 이차 대사산물의 생산을 체크하고, 숙주 세포가 새로운 대조군 ADA (즉, 이전의 반복에서의 테스트 ADA임)를 발현하는 경우, (예컨대, 효소의 발현 수준을 높이거나 낮춤으로써, 효소를 부가 또는 제거함으로써, 유전자의 카피 수를 높이거나 낮춤으로써, 효소의 발현을 조절하는 프로모터를 치환함으로써, 또는 유전자 돌연변이에 의해 효소를 변형시킴으로써), 생존성 감소를 유발하는 수준으로 잠재적으로 증가시킨다. 다른 예로, 또는 아울러, 각 반복에서, 감소된 대조군 ADA 활성을 제공하기 위해 (예, 발현을 낮추거나, 더 약한 프로모터를 사용하거나, 또는 대조군 ADA 전사체 또는 폴리펩타이드의 안정성을 낮춤으로써) 대조군 ADA의 발현을 감소시킬 수 있다. 다음번 반복에서, 이전 반복의 테스트 ADA와 비교하여 생체내 성능이 증가된 테스트 ADA를 동정할 수 있다.
본원에 기술된 스크리닝 방법의 다른 주된 이점은 시험관내 보다는 생체내에서 개선된 ADA의 선별이 이루어진다는 것이다. 그 결과, ADA 변이체의 생체내 성능을 강화하는 복수의 효소 특성들에 대한 개선을 수득할 수 있다.
본원에 기술된 스크리닝 방법을 이용하여 개발된 효소는, 비제한적인 예로, 형광 스크린 및/또는 기체 크로마토그래피에 의한 세포질 아세틸-CoA 유래 이차 대사산물의 직접 정량화 등의, 다른 선택적인 스크리닝 방법으로 수행할 수 있다. 보다 구체적으로, 이는 파르네센 등의 세스퀴테르펜 생산을 측정하기 위한 나일 레드-기반의 고효율의 형광 분석, 및 피르네센 등의 세스퀴테르펜의 역가를 측정하기 위한 기체 크로마토그래피 (GC)를 이용한 직접 정량화를 포함한다. 또한, 개선된 효소는 유도성 돌연변이 등의 유전자 조작 방법으로 추가로 개선시킬 수 있다. 이로써, 최종 효소 성능을 강화하는 효소의 여러 특성들을 순차적으로 개선시킴으로써, 가장 효과적인 효소 변이체를 동정한다.
5.2.3 PDH-바이패스의 기능적 파괴
아세틸-CoA는 PDH 복합체에 의해 촉매되는 피루베이트의 산화적 데카르복시화에 의해 미토콘드리아에서 형성될 수 있다. 그러나, 사카로마이세스 세레비지애 (S. cerevisiae)가 미토콘드리아 밖으로 아세틸-CoA를 이동시키지 못하기 때문에, PDH 바이패스는 세포질 구획에 아세틸-CoA를 제공하는데 필수적인 역할을 하며, 피루베이트를 아세틸-CoA로 변환하는 PDH 반응에 대한 대안 경로를 제공한다. PDH 바이패스에는, 효소 피루베이트 데카르복실라제 (PDC; EC 4.1.1.1), 아세트알데하이드 데하이드로게나제 (ACDH; EC 1.2.1.5 및 EC 1.2.1.4), 및 아세틸-CoA 신테타제 (ACS; EC 6.2.1.1)가 참여한다. 피루베이트 데카르복실라제는 피루베이트의 아세트알데하이드와 이산화탄소로의 데카르복시화를 촉매한다. 아세트알데하이드 데하이드로게나제는 아세트알데하이드를 아세트산으로 산화한다. 사카로마이세스 세레비지애 (S. cerevisiae)에서, 알데하이드 데하이드로게나제 패밀리는 5종의 멤버를 포함한다. ALD2 (YMR170c), ALD3 (YMR169c) 및 ALD6 (YPL061w)는 세포질 이소형이며, ALD4 (YOR374w) 및 ALD5 (YER073w)는 미토콘드리아 효소를 코딩한다. 주요 세포질 아세트알데하이드 데하이드로게나제 이소형은 ALD6에 의해 코딩된다. 아세테이트로부터 아세틸-CoA의 형성은 ACS에 의해 촉매되며, ATP의 가수분해를 수반한다. 2종의 구조 유전자 ACS1과 ACS2에 의해 ACS가 코딩된다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 PDH-바이패스 경로의 하나 이상의 유전자에 대한 기능적 파괴를 포함한다. 일부 구현예들에서, 숙주 세포의 PDH-바이패스의 하나 이상의 유전자에 대한 파괴로, 다음과 같은 한가지 이상의 반응을 촉매하는 능력이 손상된 유전자 변형된 미생물 세포가 만들어진다: (1) 피루베이트 데카르복실라제에 의한 피루베이트의 아세트알데하이드로의 데카르복시화; (2) 아세트알데하이드 데하이드로게나제에 의한 아세트알데하이드의 아세테이트로의 변환; 및 (3) 아세틸-CoA 신테타제에 의한 아세테이트 및 CoA로부터 아세틸-CoA의 합성.
일부 구현예들에서, 부모 세포와 비교하여, 숙주 세포는 PDH-바이패스 경로의 하나 이상의 유전자에 대한 기능적 파괴를 포함하며, 여기서, 감소된-기능적 또는 비-기능적 PDH-바이패스 경로의 활성은 단독으로 또는 약한 ADA와의 조합시, 숙주 세포의 증식, 생존성 및/또는 건강을 뒷받침하는데 충분하지 않다.
일부 구현예들에서, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현은 약 50% 이상까지 감소된다. 다른 구현예에서, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현은, PDH-바이패스의 하나 이상의 내인성 단백질의 활성 또는 발현에 대한 감소 또는 결손을 포함하지 않는 재조합 미생물에 비해, 약 60% 이상까지, 약 65% 이상까지, 약 70% 이상까지, 약 75% 이상까지, 약 80% 이상까지, 약 85% 이상까지, 약 90% 이상까지, 약 95% 이상까지, 또는 약 99% 이상까지 감소된다.
당해 기술 분야의 당업자가 숙지하는 바와 같이, PDH-바이패스의 단백질 등의 단백질의 활성을 감소 또는 파괴하는데 유용한 수 종의 기전들, 비제한적인 예로, 조절된 프로모터의 사용, 약한 구성적인 프로모터의 사용, 이배체 효모에서 단백질을 코딩하는 유전자 2 카피 중 한개 파괴, 이배체 효모에서 유전자 카피 모두의 파괴, 안티센스 핵산의 발현, siRNA의 발현, 내인성 프로모터의 네거티브 조절인자의 과다 발현, 내인성 또는 이종 유전자의 활성 변형, 비활성이 낮은 이종 유전자의 사용 등 또는 이들의 조합들이 존재한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 하나 이상의 유전자에 대한 돌연변이를 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 다른 구현예에서, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 유전자의 일부 파괴를 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 다른 구현예에서, 유전자 변형된 숙주 세포는 PDH-바이패스 단백질을 코딩하는 유전자의 전체 결손을 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 활성이 저하된다. 또 다른 구현예로, 유전자 변형된 숙주 세포는 PDH-바이패스의 단백질을 코딩하는 유전자와 관련된 조절 영역의 변형을 포함하며, 상기 유전자에 의해 코딩되는 폴리펩타이드는 발현이 저하된다. 또 다른 구현예로, 유전자 변형된 숙주 세포는, PDH-바이패스의 단백질을 코딩하는 유전자의 전사 감소를 야기하는, 전사 조절인자의 변형을 포함한다. 또 다른 구현예로, 유전자 변형된 숙주 세포는, PDH-바이패스의 단백질을 코딩하는 모든 유전자들에 대한 돌연변이를 포함하며, 이로써, 상기 유전자에 의해 코딩되는 폴리펩타이드(들)의 활성이 감소된다. 일 구현예에서, PDH-바이패스의 단백질의 활성 또는 발현이 약 50% 이상 감소된다. 다른 구현예에서, PDH-바이패스의 단백질의 활성 또는 발현이, PDH-바이패스의 단백질의 활성 또는 발현 감소를 포함하지 않는 재조합 미생물과 비교하여, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상 감소된다.
일부 구현예들에서, PDH-바이패스의 하나 이상의 유전자 파괴는, 미생물 세포에 구조체를 도입하였을 때 PDH-바이패스의 유전자를 특이적으로 파괴함으로써 파괴된 유전자에 비-기능성을 부여할 수 있는, "파괴 구조체"를 이용함으로써 달성된다. 일부 구현예들에서, 타겟 유전자의 파괴는 기능성 단백질의 발현을 방지한다. 일부 구현예들에서, 타겟 유전자의 파괴로 파괴된 유전자로부터 비-기능성의 단백질이 발현된다. 일부 구현예들에서, PDH-바이패스의 유전자 파괴는, 타겟 유전자 좌내 "파괴 유전자"를 상동적인 재조합에 의해 도입함으로써 달성된다. 이러한 구현예들에서, 상기 파괴 구조체는 타겟 유전자 좌 (상동 서열)의 한쌍의 뉴클레오티드 서열과 상동적인 한쌍의 뉴클레오티드 서열이 측면에 위치한 파괴 서열을 포함한다. 타겟 유전자의 타겟 부위가 파괴 구조체로 치환되면, 파괴 서열은 기능성 단백질의 발현을 방지하거나, 또는 타겟 유전자로부터 비-기능성 단백질이 발현되게 한다.
PDH-바이패스의 유전자를 파괴할 수 있는 파괴 구조체는 당해 기술 분야에 잘 알려져 있는 표준 분자생물 기법을 이용하여 구축할 수 있다. 예로, ambrook et al., 2001, Molecular Cloning -- A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY을 참조한다. 본 발명의 방법의 실시에서 다변화될 수 있는 파괴 구조체에 대한 파라미터로는, 비제한적인 예로, 상동적인 서열의 길이; 상동적인 서열의 뉴클레오티드 서열; 파괴 서열의 길이; 파괴 서열의 뉴클레오티드 서열; 및 타겟 유전자의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 각 상동적인 서열의 길이에 대한 유효 범위는 50 - 5,000 bp (base pair)을 포함한다. 특정 구현예에서, 각 상동적인 서열의 길이는 약 500 bp이다. 유전자 타겟팅에 필요한 상동체 길이에 대한 내용으로 Hasty et al., Mol Cell Biol 11:5586-91 (1991)을 참조한다. 일부 구현예들에서, 상동적인 서열은 타겟 서열의 코딩 서열을 포함한다. 다른 구현예들에서, 상동적인 서열은 타겟 유전자의 상류 또는 하류 서열을 포함한다. 일부 구현예들에서, 하나의 상동적인 서열은 타겟 유전자의 코딩 서열의 5'에 위치한 뉴클레오티드 서열에 상동적이며, 다른 상동적인 서열은 타겟 유전자의 코딩 서열의 3'에 위치한 뉴클레오티드 서열에 상동적이다. 일부 구현예들에서, 파괴 서열은 파괴 서열을 포함하는 미생물을 선별할 수 있는 선별 마커를 코딩하는 뉴클레오티드 서열을 포함한다. 즉, 이러한 구현예들에서, 파괴 구조체는 듀얼 기능, 즉, 타겟 유전자를 기능적으로 파괴하는 기능과 타겟 유전자가 기능적으로 파괴된 세포를 동정하기 위한 선별 마커를 제공하는 기능을 제공한다. 일부 구현예들에서, 종결 코돈 (termination codon)은, 타겟 유전자에 코딩된 야생형 단백질의 활성을 약간 가지는 융합 단백질을 만들 수 있는, 번역 리드-스로우 (translational read-through)를 예방하기 위해, 선별 마커를 코딩하는 뉴클레오티드 서열과 인-프레임으로, 그리고 하류에 위치된다. 일부 구현예들에서, 파괴 서열의 길이는 1 bp이다. 1 bp의 삽입은, 코딩 서열에 1 bp의 삽입이 기능성 단백질의 발현을 예방할 수 있는 프레임 쉬프트 돌연변이를 만들 수 있기 때문에, 타겟 유전자를 파괴하는데 충분할 수 있다. 일부 구현예들에서, 파괴 서열의 서열은 상동적인 서열들 사이에 위치한 타겟 유전자의 뉴클레오티드 서열과 1 bp 차이를 가진다. 타겟 유전자내 뉴클레오티드 서열을 파괴 서열로 치환하면, 도입되는 1 bp 치환으로 단백질의 주요부에 하나의 아미노산 치환과 비-기능성 단백질의 발현이 이루어질 수 있다. 그러나, 매우 짧은 파괴 서열을 이용하여 수행되는 파괴는 자연적인 돌연변이를 통해 야생형 서열로 복구되기 쉬워, 숙주 균주에서 PDH-바이패스가 기능적으로 복원됨을, 인지하여야 한다. 즉, 특정 구현예에서, 파괴 서열은 1 - 수개 bp 보다 길다. 다른 극단적인 예로, 과도하게 긴 길이의 파괴 서열은 보통 길이의 파괴 서열에 비해 임의의 이점을 부여하기 어려울 것이며, 형질감염 또는 타겟팅 효과가 사라질 수도 있다. 이 문맥에서, 과도하게 긴 길이는 타겟 유전자에서 선정된 상동적인 서열들 간의 거리 보다 수배 더 길다. 즉, 특정 구현예들에서, 파괴 서열의 길이는 2 - 2,000 bp일 수 있다. 다른 구현예들에서, 파괴 서열의 길이는, 파괴 구조체내 상동적인 서열들에 부합되는 타겟 유전자 좌의 영역들 사이의 간격과 대략 동일한 길이이다.
일부 구현예들에서, 파괴 구조체는 선형 DNA 분자이다. 다른 구현예들에서, 파괴 구조체는 원형 DNA 분자이다. 일부 구현예들에서, 원형의 파괴 구조체는 전술한 바와 같이 파괴 서열에 의해 분리되어 있는 한쌍의 상동적인 서열을 포함한다. 일부 구현예들에서, 원형의 파괴 구조체는 하나의 상동적인 서열을 포함한다. 이러한 원형의 파괴 구조체는, 타겟 유전자 좌로의 도입시, 선형화될 것이며, 각 말단에 상동적인 서열 부분이 위치되고, 파괴 구조체의 나머지 세그먼트들은 어떠한 타겟 유전자 뉴클레오티드 서열을 치환하지 않고도 타겟 유전자에 삽입되어 이를 파괴한다. 특정 구현예에서, 원형의 파괴 구조체의 단일한 상동적인 서열은 타겟 유전자의 코딩 서열내에 위치한 서열과 상동적이다.
파괴 구조체는 비제한적인 예로 당해 기술 분야의 당업자들에게 공지된 임의 방법으로 미생물 세포에 도입할 수 있다. 이러한 방법으로는, 비제한적으로, 세포에 의한 용액으로부터의 분자의 직접 흡수, 또는 예를 들어 리포좀 또는 이뮤노리포좀을 이용한 리포펙션을 통한 촉매화된 흡수; 입자 매개 형질감염 등을 포함한다. 예로, 미국 특허 5,272,065; Goeddel et al., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조한다. 효소 세포를 형질전환하는 구체적인 방법들은 당해 기술 분야에 잘 공지되어 있다. Hinnen et al., Proc. Natl. Acad. Sci. USA 75:1292-3 (1978); Cregg et al., Mol. Cell. Biol. 5:3376-3385 (1985)를 참조한다. 기법의 예로는, 비제한적으로, 스페로플라스팅 (spheroplasting), 전기충격 (electroporation), PEG 1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개의 형질전환을 포함한다.
5.2.3.1
ALD4 및 ALD6
일부 구현예들에서, 알데하이드 데하이드로게나제 (ACDH) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. 일부 구현예들에서, 알데하이드 데하이드로게나제는 ALD2, ALD3, ALD4, ALD5, ALD6 및 상동체로 이루어진 군으로부터 선택되는 유전자, 및 이들의 변이체에 의해 코딩된다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 ALD4의 기능적 파괴를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ALD4 뉴클레오티드 서열은 등재번호 NM_001183794 및 본원에 제시된 서열번호 7을 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Ald4 단백질 서열은 등재번호 NP_015019.1 및 본원에 제시된 서열번호 8을 포함한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 세포질 알데하이드 데하이드로게나제 (ALD6)의 기능적 파괴를 포함한다. Ald6p는 천연적인 PDH-바이패스에서 아세트알데하이드를 아세테이트로 변환하는 기능을 한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ALD6 뉴클레오티드 서열은 등재번호 SCU56604 및 본원에 제시된 서열번호 9를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Ald6 단백질 서열은 등재번호 AAB01219 및 본원에 제시된 서열번호 10을 포함한다.
당해 기술 분야에서 이해되는 바와 같이, 사카로마이세스 세레비지애 (S. cerevisiae) 이외의 효소에서 알데하이드 데하이드로게나제에 대한 천연 상동체는 본원에 기술된 방법을 이용하여 유사하게 불활화할 수 있다.
당해 기술 분야의 당업자가 이해하는 바와 같이, 2 이상의 알데하이드 데하이드로게나제의 활성 또는 발현이 감소 또는 없어질 수 있다. 일 특정 구현예에서, ALD4 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다. 다른 특정 구현예에서, ALD5 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다. 또 다른 특정 구현예에서, ALD4, ALD5 및 ALD6, 또는 이의 상동체 또는 변이체의 활성 또는 발현이 감소 또는 소실된다.
또 다른 특정 구현예에서, 세포질에 위치한 알데하이드 데하이드로게나제, ALD2, ALD3 및 ALD6, 또는 이들의 상동체 또는 변치에의 활성 또는 발현이, 감소 또는 소실된다. 또 다른 특정 구현예에서, 미토콘드리아에 위치한 알데하이드 데하이드로게나제, ALD4 및 ALD5, 또는 이들의 상동체 또는 변치에의 활성 또는 발현이, 감소 또는 소실된다.
5.2.3.2
ACS1 및 ACS2
일부 구현예들에서, 아세틸-CoA 신타제 (ACS) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. 일부 구현예들에서, 아세틸-CoA 신타제는 ACS1, ACS2 및 상동체로 이루어진 군으로부터 선택되는 유전자, 및 이들의 변이체에 의해 코딩된다.
일부 구현예들에서, 아세틸-CoA 신타제 (ACS) 활성을 코딩하는 하나 이상의 유전자가 숙주 세포에서 기능적으로 파괴된다. ACS1과 ACS2는, 둘다, 아세테이트를 아세틸-CoA로 변환할 수 있는, 아세틸-CoA 신타제이다. ACS1은 호흡 조건 (respiratory condition)에서만 발현되는 반면, ACS2는 구성적으로 발현된다. ACS3가 낫 아웃되면, 균주는 호흡 조건 (예, 에탄올, 글리세롤, 또는 아세테이트 매질)에서 증식할 수 있지만, 발효가능한 탄소원 (예, 슈크로스, 글루코스)에서는 사멸한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 ACS1의 기능적인 파괴를 포함한다. 사카로마이세스 세레비지애 (S. cerevisiae)의 ACS1 유전자 서열은 기존에 공지되었다. 예로, Nagasu et al., Gene 37 (1-3):247-253 (1985)을 참조한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ACS1 뉴클레오티드 서열은 등재번호 X66425와 본원에 제시된 서열번호 3을 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Acs1 단백질 서열은 등재번호 AAC04979와 본원에 제시된 서열번호 4를 포함한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 ACS2의 기능적인 파괴를 포함한다. 사카로마이세스 세레비지애 (S. cerevisiae)의 ACS2 유전자 서열은 기존에 공지된 바 있다. 예로, Van den Berg et al., Eur. J. Biochem. 231(3):704-713 (1995)을 참조한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 ACS2 뉴클레오티드 서열은 등재번호 S79456과 본원에 제시된 서열번호 5를 포함한다. 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 대표적인 Acs2 단백질 서열은 등재번호 CAA97725와 본원에 제시된 서열번호 6을 포함한다.
당해 기술 분야에서 이해되는 바와 같이, 사카로마이세스 세레비지애 (S. cerevisiae) 이외의 효소에서 아세틸-CoA 신타제에 대한 천연 상동체는 본원에 기술된 방법을 이용하여 유사하게 불활화할 수 있다.
일부 구현예들에서, 숙주 세포는 호흡 조건에서 (즉, 숙주 세포를 예컨대 에탄올, 글리세롤 또는 아세테이트의 존재 하에 배양하였을 때) 아세테이트를 아세틸-CoA로 변환할 수 있는, 세포질 아세틸-coA 신타제 활성을 포함한다. 일부 이러한 구현예에서, 숙주 세포는 ACS1 활성을 포함하는 효모 세포이다. 다른 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, 호흡 조건에서 내인성 아세틸-CoA 신타제 활성을 포함하지 않거나, 감소된다. 이러한 일부 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, ACS1 활성이 없거나 감소된, 효소 세포이다.
일부 구현예들에서, 숙주 세포는 무-호흡 조건에서 (즉, 숙주 세포를 발효가능한 탄소원 (예, 슈크로스, 글루코스)의 존재 하에 배양하였을 때) 아세테이트를 아세틸-CoA로 변환할 수 있는, 세포질 아세틸-coA 신타제 활성을 포함한다. 일부 이러한 구현예들에서, 숙주 세포는 ACS2 활성을 포함하는 효모 세포이다. 다른 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, 무-호흡 조건에서는 내인성 아세틸-CoA 신타제 활성이 없거나 감소된다. 일부 이러한 구현예들에서, 숙주 세포는, 부모 세포와 비교하여, ACS2 활성이 없거나 감소된, 효모 세포이다.
5.2.4
포스포케톨라제 (PK) 및 포스포트랜프아세틸라제 (PTA)
효모에서, 아세틸-CoA는 당분해 반응, 트리카르복시산 (TCA) 사이클, 산화적 인산화 및 피루베이트 대사를 통해 글루코스로부터 생합성된다. 그러나, 이러한 생합성 경로에서, 피루베이트 카르복실라제에 의한 피루베이트 대사 과정, 피루베이트 데하이드로게나제 및 이소사이트레이트 데하이드로게나제에 의한 TCA 사이클에서 CO2가 소모된다. 산업 발효 현장에서, 저 당분해를 통한 흐름을 줄이는 한가지 이점은, 피루베이트를 아세트알데하이드로 변환하는 중에 CO2가 적게 생산되며, 따라서 최대 이론 수율이 증가된다는 것이다. 2번째 이점은 NADH가 적게 생산되어, 이를 재산화하는데 필요한 산소가 현저하게 적게 필요하다는 것이다. 탄소 원자의 감소는 이론적으로는 TCA 사이클을 바이패스함으로써 피할 수 있다. 이는, 포스포케톨라제 (PK) (효소 클래스 EC 4.1.2.9, EC 4.1.2.22)를 포스포아세틸트랜스퍼라제 (PTA) (EC 2.3.1.8)와 조합 사용함으로써 달성할 수 있다.
PK와 PTA는 프럭토스-6-포스페이트 (F6P) 또는 자일룰로스-5-포스페이트 (X5P)를 아세틸-CoA로 변환하는 반응을 촉매한다 (도 7). PK는 펜토스 포스페이트 중간산물인 자일룰로스 5-포스페이트로부터, 또는 당분해 중간산물인 D-프럭토스 6-포스페이트 (F6P)로부터 나오며; PK는 X5P를 글리세르알데하이드 3-포스페이트 (G3P)와 아세틸 포스페이트로, 또는 F6P를 에리트로스 4-포스페이트 (E4P)로 분할한다. 그런 후, PTA는 아세틸 포스페이트를 아세틸-CoA로 변환한다. G3P는 저 당분해 과정에 재투입될 수 있으며, E4P는 펜토스 포스페이트 경로 또는 당분해 반응에 트랜스알돌라제 및 트랜스케톨라제의 비-산화적인 펜토스 포스페이트 경로를 통한 사이클링에 의해 재진입할 수 있다.
일부 구현예들에서, 본원에 제공되는 유전자 변형된 숙주 세포는 포스포케톨라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 포스포케톨라제는 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)로부터 유래된다 (Lee et al., Biotechnol Lett. 27(12);853-858 (2005). 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 대표적인 포스포케톨라제 뉴클레오티드 서열로는 등재번호 AY804190와 본원에 제시된 서열번호 11을 포함한다. 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 대표적인 포스포케톨라제 단백질 서열은 등재번호 YP_819405, AAV66077.1 및 본원에 제시된 서열번호 12를 포함한다. 다른 사용가능한 포스포케톨라제로는, 비제한적으로, 비피도박테리움 덴티움 (Bifidobacterium dentium) ATCC 27678 (ABIX02000002.1:2350400..2352877; EDT46356.1); 비피도박테리움 애니말리스 (Bifidobacterium animalis) (NC_017834.1:1127580..1130057; YP_006280131.1); 및 비피도박테리움 슈돌롱검 (Bifidobacterium pseudolongum) (AY518216.1:988..3465; AAR98788.1)로부터 유래된 것을 포함한다.
또한, 본원에 제시된 조성물 방법에 사용가능한 포스포케톨라제로는, 본원에 기술된 임의의 포스포케톨라제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 포스포케톨라제과 상당한 상동성을 공유함; 및 (2) X5P를 글리세르알데하이드 3-포스페이트 (G3P)와 아세틸 포스페이트로 변환하거나; 또는 F6P를 에리트로스 4-포스페이트 (E4P)로 변환하는 과정을 촉매할 수 있음. 포스포케톨라제의 유도체는, 유도체의 아미노산 서열이 포스포케톨라제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 포스포케톨라제와 "상당한 상동성"을 공유한다고 언급한다.
일부 구현예들에서, 본원에 제시된 유전자 변형된 숙주 세포는 포스포트랜스아세틸라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 포스포트랜스아세틸라제는 클로스트리듐 클루이베리 (Clostridium kluyveri)로부터 유래된다. 클로스트리듐 클루이베리 (Clostridium kluyveri)의 대표적인 포스포트랜스아세틸라제 뉴클레오티드 서열은 등재번호 NC_009706.1:1428554..1429555, 및 본원에 제시된 서열번호 13을 포함한다. 클로스트리듐 클루이베리 (Clostridium kluyveri)의 대표적인 포스포트랜스아세틸라제 단백질 서열은 등재번호 YP_001394780과 본원에 제시된 서열번호 14를 포함한다. 그외 사용가능한 포스포트랜스아세틸라제는, 비제한적으로, 락토바실러스 루테리 (Lactobacillus reuteri) (NC_010609.1:460303..461277; YP_001841389.10); 바실러스 섭틸리스 (Bacillus subtilis) (NC_014479.1:3671865..3672836; YP_003868063.1); 및 메타노사르시나 서모필라 (Methanosarcina thermophila) (L23147.1:207..1208; AAA72041.1)로부터 유래된 것을 포함한다.
또한, 본원에 제공되는 조성물과 방법에 사용가능한 포스포트랜스아세틸라제는, 본원에 기술된 임의의 포스포트랜스아세틸라제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 포스포트랜스아세틸라제와 상당한 상동성을 공유함; 및 (2) 아세틸 포스페이트의 아세틸-CoA로의 변환을 촉매할 수 있음. 포스포트랜스아세틸라제의 유도체는, 유도체의 아미노산 서열이 포스포트랜스아세틸라제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 포스포트랜스아세틸라제와 "상당한 상동성"을 공유한다고 언급된다.
5.2.5
MEV 경로
일부 구현예들에서, 숙주 세포는 MEV 경로의 하나 이상의 이종의 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는, 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 2분자를 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 형성하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함한다. 일부 구현예들에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함한다.
일부 구현예들에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제, 아세토아세틸-CoA 신타제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로 이루어진 군으로부터 선택된다. 일부 구현예들에서, 아세토아세틸-CoA의 형성을 촉매할 수 있는 MEV 경로 효소와 관련하여, 유전자 변형된 숙주 세포는, 아세틸-CoA 2 분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세토아세틸-CoA 신타제 중 어느 하나를 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 아세틸-CoA 2 분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예로, 아세틸-CoA 티올라제; 및 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세토아세틸-CoA 신타제를 둘다 포함한다.
일부 구현예들에서, 숙주 세포는 MEV 경로의 1개 보다 많은 수의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드를 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 2종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 HMG-CoA를 메발로네이트로 변환할 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 변환할 수 있는 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 3종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 4종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 5종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 6종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 7종의 효소를 코딩하는 하나 이상의 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, 숙주 세포는 MEV 경로의 모든 효소를 코딩하는 복수의 이종의 뉴클레오티드 서열을 포함한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함한다. 일부 구현예에서, 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함한다. 일부 구현예들에서, 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형시켜 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 추가로 포함한다.
5.2.5.1
아세틸-CoA의 아세토아세틸-CoA로의 변환
일부 구현예들에서, 유전자 변형된 숙주 세포는 아세틸-코엔자임 A 2분자를 축합하여 아세토아세틸-CoA를 형성하는 효소, 예컨대 아세틸-CoA 티올라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_000913 REGION: 2324131.2325315; 에스케리키아 콜라이 (Escherichia coli)), (D49362; 파라코커스 데니트리피칸스 (Paracoccus denitrificans)), 및 (L20428; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.
아세틸-CoA 티올라제는 아세틸-CoA 2 분자의 아세토아세틸-CoA로의 가역적인 축합을 촉매하지만, 이 반응은 열역학적으로는 비우호적이며; 아세토아세틸-CoA 티올라이시스(thiolysis)가 아세토아세틸-CoA 합성 보다 우호적이다. 아세토아세틸-CoA 신타제 (AACS) (이명, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제; EC 2.3.1.194)는 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성한다. 아세틸-CoA 티올라제와는 반대로, AACS-촉매화된 아세토아세틸-CoA 합성은, 조합된 말로닐-CoA의 데카르복시화로 인해, 기본적으로 에너지-우호적인 반응이다. 아울러, AACS는 또한 아세토아세틸-CoA에 대해서는 티올라이시스 활성을 나타내지 않으므로, 반응은 비가역적이다.
이종의 ADA와 아세틸-CoA 티올라제를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올라이시스에 우호적인 아세틸-CoA 티올라제에 의해 촉매되는 가역적인 반응으로, 대규모 아세틸-CoA 풀이 만들어질 수 있다. 가역적인 ADA 활성 측면에서, 이러한 아세틸-CoA 풀은 아세틸-CoA를 아세트알데하이드로 변환하는 가역적인 반응쪽으로 ADA를 향하게 할 수 있으며, 이로써 ADA에 의해 제공되는 아세틸-CoA가 생산되는 방향으로 가게 하는 이점이 없어질 수 있다. 즉, 일부 구현예에서, 아세틸-CoA를 ADA의 정방향 반응으로 가게 하는 강력한 견인력을 제공하기 위해, 본원에 제공된 유전자 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 신타제를 이용하여 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 형성한다.
일부 구현예들에서, AACS는 스트렙토마이세스 sp. strain CL190로부터 유래된다 (Okamura et al., Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 sp. strain CL190의 대표적인 AACS 뉴클레오티드 서열은 등재번호 AB540131.1과 본원에 제시된 서열번호 15를 포함한다. 스트렙토마이세스 sp. strain CL190의 대표적인 AACS 단백질 서열은 등재번호 D7URV0, BAJ10048과 본원에 제시된 서열번호 16을 포함한다. 본원에 제공되는 조성물 및 방법에 이용가능한 다른 아세토아세틸-CoA 신타제로는, 비제한적으로, 스트렙토마이세스 sp. (AB183750; KO-3988 BAD86806); 스트렙토마이세스 아눌라쿠스 (S. anulatus) strain 9663 (FN178498; CAX48662); 스트렙토마이세스 sp. KO-3988 (AB212624; BAE78983); 액티노플란스 (Actinoplanes) sp. A40644 (AB113568; BAD07381); 스트렙토마이세스 sp. C (NZ_ACEW010000640; ZP_05511702); 노카르디옵시스 다손빌레이 (Nocardiopsis dassonvillei) DSM 43111 (NZ_ABUI01000023; ZP_04335288); 마이코박테리움 얼세란스 (Mycobacterium ulcerans) Agy99 (NC_008611; YP_907152); 마이코박테리움 마리눔 (Mycobacterium marinum) M (NC_010612; YP_001851502); 스트렙토마이세스 sp. Mg1 (NZ_DS570501; ZP_05002626); 스트렙토마이세스 sp. AA4 (NZ_ACEV01000037; ZP_05478992); 스트렙토마이세스 로세오스포루스 (S. roseosporus) NRRL 15998 (NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 sp. ACTE (NZ_ADFD01000030; ZP_06275834); 스크렙토마이세스 비리도크로모게네스 (S. viridochromogenes) DSM 40736 (NZ_ACEZ01000031; ZP_05529691); 프랜키아 (Frankia) sp. CcI3 (NC_007777; YP_480101); 노카르디아 브라실렌시스 (Nocardia brasiliensis) (NC_018681; YP_006812440.1); 및 오스트윅키아 첼로네 (Austwickia chelonae) (NZ_BAGZ01000005; ZP_10950493.1)를 포함한다. 추가적인 적정 아세토아세틸-CoA 신타제로는 미국 특허 공개공보 2010/0285549와 2011/0281315에 기술되어 있으며, 그 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.
또한, 본원에 제공되는 조성물 및 방법에 사용가능한 아세토아세틸-CoA 신타제는, 본원에 기술된 임의의 아세토아세틸-CoA 신타제의 유도체로 지칭되는 분자를 포함한다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 아세토아세틸-CoA 신타제와 상당한 상동성을 공유함; 및 (2) 아세틸-CoA와 말로닐-CoA를 축합하여 아세토아세틸-CoA로 변환하는 비가역적인 축합을 촉매할 수 있음. 아세토아세틸-CoA 신타제의 유도체는, 유도체의 아미노산 서열이 아세토아세틸-CoA 신타제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, 아세토아세틸-CoA 신타제와 "상당한 상동성"을 공유한다고 언급된다.
5.2.5.2
아세토아세틸-CoA의 HMG-CoA로의 변환
일부 구현예들에서, 숙주 세포는, 아세토아세틸-CoA를 다른 아세틸-CoA 분자와 축합하여 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA)를 형성할 수 있는 효소, 예컨대 HMG-CoA 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_001145. complement 19061.20536; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (X96617; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (X83882; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AB037907; 키타사토스포라 그리세올라 (Kitasatospora griseola)), (BT007302; 호모 사피엔스 (Homo sapiens)), 및 (NC_002758, Locus tag SAV2546, GeneID 1122571; 스타필로코커스 아우레우스 (Staphylococcus aureus))를 포함한다.
5.2.5.3
HMG-CoA의 메발로네이트로의 변환
일부 구현예들에서, 숙주 세포는 HMG-CoA를 메발로네이트로 변환할 수 있는 효소, 예컨대 HMG-CoA 리덕타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 일부 구현예들에서, HMG-CoA 리덕타제는 NADH-가용성 하이드록시메틸글루타릴-CoA 리덕타제-CoA 리덕타제이다. HMG-CoA 리덕타제 (EC 1.1.1.34; EC 1.1.1.88)는 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매하며, 클래스 I과 클래스 II HMGr 2종의 클래스로 분류될 수 있다. 클래스 I은 진핵생물과 대부분의 고세균의 효소를 포함하며, 클래스 II는 일부 원핵생물과 고세균의 HMG-CoA 리덕타제를 포함한다. 서열 다양성 외에도, 2종류의 효소는 또한 이들의 조인자 특이성에 차이가 있다. NADPH만을 이용하는 클래스 I 효소와는 달리, 클래스 II HMG-CoA 리덕타제는 NADPH와 NADH를 구별하는 능력에 차이가 있다. 예로, Hedl et al., Journal of Bacteriology 186 (7): 1927-1932 (2004)를 참조한다. 클래스 II HMG-CoA 리덕타제를 선별하기 위한 조인자 특이성은 아래에 나타낸다.
표 1. 클래스 II HMG-CoA 리덕타제를 선별하기 위한 조인자 특이성
소스 | 코엔자임 특이성 | K m NADPH (μM) | K m NADH (μM) |
슈도모나스 메발로니 (P. mevalonii)
|
NADH | 80 | |
아르케오글로부스 풀기두스 (A. fulgidus) | NAD(P)H | 500 | 160 |
스타필로코커스 아우레우스 (S. aureus) | NAD(P)H | 70 | 100 |
엔테로코커스 패칼리스 ( E. faecalis) | NADPH | 30 |
본원에 제시된 조성물 및 방법에서 사용가능한 HMG-CoA 리덕타제는 조인자로서 NADH를 이용할 수 있는 HMG-CoA 리덕타제, 예컨대 슈도모나스 메발로니 (P. mevalonii), 아르케오글로부스 풀기두스 (A. fulgidus) 또는 스타필로코커스 아우레우스 (S. aureus) 유래의 HMG-CoA 리덕타제를 포함한다. 특정 구현예에서, HMG-CoA 리덕타제는 조인자로서 NADH만을 이용하며, 예컨대, 슈도모나스 메발로니 (P. mevalonii), 실리시박터 포메로이 (S. pomeroyi) 또는 델프티아 액시도보란스 (D. acidovorans) 유래의 HMG-CoA 리덕타제이다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 슈도모나스 메발로니 (Pseudomonas mevalonii)로부터 유래된다. HMG-CoA 리덕타제 (E.C. 1.1.1.88)를 코딩하는 슈도모나스 메발로니 (Pseudomonas mevalonii)의 야생형 mvaA 유전자 서열은 이전에 개시된 바 있다. Beach 및 Rodwell, J. Bacteriol. 171:2994-3001 (1989)을 참조한다. 슈도모나스 메발로니 (Pseudomonas mevalonii)의 대표적인 mvaA 뉴클레오티드 서열은 등재번호 M24015, 및 본원에 제시된 서열번호 17을 포함한다. 슈도모나스 메발로니 (Pseudomonas mevalonii)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 AAA25837, P13702, MVAA_PSEMV 및 본원에 제시된 서열번호 18을 포함한다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 실리시박터 포메로이 (Silicibacter pomeroyi)로부터 유래된다. 실리시박터 포메로이 (Silicibacter pomeroyi)의 대표적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 등재번호 NC_006569.1, 및 본원에 제시된 서열번호 19를 포함한다. 실리시박터 포메로이 (Silicibacter pomeroyi)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 YP_164994 및 본원에 제시된 서열번호 20을 포함한다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 델프티아 액시도보란스 (Delftia acidovorans)로부터 유래된다. 델프티아 액시도보란스 (Delftia acidovorans)의 대표적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 NC_010002 REGION: complement(319980..321269), 및 본원에 제시된 서열번호 21을 포함한다. 델프티아 액시도보란스 (Delftia acidovorans)의 대표적인 HMG-CoA 리덕타제 단백질 서열은 등재번호 YP_001561318 및 본원에 제시된 서열번호 22를 포함한다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 솔라눔 투베로숨 (Solanum tuberosum)으로부터 유래된다 (Crane et al., J. Plant Physiol. 159:1301-1307 (2002)).
또한, 본원에 제공되는 조성물 및 방법에 사용가능한 NADH-가용성 HMG-CoA 리덕타제는, 본원에 언급된 임의의 NADH-가용성 HMG-CoA 리덕타제, 예컨대 슈도모나스 메발로니 (P. mevalonii), 실리시박터 포메로이(S. pomeroyi) 및 델프티아 액시도보란스 (D. acidovorans)로부터 유래된 NADH-가용성 HMG-CoA 리덕타제에 대한 "유도체"로 지칭되는 분자를 포함함다. 이러한 "유도체"는 다음과 같은 특징을 가진다: (1) 이는 본원에 기술된 임의의 NADH-가용성 HMG-CoA 리덕타제와 상당한 상동성을 공유함; 및 (2) 조인자로서 선호적으로 NADH를 이용하면서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매할 수 있음. NADH-가용성 HMG-CoA 리덕타제의 유도체는, 유도체의 아미노산 서열이 NADH-가용성 HMG-CoA 리덕타제의 서열과 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일하다면, NADH-가용성 HMG-CoA 리덕타제와 "상당한 상동성"을 공유한다고 지칭된다.
본원에서, "NADH-가용성"이라는 표현은, 예를 들어, NADPH 보다 NADH에 대해 높은 비활성 (specific activity)을 나타냄으로써, NADH-가용성 HMG-CoA 리덕타제가 조인자로서 NADPH에 비해 NADH에 대해 선택적이라는 것을 의미한다. 일부 구현예들에서, 조인자로서 NADH에 대한 선택성은 k cat (NADH)/ k cat (NADPH) 비로 표시된다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 k cat (NADH)/ k cat (NADPH) 비가 적어도 5, 10, 15, 20, 25 또는 > 25이다. 일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는 NADH만을 이용한다. 예를 들어, NADH만을 사용하는 NADH-가용성 HMG-CoA 리덕타제는 시험관내에서 유일한 조인자로서 제공되는 NADH를 이용하여 일부 활성을 나타내며 (예, 실시예 1 및 아래 섹션 6.1.1.3), NADPH가 유일한 조인자로서 제공되는 경우 검출가능한 활성을 나타내지 않는다. Kim et al., Protein Science 9:1226-1234 (2000); 및 Wilding et al., J. Bacteriol. 182(18):5147-52 (2000)에 개시된 방법을 비롯하여, 당해 기술 분야에 공지된 조인자 특이성을 확인하기 위한 임의의 방법을 이용하여, 조인자로서 NADH에 대해 선호성을 가지는 HMG-CoA 리덕타제를 동정할 수 있으며, 이들의 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는, 예를 들어 조인자-결합 포켓에 부위 특이적인 돌연변이를 유발하여, NAPDH에 비해 NADH에 선택적이도록 조작된다. NADH-선택성을 조작하는 방법은 Watanabe et al., Microbiology 153:3044-3054 (2007)에 기술되어 있으며, HMG-CoA 리덕타제의 조인자 특이성을 확인하는 방법은 Kim et al., Protein Sci. 9:1226-1234 (2000)에 기술되어 있으며, 그 내용은 전체가 원용에 의해 본 명세서에 포함된다.
일부 구현예들에서, NADH-가용성 HMG-CoA 리덕타제는, 메발로네이트 분해 경로를 천연적으로 포함하는 숙주 종, 예컨대, 이의 단독 탄소원으로서 메발로네이트를 이화하는 숙주 종으로부터 유래된다. 이들 구현예들에서, 천연 숙주 세포에서 내재화된 (R)-메발로네이트의 (S)-HMG-CoA로의 산화적인 아실화를 정상적으로 촉매하는, NADH-가용성 HMG-CoA 리덕타제를 이용하여, 역 반응 (reverse reaction), 즉, 메발로네이트 생합성 경로를 포함하는 유전자 변형된 숙주 세포에서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적인 탈아실화를 촉매한다. 단독 탄소원으로서 메발로네이트에서 증식할 수 있는 원핵생물은 Anderson et al., J. Bacteriol, 171(12):6468-6472 (1989); Beach et al., J. Bacteriol. 171:2994-3001 (1989); Bensch et al., J. Biol. Chem. 245:3755-3762; Fimongnari et al., Biochemistry 4:2086-2090 (1965); Siddiqi et al., Biochem. Biophys. Res. Commun. 8:110-113 (1962); Siddiqi et al., J. Bacteriol. 93:207-214 (1967); 및 Takatsuji et al., Biochem. Biophys. Res. Commun.110:187-193 (1983)에 기술되어 있으며, 그 전체 내용이 원용에 의해 본 명세서에 포함된다.
본원에 제시된 조성물 및 방법에 대한 일부 구현예들에서, 숙주 세포는 NADH-가용성 HMGr과 NADPH-가용성 HMG-CoA 리덕타제 둘다를 포함한다. NADPH-가용성 HMG-CoA 리덕타제를 코딩하는 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로: (NM_206548; 드로소필라 멜라노가스터 (Drosophila melanogaster)), (NC_002758, Locus tag SAV2545, GeneID 1122570; 스타필로코커스 아우레우스 (Staphylococcus aureus)), (AB015627; 스트렙토마이세스 sp. KO 3988), (AX128213, 절단된 HMG-CoA 리덕타제를 코딩하는 서열 제공; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), 및 (NC_001145: complement (115734.118898; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.
5.2.5.4
메발로네이트의 메발로네이트-5-포스페이트로의 변환
일부 구현예들에서, 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 변환할 수 있는 효소, 예컨대 메발로네이트 키나제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로: (L77688; 아라비옵시스 탈리아나 (Arabidopsis thaliana)) 및 (X55875; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.
5.2.5.5
메발로네이트-5-포스페이트의 메발로네이트-5-피로포스페이트로의 변환
일부 구현예들에서, 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환할 수 있는 효소, 예컨대 포스포메발로네이트 키나제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로: (AF429385; 헤베아 브라실렌시스 (Hevea brasiliensis)), (NM_006556; 호모 사피엔스 (Homo sapiens)), 및 (NC_001145. complement 712315.713670; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae))를 포함한다.
5.2.5.6
메발로네이트-5-피로포스페이트의 IPP로의 변환
일부 구현예들에서, 숙주 세포는 메발로네이트 5-피로포스페이트로를 이소펜테닐 다이포스페이트 (IPP)로 변환할 수 있는 효소, 예컨대 메발로네이트 피로포스페이트 데카르복실라제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (X97557; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (AF290095; 엔테로코커스 패슘 (Enterococcus faecium)), 및 (U49260; 호모 사피엔스 (Homo sapiens))를 포함한다.
5.2.5.7
IPP의 DMAPP로의 변환
일부 구현예들에서, 숙주 세포는 further comprises MEV 경로를 통해 만들어진 IPP를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소, 예컨대 IPP 이소머라제를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (NC_000913, 3031087.3031635; 에스케리키아 콜라이 (Escherichia coli)), 및 (AF082326; 헤마토코커스 프루바이얼리스 (Haematococcus pluvialis)를 포함한다.
5.2.5.8
폴리프레닐 신타제
일부 구현예들에서, 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여 탄소를 5개 보다 많이 포함하는 폴리프레닐 화합물을 형성할 수 있는 폴리프레닐 신타제를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다.
일부 구현예들에서, 숙주 세포는 IPP 한 분자와 DMAPP 1 분자를 축합하여 게라닐 피로포스페이트 ("GPP") 1 분자를 형성할 수 있는 효소, 예로 GPP 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (AF513111; 아비에스 그란디스 (Abies grandis)), (AF513112; 아비에스 그란디스 (Abies grandis)), (AF513113; 아비에스 그란디스 (Abies grandis)), (AY534686; 안티리눔 마주스 (Antirrhinum majus)), (AY534687; 안티리눔 마주스 (Antirrhinum majus)), (Y17376; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AE016877, Locus AP11092; 바실러스 세레우스 (Bacillus cereus); ATCC 14579), (AJ243739; 시트러스 시넨시스 (Citrus sinensis)), (AY534745; 클라르키아 브루어리 (Clarkia breweri)), (AY953508; 입스 피니 (Ips pini)), (DQ286930; 라이코퍼시콘 에스쿨렌툼 (Lycopersicon esculentum)), (AF182828; 멘타 x 피페리타 (Mentha x piperita)), (AF182827; 멘타 x 피페리타 (Mentha x piperita)), (MPI249453; 멘타 x 피페리타 (Mentha x piperita)), (PZE431697, Locus CAD24425; 파라코커스 제아산티니팍시엔스 (Paracoccus zeaxanthinifaciens)), (AY866498; 피크로리자 쿠로아 (Picrorhiza kurrooa)), (AY351862; 비티스 비니페라 (Vitis vinifera)), 및 (AF203881, Locus AAF12843; 자이모모나스 모빌리스 (Zymomonas mobilis))를 포함한다.
일부 구현예들에서, 숙주 세포는 IPP 2 분자를 DMAPP 1 분자와 축합하거나, 또는 IPP 분자에 GPP 분자를 부가하여, 파르네실 피로포스페이트 ("FPP") 분자를 형성할 수 있는 효소, 예로, FPP 신타제를 코딩하는 이종의 뉴클레오티드 서열을 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열의 예시적인 예로는, 비제한적으로, (ATU80605; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (ATHFPS2R; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AAU36376; 아르테미시아 아누아 (Artemisia annua)), (AF461050; Bos taurus), (D00694; 에스케리키아 콜라이 (Escherichia coli) K-12), (AE009951, Locus AAL95523; 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum) subsp. nucleatum ATCC 25586), (GFFPPSGEN; 지베렐라 푸이쿠로이 (Gibberella fujikuroi)), (CP000009, Locus AAW60034; 글루코노박터 옥시단스 (Gluconobacter oxydans) 621H), (AF019892; 헬리안투스 안누스 (Helianthus annuus)), (HUMFAPS; 호모 사피엔스 (Homo sapiens)), (KLPFPSQCR; 클루이베로마이세스 락티스 (Kluyveromyces lactis)), (LAU15777; 루피누스 알부스 (Lupinus albus)), (LAU20771; 루피누스 알부스 (Lupinus albus)), (AF309508; 무스 무스쿨러스 (Mus musculus)), (NCFPPSGEN; 뉴로스포라 크라사 (Neurospora crassa)), (PAFPS1; 파르테늄 아르겐타툼 (Parthenium argentatum)), (PAFPS2; 파르테늄 아르겐타툼 (Parthenium argentatum)), (RATFAPS; 라투스 노르베기쿠스 (Rattus norvegicus)), (YSCFPP; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (D89104; 스키조사카로마이세스 폼베 (스키조사카로마이세스 폼베 (Schizosaccharomyces pombe))), (CP000003, Locus AAT87386; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (NC_008022, Locus YP_598856; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS10270), (NC_008023, Locus YP_600845; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS2096), (NC_008024, Locus YP_602832; 스트렙토코커스 피오게네스 (Streptococcus pyogenes) MGAS10750), (MZEFPS; 지 메이스 (Zea mays)), (AE000657, Locus AAC06913; 아퀴펙스 에어올리쿠스 (Aquifex aeolicus) VF5), (NM_202836; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (D84432, Locus BAA12575; 바실러스 섭틸리스 (Bacillus subtilis)), (U12678, Locus AAC28894; 브래디리조븀 자포니쿰 (Bradyrhizobium japonicum) USDA 110), (BACFDPS; 지오바실러스 스테아로서모필러스 (Geobacillus stearothermophilus)), (NC_002940, Locus NP_873754; 헤모필러스 두크레이 (Haemophilus ducreyi) 35000HP), (L42023, Locus AAC23087; 헤모필러스 인플루엔자 (Haemophilus influenza)e Rd KW20), (J05262; 호모 사피엔스 (Homo sapiens)), (YP_395294; 락토바실러스 사케이 (Lactobacillus sakei) subsp. sakei 23K), (NC_005823, Locus YP_000273; 펩토스피라 인테로간스 (Leptospira interrogans) serovar Copenhageni str. Fiocruz L1-130), (AB003187; 마이크로코커스 루테우스 (Micrococcus luteus)), (NC_002946, Locus YP_208768; 네이세리아 고노로이에 (Neisseria gonorrhoeae) FA 1090), (U00090, Locus AAB91752; 리조븀 (Rhizobium) sp. NGR234), (J05091; 사카로마이세스 세레비지애 (Saccharomyces cerevisae), (CP000031, Locus AAV93568; 실리시박터 포메로이 (Silicibacter pomeroyi)) DSS-3), (AE008481, Locus AAK99890; 스트렙토코커스 뉴모니아 (Streptococcus pneumonia)e R6), 및 (NC_004556, Locus NP 779706; 크실렐라 파스티도사 (Xylella fastidiosa) Temecula1)를 포함한다.
일부 구현예들에서, 숙주 세포는 IPP를 DMAPP와, 또는 IPP를 FPP와 조합하여 게라닐게라닐 피로포스페이트 ("GGPP")를 형성할 수 있는 효소를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다. 이러한 효소를 코딩하는 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (ATHGERPYRS; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (BT005328; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_119845; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NZ_AAJM01000380, Locus ZP_00743052; 바실러스 투린지엔시스 (Bacillus thuringiensis) serovar israelensis, ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로세우스 (Catharanthus roseus)), (NZ_AABF02000074, Locus ZP_00144509; 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum) subsp. vincentii, ATCC 49256), (GFGGPPSGN; 지베렐라 푸이쿠로이 (Gibberella fujikuroi)), (AY371321; 징코 빌로바 (Ginkgo biloba)), (AB055496; 헤베아 브라실렌시스 (Hevea brasiliensis)), (AB017971; 호모 사피엔스 (Homo sapiens)), (MCI276129; 무코르 시르시넬로이데스 f. 루시타니쿠스 (Mucor circinelloides f. lusitanicus)), (AB016044; 무스 무스쿨러스 (Mus musculus)), (AABX01000298, Locus NCU01427; 뉴로스포라 크라사 (Neurospora crassa)), (NCU20940; 뉴로스포라 크라사 (Neurospora crassa)), (NZ_AAKL01000008, Locus ZP_00943566; 랄스토니아 솔라나세아룸 (Ralstonia solanacearum) UW551), (AB118238; 라투스 노르베기쿠스 (Rattus norvegicus)), (SCU31632; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)), (AB016095; 시네코코쿠스 엘롱가테스 (Synechococcus elongates)), (SAGGPS; 시나피스 알바 (Sinapis alba)), (SSOGDS;설폴로부스 액시도칼다리우스 (Sulfolobus acidocaldarius)), (NC_007759, Locus YP_461832; Syntrophus aciditrophicus SB), (NC_006840, Locus YP_204095; 비브리오 피세리 (Vibrio fischeri) ES114), (NM_112315; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (ERWCRTE; 판토에아 어글로머란스 (Pantoea agglomerans)), (D90087, Locus BAA14124; 판토에아 아나나티스 (Pantoea ananatis)), (X52291, Locus CAA36538; 로도박터 캡슐라투스 (Rhodobacter capsulatus)), (AF195122, Locus AAF24294; 로도박터 스페어로이데스 (Rhodobacter sphaeroides)), 및 (NC_004350, Locus NP_721015; 스트렙토코커스 무탄스 (Streptococcus mutans) UA159)를 포함한다.
5.2.5.9
테르펜 신타제
일부 구현예들에서, 숙주 세포는 폴리프레닐을 변형시켜, 헤미테르펜, 모노테르펜, 세스퀴테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 폴리테르펜, 스테로이드 화합물, 카로테노이드 또는 변형된 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 뉴클레오티드 서열을 추가로 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 카렌 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AF461460, REGION 43.1926; 피세아 아비에스 (Picea abies)) 및 (AF527416, REGION: 78.1871; 살비아 스테노필라 (Salvia stenophylla))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 게라니올 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AJ457070; 신나모뭄 테누이필럼 (Cinnamomum tenuipilum)), (AY362553; 오시뭄 바실리쿰 (Ocimum basilicum)), (DQ234300; 펠릴라 프루테센스 (Perilla frutescens) strain 1864), (DQ234299; 페릴라 시트리오도라 (Perilla citriodora) strain 1861), (DQ234298; 페릴라 시트리오도라 (Perilla citriodora) strain 4935), 및 (DQ088667; 페릴라 시트리오도라 (Perilla citriodora))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 리날롤 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AF497485; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AC002294, Locus AAB71482; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AY059757; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_104793; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (AF154124; 아르테미시아 아누아 (Artemisia annua)), (AF067603; 클라르키아 브루어리 (Clarkia breweri)), (AF067602; 클라르키아 콘시나 (Clarkia concinna)), (AF067601; 클라르키아 브루어리 (Clarkia breweri)), (U58314; 클라르키아 브루어리 (Clarkia breweri)), (AY840091; 라이코퍼시콘 에스쿨렌툼 (Lycopersicon esculentum)), (DQ263741; 라반둘라 안구스티폴리아 (Lavandula angustifolia)), (AY083653; 멘타 사이트레이트 (Mentha citrate)), (AY693647; 오시뭄 바실리쿰 (Ocimum basilicum)), (XM_463918; 오리자 사티바 (Oryza sativa)), (AP004078, Locus BAD07605; 오리자 사티바 (Oryza sativa)), (XM_463918, Locus XP_463918; 오리자 사티바 (Oryza sativa)), (AY917193; 페릴라 시트리오도라 (Perilla citriodora)), (AF271259; 펠릴라 프루테센스 (Perilla frutescens)), (AY473623; 피세아 아비에스 (Picea abies)), (DQ195274; 피세아 시첸시스 (Picea sitchensis)), 및 (AF444798; 펠릴라 프루테센스 (Perilla frutescens) var. crispa cultivar No. 79)를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 리모넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (+)-리모넨 신타제 (AF514287, REGION: 47.1867; 시트러스 리몬 (Citrus limon) 및 AY055214 (REGION: 48.1889; 아가스타케 루고사 (Agastache rugosa)) 및 (-)-리모넨 신타제 (DQ195275, REGION: 1.1905; 피세아 시첸시스 (Picea sitchensis)), (AF006193, REGION: 73.1986; 아비에스 그란디스 (Abies grandis)), 및 (MHC4SLSP, REGION: 29.1828; 멘타 스피카타 (Mentha spicata))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 미르센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (U87908; 아비에스 그란디스 (Abies grandis)), (AY195609; 안티리눔 마주스 (Antirrhinum majus)), (AY195608; 안티리눔 마주스 (Antirrhinum majus)), (NM_127982; 아라비옵시스 탈리아나 (Arabidopsis thaliana) TPS10), (NM_113485; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_113483; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (AF271259; 펠릴라 프루테센스 (Perilla frutescens)), (AY473626; 피세아 아비에스 (Picea abies)), (AF369919; 피세아 아비에스 (Picea abies)), 및 (AJ304839; 퀘르쿠스 일렉스 (Quercus ilex))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 옥시멘 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AY195607; 안티리눔 마주스 (Antirrhinum majus)), (AY195609; 안티리눔 마주스 (Antirrhinum majus)), (AY195608; 안티리눔 마주스 (Antirrhinum majus)), (AK221024; 아라비옵시스 탈리아나 (Arabidopsis thaliana)), (NM_113485; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_113483; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS-CIN), (NM_117775; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS03), (NM_001036574; 아라비옵시스 탈리아나 (Arabidopsis thaliana) ATTPS03), (NM_127982; 아라비옵시스 탈리아나 (Arabidopsis thaliana) TPS10), (AB110642; 시트러스 운시우 (Citrus unshiu) CitMTSL4) 및 (AY575970; Lotus corniculatus var. japonicus)를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 알파-피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (+) 알파-피넨 신타제 (AF543530, REGION: 1.1887; 피누스 타에다 (Pinus taeda)), (-)알파-피넨 신타제 (AF543527, REGION: 32.1921; 피누스 타에다 (Pinus taeda)), 및 (+)/(-)알파-피넨 신타제 (AGU87909, REGION: 6111892; 아비에스 그란디스 (Abies grandis))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 베타-피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (-) 베타-피넨 신타제 (AF276072, REGION: 1.1749; 아르테미시아 아누아 (Artemisia annua)) 및 (AF514288, REGION: 26.1834; 시트러스 리몬 (Citrus limon))을 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 사비넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AF051901 (REGION: 26.1798, 살비아 오피시날리스 (Salvia officinalis) 유래)를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 감마-테르피넨 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는: (AF514286, REGION: 30.1832, 시트러스 리몬 (Citrus limon)) 및 (AB110640, REGION 1.1803, 시트러스 운시우 (Citrus unshiu))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 테르피놀렌 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (AY693650, 오스시뭄 바실리툼 (Oscimum basilicum)) 및 (AY906866, REGION: 10.1887, 슈도츠가 멘지에시 (Pseudotsuga menziesii))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 아모르파디엔 신타제를 코딩한다. 적정 뉴클레오티드 서열에 대한 예시적인 예는, 미국 특허 공개공보 2004/0005678의 서열번호 37이다.
일부 구현예들에서, 이종의 뉴클레오티드는 알파-파르네센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, DQ309034, 피루스 코무니스 (Pyrus communis) cultivar d'Anjou (배; 유전자명 AFS1) 및 AY182241, 말루스 도메스티카 (Malus domestica) (사과; 유전자 AFS1)를 포함한다. Pechouus et al., Planta 219(1):84-94 (2004).
일부 구현예들에서, 이종의 뉴클레오티드는 베타-파르네센 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 멘타 x 피페리타 (Mentha x piperita)의 등재번호 AF024615 (peppermint; gene Tspa11), 및 아르테미시아 아누아 (Artemisia annua)의 AY835398을 포함한다. Picaud et al., Phytochemistry 66(9): 961-967 (2005).
일부 구현예들에서, 이종의 뉴클레오티드는 파르네솔 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 지 메이스 (Zea mays)의 등재번호 AF529266와 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)의 YDR481C (유전자 Pho8)를 포함한다. Song, L., Applied Biochemistry and Biotechnology 128:149-158 (2006).
일부 구현예들에서, 이종의 뉴클레오티드는 네롤리돌 신타제제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, 지 메이스 (Zea mays)의 AF529266 (옥수수; 유전자 tps1)을 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 패출리올 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AY508730 (REGION: 포고스테몬 카블린 (Pogostemon cablin)의 1.1659)을 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 노트카톤 (nootkatone) 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, AF441124 (REGION: 1.1647, 시트러스 시넨시스 (Citrus sinensis)) 및 AY917195 (REGION: 1.1653, 펠릴라 프루테센스 (Perilla frutescens))를 포함한다.
일부 구현예들에서, 이종의 뉴클레오티드는 아비에타딘 (abietadiene) 신타제를 코딩한다. 적합한 뉴클레오티드 서열에 대한 예시적인 예로는, 비제한적으로, (U50768; 아비에스 그란디스 (Abies grandis)) 및 (AY473621; 피세아 아비에스 (Picea abies))을 포함한다.
일부 구현예들에서, 숙주 세포는 C5 이소프레노이드를 생산한다. 이 화합물은 하나의 이소프렌 유닛으로부터 파생되며, 또한 헤미테르펜으로도 불리운다. 헤미테르펜에 대한 예시적인 예가 이소프렌이다. 다른 구현예들에서, 이소프레노이드는 C10 이소프레노이드이다. 이 화합물은 이소프렌 2개의 유닛으로부터 파생되며, 모노테르펜으로도 지칭된다. 모노테르펜에 대한 예시적인 예로는 리모넨, 시트라넬롤, 게라니올, 멘톨, 페릴릴 알코올, 리날롤, 튜온 (thujone) 및 미르센이 있다. 다른 구현예들에서, 이소프레노이드는 C15 이소프레노이드이다. 이 화합물은 이소프렌 3개의 유닛으로부터 파생되며, 세스퀴테르펜으로도 지칭된다. 세스퀴테르펜에 대한 예시적인 예로는 페리플라논 (periplanone) B, 징콜라이드 (gingkolide) B, 아모르파디엔, 아르테미시닌 (artemisinin), 아르테미신산 (artemisinic acid), 발렌센 (valencene), 노트카톤 (nootkatone), 에피-세드롤 (epi-cedrol), 에피-아리스톨로켄 (epi-aristolochene), 파르네솔 (farnesol), 고시폴 (gossypol), 사노닌 (sanonin), 페리플라논, 포르스콜린 (forskolin), 및 패촐롤 (패촐리 알코올이라고도 함)이 있다. 다른 구현예들에서, 이소프레노이드는 C20 이소프레노이드이다. 이 화합물은 이소프렌 4개의 유닛으로부터 파생되며, 또한 다이테르펜으로도 지칭된다. 다이테르펜에 대한 예시적인 예로는 카르벤 (casbene), 엘루테로빈 (eleutherobin), 파클리탁셀, 프로스트라틴 (prostratin), 슈도프테로신 (pseudopterosin) 및 탁사디엔 (taxadiene)이 있다. 또 다른 예로, 이소프레노이드는 C20+ 이소프레노이드이다. 이 화합물은 4개 보다 많은 수의 이소프렌 유닛들로부터 파생되며, 트리테르펜 (이소프렌 6개의 유닛으로부터 파생된 C30 이소프레노이드 화합물), 예컨대 아르브루시드 (arbruside) E, 브루세안틴 (bruceantin), 테스토스테론, 프로게스테론, 코르티손, 디지톡신 (digitoxin) 및 스쿠알렌; 테트라테르펜 (이소프레노이드 8개로부터 파생된 C40 이소프레노이드 화합물), 예컨대 베타-카로텐; 및 폴리테르펜 (8개 보다 많은 수의 이소프렌 유닛으로부터 파생된 C40+ 이소프레노이드 화합물), 예컨대 폴리이소프렌을 포함한다. 일부 구현예들에서, 이소프레노이드는 아비에타디엔, 아모르파디엔, 카렌, 알파-파르네센, 베타-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, 베타-피넨, 사비넨, 감마-테르피넨, 페르피놀렌 및 발렌센으로 이루어진 군으로부터 선택된다. 이소프레노이드 화합물은, 또한, 비제한적으로, 카로테노이드 (예, 라이코펜, 알파- 및 베타-카로텐, 알파- 및 베타-크립토잔틴, 빅신 (bixin), 제아잔틴 (zeaxanthin), 아스타잔틴 (astaxanthin) 및 루테인), 스테로이드 화합물, 및 다른 화학 기로 변형된 이소프레노이드로 구성된 화합물들, 예컨대 혼성 테르펜-알카로이드 및 코엔자임 Q-10을 포함한다.
5.3
유전자 변형된 세포의 제조 방법
또한, 본 발명은, 전술한 한가지 이상의 변형, 예컨대 ADA, NADH-가용성 HMG-CoA 리덕타제, AACS, PK, PTA 및 그외 메발로네이트 경로 효소로부터 선택되는 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산을 포함하도록 유전자 조작된 숙주 세포의 제조 방법을 제공한다. 숙주 세포에서 이종의 효소의 발현은, 숙주 세포에, 숙주 세포에서의 발현을 허용하는 조절 인자의 통제를 받도록 상기 효소를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입함으로써, 달성될 수 있다. 일부 구현예들에서, 핵산은 염색체외 플라스미드이다. 다른 구현예들에서, 핵산은 숙주 세포의 염색체로 뉴클레오티드 서열을 삽입할 수 있는 염색체 삽입 벡터이다.
이들 단백질을 코딩하는 핵산은, 비제한적인 예로, 당해 기술 분야의 당업자에게 공지된 임의의 방법을 이용하여 숙주 세포로 도입할 수 있다 (예를 들어, Hinnen et al. (1978) Proc. Natl. Acad. Sci. USA 75:1292-3; Cregg et al. (1985) Mol. Cell. Biol. 5:3376-3385; Goeddel et al. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc. , CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al. , 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; Ausubel et al. , eds. , Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY을 참조함). 기법의 예로는, 비제한적으로, 스페로플라스팅, 전기충격, PEG 1000 매개 형질전환 및 리튬 아세테이트 또는 리튬 클로라이드 매개의 형질전환을 포함한다.
숙주 세포내 효소의 카피 수는, 이 효소를 코딩하는 유전자의 전사를 수정함으로써 변형시킬 수 있다. 이는, 예를 들어, 이 효소를 코딩하는 뉴클레오티드 서열의 카피 수를 변형시킴으로써 (예로, 뉴클레오티드 서열을 포함하는 고카피수 또는 저카피수 발현 벡터를 이용하거나, 또는 숙주 세포의 게놈에 뉴클레오티드 서열의 부가 카피를 도입하거나 숙주 세포의 게놈에서 뉴클레오티드 서열을 결손 또는 파괴함으로써), 또는 오페론의 폴리시스트론 mRNA에서 코딩 서열의 순서를 바꾸거나 또는 오페론을 자신의 조절 인자를 가진 각각의 개개 유전자로 분할함으로써, 또는 뉴클레오티드 서열엘 작동가능하게 연결된 프로모터나 오퍼레이터의 세기를 높임으로써, 달성할 수 있다. 다른 예로, 또는 아울러, 숙주 세포에서 효소의 카피 수는, 이 효소를 코딩하는 mRNA의 번역 수준을 수정함으로써 변형시킬 수 있다. 이는, 예를 들어, mRNA의 안정성을 변형시키거나, 리보솜 결합부의 서열을 변형시키거나, 리보솜 결합부와 효소 코딩 서열의 개시 코돈 사이의 거리나 서열을 변형시킴으로써, 효소 코딩 영역의 개시 코돈의 5' 측의 "상류" 또는 인접하게 위치한 시스트론 사이 영역을 변형시킴으로써, mRNA 전사체의 3'-말단을 헤어핀 또는 특수 서열을 이용하거나 안정화하거나, 효소의 코돈 용법을 변형시키거나, 효소의 생합성에 사용되는 희귀 코돈 tRNA의 발현을 변형시키거나, 및/또는 효소의 안정성을 예를 들어 이의 코딩 서열의 돌연변이를 통해 높이므로써, 달성할 수 있다.
숙주 세포에서 효소의 활성은, 비제한적인 예로, 숙주 세포에서 증가된 또는 감소된 가용성을 나타내는 변형된 형태의 효소를 발현하거나, 효소의 활성을 저해하는 도메인이 결핍된 변형된 형태의 효소를 발현하거나, 기질에 대한 Kcat가 높거나 낮은, 또는 Km이 낮거나 높은 변형된 형태의 효소를 발현하거나, 또는 경로에서 다른 분자에 의한 피드백 또는 피드-포워드 조절에 의해 영향을 많이 또는 적게 받는 변형된 형태의 효소를 발현하는 등의, 다수 방식으로 변형시킬 수 있다.
일부 구현예들에서, 숙주 세포를 유전자 변형하기 위해 사용되는 핵산은 형질전환된 숙주 세포의 선별과 외래 DMA를 유지하도록 숙주 세포에 선택압을 부여하는데 유용한 하나 이상의 선별 마커를 포함한다.
일부 구현예들에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커에 대한 예시적인 예로는, 비제한적으로, BLA, NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN R , 및 SH BLE 유전자 산물을 포함한다. E. coli 유래 BLA 유전자 산물은 베타-락탐 항생제 (예, 스펙트럼이 좁은 세팔로스포린, 세파마이신 및 카르바페넴 (에르타페넴), 세파만돌 및 세포페라존)과, 테모실린을 제외한 모든 항-그람-음성 박테리아 페니실린에 대해 내성을 부여하며; 스트렙토마이세스 노우르세이 (S. noursei) 유래의 NAT1 유전자 산물은 노르세오트리신 (nourseothricin)에 대해 내성을 부여하며; 스크렙토마이세스 비리도크로모게네스 (S. viridochromogenes) Tu94 유래 PAT 유전자 산물은 비알로포스 (bialophos)에 대해 내성을 부여하며; 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 유래 AUR1-C 유전자 산물은 아우에로바시딘 A (Auerobasidin A) (AbA)에 대해 내성을 부여하며; PDR4 유전자산물은 세룰레닌 (cerulenin)에 대해 내성을 부여하며; SMR1 유전자 산물은 설포메투론 메틸에 대해 내성을 부여하며; Tn9 트랜스포손 유래 CAT 유전자 산물은 클로람페니콜에 대해 내성을 부여하며; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대해 내성을 부여하며; 클렙시엘라 뉴모니아 (Klebsiella pneumonia)의 HPH 유전자 산물은 히그로마이신 B에 대해 내성을 부여하며; E. coli 유래 DSDA 유전자 산물은 단일 질소원으로서 D-세린이 첨가된 플레이트에서 세포 생육을 허용하며; Tn903 트랜스포존의 KAN R 유전자는 G418에 대해 내성을 부여하며; 스트렙토알로테이쿠스 힌더스타누스 (Streptoalloteichus hindustanus) 유래 SH BLE 유전자 산물은 제오신 (Zeocin) (블레오마이신)에 대해 내성을 부여한다. 일부 구현예들에서, 항생제 내성 마터는 본원에 기술된 유전자 변형된 숙주 세포를 분리한 후에 제거된다.
일부 구현예들에서, 선별 마커는 유전자 변형된 미생물에서 영양요구성 (예, 영양분 영양요구성)을 구제한다. 이러한 구현예에서, 부모 미생물은, 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하지만 부모 세포에게 비-기능성을 부여하였을 때 한가지 이상의 영양분의 보충없이 배지에서 생육할 수 없게 하는, 하나 이상의 유전자 산물에 대한 기능적 파괴를 포함한다. 이러한 유전자 산물로는, 비제한적으로, 효모에서의 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2 및 URA3 유전자 산물을 포함한다. 이후, 영양요구성 표현형은 파괴된 유전자 산물의 기능적 카피를 코딩하는 발현 벡터 또는 염색체 삽입 구조체를 부모 세포에 형질전환함으로써, 복구할 수 있으며, 제조되는 유전자 변형된 숙주 세포는 부모 세포의 영양 요구성 표현형의 소실을 기초로 선별할 수 있다. URA3, TRP1 및 LYS2 유전자의 선별 마커로서의 이용은 파지티브 및 네거티브 선별이 모두 가능하기 때문에 현저한 이점을 가진다. 파지티브 선별은 URA3, TRP1 및 LYS2 돌연변이의 영양요구성 보완에 의해 수행되는 반면, 네거티브 선별은 특정 저해제, 즉, 프로토트로픽 균주의 생육은 방지하지만 각각 URA3, TRP1 및 LYS2 돌연변이의 생육을 허용하는, 5-플루오로-오로트산 (FOA), 5-플루오로안트라닐산 및 아미노아디프산 (aAA)을 이용한다. 다른 구현예들에서, 선별 마커는 공지 선별 방법으로 동정할 수 있는 그외 비-치사적 결핍 또는 표현형을 복원한다.
본원은 본원의 방법, 조성물 및 유기체에 이용가능한 특정 유전자와 단백질을 기술하지만; 이러한 유전자에 대한 완전한 동정이 필수적이지 않는 것으로 이해될 것이다. 예를 들어, 폴리펩타이드 또는 효소를 코딩하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드에 변형을 가하여, 활성을 스크리닝할 수 있다. 전형적으로, 이러한 변경은 보존적인 돌연변이와 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이된 폴리뉴클레오티드 및 폴리펩타이드는 당해 기술 분야에 공지된 방법을 이용하여 기능성 효소의 발현을 스크리닝할 수 있다.
유전자 코드의 선천적인 축중 (degeneracy)으로 인해, 기능적으로 동일하거나 등가의 폴리펩타이드를 실질적으로 코딩하는 다른 폴리뉴클레오티드도 사용하여, 이러한 효소를 코딩하는 폴리뉴클레오티드를 클로닝하고 발현할 수 있다.
당해 기술 분야의 당업자에게 이해되는 바와 같이, 특정 숙주에서 이의 발현을 강화하도록 코딩 서열을 변형시키는 것이 유익할 수 있다. 유전자 코드는 가능한 코돈 64종으로 많지만, 대부분의 유기체는 전형적으로 이들 코돈의 서브세트를 이용한다. 종들에서 가장 흔히 사용되는 코돈을 최적 코돈이라고 하며, 이용하지 않는 코돈은 희귀 또는 저-가용성 코돈으로 분류된다. 코돈은 "코돈 최적화" 또는 "종에서 코돈 편향 조절"로 종종 치징되는 프로세스에서, 숙주의 선호적인 코돈 사용을 반영하여 치환할 수 있다.
특정 원핵생물 또는 진핵생물 숙주에 선호되는 코돈을 포함하는 최적화된 코딩 서열 (Murray et al., 1989, Nucl Acids Res. 17: 477-508)을, 예를 들어, 비-최적화된 서열로부터 만들어지는 전사체와 비교하여, 긴 반감기 등의 바람직한 특성을 가진 재조합 RNA 전사체를 생산하거나 또는 번역 속도를 높이도록, 준비할 수 있다. 또한, 번역 정지 코돈은 숙주 선호성을 반영하도록 변형될 수 있다. 예를 들어, 사카로마이세스 세레비지애 (S. cerevisiae)와 포유류의 전형적인 정지 코돈은 각각 UAA와 UGA이다. 단자엽 식물의 전형적인 정지 코돈은 UGA이고, 곤충과 E. coli는 통상 정지 코돈으로 UAA를 이용한다 (Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).
당해 기술 분야의 당업자는, 유전자 코드의 축중 특성으로 인해, 뉴클레오티드 서열에 차이가 있는 다양한 DNA 분자들을 사용하여 본원의 소정의 효소를 코딩할 수 있다는 것을 알 것이다. 전술한 생합성 효소를 코딩하는 천연 DNA 서열은 단지 본원의 일 구현예를 예시하기 위해 참조하며, 본원은 본원의 방법에서 사용되는 효소의 폴리펩타이드 및 단백질의 아미노산 서열을 코딩하는 임의의 서열의 DNA 분자를 포함한다. 비슷한 방식으로. 폴리펩타이드는 전형적으로 바람직한 활성의 소실 또는 유의한 소실 없이, 아미노산 서열에 하나 이상의 아미노산의 치환, 결손 및 삽입을 허용할 수 있다. 본원은, 변형된 또는 변이체 폴리펩타이드가 참조 폴리펩타이드의 효소적 이화 활성 또는 동화 활성을 가지는 한, 본원에 기술된 특정 단백질과 다른 아미노산 서열을 가진 상기한 폴리펩타이드를 포함한다. 아울런, 본원에 나타낸 DNA 서열에 의해 코딩되는 아미노산 서열은 단지 본원의 구현예들을 예시한다.
아울러, 본원에 제시된 조성물 및 방법에서 사용가능한 효소의 상동체도 본원에 포함된다. 일부 구현예들에서, 2종의 단백질 (또는 단백질의 영역)은, 아미노산 서열이 적어도 약 30%, 40%, 50% 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 가지는 경우에, 실질적으로 상동하다. 2종의 아미노산 서열 또는 2종의 핵산 서열의 동일성 %를 확인하기 위해, 서열들을 최상으로 비교할 목적으로 정렬한다 (예, 최적 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 양쪽에 갭을 도입할 수 있으며, 비-상동적인 서열은 비교를 위해 무시할 수 있음). 일 구현예에서, 비교 목적으로 정렬한 기준 서열의 길이는 기준 서열의 길이의 적어도 30%, 전형적으로 적어도 40%, 보다 전형적으로 50%, 보다 더 전형적으로 적어도 60%, 보다 더 전형적으로 적어도 70%, 80%, 90%, 100%이다. 그 후 대응되는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기와 뉴클레오티드를 비교한다. 제1 서열의 한 위치에 제2 서열의 대응되는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드가 있는 경우, 이 분자는 그 위치에서 동일하다 (본원에서, 아미노산 또는 핵산 "동일성 (identity)"은 아미노산 또는 핵산 "상동성"과 등가이다). 2개의 서열 간의 동일성 %는, 2종의 서열을 최적으로 정렬하기 위해 동입되어야 하는 갭 수와 각 갭의 길이를 고려하여, 서열들이 공유하는 동일한 위치의 갯수에 대한 함수이다.
"상동성"이 단백질 또는 펩타이드를 언급하는데 사용된다면, 동일하지 않은 잔기 위치들은 흔히 보존적인 아미노산 치환 차이가 있는 것으로 인지된다. "보존적인 아미노산 치환"은, 아미노산 잔기가 비슷한 화학적 특성 (예, 전하 또는 소수성)을 가진 측쇄 (R 기)를 가진 다른 아미노산 잔기로 치환된 것이다. 일반적으로, 보존적인 아미노산 치환은 단백질의 기능적인 특성을 실질적으로 바꾸지 않을 것이다. 2개 이상의 아미노산 서열이 보존적인 치환에 의해 서로 차이가 있을 경우, 서열의 동일성 % 또는 상동성 정도는 치환의 보존적인 특성을 보정하는 것 이상으로 조정될 수 있다. 이러한 조정을 가하는 수단은 당해 기술 분야의 당업자들에게 잘 알려져 있다 (예컨대, Pearson W. R., 1994, Methods in Mol Biol 25: 365-89).
다음과 같은 6가지 그룹들 각각은 서로에 대한 보존적인 치환인 아미노산을 포함한다: 1) 세린 (S), 트레오닌 (T); 2) 아스파르트산 (D), 글루탐산 (E); 3) 아스파라긴 (N), 글루타민 (Q); 4) 아르기닌 (R), 라이신 (K); 5) 이소루신 (I), 루신 (L), 알라닌 (A), 발린 (V), 및 6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W).
또한 서열 동일성 %로 언급되는 폴리펩타이드의 서열 상동성은, 전형적으로 서열 분석 소프트웨어를 이용하여 측정한다. 여러가지 유기체로부터 유래된 다수의 서열을 포함하는 데이타베이스에 대해 분자를 비교하는데 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST이다. 여러가지 다수 유기체로부터 유래된 서열이 포함된 데이타베이스를 검색하는 경우, 아미노산 서열을 비교하는 것이 전형적이다.
아울러, 외래 효소를 코딩하는 임의 유전자 (또는 본원에 언급된 임의의 기타 (또는 이의 발현을 통제 또는 조절하는 임의의 조절 인자)는, 당해 기술 분야의 당업자에게 공지된, 방향성 진화 또는 합리적인 돌연변이 유발 등의 유전자/단백질 조작 기법에 의해 최적화할 수 있다. 이러한 행위는 당해 기술 분야의 당업자가 효모에서 효소의 발현 및 활성을 최적화할 수 있게 한다.
아울러, 이들 효소를 코딩하는 유전자는 다른 진균 및 세균 종들에서 동정할 수 있으며, 이 경로를 조절하도록 발현시킬 수 있다. 비제한적인 예로, 사카로마이세스 세레비지애 (S. cerevisiae) 및 사카로마이세스 우바룸 (S. uvarum) 등의 사카로마이세스 (Saccharomyces) spp., 클루이베로마이세스 써모톨러란스 (K. thermotolerans), 클루이베로마이세스 락티스 (K. lactis) 및 클루이베로마이세스 막시아누스 (K. marxianus) 등의 클루이베로마이세스 (Kluyveromyces) spp, 피키아 (Pichia) spp., 한세눌라 폴리모르파 (H. polymorpha) 등의 한세눌라 (Hansenula) spp., 칸디다 (Candida) spp., 트리코스포론 (Trichosporon) spp., 야마다지마 스티피티스 (Y. spp. stipitis) 등의 야마다지마 (Yamadazyma) spp., 토룰라스포라 프레토리엔시스 (Torulaspora pretoriensis), 이사첸키아 오리엔탈리스 (Issatchenkia orientalis), 스키조사카로마이세스 폼베 (S. pombe) 등의 스키조사카로마이세스 (Schizosaccharomyces) spp., 크립토코커스 (Cryptococcus) spp., 아스퍼질러스 (Aspergillus) spp., 뉴로스포라 (Neurospora) spp., 또는 우스틸라고 (Ustilago) spp. 등의, 다양한 유기체들이 이들 효소의 소스로서 사용될 수 있다. 혐기성 진균 유래 유전자의 소스로는, 비제한적으로, 피로마이세스 (Piromyces) spp., 오르피노마이세스 (Orpinomyces) spp., 또는 네오칼리마스틱스 (Neocallimastix) spp.를 포함한다. 사용가능한 원핵생물 효소의 소스로는, 비제한적으로, 에스케리키아 콜라이 (Escherichia coli), 자이모모나스 모빌리스 (Zymomonas mobilis), 스타필로코커스 아우레우스 (Staphylococcus aureus), 바실러스 (Bacillus) spp., 클로스트리듐 (Clostridium) spp., 코리네박테리움 (Corynebacterium) spp., 슈도모나스 (Pseudomonas) spp., 락토코커스 (Lactococcus) spp., 엔테로박터 (Enterobacter) spp., 및 살모넬라 (Salmonella) spp.를 포함한다.
당해 기술 분야에 공지된 기법들은 추가적인 상동성 유전자와 상동성 효소를 동정하는데 적합할 수 있다. 일반적으로, 유전자 상동체 및/또는 효소 상동체들을 기능적 분석을 통해 동정할 수 있으며, 기능적 유사성을 가질 것이다. 당해 기술 분야의 당업자에게 공지된 기법들은 유전자 유사체와 효소 유사체를 동정하는데 적합할 수 있다. 예를 들어, ADA 유전자, 단백질 또는 효소의 상동체 또는 유사체를 동정하기 위해, 비제한적으로, ADA 유전자/효소의 공개 서열을 토대로 한 프라이머를 이용한 PCR에 의해 또는 ADA 유전자들에서 보존적인 영역을 증폭하도록 설계된 축중 프라이머를 이용한 축중 PCR에 의해 유전자를 클로닝하는 등의, 기법들을 포함할 수 있다. 아울러, 당해 기술 분야의 당업자는 기능성 상동성 또는 유사성을 가진 유전자, 단백질 또는 효소의 상동체 또는 유사체를 동정하기 위해 기법들을 이용할 수 있다. 기법으로는 (예, 본원에 기술된 바와 같이, 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970에 기술된 바와 같이) 활성에 대한 시험관내 효소 분석을 통해 효소의 촉매 활성을 세포 또는 세포 배양물에서 검사한 다음, 정제를 통해 상기 활성을 가진 효소를 분리하고, 에드만 분해, 가능성 있는 핵산 서열에 대한 PCR 프라이머 설계, PCR을 통한 상기 DNA 서열의 증폭 및 상기 핵산 서열의 클로닝 등의 기법을 통해 효소의 단백질 서열을 결정하는 것을 포함한다. 상동적이거나 유사한 유전자 및/또는 상동적이거나 유사한 효소, 유전자 유사체 및/또는 효소 또는 단백질의 유사체를 동정하기 위해, 또한, 기법은 BRENDA, KEGG 또는 MetaCYC 등의 데이타베이스를 이용하여 후보 유전자나 효소에 대한 데이타를 비교하는 것을 포함한다. 후보 유전자 또는 효소는 본원의 교시 내용에 따라 전술한 데이타베이스에서 동정할 수 있다.
5.4
이소프레노이드의 생산 방법
다른 측면에서, 본 발명은, (a) 본원에 기술된 임의의 유전자 변형된 숙주 세포 개체군을 이소프레노이드 화합물을 제조하는데 적합한 조건 하에서 탄소원이 부가된 배지에서 배양하는 단계; 및 (b) 상기 배지로부터 상기 이소프레노이드 화합물을 회수하는 단계를 포함하는, 이소프레노이드의 생산 방법을 제공한다.
일부 구현예들에서, 유전자 변형된 숙주 세포는 ADA의 이종의 발현, NADH-가용성 HMG-CoA 리덕타제의 이종의 발현, AACS의 이종의 발현, 포스포케톨라제의 이종의 발현, 포스포트랜스아세틸라제의 이종의 발현, 및 한가지 이상의 메발로네이트 경로 효소의 이종의 발현으로 이루어진 군으로부터 선택되는 하나 이상의 변형을 포함하며; 유전자 변형된 숙주 세포는 상기 하나 이상의 변형을 포함하지 않는 부모 세포 또는 유전자 변형된 숙주 세포의 상기 하나 이상의 변형의 서브세트만을 포함하지만 유전적으로 동일한 부모 세포에 비해, 증가된 양으로 이소프레노이드 화합물을 생산한다. 일부 구현예들에서, 증가량은, 예를 들어 수율, 생산, 생산성을, 세포 배양물 L 당 g, 건조 세포 중량 g 당 mg, 세포 배양물 기준 (basis) 단위 체적 당, 건조 세포 중량 기준 단위 당, 세포 배양물 단위 부피/시간 기준 또는 건조 세포 중량 단위/단위 시간 기준으로 측정시, 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 >100% 높다.
일부 구현예들에서, 숙주 세포는 발효 배지 L 당 약 10 g 이상의 증가된 수준으로 이소프레노이드를 생산한다. 일부 이러한 구현예에서, 이소프레노이드는 세포 배양물 L 당 약 10 - 약 50 g, > 약 15 g, > 약 20 g, > 약 25 g 또는 > 약 30 g으로 생산된다.
일부 구현예들에서, 숙주 세포는 건조 세포 중량 g 당 약 50 mg 이상의 증가된 수준으로 이소프레노이드를 생산한다. 일부 이러한 구현예에서, 이소프레노이드는 건조 세포 중량 g 당 약 50 - 약 1500 mg, > 약 100 mg, > 약 150 mg, > 약 200 mg, > 약 250 mg, > 약 500 mg, > 약 750 mg, 또는 > 약 1000 mg으로 생산된다.
일부 구현예들에서, 숙주 세포는, 세포 배양물 기준 단위 부피 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.
일부 구현예들에서, 숙주 세포는, 건조 세포 중량 기준 단위 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2. 5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.
일부 구현예들에서, 숙주 세포는, 세포 배양물 단위 부피/단위 시간 기준 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2. 5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.
일부 구현예들에서, 숙주 세포는, 건조 세포 중량 단위/단위 시간 기준 당, 부모 세포에서 생산되는 이소프레노이드 수준의, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배 또는 적어도 약 1,000배이거나 또는 그 보다 많은, 증가된 수준으로 이소프레노이드를 생산한다.
대부분의 구현예들에서, 숙주 세포에 의한 증가된 수준으로의 이소프레노이드 생산은 유도성 화합물에 의해 유도가능하다. 이러한 숙주 세포는 상기 유도성 화합물의 부재시에 쉽게 조작할 수 있다. 유도성 화합물을 그런 후 첨가하여 숙주 세포에서 증가된 수준으로 이소프레노이드를 생산하도록 유도한다. 다른 구현예들에서, 숙주 세포에 의한 증가된 수준으로의 이소프레노이드 생산은 예를 들어 배양 온도, 배지 조성 등의 배양 조건에 변화를 줌으로써 유도가능하다.
5.4.1
배양 배지 및 조건
미생물 배양물을 유지 및 증식시키기 위한 재료와 방법들은 미생물학 또는 발효 과학 분야의 당업자들에게 잘 알려져 있다 (예를 들어, Bailey et al., Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986). 숙주 세포의 특이적인 요구성, 발효 및 공정에 따라, 적절한 배양 배지, pH, 온도 및 호기, 미세호기 또는 혐기성 조건 등의 요건에 대해 고려가 이루어져야 한다.
본원에 제공되는 이소프레노이드 생산 방법은, 비제한적인 예로, 세포 배양 플레이트, 플라스크 또는 발효기 등의 적정 용기에서, 적정 배양 배지 (예, 판토테네이트 보충물이 첨가되거나 첨가되지 않은 배지)에서 수행될 수 있다. 또한, 본 방법은 미생물 생산의 산업적인 생산을 뒷받침하기 위해 당해 기술 분야에 공지된 임의의 발효 규모로 수행할 수 있다. 교반형 탱크 발효기, 에어리프트 발효기, 버블 발효기 또는 이들의 임의 조합 등의 임의의 적정 발효기가 사용될 수 있다. 숙주 세포로서 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)를 사용하는 특정 구현예에서, 균주는 Kosaric, et al, in Ullmann's Encyclopedia of Industrial Chemistry, Sixth Edition, Volume 12, pages 398-473, Wiley-VCH Verlag GmbH & Co. KDaA, Weinheim, Germany에 상세하게 기술된 발효기에서 배양할 수 있다.
일부 구현예들에서, 배양 배지는 이소프레노이드를 생산할 수 있는 유전자 변형된 미생물을 존속시킬 수 있는, 즉 증식과 생존을 유지시킬 수 있는, 모든 배양 배지이다. 일부 구현예들에서, 배양 배지는 동화할 수 있는 탄소원, 질소원 및 인원을 포함하는 수성 배지이다. 또한, 이러한 배지는 적정 염, 미네랄, 금속 및 기타 영양분을 포함할 수 있다. 일부 구현예들에서, 탄소원과 세포 필수 영양분들 각각은 발효 배지에 증가시키면서 또는 계속적으로 첨가하며, 각각의 필요 영양분은, 예를 들어, 탄소원을 바이오메스로 변환하는 세포의 대사 기능 또는 호흡 작용을 기초로 사전 결정된 세포 생육 곡선에 따라, 기본적으로 증식하는 세포에 의한 효율적인 동화에 필요한 최소 수준으로 유지된다.
미생물을 배양하기 위한 적정 조건과 적정 배지는 당해 기술 분야에 잘 공지되어 있다. 일부 구현예들에서, 적정 배지에는, 예를 들어, 유도제 (예, 유전자 산물을 코딩하는 하나 이상의 뉴클레오티드 서열이 유도 프로모터의 통제를 받는 경우), 억제제 (예, 유전자 산물을 코딩하는 하나 이상의 뉴클레오티드 서열이 억제 프로모터의 통제를 받는 경우), 또는 선별 물질 (예, 유전자 변형을 포함하는 미생물을 선별하기 위한 항생제) 등의 한가지 이상의 추가적인 물질이 보충된다.
일부 구현예들에서, 탄소원은 단당류 (단순 당), 이당류, 다당류, 비-발효성 탄소원 또는 이들의 하나 이상의 조합이다. 적합한 단당류에 대한 비제한적인 예로는 글루코스, 갈락토스, 만노스, 프럭토스, 리보스 및 이들의 조합을 포함한다. 적합한 이당류에 대한 비제한적인 예로는 슈크로스, 락토스, 말토스, 트레할로스, 셀로바이오스 (cellobiose) 및 이들의 조합을 포함한다. 적합한 다당류에 대한 비제한적인 예로는 스타치, 글리코겐, 셀룰로스, 키틴, 및 이들의 조합을 포함한다. 적합한 비-발효성 탄소원에 대한 비제한적인 예로는 아세테이트와 글리세롤을 포함한다.
배양 배지에서 글루코스와 같은 탄소원의 농도는 세포의 증식을 촉진시키지만, 사용되는 미생물의 증식을 억제할 만큼 높지 않아야 한다. 전형적으로, 배양은, 원하는 증식 및 바이오메스 수준을 달성하기 위한 수준이지만 미미한 수준 (검출 한계가 약 < 0.1g/l임)으로 첨가하면서 글루코스와 같은 탄소원과 함께 진행된다. 다른 구현예들에서, 글루코스와 같은 탄소원의 배양 배지에서의 농도는 > 약 1 g/L, 바람직하게는 > 약 2 g/L, 더 바람직하게는 > 약 5 g/L이다. 또한, 글루코스와 같은 탄소원의 배양 배지에서의 농도는 전형적으로 < 약 100 g/L, 바람직하게는 < 약 50 g/L, 더 바람직하게는 < 약 20 g/L이다. 배지 성분 농도에 대한 언급은 처음 및/또는 진행 중인 성분의 농도 둘다를 지칭할 수 있는 것임에 유념하여야 한다. 어떤 경우에는, 배양 중에 탄소원이 고갈되도록 배양 배지를 두는 것이 바람직할 수도 있다.
적합한 배양 배지에 사용할 수 있는 동화가능한 질소원으로는, 비제한적으로, 단순 질소원, 유기 질소원 및 복합 질소원을 포함한다. 이러한 질소원으로는 동물, 식물 및/또는 미생물 기원의 무수 암모니아, 암모늄 염 및 기질을 포함한다. 적합한 질소원으로는, 비제한적으로, 단백질 가수분해물, 미생물 바이오메스 가수분해물, 펩톤, 효모 추출물, 암모늄 설페이트, 우레아 및 아미노산을 포함한다. 전형적으로, 배양 배지내 질소원의 농도는 > 약 0.1 g/L, 바람직하게는 > 약 0.25 g/L, 더 바람직하게는 > 약 1.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 질소원을 첨가하는 것은 미생물의 배양에 유익하지 않다. 그 결과, 배양 배지내 질소원의 농도는 < 약 20 g/L, 바람직하게는 < 약 10 g/L, 더 바람직하게는 < 약 5 g/L이다. 또한, 일부 경우들에서는, 배양 중에 배양 배지에서 질소원이 고갈되게 하는 것이 바람직할 수 있다.
유효 배양 배지는 무기염, 비타민, 미량 금속 및 증식 촉진제 등의 다른 화합물도 포함할 수 있다. 또한, 이러한 다른 화합물들은 유효 배지에 탄소원, 질소원 또는 미네랄원으로서 존재하거나, 또는 배지에 특이적으로 첨가될 수 있다.
또한, 배양 배지는 적정 인원을 포함할 수 있다. 이러한 인원으로는 무기 인원과 유기 인원을 둘다 포함한다. 바람직한 인원으로는, 비제한적으로, 모노 또는 다이베이직 소듐 및 포타슘 포스페이트 등의 포스페이트 염, 암모늄 포스페이트 및 이의 혼합물을 포함한다. 전형적으로, 배양 배지에서 인 농도는 > 약 1.0 g/L, 바람직하게는 > 약 2.0 g/L, 더 바람직하게는 > 약 5.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 인을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 인 농도는 전형적으로 < 약 20 g/L, 바람직하게는 < 약 15 g/L, 더 바람직하게는 < 약 10 g/L이다.
또한, 배양 배지는 적정 마그네슘 소스를, 비슷한 양의 마그네슘에 기여하는 농도로 다른 마그네슘 소스들도 사용될 수 있지만, 바람직하게는 마그네슘 설페이트 헵타하이드레이트 등의 생리적으로 허용가능한 염 형태로, 포함할 수 있다. 전형적으로, 배양 배지에서 마그네슘의 농도는 > 약 0.5 g/L, 바람직하게는 > 약 1.0 g/L, 더 바람직하게는 > 약 2.0 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 마그네슘을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 마그네슘의 농도는 전형적으로 < 약 10 g/L, 바람직하게는 < 약 5 g/L, 더 바람직하게는 < 약 3 g/L이다. 또한, 어떤 경우에는, 배양 중에 배양 배지에서 마그네슘 소스를 고갈되게 하는 것이 바람직할 수 있다.
일부 구현예들에서, 배양 배지는 트리소듐 사이트레이트의 이수화물 (dihydrate) 등의 생물학적으로 허용가능한 킬레이트를 또한 포함할 수 있다. 이 경우, 배양 배지내 킬레이트의 농도는 > 약 0.2 g/L, 바람직하게는 > 약 0.5 g/L, 더 바람직하게는 > 약 1 g/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 킬레이트제를 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지내 킬레이트제의 농도는 전형적으로 < 약 10 g/L, 바람직하게는 < 약 5 g/L, 더 바람직하게는 < 약 2 g/L이다.
또한, 배양 배지는 배양 배지의 바람직한 pH를 유지하기 위해 생물학적으로 허용가능한 산 또는 염기를 처음에 포함할 수 있다. 생물학적으로 허용가능한 산으로는, 비제한적으로, 염산, 황산, 질산, 인산 및 이의 혼합물을 포함한다. 생물학적으로 허용가능한 염기로는, 비제한적으로, 암모늄 하이드록사이드, 소듐 하이드록사이드, 포타슘 하이드록사이드 및 이의 혼합물을 포함한다. 일부 구현예들에서, 사용되는 염기는 암모늄 하이드록사이드이다.
또한, 배양 배지는, 비제한적인 예로, 칼슘 클로라이드 등의 생물학적으로 허용가능한 칼슘염을 포함할 수 있다. 전형적으로, 칼슘 클로라이드, 이수화물 등의 칼슘원의 배양 배지에 농도는 약 5 mg/L - 약 2000 mg/L, 바람직하게는 약 20 mg/L - 약 1000 mg/L, 더 바람직하게는 약 50 mg/L - 약 500 mg/L의 범위이다.
또한, 배양 배지는 소듐 클로라이드를 포함한다. 전형적으로, 배양 배지에서 소듐 클로라이드의 농도는 약 0.1 g/L - 약 5 g/L, 바람직하게는 약 1 g/L - 약 4 g/L, 더 바람직하게는 약 2 g/L - 약 4 g/L의 범위이다.
일부 구현예들에서, 배양 배지는 또한 미량 금속을 포함할 수 있다. 이러한 미량 금속은, 편의상, 배양 배지의 나머지 부분과 별도로 준비할 수 있는, 스톡 용액으로서 배양 배지에 첨가할 수 있다. 전형적으로, 배양 배지에 첨가되는 이러한 미량 금속 용액의 양은 > 약 1 ml/L, 바람직하게는 > 약 5 mL/L, 더 바람직하게는 > 약 10 mL/L이다. 그러나, 특정 농도를 초과하여, 배양 배지에 미량 금속을 첨가하는 것은 미생물의 배양에 유익하지 않다. 즉, 배양 배지에 첨가되는 미량 금속 용액은 전형적으로 < 약 100 mL/L, 바람직하게는 < 약 50 mL/L, 더 바람직하게는 < 약 30 mL/L이다. 아울러, 스톡 용액에 미량 금속을 첨가하기 위해, 개개 성분들을, 미량 금속 용액의 상기 범위로 표시된 성분들의 양에 독립적으로 해당되는 범위로 각각 개별적으로 첨가할 수 있다는 것에 유념하여야 한다.
배양 배지는 판토테네이트, 바이오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl 및 티아민-HCl 등의 다른 비타민을 포함할 수 있다. 이 비타민을, 편의상, 배양 배지의 나머지 부분과 별도로 준비할 수 있는, 스톡 용액으로서 배양 배지에 첨가할 수 있다. 그러나, 특정 농도를 초과하여, 배양 배지에 비타민을 첨가하는 것은 미생물의 배양에 유익하지 않다.
본원에 기술된 발효 방법은, 비제한적으로, 배치식, 피드-배치식, 세포 리사이클, 연속 및 반-연속식을 포함하는, 통상적인 배양 방식으로 수행할 수 있다. 일부 구현예들에서, 발효는 피드-배치 모드로 수행한다. 이러한 예에서, 배지 성분들의 일부는 배양 중에, 예컨대 판토테네이트는 발효의 생산 단계 중에 고갈된다. 일부 구현예들에서, 증식 및/또는 이소프레노이드 생산이 첨가가 필요한 시점 이전에 일정 기간 동안 유지되도록, 배양물에, 예를 들어, 생산 단계의 시작시에 상기한 성분을 상대적으로 고 농도로 첨가할 수 있다. 이들 성분들의 바람직한 범위는 수준이 배양에 의해 고갈됨에 따라 첨가함으로써 배양 중에 유지시킨다. 배양 배지내 성분들의 수준은, 예를 들어, 배양 배지를 주기적으로 샘플링하여 농도를 분석함으로써, 모니터링할 수 있다. 다른 예로, 표준 배양 공정이 전개되면, 배양 중 특정 시점에 공지된 수준에 해당되는 시간 조절된 간격으로 첨가를 행할 수 있다. 당해 기술 분야의 당업자에게 공지되는 바와 같이, 배지의 세포 밀도가 증가됨에 따라 배양 중에 영양분의 소비 속도는 빨라진다. 아울러, 외래 미생물이 배양 배지에 도입되는 것을 방지하기 위해, 당해 기술 분야에 공지된 바와 같이, 무균 첨가 방법을 이용하여 첨가한다. 아울러, 소포제 (anti-foaming agent)도 소량 배양 중에 첨가할 수 있다.
배양 배지의 온도는 유전자 변형된 세포의 배양 및/또는 이소프레노이드의 생산에 적합한 모든 온도일 수 있다. 예를 들어, 배양 배지에 접종물을 접종하기 전에, 배양 배지를 약 20℃ - 약 45℃, 바람직하게는 약 25℃ - 약 40℃, 더 바람직하게는 약 28℃ - 약 32℃의 범위내 온도로 만들어 유지할 수 있다.
배양 배지의 pH는 배양 배지에 산 또는 염기를 첨가함으로써 조절할 수 있다. pH를 조절하기 위해 암모니아를 사용하는 경우, 배양 배지에 질소원으로서 이것이 편리하게 사용된다. 바람직하게는, pH는 약 3.0 - 약 8.0, 더 바람직하게는 약 3.5 - 약 7.0, 가장 바람직하게는 약 4.0 - 약 6.5로 유지된다.
일부 구현예들에서, 배양 배지의 글루코스 농도 등의 탄소원 농도는 배양 중에 모니터링한다. 배양 배지의 글루코스 농도는, 예를 들어, 상층액, 예컨대 배양 배지의 무세포성 성분에서 글루코스 농도를 모니터링하는데 사용할 수 있는, 글루코스 옥시다제 효소 테스트 또는 고압 액체 크로마토그래피를 이용하는 등의, 공지 기법을 이용하여 모니터링할 수 있다. 이전에 언급된 바와 같이, 탄소원의 농도는 세포 배양 저해가 이루어지는 수준 보다 낮게 유지되어야 한다. 이 농도는 유기체에 따라 달라질 수 있지만, 탄소원으로서 글루코스의 경우, 세포 배양 저해는, > 약 60 g/L의 글루코스 농도에서 이루어지며, 실험을 통해 쉽게 측정할 수 있다. 즉, 탄소원으로서 글루코스를 사용하는 경우, 글루코스가 바람직하게는 발효기에 공급되며 검출 한계 이하로 유지된다. 다른 예로, 배양 배지내 글루코스 농도는 약 1 g/L - 약 100 g/L, 더 바람직하게는 약 2 g/L - 약 50 g/L, 더 더 바람직하게는 약 5 g/L - 약 20 g/L의 범위로 유지된다. 탄소원의 농도는 예를 들어 실질적으로 순수한 글루코스 용액을 첨가함으로써 바람직한 수준으로 유지시킬 수 있지만, 오리지날 배양 배지의 분액을 첨가함으로써 배양 배지의 탄소원 농도를 유지하는 것이 허용되며, 바람직할 수 있다. 오리지날 배양 배지의 분액 사용은, 배지내 다른 영양분의 농도 (예, 질소원 및 인원)를 동시에 유지시킬 수 있기 때문에, 바람직할 수 있다. 이와 같이, 미량 금속 농도도 미량 금속 용액의 분액을 첨가함으로써 배양 배지에서 유지시킬 수 있다.
5.4.2
이소프레노이드 회수
숙주 세포에서 이소프레노이드가 생산되면, 이는 당해 기술 분야에 공지된 방법으로 임의의 적정 분리 및 정제를 이용하여 후속적인 사용을 위해 회수 또는 분리할 수 있다. 일부 구현예들에서, 원심분리에 의해 발효물로부터 이소프레노이드를 포함하는 유기상을 분리한다. 다른 구현예들에서, 이소프레노이드를 포함하는 유기상을 발효물로부터 자연적으로 분리한다. 다른 구현예들에서, 이소프레노이드를 포함하는 유기상은 발효 반응물에 탈유화제 (deemulsifier) 및/또는 핵제 (nucleating agent)를 첨가함으로써, 발효물로부터 분리한다. 탈유화제에 대한 예시적인 예로는 응결제 및 응집제를 포함한다. 핵제에 대한 예시적인 예로는 이소프레노이드 자체와 도데칸, 이소프로필 미리스트레이트 및 메틸 올리에이트 등의 유기 용매로 구성된 액적을 포함한다.
이들 세포에서 생산되는 이소프레노이드는 배양 상층물에 존재하거나 및/또는 숙주 세포와 조합하여 존재할 수 있다. 이소프레노이드가 숙주 세포와 조합하여 존재하는 구현예에서, 이소프레노이드의 회수는 세포를 투과화하거나 세포 용혈시키는 방법을 포함한다. 다른 예로, 또는 동시에, 배양 배지내 이소프레노이드는, 비제한적인 예로, 크로마토그래피, 추출, 용매 추출, 막 분리, 전기투석, 역 삼투, 증류, 화학 유도체화 및 결정화 등의, 회수 공정을 이용하여 회수할 수 있다.
일부 구현예들에서, 이소프레노이드는 유기 상에 존재할 수 있는 다른 산물들로부터 분리한다. 일부 구현예들에서, 분리는 흡착, 증류, 가스-액체 추출 (스트립핑), 액체-액체 추출 (용매 추출), 한외여과 및 표준 크로마토그래피 기법을 이용하여 달성한다.
6.
실시예
6.1
실시예 1:
NADH-특이적인 HMG-CoA 리덕타제의 동정 및 특정화
본 실시예는 NADH 조인자 특이성을 가지는 것으로 이전에 공지되지 않은 HMG-CoA 리덕타제의 동정과 특정화에 대해 기술한다.
6.1.1
재료 및 방법
6.1.1.1 균주 조작
야생형 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주 (CEN.PK2, Mat a, ura3 - , TRP1+, leu2 - , MAL2-8C, SUC2)를 메발로네이트 (MevT) 경로를 발현하기 위한 숙주 세포로 사용하였다 (이로써, 아세틸-CoA 티올라제 (ERG10)는 아세틸-CoA를 아세토아세틸-CoA로 변환함; HMG-CoA 신타제 (ERG13)는 아세토아세틸-CoA를 HMG-CoA로 변환함; HMG-CoA 리덕타제는 HMG-CoA를 메발로네이트로 변환함 (도 1)).
본 균주를, 스타필로코커스 아우레우스 (Staphylococcus aureus) (ZP_06815052), 헤르페토시폰 아우란티아쿠스 (Herpetosiphon aurantiacus) (YP_001546303), 슈도모나스 메발로니 (Pseudomonas mevalonii) (P13702), 델프티아 액시도보란스 (Delftia acidovorans) (YP_001561318), 멘타노세이타 써모필라 (Menthanosaeta thermofila) (YP_843364) 또는 살리시박터 포메오이리 (Silicibacter pomeoyri) (YP_164994)로부터 유래된 이종의 클래스 II HMG-CoA 리덕타제; 또는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) HMG-CoA 리덕타제 (tHMG-CoA 리덕타제) (EEU05004)의 N-말단이 절단된 버전 중 어느 하나를 코딩하는 플라스미드로 형질전환하였다. 클래스 II HMG-CoA 리덕타제는 효모에서의 발현을 위해 코돈 최적화되었으며, C-말단 FLAG-HIS 테그를 가미하여 화학적으로 합성하였으며, 단 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제는 다음과 같은 부가적인 변형을 가미하여 합성하였다.
NotI 사이트 - GAL1 프로모터 - NdeI 사이트 - [슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제] - EcoRI 사이트 - FLAG 테그 - HIS 테그 - 정지 코돈 - PGK1 종결인자 - NotI 사이트
이 DNA를 pBluescript SK+ 벡터 (Stratagene)의 NotI 사이트에 클로닝하였다. 야생형 CENPK2 균주의 게놈 DNA 추출물을 주형으로 이용하고, 올리고뉴클레오티드인 YT_164_30_Gal7F (5' 말단에 SacI과 NotI 제한 효소 부위가 포함됨)와 YT_164_30_Gal7R (3'-말단에 NdeI 제한 효소 부위가 포함됨)를 이용하여, 효모 Gal7 프로모터를 PCR로 증폭하였다 (표 2). PCR 산물을 pCR II-TOPO 벡터 (Invitrogen)에 클로닝하였다. 양 플라스미드를 SacI과 NotI으로 자르고, 절단된 Sc.GAL7 프로모터를 이용하여 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제 유전자의 상류 Gal1 프로모터와 치환하였다. 제조되는 플라스미드와 pAM70 (서열번호 23), 즉 URA3 마커를 가진 효모 에피좀 벡터 pRS426 둘다를 NotI으로 절단하였다. 그런 후, pAM70의 NotI 절단부에 NotI 단편을 연결함으로써, 플라스미드 pAM01147 (서열번호 24)을 구축하였다. 이 플라스미드는, 플라스미드를 NdeI과 EcoRI으로 자른 후, 5'-말단과 3'-말단에 각각 NdeI 및 EcoRI 사이트를 가지는 절단한 대상 HMG-CoA 리덕타제 코딩 서열과 연결함으로써, 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제 코딩 서열을 임의의 대상 HMG-CoA 리덕타제 코딩 서열 (효모 tHMG-CoA 리덕타제가 포함됨)로 치환하기 위한 베이스 플라스미드로 사용하였다. 플라스미드 DNA 증폭은 에스케리키아 콜라이 (Escherichia coli) 균주 DH5알파에서 수행하였다. 그 후, 균주 Y1389에 여러가지 HMG-CoA 리덕타제의 코딩 서열을 보유한 플라스미드를 형질전환하고, 형질전환체를 2% 글루코스가 포함된 우라실 무첨가 CSM 배지 플레이트에서 선별하였다. 사카로마이세스 세레비지애 (S. cerevisiae)로의 모든 DNA 매개 형질전환은, Gietz RW and Woods RA, Guide to Yeast Genetics and Molecular and Cell Biology, Part B. San Diego, CA: Academic Press Inc. pp. 87-96 (2002)에 기술된 바와 같은, 표준 리튬 아세테이트 공정을 이용하여 수행하였다.
Sc. 아세토아세틸-CoA 티올라제 (ERG10) 및 Sc.HMG-CoA 신타제 (ERG13)의 게놈내 삽입은, 하기 나타낸 삽입 구조체 (서열번호 25)를 이용하여 숙주 균주의 Gal80 유전자 좌를 타겟팅하였다.
삽입 구조체의 각 성분을 주형으로 Y002 게놈 DNA 100 ng을 이용하여 PCR 증폭하였다. -1000에서 -1 위치의 상류 GAL80 유전자 좌의 PCR 증폭을 올리고뉴클레오티드 YT_164_36_001 및 YT_164_36_003 (표 2)을 이용하여 수행하였다. 효모 ERG10 및 ERG13 유전자의 PCR 증폭은, ERG13의 경우 올리고뉴클레오티드들 YT_164_36_002 및 YT_164_36_005와, ERG10의 경우 YT_164_36_006 및 YT_164_36_009 쌍을 이용하여 수행하였다. 올리고뉴클레오티드들 YT_164_36_004 및 YT_164_36_007을 사용하여 GAL1/10 프로모터를 증폭하였으며, 프라이머 YT_164_36_008 및 YT_164_36_011은 이를 이용하여 LEU2 유전자를 증폭하였다. (정지 코돈 이후의) 23에서 1000에 위치한 하류 GAL80 유전자 좌는 올리고뉴클레오티드들 YT_164_36_010 및 YT_164_36_012를 이용하여 PCR 증폭하였다. 각 DNA 조각 100 fmol을 하나의 시험관에 넣고, 프라이머 YT_164_36_001과 YT_164_36_012를 이용한 스티칭 PCR 반응에 의해 조립하였다. 예상된 분자량을 가지는 PCR 산물들을 겔에서 정제하였다.
표 2. 균주 조작에 사용된 프라이머들
프라이머 명 | 서열번호 | 프라이머 서열 |
YT_164_36_001 | 서열번호 26 | GCCTGTCTACAGGATAAAGACGGG |
YT_164_36_002 | 서열번호 27 | TCCCGTTCTTTCCACTCCCGTCTATATATATATCATTGTTATTA |
YT_164_36_003 | 서열번호 28 | TAATAACAATGATATATATATAGACGGGAGTGGAAAGAACGGGA |
YT_164_36_004 | 서열번호 29 | CCAACAAAGTTTAGTTGAGAGTTTCATTTATATTGAATTTTCAAAAATTCTTAC |
YT_164_36_005 | 서열번호 30 | GTAAGAATTTTTGAAAATTCAATATAAATGAAACTCTCAACTAAACTTTGTTGG |
YT_164_36_006 | 서열번호 31 | GTCAAGGAGAAAAAACTATAATGTCTCAGAACGTTTACATTGTATCGACTGCCAGAACCC |
YT_164_36_007 | 서열번호 32 | GGGTTCTGGCAGTCGATACAATGTAAACGTTCTGAGACATTATAGTTTTTTCTCCTTGAC |
YT_164_36_008 | 서열번호 33 | GTGTGCCTTTTGACTTACTTTTACGTTGAGCCATTAGTATCA |
YT_164_36_009 | 서열번호 34 | TGATACTAATGGCTCAACGTAAAAGTAAGTCAAAAGGCACAC |
YT_164_36_010 | 서열번호 35 | GATATTTCTTGAATCAGGCGCCTTAGACCCCCCAGTGCAGCGAACGTTATAAAAAC |
YT_164_36_011 | 서열번호 36 | GTTTTTATAACGTTCGCTGCACTGGGGGGTCTAAGGCGCCTGATTCAAGAAATATC |
YT_164_36_012 | 서열번호 37 | AAATATGACCCCCAATATGAGAAATTAAGGC |
YT_164_30_Gal3F | 서열번호 38 | GAGCTCGCGGCCGC GTACATACCTCTCTCCGTATCCTCGTAATCATTTTCTTGT |
YT_164_30_Gal3R | 서열번호 39 | CATATGACTATGTGT TGCCCTACCTTTTTACTTTTATTTTCTCTTT |
YT_164_30_Gal7F | 서열번호 40 | GAGCTCGCGGCCGC GTGTCACAGCGAATTTCCTCACATGTAGGGACCGAATTGT |
YT_164_30_Gal7R | 서열번호 41 | CATATGTTTTGAGGGAATATTCAACTGTTTTTTTTTATCATGTTGA |
RYSE 0 | 서열번호 42 | GACGGCACGGCCACGCGTTTAAACCGCC |
RYSE 19 | 서열번호 43 | CCCGCCAGGCGCTGGGGTTTAAACACC |
(전술한) 여러가지 HMG-CoA 리덕타제로 형질전환된 Y1389 유도체에, 아래 표 3에 열거된 균주를 구축하기 위해, ERG 10/ERG13 삽입 구조체를 형질전환하였다. 형질전환체들을 우라실과 루신이 무첨가된 2% 글루코스를 함유하는 CSM 배지 플레이트에서 선별하였다. 모든 유전자 파괴 및 치환은 표현형 분석과 콜러니 PCR로 검증하였다.
표 3: 균주 설명
균주 # | 설명 | adh1 낫 아웃한 이후의 균주 # |
Y1431 | 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) tHMG-CoA 리덕타제를 구비한 MevT | Y1804 |
Y1432 | 스타필로코커스 아우레우스 (S. aureus) HMG-CoA 리덕타제를 구비한 MevT | |
Y1433 | 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제를 구비한 MevT | Y1805 |
Y1435 | 델프티아 액시도보란스 (D. acidovorans) HMG-CoA 리덕타제를 구비한 MevT | Y1806 |
Y1436 | 멘타노세이타 써모필라 (M. thermofila) HMG-CoA 리덕타제를 구비한 MevT | |
Y1486 | 헤르페토시폰 아우란티아쿠스 (H. aurantiacus) HMG-CoA 리덕타제를 구비한 MevT | |
Y1487 | 실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 구비한 MevT | Y1807 |
균주 Y1431, Y1433, Y1435 및 Y1487의 경우, ADH1 유전자는 하기 나타낸 파괴 구조체를 이용하여 낫아웃하였다 (서열번호 44):
파괴 구조체는 미국 특허 8,221,982에 기술된 폴리뉴클레오티드 조립 방법에 의해 제작하였다. 삽입 구조체의 ADH1 5' 상동성 영역은 ADH1 코딩 서열의 -563에서 -77 위치와 상동적이며, ADH1 3' 상동성 영역은 (ADH1 유전자의 정지 코돈 하류) 87에서 538 위치와 상동적이다. 프라이머 RYSE 0 및 RYSE 19를 사용하여 산물을 증폭시켰다. 균주 Y1431, Y1433, Y1435 및 Y1487 (표 2)은 산물로 형질전환하였고, 형질전환체를 2% 글루코스 및 G418 (제네티신 (Geneticin))이 첨가된 YPD 배지 플레이트에서 선별하였다. ADH1 유전자의 파괴는 표현형 분석과 콜로니 PCR로 검증하였다.
6.1.1.2 세포 배양
해당 효모 균주의 콜로니 하나를 2% 슈크로스가 첨가된 효모 질소 베이스 (YNB) 3 ml에서 밤새 스타터 배양으로서 배양하였다. 다음날, 250 ml 일회용 PETG 멸균 플라스크 (Nalgene)에서 40 ml YNB-4% 슈크로스 생산용 배양 배지에서 배양한 스타터 배양물을 최초 OD600 0.05로 희석하여, 생산용 플라스크를 준비하였다. 이 플라스크는 아래 나타낸 기간 동안 250 RPM으로 교반하면서 30℃에서 인큐베이션하였다.
6.1.1.3 세포 무함유성 추출물을 이용한 HMG-CoA 리덕타제의 활성 분석
효모 세포를 HMG-CoA 리덕타제 활성 분석 (도 8)을 위해 48시간, 또는 메발로네이트 분석 (표 4)을 위해 72시간 배양하고, 15 mL 팔콘 시험관에서 팔콘 시험관용의 적절한 캐리지가 장착된 스윙 버켓 로터 JS-5.3를 이용하여 10분간 4000 x g로 원심분리하여 회수하였다. 세포 펠렛을 1 ml에 재현탁하고, 차가운 세포용혈 완충액 (100 mM Tris pH 7.0 + Mini, EDTA 프리 프로테아제 저해제 정제 (Roche) 추가됨, 1 mM DTT 및 1 mM EDTA)으로 1번 헹구었다. 그런 후, 세포를 O 고리 캡이 장착된 2 mL 플라스틱 스크류 캡의 마이크로퓨즈 시험관 (Fisher Brand 520-GRD)으로 옮기고, 파괴 비드 (Disruption beads, 0.5Mm, Fisher)와 비드 비터를 6 M/S으로 1분간 사용하여, 세포를 용혈시켰다. 이 시험관을 즉시 빙수조에 적어도 5분간 두었다. 시헌관을 20분간 최소 8000 x g로 원심분리하였다. 상층액을 새로운 차가운 시험관으로 옮겼다. 단백질에 대한 고전적인 브래드포드 분석을 이용하여 단백질 농도를 측정하였다 (Bradford MM A rapid and sensitive method for quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal. Biochem 72, 248-254 (1976)).
HMG-CoA 리덕타제 분석을 위해, 반응 완충액 (100 mM 포스페이트 완충제 pH 7.0, 100 mM KCl, 1 mM DTT + 1 mM EDTA)을 먼저 30℃에서 96웰 플레이트에서 예비-인큐베이션하였다. 최종 농도 150 μM으로 NADH 또는 NADPH, 최종 농도 400 μM으로 HMG-CoA 및 최종 농도 5 mM으로 DTT를 각 웰에 최종 부피 190 ㎕로 첨가하였다. 분석은, 먼저, 직선형 활성 범위로 희석한 세포 무함유 추출물을 10 ㎕ 첨가함으로써 개시하였다. 반응물은 Molecular Devices Spectramax M5 플레이트 리더를 이용하여 340 nm에서 NADPH 또는 NADH 흡광도 감소를 측정함으로써, 모니터링하였다. 340 nm에서의 단백질 농도에 따른 흡광 곡선의 기울기를 이용하여 각 세포-무함유 추출물에서의 HMGr 비활성을 계산하였다.
6.1.1.4 유기 산 및 알코올 측정
유기 산 및 알코올 분석용 샘플은, 발효 배지 1 ml을 취한 후, 이를 1.5 ml 에펜도르프 관에 넣어 준비하였다. 샘플을 테이블 에펜도르프 원심분리기를 이용하여 13,000 RPM으로 1분간 회전시켰다. 그런 후, 상층액을 15 mM 황산에 희석 (1:1 v/v)하였다. 혼합물을 볼텍싱하고, 13,000 RPM으로 1분간 원심분리하였다. 투명해진 상층액을 HPLC 분석을 위해 바이얼로 옮겼다.
HPLC 분석은, HPLC Thermofisher를 이용하고, Column Waters IC-Pak 7.8 mm x 300 mm, 7 mm, 50 Å(Waters)과 굴절지수 (RI) 검출 (Thermofisher)을 이용한 크기 배제 크로마토그래피에 의해, 글리세롤 및 메발로네이트 함량에 대해 수행하였다. 용출은 유속 0.6 mL/min의 15mM 황산 수용액을 이동상으로 이용하여 등전점에 의해 수행하였다.
6.1.2
결과
6.1.2.1 클래스 II HMG-CoA 리덕제의 조인자 특이성 결정
도 8에 나타낸 바와 같이, 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi) 유래의 HMG-CoA 리덕타제는 NADH에 대해 높은 특이성과 시험관내 높은 비활성을 나타낸다. 이들 HMG-CoA 리덕타제는 NADPH의 존재 하에서는 비활성을 실제 나타내지 않았지만, NADH의 존재 하에서는 비활성이 400 nmol/mg/min에 달하였다. 마찬가지로, 슈도모나스 메발로니 (P. mevalonii) 유래 HMG-CoA 리덕타제는 조인자로서 NADH에 대해 선택성을 나타내었으며, 이는 이전에 공개된 보고서와 일치한다. 예로, Hedl et al., J. Bacteriol 186(7):1927-1932 (2004)를 참조한다. 반면에, 사카로마이세스 세레비지아 (S. cerevisiae), 스타필로코커스 아우레우스 (S. aureus) 및 헤르페토시폰 아우란티아쿠스 (H. aurantiacus) 유래의 HMG-CoA 리덕타제들은 NADH의 존재 시에 측정가능한 활성을 나타내지 않았으며, 멘타노세이타 써모필라 (M. thermofila)의 HMG-CoA 리덕타제는 NADPH 및 NADH가 둘다 존재하는 조건에서 겨우 검출가능한 수준의 활성을 나타내었다. 이러한 결과들은, 슈도모나스 메발로니 (P. mevalonii) 유래의 HMG-CoA 리덕타제와 마찬가지로, 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi)로부터 유래된 HMG-CoA 리덕타제들이 NADH-선택적인 HMG-CoA 리덕타제이라는 것을 의미한다.
아울러, 표 4는, NADH-가용성 HMG-CoA 리덕타제 (슈도모나스 메발로니 (P. mevalonii), 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이 (S. pomeroyi)로부터 각각 유래됨)를 포함하는 MevT 경로를 가진 균주가, NADPH-가용성 HMG-CoA 리덕타제 (사카로마이세스 세레비지아 (S. cerevisiae), 스타필로코커스 아우레우스 (S. aureus) 및 헤르페토시폰 아우란티아쿠스 (H. aurantiacus)로부터 각각 유래됨)를 포함하는 MevT 경로를 가진 균주에 비해 메발로네이트를 실질적으로 적게 생산함을 보여주다. 이는, 생체내에서, NADH-가용성 HMG-CoA 리덕타제가 메발로네이트와 하류 이소프레노이드 생산 쪽으로 진행하게 하는 촉매적인 역량을 모두 활용하기 위해서는, NADH의 추가적인 소스가 필요하다는 것을 시사한다.
표 4. NADPH-가용성 HMG-CoA 리덕타제 대 NADH-가용성 HMG-CoA 리덕타제로부터 메발로네이트의 생산
HMG-CoA 리덕타제의 소스 | 메발로네이트 생산 (g/L) | 조인자 특이성 |
사카로마이세스 세레비지아 (S. cerevisiae) | 1.11 | NADPH |
스타필로코커스 아우레우스 (S. aureus) | 1.74 | NADPH |
헤르페토시폰 아우란티아쿠스 (H. aurantiacus) | 1.84 | NADPH |
슈도모나스 메발로니 (P. mevalonii) | 0.41 | NADH |
델프티아 액시도보란스 (D. acidovorans) | 0.42 | NADH |
실리시박터 포메로이 (S. pomeroyi) | 0.57 | NADH |
6.1.2.2 세포내 NADH 증가는 NADH-가용성 HMG-CoA 리덕타제의 활성을 향상시킨다.
도 9-11에 나타낸 바와 같이, 메발로네이트 생산은, 대사적 교란이 도입되었을 때, NADH의 세포내 농도를 증가시키는, NADH-가용성 HMG-CoA 리덕타제를 포함하는 MevT 경로를 구비한 세포에서, 실질적으로 향상된다. ADH1은 NADH-의존적인 방식으로 아세트알데하이드를 에탄올로 환원한다. adh1Δ 백그라운드에서, 숙주 세포는 증식 감소 (도 9)와 글리세롤 생산 증가 (도 10)를 겪으며, 이는 세포내 NADH의 축적을 초래할 수 있는 레독스 불균형을 의미한다. 그러나, NADPH-가용성 HMG-CoA 리덕타제 (사카로마이세스 세레비지애 (S. cerevisiae)(Sc.) tHMG-CoA 리덕타제)를 포함하는 MevT 경로를 구비한 세포가 adh1Δ 백그라운드에서 메발로네이트 생산 감소를 나타내는 반면, NADH-가용성 HMG-CoA 리덕타제 (슈도모나스 메발로니 (P. mevalonii), 델프티아 액시도보란스 (D. acidovorans) 및 실리시박터 포메로이(S. pomeroyi) 각각으로부터 유래된)를 포함하는 MevT 경로를 구비한 세포는, 레독스 스트레스 신호도 나타냄에도 불구하고, 메발로네이트 생산에 실질적인 향상을 나타낸다 (도 11). 이들 데이타는, NADH-가용성 HMG-CoA 리덕타제가 증가된 세포내 NADH 풀을 활용하여 메발로네이트 생산을 부스팅할 수 있다는 것을, 시사해준다. 또한, 이들 결과는, 세포내 NADH 풀 증가가 이루어지지 않은 경우, NADH-가용성 HMG-CoA 리덕타제가 조인자에 의해 제한됨을 시사한다.
특히, 이전의 공개된 보고서에서는, 슈도모나스 메발로니 (P. mevalonii)의 HMG-CoA 리덕타제가 메발로네이트 분해에 활용되는 것으로 개시된 바 있다. Anderson et al.,J. Bacteriol., (171(12):6468-6472 (1989)를 참조한다. 슈도모나스 메발로니 (P. mevalonii)는 유일한 탄소원으로서 메발로네이트에 대해 유효할 수 있는 것으로 동정된 소수의 원핵생물이다. 그러나, 본원에 제시된 결과는 메발로네이트의 생합성 경로에 사용하기 위한 슈도모나스 메발로니 (P. mevalonii) HMG-CoA 리덕타제의 예측하지 못한 유용성을 보여준다.
6.2
실시예 2:
아세틸-CoA에 대한 대안 경로 및 대안적인 MEV 경로 효소를 이용한 이소프레노이드 생산 및 레독스 밸런싱 개선
본 실시예는, MEV 경로부터 메발로네이트 및 하류 이소프레노이드 생산을, 세포질 아세틸-CoA 생산하는 대안적인 경로를 이용함으로써, 예컨대 야생형 PDH-바이패스 대신, 아세트알데하이드 데하이드로게나제, 아세틸화 (ADA, E.C. 1.2.1.10)의 이종 발현을 통해, 및 대안적인 MEV 경로 효소들과의 다양한 조합으로, 개선시킬 수 있음을 보여준다. 이들 결과는, NADPH-생산하는 PDH-바이패스 효소를 NADH-생산하는 ADA로 치환함으로써 도입되는 레독스 불균형은, ADA 발현을, MEV 경로의 NADH-가용성 HMG-CoA 리덕타제 및/또는 포스포케톨라제 및 포스포트랜스아세틸라제의 이종의 발현과 조합함으로써, 일부 완화시킬 수 있으며, 이는 또한, 세포질 아세틸-CoA를 생산하는 추가적인 대안 경로를 제공할 수 있음을 보여준다. 이들 결과는, 또한, MEV 경로에 아세틸-CoA 기질을 제공하는 ADA의 촉매적 능력이, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제에 의해 제공되는 것과 같은, 아세틸-CoA의 아세토아세틸-CoA로의 열역학적으로 우호적인 하류 변환을 제공함으로써, 실질적으로 향상된다는 것을, 추가적으로 입증해준다.
6.2.1
재료 및 방법
6.2.1.1
균주 조작
표 5에 열거된 균주들을 구축하여, (1) ADA를 NADH-가용성 HMG-CoA 리덕타제 대 NADPH-가용성 HMG-CoA 리덕타제와 쌍을 이루었을 때, 세포 증식과 이종적인 이소프레노이드의 생산에 대한 효과; (2) ADA의 발현에 의해 형성되는 레독스 불균형에 대한 포스포케톨라제 및 포스포트랜스아세틸라제의 발현이 미치는 효과; 및 (3) ADA를 발현하는 균주들에서 메발로네이트 수준에 대한 아세토아세틸-CoA 신타제의 발현이 미치는 효과를 확인하였다.
표 5.
균주 명 | 설명 |
Y968 | 야생형 CEN.PK2 |
Y12869 | acs1^acs2^ald6^; 2x Dz.eutE |
Y12746 | acs1^acs2^ald6^; 2x Dz.eutE; 3x Lm.PK; 1x Ck.PTA |
Y12869.ms63908 | 구조체 ms63908을 구비한 Y12869 |
Y12869.ms63909 | 구조체 ms63909를 구비한Y12869 |
Y968.ms63908 | 구조체 ms63908을 구비한 Y968 |
Y968.ms63909 | 구조체 ms63909를 구비한 Y968 |
Y12869.ms63907.ms64472 | 구조체 ms64472를 구비한 Y12869.ms63907 |
Y12869.ms63909.ms64472 | 구조체 ms64472를 구비한 Y12869.ms63909 |
Y968.ms63907.ms64472 | 구조체 ms64472를 구비한 Y968.ms63907 |
Y968.ms63909.ms64472 | 구조체 ms64472를 구비한 Y968.ms63909 |
6.2.1.1.1 Y968
Y968은 야생형 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) CEN.PK2, Matalpha이다. Y12869, Y12746 및 이의 파생 유도체 전체에 대한 출발 균주는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주 (CEN.PK2, Mat alpha, ura3-52, trp1-289, leu2-3,122, his3^1), Y003이다. Gietz RW and Woods RA, Guide to Yeast Genetics and Molecular and Cell Biology. Part B. San Diego, CA: Academic Press Inc. pp. 87-96 (2002)에 기술된 바와 같은 표준 리튬 아세테이트 공정을 이용하여, 사카로마이세스 세레비지애 (S. cerevisiae)에 대해 임의의 DNA-매개 형질전환을 수행하였으며, 모든 경우들에서, 구조체의 삽입은 게놈 DNA를 PCR 증폭시켜 검증하였다.
6.2.1.1.2 Y12869
Y003에 3번의 연속적인 삽입을 통해 Y12869를 구축하였다. 먼저, ACS2 유전자 좌의 상류와 하류 뉴클레오티드 서열로 구성된 서열이 측면에 위치한, 천연 사카로마이세스 세레비지애 (S. cerevisiae)LEU2 유전자로 구성된, 삽입 구조체 (i2235; 서열번호 45)를 도입함으로써, 유전자 ACS2를 제거하였다. 사카로마이세스 세레비지애 (S. cerevisiae) 숙주 세포로 도입되면, 이 구조체는 게놈의 ACS2 유전자 좌로 상동적인 재조합에 의해 삽입되어, ACS2 코딩 서열이 이의 삽입 서열로 치환됨으로써, ACS2가 기능적으로 파괴된다. 형질전환체를 유일한 탄소원으로서 2% EtOH가 포함된 CSM-leu 플레이트에 도말하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y4940이었다.
다음으로, ALD6를 제거하고, 딕케야 지아 (Dickeya zeae) eutE를 Y4940에 하기 도시된 삽입 구조체 (i74804; 서열번호 46)를 이용하여 도입하였다.
이 삽입 구조체는 선별 마커 (TRP1)와 딕케야 지아 (Dickeya zeae) 유래 유전자 eutE (NCBI 참조 서열: YP_003003316.1)를 코딩하는 2 카피의 효모-코돈-최적화된 서열을, TDH3 프로모터 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TDH3 코딩 영역의 상류 840 bp)와 TEF2 종결인자 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TEF2 코딩 영역의 하류 508 bp)의 통제 하에 포함한다. 이들 컴포넌트들은 측면에 ALD6 유전자 좌의 상류 및 하류 뉴클레오티드들이 위치한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ALD6 코딩 서열이 이의 삽입 서열로 치환됨으로써, ALD64가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 구조체를 Y4940에 형질전환하고, 형질전환체를 2% 글루코스가 첨가된 CSM-TRP 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 12602이었다.
다음으로, 자신의 프로모터와 종결인자의 통제 하에 위치한 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HIS3 유전자와 이의 측면에 위치한 ACS1의 상류 및 하류 뉴클레오티드 서열로 구성된 삽입 구조체 (i76220; 서열번호 47)를 도입함으로써, Y12602에서 ACS1을 제거하였다. 형질전환체를 단독 탄소원으로서 2% 글루코스가 첨가된 CSM-his 플레이트에 도말하고, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12747이었다.
다음으로, Y12747에 천연 URA3 서열에서 증폭시킨 PCR 산물을 형질전환하였다. 이 서열은 ura3-52 돌연변이를 복원시킨다. Rose and Winston, Mol Gen Genet 193:557-560 (1984)을 참조한다. 형질전환체를 단독 탄소원으로서 2% 글루코스가 첨가된 CSM-ura 플레이트에 도말하고, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12869이었다.
6.2.1.1.3 Y12746
Y4940에 3번의 연속적인 삽입을 통해 Y12746을 구축하였다. 먼저, Y4940에 아래에 도시된 삽입 구조체 (i73830; 서열번호 48)를 형질전환하였다.
이 삽입 구조체는, 선별 마커 (URA3); TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 TDH3 종결인자 (TDH3 코딩 서열의 하류 259 bp)의 통제 하에 위치한, 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides) (NCBI 참조 서열 YP_819405.1) 유래 효모-코돈 최적화된 포스포케톨라제 버전; TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 PGK1 종결인자 (PGK1 코딩 서열의 하류 259 bp)의 통제 하에 위치한, 효모 코돈-최적화된 버전의, 클로스트리듐 클루이베리 (Clostridium kluyveri) 포스포트랜스아세틸라제 (NCBI 참조 서열: YP_001394780.1); 측면에 위치한, 사카로마이세스 세레비지애 (S. cerevisiae) BUD9 유전자 좌의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열을 포함한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, BUD9 코딩 서열이 이의 삽입 서열로 치환됨으로써, BUD9은 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체는 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하였다.
제조되는 균주에, 하기 도시된 삽입 구조체 (i74810; 서열번호 49)를 형질전환하였다.
이 구조체는 선별 마커 (TRP1); TDH3 프로모터 (TDH3 코딩 서열의 상류 870 bp) 및 TDH3 종결인자 (TDH3 코딩 서열의 하류 259 bp)의 통제 하에 위치한 2 카피의 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides) 유래 포스포케톨라제; 이들의 양 측면에 위치한, ALD6 유전자 좌의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열을 포함한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ALD6 코딩 서열이 이의 삽입 서열로 치환됨으로써, ALD6가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.
마지막으로, 제조되는 균주에 하기 도시된 구조체 (i76221; 서열번호 50)를 형질전환하였다.
이 구조체는, 선별 마커 (HIS3); 및 TDH3 프로모터 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TDH3 코딩 영역의 상류 840 bp) 및 TEF2 종결인자 (천연적인 사카로마이세스 세레비지애 (S. cerevisiae) TEF2 코딩 영역의 하류 508 bp)의 통제 하에 위치한, 딕케야 지아 (Dic-keya zeae) 유래 유전자 eutE를 코딩하는 효모-코돈-최적화된 서열 (NCBI 참조 서열: YP_003003316.1) 2 카피를 포함한다. 이들 컴포넌트들은 측면에 ACS1 유전자 좌의 상류 및 하류 뉴클레오티드들이 위치한다. 숙주 세포로 도입되면, 이 구조체는 숙주 세포의 게놈으로 상동적인 재조합에 의해 삽입되어, ACS1 코딩 서열이 이의 삽입 서열로 치환됨으로써, ACS1이 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-HIS 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다. 제조되는 균주는 Y12746이었다.
6.2.1.1.4 ms63907, ms63908, ms63909 및 ms64472 삽입 구조체
ms63907 삽입 구조체 (i84022; 서열번호 51)를 아래에 나타낸다.
이 구조체는, 선택 마커(URA3); 자신의 프로모터 하에 위치한 천연적인 효모 GAL4 전사 인자 1 카피; 메발로네이트 경로의 천연 효모 효소 2종 (아세토아세틸-CoA 티올라제를 코딩하는 ERG10, HMG-CoA 신타제를 코딩하는 ERG13), 및 실리시박터 포메로이 (Silicibacter pomeroyi)) HMG-CoA 리덕타제의 효모 코돈-최적화된 버전 2 카피, 모두 갈락토스 유도성 프로모터 (사카로마이세스 세레비지애 (S. cerevisiae) 유전자 GAL1 및 GAL10의 프로모터) 하에 위치됨, 뿐만 아니라, 측면에 위치한, 사카로마이세스 세레비지애 (S. cerevisiae) HO 엔도뉴클레아제 유전자 좌의 상류 및 하류 뉴클레오티드로 구성된 상동적인 서열을 코딩하는, 뉴클레오티드 서열을 포함한다. 숙주 세포로 도입되면, ms63907 구조체는 숙주 세포의 게놈으로 상동적인 삽입에 의해 삽입되어, HO 코딩 서열이 이의 삽입 서열로 치환됨으로써, HO가 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.
ms63908 삽입 구조체 (i84024; 서열번호 52)는, 2가지만 제외하고는, ms63907과 동일하다: 첫째, ERG10이, AHP1 종결인자 (사카로마이세스 세레비지애 (S. cerevisiae)의 AHP1 코딩 서열의 하류 125 bp)가 융합된, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제 (accession no. AB540131.1)를 코딩하는, 스트렙토마이세스 sp.의 nphT7 유전자의 효모 코돈-최적화된 버전으로 치환되며; 두번째로, 실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 코딩하는 서열이 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HMG-CoA 리덕타제를 코딩하는 절단된 HMG1 코딩 서열인, tHMGr로 치환됨.
ms63909 삽입 구조체 (i84026; 서열번호 53)는, 한가지만 제외하고는, ms63907과 동일하다: 실리시박터 포메로이(S. pomeroyi) HMG-CoA 리덕타제를 코딩하는 서열이 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) HMG-CoA 리덕타제를 코딩하는 절단된 HMG1 코딩 서열인, tHMGr로 치환됨.
ms64472 삽입 구조체 (i85207; 서열번호 54)를 하기에 도시한다.
이 구조체는, 선별 마커 (URA3); 에르고스테롤 경로의 5종의 천연 효모 효소들 (메발로네이트 키나제를 코딩하는 ERG12, 포스포메발로네이트 키나제를 코딩하는 ERG8, 메발로네이트 피로포스페이트 데카르복실라제를 코딩하는 ERG19, 다이메틸알릴 다이포스페이트 이소머라제를 코딩하는 IDI1, 및 파르네실 피로포스페이트 신테타제를 코딩하는 ERG20), 뿐만 아니라, 진화된, 효모 코돈-최적화된 버전의 아르테미시아 아누아 (Artemisia annua) 파르네센 신타제, 이들 모두 갈락토스-유도성 프로모터의 통제 하에 위치함 (사카로마이세스 세레비지애 (S. cerevisiae) 유전자 GAL1, GAL10 및 GAL7의 프로모터들)를 코딩하는 뉴클레오티드 서열을 포함한다. 이들 서열들에는, GAL80의 상류 및 하류 뉴클레오티드 서열로 구성된 상동적인 서열들이 측면에 위치한다. 숙주 세포로 도입되면, ms64472 구조체는 숙주 세포의 게놈으로 상동적인 삽입에 의해 삽입되어, GAL80 코딩 서열이 이의 삽입 서열로 치환됨으로써, GAL80이 기능적으로 파괴된다. 이 구조체는 미국 특허 8,221,982에 기술된 방법을 이용하여 조립하였다. 형질전환체를 2% 글루코스가 첨가된 CSM-URA 플레이트에서 선별하여, PCR 증폭에 의해 검증하였다.
6.2.1.2
메발로네이트의 정량화
콜로니 하나를 96웰 플레이트의 웰에 50 mM 숙시네이트 pH 5.0 및 20 g/L 슈크로스가 첨가된 시드 배지 (15 g/L 암모늄 설페이트, 8 g/L 포타슘 포스페이트, 6.1 g/L 마그네슘 설페이트, 150 mg/L EDTA, 57.5 mg/L 아연 설페이트, 4.8 mg/L 코발트 클로라이드, 3.24 mg/L 망간 클로라이드, 5 mg/L 구리 설페이트, 29.4 mg/L 칼슘 클로라이드, 27.8 mg/L 철 설페이트, 4.8 mg/L 소듐 몰리브데이트, 0.6 mg/L 바이오틴, 12 mg/L 칼슘 판토테네이트, 12 mg/L 니코틴산, 30 mg/L 이노시톨, 12 mg/L 티아민 하이드로클로라이드, 12 mg/L 피리독신 하이드로클로라이드, 0.24 mg/L 파라-아미노벤조산)에 접종하여, 3일간 30℃에서 배양하였다. 그런 후, 배양물 14.4 ㎕를 50 mM 숙시네이트 pH 5.0 및 40 g/L 갈락토스가 첨가된 시드 배지에서 서브배양하고, 2일간 30℃에서 배양하였다.
분비되는 메발로네이트를 정량하기 위해, 전 세포 배지를 먼저 5분간 14,000 RPM으로 스핀 다운하였다. 그런 후, 투명하게 된 배지 10 ㎕에, 분석 완충제 (1 mM CoA, 2 mM NAD, 정제 및 동결건조한 슈도모나스 메발로니 (Pseudomonas mevalonii) HMG-CoA 리덕타제, 0.2 mg/ml, 정제 및 동결건조한 슈도모나스 메발로니 (Pseudomonas mevalonii) HMG-CoA 리아제, 0.1 mg/ml, 95 mM TrisCl pH8.5, 20 mM MgCl2 및 5 mM DTT) 190 ㎕와 함께 인큐베이션하였다. 30℃에서 30분간 샘플에서 인큐베이션한 다음, Beckman M5 플레이트 리더에서 340 nm에서 흡광도를 분석하였다. 메발로네이트 농도는, 정제한 메발로네이트로 작성한 표준 그래프에 플로팅함으로써 정량하였다.
6.2.1.3
파르네센 정량
배양물을 전술한 바와 같이 먼저 배양하였다. 파르네센을 정량하기 위해, 2-부톡시에탄올 600 ㎕를, 각 200 ㎕ 씩 3번, 전 세포 배지 150 ㎕에, 각 첨가 사이에 96웰 플레이트 교반기에서 1000 rpm으로 90초간 교반하면서, 첨가하였다. 그런 후, 샘플을 40분간 인큐베이션하였다. 2-부톡시에탄올 추출물 8 ㎕를 이소프로필 알코올 200 ㎕와 96웰 UV 플레이트 (Costar 3635)에서 혼합한 다음 흡광도 222을 플레이트 리더에서 판독하였다.
6.2.1.4
광학 밀도 정량
96웰 분석 플레이트에서, 배양물 8 ㎕를 희석제 (20% PEG 200, 20% 에탄올, 2% Triton X-114)와 혼합하여, 실온에서 30분간 인큐베이션하였다. 이 분석 플레이트를 볼텍싱한 후, Beckman M5 플레이트 리더에서 OD600을 측정하였다.
6.2.1.5
배치 발효
콜로니 하나를 50 mM 숙시네이트 pH 5.0 및 20 g/L 슈크로스가 첨가된 시드 배지 5 ml에서 배양하여, Y967, Y12869 및 Y12746의 접종 배양물을 배양하였다. 배양 3일 후, 사전배양물을 50 mM 숙시네이트 pH 5.0 및 40 g/L 슈크로스가 첨가된 시드 배지 25 ml에서 첫 광학 밀도 (OD) 0.1로 서브배양하였다. 10시간 후, 배양물을 다시, 50 mM 숙시네이트 pH 5.0 및 40 g/L 슈크로스가 첨가된 시드 배지 50 ml에 OD 0.05로 서브배양하였다. 배양물을 30℃에서 배양하였다. OD가 약 3이 되면, 3개의 플라스크를 절반으로 나누고, 스핀 다운한 후, 배지를 버렸다. 배양물을 40 g/L 글루코스 (숙시네이트 무첨가)가 첨가된 시드 배지 1.5 L에 재현탁하고, 발효기로 옮겼다. 발효 실험은 2 L Biostat B plus vessel (Sartorius, Germany)에서 수행하였다. 교반을 1200 rpm으로 조절하고, 발효기에 공기를 0.5 L/min으로 계속 주입하였다. 14.4 M NH4OH로 pH를 5.0으로 유지하였고, 온도를 30℃로 유지하였다. 거의 1.5시간 마다 샘플을 취하여 OD, 건조 세포 중량, 유기 산 및 당을 측정하였다.
6.2.2
결과
6.2.2.1
ADA 균주는 NADPH-가용성 HMGr 보다는 NADH-가용성 HMGr와 쌍을 이루었을 때 이소프레노이드를 더 많이 생산한다.
도 12A는, PDH-바이패스 (acs1Δ acs2 Δ ald6Δ)의 결손 및 이종적으로 발현되는 ADA (Dz.eutE)를 포함하는, 균주 Y12869가, NADPH-가용성 HMGr을 포함하는 MEV 경로 (구조체 ms63909) 보다는 NADH-가용성 HMGr을 포함하는 MEV 경로 (구조체 ms63907)를 발현할 때, 파르네센을 더 많이 생산함을 보여준다. 반면에, 도 12B는, 무손상 PDH-바이패스를 포함하는 균주 Y968은 NADPH-가용성 HMGr와 쌍을 이루었을 때 파르네센을 더 많이 생산함을 보여준다. 이들 결과는, MEV 경로로부터 이소프레노이드를 생산하기 위한 ADA의 활용은, MEV 경로가 NADH-가용성 HMGr을 포함할 때 개선됨을 보여준다.
6.2.2.2
ADA의 발현은 레독스 불균형을 야기하지만, PK와 PTA가 당분해와 흐름을 공유할 때 완화된다
천연 효모는 당분해를 통해 소모되는 글루코스 1개 당 NADH 2개를 생산한다. 에탄올로 발효하였을 때, NADH 2개가 NAD+로 다시 산화된다. 그러나, 글루코스 분획은 에탄올로 발효되기 보다는 바이오메스로 변환되어, 과량의 NADH가 만들어진다. 이 과량의 NADH는, 다이하이드록시아세톤 포스페이트의 글리세롤 3-포스페이트로의 환원을 통해, NAD+로 다시 산화되며, 글리세롤 3-포스페이트는 글리세롤로 가수분해된다. 천연적인 PDH-바이패스 대신 아실화 아세트알데하이드 데하이드로게나제를 이용하는 균주는, NADPH 대신, NADH를 생산하므로, 추가의 과잉의 NADH가 생성된다. 바이오메스로 변환되는 각 글루코스의 경우, 천연적인 PDH-바이패스 대신 ADA를 이용하는 균주는 실제 NADH를 2배 많이 생산하는데, 이는 과량의 NADH를 다시 산화하기 위해서는 2배 정도로 많은 글리세롤을 생산하여야 한다는 것을 의미한다. 도 13A에 나타낸 바와 같이, Y12869 (야생형 PDH-바이패스 대신 ADA를 이용하는 균주)는 (무손상 PDH-바이패스를 포함하는) Y968의 2배 많은 글리세롤을 생산하지만, 배치 글루코스 발효에서 글루코스를 유사한 수준으로 소비한다. 이러한 결과들은, Y12869에서 ADA 반응의 화학량론으로 예측되는 바와 같이 레독스 불균형이 발생됨을 입증해준다.
ADA 균주에 포스포케톨라제 및 포스포트랜스아세틸라제를 부가하면, 글루코스로부터 AcCoA를 합성하는 대안적인 비-당분해성 경로가 제공되어, 당분해를 통한 NADH 생산이 감소되고 레독스 균형이 향상된다. 도 13B에 나타낸 바와 같이, Y12745 (ADA 외에도, 포스포케톨라제 및 포스포트랜스아세틸라제를 보유한 균주)는 Y12869의 절반으로 글리세롤을 생산하지만, 배치 글루코스 발효시 글루코스는 비슷한 수준으로 소비한다.
6.2.2.3
ADA 균주에서 ATP 절약은 열역학적인 구동력을 희생하게 되지만 아세틸-CoA에 대한 강력한 견인력에 의해 완화된다.
아세틸-CoA를 형성하기 위한 천연적인 PDH-바이패스 반응은, ATP의 AMP로의 가수분해와 커플링되기 때문에, 열역학적으로 우호적이다. 반면 아실화 아세트알데하이드 데하이드로게나제 반응은 ATP와 커플링되어 있지 않으며, 아세틸-CoA 합성에 있어 천연적인 PDH-바이패스 반응 보다 훨씬 평형에 가깝다. 메발로네이트를 생산하기 위해 천연적인 사카로마이세스 세레비지애 (S. cerevisiae) 경로 유전자를 이용하는 경우, ADA를 이용하는 균주는, ADA 및 Ald6의 시험관내에서의 비슷한 카이네틱 특성에도 불구하고, 야생형 PDH-바이패스를 이용하는 균주 보다 메발로네이트를 훨씬 적게 생산한다. 도 14 (첫번째 및 2번째 컬럼)에 나타낸 바와 같이, 시험관내에서 측정한 충분한 카이네틱 역량에도 불구하고, ADA 균주 (Y12869.ms63909)에서의 메발로네이트 생산은 야생형의 등가 균주 (Y968.ms63909)의 ~30%에 불과하다. 이 결과는, ADA에 의한 아세트알데하이드의 아세틸-CoA로의 변환을 뒷받침하는 열역학적인 구동력의 결핍을 반영한다.
Erg10 아세틸-CoA 티올라제는, 열역학적으로 비우호적인 반응인 아세틸-CoA 2개로부터 아세토아세틸-CoA를 형성하는 반응을 촉매한다. nphT7에 코딩된 아세토아세틸-CoA 신타제 (즉, 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제)는, 말로닐-CoA의 데카르복시화로 인해 열역학적으로 우호적인 반응인, 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 합성하는 과정을 촉매한다. AcCoA 생산의 바로 하류에 이러한 열역학적으로 우호적인 반응을 투입하면, ADA의 정방향 활성을 증가시키는 열역학적인 구동력이 부여된다. 도 14 (3번째 및 4번째 컬럼)에 나타낸 바와 같이, nphT7을 ERG10 대신 과다 발현하면, Y968.ms63908와 Y12869.ms63908은 메발로네이트를 비슷한 수준으로 만들어낸다. 아울러, 이들 균주는 MEV 경로의 첫번째 단계에서 ERG10을 이용하는 등가의 균주 (Y968.ms63909 및 Y12869.63909) 보다 메발로네이트를 실질적으로 더 많이 생산한다.
본 명세서에 인용된 모든 간행물, 특허 및 특허 출원은, 각 개별 간행물 또는 특허 출원이 구체적이고 개별적으로 원용에 의해 본 명세서에 포함되는 바와 같이, 원용에 의해 본 명세서에 포함된다. 전술한 본 발명은 예시적인 방식으로, 명확한 이해를 위한 예로 기술되어 있지만, 당해 기술 분야의 당업자라면 본 발명의 교시 내용에 비추어, 첨부된 청구항의 사상 및 범위로부터 이탈되지 않으면서 특정한 변형과 수정을 가할 수 있음을 쉽게 알 것이다.
SEQUENCE LISTING
<110> AMYRIS, INC.
GARDNER, Timothy Stevens
HAWKINS, Kristy Michelle
MEADOWS, Adam Leon
TSONG, Annie Ening
TSEGAYE, Yoseph
<120> PRODUCTION OF ACETYL-COENZYME A DERIVED ISOPRENOIDS
<130> 107345.00374
<150> US 61/557,893
<151> 2011-11-09
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 1380
<212> DNA
<213> Dickeya zeae
<220>
<221> misc_feature
<222> (1)..(1380)
<223> Dickeya zeae eutE gene sequence
<400> 1
atggagcatt cagttatcga accgacagtg cccatgccgc tgccagccat gtttgacgcg 60
ccatctggaa tcttttctag cctggacgat gcagtccagg cggcaaccct ggcacaacaa 120
cagttgtcgt ctgtggagtt acgccagcaa gttattaaag caattagagt tgcaggcgaa 180
cgctatgcac aggttctggc ggaaatggcg gtggctgaaa caggtatggg tcgggtagtg 240
gataaataca ttaaaaatgt ttcacaggct cgccatacac ccggcattga atgtctgagc 300
gcggaagttc tgacaggcga caatggcctg acactgattg aaaatgcccc ttggggagtg 360
gtggcttccg tgacgccaag cacgaaccca gccgccacag tcatcaataa tgcaatttcc 420
atgattgcgg cagggaattc agtcgttttt gcaccgcacc catccgccaa aaatgtgtcc 480
ttacgcacaa tatcgcttct taacaaagca attgtggcga caggtgggcc agaaaatctg 540
ctggtatccg tcgcaaatcc caacatcgaa acagctcaac gcctgttccg ttatccaggt 600
attggattac tcgtcgtaac aggtggtgag gcggtggtgg aagcggcgcg caaacacact 660
gataaacgtt taattgccgc aggcgccgga aaccccccag tagtcgttga cgaaacagcg 720
gatataccga aagccgctcg cgcaatagta aagggcgctt cgtttgacaa caatattatt 780
tgtgccgacg agaaagtatt aatcgtggtt gatcgcgtag ccgacgcctt attagccgaa 840
atgcaacgca acaatgctgt tttactgacg cctgaacaga cagaacgact tctgcccgct 900
ttgctgagcg atatagatga gcaggggaag ggacgcgtga accgcgatta tgtggggagg 960
gatgccgcta aactagcggc ggccattggt ttagaagtgt cagaacacac aagattatta 1020
cttgctgaaa cagatgctga tcatcctttt gcagtaaccg aattaatgat gcccgtattg 1080
cctgttatcc gtgtaaaaaa cgttgatgac gccattgccc tcgctgtaaa acttgagagt 1140
ggttgtcgtc acactgcagc aatgcattcg acaaacatta ggaacctgaa tcggatggca 1200
aatgctataa atacatcaat ttttgttaaa aatggtccgt gtatcgctgg gctgggcctg 1260
ggtggcgagg gctggacgtc gatgactata tctacaccca caggggaagg agttacctca 1320
gcacgcacct tcgtacgttt acgtagatgt gtattggttg acatgttcag aatcgcgtaa 1380
<210> 2
<211> 459
<212> PRT
<213> Dickeya zeae
<220>
<221> misc_feature
<222> (1)..(459)
<223> Dickeya zeae eutE protein sequence
<400> 2
Met Glu His Ser Val Ile Glu Pro Thr Val Pro Met Pro Leu Pro Ala
1 5 10 15
Met Phe Asp Ala Pro Ser Gly Ile Phe Ser Ser Leu Asp Asp Ala Val
20 25 30
Gln Ala Ala Thr Leu Ala Gln Gln Gln Leu Ser Ser Val Glu Leu Arg
35 40 45
Gln Gln Val Ile Lys Ala Ile Arg Val Ala Gly Glu Arg Tyr Ala Gln
50 55 60
Val Leu Ala Glu Met Ala Val Ala Glu Thr Gly Met Gly Arg Val Val
65 70 75 80
Asp Lys Tyr Ile Lys Asn Val Ser Gln Ala Arg His Thr Pro Gly Ile
85 90 95
Glu Cys Leu Ser Ala Glu Val Leu Thr Gly Asp Asn Gly Leu Thr Leu
100 105 110
Ile Glu Asn Ala Pro Trp Gly Val Val Ala Ser Val Thr Pro Ser Thr
115 120 125
Asn Pro Ala Ala Thr Val Ile Asn Asn Ala Ile Ser Met Ile Ala Ala
130 135 140
Gly Asn Ser Val Val Phe Ala Pro His Pro Ser Ala Lys Asn Val Ser
145 150 155 160
Leu Arg Thr Ile Ser Leu Leu Asn Lys Ala Ile Val Ala Thr Gly Gly
165 170 175
Pro Glu Asn Leu Leu Val Ser Val Ala Asn Pro Asn Ile Glu Thr Ala
180 185 190
Gln Arg Leu Phe Arg Tyr Pro Gly Ile Gly Leu Leu Val Val Thr Gly
195 200 205
Gly Glu Ala Val Val Glu Ala Ala Arg Lys His Thr Asp Lys Arg Leu
210 215 220
Ile Ala Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
225 230 235 240
Asp Ile Pro Lys Ala Ala Arg Ala Ile Val Lys Gly Ala Ser Phe Asp
245 250 255
Asn Asn Ile Ile Cys Ala Asp Glu Lys Val Leu Ile Val Val Asp Arg
260 265 270
Val Ala Asp Ala Leu Leu Ala Glu Met Gln Arg Asn Asn Ala Val Leu
275 280 285
Leu Thr Pro Glu Gln Thr Glu Arg Leu Leu Pro Ala Leu Leu Ser Asp
290 295 300
Ile Asp Glu Gln Gly Lys Gly Arg Val Asn Arg Asp Tyr Val Gly Arg
305 310 315 320
Asp Ala Ala Lys Leu Ala Ala Ala Ile Gly Leu Glu Val Ser Glu His
325 330 335
Thr Arg Leu Leu Leu Ala Glu Thr Asp Ala Asp His Pro Phe Ala Val
340 345 350
Thr Glu Leu Met Met Pro Val Leu Pro Val Ile Arg Val Lys Asn Val
355 360 365
Asp Asp Ala Ile Ala Leu Ala Val Lys Leu Glu Ser Gly Cys Arg His
370 375 380
Thr Ala Ala Met His Ser Thr Asn Ile Arg Asn Leu Asn Arg Met Ala
385 390 395 400
Asn Ala Ile Asn Thr Ser Ile Phe Val Lys Asn Gly Pro Cys Ile Ala
405 410 415
Gly Leu Gly Leu Gly Gly Glu Gly Trp Thr Ser Met Thr Ile Ser Thr
420 425 430
Pro Thr Gly Glu Gly Val Thr Ser Ala Arg Thr Phe Val Arg Leu Arg
435 440 445
Arg Cys Val Leu Val Asp Met Phe Arg Ile Ala
450 455
<210> 3
<211> 2728
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(2728)
<223> Saccharomyces cerevisiae ACS1 nucleotide sequence
<400> 3
acctcccgcg acctccaaaa tcgaactacc ttcacaatgt cgccctctgc cgtacaatca 60
tcaaaactag aagaacagtc aagtgaaatt gacaagttga aagcaaaaat gtcccagtct 120
gcctccactg cgcagcagaa gaaggaacat gagtatgaac atttgacctc ggtcaagatc 180
gtgccacaac ggcccatctc agatagactg cagcccgcaa ttgctaccca ctattctcca 240
cacttggacg ggttgcagga ctatcagcgc ttgcacaagg agtctattga agaccctgct 300
aagttcttcg gttctaaagc tacccaattt ttaaactggt ctaagccatt cgataaggtg 360
ttcatcccag actctaaaac gggtaggccc tccttccaga acaatgcatg gttcctcaac 420
ggccaattaa acgcctgtta caactgtgtt gacagacatg ccttgaagac ccctaacaag 480
aaagccatta ttttcgaagg tgacgagcct ggccaaggct attccattac ctacaaggaa 540
ctacttgaag aagtttgtca agtggcacaa gtgctgactt actctatggg cgttcgcaag 600
ggcgatactg ttgccgtgta catgcctatg gtcccagaag caatcataac cttgttggcc 660
atttcccgta tcggcgccat tcactccgta gtctttgccg ggttttcttc caactccttg 720
agagatcgta tcaacgatgg ggactctaaa gttgtcatca ctacagatga atccaacaga 780
ggtggtaaag tcattgagac taaaagaatt gttgatgacg cgctaagaga gaccccaggc 840
gtgagacacg tcttggttta tagaaagacc aacaatccat ctgttgcttt ccatgccccc 900
agagatttag attgggcaac agaaaagaag aaatacaaga cctactatcc atgcacaccc 960
gttgattctg aggatccatt attcttgttg tatacgtctg gttctactgg tgcccccaag 1020
ggtgttcaac attctaccgc aggttacttg ctgggagctt tgttgaccat gcgctacact 1080
tttgacactc accaagaaga cgttttcttc acagctggag acattggctg gattacaggc 1140
cacacttatg tggtttatgg tcccttacta tatggttgtg ccactttggt ctttgaaggg 1200
actcctgcgt acccaaatta ctcccgttat tgggatatta ttgatgaaca caaagtcacc 1260
caattttatg ttgccccaac tgctttgcgt ttgttgaaaa gagctggtga ttcctacatc 1320
gaaaatcatt ccttaaaatc tttgcgttgc ttgggttcgg tcggtgaacc aattgctgct 1380
gaagtttggg agtggtactc tgaaaaaata ggtaaaaatg aaatccccat tgtagacacc 1440
tactggcaaa cagaatctgg ttcgcatctg gtcaccccgc tggctggtgg tgtcacacca 1500
atgaaaccgg gttctgcctc attccccttc ttcggtattg atgcagttgt tcttgaccct 1560
aacactggtg aagaacttaa taccagccac gcagagggtg tccttgccgt caaagctgca 1620
tggccatcat ttgcaagaac tatttggaaa aatcatgata ggtatctaga cacttatttg 1680
aacccttacc ctggctacta tttcactggt gatggtgctg caaaggataa ggatggttat 1740
atctggattt tgggtcgtgt agacgatgtg gtgaacgtct ctggtcaccg tctgtctacc 1800
gctgaaattg aggctgctat tatcgaagat ccaattgtgg ccgagtgtgc tgttgtcgga 1860
ttcaacgatg acttgactgg tcaagcagtt gctgcatttg tggtgttgaa aaacaaatct 1920
aattggtcca ccgcaacaga tgatgaatta caagatatca agaagcattt ggtctttact 1980
gttagaaaag acatcgggcc atttgccgca ccaaaattga tcattttagt ggatgacttg 2040
cccaagacaa gatctggcaa aattatgaga cgtattttaa gaaaaatcct agcaggagaa 2100
agtgaccaac taggcgacgt ttctacattg tcaaaccctg gcattgttag acatctaatt 2160
gattcggtca agttgtaatg atgatttctt tcctttttat attgacgact tttttttttt 2220
cgtgtgtttt tgttctctta taaccgagct gcttacttat tattatttca ccttctcttt 2280
ttatttatac ttataattat ttattcttta catactgtta caagaaactc ttttctacat 2340
taattgcata aagtgtcaat cagcacatcc tctatatcgc tatcaacaac aaatttgaca 2400
aacctgccta tatcttcagg aacaactgcc gcatcgctac caccactact tgtgaagtcc 2460
ctggagttta atatgcactg aaatttacct agccgtttta cacaagacca taatccatcc 2520
atgctatcgc agtatatgat tttgtgttcg tttttcgtct tgcgaaaggc atcctcaatg 2580
gcttgtttca ttgatccatc agtgtggctc gtaggtacca gcaaaaccac ttcatcagcg 2640
gcgtactcct cccactttat gggcagtcct tgtatcgact tgctcattat aatacatttg 2700
ctctatcccc gcgtgcttgg ccggccgt 2728
<210> 4
<211> 713
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(713)
<223> Saccharomyces cerevisiae ACS1 protein sequence
<400> 4
Met Ser Pro Ser Ala Val Gln Ser Ser Lys Leu Glu Glu Gln Ser Ser
1 5 10 15
Glu Ile Asp Lys Leu Lys Ala Lys Met Ser Gln Ser Ala Ser Thr Ala
20 25 30
Gln Gln Lys Lys Glu His Glu Tyr Glu His Leu Thr Ser Val Lys Ile
35 40 45
Val Pro Gln Arg Pro Ile Ser Asp Arg Leu Gln Pro Ala Ile Ala Thr
50 55 60
His Tyr Ser Pro His Leu Asp Gly Leu Gln Asp Tyr Gln Arg Leu His
65 70 75 80
Lys Glu Ser Ile Glu Asp Pro Ala Lys Phe Phe Gly Ser Lys Ala Thr
85 90 95
Gln Phe Leu Asn Trp Ser Lys Pro Phe Asp Lys Val Phe Ile Pro Asp
100 105 110
Ser Lys Thr Gly Arg Pro Ser Phe Gln Asn Asn Ala Trp Phe Leu Asn
115 120 125
Gly Gln Leu Asn Ala Cys Tyr Asn Cys Val Asp Arg His Ala Leu Lys
130 135 140
Thr Pro Asn Lys Lys Ala Ile Ile Phe Glu Gly Asp Glu Pro Gly Gln
145 150 155 160
Gly Tyr Ser Ile Thr Tyr Lys Glu Leu Leu Glu Glu Val Cys Gln Val
165 170 175
Ala Gln Val Leu Thr Tyr Ser Met Gly Val Arg Lys Gly Asp Thr Val
180 185 190
Ala Val Tyr Met Pro Met Val Pro Glu Ala Ile Ile Thr Leu Leu Ala
195 200 205
Ile Ser Arg Ile Gly Ala Ile His Ser Val Val Phe Ala Gly Phe Ser
210 215 220
Ser Asn Ser Leu Arg Asp Arg Ile Asn Asp Gly Asp Ser Lys Val Val
225 230 235 240
Ile Thr Thr Asp Glu Ser Asn Arg Gly Gly Lys Val Ile Glu Thr Lys
245 250 255
Arg Ile Val Asp Asp Ala Leu Arg Glu Thr Pro Gly Val Arg His Val
260 265 270
Leu Val Tyr Arg Lys Thr Asn Asn Pro Ser Val Ala Phe His Ala Pro
275 280 285
Arg Asp Leu Asp Trp Ala Thr Glu Lys Lys Lys Tyr Lys Thr Tyr Tyr
290 295 300
Pro Cys Thr Pro Val Asp Ser Glu Asp Pro Leu Phe Leu Leu Tyr Thr
305 310 315 320
Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Gln His Ser Thr Ala Gly
325 330 335
Tyr Leu Leu Gly Ala Leu Leu Thr Met Arg Tyr Thr Phe Asp Thr His
340 345 350
Gln Glu Asp Val Phe Phe Thr Ala Gly Asp Ile Gly Trp Ile Thr Gly
355 360 365
His Thr Tyr Val Val Tyr Gly Pro Leu Leu Tyr Gly Cys Ala Thr Leu
370 375 380
Val Phe Glu Gly Thr Pro Ala Tyr Pro Asn Tyr Ser Arg Tyr Trp Asp
385 390 395 400
Ile Ile Asp Glu His Lys Val Thr Gln Phe Tyr Val Ala Pro Thr Ala
405 410 415
Leu Arg Leu Leu Lys Arg Ala Gly Asp Ser Tyr Ile Glu Asn His Ser
420 425 430
Leu Lys Ser Leu Arg Cys Leu Gly Ser Val Gly Glu Pro Ile Ala Ala
435 440 445
Glu Val Trp Glu Trp Tyr Ser Glu Lys Ile Gly Lys Asn Glu Ile Pro
450 455 460
Ile Val Asp Thr Tyr Trp Gln Thr Glu Ser Gly Ser His Leu Val Thr
465 470 475 480
Pro Leu Ala Gly Gly Val Thr Pro Met Lys Pro Gly Ser Ala Ser Phe
485 490 495
Pro Phe Phe Gly Ile Asp Ala Val Val Leu Asp Pro Asn Thr Gly Glu
500 505 510
Glu Leu Asn Thr Ser His Ala Glu Gly Val Leu Ala Val Lys Ala Ala
515 520 525
Trp Pro Ser Phe Ala Arg Thr Ile Trp Lys Asn His Asp Arg Tyr Leu
530 535 540
Asp Thr Tyr Leu Asn Pro Tyr Pro Gly Tyr Tyr Phe Thr Gly Asp Gly
545 550 555 560
Ala Ala Lys Asp Lys Asp Gly Tyr Ile Trp Ile Leu Gly Arg Val Asp
565 570 575
Asp Val Val Asn Val Ser Gly His Arg Leu Ser Thr Ala Glu Ile Glu
580 585 590
Ala Ala Ile Ile Glu Asp Pro Ile Val Ala Glu Cys Ala Val Val Gly
595 600 605
Phe Asn Asp Asp Leu Thr Gly Gln Ala Val Ala Ala Phe Val Val Leu
610 615 620
Lys Asn Lys Ser Asn Trp Ser Thr Ala Thr Asp Asp Glu Leu Gln Asp
625 630 635 640
Ile Lys Lys His Leu Val Phe Thr Val Arg Lys Asp Ile Gly Pro Phe
645 650 655
Ala Ala Pro Lys Leu Ile Ile Leu Val Asp Asp Leu Pro Lys Thr Arg
660 665 670
Ser Gly Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Leu Ala Gly Glu
675 680 685
Ser Asp Gln Leu Gly Asp Val Ser Thr Leu Ser Asn Pro Gly Ile Val
690 695 700
Arg His Leu Ile Asp Ser Val Lys Leu
705 710
<210> 5
<211> 2287
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(2287)
<223> Saccharomyces cerevisiae ACS2 nucleotide sequence
<400> 5
acctcccgcg acctccaaaa tcgaactacc ttcacaatga caatcaagga acataaagta 60
gtttatgaag ctcacaacgt aaaggctctt aaggctcctc aacattttta caacagccaa 120
cccggcaagg gttacgttac tgatatgcaa cattatcaag aaatgtatca acaatctatc 180
aatgagccag aaaaattctt tgataagatg gctaaggaat acttgcattg ggatgctcca 240
tacaccaaag ttcaatctgg ttcattgaac aatggtgatg ttgcatggtt tttgaacggt 300
aaattgaatg catcatacaa ttgtgttgac agacatgcct ttgctaatcc cgacaagcca 360
gctttgatct atgaagctga tgacgaatcc gacaacaaaa tcatcacatt tggtgaatta 420
ctcagaaaag tttcccaaat cgctggtgtc ttaaaaagct ggggcgttaa gaaaggtgac 480
acagtggcta tctatttgcc aatgattcca gaagcggtca ttgctatgtt ggctgtggct 540
cgtattggtg ctattcactc tgttgtcttt gctgggttct ccgctggttc gttgaaagat 600
cgtgtcgttg acgctaattc taaagtggtc atcacttgtg atgaaggtaa aagaggtggt 660
aagaccatca acactaaaaa aattgttgac gaaggtttga acggagtcga tttggtttcc 720
cgtatcttgg ttttccaaag aactggtact gaaggtattc caatgaaggc cggtagagat 780
tactggtggc atgaggaggc cgctaagcag agaacttacc tacctcctgt ttcatgtgac 840
gctgaagatc ctctattttt attatacact tccggttcca ctggttctcc aaagggtgtc 900
gttcacacta caggtggtta tttattaggt gccgctttaa caactagata cgtttttgat 960
attcacccag aagatgttct cttcactgcc ggtgacgtcg gctggatcac gggtcacacc 1020
tatgctctat atggtccatt aaccttgggt accgcctcaa taattttcga atccactcct 1080
gcctacccag attatggtag atattggaga attatccaac gtcacaaggc tacccatttc 1140
tatgtggctc caactgcttt aagattaatc aaacgtgtag gtgaagccga aattgccaaa 1200
tatgacactt cctcattacg tgtcttgggt tccgtcggtg aaccaatctc tccagactta 1260
tgggaatggt atcatgaaaa agtgggtaac aaaaactgtg tcatttgtga cactatgtgg 1320
caaacagagt ctggttctca tttaattgct cctttggcag gtgctgtccc aacaaaacct 1380
ggttctgcta ccgtgccatt ctttggtatt aacgcttgta tcattgaccc tgttacaggt 1440
gtggaattag aaggtaatga tgtcgaaggt gtccttgccg ttaaatcacc atggccatca 1500
atggctagat ctgtttggaa ccaccacgac cgttacatgg atacttactt gaaaccttat 1560
cctggtcact atttcacagg tgatggtgct ggtagagatc atgatggtta ctactggatc 1620
aggggtagag ttgacgacgt tgtaaatgtt tccggtcata gattatccac atcagaaatt 1680
gaagcatcta tctcaaatca cgaaaacgtc tcggaagctg ctgttgtcgg tattccagat 1740
gaattgaccg gtcaaaccgt cgttgcatat gtttccctaa aagatggtta tctacaaaac 1800
aacgctactg aaggtgatgc agaacacatc acaccagata atttacgtag agaattgatc 1860
ttacaagtta ggggtgagat tggtcctttc gcctcaccaa aaaccattat tctagttaga 1920
gatctaccaa gaacaaggtc aggaaagatt atgagaagag ttctaagaaa ggttgcttct 1980
aacgaagccg aacagctagg tgacctaact actttggcca acccagaagt tgtacctgcc 2040
atcatttctg ctgtagagaa ccaatttttc tctcaaaaaa agaaataact taaatgagaa 2100
aaatttcgta atgagataaa atttcgctcc ttttctgttt tctattttct attttcccaa 2160
cttttgctct attcagttat aaattactat ttatccatca gttaaaaaac aagatctttt 2220
actggtcagc taggaaagcg aaaatacaaa gactttatgc actatccccg cgtgcttggc 2280
cggccgt 2287
<210> 6
<211> 683
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(683)
<223> Saccharomyces cerevisiae ACS2 protein sequence
<400> 6
Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys
1 5 10 15
Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly
20 25 30
Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile
35 40 45
Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His
50 55 60
Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly
65 70 75 80
Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys
85 90 95
Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr
100 105 110
Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu
115 120 125
Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val
130 135 140
Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala
145 150 155 160
Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val
165 170 175
Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp
180 185 190
Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly
195 200 205
Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val
210 215 220
Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly
225 230 235 240
Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala
245 250 255
Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro
260 265 270
Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val
275 280 285
Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg
290 295 300
Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp
305 310 315 320
Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr
325 330 335
Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp
340 345 350
Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe
355 360 365
Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala
370 375 380
Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val
385 390 395 400
Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val
405 410 415
Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser
420 425 430
Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro
435 440 445
Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp
450 455 460
Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu
465 470 475 480
Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His
485 490 495
His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr
500 505 510
Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile
515 520 525
Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser
530 535 540
Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu
545 550 555 560
Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val
565 570 575
Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu
580 585 590
Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile
595 600 605
Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile
610 615 620
Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg
625 630 635 640
Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp
645 650 655
Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala
660 665 670
Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys
675 680
<210> 7
<211> 1798
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(1798)
<223> Saccharomyces cerevisiae ALD4 nucleotide sequence
<400> 7
gcacccaggg acacacagca gcgaagtatt ttcagaatgt tcagtagatc tacgctctgc 60
ttaaagacgt ctgcatcctc cattgggaga cttcaattga gatatttctc acaccttcct 120
atgacagtgc ctatcaagct gcccaatggg ttggaatatg agcaaccaac ggggttgttc 180
atcaacaaca agtttgttcc ttctaaacag aacaagacct tcgaagtcat taacccttcc 240
acggaagaag aaatatgtca tatttatgaa ggtagagagg acgatgtgga agaggccgtg 300
caggccgccg accgtgcctt ctctaatggg tcttggaacg gtatcgaccc tattgacagg 360
ggtaaggctt tgtacaggtt agccgaatta attgaacagg acaaggatgt cattgcttcc 420
atcgagactt tggataacgg taaagctatc tcttcctcga gaggagatgt tgatttagtc 480
atcaactatt tgaaatcttc tgctggcttt gctgataaaa ttgatggtag aatgattgat 540
actggtagaa cccatttttc ttacactaag agacagcctt tgggtgtttg tgggcagatt 600
attccttgga atttcccact gttgatgtgg gcctggaaga ttgcccctgc tttggtcacc 660
ggtaacaccg tcgtgttgaa gactgccgaa tccaccccat tgtccgcttt gtatgtgtct 720
aaatacatcc cacaggcggg tattccacct ggtgtgatca acattgtatc cgggtttggt 780
aagattgtgg gtgaggccat tacaaaccat ccaaaaatca aaaaggttgc cttcacaggg 840
tccacggcta cgggtagaca catttaccag tccgcagccg caggcttgaa aaaagtgact 900
ttggagctgg gtggtaaatc accaaacatt gtcttcgcgg acgccgagtt gaaaaaagcc 960
gtgcaaaaca ttatccttgg tatctactac aattctggtg aggtctgttg tgcgggttca 1020
agggtgtatg ttgaagaatc tatttacgac aaattcattg aagagttcaa agccgcttct 1080
gaatccatca aggtgggcga cccattcgat gaatctactt tccaaggtgc acaaacctct 1140
caaatgcaac taaacaaaat cttgaaatac gttgacattg gtaagaatga aggtgctact 1200
ttgattaccg gtggtgaaag attaggtagc aagggttact tcattaagcc aactgtcttt 1260
ggtgacgtta aggaagacat gagaattgtc aaagaggaaa tctttggccc tgttgtcact 1320
gtaaccaaat tcaaatctgc cgacgaagtc attaacatgg cgaacgattc tgaatacggg 1380
ttggctgctg gtattcacac ctctaatatt aataccgcct taaaagtggc tgatagagtt 1440
aatgcgggta cggtctggat aaacacttat aacgatttcc accacgcagt tcctttcggt 1500
gggttcaatg catctggttt gggcagggaa atgtctgttg atgctttaca aaactacttg 1560
caagttaaag cggtccgtgc caaattggac gagtaaggtc atcaataagc ctggtgtcca 1620
atcgatgctt acatacataa aattaaatat tctgtctctg ttatatttcc acatgtcatc 1680
atttcaaata tatgtacttt aaagaaaata aaataaaaaa taaaattttt ttctcccgat 1740
aatcaatttt cttaattaat taattgcgtt acgaaacgcg atcgccgacg ccgccgat 1798
<210> 8
<211> 519
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(519)
<223> Saccharomyces cerevisiae ALD4 protein sequence
<400> 8
Met Phe Ser Arg Ser Thr Leu Cys Leu Lys Thr Ser Ala Ser Ser Ile
1 5 10 15
Gly Arg Leu Gln Leu Arg Tyr Phe Ser His Leu Pro Met Thr Val Pro
20 25 30
Ile Lys Leu Pro Asn Gly Leu Glu Tyr Glu Gln Pro Thr Gly Leu Phe
35 40 45
Ile Asn Asn Lys Phe Val Pro Ser Lys Gln Asn Lys Thr Phe Glu Val
50 55 60
Ile Asn Pro Ser Thr Glu Glu Glu Ile Cys His Ile Tyr Glu Gly Arg
65 70 75 80
Glu Asp Asp Val Glu Glu Ala Val Gln Ala Ala Asp Arg Ala Phe Ser
85 90 95
Asn Gly Ser Trp Asn Gly Ile Asp Pro Ile Asp Arg Gly Lys Ala Leu
100 105 110
Tyr Arg Leu Ala Glu Leu Ile Glu Gln Asp Lys Asp Val Ile Ala Ser
115 120 125
Ile Glu Thr Leu Asp Asn Gly Lys Ala Ile Ser Ser Ser Arg Gly Asp
130 135 140
Val Asp Leu Val Ile Asn Tyr Leu Lys Ser Ser Ala Gly Phe Ala Asp
145 150 155 160
Lys Ile Asp Gly Arg Met Ile Asp Thr Gly Arg Thr His Phe Ser Tyr
165 170 175
Thr Lys Arg Gln Pro Leu Gly Val Cys Gly Gln Ile Ile Pro Trp Asn
180 185 190
Phe Pro Leu Leu Met Trp Ala Trp Lys Ile Ala Pro Ala Leu Val Thr
195 200 205
Gly Asn Thr Val Val Leu Lys Thr Ala Glu Ser Thr Pro Leu Ser Ala
210 215 220
Leu Tyr Val Ser Lys Tyr Ile Pro Gln Ala Gly Ile Pro Pro Gly Val
225 230 235 240
Ile Asn Ile Val Ser Gly Phe Gly Lys Ile Val Gly Glu Ala Ile Thr
245 250 255
Asn His Pro Lys Ile Lys Lys Val Ala Phe Thr Gly Ser Thr Ala Thr
260 265 270
Gly Arg His Ile Tyr Gln Ser Ala Ala Ala Gly Leu Lys Lys Val Thr
275 280 285
Leu Glu Leu Gly Gly Lys Ser Pro Asn Ile Val Phe Ala Asp Ala Glu
290 295 300
Leu Lys Lys Ala Val Gln Asn Ile Ile Leu Gly Ile Tyr Tyr Asn Ser
305 310 315 320
Gly Glu Val Cys Cys Ala Gly Ser Arg Val Tyr Val Glu Glu Ser Ile
325 330 335
Tyr Asp Lys Phe Ile Glu Glu Phe Lys Ala Ala Ser Glu Ser Ile Lys
340 345 350
Val Gly Asp Pro Phe Asp Glu Ser Thr Phe Gln Gly Ala Gln Thr Ser
355 360 365
Gln Met Gln Leu Asn Lys Ile Leu Lys Tyr Val Asp Ile Gly Lys Asn
370 375 380
Glu Gly Ala Thr Leu Ile Thr Gly Gly Glu Arg Leu Gly Ser Lys Gly
385 390 395 400
Tyr Phe Ile Lys Pro Thr Val Phe Gly Asp Val Lys Glu Asp Met Arg
405 410 415
Ile Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Thr Lys Phe
420 425 430
Lys Ser Ala Asp Glu Val Ile Asn Met Ala Asn Asp Ser Glu Tyr Gly
435 440 445
Leu Ala Ala Gly Ile His Thr Ser Asn Ile Asn Thr Ala Leu Lys Val
450 455 460
Ala Asp Arg Val Asn Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp
465 470 475 480
Phe His His Ala Val Pro Phe Gly Gly Phe Asn Ala Ser Gly Leu Gly
485 490 495
Arg Glu Met Ser Val Asp Ala Leu Gln Asn Tyr Leu Gln Val Lys Ala
500 505 510
Val Arg Ala Lys Leu Asp Glu
515
<210> 9
<211> 2744
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(2744)
<223> Saccharomyces cerevisiae cytosolic aldehyde dehydrogenase 6
(ALD6) nucleotide sequence
<400> 9
catatggcgt atccaagccg aaaccctttg cctcatcccc acggaataag gcagccgaca 60
aaagaaaaac gaccgaaaag gaaccagaaa gaaaaaagag ggtgggcgcg ccgcggacgt 120
gtaaaaagat atgcatccag cttctatatc gctttaactt taccgttttg ggcatcggga 180
acgtatgtaa cattgatctc ctcttgggaa cggtgagtgc aacagatgcg atatagcacc 240
gaccatgtgg gcaaattcgt aataaattcg gggtgagggg gattcaagac aagcaacctt 300
gttagtcagc tcaaacagcg atttaacggt tgagtaacac atcaaaacac cgttcgaggt 360
caagcctggc gtgtttaaca agttcttgat atcatatata aatgtaataa gaagtttggt 420
aatattcaat tcgaagtgtt cagtctttta cttctcttgt tttatagaag aaaaaacatc 480
aagaaacatc tttaacatac acaaacacat actatcagaa tacaatgact aagctacact 540
ttgacactgc tgaaccagtc aagatcacac ttccaaatgg tttgacatac gagcaaccaa 600
ccggtctatt cattaacaac aagtttatga aagctcaaga cggtaagacc tatcccgtcg 660
aagatccttc cactgaaaac accgtttgtg aggtctcttc tgccaccact gaagatgttg 720
aatatgctat cgaatgtgcc gaccgtgctt tccacgacac tgaatgggct acccaagacc 780
caagagaaag aggccgtcta ctaagtaagt tggctgacga attggaaagc caaattgact 840
tggtttcttc cattgaagct ttggacaatg gtaaaacttt ggcctttaag gcccgtgggg 900
atgttaccat tgcaatcaac tgtctaagag atgctgctgc ctatgccgac aaagtcaacg 960
gtagaacaat caacaccggt gacggctaca tgaacttcac caccttagag ccaatcggtg 1020
tctgtggtca aattattcca tggaactttc caataatgat gttggcttgg aagatcgccc 1080
cagcattggc catgggtaac gtctgtatct tgaaacccgc tgctgtcaca cctttaaatg 1140
ccctatactt tgcttcttta tgtaagaagg ttggtattcc agctggtgtc gtcaacatcg 1200
ttccaggtcc tggtagaact gttggtgctg ctttgaccaa cgacccaaga atcagaaagc 1260
tggcttttac cggttctaca gaagtcggta agagtgttgc tgtcgactct tctgaatcta 1320
acttgaagaa aatcactttg gaactaggtg gtaagtccgc ccatttggtc tttgacgatg 1380
ctaacattaa gaagacttta ccaaatctag taaacggtat tttcaagaac gctggtcaaa 1440
tttgttcctc tggttctaga atttacgttc aagaaggtat ttacgacgaa ctattggctg 1500
ctttcaaggc ttacttggaa accgaaatca aagttggtaa tccatttgac aaggctaact 1560
tccaaggtgc tatcactaac cgtcaacaat tcgacacaat tatgaactac atcgatatcg 1620
gtaagaaaga aggcgccaag atcttaactg gtggcgaaaa agttggtgac aagggttact 1680
tcatcagacc aaccgttttc tacgatgtta atgaagacat gagaattgtt aaggaagaaa 1740
tttttggacc agttgtcact gtcgcaaagt tcaagacttt agaagaaggt gtcgaaatgg 1800
ctaacagctc tgaattcggt ctaggttctg gtatcgaaac agaatctttg agcacaggtt 1860
tgaaggtggc caagatgttg aaggccggta ccgtctggat caacacatac aacgattttg 1920
actccagagt tccattcggt ggtgttaagc aatctggtta cggtagagaa atgggtgaag 1980
aagtctacca tgcatacact gaagtaaaag ctgtcagaat taagttgtaa tgtaccaacc 2040
tgcatttctt tccgtcatat acacaaaata ctttcatata aacttacttg gtcttacgtc 2100
ataaataaat atgtatacat ataaattaaa aaatttggtt ttatattttt acaaaaagaa 2160
tcgtttactt catttctccc ttttaagcga tacaatccat gaaaaaagag aaaaagagag 2220
aacaggcttg tgccttcttt aaaacatccc acacaaaatc atattgaatt gaattttaca 2280
tcttaagcta gtgtacaaca actgctatat ccaaagaaaa ctaacgtgga ccgcttttag 2340
agttgagaaa aaggtttgaa aaaaatagca atacaaagac ttgtttcata tataaaatac 2400
agggagcaca ttgagctaat ataacataaa cactgcgaac caattccaat caaaaggtac 2460
acatgagagc attcccccga gtactgccat ttcgccatca gagatcatat aataacatcc 2520
ttcttcgaac agtaaggctt tttggttcat cactttcttc ttttgatttc tctaggcaaa 2580
tgcctaaggt ggaccctgac aataccgctg caatgctact acagaaaaac ttgatccaaa 2640
gaaacaacat gctctatggg tatggatcag ggacaatacg atgtactttg ctagactcaa 2700
ctggacgagc caaatcacca ttagtagaga taaaacgtga ggat 2744
<210> 10
<211> 500
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<221> misc_feature
<222> (1)..(500)
<223> Saccharomyces cerevisiae cytosolic aldehyde dehydrogenase 6
(ALD6) protein sequence
<400> 10
Met Thr Lys Leu His Phe Asp Thr Ala Glu Pro Val Lys Ile Thr Leu
1 5 10 15
Pro Asn Gly Leu Thr Tyr Glu Gln Pro Thr Gly Leu Phe Ile Asn Asn
20 25 30
Lys Phe Met Lys Ala Gln Asp Gly Lys Thr Tyr Pro Val Glu Asp Pro
35 40 45
Ser Thr Glu Asn Thr Val Cys Glu Val Ser Ser Ala Thr Thr Glu Asp
50 55 60
Val Glu Tyr Ala Ile Glu Cys Ala Asp Arg Ala Phe His Asp Thr Glu
65 70 75 80
Trp Ala Thr Gln Asp Pro Arg Glu Arg Gly Arg Leu Leu Ser Lys Leu
85 90 95
Ala Asp Glu Leu Glu Ser Gln Ile Asp Leu Val Ser Ser Ile Glu Ala
100 105 110
Leu Asp Asn Gly Lys Thr Leu Ala Leu Ala Arg Gly Asp Val Thr Ile
115 120 125
Ala Ile Asn Cys Leu Arg Asp Ala Ala Ala Tyr Ala Asp Lys Val Asn
130 135 140
Gly Arg Thr Ile Asn Thr Gly Asp Gly Tyr Met Asn Phe Thr Thr Leu
145 150 155 160
Glu Pro Ile Gly Val Cys Gly Gln Ile Ile Pro Trp Asn Phe Pro Ile
165 170 175
Met Met Leu Ala Trp Lys Ile Ala Pro Ala Leu Ala Met Gly Asn Val
180 185 190
Cys Ile Leu Lys Pro Ala Ala Val Thr Pro Leu Asn Ala Leu Tyr Phe
195 200 205
Ala Ser Leu Cys Lys Lys Val Gly Ile Pro Ala Gly Val Val Asn Ile
210 215 220
Val Pro Gly Pro Gly Arg Thr Val Gly Ala Ala Leu Thr Asn Asp Pro
225 230 235 240
Arg Ile Arg Lys Leu Ala Phe Thr Gly Ser Thr Glu Val Gly Lys Ser
245 250 255
Val Ala Val Asp Ser Ser Glu Ser Asn Leu Lys Lys Ile Thr Leu Glu
260 265 270
Leu Gly Gly Lys Ser Ala His Leu Val Phe Asp Asp Ala Asn Ile Lys
275 280 285
Lys Thr Leu Pro Asn Leu Val Asn Gly Ile Phe Lys Asn Ala Gly Gln
290 295 300
Ile Cys Ser Ser Gly Ser Arg Ile Tyr Val Gln Glu Gly Ile Tyr Asp
305 310 315 320
Glu Leu Leu Ala Ala Phe Lys Ala Tyr Leu Glu Thr Glu Ile Lys Val
325 330 335
Gly Asn Pro Phe Asp Lys Ala Asn Phe Gln Gly Ala Ile Thr Asn Arg
340 345 350
Gln Gln Phe Asp Thr Ile Met Asn Tyr Ile Asp Ile Gly Lys Lys Glu
355 360 365
Gly Ala Lys Ile Leu Thr Gly Gly Glu Lys Val Gly Asp Lys Gly Tyr
370 375 380
Phe Ile Arg Pro Thr Val Phe Tyr Asp Val Asn Glu Asp Met Arg Ile
385 390 395 400
Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Ala Lys Phe Lys
405 410 415
Thr Leu Glu Glu Gly Val Glu Met Ala Asn Ser Ser Glu Phe Gly Leu
420 425 430
Gly Ser Gly Ile Glu Thr Glu Ser Leu Ser Thr Gly Leu Lys Val Ala
435 440 445
Lys Met Leu Lys Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp Phe
450 455 460
Asp Ser Arg Val Pro Phe Gly Gly Val Lys Gln Ser Gly Tyr Gly Arg
465 470 475 480
Glu Met Gly Glu Glu Val Tyr His Ala Tyr Thr Glu Val Lys Ala Val
485 490 495
Arg Ile Lys Leu
500
<210> 11
<211> 2749
<212> DNA
<213> Leuconostoc mesenteroides
<220>
<221> misc_feature
<222> (1)..(2749)
<223> Leuconostoc mesenteroides Phosphoketolase (PK) gene sequence
<400> 11
gttacggaag aagtcgtggt ttacggtgtt tatgattctt gcaaaaaata aggagtactt 60
aatctcatgg cagatttcga ttcaaaagag tacttggaac ttgttgataa gtggtggcgc 120
gcaactaact atttgtcagc tgggatgatc tttttgaaga gcaacccatt gttctcagtt 180
actaatacac ctatcaaggc tgaagatgta aaagttaagc caatcggaca ctggggtact 240
atctcaggtc agacattctt gtatgcacat gctaaccgtt tgatcaacaa gtatggtttg 300
aacatgtttt acgttggtgg tcctggtcac ggtggccaag ttatggttac taacgcttac 360
ttagacggcg catatactga agattatcct gaaattactc aagatatcga aggtatgagc 420
cacttgttca agcgtttctc attccctggc ggtattggat cacacatgac agctcaaaca 480
cctggttcat tacacgaagg tggtgaattg ggctattcat tgagccacgc ttttggtgcc 540
gttttggaca atcctgacca agttgctttc gcagttgttg gtgatggtga agctgaaaca 600
ggtccttcaa tggcttcatg gcactcaatt aagtttttga atgctaagaa tgatggtgcc 660
gttttgcctg tcttggattt gaacggattc aagatttcaa acccaactat cttctcacgt 720
atgagtgatg aagaaatcac aaagttcttt gaaggtttgg gttattcacc tcgcttcatc 780
gaaaacgatg atattcatga ctacgcaaca tatcaccaac ttgcagcaaa cattttggat 840
caagctattg aagatattca agctattcaa aatgatgcac gtgaaaatgg taagtatcaa 900
gatggtgaaa tccctgcatg gccagtaatt attgctcgct tgccaaaggg ctggggtgga 960
ccaacgcacg atgcaagtaa caatcctatt gaaaactcat tccgtgcgca ccaagtgcca 1020
ttgcctcttg aacaacacga tcttgcaaca ttgcctgaat tcgaagactg gatgaactca 1080
tacaagcctg aagaattatt caatgctgat ggttctttga aggatgaatt gaaagctatc 1140
gctcctaagg gtgacaagcg tatgtcagct aaccctatta caaatggtgg tgctgatcgt 1200
tcagacttga agttgcctaa ctggagagaa ttcgctaacg atatcaatga tgatacacgt 1260
ggtaaggaat tcgctgatag caagcgcaat atggacatgg caacattgtc aaactacttg 1320
ggtgctgttt cacaattgaa cccaactcgt ttccgcttct tcggtcctga tgaaacaatg 1380
tcaaaccgtt tgtggggatt gttcaatgtt acaccacgtc aatggatgga agaaatcaag 1440
gaaccacaag atcaattgtt gagccctacg ggtcgcatta ttgattcaca attgtctgaa 1500
catcaagctg aaggttggct tgaaggatat actttgactg gtcgtgttgg aatcttcgca 1560
tcatacgagt cattcttgcg tgttgtcgat acaatggtta cgcaacactt caagtggttg 1620
cgtcacgctt cagaacaagc atggcgtaat gactatccat cattgaactt gattgcaact 1680
tcaactgctt tccaacaaga tcacaatgga tatactcacc aagatccagg tatgttgact 1740
cacttggctg aaaagaagtc taactttatt cgtgaatatt tgccagctga tggtaactca 1800
ttgttggctg ttcaagaacg tgctttctca gaacgtcata aggttaactt gttgattgct 1860
tctaagcaac cacgtcaaca atggtttaca gttgaagaag ctgaagtatt ggctaacgaa 1920
ggtttgaaga tcattgattg ggcttctact gcaccttcta gtgatgttga tattacattc 1980
gcatctgctg gtactgaacc aacaattgaa actttggctg ctttgtggtt gattaaccaa 2040
gcattcccag atgttaagtt ccgttatgtt aacgttgttg aattactacg tttgcaaaag 2100
aagtcagaac ctaacatgaa tgatgaacgt gaattatcag ccgaagaatt caacaagtat 2160
ttccaagctg atacaccagt tatcttcggt ttccatgctt atgaaaactt gattgaatca 2220
ttcttcttcg aacgtaagtt cacgggtgat gtatacgttc atggatatcg tgaagatggt 2280
gacatcacaa cgacatatga tatgcgtgta tattcacact tggatcgctt ccatcaagct 2340
aaggaagctg ctgaaatctt gtctgcaaat ggtaagattg atcaagctgc tgctgataca 2400
ttcatcgcta agatggatga tactttggca aagcatttcc aagttactcg taacgaaggt 2460
cgtgatatcg aagaattcac tgactggaca tggtcaccac ttaagtaatt taaaattatt 2520
ttatcaaaac caactattat ttttaatagt tggttttttt atggctaaat tgactacata 2580
ctaaacgaaa ccatgtaaaa gtgccacata gttttactta ataagttcct tttatttttt 2640
gatttgcaat gcaaaattgt aagcgtaata tgaataataa aaacccccaa ttagttagct 2700
aattgggggt tttgtaaatc accatatcag ccgctcatag tcttagacg 2749
<210> 12
<211> 813
<212> PRT
<213> Leuconostoc mesenteroides
<220>
<221> misc_feature
<222> (1)..(813)
<223> Leuconostoc mesenteroides Phosphoketolase (PK) protein sequence
<400> 12
Met Ala Asp Phe Asp Ser Lys Glu Tyr Leu Glu Leu Val Asp Lys Trp
1 5 10 15
Trp Arg Ala Thr Asn Tyr Leu Ser Ala Gly Met Ile Phe Leu Lys Ser
20 25 30
Asn Pro Leu Phe Ser Val Thr Asn Thr Pro Ile Lys Ala Glu Asp Val
35 40 45
Lys Val Lys Pro Ile Gly His Trp Gly Thr Ile Ser Gly Gln Thr Phe
50 55 60
Leu Tyr Ala His Ala Asn Arg Leu Ile Asn Lys Tyr Gly Leu Asn Met
65 70 75 80
Phe Tyr Val Gly Gly Pro Gly His Gly Gly Gln Val Met Val Thr Asn
85 90 95
Ala Tyr Leu Asp Gly Ala Tyr Thr Glu Asp Tyr Pro Glu Ile Thr Gln
100 105 110
Asp Ile Glu Gly Met Ser His Leu Phe Lys Arg Phe Ser Phe Pro Gly
115 120 125
Gly Ile Gly Ser His Met Thr Ala Gln Thr Pro Gly Ser Leu His Glu
130 135 140
Gly Gly Glu Leu Gly Tyr Ser Leu Ser His Ala Phe Gly Ala Val Leu
145 150 155 160
Asp Asn Pro Asp Gln Val Ala Phe Ala Val Val Gly Asp Gly Glu Ala
165 170 175
Glu Thr Gly Pro Ser Met Ala Ser Trp His Ser Ile Lys Phe Leu Asn
180 185 190
Ala Lys Asn Asp Gly Ala Val Leu Pro Val Leu Asp Leu Asn Gly Phe
195 200 205
Lys Ile Ser Asn Pro Thr Ile Phe Ser Arg Met Ser Asp Glu Glu Ile
210 215 220
Thr Lys Phe Phe Glu Gly Leu Gly Tyr Ser Pro Arg Phe Ile Glu Asn
225 230 235 240
Asp Asp Ile His Asp Tyr Ala Thr Tyr His Gln Leu Ala Ala Asn Ile
245 250 255
Leu Asp Gln Ala Ile Glu Asp Ile Gln Ala Ile Gln Asn Asp Ala Arg
260 265 270
Glu Asn Gly Lys Tyr Gln Asp Gly Glu Ile Pro Ala Trp Pro Val Ile
275 280 285
Ile Ala Arg Leu Pro Lys Gly Trp Gly Gly Pro Thr His Asp Ala Ser
290 295 300
Asn Asn Pro Ile Glu Asn Ser Phe Arg Ala His Gln Val Pro Leu Pro
305 310 315 320
Leu Glu Gln His Asp Leu Ala Thr Leu Pro Glu Phe Glu Asp Trp Met
325 330 335
Asn Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala Asp Gly Ser Leu Lys
340 345 350
Asp Glu Leu Lys Ala Ile Ala Pro Lys Gly Asp Lys Arg Met Ser Ala
355 360 365
Asn Pro Ile Thr Asn Gly Gly Ala Asp Arg Ser Asp Leu Lys Leu Pro
370 375 380
Asn Trp Arg Glu Phe Ala Asn Asp Ile Asn Asp Asp Thr Arg Gly Lys
385 390 395 400
Glu Phe Ala Asp Ser Lys Arg Asn Met Asp Met Ala Thr Leu Ser Asn
405 410 415
Tyr Leu Gly Ala Val Ser Gln Leu Asn Pro Thr Arg Phe Arg Phe Phe
420 425 430
Gly Pro Asp Glu Thr Met Ser Asn Arg Leu Trp Gly Leu Phe Asn Val
435 440 445
Thr Pro Arg Gln Trp Met Glu Glu Ile Lys Glu Pro Gln Asp Gln Leu
450 455 460
Leu Ser Pro Thr Gly Arg Ile Ile Asp Ser Gln Leu Ser Glu His Gln
465 470 475 480
Ala Glu Gly Trp Leu Glu Gly Tyr Thr Leu Thr Gly Arg Val Gly Ile
485 490 495
Phe Ala Ser Tyr Glu Ser Phe Leu Arg Val Val Asp Thr Met Val Thr
500 505 510
Gln His Phe Lys Trp Leu Arg His Ala Ser Glu Gln Ala Trp Arg Asn
515 520 525
Asp Tyr Pro Ser Leu Asn Leu Ile Ala Thr Ser Thr Ala Phe Gln Gln
530 535 540
Asp His Asn Gly Tyr Thr His Gln Asp Pro Gly Met Leu Thr His Leu
545 550 555 560
Ala Glu Lys Lys Ser Asn Phe Ile Arg Glu Tyr Leu Pro Ala Asp Gly
565 570 575
Asn Ser Leu Leu Ala Val Gln Glu Arg Ala Phe Ser Glu Arg His Lys
580 585 590
Val Asn Leu Leu Ile Ala Ser Lys Gln Pro Arg Gln Gln Trp Phe Thr
595 600 605
Val Glu Glu Ala Glu Val Leu Ala Asn Glu Gly Leu Lys Ile Ile Asp
610 615 620
Trp Ala Ser Thr Ala Pro Ser Ser Asp Val Asp Ile Thr Phe Ala Ser
625 630 635 640
Ala Gly Thr Glu Pro Thr Ile Glu Thr Leu Ala Ala Leu Trp Leu Ile
645 650 655
Asn Gln Ala Phe Pro Asp Val Lys Phe Arg Tyr Val Asn Val Val Glu
660 665 670
Leu Leu Arg Leu Gln Lys Lys Ser Glu Pro Asn Met Asn Asp Glu Arg
675 680 685
Glu Leu Ser Ala Glu Glu Phe Asn Lys Tyr Phe Gln Ala Asp Thr Pro
690 695 700
Val Ile Phe Gly Phe His Ala Tyr Glu Asn Leu Ile Glu Ser Phe Phe
705 710 715 720
Phe Glu Arg Lys Phe Thr Gly Asp Val Tyr Val His Gly Tyr Arg Glu
725 730 735
Asp Gly Asp Ile Thr Thr Thr Tyr Asp Met Arg Val Tyr Ser His Leu
740 745 750
Asp Arg Phe His Gln Ala Lys Glu Ala Ala Glu Ile Leu Ser Ala Asn
755 760 765
Gly Lys Ile Asp Gln Ala Ala Ala Asp Thr Phe Ile Ala Lys Met Asp
770 775 780
Asp Thr Leu Ala Lys His Phe Gln Val Thr Arg Asn Glu Gly Arg Asp
785 790 795 800
Ile Glu Glu Phe Thr Asp Trp Thr Trp Ser Pro Leu Lys
805 810
<210> 13
<211> 1002
<212> DNA
<213> Clostridium kluyveri
<220>
<221> misc_feature
<222> (1)..(1002)
<223> Clostridium kluyveri Phosphotransacetylase (PTA) gene sequence
<400> 13
atgaaattaa tggaaaatat ttttggttta gccaaagcag ataagaaaaa aattgttttg 60
gcagaaggag aagaagaaag gaacattaga gcttccgaag aaataataag ggatggtatt 120
gcagatataa ttttagtagg aagtgaaagt gtaataaaag agaatgcagc taaatttggg 180
gttaacttag ctggagtgga aatagtagat cctgaaactt caagtaaaac tgcaggctat 240
gccaatgctt tttatgaaat tagaaagaat aaaggagtta cactggaaaa agcagataaa 300
atagttagag atcctatata ttttgcaaca atgatggtga aacttggaga tgcagatggt 360
ttagtttcag gtgcaataca tacaacggga gatcttttga gaccaggact tcaaatagtg 420
aagacagttc caggtgcttc tgtggtttcc agtgtatttt taatgagtgt accagattgt 480
gaatatggag aagatggatt cttgttattt gctgattgtg ctgtaaatgt atgtcctact 540
gctgaagaat tatcttcaat tgcaataact acagcagaaa ctgcaaaaaa tttgtgtaaa 600
atagaaccaa gagttgccat gctttcattt tctactatgg gaagtgctag tcatgaattg 660
gtagataaag ttacaaaagc aacaaaactt gctaaagaag ctagacctga tttggatata 720
gatggagaac ttcaattgga tgcttcccta gtaaaaaaag ttgcagactt aaaagctccg 780
ggcagtaaag tggcaggaaa agccaatgta cttatattcc ctgatataca agcaggaaat 840
ataggatata agttagttca aagatttgca aaagctgagg ctataggacc tatatgtcag 900
ggatttgcaa agcctataaa tgatttatca agaggctgca gcgttgatga tatagtaaag 960
gtagtggctg taactgcagt tcaagcacag gcacagggtt ag 1002
<210> 14
<211> 333
<212> PRT
<213> Clostridium kluyveri
<220>
<221> misc_feature
<222> (1)..(333)
<223> Clostridium kluyveri Phosphotransacetylase (PTA) protein sequence
<400> 14
Met Lys Leu Met Glu Asn Ile Phe Gly Leu Ala Lys Ala Asp Lys Lys
1 5 10 15
Lys Ile Val Leu Ala Glu Gly Glu Glu Glu Arg Asn Ile Arg Ala Ser
20 25 30
Glu Glu Ile Ile Arg Asp Gly Ile Ala Asp Ile Ile Leu Val Gly Ser
35 40 45
Glu Ser Val Ile Lys Glu Asn Ala Ala Lys Phe Gly Val Asn Leu Ala
50 55 60
Gly Val Glu Ile Val Asp Pro Glu Thr Ser Ser Lys Thr Ala Gly Tyr
65 70 75 80
Ala Asn Ala Phe Tyr Glu Ile Arg Lys Asn Lys Gly Val Thr Leu Glu
85 90 95
Lys Ala Asp Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met
100 105 110
Val Lys Leu Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Ile His Thr
115 120 125
Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Val Pro
130 135 140
Gly Ala Ser Val Val Ser Ser Val Phe Leu Met Ser Val Pro Asp Cys
145 150 155 160
Glu Tyr Gly Glu Asp Gly Phe Leu Leu Phe Ala Asp Cys Ala Val Asn
165 170 175
Val Cys Pro Thr Ala Glu Glu Leu Ser Ser Ile Ala Ile Thr Thr Ala
180 185 190
Glu Thr Ala Lys Asn Leu Cys Lys Ile Glu Pro Arg Val Ala Met Leu
195 200 205
Ser Phe Ser Thr Met Gly Ser Ala Ser His Glu Leu Val Asp Lys Val
210 215 220
Thr Lys Ala Thr Lys Leu Ala Lys Glu Ala Arg Pro Asp Leu Asp Ile
225 230 235 240
Asp Gly Glu Leu Gln Leu Asp Ala Ser Leu Val Lys Lys Val Ala Asp
245 250 255
Leu Lys Ala Pro Gly Ser Lys Val Ala Gly Lys Ala Asn Val Leu Ile
260 265 270
Phe Pro Asp Ile Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg
275 280 285
Phe Ala Lys Ala Glu Ala Ile Gly Pro Ile Cys Gln Gly Phe Ala Lys
290 295 300
Pro Ile Asn Asp Leu Ser Arg Gly Cys Ser Val Asp Asp Ile Val Lys
305 310 315 320
Val Val Ala Val Thr Ala Val Gln Ala Gln Ala Gln Gly
325 330
<210> 15
<211> 2137
<212> DNA
<213> Streptomyces sp. CL190
<220>
<221> misc_feature
<222> (1)..(2137)
<223> Streptomyces sp. CL190 nphT7 gene sequence
<400> 15
cctgcaggcc gtcgagggcg cctggaagga ctacgcggag caggacggcc ggtcgctgga 60
ggagttcgcg gcgttcgtct accaccagcc gttcacgaag atggcctaca aggcgcaccg 120
ccacctgctg aacttcaacg gctacgacac cgacaaggac gccatcgagg gcgccctcgg 180
ccagacgacg gcgtacaaca acgtcatcgg caacagctac accgcgtcgg tgtacctggg 240
cctggccgcc ctgctcgacc aggcggacga cctgacgggc cgttccatcg gcttcctgag 300
ctacggctcg ggcagcgtcg ccgagttctt ctcgggcacc gtcgtcgccg ggtaccgcga 360
gcgtctgcgc accgaggcga accaggaggc gatcgcccgg cgcaagagcg tcgactacgc 420
cacctaccgc gagctgcacg agtacacgct cccgtccgac ggcggcgacc acgccacccc 480
ggtgcagacc accggcccct tccggctggc cgggatcaac gaccacaagc gcatctacga 540
ggcgcgctag cgacacccct cggcaacggg gtgcgccact gttcggcgca ccccgtgccg 600
ggctttcgca cagctattca cgaccatttg aggggcgggc agccgcatga ccgacgtccg 660
attccgcatt atcggtacgg gtgcctacgt accggaacgg atcgtctcca acgatgaagt 720
cggcgcgccg gccggggtgg acgacgactg gatcacccgc aagaccggta tccggcagcg 780
tcgctgggcc gccgacgacc aggccacctc ggacctggcc acggccgcgg ggcgggcagc 840
gctgaaagcg gcgggcatca cgcccgagca gctgaccgtg atcgcggtcg ccacctccac 900
gccggaccgg ccgcagccgc ccacggcggc ctatgtccag caccacctcg gtgcgaccgg 960
cactgcggcg ttcgacgtca acgcggtctg ctccggcacc gtgttcgcgc tgtcctcggt 1020
ggcgggcacc ctcgtgtacc ggggcggtta cgcgctggtc atcggcgcgg acctgtactc 1080
gcgcatcctc aacccggccg accgcaagac ggtcgtgctg ttcggggacg gcgccggcgc 1140
aatggtcctc gggccgacct cgaccggcac gggccccatc gtccggcgcg tcgccctgca 1200
caccttcggc ggcctcaccg acctgatccg tgtgcccgcg ggcggcagcc gccagccgct 1260
ggacacggat ggcctcgacg cgggactgca gtacttcgcg atggacgggc gtgaggtgcg 1320
ccgcttcgtc acggagcacc tgccgcagct gatcaagggc ttcctgcacg aggccggggt 1380
cgacgccgcc gacatcagcc acttcgtgcc gcatcaggcc aacggtgtca tgctcgacga 1440
ggtcttcggc gagctgcatc tgccgcgggc gaccatgcac cggacggtcg agacctacgg 1500
caacacggga gcggcctcca tcccgatcac catggacgcg gccgtgcgcg ccggttcctt 1560
ccggccgggc gagctggtcc tgctggccgg gttcggcggc ggcatggccg cgagcttcgc 1620
cctgatcgag tggtagtcgc ccgtaccacc acagcggtcc ggcgccacct gttccctgcg 1680
ccgggccgcc ctcggggcct ttaggcccca caccgcccca gccgacggat tcagtcgcgg 1740
cagtacctca gatgtccgct gcgacggcgt cccggagagc ccgggcgaga tcgcgggccc 1800
ccttctgctc gtccccggcc cctcccgcga gcaccacccg cggcggacgg ccgccgtcct 1860
ccgcgatacg ccgggcgagg tcgcaggcga gcacgccgga cccggagaag ccccccagca 1920
ccagcgaccg gccgactccg tgcgcggcca gggcaggctg cgcgccgtcg acgtcggtga 1980
gcagcaccag gagctcctgc ggcccggcgt agaggtcggc cagccggtcg tagcaggtcg 2040
cgggcgcgcc cggcggcggg atcagacaga tcgtgcccgc ccgctcgtgc ctcgccgccc 2100
gcagcgtgac cagcggaatg tcccgcccag ctccgga 2137
<210> 16
<211> 325
<212> PRT
<213> Streptomyces sp. CL190
<220>
<221> misc_feature
<222> (1)..(325)
<223> Streptomyces sp. CL190 acetyl-CoA:malonyl-CoA acyltransferase
protein sequence
<400> 16
Arg Phe Arg Ile Ile Gly Thr Gly Ala Tyr Val Pro Glu Arg Ile Val
1 5 10 15
Ser Asn Asp Glu Val Gly Ala Pro Ala Gly Val Asp Asp Asp Trp Ile
20 25 30
Thr Arg Lys Thr Gly Ile Arg Gln Arg Arg Trp Ala Ala Asp Asp Gln
35 40 45
Ala Thr Ser Asp Leu Ala Thr Ala Ala Gly Arg Ala Ala Leu Lys Ala
50 55 60
Ala Gly Ile Thr Pro Glu Gln Leu Thr Val Ile Ala Val Ala Thr Ser
65 70 75 80
Thr Pro Asp Arg Pro Gln Pro Pro Thr Ala Ala Tyr Val Gln His His
85 90 95
Leu Gly Ala Thr Gly Thr Ala Ala Phe Asp Val Asn Ala Val Cys Ser
100 105 110
Gly Thr Val Phe Ala Leu Ser Ser Val Ala Gly Thr Leu Val Tyr Arg
115 120 125
Gly Gly Tyr Ala Leu Val Ile Gly Ala Asp Leu Tyr Ser Arg Ile Leu
130 135 140
Asn Pro Ala Asp Arg Lys Thr Val Val Leu Phe Gly Asp Gly Ala Gly
145 150 155 160
Ala Met Val Leu Gly Pro Thr Ser Thr Gly Thr Gly Pro Ile Val Arg
165 170 175
Arg Val Ala Leu His Thr Phe Gly Gly Leu Thr Asp Leu Ile Arg Val
180 185 190
Pro Ala Gly Gly Ser Arg Gln Pro Leu Asp Thr Asp Gly Leu Asp Ala
195 200 205
Gly Leu Gln Tyr Phe Ala Met Asp Gly Arg Glu Val Arg Arg Phe Val
210 215 220
Thr Glu His Leu Pro Gln Leu Ile Lys Gly Phe Leu His Glu Ala Gly
225 230 235 240
Val Asp Ala Ala Asp Ile Ser His Phe Val Pro His Gln Ala Asn Gly
245 250 255
Val Met Leu Asp Glu Val Phe Gly Glu Leu His Leu Pro Arg Ala Thr
260 265 270
Met His Arg Thr Val Glu Thr Tyr Gly Asn Thr Gly Ala Ala Ser Ile
275 280 285
Pro Ile Thr Met Asp Ala Ala Val Arg Ala Gly Ser Phe Arg Pro Gly
290 295 300
Glu Leu Val Leu Leu Ala Gly Phe Gly Gly Gly Met Ala Ala Ser Phe
305 310 315 320
Ala Leu Ile Glu Trp
325
<210> 17
<211> 1287
<212> DNA
<213> Pseudomonas mevalonii
<220>
<221> misc_feature
<222> (1)..(1287)
<223> Pseudomonas mevalonii HMG-CoA reductase (mvaA) gene sequence
<400> 17
atgagcctcg attcccgcct gcccgctttc cgtaacctgt cccctgccgc gcgcctggac 60
cacatcggcc agttgctcgg cctgagccac gacgatgtca gcctgctggc caacgccggt 120
gccctgccga tggacatcgc caacggcatg atcgaaaacg tcatcggcac cttcgagctg 180
ccctatgccg tggccagcaa cttccagatc aatggccgtg atgtgctggt gccgctggtg 240
gtggaagagc cctcgatcgt cgccgctgct tcgtacatgg ccaagctggc ccgtgccaac 300
ggcggcttca ccacctccag cagcgccccg ctgatgcatg cccaggtaca gatcgtcggc 360
atacaggacc cgctcaatgc acgcctgagc ctgctgcgcc gcaaagacga aatcattgaa 420
ctggccaacc gcaaggacca gttgctcaac agcctcggcg gcggctgccg cgacatcgaa 480
gtgcacacct tcgccgatac cccgcgtggc ccgatgctgg tggcgcacct gatcgtcgat 540
gtacgcgatg ccatgggcgc caacaccgtc aataccatgg ccgaggccgt tgcgccgctg 600
atggaagcca tcaccggggg ccaggtacgc ctgcgcattc tgtccaacct ggccgacctg 660
cgcctggcca gggcccaggt gcggattact ccgcagcaac tggaaacggc cgaattcagt 720
ggcgaggcag tgatcgaagg catcctcgac gcctacgcct tcgctgcggt cgacccttac 780
cgcgcggcca cccacaacaa gggcatcatg aatggcatcg acccactgat cgtcgccact 840
ggcaacgact ggcgtgcagt ggaagccggc gcccatgcgt atgcctgccg cagtggtcac 900
tacggctcgc tgaccacctg ggaaaaggac aacaacggcc atttggtcgg caccctggaa 960
atgccgatgc ccgtaggcct ggtcggcggc gccaccaaaa cccatccgct ggcgcaactg 1020
tcgctgcgca tcctcggcgt gaaaacagcc caggcgctcg ctgagattgc cgtggccgta 1080
ggcctggcgc aaaacctcgg ggccatgcgc gccctggcca ccgaaggcat ccagcgcggc 1140
cacatggccc tgcatgcgcg caatattgcc gtggtggcgg gcgcccgagg cgatgaggtg 1200
gactgggttg cccggcagtt ggtggaatac cacgacgtgc gcgccgaccg cgccgtagca 1260
ctgctgaaac aaaagcgcgg ccaatga 1287
<210> 18
<211> 428
<212> PRT
<213> Pseudomonas mevalonii
<220>
<221> misc_feature
<222> (1)..(428)
<223> Pseudomonas mevalonii hydroxymethylglutaryl -CoA reductase
protein sequence
<400> 18
Met Ser Leu Asp Ser Arg Leu Pro Ala Phe Arg Asn Leu Ser Pro Ala
1 5 10 15
Ala Arg Leu Asp His Ile Gly Gln Leu Leu Gly Leu Ser His Asp Asp
20 25 30
Val Ser Leu Leu Ala Asn Ala Gly Ala Leu Pro Met Asp Ile Ala Asn
35 40 45
Gly Met Ile Glu Asn Val Ile Gly Thr Phe Glu Leu Pro Tyr Ala Val
50 55 60
Ala Ser Asn Phe Gln Ile Asn Gly Arg Asp Val Leu Val Pro Leu Val
65 70 75 80
Val Glu Glu Pro Ser Ile Val Ala Ala Ala Ser Tyr Met Ala Lys Leu
85 90 95
Ala Arg Ala Asn Gly Gly Phe Thr Thr Ser Ser Ser Ala Pro Leu Met
100 105 110
His Ala Gln Val Gln Ile Val Gly Ile Gln Asp Pro Leu Asn Ala Arg
115 120 125
Leu Ser Leu Leu Arg Arg Lys Asp Glu Ile Ile Glu Leu Ala Asn Arg
130 135 140
Lys Asp Gln Leu Leu Asn Ser Leu Gly Gly Gly Cys Arg Asp Ile Glu
145 150 155 160
Val His Thr Phe Ala Asp Thr Pro Arg Gly Pro Met Leu Val Ala His
165 170 175
Leu Ile Val Asp Val Arg Asp Ala Met Gly Ala Asn Thr Val Asn Thr
180 185 190
Met Ala Glu Ala Val Ala Pro Leu Met Glu Ala Ile Thr Gly Gly Gln
195 200 205
Val Arg Leu Arg Ile Leu Ser Asn Leu Ala Asp Leu Arg Leu Ala Arg
210 215 220
Ala Gln Val Arg Ile Thr Pro Gln Gln Leu Glu Thr Ala Glu Phe Ser
225 230 235 240
Gly Glu Ala Val Ile Glu Gly Ile Leu Asp Ala Tyr Ala Phe Ala Ala
245 250 255
Val Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met Asn Gly
260 265 270
Ile Asp Pro Leu Ile Val Ala Thr Gly Asn Asp Trp Arg Ala Val Glu
275 280 285
Ala Gly Ala His Ala Tyr Ala Cys Arg Ser Gly His Tyr Gly Ser Leu
290 295 300
Thr Thr Trp Glu Lys Asp Asn Asn Gly His Leu Val Gly Thr Leu Glu
305 310 315 320
Met Pro Met Pro Val Gly Leu Val Gly Gly Ala Thr Lys Thr His Pro
325 330 335
Leu Ala Gln Leu Ser Leu Arg Ile Leu Gly Val Lys Thr Ala Gln Ala
340 345 350
Leu Ala Glu Ile Ala Val Ala Val Gly Leu Ala Gln Asn Leu Gly Ala
355 360 365
Met Arg Ala Leu Ala Thr Glu Gly Ile Gln Arg Gly His Met Ala Leu
370 375 380
His Ala Arg Asn Ile Ala Val Val Ala Gly Ala Arg Gly Asp Glu Val
385 390 395 400
Asp Trp Val Ala Arg Gln Leu Val Glu Tyr His Asp Val Arg Ala Asp
405 410 415
Arg Ala Val Ala Leu Leu Lys Gln Lys Arg Gly Gln
420 425
<210> 19
<211> 1302
<212> DNA
<213> Silicibacter pomeroyi
<220>
<221> misc_feature
<222> (1)..(1302)
<223> Silicibacter pomeroyi hydroxymethylglutaryl-CoA reductase gene
sequence
<400> 19
atgacaggca agacgggtca catcgatggt ttgaactcgc gcattgaaaa gatgcgagat 60
ctcgaccccg cacaacggct ggtgcgcgtt gccgaggcgg cgggcctcga gcccgaggcg 120
atcagcgcgc tggcgggtaa cggcgccctg cccctctcgc tggccaacgg gatgatcgag 180
aacgtcatcg gcaaattcga actgccgctg ggcgtggcca cgaatttcac tgtgaacggc 240
cgcgactatc tgatcccgat ggcggtcgaa gagccctcgg tggtggcggc cgcgtcctat 300
atggcgcgta tcgcgcgcga gaatggcgga ttcaccgcgc atggcaccgc gcccttgatg 360
cgcgcccaga tccaggtggt cgggttgggt gatcccgagg gcgcccggca gcgtctcctc 420
gcccacaagg ccgcgttcat ggaggcggcg gacgctgtcg atccggtgct tgtcgggctg 480
ggtggcggct gccgcgatat cgaggttcac gtgttccggg atacgccggt gggcgcgatg 540
gtcgtcctgc acctgatcgt cgatgtgcgc gacgcgatgg gggccaatac ggtcaacacg 600
atggccgaac ggctggcccc cgaggtcgag cggattgccg gtggcaccgt gcggctgcgc 660
atcctgtcga acctcgccga cctgcgattg gtccgggcgc gggtggaact ggccccggaa 720
acactgacaa cgcagggcta tgacggcgcc gacgtggcgc ggggcatggt cgaggcctgc 780
gcgcttgcca tcgtcgaccc ctatcgcgcg gcgacccata acaaggggat catgaacggc 840
atcgacccgg tcgtcgtcgc caccggcaat gactggcgcg cgatcgaggc gggtgcccat 900
gcctatgccg cccgcacggg tcattatacc tcgctgaccc gctgggaact ggcgaatgac 960
gggcggcttg tgggcacgat cgaactgccc ctggcgcttg gccttgtcgg cggcgcgacc 1020
aagacgcacc cgaccgcacg ggcggcgctg gccctgatgc aggtagagac tgcaaccgaa 1080
ctggcccagg tcaccgccgc cgtgggtctg gcgcagaaca tggccgccat ccgcgcgctg 1140
gcgaccgaag gcatccagcg cggtcacatg acccttcatg cgcgcaacat cgcgatcatg 1200
gccggcgcaa caggcgccga tatcgaccgc gtcacccggg tcattgtcga agcgggcgac 1260
gtcagcgtgg cccgtgcaaa acaggtgctg gaaaacacct ga 1302
<210> 20
<211> 433
<212> PRT
<213> Silicibacter pomeroyi
<220>
<221> misc_feature
<222> (1)..(433)
<223> Silicibacter pomeroyi hydroxymethylglutaryl-CoA reductase protein
sequence
<400> 20
Met Thr Gly Lys Thr Gly His Ile Asp Gly Leu Asn Ser Arg Ile Glu
1 5 10 15
Lys Met Arg Asp Leu Asp Pro Ala Gln Arg Leu Val Arg Val Ala Glu
20 25 30
Ala Ala Gly Leu Glu Pro Glu Ala Ile Ser Ala Leu Ala Gly Asn Gly
35 40 45
Ala Leu Pro Leu Ser Leu Ala Asn Gly Met Ile Glu Asn Val Ile Gly
50 55 60
Lys Phe Glu Leu Pro Leu Gly Val Ala Thr Asn Phe Thr Val Asn Gly
65 70 75 80
Arg Asp Tyr Leu Ile Pro Met Ala Val Glu Glu Pro Ser Val Val Ala
85 90 95
Ala Ala Ser Tyr Met Ala Arg Ile Ala Arg Glu Asn Gly Gly Phe Thr
100 105 110
Ala His Gly Thr Ala Pro Leu Met Arg Ala Gln Ile Gln Val Val Gly
115 120 125
Leu Gly Asp Pro Glu Gly Ala Arg Gln Arg Leu Leu Ala His Lys Ala
130 135 140
Ala Phe Met Glu Ala Ala Asp Ala Val Asp Pro Val Leu Val Gly Leu
145 150 155 160
Gly Gly Gly Cys Arg Asp Ile Glu Val His Val Phe Arg Asp Thr Pro
165 170 175
Val Gly Ala Met Val Val Leu His Leu Ile Val Asp Val Arg Asp Ala
180 185 190
Met Gly Ala Asn Thr Val Asn Thr Met Ala Glu Arg Leu Ala Pro Glu
195 200 205
Val Glu Arg Ile Ala Gly Gly Thr Val Arg Leu Arg Ile Leu Ser Asn
210 215 220
Leu Ala Asp Leu Arg Leu Val Arg Ala Arg Val Glu Leu Ala Pro Glu
225 230 235 240
Thr Leu Thr Thr Gln Gly Tyr Asp Gly Ala Asp Val Ala Arg Gly Met
245 250 255
Val Glu Ala Cys Ala Leu Ala Ile Val Asp Pro Tyr Arg Ala Ala Thr
260 265 270
His Asn Lys Gly Ile Met Asn Gly Ile Asp Pro Val Val Val Ala Thr
275 280 285
Gly Asn Asp Trp Arg Ala Ile Glu Ala Gly Ala His Ala Tyr Ala Ala
290 295 300
Arg Thr Gly His Tyr Thr Ser Leu Thr Arg Trp Glu Leu Ala Asn Asp
305 310 315 320
Gly Arg Leu Val Gly Thr Ile Glu Leu Pro Leu Ala Leu Gly Leu Val
325 330 335
Gly Gly Ala Thr Lys Thr His Pro Thr Ala Arg Ala Ala Leu Ala Leu
340 345 350
Met Gln Val Glu Thr Ala Thr Glu Leu Ala Gln Val Thr Ala Ala Val
355 360 365
Gly Leu Ala Gln Asn Met Ala Ala Ile Arg Ala Leu Ala Thr Glu Gly
370 375 380
Ile Gln Arg Gly His Met Thr Leu His Ala Arg Asn Ile Ala Ile Met
385 390 395 400
Ala Gly Ala Thr Gly Ala Asp Ile Asp Arg Val Thr Arg Val Ile Val
405 410 415
Glu Ala Gly Asp Val Ser Val Ala Arg Ala Lys Gln Val Leu Glu Asn
420 425 430
Thr
<210> 21
<211> 1290
<212> DNA
<213> Delftia acidovorans
<220>
<221> misc_feature
<222> (1)..(1290)
<223> Delftia acidovorans hydroxymethylglutaryl-CoA reductase
nucleotide sequence
<400> 21
atggttgccg attcgcgact gcccaatttc cgcgccctca caccggccca gcgccgggat 60
ttcctggccg atgcctgcgg cctgtccgat gccgagcgcg ccctgctcgc tgcccccggt 120
gccctgcccc tggcgctggc cgacggcatg atcgagaacg tgttcggcag cttcgagctg 180
ccgctgggcg tggccggcaa cttccgcgtc aacggccgcg acgtgctggt gcccatggcg 240
gtggaggagc cctcggtggt ggccgccgcc tcgtacatgg ccaagctggc gcgcgaggac 300
gggggctttc agacctcaag cacgctgccg ctgatgcgcg cccaggtcca ggtgctgggc 360
gtgaccgatc cacacggcgc gcgcctggcc gtgctgcagg cgcgtgcgca gatcatcgag 420
cgcgccaaca gccgcgacaa ggtgctgatc ggcctgggcg gcggctgcaa ggacatcgag 480
gtccatgtct tccccgacac gccgcgcggc cccatgctgg tggtccacct gatcgtggac 540
gtgcgcgacg ccatgggcgc caacaccgtc aacaccatgg ccgaatcggt ggcgcccctg 600
gtcgagaaga tcacgggcgg cagcgtgcgg ctgcgcatcc tgtccaacct ggccgacctg 660
cggctggccc gcgcccgcgt gcggctcacg ccgcagaccc tggccacgca ggatcgcagc 720
ggcgaggaga tcatcgaagg cgtgctggac gcctatacct tcgcggccat cgacccctac 780
cgcgcggcca cgcacaacaa gggaatcatg aacggcatcg accccgtcat cgtggccacg 840
ggcaacgact ggcgcgcggt cgaggccggc gcccatgcct atgccagccg cagcggcagc 900
tacacctcgc tgacgcgctg ggaaaaggat gccggcggcg ccctggtcgg cagcatcgag 960
ctgcccatgc cggtgggcct tgtcggcggc gccaccaaga cccatccgct ggcacgcctg 1020
gcgctgaaga tcatggacct gcagtccgcc cagcagctgg gcgagatcgc cgccgccgtg 1080
ggcctggcgc agaacctggg cgccctgcgc gccctggcca ccgaaggcat tcagcgcggc 1140
cacatggccc tgcacgcccg caacatcgcc ctggtggccg gcgccacggg cgacgaggtc 1200
gatgccgtgg cgcgccagct ggccgccgag cacgacgtgc gcaccgaccg cgcgctggaa 1260
gtgctggccg cgctgcgcgc cagggcctga 1290
<210> 22
<211> 429
<212> PRT
<213> Delftia acidovorans
<220>
<221> misc_feature
<222> (1)..(429)
<223> Delftia acidovorans hydroxymethylglutaryl-CoA reductase protein
sequence
<400> 22
Met Val Ala Asp Ser Arg Leu Pro Asn Phe Arg Ala Leu Thr Pro Ala
1 5 10 15
Gln Arg Arg Asp Phe Leu Ala Asp Ala Cys Gly Leu Ser Asp Ala Glu
20 25 30
Arg Ala Leu Leu Ala Ala Pro Gly Ala Leu Pro Leu Ala Leu Ala Asp
35 40 45
Gly Met Ile Glu Asn Val Phe Gly Ser Phe Glu Leu Pro Leu Gly Val
50 55 60
Ala Gly Asn Phe Arg Val Asn Gly Arg Asp Val Leu Val Pro Met Ala
65 70 75 80
Val Glu Glu Pro Ser Val Val Ala Ala Ala Ser Tyr Met Ala Lys Leu
85 90 95
Ala Arg Glu Asp Gly Gly Phe Gln Thr Ser Ser Thr Leu Pro Leu Met
100 105 110
Arg Ala Gln Val Gln Val Leu Gly Val Thr Asp Pro His Gly Ala Arg
115 120 125
Leu Ala Val Leu Gln Ala Arg Ala Gln Ile Ile Glu Arg Ala Asn Ser
130 135 140
Arg Asp Lys Val Leu Ile Gly Leu Gly Gly Gly Cys Lys Asp Ile Glu
145 150 155 160
Val His Val Phe Pro Asp Thr Pro Arg Gly Pro Met Leu Val Val His
165 170 175
Leu Ile Val Asp Val Arg Asp Ala Met Gly Ala Asn Thr Val Asn Thr
180 185 190
Met Ala Glu Ser Val Ala Pro Leu Val Glu Lys Ile Thr Gly Gly Ser
195 200 205
Val Arg Leu Arg Ile Leu Ser Asn Leu Ala Asp Leu Arg Leu Ala Arg
210 215 220
Ala Arg Val Arg Leu Thr Pro Gln Thr Leu Ala Thr Gln Asp Arg Ser
225 230 235 240
Gly Glu Glu Ile Ile Glu Gly Val Leu Asp Ala Tyr Thr Phe Ala Ala
245 250 255
Ile Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met Asn Gly
260 265 270
Ile Asp Pro Val Ile Val Ala Thr Gly Asn Asp Trp Arg Ala Val Glu
275 280 285
Ala Gly Ala His Ala Tyr Ala Ser Arg Ser Gly Ser Tyr Thr Ser Leu
290 295 300
Thr Arg Trp Glu Lys Asp Ala Gly Gly Ala Leu Val Gly Ser Ile Glu
305 310 315 320
Leu Pro Met Pro Val Gly Leu Val Gly Gly Ala Thr Lys Thr His Pro
325 330 335
Leu Ala Arg Leu Ala Leu Lys Ile Met Asp Leu Gln Ser Ala Gln Gln
340 345 350
Leu Gly Glu Ile Ala Ala Ala Val Gly Leu Ala Gln Asn Leu Gly Ala
355 360 365
Leu Arg Ala Leu Ala Thr Glu Gly Ile Gln Arg Gly His Met Ala Leu
370 375 380
His Ala Arg Asn Ile Ala Leu Val Ala Gly Ala Thr Gly Asp Glu Val
385 390 395 400
Asp Ala Val Ala Arg Gln Leu Ala Ala Glu His Asp Val Arg Thr Asp
405 410 415
Arg Ala Leu Glu Val Leu Ala Ala Leu Arg Ala Arg Ala
420 425
<210> 23
<211> 5726
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: pAM70 plasmid
<400> 23
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataccac agcttttcaa ttcaattcat catttttttt ttattctttt ttttgatttc 240
ggtttctttg aaattttttt gattcggtaa tctccgaaca gaaggaagaa cgaaggaagg 300
agcacagact tagattggta tatatacgca tatgtagtgt tgaagaaaca tgaaattgcc 360
cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga taaatcatgt 420
cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct gccaagctat 480
ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt cgtaccacca 540
aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta aaaacacatg 600
tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag gcattatccg 660
ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt aatacagtca 720
aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt acgaatgcac 780
acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcagaa gaagtaacaa 840
aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc ctatctactg 900
gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt gttatcggct 960
ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg attatgacac 1020
ccggtgtggg tttagatgac aagggagacg cattgggtca acagtataga accgtggatg 1080
atgtggtctc tacaggatct gacattatta ttgttggaag aggactattt gcaaagggaa 1140
gggatgctaa ggtagagggt gaacgttaca gaaaagcagg ctgggaagca tatttgagaa 1200
gatgcggcca gcaaaactaa aaaactgtat tataagtaaa tgcatgtata ctaaactcac 1260
aaattagagc ttcaatttaa ttatatcagt tattacccta tgcggtgtga aataccgcac 1320
agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt ttgttaaaat 1380
tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa atcggcaaaa 1440
tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca gtttggaaca 1500
agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg 1560
gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg aggtgccgta 1620
aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg 1680
cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa 1740
gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg 1800
gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 1860
cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg 1920
taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag cgcgcgtaat 1980
acgactcact atagggcgaa ttgggtaccg ggccccccct cgaggtcgac ggtatcgata 2040
agcttgatat cgaattcctg cagcccgggg gatccactag ttctagagcg gccgccaccg 2100
cggtggagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca 2160
tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 2220
gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 2280
gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 2340
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 2400
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 2460
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 2520
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 2580
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 2640
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 2700
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 2760
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 2820
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 2880
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 2940
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3000
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3060
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3120
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3180
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 3240
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 3300
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 3360
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 3420
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 3480
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 3540
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 3600
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 3660
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 3720
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 3780
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 3840
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 3900
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 3960
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 4020
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 4080
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 4140
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 4200
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 4260
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga 4320
agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac 4380
aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca 4440
acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt 4500
caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt 4560
taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat 4620
ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc 4680
tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct 4740
attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa 4800
gctgcgggtg cattttttca agataaaggc atccccgatt atattctata ccgatgtgga 4860
ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat 4920
tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc 4980
gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta 5040
atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga 5100
aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt 5160
ttgagcaatg tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg 5220
cgtttttggt tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga 5280
agttcctata ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa 5340
aacgagcgct tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc 5400
acctatatct gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt 5460
ttatgcttaa atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac 5520
ctcctgtgat attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt 5580
tagctgttct atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat 5640
ttcctttgat attggatcat actaagaaac cattattatc atgacattaa cctataaaaa 5700
taggcgtatc acgaggccct ttcgtc 5726
<210> 24
<211> 8125
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: pAM01147 plasmid
<400> 24
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataccac agcttttcaa ttcaattcat catttttttt ttattctttt ttttgatttc 240
ggtttctttg aaattttttt gattcggtaa tctccgaaca gaaggaagaa cgaaggaagg 300
agcacagact tagattggta tatatacgca tatgtagtgt tgaagaaaca tgaaattgcc 360
cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga taaatcatgt 420
cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct gccaagctat 480
ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt cgtaccacca 540
aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta aaaacacatg 600
tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag gcattatccg 660
ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt aatacagtca 720
aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt acgaatgcac 780
acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcagaa gaagtaacaa 840
aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc ctatctactg 900
gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt gttatcggct 960
ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg attatgacac 1020
ccggtgtggg tttagatgac aagggagacg cattgggtca acagtataga accgtggatg 1080
atgtggtctc tacaggatct gacattatta ttgttggaag aggactattt gcaaagggaa 1140
gggatgctaa ggtagagggt gaacgttaca gaaaagcagg ctgggaagca tatttgagaa 1200
gatgcggcca gcaaaactaa aaaactgtat tataagtaaa tgcatgtata ctaaactcac 1260
aaattagagc ttcaatttaa ttatatcagt tattacccta tgcggtgtga aataccgcac 1320
agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt ttgttaaaat 1380
tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa atcggcaaaa 1440
tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca gtttggaaca 1500
agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg 1560
gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg aggtgccgta 1620
aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg 1680
cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa 1740
gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg 1800
gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 1860
cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg 1920
taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag cgcgcgtaat 1980
acgactcact atagggcgaa ttgggtaccg ggccccccct cgaggtcgac ggtatcgata 2040
agcttgatat cgaattcctg cagcccgggg gatccactag ttctagagcg gccgcttatt 2100
gcagaagatt agactttttt tgttgcaagt gggatgagct tggagcagga agaatacact 2160
atactggatc taaagagtac aatagatgga taagaatatt ggcagcgcaa aaaggcttca 2220
agcttacaca acacggttta tttcgaaata atatccttct cgaaagcttt aacgaacgca 2280
gaattttcga gttattaaac ttaaaatacg ctgaacccga acatagaaat atcgaatggg 2340
aaaaaaaaac tgcataaagg cattaaaaga ggagcgaatt tttttttaat aaaaatctta 2400
ataatcatta aaagataaat aatagtctat atatacgtat ataaataaaa aatattcaaa 2460
aaataaaata aactattatt ttagcgtaaa ggatggggaa agagaaaaga aaaaaattga 2520
tctatcgatt tcaattcaat tcaattcagt ggtgatggtg atgatgccct ttatcgtcat 2580
cgtccttata atcgaattcc tggcctctct tttgttttag aagtgcgacg gcacgatctg 2640
ctctgacatc gtgatattca actaattgtc tggcaaccca atcgacttcg tcgccccttg 2700
cacctgctac aaccgctata ttcctcgcat gcaaggccat gtgacccctt tgaatacctt 2760
cagttgctaa agccctcatt gcacccaaat tttgagcaag accaacagcc acagcgatct 2820
ctgccaaggc ttgggcagtt ttaactccta atattcttaa agataattga gccagagggt 2880
gggtcttcgt tgcaccacct actaatccaa ccggcatcgg catctccaga gtaccgacta 2940
aatgaccatt attatccttc tcccaagtag ttagagaacc ataatgtccg gacctacaag 3000
cgtacgcgtg agccccagcc tctacggctc tccaatcgtt accagtagca acaattagtg 3060
gatctatgcc gttcataata cctttattat gtgtagcggc tctgtatggg tcaacagcgg 3120
cgaaagcata agcgtctaga ataccttcaa tcacagcctc ccccgaaaat tccgctgttt 3180
ccaattgctg tggggttatt cttacttgtg cacgagctaa tcttagatca gctaaattag 3240
acaagatcct tagacgcact tgaccgccag taattgcctc cattaatggt gcgacggctt 3300
cagccattgt gtttactgtg ttcgccccca ttgcatcacg aacatctacg attaagtgag 3360
caactaacat aggtcctcta ggagtgtcag cgaatgtatg cacttcgatg tctctacaac 3420
caccacctaa cgaatttaac aattgatctt ttctattagc caattctatt atctcatctt 3480
ttcttctcaa caatgaaagt ctggcgttta aaggatcttg tataccaacg atttgtactt 3540
gagcatgcat aagtggggct gaactgctgg tggtgaaacc tccgttcgct cttgccaatt 3600
tagccatgta tgatgctgct gcaactatag atggttcctc aacgactagt gggaccaaaa 3660
catccctacc attaatttga aaattcgaag caacggcgta cggaagttcg aaagtaccta 3720
taacattttc gatcatacca ttagcgatgt ccataggcaa tgctccagcg ttggccaaca 3780
aagaaacgtc atcatggctt aatcccaata gttgtcctat gtgatctaaa cgagcagccg 3840
gactcaggtt tctgaatgct ggcaatctgc tatctaaaga catatgtttt gagggaatat 3900
tcaactgttt ttttttatca tgttgatgct ctgcataata atgcccataa atatttccga 3960
cctgctttta tatctttgct agccaaacta actgaacata gctacacatt attttcagct 4020
tggctatttt gtgaacactg tatagccagt ccttcggatc acggtcaaca gttgtccgag 4080
cgctttttgg accctttccc ttatttttgg gttaaggaaa atgacagaaa atatatctaa 4140
tgagccttcg ctcaacagtg ctccgaagta tagctttcca aaaggagagg caaagcaatt 4200
taagaatgta tgaacaaaat aaaggggaaa aattaccccc tctactttac caaacgaata 4260
ctaccaataa tatttacaac ttttccttat gattttttca ctgaagcgct tcgcaatagt 4320
tgtgagcgat atcaaaagta acgaaatgaa cttcgcggct cgtgctatat tcttgttgct 4380
accgtccata tctttccata gattttcaat ctttgatgtc tccatggtgg tacagagaac 4440
ttgtaaacaa ttcggtccct acatgtgagg aaattcgctg tgacacgcgg ccgccaccgc 4500
ggtggagctc cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgtaatcat 4560
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 4620
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 4680
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 4740
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 4800
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 4860
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 4920
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 4980
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5040
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5100
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5160
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5220
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5280
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5340
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5400
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5460
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 5520
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 5580
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 5640
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 5700
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 5760
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 5820
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 5880
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 5940
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6000
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6060
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6120
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6180
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6240
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6300
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6360
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 6420
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 6480
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 6540
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 6600
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 6660
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa 6720
gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 6780
aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 6840
cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc 6900
aaacaaagaa tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt 6960
accaacaaag aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt 7020
tttctaacaa agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct 7080
cttgataact ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta 7140
ttttctcttc cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag 7200
ctgcgggtgc attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat 7260
tgcgcatact ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt 7320
atgaacggtt tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg 7380
tattgttttc gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa 7440
tactagagat aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa 7500
aggtggatgg gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt 7560
tgagcaatgt ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc 7620
gtttttggtt ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa 7680
gttcctatac tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa 7740
acgagcgctt ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca 7800
cctatatctg cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt 7860
tatgcttaaa tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc 7920
tcctgtgata ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt 7980
agctgttcta tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt 8040
tcctttgata ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat 8100
aggcgtatca cgaggccctt tcgtc 8125
<210> 25
<211> 10881
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: ERG10-ERG13 integration construct
<400> 25
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240
ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300
ctagtaacgg ccgccagtgt gctggaattc gcccttaaat atgaccccca atatgagaaa 360
ttaaggctag attattctca ggaaaaagct tttcatcttg aaatgctgca attatgtcgg 420
gtcccatttc tccacactta gcatctctct tataatgccc acagactaag ttccaatctc 480
ttagaaaagt ttcaccctga aaccttgtaa gctttctatg atgcacttca tgaacctgtt 540
gggaagcctt ggccttaccg cttaaataat cctggaagga tagctttggt gcttgaatag 600
ctccttcatc taaaaaagat gcaaattcct cgatgtccgt ttccttaatt acataaagct 660
tcatgtcagg aataacaaaa aaataaagcc attcatcgtg ttgttttggc cttggaataa 720
attcattttg caaatgcacc gcatttatta gtattcctgg agaaccacct aaatgggagc 780
gcaatttact aatggcatta tatggccgat ttgtattagt atccaaatta tgattccatg 840
ctaccttcca tggttgagca aacctatcac ccggtgataa cagcaaaaca tgcttattgt 900
aattgggcgt tctatgagga agcttgatat gaggatctaa tggatcagtt tttgaaggca 960
gccttgcgtt tatttcttgg caataacagt ttgtttgatc attttgagca cgggtatgaa 1020
gatcaggaac gctaatatgt ttgaagctat gatggaagga tgcccgctgc tgcaaagttt 1080
tgacagttat acgtagcatt ttattttttg tgtcagtgca ccttctctca cttttctact 1140
aaggaaattt gatatttcaa atgtagtatg ctaataaata agaacacccg catgcacgaa 1200
aaagggaaat ttaaaactag ttaggtaaac aaagttcaga acaagaaatg atatggttgt 1260
tttacataga tatatactca gtattcgttt ttataacgtt cgctgcactg gggggtctaa 1320
ggcgcctgat tcaagaaata tcttgaccgc agttaactgt gggaatactc aggtatcgta 1380
agatgcaaga gttcgaatct cttagcaacc attatttttt tcctcaacat aacgagaaca 1440
cacaggggcg ctatcgcaca gaatcaaatt cgatgactgg aaattttttg ttaatttcag 1500
aggtcgcctg acgcatatac ctttttcaac tgaaaaattg ggagaaaaag gaaaggtgag 1560
agcgccggaa ccggcttttc atatagaata gagaagcgtt catgactaaa tgcttgcatc 1620
acaatacttg aagttgacaa tattatttaa ggacctattg ttttttccaa taggtggtta 1680
gcaatcgtct tactttctaa cttttcttac cttttacatt tcagcaatat atatatatat 1740
atttcaagga tataccattc taatgtctgc ccctaagaag atcgtcgttt tgccaggtga 1800
ccacgttggt caagaaatca cagccgaagc cattaaggtt cttaaagcta tttctgatgt 1860
tcgttccaat gtcaagttcg atttcgaaaa tcatttaatt ggtggtgctg ctatcgatgc 1920
tacaggtgtt ccacttccag atgaggcgct ggaagcctcc aagaaggctg atgccgtttt 1980
gttaggtgct gtgggtggtc ctaaatgggg taccggtagt gttagacctg aacaaggttt 2040
actaaaaatc cgtaaagaac ttcaattgta cgccaactta agaccatgta actttgcatc 2100
cgactctctt ttagacttat ctccaatcaa gccacaattt gctaaaggta ctgacttcgt 2160
tgttgtcaga gaattagtgg gaggtattta ctttggtaag agaaaggaag acgatggtga 2220
tggtgtcgct tgggatagtg aacaatacac cgttccagaa gtgcaaagaa tcacaagaat 2280
ggccgctttc atggccctac aacatgagcc accattgcct atttggtcct tggataaagc 2340
taatgttttg gcctcttcaa gattatggag aaaaactgtg gaggaaacca tcaagaacga 2400
attccctaca ttgaaggttc aacatcaatt gattgattct gccgccatga tcctagttaa 2460
gaacccaacc cacctaaatg gtattataat caccagcaac atgtttggtg atatcatctc 2520
cgatgaagcc tccgttatcc caggttcctt gggtttgttg ccatctgcgt ccttggcctc 2580
tttgccagac aagaacaccg catttggttt gtacgaacca tgccacggtt ctgctccaga 2640
tttgccaaag aataaggtca accctatcgc cactatcttg tctgctgcaa tgatgttgaa 2700
attgtcattg aacttgcctg aagaaggtaa ggccattgaa gatgcagtta aaaaggtttt 2760
ggatgcaggt atcagaactg gtgatttagg tggttccaac agtaccaccg aagtcggtga 2820
tgctgtcgcc gaagaagtta agaaaatcct tgcttaaaaa gattctcttt ttttatgata 2880
tttgtacata aactttataa atgaaattca taatagaaac gacacgaaat tacaaaatgg 2940
aatatgttca tagggtagac gaaactatat acgcaatcta catacattta tcaagaagga 3000
gaaaaaggag gatgtaaagg aatacaggta agcaaattga tactaatggc tcaacgtaaa 3060
agtaagtcaa aaggcacacc tcagcgtttg agtacctgaa aaacgatgaa tcgcaaataa 3120
aactttaaat tatgcctgtt atacataaag ccatttatat atttatgtat tttatgaaaa 3180
agatcatgag aaaatcgcag aacgtaatca tatcttttca atgacaatag aggaagcacc 3240
accaccacca ttacaaatgg cggcaacacc gatcttacct ccttcttgct gtaagatgga 3300
tagcagtgta acaaccactc tagcaccaga acaacccaat gggtgaccta gagcaacagc 3360
accaccatat acattaacct tagatgggtc tagcttcaaa atcttagtgt tcaccaaacc 3420
gacaaccgaa aaggcttcat tgaattcaaa gtaatcaaca gaattgatgt cttcgatgcc 3480
agcatgtttc aaagcctttg gaactgcaag agatggagcc catgtaaaat cagctggttg 3540
atgagcggcc tcaccccaac ctttgataat agccaaaggc ttcaaattct tttccttcaa 3600
aactttttcg gaaaccaaga tgacggctgc agcaccatcg ttgattggag aagcgttagc 3660
ggcagtaaca gtaccgtttt ctttttggaa aacagtcctt gcagatctca atttttcaac 3720
gtgtaatcta gcaggttcct cgtccttcgt gacttgagta tcaggcttac ctctaaatcc 3780
cttaatggta acaggtacaa tttcattgtc gaatttacct tccttttgag atttttgaga 3840
tttttggtag gattcgatgg caaaattgtc ttgttgttct ctagtaatat cccaatcacg 3900
ggcacacttt tctgcgtgta cacccatggc tagaccatcg tacgcatcgt tcaacccatc 3960
tctttcgaca ccatcaacaa gaacagtttg gccaaatttg gcacccgcac gggctgctgg 4020
catgtagtat ggtgcgttag tcatagattc acaaccacca gctacgacaa catcagcatt 4080
accacatttg atggattgag cacccaaaat gattgccttc atagcggatg cacagacctt 4140
gttaactgtg cttgcaacga tatgattact caaaccggca gccaaagcaa cttgtctggc 4200
cggagcttgg cccaaattgg cagaaagaac gttaccaaaa ataatttcgt caaaatcctt 4260
ggatgcatcc aattctggaa ccttagccaa ggcgcctttt aaagcaacag cacccaattc 4320
cactgctgtc ttggaggata gagaaccctg gaatgaacca attggggttc tggcagtcga 4380
tacaatgtaa acgttctgag acattatagt tttttctcct tgacgttaaa gtatagaggt 4440
atattaacaa ttttttgttg atacttttat gacatttgaa taagaagtaa tacaaaccga 4500
aaatgttgaa agtattagtt aaagtggtta tgcagctttt gcatttatat atctgttaat 4560
agatcaaaaa tcatcgcttc gctgattaat taccccagaa ataaggctaa aaaactaatc 4620
gcattattat cctatggttg ttaatttgat tcgttgattt gaaggtttgt ggggccaggt 4680
tactgccaat ttttcctctt cataaccata aaagctagta ttgtagaatc tttattgttc 4740
ggagcagtgc ggcgcgaggc acatctgcgt ttcaggaacg cgaccggtga agaccaggac 4800
gcacggagga gagtcttccg tcggagggct gtcgcccgct cggcggcttc taatccgtac 4860
ttcaatatag caatgagcag ttaagcgtat tactgaaagt tccaaagaga aggttttttt 4920
aggctaagat aatggggctc tttacatttc cacaacatat aagtaagatt agatatggat 4980
atgtatatgg tggtattgcc atgtaatatg attattaaac ttctttgcgt ccatccaaaa 5040
aaaaagtaag aatttttgaa aattcaatat aaatgaaact ctcaactaaa ctttgttggt 5100
gtggtattaa aggaagactt aggccgcaaa agcaacaaca attacacaat acaaacttgc 5160
aaatgactga actaaaaaaa caaaagaccg ctgaacaaaa aaccagacct caaaatgtcg 5220
gtattaaagg tatccaaatt tacatcccaa ctcaatgtgt caaccaatct gagctagaga 5280
aatttgatgg cgtttctcaa ggtaaataca caattggtct gggccaaacc aacatgtctt 5340
ttgtcaatga cagagaagat atctactcga tgtccctaac tgttttgtct aagttgatca 5400
agagttacaa catcgacacc aacaaaattg gtagattaga agtcggtact gaaactctga 5460
ttgacaagtc caagtctgtc aagtctgtct tgatgcaatt gtttggtgaa aacactgacg 5520
tcgaaggtat tgacacgctt aatgcctgtt acggtggtac caacgcgttg ttcaactctt 5580
tgaactggat tgaatctaac gcatgggatg gtagagacgc cattgtagtt tgcggtgata 5640
ttgccatcta cgataagggt gccgcaagac caaccggtgg tgccggtact gttgctatgt 5700
ggatcggtcc tgatgctcca attgtatttg actctgtaag agcttcttac atggaacacg 5760
cctacgattt ttacaagcca gatttcacca gcgaatatcc ttacgtcgat ggtcattttt 5820
cattaacttg ttacgtcaag gctcttgatc aagtttacaa gagttattcc aagaaggcta 5880
tttctaaagg gttggttagc gatcccgctg gttcggatgc tttgaacgtt ttgaaatatt 5940
tcgactacaa cgttttccat gttccaacct gtaaattggt cacaaaatca tacggtagat 6000
tactatataa cgatttcaga gccaatcctc aattgttccc agaagttgac gccgaattag 6060
ctactcgcga ttatgacgaa tctttaaccg ataagaacat tgaaaaaact tttgttaatg 6120
ttgctaagcc attccacaaa gagagagttg cccaatcttt gattgttcca acaaacacag 6180
gtaacatgta caccgcatct gtttatgccg cctttgcatc tctattaaac tatgttggat 6240
ctgacgactt acaaggcaag cgtgttggtt tattttctta cggttccggt ttagctgcat 6300
ctctatattc ttgcaaaatt gttggtgacg tccaacatat tatcaaggaa ttagatatta 6360
ctaacaaatt agccaagaga atcaccgaaa ctccaaagga ttacgaagct gccatcgaat 6420
tgagagaaaa tgcccatttg aagaagaact tcaaacctca aggttccatt gagcatttgc 6480
aaagtggtgt ttactacttg accaacatcg atgacaaatt tagaagatct tacgatgtta 6540
aaaaataatc ttcccccatc gattgcatct tgctgaaccc ccttcataaa tgctttattt 6600
ttttggcagc ctgctttttt tagctctcat ttaatagagt agttttttaa tctatatact 6660
aggaaaactc tttatttaat aacaatgata tatatataga cgggagtgga aagaacggga 6720
aaccaactat cgagattgta tacgctggtc ggcaaggacc agcagtgaca tgtgatgtat 6780
atatattcag gttcaaaaaa aaaagttatg agcttttggt tattatgaat gtagcagaca 6840
ttttgaggtc gttcgggcga gagtgcgccg gtaaatgaag aaaatatagg atattattaa 6900
tattagaatt aaactattat attgcagggg agagaagaaa ggggtataaa tatatattac 6960
aaagcggaaa acttgcgcca tttaaacaga gacatcgtcc gggcgctcgt gtgattttct 7020
tatagtgaag aagttaatac ctttaggttg gttttccgta gcagcagtgg cagtgaccgg 7080
attagcattg gaagaaggcc ccactatgct tgcactttgt tgcatgtctt caggtccagt 7140
ggcagtcaat attgggtcag ttgcttgctc cttctctcta tggaagggat tccatctgga 7200
ggaggttctg tatcttgaat tgtcgatgga gtaagtagag gccaaccttg ccctaacaga 7260
ccagaagacc agcaggataa attccacgat acataaaaag acacttgccc aagccatacc 7320
catcatagag gcacccaatt gggcactacg atgatcgtca tggaaagcat tctttgccat 7380
ggcagaggcg gccgtttgca agacaacggc tgccgtattg aagacaaacc caaaagacat 7440
gaggataagc accatctctg aaagcatctt cgagcaccaa gtcaaaacgt aaaggataaa 7500
cgacacacct acaaaggcaa gcgcaatcca aaagaaacaa aatgaaaatc tagtcaggta 7560
gtaaaaagcg tctcttttgg aaataaactg gtgagggaca ttgatgtgtg tgttgaagtt 7620
atctactggg gaaatggggt atgcaggtgc caaattgctt gtgcaggtat ccgacccgtc 7680
tttatcctgt agacaggcaa gggcgaattc tgcagatatc catcacactg gcggccgctc 7740
gagcatgcat ctagagggcc caattcgccc tatagtgagt cgtattacaa ttcactggcc 7800
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 7860
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 7920
caacagttgc gcagcctata cgtacggcag tttaaggttt acacctataa aagagagagc 7980
cgttatcgtc tgtttgtgga tgtacagagt gatattattg acacgccggg gcgacggatg 8040
gtgatccccc tggccagtgc acgtctgctg tcagataaag tctcccgtga actttacccg 8100
gtggtgcata tcggggatga aagctggcgc atgatgacca ccgatatggc cagtgtgccg 8160
gtctccgtta tcggggaaga agtggctgat ctcagccacc gcgaaaatga catcaaaaac 8220
gccattaacc tgatgttctg gggaatataa atgtcaggca tgagattatc aaaaaggatc 8280
ttcacctaga tccttttcac gtagaaagcc agtccgcaga aacggtgctg accccggatg 8340
aatgtcagct actgggctat ctggacaagg gaaaacgcaa gcgcaaagag aaagcaggta 8400
gcttgcagtg ggcttacatg gcgatagcta gactgggcgg ttttatggac agcaagcgaa 8460
ccggaattgc cagctggggc gccctctggt aaggttggga agccctgcaa agtaaactgg 8520
atggctttct cgccgccaag gatctgatgg cgcaggggat caagctctga tcaagagaca 8580
ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 8640
tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 8700
gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 8760
ggtgccctga atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc 8820
gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 8880
ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 8940
atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 9000
caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 9060
caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 9120
aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 9180
aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 9240
gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 9300
gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 9360
gccttctatc gccttcttga cgagttcttc tgaattatta acgcttacaa tttcctgatg 9420
cggtattttc tccttacgca tctgtgcggt atttcacacc gcatacaggt ggcacttttc 9480
ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 9540
cgctcatgag acaataaccc tgataaatgc ttcaataata gcacgtgagg agggccacca 9600
tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg 9660
agttctggac cgaccggctc gggttctccc gggacttcgt ggaggacgac ttcgccggtg 9720
tggtccggga cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca 9780
acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag tggtcggagg 9840
tcgtgtccac gaacttccgg gacgcctccg ggccggccat gaccgagatc ggcgagcagc 9900
cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg 9960
aggagcagga ctgacacgtg ctaaaacttc atttttaatt taaaaggatc taggtgaaga 10020
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 10080
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 10140
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 10200
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 10260
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 10320
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 10380
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 10440
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 10500
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 10560
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 10620
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 10680
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctgggctttt 10740
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 10800
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 10860
cagtgagcga ggaagcggaa g 10881
<210> 26
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_001
<400> 26
gcctgtctac aggataaaga cggg 24
<210> 27
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_002
<400> 27
tcccgttctt tccactcccg tctatatata tatcattgtt atta 44
<210> 28
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_003
<400> 28
taataacaat gatatatata tagacgggag tggaaagaac ggga 44
<210> 29
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_004
<400> 29
ccaacaaagt ttagttgaga gtttcattta tattgaattt tcaaaaattc ttac 54
<210> 30
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_005
<400> 30
gtaagaattt ttgaaaattc aatataaatg aaactctcaa ctaaactttg ttgg 54
<210> 31
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_006
<400> 31
gtcaaggaga aaaaactata atgtctcaga acgtttacat tgtatcgact gccagaaccc 60
<210> 32
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_007
<400> 32
gggttctggc agtcgataca atgtaaacgt tctgagacat tatagttttt tctccttgac 60
<210> 33
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_008
<400> 33
gtgtgccttt tgacttactt ttacgttgag ccattagtat ca 42
<210> 34
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_009
<400> 34
tgatactaat ggctcaacgt aaaagtaagt caaaaggcac ac 42
<210> 35
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_010
<400> 35
gatatttctt gaatcaggcg ccttagaccc cccagtgcag cgaacgttat aaaaac 56
<210> 36
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_36_011
<400> 36
gtttttataa cgttcgctgc actggggggt ctaaggcgcc tgattcaaga aatatc 56
<210> 37
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: Linker YT_164_36_012
<400> 37
aaatatgacc cccaatatga gaaattaagg c 31
<210> 38
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_30_Gal3F
<400> 38
gagctcgcgg ccgcgtacat acctctctcc gtatcctcgt aatcattttc ttgt 54
<210> 39
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_30_Gal3R
<400> 39
catatgacta tgtgttgccc taccttttta cttttatttt ctcttt 46
<210> 40
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_30_Gal7F
<400> 40
gagctcgcgg ccgcgtgtca cagcgaattt cctcacatgt agggaccgaa ttgt 54
<210> 41
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic primer YT_164_30_Gal7R
<400> 41
catatgtttt gagggaatat tcaactgttt ttttttatca tgttga 46
<210> 42
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: RYSE Linker 0
<400> 42
gacggcacgg ccacgcgttt aaaccgcc 28
<210> 43
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: RYSE Linker 19
<400> 43
cccgccaggc gctggggttt aaacacc 27
<210> 44
<211> 2738
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: Kan A-ADH1 disruption construct
<400> 44
gacggcacgg ccacgcgttt aaaccgccaa tgggctaaac aagactacac caattacact 60
gcctcattga tggtggtaca taacgaacta atactgtagc cctagacttg atagccatca 120
tcatatcgaa gtttcactac cctttttcca tttgccatct attgaagtaa taataggcgc 180
atgcaacttc ttttcttttt ttttcttttc tctctccccc gttgttgtct caccatatcc 240
gcaatgacaa aaaaatgatg gaagacacta aaggaaaaaa ttaacgacaa agacagcacc 300
aacagatgtc gttgttccag agctgatgag gggtatctcg aagcacacga aactttttcc 360
ttccttcatt cacgcacact actctctaat gagcaacggt atacggcctt ccttccagtt 420
acttgaattt gaaataaaaa aaagtttgct gtcttgctat caagtataaa tagacctgca 480
attattaatc ttttgtttcc tcgtcattgt tctcgctcac acgcggccag ggggagcctc 540
gacactagta atacacatca tcgtcctaca agttcatcaa agtgttggac agacaactat 600
accagcatgg atctcttgta tcggttcttt tctcccgctc tctcgcaata acaatgaaca 660
ctgggtcaat catagcctac acaggtgaac agagtagcgt ttatacaggg tttatacggt 720
gattcctacg gcaaaaattt ttcatttcta aaaaaaaaaa gaaaaatttt tctttccaac 780
gctagaagga aaagaaaaat ctaattaaat tgatttggtg attttctgag agttcccttt 840
ttcatatatc gaattttgaa tataaaagga gatcgaaaaa atttttctat tcaatctgtt 900
ttctggtttt atttgatagt ttttttgtgt attattatta tggattagta ctggtttata 960
tgggtttttc tgtataactt ctttttattt tagtttgttt aatcttattt tgagttacat 1020
tatagttccc taactgcaag agaagtaaca ttaaaaatgg gtaaggaaaa gactcacgtt 1080
tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 1140
gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 1200
gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 1260
agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 1320
cctgatgatg catggttact caccactgcg atccccggca aaacagcatt ccaggtatta 1380
gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 1440
ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 1500
caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 1560
aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 1620
gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 1680
ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 1740
atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 1800
tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 1860
ttctaagttt aacttgatac tactagattt tttctcttca tttataaaat ttttggttat 1920
aattgaagct ttagaagtat gaaaaaatcc ttttttttca ttctttgcaa ccaaaataag 1980
aagcttcttt tattcattga aatgatgaat ataaacctaa caaaagaaaa agactcgaat 2040
atcaaacatt aaaaaaaaat aaaagaggtt atctgttttc ccatttagtt ggagtttgca 2100
ttttctaata gatagaactc tcaattaatg tggatttagt ttctctgttc gttttttttt 2160
gttttgttct cactgtattt acatttctat ttagtattta gttattcata taatcttaac 2220
ttctcgagga gctccgctcg tccaacgccg gcggaccttt taaaacgaaa attcttattc 2280
ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 2340
attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 2400
caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 2460
ctcagaggac aacacctgtt gtaatcgttc ttccacacgg atccacagcc tagccttcag 2520
ttgggctcta tcttcatcgt cattcattgc atctactagc cccttacctg agcttcaaga 2580
cgttatatcg cttttatgta tcatgatctt atcttgagat atgaatacat aaatatattt 2640
actcaagtgt atacgtgcat gcttttttta cggcagcatt tttttttcaa ctctgatcgc 2700
ccctttactg cggtgtttaa accccagcgc ctggcggg 2738
<210> 45
<211> 3059
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i2235 integration construct
<400> 45
gacggcacgg ccacgcgttt aaaccgcctc gatatttcct gtgagaagtt taaatccact 60
aaggtttttc attgttgctg cagatgtgtt tttccattca tcctgaaata tgcactgcta 120
ttccgcattc cattccccta gtctttttta gttctttccg ttcgaccttc atcgaaaaat 180
gacaaaacgc gttaggaaca acaaccaatt gcaaacaagc agtgaaacaa aaccatcaag 240
gcccgaaaat acaagtgtgt actaatacag taagtaggtc aaatacgcaa tgaccaaaga 300
tgccgtgaat ctagatgctt acaccgtgag cttcatgcct ttctataccg agtatcaagg 360
accaaccgaa gagtttaagg attacaaatt cgaagatact atttactttc gtggcaagga 420
actgaagagg gaaaagtctg cgacgccttc cagtagcgat aacacaacta gtaatacctt 480
cagtaatggc gccatcctct cgggaaacac aataactggc aagatagttt cagtgaataa 540
ttacgaaaga gagggcactg atcgcaacga attggcgcga ttgcaagaat tgatctccct 600
catcgatgtc ataaatcagt aaatataagc tcacacgcgg ccagggggag cccgttgagc 660
cattagtatc aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat 720
aaatgtatgt agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa 780
tttcgtgtcg tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa 840
aagagaatct ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc 900
ggtggtactg ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt 960
aactgcatct tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat 1020
tgcagcagac aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga 1080
accgtggcat ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga 1140
cgcagatggc aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc 1200
accaaacatg ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat 1260
catggcggca gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat 1320
ggtttcctcc acagtttttc tccataatct tgaagaggcc aaaacattag ctttatccaa 1380
ggaccaaata ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat 1440
tctttgcact tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc 1500
ttcctttctc ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt 1560
acctttagca aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt 1620
acatggtctt aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc 1680
aggtctaaca ctaccggtac cccatttagg accacccaca gcacctaaca aaacggcatc 1740
aaccttcttg gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc 1800
agcaccacca attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat 1860
agctttaaga accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa 1920
aacgacgatc ttcttagggg cagacatagg ggcagacatt agaatggtat atccttgaaa 1980
tatatatata tattgctgaa atgtaaaagg taagaaaagt tagaaagtaa gacgattgct 2040
aaccacctat tggaaaaaac aataggtcct taaataatat tgtcaacttc aagtattgtg 2100
atgcaagcat ttagtcatga acgcttctct attctatatg aaaagccggt tccggcctct 2160
cacctttcct ttttctccca atttttcagt tgaaaaaggt atatgcgtca ggcgacctct 2220
gaaattaaca aaaaatttcc agtcatcgaa tttgattctg tgcgatagcg cccctgtgtg 2280
ttctcgttat gttgaggaaa aaaataatgg ttgctaagag attcgaactc ttgcatctta 2340
cgatacctga gtattcccac agttaactgc ggtcaagata tttcttgaat caggcgcctc 2400
gctcgtccaa cgccggcgga cctcttaaat gagaaaaatt tcgtaatgag ataaaatttc 2460
gctccttttc tgttttctat tttctatttt cccaactttt gctctattca gttataaatt 2520
actatttatc catcagttaa aaaacaagat cttttactgg tcagctagga aagcgaaaat 2580
acaaagactt tatgcactta gtgatatata tgtatagata tatccatttt tacgcactta 2640
tcatatatct tagttatcta aatacaatct agttattcgt acacaatcgc ccctgttatc 2700
cctatagtgg gaataaagta atgcactgtg acggggttct tcgcccggga tagggtaaaa 2760
ggatattgcc gtttcaagaa acttcgggga taatcgaata agataccgag aaagctattg 2820
ttcgttgtgc acgtaggatg tatattgaac aagcatgacc agaatctgat gcattacgag 2880
aaggttacgg gatgatatca gacctccgaa gtccatgttg caaaatgtgc cgactttccg 2940
cggcgctatt tggcacaaat ttcaggagaa acatcactgt cggtgttata gaattccatc 3000
tatattgttt tccccgtagg catacgtcga gcggtgttta aaccccagcg cctggcggg 3059
<210> 46
<211> 8106
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i74804 integration construct
<400> 46
gacggcacgg ccacgcgttt aaaccgcccg ctcgcctcat ccccacggga ataaggcagc 60
cgacaaaaga aaaacgaccg aaaaggaacc agaaagaaaa aagagggtgg gcgcgccgcg 120
gacgtgtaaa aagatatgca tccagcttct atatcgcttt aactttaccg ttttgggcat 180
cgggaacgta tgtaacattg atctcctctt gggaacggtg agtgcaacga atgcgatata 240
gcaccgacca tgtgggcaaa ttcgtaataa attcggggtg agggggattc aagacaagca 300
accttgttag tcagctcaaa cagcgattta acggttgagt aacacatcaa aacaccgttc 360
gaggtcaagc ctggcgtgtt taacaagttc ttgatatcat atataaatgt aataagaagt 420
ttggtaatat tcaattcgaa gtgttcagtc ttttacttct cttgttttat agaagaaaaa 480
acatcaagaa acatctttaa catacacaaa cacatactat cagaatacac gctcgtccaa 540
cgccggcgga cctttcagac gcgactgcct catcagtaag acccgttgaa aagaacttac 600
ctgaaaaaaa cgaatatata ctagcgttga atgttagcgt caacaacaag aagtttaatg 660
acgcggaggc caaggcaaaa agattccttg attacgtaag ggagttagaa tcattttgaa 720
taaaaaacac gctttttcag ttcgagttta tcattatcaa tactgccatt tcaaagaata 780
cgtaaataat taatagtagt gattttccta actttattta gtcaaaaaat tagcctttta 840
attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 900
cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 960
tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 1020
accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 1080
caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 1140
aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 1200
ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 1260
ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 1320
tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 1380
gaacttagtt tcgacctccc gcgacctcca aaatcgaact accttcacaa tggaacattc 1440
tgtaatcgaa ccaactgtgc ccatgccgct accagccatg tttgacgctc catctggtat 1500
ttttagctct ttggacgacg ctgtgcaagc agccacctta gcccaacaac aactaagttc 1560
agttgagttg cgtcagcaag taatcaaagc cataagagtg gccggagaaa ggtatgcaca 1620
agttttggct gaaatggcag ttgctgaaac tggtatgggt agggtggtgg ataagtacat 1680
taagaatgtc tctcaagctc gtcatacgcc tggtatagaa tgtttatcgg ccgaggttct 1740
tacgggtgat aatggcctaa cattgattga aaatgcccct tggggagtcg tagcttcagt 1800
cacgccaagc acaaatccag cagctacggt aattaataat gcaatctcaa tgattgcagc 1860
ggggaattca gtcgtgttcg caccacatcc ttctgccaaa aacgtctcac taaggactat 1920
ttctttactc aacaaggcca ttgtcgctac cggcggccca gaaaatttac tagttagtgt 1980
ggcaaaccct aacatcgaaa ctgcacagag attattcaga tatccgggta ttggattgtt 2040
agttgtgaca ggtggtgaag ccgtcgttga agccgctagg aagcatacag ataaaaggtt 2100
aattgcagcc ggcgctggta atcctcctgt tgttgtggac gaaactgctg acatacctaa 2160
agccgcaaga gcaattgtca agggtgcttc tttcgacaac aacataattt gtgctgatga 2220
aaaagttttg attgtggtag acagagttgc agatgcacta ttggcagaaa tgcaaagaaa 2280
taacgccgtc ttacttacac ccgaacagac cgaaagacta ctacccgctc ttttgtccga 2340
tattgacgaa cagggcaaag gacgtgtgaa tagagattat gttggaagag atgcggctaa 2400
attagcagcg gctattggtc tggaagttag cgaacatact cgtctactcc tggcagagac 2460
agacgctgat catccattcg ccgtgacgga gctgatgatg ccagtgttac cagtaataag 2520
agtcaagaat gtagatgatg caatcgcatt ggcagttaag ctagagtcag gctgcagaca 2580
cacagctgcg atgcactcta ctaatataag aaacttaaat agaatggcta atgccatcaa 2640
tacctctatc tttgtaaaaa atggtccatg tattgcaggt ttgggtttag gcggtgaagg 2700
ttggacttca atgactatta gcactccgac cggtgaaggt gttacaagcg ctcgtacctt 2760
tgtcagatta agaaggtgtg tcttagtcga catgtttcgg attgcttaag cggccgcgag 2820
taataattat tgcttccata taatattttt atatacctct tatttttatg tattagttaa 2880
ttaagtattt ttatctatct gcttatcatt ttcttttcat ataggggggg ttggtgtttt 2940
cttgcccatc agattgatgt cctccaactc ggcactattt tacaaagggt ttttttgtaa 3000
gagaaggaga agacagatac taaaccatac gttactcgaa acaaaaaaaa aaaaaatgga 3060
aaaagctgct atcaacaaaa gacggcctca tcaaacctaa agaaaccatg tcagcgtatg 3120
tatatacctt gtaatttacg tttccttaaa tcttctttct actaacgttt tcattattct 3180
atactctatg accaataaaa acagactgta ctttcaaaat ttacccagta ggccagcaaa 3240
taaagaaaat tataccagat tacttctgaa acacattaat cccaacaaca agtatgccat 3300
taatccgtcg ctaccccatc cccgcgtgct tggccggccg tacactgagt aatggtagtt 3360
ataagaaaga gaccgagtta gggacagtta gaggcggtgg agatattcct tatggcatgt 3420
ctggcgatga taaaactttt caaacggcag ccccgatcta aaagagctga cagggaaatg 3480
gtcagaaaaa gaaacgtgca cccgcccgtc tggacgcgcc gctcacccgc acggcagaga 3540
ccaatcagta aaaatcaacg gttaacgaca ttactatata tataatatag gaagcattta 3600
atagaacagc atcgtaatat atgtgtactt tgcagttatg acgccagatg gcagtagtgg 3660
aagatattct ttattgaaaa atagcttgtc accttacgta caatcttgat ccggagcttt 3720
tctttttttg ccgattaaga attcggtcga aaaaagaaaa ggagagggcc aagagggagg 3780
gcattggtga ctattgagca cgtgagtata cgtgattaag cacacaaagg cagcttggag 3840
tatgtctgtt attaatttca caggtagttc tggtccattg gtgaaagttt gcggcttgca 3900
gagcacagag gccgcagaat gtgctctaga ttccgatgct gacttgctgg gtattatatg 3960
tgtgcccaat agaaagagaa caattgaccc ggttattgca aggaaaattt caagtcttgt 4020
aaaagcatat aaaaatagtt caggcactcc gaaatacttg gttggcgtgt ttcgtaatca 4080
acctaaggag gatgttttgg ctctggtcaa tgattacggc attgatatcg tccaactgca 4140
tggagatgag tcgtggcaag aataccaaga gttcctcggt ttgccagtta ttaaaagact 4200
cgtatttcca aaagactgca acatactact cagtgcagct tcacagaaac ctcattcgtt 4260
tattcccttg tttgattcag aagcaggtgg gacaggtgaa cttttggatt ggaactcgat 4320
ttctgactgg gttggaaggc aagagagccc cgaaagctta cattttatgt tagctggtgg 4380
actgacgcca gaaaatgttg gtgatgcgct tagattaaat ggcgttattg gtgttgatgt 4440
aagcggaggt gtggagacaa atggtgtaaa agactctaac aaaatagcaa atttcgtcaa 4500
aaatgctaag aaataggtta ttactgagta gtatttattt aagtattgtt tgtgcacttg 4560
cctgcaggcc ttttgaaaag caagcataaa agatctaaac ataaaatctg taaaataaca 4620
agatgtaaag ataatgctaa atcatttggc tttttgattg attgtacagg aaaatataca 4680
tcgcaggggg ttgactttta ccatttcacc gcaatggaat caaacttgtt gaagagaatg 4740
ttcacaggcg catacgctac aatgacacgg ccggccaagc acgcggggat ggggtagcga 4800
cggattaatg gcatacttgt tgttgggatt aatgtgtttc agaagtaatc tggtataatt 4860
ttctttattt gctggcctac tgggtaaatt ttgaaagtac agtctgtttt tattggtcat 4920
agagtataga ataatgaaaa cgttagtaga aagaagattt aaggaaacgt aaattacaag 4980
gtatatacat acgctgacat ggtttcttta ggtttgatga ggccgtcttt tgttgatagc 5040
agctttttcc attttttttt tttttgtttc gagtaacgta tggtttagta tctgtcttct 5100
ccttctctta caaaaaaacc ctttgtaaaa tagtgccgag ttggaggaca tcaatctgat 5160
gggcaagaaa acaccaaccc cccctatatg aaaagaaaat gataagcaga tagataaaaa 5220
tacttaatta actaatacat aaaaataaga ggtatataaa aatattatat ggaagcaata 5280
attattactc gcggccgctt aagcaatccg aaacatgtcg actaagacac accttcttaa 5340
tctgacaaag gtacgagcgc ttgtaacacc ttcaccggtc ggagtgctaa tagtcattga 5400
agtccaacct tcaccgccta aacccaaacc tgcaatacat ggaccatttt ttacaaagat 5460
agaggtattg atggcattag ccattctatt taagtttctt atattagtag agtgcatcgc 5520
agctgtgtgt ctgcagcctg actctagctt aactgccaat gcgattgcat catctacatt 5580
cttgactctt attactggta acactggcat catcagctcc gtcacggcga atggatgatc 5640
agcgtctgtc tctgccagga gtagacgagt atgttcgcta acttccagac caatagccgc 5700
tgctaattta gccgcatctc ttccaacata atctctattc acacgtcctt tgccctgttc 5760
gtcaatatcg gacaaaagag cgggtagtag tctttcggtc tgttcgggtg taagtaagac 5820
ggcgttattt ctttgcattt ctgccaatag tgcatctgca actctgtcta ccacaatcaa 5880
aactttttca tcagcacaaa ttatgttgtt gtcgaaagaa gcacccttga caattgctct 5940
tgcggcttta ggtatgtcag cagtttcgtc cacaacaaca ggaggattac cagcgccggc 6000
tgcaattaac cttttatctg tatgcttcct agcggcttca acgacggctt caccacctgt 6060
cacaactaac aatccaatac ccggatatct gaataatctc tgtgcagttt cgatgttagg 6120
gtttgccaca ctaactagta aattttctgg gccgccggta gcgacaatgg ccttgttgag 6180
taaagaaata gtccttagtg agacgttttt ggcagaagga tgtggtgcga acacgactga 6240
attccccgct gcaatcattg agattgcatt attaattacc gtagctgctg gatttgtgct 6300
tggcgtgact gaagctacga ctccccaagg ggcattttca atcaatgtta ggccattatc 6360
acccgtaaga acctcggccg ataaacattc tataccaggc gtatgacgag cttgagagac 6420
attcttaatg tacttatcca ccaccctacc cataccagtt tcagcaactg ccatttcagc 6480
caaaacttgt gcataccttt ctccggccac tcttatggct ttgattactt gctgacgcaa 6540
ctcaactgaa cttagttgtt gttgggctaa ggtggctgct tgcacagcgt cgtccaaaga 6600
gctaaaaata ccagatggag cgtcaaacat ggctggtagc ggcatgggca cagttggttc 6660
gattacagaa tgttccattg tgaaggtagt tcgattttgg aggtcgcggg aggtcgaaac 6720
taagttcttg gtgttttaaa actaaaaaaa agactaacta taaaagtaga atttaagaag 6780
tttaagaaat agatttacag aattacaatc aatacctacc gtctttatat acttattagt 6840
caagtagggg aataatttca gggaactggt ttcaaccttt tttttcagct ttttccaaat 6900
cagagagagc agaaggtaat agaaggtgta agaaaatgag atagatacat gcgtgggtca 6960
attgccttgt gtcatcattt actccaggca ggttgcatca ctccattgag gttgtgcccg 7020
ttttttgcct gtttgtgccc ctgttctctg tagttgcgct aagagaatgg acctatgaac 7080
tgatggttgg tgaagaaaac aatattttgg tgctgggatt cttttttttt ctggatgcca 7140
gcttaaaaag cgggctccat tatatttagt ggatgccagg aataaactgt tcacccagac 7200
acctacgatg ttatatattc tgtgtaaccc gccccctatt ttgggcatgt acgggttaca 7260
gcagaattaa aaggctaatt ttttgactaa ataaagttag gaaaatcact actattaatt 7320
atttacgtat tctttgaaat ggcagtattg ataatgataa actcgaactg aaaaagcgtg 7380
ttttttattc aaaatgattc taactccctt acgtaatcaa ggaatctttt tgccttggcc 7440
tccgcgtcat taaacttctt gttgttgacg ctaacattca acgctagtat atattcgttt 7500
ttttcaggta agttcttttc aacgggtctt actgatgagg cagtcgcgtc tgaaaggtcc 7560
gccggcgttg gacgagcgtg taccaacctg catttctttc cgtcatatac acaaaatact 7620
ttcatataaa cttacttggt cttacgtcat aaataaatat gtatacatat aaattaaaaa 7680
atttggtttt atatttttac aaaaagaatc gtttacttca tttctccctt ttaagcgata 7740
caatccatga aaaaagagaa aaagagagaa caggcttgtg ccttctttaa aacatcccac 7800
acaaaatcat attgaattga attttacatc ttaagctagt gtacaacaac tgctatatcc 7860
aaagaaaact aacgtggacc gcttttagag ttgagaaaaa ggtttgaaaa aaatagcaat 7920
acaaagactt gtttcatata taaaatacag ggagcacatt gagctaatat aacataaaca 7980
ctgcgaacca attccaatca aaaggtacac atgagagcat tcccccgagt actgccattt 8040
cgccatcaga gatcatataa taacatcctt cttcgaacgg cggtttaaac gcgtggccgt 8100
gccgtc 8106
<210> 47
<211> 2404
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i76220 integration construct
<400> 47
gacggcacgg ccacgcgttt aaaccgccgc acgtgtatgt acggctgtgt aaatatgata 60
atcatctcgg acgaacggcg tagtactctc catcccctaa aaatgttcac gtgtgactgc 120
tccatttcgc cggatgtcga gatgaccccc ccccctcaaa aggcactcac ctgctgacat 180
gccgtggcaa atgattgggg tcatcctttt tttctgttat ctctaagatc caaagaaaag 240
taaaaaaaaa aggttggggt acgaattgcc gccgagcctc cgatgccatt attcaatggg 300
tattgcagtt ggggtatagt tcctcggtgg caaatagttc tcccttcatt ttgtatataa 360
actgggcggc tattctaagc atatttctcc cttaggttat ctggtagtac gttatatctt 420
gttcttatat tttctatcta taagcaaaac caaacatatc aaaactacta gaaagacatt 480
gccccactgt gttcgctcgt ccaacgccgg cggacctttc tcgacgtggg cctttttctt 540
gccatatgga tccgctgcac ggtcctgttc cctagcatgt acgtgagcgt atttcctttt 600
aaaccacgac gctttgtctt cattcaacgt ttcccattgt ttttttctac tattgctttg 660
ctgtgggaaa aacttatcga aagatgacga ctttttctta attctcgttt taagagcttg 720
gtgagcgcta ggagtcactg ccaggtatcg tttgaacacg gcattagtca gggaagtcat 780
aacacagtcc tttcccgcaa ttttcttttt ctattactct tggcctcctc tagtacactc 840
tatatttttt tatgcctcgg taatgatttt catttttttt tttccaccta gcggatgact 900
cttttttttt cttagcgatt ggcattatca cataatgaat tatacattat ataaagtaat 960
gtgatttctt cgaagaatat actaaaaaat gagcaggcaa gataaacgaa ggcaaagatg 1020
acagagcaga aagccctagt aaagcgtatt acaaatgaaa ccaagattca gattgcgatc 1080
tctttaaagg gtggtcccct agcgatagag cactcgatct tcccagaaaa agaggcagaa 1140
gcagtagcag aacaggccac acaatcgcaa gtgattaacg tccacacagg tatagggttt 1200
ctggaccata tgatacatgc tctggccaag cattccggct ggtcgctaat cgttgagtgc 1260
attggtgact tacacataga cgaccatcac accactgaag actgcgggat tgctctcggt 1320
caagctttta aagaggccct aggggccgtg cgtggagtaa aaaggtttgg atcaggattt 1380
gcgcctttgg atgaggcact ttccagagcg gtggtagatc tttcgaacag gccgtacgca 1440
gttgtcgaac ttggtttgca aagggagaaa gtaggagatc tctcttgcga gatgatcccg 1500
cattttcttg aaagctttgc agaggctagc agaattaccc tccacgttga ttgtctgcga 1560
ggcaagaatg atcatcaccg tagtgagagt gcgttcaagg ctcttgcggt tgccataaga 1620
gaagccacct cgcccaatgg taccaacgat gttccctcca ccaaaggtgt tcttatgtag 1680
tgacaccgat tatttaaagc tgcagcatac gatatatata catgtgtata tatgtatacc 1740
tatgaatgtc agtaagtatg tatacgaaca gtatgatact gaagatgaca aggtaatgca 1800
tcattctata cgtgtcattc tgaacgaggc gcgctttcct tttttctttt tgctttttct 1860
ttttttttct cttgaactcg aggtccgccg gcgttggacg agcgtgatga tttctttcct 1920
ttttatattg acgacttttt ttttttcgtg tgtttttgtt ctcttataac cgagctgctt 1980
acttattatt atttcacctt ctctttttat ttatacttat aattatttat tctttacata 2040
ctgttacaag aaactctttt ctacattaat tgcataaagt gtcaatcagc acatcctcta 2100
tatcgctatc aacaacaaat ttgacaaacc tgcctatatc ttcaggaaca actgccgcat 2160
cgctaccacc actacttgtg aagtccctgg agtttaatat gcactgaaat ttacctagcc 2220
gttttacaca agaccataat ccatccatgc tatcgcagta tatgattttg tgttcgtttt 2280
tcgtcttgcg aaaggcatcc tcaatggctt gtttcattga tccatcagtg tggctcgtag 2340
gtaccagcaa aaccacttca tcagcggcgt actcctggcg gtttaaacgc gtggccgtgc 2400
cgtc 2404
<210> 48
<211> 8536
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i73830 integration construct
<400> 48
gacggcacgg ccacgcgttt aaaccgccac ccagccaagg tagtctaaaa gctaatttct 60
ctaaaaggga gaaagttggt gattttttat ctcgcattat tatatatgca agaatagtta 120
aggtatagtt ataaagtttt atcttaattg ccacatacgt acattgacac gtagaaggac 180
tccattattt ttttcattct agcatactat tattccttgt aacgtcccag agtattccat 240
ttaattgtcc tccatttctt aacggtgacg aaggatcacc atacaacaac tactaaagat 300
tatagtacac tctcaccttg caactattta tctgacattt gccttacttt tatctccagc 360
ttcccctcga ttttattttt caatttgatt tctaaagctt tttgcttagg cataccaaac 420
catccactca tttaacacct tatttttttt ttcgaagaca gcatccaact ttatacgttc 480
actacctttt tttttacaac aatttcattc ttcatcctat gaacgctcgt ccaacgccgg 540
cggacctttc agacgcgact gcctcatcag taagacccgt tgaaaagaac ttacctgaaa 600
aaaacgaata tatactagcg ttgaatgtta gcgtcaacaa caagaagttt aatgacgcgg 660
aggccaaggc aaaaagattc cttgattacg taagggagtt agaatcattt tgaataaaaa 720
acacgctttt tcagttcgag tttatcatta tcaatactgc catttcaaag aatacgtaaa 780
taattaatag tagtgatttt cctaacttta tttagtcaaa aaattagcct tttaattctg 840
ctgtaacccg tacatgccca aaataggggg cgggttacac agaatatata acatcgtagg 900
tgtctgggtg aacagtttat tcctggcatc cactaaatat aatggagccc gctttttaag 960
ctggcatcca gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc accaaccatc 1020
agttcatagg tccattctct tagcgcaact acagagaaca ggggcacaaa caggcaaaaa 1080
acgggcacaa cctcaatgga gtgatgcaac ctgcctggag taaatgatga cacaaggcaa 1140
ttgacccacg catgtatcta tctcattttc ttacaccttc tattaccttc tgctctctct 1200
gatttggaaa aagctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt 1260
gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa 1320
acttcttaaa ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt 1380
agtttcgacc tcccgcgacc tccaaaatcg aactaccttc acaatggctg atttcgattc 1440
taaagaatac ttggagttag ttgacaagtg gtggcgtgcc accaactact tgtccgctgg 1500
tatgattttc ttgaagtcca acccattatt ctctgttact aataccccaa tcaaggccga 1560
agatgtcaaa gttaaaccaa ttggtcactg gggtactatt tccggtcaaa ctttcttata 1620
cgcccacgct aaccgtttga ttaacaagta cggtctcaac atgttttacg ttggtggtcc 1680
aggtcacggt ggtcaagtca tggttactaa cgcctactta gacggtgcct acaccgaaga 1740
ttacccagaa attactcaag acatcgaagg tatgtctcat ttgttcaagc gtttctcttt 1800
ccctggtggt attggttccc atatgaccgc tcaaactcca ggttccttgc acgaaggtgg 1860
tgaattgggt tactctttgt cccatgcttt cggtgctgtt ttggacaacc cagaccaagt 1920
tgcttttgct gtcgttggtg atggtgaagc tgaaactggt ccatctatgg cctcttggca 1980
ttccattaag ttcttaaatg ccaagaacga tggtgccgtt ttgccagttt tggatttaaa 2040
cggtttcaag atttccaatc caaccatttt ttctagaatg tctgatgaag aaattactaa 2100
gttcttcgaa ggtttgggtt attcccctag attcattgaa aatgatgaca ttcacgacta 2160
cgccacctac caccaattgg ccgctaacat cttagatcaa gccatcgaag acattcaagc 2220
tattcaaaat gacgccagag agaatggtaa atatcaagat ggtgaaattc cagcttggcc 2280
tgttattatc gctagattgc caaagggttg gggtggtcca acccacgatg cttctaataa 2340
tccaattgaa aactctttca gagctcacca agttccatta ccattggaac aacacgattt 2400
ggccaccttg ccagaattcg aagattggat gaactcttac aagccagaag aattattcaa 2460
cgctgatggt tccttgaagg atgagttgaa agctattgcc ccaaagggtg ataagagaat 2520
gtctgctaac ccaatcacca acggtggtgc tgacagatcc gacttgaaat tgccaaattg 2580
gagagaattc gctaacgaca tcaacgacga taccagaggt aaggaattcg ctgactctaa 2640
gagaaacatg gatatggcta ctttatccaa ctatttaggt gccgtttctc aattgaaccc 2700
aaccagattc agattcttcg gtccagatga aaccatgtcc aacagattgt ggggtttgtt 2760
taatgttacc ccacgtcaat ggatggaaga aatcaaggaa ccacaagatc aattgttgtc 2820
tccaactggt cgtatcatcg attcccaatt gtctgaacac caagctgaag gttggttgga 2880
aggttacact ttgactggta gagttggtat ctttgcctct tacgaatctt tcttgagagt 2940
tgttgatacc atggtcactc aacatttcaa gtggttgcgt cacgcttccg aacaagcttg 3000
gagaaatgac tatccatcct taaatttgat cgctacctct accgctttcc aacaagatca 3060
taacggttat actcaccaag accctggtat gttaactcat ttggccgaga agaagtctaa 3120
cttcattaga gaatatttgc cagccgacgg taactctttg ttagccgttc aagagagagc 3180
tttctctgaa agacataagg ttaacttatt gatcgcttct aaacaaccaa gacaacaatg 3240
gttcactgtt gaagaagctg aagtcttagc taacgaaggt ttgaagatta tcgattgggc 3300
ttctactgct ccatcttccg atgttgatat tacttttgct tctgccggta ctgaaccaac 3360
cattgagact ttggccgcct tatggttgat taatcaagct ttccctgacg ttaagtttag 3420
atacgttaac gttgttgaat tgttaagatt gcaaaagaaa tctgaaccaa acatgaacga 3480
cgaaagagaa ttatctgccg aagaatttaa taagtacttc caagccgaca ctccagttat 3540
cttcggtttc cacgcttacg aaaacttgat tgaatctttc tttttcgaga gaaagttcac 3600
cggtgatgtc tatgttcacg gttatagaga agatggtgat atcactacca cctacgatat 3660
gagagtctat tcccacttgg atcgtttcca tcaagccaag gaagccgccg aaatcttgtc 3720
tgctaacggt aaaatcgacc aagccgctgc cgacaccttt attgctaaga tggacgacac 3780
tttggccaaa cacttccaag ttactagaaa tgaaggtaga gatattgaag aattcactga 3840
ctggacttgg tctccattga agtaagtgaa tttactttaa atcttgcatt taaataaatt 3900
ttctttttat agctttatga cttagtttca atttatatac tattttaatg acattttcga 3960
ttcattgatt gaaagctttg tgttttttct tgatgcgcta ttgcattgtt cttgtctttt 4020
tcgccacatg taatatctgt agtagatacc tgatacattg tggatgctga gtgaaatttt 4080
agttaataat ggaggcgctc ttaataattt tggggatatt ggcttatccc cgcgtgcttg 4140
gccggccgta cgaaaatcgt tattgtcttg aaggtgaaat ttctactctt attaatggtg 4200
aacgttaagc tgatgctatg atggaagctg attggtctta acttgcttgt catcttgcta 4260
atggtcattg gctcgtgtta ttacttaagt tatttgtact cgttttgaac gtaatgctaa 4320
tgatcatctt atggaataat agtgagtggt ttcagggtcc ataaagcttt tcaattcatc 4380
tttttttttt ttgttctttt ttttgattcc ggtttctttg aaattttttt gattcggtaa 4440
tctccgagca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 4500
tatgtggtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 4560
aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 4620
ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 4680
tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 4740
gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 4800
gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 4860
gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 4920
tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt attgttagcg 4980
gtttgaagca ggcggcggaa gaagtaacaa aggaacctag aggccttttg atgttagcag 5040
aattgtcatg caagggctcc ctagctactg gagaatatac taagggtact gttgacattg 5100
cgaagagtga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 5160
atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 5220
cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct gacattatta 5280
ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 5340
gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 5400
tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 5460
tattaccacg aaaatcgtta ttgtcttgaa ggtgaaattt ctactcttat taatggtgaa 5520
cgttaagctg atgctatgat ggaagctgat tggtcttaac ttgcttgtca tcttgctaat 5580
ggtcatatgg ctcgtgttat tacttaagtt atttgtactc gttttgaacg taatgctaat 5640
gatcatctta tggaataata gtgaacggcc ggccaagcac gcggggatgg gatgagcttg 5700
gagcaggaag aatacactat actggatcta aagagtacaa tagatggata agaatattgg 5760
cagcgcaaaa aggcttcaag cttacacaac acggtttatt tcgaaataat atccttctcg 5820
aaagctttaa cgaacgcaga attttcgagt tattaaactt aaaatacgct gaacccgaac 5880
atagaaatat cgaatgggaa aaaaaaactg cataaaggca ttaaaagagg agcgaatttt 5940
tttttaataa aaatcttaat aatcattaaa agataaataa tagtctatat atacgtatat 6000
aaataaaaaa tattcaaaaa ataaaataaa ctattatttt agcgtaaagg atggggaaag 6060
agaaaagaaa aaaattgatc tatcgatttc aattcaattc aatagatctt tatccttgtg 6120
cttgtgcctg aactgcggta acggcaacaa ctttgacgat gtcgtcgact gaacatcccc 6180
ttgacaaatc gttgataggt ttggcaaatc cctgacatat aggaccgatg gcttcggcct 6240
ttgcgaatct ttggaccaac ttgtatccga tgtttcctgc ctggatgtct gggaagatca 6300
agacatttgc cttaccagcg actttagatc caggggcttt caaatctgcg accttcttaa 6360
ccaatgaggc gtctaactgc aattcaccgt cgatgtctaa gtcaggccta gcctccttag 6420
ccaattttgt tgcctttgta accttgtcga ctaattcatg tgaggctgat cccatggttg 6480
agaatgacaa catggctacc cttggctcga tcttgcacaa attctttgca gtctcagcag 6540
tggtaattgc gattgaagat aactcttcag cggtaggaca aacatttaca gcgcagtcag 6600
cgaataacaa aaaaccgtcc tctccatact cgcagtcagg tactgacatc aagaagactg 6660
atgagacgac agatgcacct ggtactgttt tgacaatctg caaaccaggc cttaacaagt 6720
ctcctgtagt atgtatagca ccagatacca aaccgtcagc gtcacctaac ttgaccatca 6780
ttgttgcgaa gtagattggg tccctgacga ttttgtcagc cttctccaag gtgactccct 6840
tgttttttct gatctcgtag aaagcgttgg cgtaaccggc ggtcttagaa gaagtttctg 6900
ggtcgactat ctctactccg gccaaattta ctccgaattt tgcggcgttt tccttaatga 6960
cagactctga accgaccaag attatgtcgg caataccgtc cctaataatc tcctctgaag 7020
ccctgatgtt cctctcttcc tcaccctctg ccaaaacgat tttcttcttg tcggccttgg 7080
ccaatccgaa gatattctcc atcaatttca ttgtgaaggt agttcgattt tggaggtcgc 7140
gggaggtcga aactaagttc ttggtgtttt aaaactaaaa aaaagactaa ctataaaagt 7200
agaatttaag aagtttaaga aatagattta cagaattaca atcaatacct accgtcttta 7260
tatacttatt agtcaagtag gggaataatt tcagggaact ggtttcaacc ttttttttca 7320
gctttttcca aatcagagag agcagaaggt aatagaaggt gtaagaaaat gagatagata 7380
catgcgtggg tcaattgcct tgtgtcatca tttactccag gcaggttgca tcactccatt 7440
gaggttgtgc ccgttttttg cctgtttgtg cccctgttct ctgtagttgc gctaagagaa 7500
tggacctatg aactgatggt tggtgaagaa aacaatattt tggtgctggg attctttttt 7560
tttctggatg ccagcttaaa aagcgggctc cattatattt agtggatgcc aggaataaac 7620
tgttcaccca gacacctacg atgttatata ttctgtgtaa cccgccccct attttgggca 7680
tgtacgggtt acagcagaat taaaaggcta attttttgac taaataaagt taggaaaatc 7740
actactatta attatttacg tattctttga aatggcagta ttgataatga taaactcgaa 7800
ctgaaaaagc gtgtttttta ttcaaaatga ttctaactcc cttacgtaat caaggaatct 7860
ttttgccttg gcctccgcgt cattaaactt cttgttgttg acgctaacat tcaacgctag 7920
tatatattcg tttttttcag gtaagttctt ttcaacgggt cttactgatg aggcagtcgc 7980
gtctgaaagg tccgccggcg ttggacgagc gctccatgct ggacttactc gtcgaagatt 8040
tcctgctact ctctatataa ttagacaccc atgttataga tttcagaaaa caatgtaata 8100
atatatggta gcctcctgaa actaccaagg gaaaaatctc aacaccaaga gctcatattc 8160
gttggaatag cgataatatc tctttacctc aatcttatat gcatgttatt tgctcttata 8220
attggtctct atttagggaa aaaagtcggt ttgagagctt ctcgcgatgt gaaatctcaa 8280
tttgaactgc acgccaaagc tagcccattt cacgaacacc agaaagaaga aatccccaag 8340
gatcgcatga cagagtatgc tctctcatat cgttgagtat gaatgccaat acactgatca 8400
gctttacaag aaacgtaaaa tctggcacga tggtagactg aaatactttc agttaaacaa 8460
cagattcatg ctttatacgg aaaaggataa cgttttgtta gctagtgagg cggtttaaac 8520
gcgtggccgt gccgtc 8536
<210> 49
<211> 9734
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i74810 integration construct
<400> 49
gacggcacgg ccacgcgttt aaaccgcccg ctcgcctcat ccccacggga ataaggcagc 60
cgacaaaaga aaaacgaccg aaaaggaacc agaaagaaaa aagagggtgg gcgcgccgcg 120
gacgtgtaaa aagatatgca tccagcttct atatcgcttt aactttaccg ttttgggcat 180
cgggaacgta tgtaacattg atctcctctt gggaacggtg agtgcaacga atgcgatata 240
gcaccgacca tgtgggcaaa ttcgtaataa attcggggtg agggggattc aagacaagca 300
accttgttag tcagctcaaa cagcgattta acggttgagt aacacatcaa aacaccgttc 360
gaggtcaagc ctggcgtgtt taacaagttc ttgatatcat atataaatgt aataagaagt 420
ttggtaatat tcaattcgaa gtgttcagtc ttttacttct cttgttttat agaagaaaaa 480
acatcaagaa acatctttaa catacacaaa cacatactat cagaatacac gctcgtccaa 540
cgccggcgga cctttcagac gcgactgcct catcagtaag acccgttgaa aagaacttac 600
ctgaaaaaaa cgaatatata ctagcgttga atgttagcgt caacaacaag aagtttaatg 660
acgcggaggc caaggcaaaa agattccttg attacgtaag ggagttagaa tcattttgaa 720
taaaaaacac gctttttcag ttcgagttta tcattatcaa tactgccatt tcaaagaata 780
cgtaaataat taatagtagt gattttccta actttattta gtcaaaaaat tagcctttta 840
attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 900
cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 960
tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 1020
accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 1080
caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 1140
aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 1200
ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 1260
ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 1320
tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 1380
gaacttagtt tcgacctccc gcgacctcca aaatcgaact accttcacaa tggctgattt 1440
cgattctaaa gaatacttgg agttagttga caagtggtgg cgtgccacca actacttgtc 1500
cgctggtatg attttcttga agtccaaccc attattctct gttactaata ccccaatcaa 1560
ggccgaagat gtcaaagtta aaccaattgg tcactggggt actatttccg gtcaaacttt 1620
cttatacgcc cacgctaacc gtttgattaa caagtacggt ctcaacatgt tttacgttgg 1680
tggtccaggt cacggtggtc aagtcatggt tactaacgcc tacttagacg gtgcctacac 1740
cgaagattac ccagaaatta ctcaagacat cgaaggtatg tctcatttgt tcaagcgttt 1800
ctctttccct ggtggtattg gttcccatat gaccgctcaa actccaggtt ccttgcacga 1860
aggtggtgaa ttgggttact ctttgtccca tgctttcggt gctgttttgg acaacccaga 1920
ccaagttgct tttgctgtcg ttggtgatgg tgaagctgaa actggtccat ctatggcctc 1980
ttggcattcc attaagttct taaatgccaa gaacgatggt gccgttttgc cagttttgga 2040
tttaaacggt ttcaagattt ccaatccaac cattttttct agaatgtctg atgaagaaat 2100
tactaagttc ttcgaaggtt tgggttattc ccctagattc attgaaaatg atgacattca 2160
cgactacgcc acctaccacc aattggccgc taacatctta gatcaagcca tcgaagacat 2220
tcaagctatt caaaatgacg ccagagagaa tggtaaatat caagatggtg aaattccagc 2280
ttggcctgtt attatcgcta gattgccaaa gggttggggt ggtccaaccc acgatgcttc 2340
taataatcca attgaaaact ctttcagagc tcaccaagtt ccattaccat tggaacaaca 2400
cgatttggcc accttgccag aattcgaaga ttggatgaac tcttacaagc cagaagaatt 2460
attcaacgct gatggttcct tgaaggatga gttgaaagct attgccccaa agggtgataa 2520
gagaatgtct gctaacccaa tcaccaacgg tggtgctgac agatccgact tgaaattgcc 2580
aaattggaga gaattcgcta acgacatcaa cgacgatacc agaggtaagg aattcgctga 2640
ctctaagaga aacatggata tggctacttt atccaactat ttaggtgccg tttctcaatt 2700
gaacccaacc agattcagat tcttcggtcc agatgaaacc atgtccaaca gattgtgggg 2760
tttgtttaat gttaccccac gtcaatggat ggaagaaatc aaggaaccac aagatcaatt 2820
gttgtctcca actggtcgta tcatcgattc ccaattgtct gaacaccaag ctgaaggttg 2880
gttggaaggt tacactttga ctggtagagt tggtatcttt gcctcttacg aatctttctt 2940
gagagttgtt gataccatgg tcactcaaca tttcaagtgg ttgcgtcacg cttccgaaca 3000
agcttggaga aatgactatc catccttaaa tttgatcgct acctctaccg ctttccaaca 3060
agatcataac ggttatactc accaagaccc tggtatgtta actcatttgg ccgagaagaa 3120
gtctaacttc attagagaat atttgccagc cgacggtaac tctttgttag ccgttcaaga 3180
gagagctttc tctgaaagac ataaggttaa cttattgatc gcttctaaac aaccaagaca 3240
acaatggttc actgttgaag aagctgaagt cttagctaac gaaggtttga agattatcga 3300
ttgggcttct actgctccat cttccgatgt tgatattact tttgcttctg ccggtactga 3360
accaaccatt gagactttgg ccgccttatg gttgattaat caagctttcc ctgacgttaa 3420
gtttagatac gttaacgttg ttgaattgtt aagattgcaa aagaaatctg aaccaaacat 3480
gaacgacgaa agagaattat ctgccgaaga atttaataag tacttccaag ccgacactcc 3540
agttatcttc ggtttccacg cttacgaaaa cttgattgaa tctttctttt tcgagagaaa 3600
gttcaccggt gatgtctatg ttcacggtta tagagaagat ggtgatatca ctaccaccta 3660
cgatatgaga gtctattccc acttggatcg tttccatcaa gccaaggaag ccgccgaaat 3720
cttgtctgct aacggtaaaa tcgaccaagc cgctgccgac acctttattg ctaagatgga 3780
cgacactttg gccaaacact tccaagttac tagaaatgaa ggtagagata ttgaagaatt 3840
cactgactgg acttggtctc cattgaagta agtgaattta ctttaaatct tgcatttaaa 3900
taaattttct ttttatagct ttatgactta gtttcaattt atatactatt ttaatgacat 3960
tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc attgttcttg 4020
tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga tgctgagtga 4080
aattttagtt aataatggag gcgctcttaa taattttggg gatattggct tatccccgcg 4140
tgcttggccg gccgtacact gagtaatggt agttataaga aagagaccga gttagggaca 4200
gttagaggcg gtggagatat tccttatggc atgtctggcg atgataaaac ttttcaaacg 4260
gcagccccga tctaaaagag ctgacaggga aatggtcaga aaaagaaacg tgcacccgcc 4320
cgtctggacg cgccgctcac ccgcacggca gagaccaatc agtaaaaatc aacggttaac 4380
gacattacta tatatataat ataggaagca tttaatagaa cagcatcgta atatatgtgt 4440
actttgcagt tatgacgcca gatggcagta gtggaagata ttctttattg aaaaatagct 4500
tgtcacctta cgtacaatct tgatccggag cttttctttt tttgccgatt aagaattcgg 4560
tcgaaaaaag aaaaggagag ggccaagagg gagggcattg gtgactattg agcacgtgag 4620
tatacgtgat taagcacaca aaggcagctt ggagtatgtc tgttattaat ttcacaggta 4680
gttctggtcc attggtgaaa gtttgcggct tgcagagcac agaggccgca gaatgtgctc 4740
tagattccga tgctgacttg ctgggtatta tatgtgtgcc caatagaaag agaacaattg 4800
acccggttat tgcaaggaaa atttcaagtc ttgtaaaagc atataaaaat agttcaggca 4860
ctccgaaata cttggttggc gtgtttcgta atcaacctaa ggaggatgtt ttggctctgg 4920
tcaatgatta cggcattgat atcgtccaac tgcatggaga tgagtcgtgg caagaatacc 4980
aagagttcct cggtttgcca gttattaaaa gactcgtatt tccaaaagac tgcaacatac 5040
tactcagtgc agcttcacag aaacctcatt cgtttattcc cttgtttgat tcagaagcag 5100
gtgggacagg tgaacttttg gattggaact cgatttctga ctgggttgga aggcaagaga 5160
gccccgaaag cttacatttt atgttagctg gtggactgac gccagaaaat gttggtgatg 5220
cgcttagatt aaatggcgtt attggtgttg atgtaagcgg aggtgtggag acaaatggtg 5280
taaaagactc taacaaaata gcaaatttcg tcaaaaatgc taagaaatag gttattactg 5340
agtagtattt atttaagtat tgtttgtgca cttgcctgca ggccttttga aaagcaagca 5400
taaaagatct aaacataaaa tctgtaaaat aacaagatgt aaagataatg ctaaatcatt 5460
tggctttttg attgattgta caggaaaata tacatcgcag ggggttgact tttaccattt 5520
caccgcaatg gaatcaaact tgttgaagag aatgttcaca ggcgcatacg ctacaatgac 5580
acggccggcc aagcacgcgg ggataagcca atatccccaa aattattaag agcgcctcca 5640
ttattaacta aaatttcact cagcatccac aatgtatcag gtatctacta cagatattac 5700
atgtggcgaa aaagacaaga acaatgcaat agcgcatcaa gaaaaaacac aaagctttca 5760
atcaatgaat cgaaaatgtc attaaaatag tatataaatt gaaactaagt cataaagcta 5820
taaaaagaaa atttatttaa atgcaagatt taaagtaaat tcacttactt caatggagac 5880
caagtccagt cagtgaattc ttcaatatct ctaccttcat ttctagtaac ttggaagtgt 5940
ttggccaaag tgtcgtccat cttagcaata aaggtgtcgg cagcggcttg gtcgatttta 6000
ccgttagcag acaagatttc ggcggcttcc ttggcttgat ggaaacgatc caagtgggaa 6060
tagactctca tatcgtaggt ggtagtgata tcaccatctt ctctataacc gtgaacatag 6120
acatcaccgg tgaactttct ctcgaaaaag aaagattcaa tcaagttttc gtaagcgtgg 6180
aaaccgaaga taactggagt gtcggcttgg aagtacttat taaattcttc ggcagataat 6240
tctctttcgt cgttcatgtt tggttcagat ttcttttgca atcttaacaa ttcaacaacg 6300
ttaacgtatc taaacttaac gtcagggaaa gcttgattaa tcaaccataa ggcggccaaa 6360
gtctcaatgg ttggttcagt accggcagaa gcaaaagtaa tatcaacatc ggaagatgga 6420
gcagtagaag cccaatcgat aatcttcaaa ccttcgttag ctaagacttc agcttcttca 6480
acagtgaacc attgttgtct tggttgttta gaagcgatca ataagttaac cttatgtctt 6540
tcagagaaag ctctctcttg aacggctaac aaagagttac cgtcggctgg caaatattct 6600
ctaatgaagt tagacttctt ctcggccaaa tgagttaaca taccagggtc ttggtgagta 6660
taaccgttat gatcttgttg gaaagcggta gaggtagcga tcaaatttaa ggatggatag 6720
tcatttctcc aagcttgttc ggaagcgtga cgcaaccact tgaaatgttg agtgaccatg 6780
gtatcaacaa ctctcaagaa agattcgtaa gaggcaaaga taccaactct accagtcaaa 6840
gtgtaacctt ccaaccaacc ttcagcttgg tgttcagaca attgggaatc gatgatacga 6900
ccagttggag acaacaattg atcttgtggt tccttgattt cttccatcca ttgacgtggg 6960
gtaacattaa acaaacccca caatctgttg gacatggttt catctggacc gaagaatctg 7020
aatctggttg ggttcaattg agaaacggca cctaaatagt tggataaagt agccatatcc 7080
atgtttctct tagagtcagc gaattcctta cctctggtat cgtcgttgat gtcgttagcg 7140
aattctctcc aatttggcaa tttcaagtcg gatctgtcag caccaccgtt ggtgattggg 7200
ttagcagaca ttctcttatc accctttggg gcaatagctt tcaactcatc cttcaaggaa 7260
ccatcagcgt tgaataattc ttctggcttg taagagttca tccaatcttc gaattctggc 7320
aaggtggcca aatcgtgttg ttccaatggt aatggaactt ggtgagctct gaaagagttt 7380
tcaattggat tattagaagc atcgtgggtt ggaccacccc aaccctttgg caatctagcg 7440
ataataacag gccaagctgg aatttcacca tcttgatatt taccattctc tctggcgtca 7500
ttttgaatag cttgaatgtc ttcgatggct tgatctaaga tgttagcggc caattggtgg 7560
taggtggcgt agtcgtgaat gtcatcattt tcaatgaatc taggggaata acccaaacct 7620
tcgaagaact tagtaatttc ttcatcagac attctagaaa aaatggttgg attggaaatc 7680
ttgaaaccgt ttaaatccaa aactggcaaa acggcaccat cgttcttggc atttaagaac 7740
ttaatggaat gccaagaggc catagatgga ccagtttcag cttcaccatc accaacgaca 7800
gcaaaagcaa cttggtctgg gttgtccaaa acagcaccga aagcatggga caaagagtaa 7860
cccaattcac caccttcgtg caaggaacct ggagtttgag cggtcatatg ggaaccaata 7920
ccaccaggga aagagaaacg cttgaacaaa tgagacatac cttcgatgtc ttgagtaatt 7980
tctgggtaat cttcggtgta ggcaccgtct aagtaggcgt tagtaaccat gacttgacca 8040
ccgtgacctg gaccaccaac gtaaaacatg ttgagaccgt acttgttaat caaacggtta 8100
gcgtgggcgt ataagaaagt ttgaccggaa atagtacccc agtgaccaat tggtttaact 8160
ttgacatctt cggccttgat tggggtatta gtaacagaga ataatgggtt ggacttcaag 8220
aaaatcatac cagcggacaa gtagttggtg gcacgccacc acttgtcaac taactccaag 8280
tattctttag aatcgaaatc agccattgtg aaggtagttc gattttggag gtcgcgggag 8340
gtcgaaacta agttcttggt gttttaaaac taaaaaaaag actaactata aaagtagaat 8400
ttaagaagtt taagaaatag atttacagaa ttacaatcaa tacctaccgt ctttatatac 8460
ttattagtca agtaggggaa taatttcagg gaactggttt caaccttttt tttcagcttt 8520
ttccaaatca gagagagcag aaggtaatag aaggtgtaag aaaatgagat agatacatgc 8580
gtgggtcaat tgccttgtgt catcatttac tccaggcagg ttgcatcact ccattgaggt 8640
tgtgcccgtt ttttgcctgt ttgtgcccct gttctctgta gttgcgctaa gagaatggac 8700
ctatgaactg atggttggtg aagaaaacaa tattttggtg ctgggattct ttttttttct 8760
ggatgccagc ttaaaaagcg ggctccatta tatttagtgg atgccaggaa taaactgttc 8820
acccagacac ctacgatgtt atatattctg tgtaacccgc cccctatttt gggcatgtac 8880
gggttacagc agaattaaaa ggctaatttt ttgactaaat aaagttagga aaatcactac 8940
tattaattat ttacgtattc tttgaaatgg cagtattgat aatgataaac tcgaactgaa 9000
aaagcgtgtt ttttattcaa aatgattcta actcccttac gtaatcaagg aatctttttg 9060
ccttggcctc cgcgtcatta aacttcttgt tgttgacgct aacattcaac gctagtatat 9120
attcgttttt ttcaggtaag ttcttttcaa cgggtcttac tgatgaggca gtcgcgtctg 9180
aaaggtccgc cggcgttgga cgagcgtgta ccaacctgca tttctttccg tcatatacac 9240
aaaatacttt catataaact tacttggtct tacgtcataa ataaatatgt atacatataa 9300
attaaaaaat ttggttttat atttttacaa aaagaatcgt ttacttcatt tctccctttt 9360
aagcgataca atccatgaaa aaagagaaaa agagagaaca ggcttgtgcc ttctttaaaa 9420
catcccacac aaaatcatat tgaattgaat tttacatctt aagctagtgt acaacaactg 9480
ctatatccaa agaaaactaa cgtggaccgc ttttagagtt gagaaaaagg tttgaaaaaa 9540
atagcaatac aaagacttgt ttcatatata aaatacaggg agcacattga gctaatataa 9600
cataaacact gcgaaccaat tccaatcaaa aggtacacat gagagcattc ccccgagtac 9660
tgccatttcg ccatcagaga tcatataata acatccttct tcgaacggcg gtttaaacgc 9720
gtggccgtgc cgtc 9734
<210> 50
<211> 7980
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i76221 integration construct
<400> 50
gacggcacgg ccacgcgttt aaaccgccgc acgtgtatgt acggctgtgt aaatatgata 60
atcatctcgg acgaacggcg tagtactctc catcccctaa aaatgttcac gtgtgactgc 120
tccatttcgc cggatgtcga gatgaccccc ccccctcaaa aggcactcac ctgctgacat 180
gccgtggcaa atgattgggg tcatcctttt tttctgttat ctctaagatc caaagaaaag 240
taaaaaaaaa aggttggggt acgaattgcc gccgagcctc cgatgccatt attcaatggg 300
tattgcagtt ggggtatagt tcctcggtgg caaatagttc tcccttcatt ttgtatataa 360
actgggcggc tattctaagc atatttctcc cttaggttat ctggtagtac gttatatctt 420
gttcttatat tttctatcta taagcaaaac caaacatatc aaaactacta gaaagacatt 480
gccccactgt gttcgctcgt ccaacgccgg cggacctttc agacgcgact gcctcatcag 540
taagacccgt tgaaaagaac ttacctgaaa aaaacgaata tatactagcg ttgaatgtta 600
gcgtcaacaa caagaagttt aatgacgcgg aggccaaggc aaaaagattc cttgattacg 660
taagggagtt agaatcattt tgaataaaaa acacgctttt tcagttcgag tttatcatta 720
tcaatactgc catttcaaag aatacgtaaa taattaatag tagtgatttt cctaacttta 780
tttagtcaaa aaattagcct tttaattctg ctgtaacccg tacatgccca aaataggggg 840
cgggttacac agaatatata acatcgtagg tgtctgggtg aacagtttat tcctggcatc 900
cactaaatat aatggagccc gctttttaag ctggcatcca gaaaaaaaaa gaatcccagc 960
accaaaatat tgttttcttc accaaccatc agttcatagg tccattctct tagcgcaact 1020
acagagaaca ggggcacaaa caggcaaaaa acgggcacaa cctcaatgga gtgatgcaac 1080
ctgcctggag taaatgatga cacaaggcaa ttgacccacg catgtatcta tctcattttc 1140
ttacaccttc tattaccttc tgctctctct gatttggaaa aagctgaaaa aaaaggttga 1200
aaccagttcc ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat 1260
tgattgtaat tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc 1320
ttttttttag ttttaaaaca ccaagaactt agtttcgacc tcccgcgacc tccaaaatcg 1380
aactaccttc acaatggaac attctgtaat cgaaccaact gtgcccatgc cgctaccagc 1440
catgtttgac gctccatctg gtatttttag ctctttggac gacgctgtgc aagcagccac 1500
cttagcccaa caacaactaa gttcagttga gttgcgtcag caagtaatca aagccataag 1560
agtggccgga gaaaggtatg cacaagtttt ggctgaaatg gcagttgctg aaactggtat 1620
gggtagggtg gtggataagt acattaagaa tgtctctcaa gctcgtcata cgcctggtat 1680
agaatgttta tcggccgagg ttcttacggg tgataatggc ctaacattga ttgaaaatgc 1740
cccttgggga gtcgtagctt cagtcacgcc aagcacaaat ccagcagcta cggtaattaa 1800
taatgcaatc tcaatgattg cagcggggaa ttcagtcgtg ttcgcaccac atccttctgc 1860
caaaaacgtc tcactaagga ctatttcttt actcaacaag gccattgtcg ctaccggcgg 1920
cccagaaaat ttactagtta gtgtggcaaa ccctaacatc gaaactgcac agagattatt 1980
cagatatccg ggtattggat tgttagttgt gacaggtggt gaagccgtcg ttgaagccgc 2040
taggaagcat acagataaaa ggttaattgc agccggcgct ggtaatcctc ctgttgttgt 2100
ggacgaaact gctgacatac ctaaagccgc aagagcaatt gtcaagggtg cttctttcga 2160
caacaacata atttgtgctg atgaaaaagt tttgattgtg gtagacagag ttgcagatgc 2220
actattggca gaaatgcaaa gaaataacgc cgtcttactt acacccgaac agaccgaaag 2280
actactaccc gctcttttgt ccgatattga cgaacagggc aaaggacgtg tgaatagaga 2340
ttatgttgga agagatgcgg ctaaattagc agcggctatt ggtctggaag ttagcgaaca 2400
tactcgtcta ctcctggcag agacagacgc tgatcatcca ttcgccgtga cggagctgat 2460
gatgccagtg ttaccagtaa taagagtcaa gaatgtagat gatgcaatcg cattggcagt 2520
taagctagag tcaggctgca gacacacagc tgcgatgcac tctactaata taagaaactt 2580
aaatagaatg gctaatgcca tcaatacctc tatctttgta aaaaatggtc catgtattgc 2640
aggtttgggt ttaggcggtg aaggttggac ttcaatgact attagcactc cgaccggtga 2700
aggtgttaca agcgctcgta cctttgtcag attaagaagg tgtgtcttag tcgacatgtt 2760
tcggattgct taagcggccg cgagtaataa ttattgcttc catataatat ttttatatac 2820
ctcttatttt tatgtattag ttaattaagt atttttatct atctgcttat cattttcttt 2880
tcatataggg ggggttggtg ttttcttgcc catcagattg atgtcctcca actcggcact 2940
attttacaaa gggttttttt gtaagagaag gagaagacag atactaaacc atacgttact 3000
cgaaacaaaa aaaaaaaaaa tggaaaaagc tgctatcaac aaaagacggc ctcatcaaac 3060
ctaaagaaac catgtcagcg tatgtatata ccttgtaatt tacgtttcct taaatcttct 3120
ttctactaac gttttcatta ttctatactc tatgaccaat aaaaacagac tgtactttca 3180
aaatttaccc agtaggccag caaataaaga aaattatacc agattacttc tgaaacacat 3240
taatcccaac aacaagtatg ccattaatcc gtcgctaccc catccccgcg tgcttggccg 3300
gccgtttctc gacgtgggcc tttttcttgc catatggatc cgctgcacgg tcctgttccc 3360
tagcatgtac gtgagcgtat ttccttttaa accacgacgc tttgtcttca ttcaacgttt 3420
cccattgttt ttttctacta ttgctttgct gtgggaaaaa cttatcgaaa gatgacgact 3480
ttttcttaat tctcgtttta agagcttggt gagcgctagg agtcactgcc aggtatcgtt 3540
tgaacacggc attagtcagg gaagtcataa cacagtcctt tcccgcaatt ttctttttct 3600
attactcttg gcctcctcta gtacactcta tattttttta tgcctcggta atgattttca 3660
tttttttttt tccacctagc ggatgactct ttttttttct tagcgattgg cattatcaca 3720
taatgaatta tacattatat aaagtaatgt gatttcttcg aagaatatac taaaaaatga 3780
gcaggcaaga taaacgaagg caaagatgac agagcagaaa gccctagtaa agcgtattac 3840
aaatgaaacc aagattcaga ttgcgatctc tttaaagggt ggtcccctag cgatagagca 3900
ctcgatcttc ccagaaaaag aggcagaagc agtagcagaa caggccacac aatcgcaagt 3960
gattaacgtc cacacaggta tagggtttct ggaccatatg atacatgctc tggccaagca 4020
ttccggctgg tcgctaatcg ttgagtgcat tggtgactta cacatagacg accatcacac 4080
cactgaagac tgcgggattg ctctcggtca agcttttaaa gaggccctag gggccgtgcg 4140
tggagtaaaa aggtttggat caggatttgc gcctttggat gaggcacttt ccagagcggt 4200
ggtagatctt tcgaacaggc cgtacgcagt tgtcgaactt ggtttgcaaa gggagaaagt 4260
aggagatctc tcttgcgaga tgatcccgca ttttcttgaa agctttgcag aggctagcag 4320
aattaccctc cacgttgatt gtctgcgagg caagaatgat catcaccgta gtgagagtgc 4380
gttcaaggct cttgcggttg ccataagaga agccacctcg cccaatggta ccaacgatgt 4440
tccctccacc aaaggtgttc ttatgtagtg acaccgatta tttaaagctg cagcatacga 4500
tatatataca tgtgtatata tgtataccta tgaatgtcag taagtatgta tacgaacagt 4560
atgatactga agatgacaag gtaatgcatc attctatacg tgtcattctg aacgaggcgc 4620
gctttccttt tttctttttg ctttttcttt ttttttctct tgaactcgac ggccggccaa 4680
gcacgcgggg atggggtagc gacggattaa tggcatactt gttgttggga ttaatgtgtt 4740
tcagaagtaa tctggtataa ttttctttat ttgctggcct actgggtaaa ttttgaaagt 4800
acagtctgtt tttattggtc atagagtata gaataatgaa aacgttagta gaaagaagat 4860
ttaaggaaac gtaaattaca aggtatatac atacgctgac atggtttctt taggtttgat 4920
gaggccgtct tttgttgata gcagcttttt ccattttttt tttttttgtt tcgagtaacg 4980
tatggtttag tatctgtctt ctccttctct tacaaaaaaa ccctttgtaa aatagtgccg 5040
agttggagga catcaatctg atgggcaaga aaacaccaac cccccctata tgaaaagaaa 5100
atgataagca gatagataaa aatacttaat taactaatac ataaaaataa gaggtatata 5160
aaaatattat atggaagcaa taattattac tcgcggccgc ttaagcaatc cgaaacatgt 5220
cgactaagac acaccttctt aatctgacaa aggtacgagc gcttgtaaca ccttcaccgg 5280
tcggagtgct aatagtcatt gaagtccaac cttcaccgcc taaacccaaa cctgcaatac 5340
atggaccatt ttttacaaag atagaggtat tgatggcatt agccattcta tttaagtttc 5400
ttatattagt agagtgcatc gcagctgtgt gtctgcagcc tgactctagc ttaactgcca 5460
atgcgattgc atcatctaca ttcttgactc ttattactgg taacactggc atcatcagct 5520
ccgtcacggc gaatggatga tcagcgtctg tctctgccag gagtagacga gtatgttcgc 5580
taacttccag accaatagcc gctgctaatt tagccgcatc tcttccaaca taatctctat 5640
tcacacgtcc tttgccctgt tcgtcaatat cggacaaaag agcgggtagt agtctttcgg 5700
tctgttcggg tgtaagtaag acggcgttat ttctttgcat ttctgccaat agtgcatctg 5760
caactctgtc taccacaatc aaaacttttt catcagcaca aattatgttg ttgtcgaaag 5820
aagcaccctt gacaattgct cttgcggctt taggtatgtc agcagtttcg tccacaacaa 5880
caggaggatt accagcgccg gctgcaatta accttttatc tgtatgcttc ctagcggctt 5940
caacgacggc ttcaccacct gtcacaacta acaatccaat acccggatat ctgaataatc 6000
tctgtgcagt ttcgatgtta gggtttgcca cactaactag taaattttct gggccgccgg 6060
tagcgacaat ggccttgttg agtaaagaaa tagtccttag tgagacgttt ttggcagaag 6120
gatgtggtgc gaacacgact gaattccccg ctgcaatcat tgagattgca ttattaatta 6180
ccgtagctgc tggatttgtg cttggcgtga ctgaagctac gactccccaa ggggcatttt 6240
caatcaatgt taggccatta tcacccgtaa gaacctcggc cgataaacat tctataccag 6300
gcgtatgacg agcttgagag acattcttaa tgtacttatc caccacccta cccataccag 6360
tttcagcaac tgccatttca gccaaaactt gtgcatacct ttctccggcc actcttatgg 6420
ctttgattac ttgctgacgc aactcaactg aacttagttg ttgttgggct aaggtggctg 6480
cttgcacagc gtcgtccaaa gagctaaaaa taccagatgg agcgtcaaac atggctggta 6540
gcggcatggg cacagttggt tcgattacag aatgttccat tgtgaaggta gttcgatttt 6600
ggaggtcgcg ggaggtcgaa actaagttct tggtgtttta aaactaaaaa aaagactaac 6660
tataaaagta gaatttaaga agtttaagaa atagatttac agaattacaa tcaataccta 6720
ccgtctttat atacttatta gtcaagtagg ggaataattt cagggaactg gtttcaacct 6780
tttttttcag ctttttccaa atcagagaga gcagaaggta atagaaggtg taagaaaatg 6840
agatagatac atgcgtgggt caattgcctt gtgtcatcat ttactccagg caggttgcat 6900
cactccattg aggttgtgcc cgttttttgc ctgtttgtgc ccctgttctc tgtagttgcg 6960
ctaagagaat ggacctatga actgatggtt ggtgaagaaa acaatatttt ggtgctggga 7020
ttcttttttt ttctggatgc cagcttaaaa agcgggctcc attatattta gtggatgcca 7080
ggaataaact gttcacccag acacctacga tgttatatat tctgtgtaac ccgcccccta 7140
ttttgggcat gtacgggtta cagcagaatt aaaaggctaa ttttttgact aaataaagtt 7200
aggaaaatca ctactattaa ttatttacgt attctttgaa atggcagtat tgataatgat 7260
aaactcgaac tgaaaaagcg tgttttttat tcaaaatgat tctaactccc ttacgtaatc 7320
aaggaatctt tttgccttgg cctccgcgtc attaaacttc ttgttgttga cgctaacatt 7380
caacgctagt atatattcgt ttttttcagg taagttcttt tcaacgggtc ttactgatga 7440
ggcagtcgcg tctgaaaggt ccgccggcgt tggacgagcg tgatgatttc tttccttttt 7500
atattgacga cttttttttt ttcgtgtgtt tttgttctct tataaccgag ctgcttactt 7560
attattattt caccttctct ttttatttat acttataatt atttattctt tacatactgt 7620
tacaagaaac tcttttctac attaattgca taaagtgtca atcagcacat cctctatatc 7680
gctatcaaca acaaatttga caaacctgcc tatatcttca ggaacaactg ccgcatcgct 7740
accaccacta cttgtgaagt ccctggagtt taatatgcac tgaaatttac ctagccgttt 7800
tacacaagac cataatccat ccatgctatc gcagtatatg attttgtgtt cgtttttcgt 7860
cttgcgaaag gcatcctcaa tggcttgttt cattgatcca tcagtgtggc tcgtaggtac 7920
cagcaaaacc acttcatcag cggcgtactc ctggcggttt aaacgcgtgg ccgtgccgtc 7980
<210> 51
<211> 13266
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i84022 integration construct
<400> 51
gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60
aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120
cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180
aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240
gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300
acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360
aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420
agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480
acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540
atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600
aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660
gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720
tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780
ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840
tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900
cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960
ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020
agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080
cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140
ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200
acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260
aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320
aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380
ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440
tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500
ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560
gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620
tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680
tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740
tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800
attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860
tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920
tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980
cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040
atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100
gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160
aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220
cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280
agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340
tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400
gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460
agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520
tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580
agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640
acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700
acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760
atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820
cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880
ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940
ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000
aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060
ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120
cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180
cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240
ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300
cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360
tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420
cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480
ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540
tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600
attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660
ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720
atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780
gccgtagtta tgacaattac aacaacagaa ttctttctat atatgcacga acttgtaata 3840
tggaagaaat tatgacgtac aaactataaa gtaaatattt tacgtaacac atggtgctgt 3900
tgtgcttctt tttcaagaga ataccaatga cgtatgacta agtttatgta ttttccaaaa 3960
cctgtttagc cctggcgaca gatacgtctc cggcttcaac gatgaccctg gtgaccctgt 4020
caatgtcggc tccggtggca ccggccatga ttgcgatgtt ccttgcgtgt aaggtcatgt 4080
gtcccctttg gattccctcg gttgccaagg ccctaattgc ggccatattc tgagccaaac 4140
caacggcggc agtaacctgg gccaactcag tagcggtttc gacctgcatt aaggccaaag 4200
cggccctagc tgtagggtga gtcttggtgg ctcctcctac caaacccaag gccaaaggca 4260
attcaatggt accgaccaac ctaccgtcgt tggccaactc ccaccttgtc aaagaggtgt 4320
aatgtccggt cctggcggcg taggcgtggg ctccagcttc gatggccctc cagtcgttac 4380
ctgttgcgac gacgactggg tcaattccgt tcataattcc cttgttatgg gttgcggccc 4440
tgtaagggtc gactattgct aaggcgcagg cttcaaccat tccccttgca acgtcggcac 4500
catcgtatcc ctgggtggtc aaagtctcag gggctaactc aaccctggct cttaccaacc 4560
tcaagtcggc caagttagac aaaatcctca acctgacggt tccaccagcg atcctctcta 4620
cctctggagc taacctttca gccatggtgt taactgtgtt ggcacccatg gcgtctctga 4680
catcaacaat caagtgcaat acgaccattg caccaacagg ggtgtcccta aaaacatgga 4740
cctcaatgtc tctgcaacca ccacctaaac caaccaaaac tggatctacg gcatctgctg 4800
cttccatgaa agcagcctta tgggccaaca acctttgcct agctccttct gggtctccta 4860
atccgacaac ttggatttgg gccctcatta aaggtgcagt tccgtgtgcg gtgaatccac 4920
cgttctctct agctatcctt gccatatatg aggctgcggc aacaacagat ggttcctcga 4980
ctgccatagg tattaagtag tcccttccgt tgacggtgaa gttggtggcg acacccaatg 5040
gcaactcaaa ttttccgata acattctcga tcataccgtt ggccaatgac aaaggcaaag 5100
caccgttacc ggccaatgca gaaatggctt caggttccaa tcctgcggct tcggcaaccc 5160
taactaacct ctgagcagga tccaagtccc tcatcttctc gatccttgag ttcaatccgt 5220
cgatgtgacc tgtctttcca gtcattgtaa agttagttgg ttgcgcgact tcgggtgggg 5280
taagtataga ggtatattaa caattttttg ttgatacttt tatgacattt gaataagaag 5340
taatacaaac cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagct tttgcattta 5400
tatatctgtt aatagatcaa aaatcatcgc ttcgctgatt aattacccca gaaataaggc 5460
taaaaaacta atcgcattat tatcctatgg ttgttaattt gattcgttga tttgaaggtt 5520
tgtggggcca ggttactgcc aatttttcct cttcataacc ataaaagcta gtattgtaga 5580
atctttattg ttcggagcag tgcggcgcga ggcacatctg cgtttcagga acgcgaccgg 5640
tgaagaccag gacgcacgga ggagagtctt ccgtcggagg gctgtcgccc gctcggcggc 5700
ttctaatccg tacttcaata tagcaatgag cagttaagcg tattactgaa agttccaaag 5760
agaaggtttt tttaggctaa gataatgggg ctctttacat ttccacaaca tataagtaag 5820
attagatatg gatatgtata tggtggtatt gccatgtaat atgattatta aacttctttg 5880
cgtccatcca aaaaaaaagt aacgcacgca cactcccgac agacaactag cttgataatg 5940
tctcagaacg tttacattgt atcgactgcc agaaccccaa ttggttcatt ccagggttct 6000
ctatcctcca agacagcagt ggaattgggt gctgttgctt taaaaggcgc cttggctaag 6060
gttccagaat tggatgcatc caaggatttt gacgaaatta tttttggtaa cgttctttct 6120
gccaatttgg gccaagctcc ggccagacaa gttgctttgg ctgccggttt gagtaatcat 6180
atcgttgcaa gcacagttaa caaggtctgt gcatccgcta tgaaggcaat cattttgggt 6240
gctcaatcca tcaaatgtgg taatgctgat gttgtcgtag ctggtggttg tgaatctatg 6300
actaacgcac catactacat gccagcagcc cgtgcgggtg ccaaatttgg ccaaactgtt 6360
cttgttgatg gtgtcgaaag agatgggttg aacgatgcgt acgatggtct agccatgggt 6420
gtacacgcag aaaagtgtgc ccgtgattgg gatattacta gagaacaaca agacaatttt 6480
gccatcgaat cctaccaaaa atctcaaaaa tctcaaaagg aaggtaaatt cgacaatgaa 6540
attgtacctg ttaccattaa gggatttaga ggtaagcctg atactcaagt cacgaaggac 6600
gaggaacctg ctagattaca cgttgaaaaa ttgagatctg caaggactgt tttccaaaaa 6660
gaaaacggta ctgttactgc cgctaacgct tctccaatca acgatggtgc tgcagccgtc 6720
atcttggttt ccgaaaaagt tttgaaggaa aagaatttga agcctttggc tattatcaaa 6780
ggttggggtg aggccgctca tcaaccagct gattttacat gggctccatc tcttgcagtt 6840
ccaaaggctt tgaaacatgc tggcatcgaa gacatcaatt ctgttgatta ctttgaattc 6900
aatgaagcct tttcggttgt cggtttggtg aacactaaga ttttgaagct agacccatct 6960
aaggttaatg tatatggtgg tgctgttgct ctaggtcacc cattgggttg ttctggtgct 7020
agagtggttg ttacactgct atccatctta cagcaagaag gaggtaagat cggtgttgcc 7080
gccatttgta atggtggtgg tggtgcttcc tctattgtca ttgaaaagat atgattacgt 7140
tctgcgattt tctcatgatc tttttcataa aatacataaa tatataaatg gctttatgta 7200
taacaggcat aatttaaagt tttatttgcg attcatcgtt tttcaggtac tcaaacgctg 7260
aggtgtgcct tttgacttac ttttccgcct tggcaagctg gccgaacctg caggccgcga 7320
gcgccgatac gaaaatcgtt attgtcttga aggtgaaatt tctactctta ttaatggtga 7380
acgttaagct gatgctatga tggaagctga ttggtcttaa cttgcttgtc atcttgctaa 7440
tggtcattgg ctcgtgttat tacttaagtt atttgtactc gttttgaacg taatgctaat 7500
gatcatctta tggaataata gtgagtggtt tcagggtcca taaagctttt caattcatct 7560
tttttttttt tgttcttttt tttgattccg gtttctttga aatttttttg attcggtaat 7620
ctccgagcag aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat 7680
atgtggtgtt gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa 7740
aacctgcagg aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac 7800
tcatcctagt cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt 7860
gtgtgcttca ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg 7920
tcccaaaatt tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg 7980
cacagttaag ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag 8040
aaaatttgct gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat 8100
agcagaatgg gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg 8160
tttgaagcag gcggcggaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga 8220
attgtcatgc aagggctccc tagctactgg agaatatact aagggtactg ttgacattgc 8280
gaagagtgac aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga 8340
tgaaggttac gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagacgc 8400
attgggtcaa cagtatagaa ccgtggatga tgtggtctct acaggatctg acattattat 8460
tgttggaaga ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag 8520
aaaagcaggc tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt 8580
ataagtaaat gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt 8640
attaccacga aaatcgttat tgtcttgaag gtgaaatttc tactcttatt aatggtgaac 8700
gttaagctga tgctatgatg gaagctgatt ggtcttaact tgcttgtcat cttgctaatg 8760
gtcatatggc tcgtgttatt acttaagtta tttgtactcg ttttgaacgt aatgctaatg 8820
atcatcttat ggaataatag tgaacggccg gccaagcacg cggggattga atgagaaaaa 8880
aaatcggttg ggcttaactt taaagaaaaa agttgagatt agatttattg tgttataaat 8940
atagatatac aattctttat aaaaaaaata tatatatata tcattgttat taaataaaga 9000
gttttcctag tatatagatt aaaaaactac tctattaaat gagagctaaa aaaagcaggc 9060
tgccaaaaaa ataaagcatt tatgaagggg gttcagcaag atgcaatcga tgggggaaga 9120
ttatttttta acatcgtaag atcttctaaa tttgtcatcg atgttggtca agtagtaaac 9180
accactttgc aaatgctcaa tggaaccttg aggtttgaag ttcttcttca aatgggcatt 9240
ttctctcaat tcgatggcag cttcgtaatc ctttggagtt tcggtgattc tcttggctaa 9300
tttgttagta atatctaatt ccttgataat atgttggacg tcaccaacaa ttttgcaaga 9360
atatagagat gcagctaaac cggaaccgta agaaaataaa ccaacacgct tgccttgtaa 9420
gtcgtcagat ccaacatagt ttaatagaga tgcaaaggcg gcataaacag atgcggtgta 9480
catgttacct gtgtttgttg gaacaatcaa agattgggca actctctctt tgtggaatgg 9540
cttagcaaca ttaacaaaag ttttttcaat gttcttatcg gttaaagatt cgtcataatc 9600
gcgagtagct aattcggcgt caacttctgg gaacaattga ggattggctc tgaaatcgtt 9660
atatagtaat ctaccgtatg attttgtgac caatttacag gttggaacat ggaaaacgtt 9720
gtagtcgaaa tatttcaaaa cgttcaaagc atccgaacca gcgggatcgc taaccaaccc 9780
tttagaaata gccttcttgg aataactctt gtaaacttga tcaagagcct tgacgtaaca 9840
agttaatgaa aaatgaccat cgacgtaagg atattcgctg gtgaaatctg gcttgtaaaa 9900
atcgtaggcg tgttccatgt aagaagctct tacagagtca aatacaattg gagcatcagg 9960
accgatccac atagcaacag taccggcacc accggttggt cttgcggcac ccttatcgta 10020
gatggcaata tcaccgcaaa ctacaatggc gtctctacca tcccatgcgt tagattcaat 10080
ccagttcaaa gagttgaaca acgcgttggt accaccgtaa caggcattaa gcgtgtcaat 10140
accttcgacg tcagtgtttt caccaaacaa ttgcatcaag acagacttga cagacttgga 10200
cttgtcaatc agagtttcag taccgacttc taatctacca attttgttgg tgtcgatgtt 10260
gtaactcttg atcaacttag acaaaacagt tagggacatc gagtagatat cttctctgtc 10320
attgacaaaa gacatgttgg tttggcccag accaattgtg tatttacctt gagaaacgcc 10380
atcaaatttc tctagctcag attggttgac acattgagtt gggatgtaaa tttggatacc 10440
tttaataccg acattttgag gtctggtttt ttgttcagcg gtcttttgtt tttttagttc 10500
agtcatttgc aagtttgtat tgtgtaattg ttgttgcttt tgcggcctaa gtcttccttt 10560
aataccacac caacaaagtt tagttgagag tttcattgtg aaggtagttc gattttggag 10620
gtcgcgggag gttacttttt ttttggatgg acgcaaagaa gtttaataat catattacat 10680
ggcaatacca ccatatacat atccatatct aatcttactt atatgttgtg gaaatgtaaa 10740
gagccccatt atcttagcct aaaaaaacct tctctttgga actttcagta atacgcttaa 10800
ctgctcattg ctatattgaa gtacggatta gaagccgccg agcgggcgac agccctccga 10860
cggaagactc tcctccgtgc gtcctggtct tcaccggtcg cgttcctgaa acgcagatgt 10920
gcctcgcgcc gcactgctcc gaacaataaa gattctacaa tactagcttt tatggttatg 10980
aagaggaaaa attggcagta acctggcccc acaaaccttc aaatcaacga atcaaattaa 11040
caaccatagg ataataatgc gattagtttt ttagccttat ttctggggta attaatcagc 11100
gaagcgatga tttttgatct attaacagat atataaatgc aaaagctgca taaccacttt 11160
aactaatact ttcaacattt tcggtttgta ttacttctta ttcaaatgtc ataaaagtat 11220
caacaaaaaa ttgttaatat acctctatac ttaccccacc cgaagtcgcg caaccaacta 11280
actttacaat gactggaaag acaggtcaca tcgacggatt gaactcaagg atcgagaaga 11340
tgagggactt ggatcctgct cagaggttag ttagggttgc cgaagccgca ggattggaac 11400
ctgaagccat ttctgcattg gccggtaacg gtgctttgcc tttgtcattg gccaacggta 11460
tgatcgagaa tgttatcgga aaatttgagt tgccattggg tgtcgccacc aacttcaccg 11520
tcaacggaag ggactactta atacctatgg cagtcgagga accatctgtt gttgccgcag 11580
cctcatatat ggcaaggata gctagagaga acggtggatt caccgcacac ggaactgcac 11640
ctttaatgag ggcccaaatc caagttgtcg gattaggaga cccagaagga gctaggcaaa 11700
ggttgttggc ccataaggct gctttcatgg aagcagcaga tgccgtagat ccagttttgg 11760
ttggtttagg tggtggttgc agagacattg aggtccatgt ttttagggac acccctgttg 11820
gtgcaatggt cgtattgcac ttgattgttg atgtcagaga cgccatgggt gccaacacag 11880
ttaacaccat ggctgaaagg ttagctccag aggtagagag gatcgctggt ggaaccgtca 11940
ggttgaggat tttgtctaac ttggccgact tgaggttggt aagagccagg gttgagttag 12000
cccctgagac tttgaccacc cagggatacg atggtgccga cgttgcaagg ggaatggttg 12060
aagcctgcgc cttagcaata gtcgaccctt acagggccgc aacccataac aagggaatta 12120
tgaacggaat tgacccagtc gtcgtcgcaa caggtaacga ctggagggcc atcgaagctg 12180
gagcccacgc ctacgccgcc aggaccggac attacacctc tttgacaagg tgggagttgg 12240
ccaacgacgg taggttggtc ggtaccattg aattgccttt ggccttgggt ttggtaggag 12300
gagccaccaa gactcaccct acagctaggg ccgctttggc cttaatgcag gtcgaaaccg 12360
ctactgagtt ggcccaggtt actgccgccg ttggtttggc tcagaatatg gccgcaatta 12420
gggccttggc aaccgaggga atccaaaggg gacacatgac cttacacgca aggaacatcg 12480
caatcatggc cggtgccacc ggagccgaca ttgacagggt caccagggtc atcgttgaag 12540
ccggagacgt atctgtcgcc agggctaaac aggttttgga aaatacataa acttagtcat 12600
acgtcattgg tattctcttg aaaaagaagc acaacagcac catgtgttac gtaaaatatt 12660
tactttatag tttgtacgtc ataatttctt ccatattaca agttcgtgca tatatagaaa 12720
gaattctgtt gttgtaattg tcataactag gtccgccggc gttggacgag cgaatgtgta 12780
tattagttta aaaagttgta tgtaataaaa gtaaaattta atattttgga tgaaaaaaac 12840
catttttaga ctttttctta actagaatgc tggagtagaa atacgccatc tcaagataca 12900
aaaagcgtta ccggcactga tttgtttcaa ccagtatata gattattatt gggtcttgat 12960
caactttcct cagacatatc agtaacagtt atcaagctaa atatttacgc gaaagaaaaa 13020
caaatatttt aattgtgata cttgtgaatt ttattttatt aaggatacaa agttaagaga 13080
aaacaaaatt tatatacaat ataagtaata ttcatatata tgtgatgaat gcagtcttaa 13140
cgagaagaca tggccttggt gacaactctc ttcaaaccaa cttcagcctt tctcaattca 13200
tcagcagatg ggtcttcgat ttgcaaagca gccaaagcgg cggtttaaac gcgtggccgt 13260
gccgtc 13266
<210> 52
<211> 13712
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i84024 integration construct
<400> 52
gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60
aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120
cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180
aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240
gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300
acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360
aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420
agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480
acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540
atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600
aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660
gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720
tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780
ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840
tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900
cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960
ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020
agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080
cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140
ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200
acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260
aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320
aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380
ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440
tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500
ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560
gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620
tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680
tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740
tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800
attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860
tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920
tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980
cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040
atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100
gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160
aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220
cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280
agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340
tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400
gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460
agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520
tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580
agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640
acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700
acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760
atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820
cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880
ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940
ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000
aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060
ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120
cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180
cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240
ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300
cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360
tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420
cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480
ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540
tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600
attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660
ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720
atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780
gccgtccgca tgactcaaga gaagcatgtg gtttttgagt ttttttcgtt gaattttcag 3840
gtaaagctca atagttatga caattacaac aacagaattc tttctatata tgcacgaact 3900
tgtaatatgg aagaaattat gacgtacaaa ctataaagta aatattttac gtaacacatg 3960
gtgctgttgt gcttcttttt caagagaata ccaatgacgt atgactaagt ttaggattta 4020
atgcaggtga cggacccatc tttcaaacga tttatatcag tggcgtccaa attgttaggt 4080
tttgttggtt cagcaggttt cctgttgtgg gtcatatgac tttgaaccaa atggccggct 4140
gctagggcag cacataagga taattcacct gccaagacgg cacaggcaac tattcttgct 4200
aattgacgtg cgttggtacc aggagcggta gcatgtgggc ctcttacacc taataagtcc 4260
aacatggcac cttgtggttc tagaacagta ccaccaccga tggtacctac ttcgatggat 4320
ggcatggata cggaaattct caaatcaccg tccacttctt tcatcaatgt tatacagttg 4380
gaactttcga cattttgtgc aggatcttgt cctaatgcca agaaaacagc tgtcactaaa 4440
ttagctgcat gtgcgttaaa tccaccaaca gacccagcca ttgcagatcc aaccaaattc 4500
ttagcaatgt tcaactcaac caatgcggaa acatcacttt ttaacacttt tctgacaaca 4560
tcaccaggaa tagtagcttc tgcgacgaca ctcttaccac gaccttcgat ccagttgatg 4620
gcagctggtt ttttgtcggt acagtagtta ccagaaacgg agacaacctc catatcttcc 4680
cagccatact cttctaccat ttgctttaat gagtattcga cacccttaga aatcatattc 4740
atacccattg cgtcaccagt agttgttcta aatctcatga agagtaaatc tcctgctaga 4800
caagtttgaa tatgttgcag acgtgcaaat cttgatgtag agttaaaagc ttttttaatt 4860
gcgttttgtc cctcttctga gtctaaccat atcttacagg caccagatct tttcaaagtt 4920
gggaaacgga ctactgggcc tcttgtcata ccatccttag ttaaaacagt tgttgcacca 4980
ccgccagcat tgattgcctt acagccacgc atggcagaag ctaccaaaca accctctgta 5040
gttgccattg gtatatgata agatgtacca tcgataacca aggggcctat aacaccaacg 5100
ggcaaaggca tgtaacctat aacattttca caacaagcgc caaatacgcg gtcgtagtca 5160
taatttttat atggtaaacg atcagatgct aatacaggag cttctgccaa aattgaaaga 5220
gccttcctac gtaccgcaac cgctctcgta gtatcaccta attttttctc caaagcgtac 5280
aaaggtaact taccgtgaat aaccaaggca gcgacctctt tgttcttcaa ttgttttgta 5340
tttccactac ttaataatgc ttctaattct tctaaaggac gtattttctt atccaagctt 5400
tcaatatcgc gggaatcatc ttcctcacta gatgatgaag gtcctgatga gctcgattgc 5460
gcagatgata aacttttgac tttcgatcca gaaatgactg ttttattggt taaaactggt 5520
gtagaagcct tttgtacagg agcagtaaaa gacttcttgg tgacttcagt cttcaccaat 5580
tggtctgcag ccattgtaaa gttagttggt tgcgcgactt cgggtggggt aagtatagag 5640
gtatattaac aattttttgt tgatactttt atgacatttg aataagaagt aatacaaacc 5700
gaaaatgttg aaagtattag ttaaagtggt tatgcagctt ttgcatttat atatctgtta 5760
atagatcaaa aatcatcgct tcgctgatta attaccccag aaataaggct aaaaaactaa 5820
tcgcattatt atcctatggt tgttaatttg attcgttgat ttgaaggttt gtggggccag 5880
gttactgcca atttttcctc ttcataacca taaaagctag tattgtagaa tctttattgt 5940
tcggagcagt gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt gaagaccagg 6000
acgcacggag gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct tctaatccgt 6060
acttcaatat agcaatgagc agttaagcgt attactgaaa gttccaaaga gaaggttttt 6120
ttaggctaag ataatggggc tctttacatt tccacaacat ataagtaaga ttagatatgg 6180
atatgtatat ggtggtattg ccatgtaata tgattattaa acttctttgc gtccatccaa 6240
aaaaaaagta acgcacgcac actcccgaca gacaactagc ttgataatga ctgatgttcg 6300
tttcagaatc atcggtaccg gtgcctatgt tccagaaaga attgtttcta acgacgaagt 6360
tggtgctcca gctggtgttg atgacgactg gatcaccaga aagactggta tcagacaaag 6420
aagatgggct gctgatgacc aagctacttc tgacttagct actgctgctg gtagagccgc 6480
cttgaaggct gctggtatta ctccagaaca attgactgtt atcgctgttg ctacctccac 6540
tccagataga ccacaaccac ctaccgctgc ctacgttcaa caccacttgg gtgctactgg 6600
tactgctgct ttcgacgtta acgctgtttg ttccggtact gttttcgcct tatcttctgt 6660
cgccggtacc ttggtctaca gaggtggtta tgctttggtt atcggtgctg acttgtactc 6720
cagaatcttg aatccagctg acagaaagac cgttgttttg ttcggtgatg gtgctggtgc 6780
tatggttttg ggtccaactt ctactggtac tggtccaatc gttagaagag tcgctttaca 6840
cacctttggt ggtttaaccg atttgattag agttccagct ggtggttcta gacaaccatt 6900
ggacactgac ggtttggacg ccggtttgca atactttgcc atggacggta gagaagttag 6960
acgtttcgtc actgaacatt tgccacaatt gatcaaaggt ttcttgcatg aagctggtgt 7020
tgacgctgct gatatttctc atttcgtccc acatcaagcc aacggtgtta tgttggacga 7080
agtttttggt gaattgcatt tgccaagagc taccatgcac agaactgttg aaacttacgg 7140
taataccggt gctgcttcca ttccaattac tatggacgct gctgttagag ccggttcctt 7200
tagaccaggt gaattggtct tattggctgg ttttggtggt ggtatggccg cctctttcgc 7260
cttgattgaa tggtagatgc tatgtaatag acaataaaac catgtttata taaaaaaaat 7320
tcaaaataga aaacgattct gtacaaggag tatttttttt ttgttctagt gtgtttatat 7380
tatccttggc taagaggcac taacctgcag gccgcgagcg ccgatacgaa aatcgttatt 7440
gtcttgaagg tgaaatttct actcttatta atggtgaacg ttaagctgat gctatgatgg 7500
aagctgattg gtcttaactt gcttgtcatc ttgctaatgg tcattggctc gtgttattac 7560
ttaagttatt tgtactcgtt ttgaacgtaa tgctaatgat catcttatgg aataatagtg 7620
agtggtttca gggtccataa agcttttcaa ttcatctttt ttttttttgt tctttttttt 7680
gattccggtt tctttgaaat ttttttgatt cggtaatctc cgagcagaag gaagaacgaa 7740
ggaaggagca cagacttaga ttggtatata tacgcatatg tggtgttgaa gaaacatgaa 7800
attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa 7860
tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca 7920
agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta 7980
ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa 8040
cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat 8100
tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 8160
cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 8220
atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcggaagaag 8280
taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctag 8340
ctactggaga atatactaag ggtactgttg acattgcgaa gagtgacaaa gattttgtta 8400
tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta 8460
tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg 8520
tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa 8580
agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt 8640
tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa 8700
actcacaaat tagagcttca atttaattat atcagttatt accacgaaaa tcgttattgt 8760
cttgaaggtg aaatttctac tcttattaat ggtgaacgtt aagctgatgc tatgatggaa 8820
gctgattggt cttaacttgc ttgtcatctt gctaatggtc atatggctcg tgttattact 8880
taagttattt gtactcgttt tgaacgtaat gctaatgatc atcttatgga ataatagtga 8940
acggccggcc aagcacgcgg ggattgaatg agaaaaaaaa tcggttgggc ttaactttaa 9000
agaaaaaagt tgagattaga tttattgtgt tataaatata gatatacaat tctttataaa 9060
aaaaatatat atatatatca ttgttattaa ataaagagtt ttcctagtat atagattaaa 9120
aaactactct attaaatgag agctaaaaaa agcaggctgc caaaaaaata aagcatttat 9180
gaagggggtt cagcaagatg caatcgatgg gggaagatta ttttttaaca tcgtaagatc 9240
ttctaaattt gtcatcgatg ttggtcaagt agtaaacacc actttgcaaa tgctcaatgg 9300
aaccttgagg tttgaagttc ttcttcaaat gggcattttc tctcaattcg atggcagctt 9360
cgtaatcctt tggagtttcg gtgattctct tggctaattt gttagtaata tctaattcct 9420
tgataatatg ttggacgtca ccaacaattt tgcaagaata tagagatgca gctaaaccgg 9480
aaccgtaaga aaataaacca acacgcttgc cttgtaagtc gtcagatcca acatagttta 9540
atagagatgc aaaggcggca taaacagatg cggtgtacat gttacctgtg tttgttggaa 9600
caatcaaaga ttgggcaact ctctctttgt ggaatggctt agcaacatta acaaaagttt 9660
tttcaatgtt cttatcggtt aaagattcgt cataatcgcg agtagctaat tcggcgtcaa 9720
cttctgggaa caattgagga ttggctctga aatcgttata tagtaatcta ccgtatgatt 9780
ttgtgaccaa tttacaggtt ggaacatgga aaacgttgta gtcgaaatat ttcaaaacgt 9840
tcaaagcatc cgaaccagcg ggatcgctaa ccaacccttt agaaatagcc ttcttggaat 9900
aactcttgta aacttgatca agagccttga cgtaacaagt taatgaaaaa tgaccatcga 9960
cgtaaggata ttcgctggtg aaatctggct tgtaaaaatc gtaggcgtgt tccatgtaag 10020
aagctcttac agagtcaaat acaattggag catcaggacc gatccacata gcaacagtac 10080
cggcaccacc ggttggtctt gcggcaccct tatcgtagat ggcaatatca ccgcaaacta 10140
caatggcgtc tctaccatcc catgcgttag attcaatcca gttcaaagag ttgaacaacg 10200
cgttggtacc accgtaacag gcattaagcg tgtcaatacc ttcgacgtca gtgttttcac 10260
caaacaattg catcaagaca gacttgacag acttggactt gtcaatcaga gtttcagtac 10320
cgacttctaa tctaccaatt ttgttggtgt cgatgttgta actcttgatc aacttagaca 10380
aaacagttag ggacatcgag tagatatctt ctctgtcatt gacaaaagac atgttggttt 10440
ggcccagacc aattgtgtat ttaccttgag aaacgccatc aaatttctct agctcagatt 10500
ggttgacaca ttgagttggg atgtaaattt ggataccttt aataccgaca ttttgaggtc 10560
tggttttttg ttcagcggtc ttttgttttt ttagttcagt catttgcaag tttgtattgt 10620
gtaattgttg ttgcttttgc ggcctaagtc ttcctttaat accacaccaa caaagtttag 10680
ttgagagttt cattgtgaag gtagttcgat tttggaggtc gcgggaggtt actttttttt 10740
tggatggacg caaagaagtt taataatcat attacatggc aataccacca tatacatatc 10800
catatctaat cttacttata tgttgtggaa atgtaaagag ccccattatc ttagcctaaa 10860
aaaaccttct ctttggaact ttcagtaata cgcttaactg ctcattgcta tattgaagta 10920
cggattagaa gccgccgagc gggcgacagc cctccgacgg aagactctcc tccgtgcgtc 10980
ctggtcttca ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa 11040
caataaagat tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc 11100
tggccccaca aaccttcaaa tcaacgaatc aaattaacaa ccataggata ataatgcgat 11160
tagtttttta gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt 11220
aacagatata taaatgcaaa agctgcataa ccactttaac taatactttc aacattttcg 11280
gtttgtatta cttcttattc aaatgtcata aaagtatcaa caaaaaattg ttaatatacc 11340
tctatactta ccccacccga agtcgcgcaa ccaactaact ttacaatggc tgcagaccaa 11400
ttggtgaaga ctgaagtcac caagaagtct tttactgctc ctgtacaaaa ggcttctaca 11460
ccagttttaa ccaataaaac agtcatttct ggatcgaaag tcaaaagttt atcatctgcg 11520
caatcgagct catcaggacc ttcatcatct agtgaggaag atgattcccg cgatattgaa 11580
agcttggata agaaaatacg tcctttagaa gaattagaag cattattaag tagtggaaat 11640
acaaaacaat tgaagaacaa agaggtcgct gccttggtta ttcacggtaa gttacctttg 11700
tacgctttgg agaaaaaatt aggtgatact acgagagcgg ttgcggtacg taggaaggct 11760
ctttcaattt tggcagaagc tcctgtatta gcatctgatc gtttaccata taaaaattat 11820
gactacgacc gcgtatttgg cgcttgttgt gaaaatgtta taggttacat gcctttgccc 11880
gttggtgtta taggcccctt ggttatcgat ggtacatctt atcatatacc aatggcaact 11940
acagagggtt gtttggtagc ttctgccatg cgtggctgta aggcaatcaa tgctggcggt 12000
ggtgcaacaa ctgttttaac taaggatggt atgacaagag gcccagtagt ccgtttccca 12060
actttgaaaa gatctggtgc ctgtaagata tggttagact cagaagaggg acaaaacgca 12120
attaaaaaag cttttaactc tacatcaaga tttgcacgtc tgcaacatat tcaaacttgt 12180
ctagcaggag atttactctt catgagattt agaacaacta ctggtgacgc aatgggtatg 12240
aatatgattt ctaagggtgt cgaatactca ttaaagcaaa tggtagaaga gtatggctgg 12300
gaagatatgg aggttgtctc cgtttctggt aactactgta ccgacaaaaa accagctgcc 12360
atcaactgga tcgaaggtcg tggtaagagt gtcgtcgcag aagctactat tcctggtgat 12420
gttgtcagaa aagtgttaaa aagtgatgtt tccgcattgg ttgagttgaa cattgctaag 12480
aatttggttg gatctgcaat ggctgggtct gttggtggat ttaacgcaca tgcagctaat 12540
ttagtgacag ctgttttctt ggcattagga caagatcctg cacaaaatgt cgaaagttcc 12600
aactgtataa cattgatgaa agaagtggac ggtgatttga gaatttccgt atccatgcca 12660
tccatcgaag taggtaccat cggtggtggt actgttctag aaccacaagg tgccatgttg 12720
gacttattag gtgtaagagg cccacatgct accgctcctg gtaccaacgc acgtcaatta 12780
gcaagaatag ttgcctgtgc cgtcttggca ggtgaattat ccttatgtgc tgccctagca 12840
gccggccatt tggttcaaag tcatatgacc cacaacagga aacctgctga accaacaaaa 12900
cctaacaatt tggacgccac tgatataaat cgtttgaaag atgggtccgt cacctgcatt 12960
aaatcctaaa cttagtcata cgtcattggt attctcttga aaaagaagca caacagcacc 13020
atgtgttacg taaaatattt actttatagt ttgtacgtca taatttcttc catattacaa 13080
gttcgtgcat atatagaaag aattctgttg ttgtaattgt cataactatt gagctttacc 13140
tgaaaattca acgaaaaaaa ctcaaaaacc acatgcttct cttgagtcat gcggaggtcc 13200
gccggcgttg gacgagcgaa tgtgtatatt agtttaaaaa gttgtatgta ataaaagtaa 13260
aatttaatat tttggatgaa aaaaaccatt tttagacttt ttcttaacta gaatgctgga 13320
gtagaaatac gccatctcaa gatacaaaaa gcgttaccgg cactgatttg tttcaaccag 13380
tatatagatt attattgggt cttgatcaac tttcctcaga catatcagta acagttatca 13440
agctaaatat ttacgcgaaa gaaaaacaaa tattttaatt gtgatacttg tgaattttat 13500
tttattaagg atacaaagtt aagagaaaac aaaatttata tacaatataa gtaatattca 13560
tatatatgtg atgaatgcag tcttaacgag aagacatggc cttggtgaca actctcttca 13620
aaccaacttc agcctttctc aattcatcag cagatgggtc ttcgatttgc aaagcagcca 13680
aagcggcggt ttaaacgcgt ggccgtgccg tc 13712
<210> 53
<211> 13964
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i84026 integration construct
<400> 53
gacggcacgg ccacgcgttt aaaccgccaa gtgatgtaac taaatacacg attaccatgg 60
aaattaacgt accttttttg tgcgtgtatt gaaatattat gacatattac agaaagggtt 120
cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 180
aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 240
gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 300
acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 360
aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 420
agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 480
acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 540
atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 600
aattctatct atactttaaa cgctcgtcca acgccggcgg acctgatgtg tattactagt 660
gtcgacgaca gcattcgccc agtatttttt ttattctaca aaccttctat aatttcaaag 720
tatttacata attctgtatc agtttaatca ccataatatc gttttctttg tttagtgcaa 780
ttaatttttc ctattgttac ttcgggcctt tttctgtttt atgagctatt ttttccgtca 840
tccttccgga tccagatttt cagcttcatc tccagattgt gtctacgtaa tgcacgccat 900
cattttaaga gaggacctcc cgcgacctcc aaaatcgaac taccttcaca atgaaacttc 960
ttagtagtat tgagcaggcg tgtgacatct gtagattgaa gaaattgaaa tgtagtaagg 1020
agaagcccaa atgtgcgaaa tgccttaaaa ataattggga atgcagatat agtccgaaga 1080
cgaagcgcag tccccttacc cgcgcgcacc ttacggaggt cgagagtcgc cttgagcgcc 1140
ttgagcaact tttccttctt atcttcccca gagaggattt ggatatgatc cttaagatgg 1200
acagtcttca agacattaag gcgcttctta cggggctttt cgtgcaggac aacgtcaaca 1260
aggacgcggt gacggaccgc cttgccagtg tcgaaaccga catgcccctt acgcttcgcc 1320
aacaccgcat ttccgccacg agtagtagtg aggaatcctc caataagggg cagcgccaac 1380
ttaccgtgag tatcgatagt gcggcccacc acgacaatag tacgatcccc cttgacttca 1440
tgccgcgcga cgccttgcac gggttcgact ggagtgagga agacgatatg agtgacggtc 1500
ttccgtttct taagaccgat ccgaataaca acggtttttt cggtgatggg agtttgcttt 1560
gcatcttgag aagtatcggt ttcaagcccg agaactatac caatagtaat gtcaatcgct 1620
tgcccacgat gatcaccgac cgctataccc ttgccagtcg cagtacgacg agtagacttt 1680
tgcagtccta cttgaacaac ttccatccgt attgtcccat tgtccatagt cccaccctta 1740
tgatgcttta caacaatcaa atcgagattg ccagtaaaga ccagtggcag attttgttca 1800
attgtattct tgcgatcggg gcgtggtgca ttgaaggtga gagtaccgac attgacgtct 1860
tctattacca gaacgccaag agtcacctta cctccaaagt gtttgaaagt gggagtatta 1920
tccttgtcac ggcgcttcac ttgcttagta gatacacgca atggcgccaa aagacgaaca 1980
cctcctacaa cttccattcc ttcagtattc gcatggcgat tagtcttggt cttaaccgcg 2040
atttgccgag tagtttttcc gactcctcca tccttgagca gcgcagaaga atctggtgga 2100
gtgtgtatag ttgggaaatt cagcttagtc ttttgtacgg gagaagtatt caattgagtc 2160
aaaacacgat tagttttccc agtagtgtgg atgacgtcca aagaacgacg acggggccga 2220
cgatttacca cggtattatc gagacggcgc gcttgcttca ggtctttacg aagatttacg 2280
agcttgataa gacggtgacc gcggagaagt cccccatttg cgcgaagaag tgtcttatga 2340
tctgcaacga aatcgaagaa gtcagtcgcc aagcgccgaa attccttcag atggacatca 2400
gtacgacggc ccttacgaac cttcttaaag agcatccctg gcttagtttc acgcgctttg 2460
agcttaaatg gaagcaactt agtttgatta tctacgtgct tcgcgacttc tttaccaact 2520
tcacgcaaaa gaaaagtcag cttgagcaag accagaacga ccaccagtcc tacgaggtca 2580
agagatgtag tattatgctt tccgacgcgg cgcagcgcac cgtcatgagt gtgtcctcct 2640
acatggataa ccacaacgtg acgccgtact tcgcgtggaa ctgcagttac tatcttttta 2700
acgcggtgct tgtgccgatt aaaacccttt tgagtaatag taagagtaac gccgaaaaca 2760
atgaaacggc gcagcttctt cagcagatca ataccgtcct tatgcttctt aagaagcttg 2820
cgaccttcaa gattcaaacc tgcgagaagt atatccaggt gcttgaggaa gtgtgcgccc 2880
ccttccttct tagtcaatgc gcgattccgc ttccccacat ttcctacaat aactccaacg 2940
ggtccgcgat caagaacatc gtggggagtg cgaccattgc gcagtatccc accttgcccg 3000
aagagaacgt gaataacatt tccgtcaagt acgtcagtcc cggtagtgtg ggtcccagtc 3060
ccgtcccgct taagagtggg gcgtcctttt ccgaccttgt gaaacttctt agtaatagac 3120
cgccgagtag aaatagtccg gtcacgattc cgcgctccac gcccagtcac agaagtgtga 3180
cccccttcct tggtcagcaa cagcaacttc agagtcttgt cccgcttacg cccagtgccc 3240
ttttcggggg tgcgaacttc aaccagtccg gtaacatcgc cgactccagt cttagtttta 3300
cctttaccaa ttcctccaat gggcccaatt tgattacgac ccagacgaac agtcaggcct 3360
tgagtcagcc gatcgcgagt agtaatgtcc acgacaattt tatgaacaac gagattaccg 3420
cctccaagat cgacgacggg aacaacagta agccgcttag tcccgggtgg accgatcaga 3480
ccgcctacaa tgccttcggg attaccacgg gtatgttcaa cacgaccacg atggacgacg 3540
tgtacaatta cctttttgac gacgaggaca cgccgccgaa tccgaagaag gaatgagcca 3600
attggtgcgg caattgataa taacgaaaat gtcttttaat gatctgggta taatgaggaa 3660
ttttccgaac gtttttactt tatatatata tatacatgta acatatattc tatacgctat 3720
atcgagaaaa cgcgatggtg gggtgacttt caactcggcg tatccccgcg tgcttggccg 3780
gccgtccgca tgactcaaga gaagcatgtg gtttttgagt ttttttcgtt gaattttcag 3840
gtaaagctca atagttatga caattacaac aacagaattc tttctatata tgcacgaact 3900
tgtaatatgg aagaaattat gacgtacaaa ctataaagta aatattttac gtaacacatg 3960
gtgctgttgt gcttcttttt caagagaata ccaatgacgt atgactaagt ttaggattta 4020
atgcaggtga cggacccatc tttcaaacga tttatatcag tggcgtccaa attgttaggt 4080
tttgttggtt cagcaggttt cctgttgtgg gtcatatgac tttgaaccaa atggccggct 4140
gctagggcag cacataagga taattcacct gccaagacgg cacaggcaac tattcttgct 4200
aattgacgtg cgttggtacc aggagcggta gcatgtgggc ctcttacacc taataagtcc 4260
aacatggcac cttgtggttc tagaacagta ccaccaccga tggtacctac ttcgatggat 4320
ggcatggata cggaaattct caaatcaccg tccacttctt tcatcaatgt tatacagttg 4380
gaactttcga cattttgtgc aggatcttgt cctaatgcca agaaaacagc tgtcactaaa 4440
ttagctgcat gtgcgttaaa tccaccaaca gacccagcca ttgcagatcc aaccaaattc 4500
ttagcaatgt tcaactcaac caatgcggaa acatcacttt ttaacacttt tctgacaaca 4560
tcaccaggaa tagtagcttc tgcgacgaca ctcttaccac gaccttcgat ccagttgatg 4620
gcagctggtt ttttgtcggt acagtagtta ccagaaacgg agacaacctc catatcttcc 4680
cagccatact cttctaccat ttgctttaat gagtattcga cacccttaga aatcatattc 4740
atacccattg cgtcaccagt agttgttcta aatctcatga agagtaaatc tcctgctaga 4800
caagtttgaa tatgttgcag acgtgcaaat cttgatgtag agttaaaagc ttttttaatt 4860
gcgttttgtc cctcttctga gtctaaccat atcttacagg caccagatct tttcaaagtt 4920
gggaaacgga ctactgggcc tcttgtcata ccatccttag ttaaaacagt tgttgcacca 4980
ccgccagcat tgattgcctt acagccacgc atggcagaag ctaccaaaca accctctgta 5040
gttgccattg gtatatgata agatgtacca tcgataacca aggggcctat aacaccaacg 5100
ggcaaaggca tgtaacctat aacattttca caacaagcgc caaatacgcg gtcgtagtca 5160
taatttttat atggtaaacg atcagatgct aatacaggag cttctgccaa aattgaaaga 5220
gccttcctac gtaccgcaac cgctctcgta gtatcaccta attttttctc caaagcgtac 5280
aaaggtaact taccgtgaat aaccaaggca gcgacctctt tgttcttcaa ttgttttgta 5340
tttccactac ttaataatgc ttctaattct tctaaaggac gtattttctt atccaagctt 5400
tcaatatcgc gggaatcatc ttcctcacta gatgatgaag gtcctgatga gctcgattgc 5460
gcagatgata aacttttgac tttcgatcca gaaatgactg ttttattggt taaaactggt 5520
gtagaagcct tttgtacagg agcagtaaaa gacttcttgg tgacttcagt cttcaccaat 5580
tggtctgcag ccattgtaaa gttagttggt tgcgcgactt cgggtggggt aagtatagag 5640
gtatattaac aattttttgt tgatactttt atgacatttg aataagaagt aatacaaacc 5700
gaaaatgttg aaagtattag ttaaagtggt tatgcagctt ttgcatttat atatctgtta 5760
atagatcaaa aatcatcgct tcgctgatta attaccccag aaataaggct aaaaaactaa 5820
tcgcattatt atcctatggt tgttaatttg attcgttgat ttgaaggttt gtggggccag 5880
gttactgcca atttttcctc ttcataacca taaaagctag tattgtagaa tctttattgt 5940
tcggagcagt gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt gaagaccagg 6000
acgcacggag gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct tctaatccgt 6060
acttcaatat agcaatgagc agttaagcgt attactgaaa gttccaaaga gaaggttttt 6120
ttaggctaag ataatggggc tctttacatt tccacaacat ataagtaaga ttagatatgg 6180
atatgtatat ggtggtattg ccatgtaata tgattattaa acttctttgc gtccatccaa 6240
aaaaaaagta acgcacgcac actcccgaca gacaactagc ttgataatgt ctcagaacgt 6300
ttacattgta tcgactgcca gaaccccaat tggttcattc cagggttctc tatcctccaa 6360
gacagcagtg gaattgggtg ctgttgcttt aaaaggcgcc ttggctaagg ttccagaatt 6420
ggatgcatcc aaggattttg acgaaattat ttttggtaac gttctttctg ccaatttggg 6480
ccaagctccg gccagacaag ttgctttggc tgccggtttg agtaatcata tcgttgcaag 6540
cacagttaac aaggtctgtg catccgctat gaaggcaatc attttgggtg ctcaatccat 6600
caaatgtggt aatgctgatg ttgtcgtagc tggtggttgt gaatctatga ctaacgcacc 6660
atactacatg ccagcagccc gtgcgggtgc caaatttggc caaactgttc ttgttgatgg 6720
tgtcgaaaga gatgggttga acgatgcgta cgatggtcta gccatgggtg tacacgcaga 6780
aaagtgtgcc cgtgattggg atattactag agaacaacaa gacaattttg ccatcgaatc 6840
ctaccaaaaa tctcaaaaat ctcaaaagga aggtaaattc gacaatgaaa ttgtacctgt 6900
taccattaag ggatttagag gtaagcctga tactcaagtc acgaaggacg aggaacctgc 6960
tagattacac gttgaaaaat tgagatctgc aaggactgtt ttccaaaaag aaaacggtac 7020
tgttactgcc gctaacgctt ctccaatcaa cgatggtgct gcagccgtca tcttggtttc 7080
cgaaaaagtt ttgaaggaaa agaatttgaa gcctttggct attatcaaag gttggggtga 7140
ggccgctcat caaccagctg attttacatg ggctccatct cttgcagttc caaaggcttt 7200
gaaacatgct ggcatcgaag acatcaattc tgttgattac tttgaattca atgaagcctt 7260
ttcggttgtc ggtttggtga acactaagat tttgaagcta gacccatcta aggttaatgt 7320
atatggtggt gctgttgctc taggtcaccc attgggttgt tctggtgcta gagtggttgt 7380
tacactgcta tccatcttac agcaagaagg aggtaagatc ggtgttgccg ccatttgtaa 7440
tggtggtggt ggtgcttcct ctattgtcat tgaaaagata tgattacgtt ctgcgatttt 7500
ctcatgatct ttttcataaa atacataaat atataaatgg ctttatgtat aacaggcata 7560
atttaaagtt ttatttgcga ttcatcgttt ttcaggtact caaacgctga ggtgtgcctt 7620
ttgacttact tttccgcctt ggcaagctgg ccgaacctgc aggccgcgag cgccgatacg 7680
aaaatcgtta ttgtcttgaa ggtgaaattt ctactcttat taatggtgaa cgttaagctg 7740
atgctatgat ggaagctgat tggtcttaac ttgcttgtca tcttgctaat ggtcattggc 7800
tcgtgttatt acttaagtta tttgtactcg ttttgaacgt aatgctaatg atcatcttat 7860
ggaataatag tgagtggttt cagggtccat aaagcttttc aattcatctt tttttttttt 7920
gttctttttt ttgattccgg tttctttgaa atttttttga ttcggtaatc tccgagcaga 7980
aggaagaacg aaggaaggag cacagactta gattggtata tatacgcata tgtggtgttg 8040
aagaaacatg aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga 8100
aacgaagata aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc 8160
ctgttgctgc caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat 8220
tggatgttcg taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt 8280
gtttactaaa aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc 8340
cgctaaaggc attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg 8400
acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg 8460
cagacattac gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg 8520
cggcggaaga agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca 8580
agggctccct agctactgga gaatatacta agggtactgt tgacattgcg aagagtgaca 8640
aagattttgt tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg 8700
attggttgat tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac 8760
agtatagaac cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag 8820
gactatttgc aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct 8880
gggaagcata tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg 8940
catgtatact aaactcacaa attagagctt caatttaatt atatcagtta ttaccacgaa 9000
aatcgttatt gtcttgaagg tgaaatttct actcttatta atggtgaacg ttaagctgat 9060
gctatgatgg aagctgattg gtcttaactt gcttgtcatc ttgctaatgg tcatatggct 9120
cgtgttatta cttaagttat ttgtactcgt tttgaacgta atgctaatga tcatcttatg 9180
gaataatagt gaacggccgg ccaagcacgc ggggattgaa tgagaaaaaa aatcggttgg 9240
gcttaacttt aaagaaaaaa gttgagatta gatttattgt gttataaata tagatataca 9300
attctttata aaaaaaatat atatatatat cattgttatt aaataaagag ttttcctagt 9360
atatagatta aaaaactact ctattaaatg agagctaaaa aaagcaggct gccaaaaaaa 9420
taaagcattt atgaaggggg ttcagcaaga tgcaatcgat gggggaagat tattttttaa 9480
catcgtaaga tcttctaaat ttgtcatcga tgttggtcaa gtagtaaaca ccactttgca 9540
aatgctcaat ggaaccttga ggtttgaagt tcttcttcaa atgggcattt tctctcaatt 9600
cgatggcagc ttcgtaatcc tttggagttt cggtgattct cttggctaat ttgttagtaa 9660
tatctaattc cttgataata tgttggacgt caccaacaat tttgcaagaa tatagagatg 9720
cagctaaacc ggaaccgtaa gaaaataaac caacacgctt gccttgtaag tcgtcagatc 9780
caacatagtt taatagagat gcaaaggcgg cataaacaga tgcggtgtac atgttacctg 9840
tgtttgttgg aacaatcaaa gattgggcaa ctctctcttt gtggaatggc ttagcaacat 9900
taacaaaagt tttttcaatg ttcttatcgg ttaaagattc gtcataatcg cgagtagcta 9960
attcggcgtc aacttctggg aacaattgag gattggctct gaaatcgtta tatagtaatc 10020
taccgtatga ttttgtgacc aatttacagg ttggaacatg gaaaacgttg tagtcgaaat 10080
atttcaaaac gttcaaagca tccgaaccag cgggatcgct aaccaaccct ttagaaatag 10140
ccttcttgga ataactcttg taaacttgat caagagcctt gacgtaacaa gttaatgaaa 10200
aatgaccatc gacgtaagga tattcgctgg tgaaatctgg cttgtaaaaa tcgtaggcgt 10260
gttccatgta agaagctctt acagagtcaa atacaattgg agcatcagga ccgatccaca 10320
tagcaacagt accggcacca ccggttggtc ttgcggcacc cttatcgtag atggcaatat 10380
caccgcaaac tacaatggcg tctctaccat cccatgcgtt agattcaatc cagttcaaag 10440
agttgaacaa cgcgttggta ccaccgtaac aggcattaag cgtgtcaata ccttcgacgt 10500
cagtgttttc accaaacaat tgcatcaaga cagacttgac agacttggac ttgtcaatca 10560
gagtttcagt accgacttct aatctaccaa ttttgttggt gtcgatgttg taactcttga 10620
tcaacttaga caaaacagtt agggacatcg agtagatatc ttctctgtca ttgacaaaag 10680
acatgttggt ttggcccaga ccaattgtgt atttaccttg agaaacgcca tcaaatttct 10740
ctagctcaga ttggttgaca cattgagttg ggatgtaaat ttggatacct ttaataccga 10800
cattttgagg tctggttttt tgttcagcgg tcttttgttt ttttagttca gtcatttgca 10860
agtttgtatt gtgtaattgt tgttgctttt gcggcctaag tcttccttta ataccacacc 10920
aacaaagttt agttgagagt ttcattgtga aggtagttcg attttggagg tcgcgggagg 10980
ttactttttt tttggatgga cgcaaagaag tttaataatc atattacatg gcaataccac 11040
catatacata tccatatcta atcttactta tatgttgtgg aaatgtaaag agccccatta 11100
tcttagccta aaaaaacctt ctctttggaa ctttcagtaa tacgcttaac tgctcattgc 11160
tatattgaag tacggattag aagccgccga gcgggcgaca gccctccgac ggaagactct 11220
cctccgtgcg tcctggtctt caccggtcgc gttcctgaaa cgcagatgtg cctcgcgccg 11280
cactgctccg aacaataaag attctacaat actagctttt atggttatga agaggaaaaa 11340
ttggcagtaa cctggcccca caaaccttca aatcaacgaa tcaaattaac aaccatagga 11400
taataatgcg attagttttt tagccttatt tctggggtaa ttaatcagcg aagcgatgat 11460
ttttgatcta ttaacagata tataaatgca aaagctgcat aaccacttta actaatactt 11520
tcaacatttt cggtttgtat tacttcttat tcaaatgtca taaaagtatc aacaaaaaat 11580
tgttaatata cctctatact taccccaccc gaagtcgcgc aaccaactaa ctttacaatg 11640
gctgcagacc aattggtgaa gactgaagtc accaagaagt cttttactgc tcctgtacaa 11700
aaggcttcta caccagtttt aaccaataaa acagtcattt ctggatcgaa agtcaaaagt 11760
ttatcatctg cgcaatcgag ctcatcagga ccttcatcat ctagtgagga agatgattcc 11820
cgcgatattg aaagcttgga taagaaaata cgtcctttag aagaattaga agcattatta 11880
agtagtggaa atacaaaaca attgaagaac aaagaggtcg ctgccttggt tattcacggt 11940
aagttacctt tgtacgcttt ggagaaaaaa ttaggtgata ctacgagagc ggttgcggta 12000
cgtaggaagg ctctttcaat tttggcagaa gctcctgtat tagcatctga tcgtttacca 12060
tataaaaatt atgactacga ccgcgtattt ggcgcttgtt gtgaaaatgt tataggttac 12120
atgcctttgc ccgttggtgt tataggcccc ttggttatcg atggtacatc ttatcatata 12180
ccaatggcaa ctacagaggg ttgtttggta gcttctgcca tgcgtggctg taaggcaatc 12240
aatgctggcg gtggtgcaac aactgtttta actaaggatg gtatgacaag aggcccagta 12300
gtccgtttcc caactttgaa aagatctggt gcctgtaaga tatggttaga ctcagaagag 12360
ggacaaaacg caattaaaaa agcttttaac tctacatcaa gatttgcacg tctgcaacat 12420
attcaaactt gtctagcagg agatttactc ttcatgagat ttagaacaac tactggtgac 12480
gcaatgggta tgaatatgat ttctaagggt gtcgaatact cattaaagca aatggtagaa 12540
gagtatggct gggaagatat ggaggttgtc tccgtttctg gtaactactg taccgacaaa 12600
aaaccagctg ccatcaactg gatcgaaggt cgtggtaaga gtgtcgtcgc agaagctact 12660
attcctggtg atgttgtcag aaaagtgtta aaaagtgatg tttccgcatt ggttgagttg 12720
aacattgcta agaatttggt tggatctgca atggctgggt ctgttggtgg atttaacgca 12780
catgcagcta atttagtgac agctgttttc ttggcattag gacaagatcc tgcacaaaat 12840
gtcgaaagtt ccaactgtat aacattgatg aaagaagtgg acggtgattt gagaatttcc 12900
gtatccatgc catccatcga agtaggtacc atcggtggtg gtactgttct agaaccacaa 12960
ggtgccatgt tggacttatt aggtgtaaga ggcccacatg ctaccgctcc tggtaccaac 13020
gcacgtcaat tagcaagaat agttgcctgt gccgtcttgg caggtgaatt atccttatgt 13080
gctgccctag cagccggcca tttggttcaa agtcatatga cccacaacag gaaacctgct 13140
gaaccaacaa aacctaacaa tttggacgcc actgatataa atcgtttgaa agatgggtcc 13200
gtcacctgca ttaaatccta aacttagtca tacgtcattg gtattctctt gaaaaagaag 13260
cacaacagca ccatgtgtta cgtaaaatat ttactttata gtttgtacgt cataatttct 13320
tccatattac aagttcgtgc atatatagaa agaattctgt tgttgtaatt gtcataacta 13380
ttgagcttta cctgaaaatt caacgaaaaa aactcaaaaa ccacatgctt ctcttgagtc 13440
atgcggaggt ccgccggcgt tggacgagcg aatgtgtata ttagtttaaa aagttgtatg 13500
taataaaagt aaaatttaat attttggatg aaaaaaacca tttttagact ttttcttaac 13560
tagaatgctg gagtagaaat acgccatctc aagatacaaa aagcgttacc ggcactgatt 13620
tgtttcaacc agtatataga ttattattgg gtcttgatca actttcctca gacatatcag 13680
taacagttat caagctaaat atttacgcga aagaaaaaca aatattttaa ttgtgatact 13740
tgtgaatttt attttattaa ggatacaaag ttaagagaaa acaaaattta tatacaatat 13800
aagtaatatt catatatatg tgatgaatgc agtcttaacg agaagacatg gccttggtga 13860
caactctctt caaaccaact tcagcctttc tcaattcatc agcagatggg tcttcgattt 13920
gcaaagcagc caaagcggcg gtttaaacgc gtggccgtgc cgtc 13964
<210> 54
<211> 13963
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct: i85207 integration construct
<400> 54
gacggcacgg ccacgcgttt aaaccgccag ggcaaggttg gcctctactt actccatcga 60
caattcaaga tacagaacct cctccagatg gaatcccttc catagagaga aggagcaagc 120
aactgaccca atattgactg ccactggacc tgaagacatg caacaaagtg caagcatagt 180
ggggccttct tccaatgcta atccggtcac tgccactgct gctacggaaa accaacctaa 240
aggtattaac ttcttcacta taagaaaatc acacgagcgc ccggacgatg tctctgttta 300
aatggcgcaa gttttccgct ttgtaatata tatttatacc cctttcttct ctcccctgca 360
atataatagt ttaattctaa tattaataat atcctatatt ttcttcattt accggcgcac 420
tctcgcccga acgacctcaa aatgtctgct acattcataa taaccaaaag ctcataactt 480
ttttttttga acctgaatat atatacatca catgtcactg ctggtccttg ccgaccagcg 540
tatacaatct cgatagttgg tttcccgttc tttccactcc cgtccgctcg tccaacgccg 600
gcggaccttc acatgtaggg accgaattgt ttacaagttc tctgtaccac catggagaca 660
tcaaagattg aaaatctatg gaaagatatg gacggtagca acaagaatat agcacgagcc 720
gcgaagttca tttcgttact tttgatatcg ctcacaacta ttgcgaagcg cttcagtgaa 780
aaaatcataa ggaaaagttg taaatattat tggtagtatt cgtttggtaa agtagagggg 840
gtaatttttc ccctttattt tgttcataca ttcttaaatt gctttgcctc tccttttgga 900
aagctatact tcggagcact gttgagcgaa ggctcattag atatattttc tgtcattttc 960
cttaacccaa aaataaggga aagggtccaa aaagcgctcg gacaactgtt gaccgtgatc 1020
cgaaggactg gctatacagt gttcacaaaa tagccaagct gaaaataatg tgtagctatg 1080
ttcagttagt ttggctagca aagatataaa agcaggtcgg aaatatttat gggcattatt 1140
atgcagagca tcaacatgat aaaaaaacct cccgcgacct ccaaaatcga actaccttca 1200
caatgactgc cgacaacaat agtatgcccc atggtgcagt atctagttac gccaaattag 1260
tgcaaaacca aacacctgaa gacattttgg aagagtttcc tgaaattatt ccattacaac 1320
aaagacctaa tacccgatct agtgagacgt caaatgacga aagcggagaa acatgttttt 1380
ctggtcatga tgaggagcaa attaagttaa tgaatgaaaa ttgtattgtt ttggattggg 1440
acgataatgc tattggtgcc ggtaccaaga aagtttgtca tttaatggaa aatattgaaa 1500
agggtttact acatcgtgca ttctccgtct ttattttcaa tgaacaaggt gaattacttt 1560
tacaacaaag agccactgaa aaaataactt tccctgatct ttggactaac acatgctgct 1620
ctcatccact atgtattgat gacgaattag gtttgaaggg taagctagac gataagatta 1680
agggcgctat tactgcggcg gtgagaaaac tagatcatga attaggtatt ccagaagatg 1740
aaactaagac aaggggtaag tttcactttt taaacagaat ccattacatg gcaccaagca 1800
atgaaccatg gggtgaacat gaaattgatt acatcctatt ttataagatc aacgctaaag 1860
aaaacttgac tgtcaaccca aacgtcaatg aagttagaga cttcaaatgg gtttcaccaa 1920
atgatttgaa aactatgttt gctgacccaa gttacaagtt tacgccttgg tttaagatta 1980
tttgcgagaa ttacttattc aactggtggg agcaattaga tgacctttct gaagtggaaa 2040
atgacaggca aattcataga atgctataac aacgcgtcaa taatataggc tacataaaaa 2100
tcataataac tttgttatca tagcaaaatg tgatataaaa cgtttcattt cacctgaaaa 2160
atagtaaaaa taggcgacaa aaatccttag taatatgtaa actttatttt ctttatttat 2220
ttacagaact ctgaatatac attgattgtt cacatttttt ttttctcttc tcaatttccc 2280
ttgattatat tcaaaaggtt attggcctct tgaatgtttc ccactgaatc cccgcgtgct 2340
tggccggccg tggagcgacc tcatgctata cctgagaaag caacctgacc tacaggaaag 2400
agttactcaa gaataagaat tttcgtttta aaacctaaga gtcactttaa aatttgtata 2460
cacttatttt ttttataact tatttaataa taaaaatcat aaatcataag aaattcgctc 2520
aaacgaccat tggatggaca aagaaggact tcatgtaaga tttcatgtca ccttcggcgt 2580
gagtgaaacc atcgttaaca gagtataaaa cttcacacat tctagccaag ttgatagctg 2640
gcattaacaa agggaatgga acggcggttg gtctcaaaga ttctctgtta ataaccttcc 2700
aggcgtcttc gacttttcta gagatgtatt cacaggcttc ttcttcagaa gcaccggatt 2760
ccttagaata acattcgatg gaggaggcaa catgacctct ttcttgttct tctttatgag 2820
agacaatatc atccatcaat ctaatgataa cacaagaagc ttcaacaata ggtgggtagg 2880
aagaaaccca tttaaaagtg tcctcgttaa caatgtcacc tctaccaacg taagatctag 2940
cagtgatcaa accgtaggta ccggtaacca tggaaacaga catgtactct tccaaagtag 3000
gcatgtaacc ttctttcaac catctggctt caaccaagta gtttctgacc aattccttag 3060
ccatttcctt aacgtagtgg atttgataag ccttaccttc cttttctaaa gattcttcca 3120
tttcaacgtg caagttaacc aattcttggt agatcaactt catgtattct ggcaacatgt 3180
ccaaacaaga aatggaccac ttctcaacgg cttgagtgaa aatttccaat tcttcgtagg 3240
taccgtagtt gtcgaaggta tcatccaaaa cgaccaacca catacaagac ttcatcaaga 3300
acattctggt tctggcatgt tgtggttcat agtaaataga caaaatccag aagtaacctt 3360
cgacaactct atcacgaacg aatggcaatt tgttttgcaa gtctaaatct ttccaccact 3420
tgcagatgtg agacaattct ttcttatgca tggattgcaa aacagagaaa tctaacttag 3480
ccaacttcaa caaaacctcg tcgtgagaag tttcttgttg gtaaattggc atatagtgta 3540
aagcttcgat tctggccaat cttcttctca atggttgctt caaggcttgg tggatttggg 3600
ttcttaagga agagtcacaa gatggatcct tggcaataat gtccaagtga accttagaga 3660
attccaaagc gttgtccaag atggtttcat cttcgactct catgaaagca gcttcgtaca 3720
aggccaagat accttgagcg tcgttacaca aagattcctt aaatttacct ttttcgtcca 3780
taaagtcctt gaaaacacca gaggagacat tgaaaccttg ttgacgcaac aaacgaaacc 3840
acaaggagat agattgtaaa ttttccttat cgacccattg ttcaccgtaa gtgacatgga 3900
tatgttgtaa agcttcttcg atttcttctt caaaatggta agcaatacct aaacgttgaa 3960
cagcattgat taattcgatc aacttaacat gttgcatagg ttcgttagaa cccttaatag 4020
taatcaattc cttcttaact tcctccttta actcttcgac taattgcttc ttcataacca 4080
agtcctctgg ttcatcgtaa gtcaaaaatt gatcacccca aatggaagcg ttgaagttag 4140
cggtatgtct aataacgtct ggcttggtag aatccttatc atcgacaaca attggggaag 4200
tagatggaga ggaagaaaca gaggaaatag gcaaagtgga cattgtaaag ttagttggtt 4260
gcgcgacttc gggtggggta agtatagagg tatattaaca attttttgtt gatactttta 4320
tgacatttga ataagaagta atacaaaccg aaaatgttga aagtattagt taaagtggtt 4380
atgcagcttt tgcatttata tatctgttaa tagatcaaaa atcatcgctt cgctgattaa 4440
ttaccccaga aataaggcta aaaaactaat cgcattatta tcctatggtt gttaatttga 4500
ttcgttgatt tgaaggtttg tggggccagg ttactgccaa tttttcctct tcataaccat 4560
aaaagctagt attgtagaat ctttattgtt cggagcagtg cggcgcgagg cacatctgcg 4620
tttcaggaac gcgaccggtg aagaccagga cgcacggagg agagtcttcc gtcggagggc 4680
tgtcgcccgc tcggcggctt ctaatccgta cttcaatata gcaatgagca gttaagcgta 4740
ttactgaaag ttccaaagag aaggtttttt taggctaaga taatggggct ctttacattt 4800
ccacaacata taagtaagat tagatatgga tatgtatatg gtggtattgc catgtaatat 4860
gattattaaa cttctttgcg tccatccaaa aaaaaagtaa cgcacgcaca ctcccgacag 4920
acaactagct tgataatggc ttcagaaaaa gaaattagga gagagagatt cttgaacgtt 4980
ttccctaaat tagtagagga attgaacgca tcgcttttgg cttacggtat gcctaaggaa 5040
gcatgtgact ggtatgccca ctcattgaac tacaacactc caggcggtaa gttaaataga 5100
ggtttgtccg ttgtggacac gtatgctatt ctctccaaca agaccgttga acaattgggg 5160
caagaagaat acgaaaaggt tgctattcta ggttggtgca ttgagttgtt gcaggcttac 5220
ttcttggtcg ccgatgatat gatggacaag tccattacca gaagaggcca accatgttgg 5280
tacaaggttc ctgaagttgg ggaaattgcc atcaatgacg cattcatgtt agaggctgct 5340
atctacaagc ttttgaaatc tcacttcaga aacgaaaaat actacataga tatcaccgaa 5400
ttgttccatg aagtcacctt ccaaaccgaa ttgggccaat tgatggactt aatcactgca 5460
cctgaagaca aagtcgactt gagtaagttc tccctaaaga agcactcctt catagttact 5520
ttcaagactg cttactattc tttctacttg cctgtcgcat tggctatgta cgttgccggt 5580
atcacagatg aaaaggattt gaaacaagcc agagatgtct tgattccatt gggtgaatat 5640
ttccaaattc aagatgacta cttagactgc ttcggtaccc cagaacagat cggtaagatc 5700
ggtacagata tccaagataa caaatgttct tgggtaatca acaaggcatt agaacttgct 5760
tccgcagaac aaagaaagac tttagacgaa aattacggta agaaggactc agtcgcagaa 5820
gccaaatgca aaaagatttt caatgacttg aaaatcgacc agttatacca cgaatatgaa 5880
gagtctgttg ccaaggattt gaaggccaag atctcccaag tcgacgagtc tcgtggcttc 5940
aaagccgacg tcttaactgc gtttttgaac aaggtttaca agagaagtaa atagaactaa 6000
cgctaatcga taaaacatta gatttcagat tagataagga ccatgtataa gaaatatata 6060
cttccactat aatatagtat aagcttacag atagtatctc tcgatctacc gttccacgtg 6120
actagtccaa gaacctgcag gccgcgagcg ccgatacgaa aatcgttatt gtcttgaagg 6180
tgaaatttct actcttatta atggtgaacg ttaagctgat gctatgatgg aagctgattg 6240
gtcttaactt gcttgtcatc ttgctaatgg tcattggctc gtgttattac ttaagttatt 6300
tgtactcgtt ttgaacgtaa tgctaatgat catcttatgg aataatagtg agtggtttca 6360
gggtccataa agcttttcaa ttcatctttt ttttttttgt tctttttttt gattccggtt 6420
tctttgaaat ttttttgatt cggtaatctc cgagcagaag gaagaacgaa ggaaggagca 6480
cagacttaga ttggtatata tacgcatatg tggtgttgaa gaaacatgaa attgcccagt 6540
attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa tcatgtcgaa 6600
agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca agctatttaa 6660
tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta ccaccaagga 6720
attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa cacatgtgga 6780
tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat tatccgccaa 6840
gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt 6900
gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg 6960
tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga 7020
acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga 7080
atatactaag ggtactgttg acattgcgaa gagtgacaaa gattttgtta tcggctttat 7140
tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg 7200
tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt 7260
ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga 7320
tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg 7380
cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat 7440
tagagcttca atttaattat atcagttatt accacgaaaa tcgttattgt cttgaaggtg 7500
aaatttctac tcttattaat ggtgaacgtt aagctgatgc tatgatggaa gctgattggt 7560
cttaacttgc ttgtcatctt gctaatggtc atatggctcg tgttattact taagttattt 7620
gtactcgttt tgaacgtaat gctaatgatc atcttatgga ataatagtga atcggcgctc 7680
gcggcctgca ggtttcctca tcctagtatg tatagcttgt acccattaaa cgaattttat 7740
catgccgccg aaaggaacaa tttcaagtac tatcggaaga tgaatggtta gatgttaagc 7800
gcggtcactt caaacttcac atttataaag atgtcacatg gaccactatt atctacctta 7860
agttatttat caagataagt ttccggatct ttttctttcc taacacccca gtcagcctga 7920
gttacatcca gccattgaac cttagaaaat cttttgtcat cagcggtttg agccctaaga 7980
tcaacatctt gcttagcaat cactgcaatg gcgtcataac caccagcacc aggtattaag 8040
caagtaagaa ctccttttaa ggtctggcaa tcatccaata agctagtttg tacgggaggt 8100
tcgatatcgg caccagattc tttagttatt tttctaaagg aacgtctaat tgtggcaact 8160
gcatctctaa cttctgtgat ctcaggatac ttttgacagg tacagtcatt cctctcaaga 8220
gactcaaata tctgatcgct gtaatcgtca tgagtctcgt gtaagcgatc tagtttagat 8280
agtccatcca taaatctaga atttgcatga tcgagttctg tatatatttt caagctttcc 8340
ggcatatgcg aatcatacca attttttacc ttctggacca gttttactgt ttctgaacca 8400
ttcttaatat cgcccatcca taaagttaat cccgaaggta aatggttact tttaatcgtt 8460
atattccagt cttcttcatt aaccaaatgc gccagtttac tgccgtaagt agcacttcca 8520
atatctggca aattagagat taatgcgggt gggaatcttc tatatctgat agatccatat 8580
gctgccgccg ctacatcaaa cccgcttcca attttaccct gagcttgaca atgagcaact 8640
tgtgataaat tatgaataac ttctctatat ttgtctacat tattttccag gtccgataca 8700
aaaaaggagg ccaaagctgt agttaaaact gtgactaaac ctgccgagga gcccagccct 8760
gttttgggaa cttcttcaat tctgtgcgaa tgaaaactca atcttctgtt gccacgatgt 8820
tcggtaacgc tgtcctcctg agaatggtag gcatcatcag agaaaatatc aataacgaac 8880
aagtttctat tgcagtagtc gtccatgtta ggcttaaagt agctaaatac gttagcgata 8940
actttttcaa tgaaagggtt cttagatccg cctatcgaaa caggaatgaa gccagtttta 9000
ggacttatat ggtacagcca ctccccatct ttaaattgtt tacttttcac acgcacttca 9060
aacttatcag actcttgcaa tgaaccgtaa ggatgggcta cagcatgcat tcttgccgat 9120
aatccgacta caaatgcttc atatttcgga tctaaaacta aatatccacc agctagtaac 9180
gctttccctg gggcactgaa ggctctcaac tctgacatta tcaagctagt tgtctgtcgg 9240
gagtgtgcgt gcgttttttt atcatgttga tgctctgcat aataatgccc ataaatattt 9300
ccgacctgct tttatatctt tgctagccaa actaactgaa catagctaca cattattttc 9360
agcttggcta ttttgtgaac actgtatagc cagtccttcg gatcacggtc aacagttgtc 9420
cgagcgcttt ttggaccctt tcccttattt ttgggttaag gaaaatgaca gaaaatatat 9480
ctaatgagcc ttcgctcaac agtgctccga agtatagctt tccaaaagga gaggcaaagc 9540
aatttaagaa tgtatgaaca aaataaaggg gaaaaattac cccctctact ttaccaaacg 9600
aatactacca ataatattta caacttttcc ttatgatttt ttcactgaag cgcttcgcaa 9660
tagttgtgag cgatatcaaa agtaacgaaa tgaacttcgc ggctcgtgct atattcttgt 9720
tgctaccgtc catatctttc catagatttt caatctttga tgtctccatg gtggtacaga 9780
gaacttgtaa acaattcggt ccctacatgt gaacggccgg ccaagcacgc ggggatccga 9840
agcatgtagg gaggtcatga tatgaaaaag caaaagagta ggcatcaaaa agtttctcat 9900
tcaagtggta actgctgtta aaattaagat atttataaat tgaagcttgg tcgttccgac 9960
caataccgta gggaaacgta aattagctat tgtaaaaaaa ggaaaagaaa agaaaagaaa 10020
aatgttacat atcgaattga tcttattcct ttggtagacc agtctttgcg tcaatcaaag 10080
attcgtttgt ttcttgtggg cctgaaccga cttgagttaa aatcactctg gcaacatcct 10140
tttgcaactc aagatccaat tcacgtgcag taaagttaga tgattcaaat tgatggttga 10200
aagcctcaag ctgctcagta gtaaatttct tgtcccatcc aggaacagag ccaaacaatt 10260
tatagataaa tgcaaagagt ttcgactcat tttcagctaa gtagtacaac acagcatttg 10320
gacctgcatc aaacgtgtat gcaacgattg tttctccgta aaactgatta atggtgtggc 10380
accaactgat gatacgcttg gaagtgtcat tcatgtagaa tattggaggg aaagagtcca 10440
aacatgtggc atggaaagag ttggaatcca tcattgtttc ctttgcaaag gtggcgaaat 10500
ctttttcaac aatggcttta cgcatgactt caaatctctt tggtacgaca tgttcaattc 10560
tttctttaaa tagttcggag gttgccacgg tcaattgcat accctgagtg gaactcacat 10620
cctttttaat atcgctgaca actaggacac aagctttcat ctgaggccag tcagagctgt 10680
ctgcgatttg tactgccatg gaatcatgac catcttcagc ttttcccatt tcccaggcca 10740
cgtatccgcc aaacaacgat ctacaagctg aaccagaccc ctttcttgct attctagata 10800
tttctgaagt tgactgtggt aattggtata acttagcaat tgcagagacc aatgcagcaa 10860
agccagcagc ggaggaagct aaaccagctg ctgtaggaaa gttattttcg gagacaatgt 10920
ggagtttcca ttgagataat gtgggcaatg aggcgtcctt cgattccatt tcctttctta 10980
attggcgtag gtcgcgcaga caattttgag ttctttcatt gtcgatgctg tgtggttctc 11040
catttaacca caaagtgtcg cgttcaaact caggtgcagt agccgcagag gtcaacgttc 11100
tgaggtcatc ttgcgataaa gtcactgata tggacgaatt ggtgggcaga ttcaacttcg 11160
tgtccctttt cccccaatac ttaagggttg cgatgttgac gggtgcggta acggatgctg 11220
tgtaaacggt cattgtgaag gtagttcgat tttggaggtc gcgggaggtt actttttttt 11280
tggatggacg caaagaagtt taataatcat attacatggc aataccacca tatacatatc 11340
catatctaat cttacttata tgttgtggaa atgtaaagag ccccattatc ttagcctaaa 11400
aaaaccttct ctttggaact ttcagtaata cgcttaactg ctcattgcta tattgaagta 11460
cggattagaa gccgccgagc gggcgacagc cctccgacgg aagactctcc tccgtgcgtc 11520
ctggtcttca ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa 11580
caataaagat tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc 11640
tggccccaca aaccttcaaa tcaacgaatc aaattaacaa ccataggata ataatgcgat 11700
tagtttttta gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt 11760
aacagatata taaatgcaaa agctgcataa ccactttaac taatactttc aacattttcg 11820
gtttgtatta cttcttattc aaatgtcata aaagtatcaa caaaaaattg ttaatatacc 11880
tctatactta ccccacccga agtcgcgcaa ccaactaact ttacaatgtc attaccgttc 11940
ttaacttctg caccgggaaa ggttattatt tttggtgaac actctgctgt gtacaacaag 12000
cctgccgtcg ctgctagtgt gtctgcgttg agaacctacc tgctaataag cgagtcatct 12060
gcaccagata ctattgaatt ggacttcccg gacattagct ttaatcataa gtggtccatc 12120
aatgatttca atgccatcac cgaggatcaa gtaaactccc aaaaattggc caaggctcaa 12180
caagccaccg atggcttgtc tcaggaactc gttagtcttt tggatccgtt gttagctcaa 12240
ctatccgaat ccttccacta ccatgcagcg ttttgtttcc tgtatatgtt tgtttgccta 12300
tgcccccatg ccaagaatat taagttttct ttaaagtcta ctttacccat cggtgctggg 12360
ttgggctcaa gcgcctctat ttctgtatca ctggccttag ctatggccta cttggggggg 12420
ttaataggat ctaatgactt ggaaaagctg tcagaaaacg ataagcatat agtgaatcaa 12480
tgggccttca taggtgaaaa gtgtattcac ggtacccctt caggaataga taacgctgtg 12540
gccacttatg gtaatgccct gctatttgaa aaagactcac ataatggaac aataaacaca 12600
aacaatttta agttcttaga tgatttccca gccattccaa tgatcctaac ctatactaga 12660
attccaaggt ctacaaaaga tcttgttgct cgcgttcgtg tgttggtcac cgagaaattt 12720
cctgaagtta tgaagccaat tctagatgcc atgggtgaat gtgccctaca aggcttagag 12780
atcatgacta agttaagtaa atgtaaaggc accgatgacg aggctgtaga aactaataat 12840
gaactgtatg aacaactatt ggaattgata agaataaatc atggactgct tgtctcaatc 12900
ggtgtttctc atcctggatt agaacttatt aaaaatctga gcgatgattt gagaattggc 12960
tccacaaaac ttaccggtgc tggtggcggc ggttgctctt tgactttgtt acgaagagac 13020
attactcaag agcaaattga cagtttcaaa aagaaattgc aagatgattt tagttacgag 13080
acatttgaaa cagacttggg tgggactggc tgctgtttgt taagcgcaaa aaatttgaat 13140
aaagatctta aaatcaaatc cctagtattc caattatttg aaaataaaac taccacaaag 13200
caacaaattg acgatctatt attgccagga aacacgaatt taccatggac ttcataagct 13260
aatttgcgat aggcattatt tattagttgt ttttaatctt aactgtgtat gaagttttat 13320
gtaataaaga tagaaagaga aacaaaaaaa aatttttcgt agtatcaatt cagctttcga 13380
agacagaatg aaatttaagc agaccatagt atccttgata cattgactca ggtccgccgg 13440
cgttggacga gcgaagcatc ttgccctgtg cttggccccc agtgcagcga acgttataaa 13500
aacgaatact gagtatatat ctatgtaaaa caaccatatc atttcttgtt ctgaactttg 13560
tttacctaac tagttttaaa tttccctttt tcgtgcatgc gggtgttctt atttattagc 13620
atactacatt tgaaatatca aatttcctta gtagaaaagt gagagaaggt gcactgacac 13680
aaaaaataaa atgctacgta taactgtcaa aactttgcag cagcgggcat ccttccatca 13740
tagcttcaaa catattagcg ttcctgatct tcatacccgt gctcaaaatg atcaaacaaa 13800
ctgttattgc caagaaataa acgcaaggct gccttcaaaa actgatccat tagatcctca 13860
tatcaagctt cctcatagaa cgcccaatta caataagcat gttttgctgt tatcaccggg 13920
tgataggttt gctcaggcgg tttaaacgcg tggccgtgcc gtc 13963
Claims (55)
- 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종 핵산; 및
(b) 아실화 아세틸알데하이드 데하이드로게나제 (ADA)를 코딩하는 이종 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 제1항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA를 말로닐-CoA와 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 또는 제2항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제3항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA)를 메발로네이트로 변환하는 NADH-가용성 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제4항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제5항 중 어느 한항에 있어서, 포스포케톨라제 (PK)를 코딩하는 이종의 핵산을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제6항 중 어느 한항에 있어서, 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제7항 중 어느 한항에 있어서, 천연적인 피루베이트 데하이드로게나제 (PDH)-바이패스의 하나 이상의 효소가 기능적으로 파괴된 것을 추가로 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제8항에 있어서, 상기 PDH-바이패스의 하나 이상의 효소가 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제9항에 있어서, ACS1이 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제9항에 있어서, ACS2가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제9항에 있어서, ALD6가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제9항에 있어서, ACS1 및 ACS2가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제9항에 있어서, ACS1, ACS2 및 ALD6가 기능적으로 파괴된 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제14항 중 어느 한항에 있어서, 알코올 데하이드로게나제 (ADH) 활성을 가진 하나 이상의 효소가 기능적으로 파괴된 것을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제15항에 있어서, 상기 ADH 활성을 가진 하나 이상의 효소가 알코올 데하이드로게나제 1 (ADH1), 알코올 데하이드로게나제 3 (ADH3), 알코올 데하이드로게나제 4 (ADH4) 및 알코올 데하이드로게나제 5 (ADH5)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제16항 중 어느 한항에 있어서, 상기 ADA의 아미노산 서열이 서열번호 2와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제3항에 있어서, 상기 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제의 아미노산 서열이 서열번호 16과 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제5항에 있어서, 상기 NADH-가용성 HMG-CoA 리덕타제의 아미노산 서열이 서열번호 20과 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제6항에 있어서, 상기 포스포케톨라제 (PK)의 아미노산 서열이 서열번호 12와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제7항에 있어서, 상기 포스포트랜스아세틸라제 (PTA)의 아미노산 서열이 서열번호 14와 80% 이상 동일한 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항, 제4항 내지 제17항 또는 제19항 내지 제21항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세틸-CoA 분자 2개를 축합하여 아세토아세틸-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제22항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 아세토아세틸-CoA를 아세틸-CoA와 축합하여 HMG-CoA를 형성하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제3항, 제6항 내지 제18항, 또는 제20항 내지 제22항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 HMG-CoA를 메발로네이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제24항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트를 메발로네이트 5-포스페이트로 인산화하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제25항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제26항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 변환하는 효소를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제27항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소가 HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카르복실라제로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제28항 중 어느 한항에 있어서, 상기 숙주 세포가 상기 MEV 경로의 모든 효소를 코딩하는 복수의 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제29항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산이 단일 전사 조절인자의 통제를 받는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제29항 중 어느 한항에 있어서, 상기 MEV 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산이 복수의 이종 전사 조절인자의 통제를 받는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제31항 중 어느 한항에 있어서, 이소펜테닐 피로포스페이트 (IPP)를 다이메틸알릴 피로포스페이트 (DMAPP)로 변환할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제32항 중 어느 한항에 있어서, IPP 및/또는 DMAPP 분자를 축합하여 폴리프레닐 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제33항 중 어느 한항에 있어서, IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 형성할 수 있는 효소를 코딩하는 이종의 핵산을 더 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제34항에 있어서, 상기 IPP 또는 폴리프레닐을 변형하여 이소프레노이드 화합물을 형성할 수 있는 효소가 카렌 신타제 (carene synthase), 게라니올 신타제 (geraniol synthase), 리날롤 신타제 (linalool synthase), 리모넨 신타제 (limonene synthase), 미르센 신타제 (myrcene synthase), 옥시멘 신타제 (ocimene synthase), α-피넨 신타제 (α-pinene synthase), β-피넨 신타제 (β-pinene synthase), γ-테르피넨 신타제 (γ-terpinene synthase), 테르피놀렌 신타제 (terpinolene synthase), 아모르파디엔 신타제 (amorphadiene synthase), α-파르네센 신타제 (α-farnesene synthase), β-파르네센 신타제 (β-farnesene synthase), 파르네솔 신타제 (farnesol synthase), 네롤리돌 신타제 (nerolidol synthase), 패출리올 신타제 (patchouliol synthase), 노트카톤 신타제 (nootkatone synthase) 및 아비에타디엔 신타제 (abietadiene synthase)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제34항에 있어서, 상기 이소프레노이드는 헤미테르펜, 모노테르펜, 다이테르펜, 트리테르펜, 테트라테르펜, 세스퀴테르펜 및 폴리테르펜으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제34항에 있어서, 상기 이소프레노이드가 세스퀴테르펜인 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제34항에 있어서, 상기 이소프레노이드가 C5-C20 이소프레노이드인 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제34항에 있어서, 상기 이소프레노이드가 아비에타디엔, 아모르파디엔, 카렌, α-파르네센, β-파르네센, 파르네솔, 게라니올, 게라닐게라니올, 이소프렌, 리날롤, 리모넨, 미르센, 네롤리돌, 옥시멘, 패출롤, β-피넨, 사비넨, γ-테르피넨, 테르피놀렌 및 발렌센으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제1항 내지 제39항 중 어느 한항에 있어서, 상기 세포가 효모 세포인 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제40항에 있어서, 상기 효모 세포가 액시쿨로코니듐 (Aciculoconidium), 암브로시오지마 (Ambrosiozyma), 아르트로아스쿠스 (Arthroascus), 아릭시오지마 (Arxiozyma), 아쉬비아 (Ashbya), 바브제비아 (Babjevia), 벤싱토니아 (Bensingtonia), 보트리오아스쿠스 (Botryoascus), 보트리오지마 (Botryozyma), 브레타노마이세스 (Brettanomyces), 불레라 (Bullera), 불레로마이세스 (Bulleromyces), 칸디다 (Candida), 시테로마이세스 (Citeromyces), 클라비스포라 (Clavispora), 크립토코커스 (Cryptococcus), 시스토필로바시듐 (Cystofilobasidium), 데바리오마이세스 (Debaryomyces), 데카라 (Dekkara), 디포다스콥시스 (Dipodascopsis), 디포다스쿠스 (Dipodascus), 에니엘라 (Eeniella), 엔도마이콥셀라 (Endomycopsella), 에레마스쿠스 (Eremascus), 에레모테시움 (Eremothecium), 에리트로바시듐 (Erythrobasidium), 펠로마이세스 (Fellomyces), 필로바시듐 (Filobasidium), 갈락토마이세스 (Galactomyces), 제오트리쿰 (Geotrichum), 귈리리에르몬델라 (Guilliermondella), 한세니아스포라 (Hanseniaspora), 한세눌라 (Hansenula), 하세가와이 (Hasegawaea), 폴터마니아 (Holtermannia), 호르모아스쿠스 (Hormoascus), 하이포피키아 (Hyphopichia), 이사첸티아 (Issatchenkia), 클로엑케라 (Kloeckera), 클로엑케라스포라 (Kloeckeraspora), 클루이베로마이세스 (Kluyveromyces), 콘도아 (Kondoa), 쿠라이시아 (Kuraishia), 쿠르츠마모마이세스 (Kurtzmanomyces), 루코스포리듐 (Leucosporidium), 리포마이세스 (Lipomyces), 로데로마이세스 (Lodderomyces), 말라세지아 (Malassezia), 메츠니코위아 (Metschnikowia), 므라키아 (Mrakia), 믹소지마 (Myxozyma), 나드소니아 (Nadsonia), 나카자와에아 (Nakazawaea), 네마토스포라 (Nematospora), 오가타에 (Ogataea), 오스포리디움 (Oosporidium), 파키솔렌 (Pachysolen), 파키티코스포라 (Phachytichospora), 파피아 (Phaffia), 피키아 (Pichia), 로도스포리듐 (Rhodosporidium), 로도토룰라 (Rhodotorula), 사카로마이세스 (Saccharomyces), 사카로마이코데스 (Saccharomycodes), 사카로마이콥시스 (Saccharomycopsis), 사이토엘라 (Saitoella), 사카구키아 (Sakaguchia), 사투라노스포라 (Saturnospora), 스키조블라스토스포리온 (Schizoblastosporion), 스키조사카로마이세스 (Schizosaccharomyces), 슈반니오마이세스 (Schwanniomyces), 스포리디오볼루스 (Sporidiobolus), 스포로볼로마이세스 (Sporobolomyces), 스포로파키더미아 (Sporopachydermia), 스테파노아스쿠스 (Stephanoascus), 스테리그마토마이세스 (Sterigmatomyces), 스테리그마토스포리듐 (Sterigmatosporidium), 심비오타프리나 (Symbiotaphrina), 심포디오마이세스 (Sympodiomyces), 심포디오마이콥시스 (Sympodiomycopsis), 토룰라스포라 (Torulaspora), 트리코스포리엘라 (Trichosporiella), 트리코스포론 (Trichosporon), 트리고놉시스 (Trigonopsis), 츠키야에아 (Tsuchiyaea), 우데니오마이세스 (Udeniomyces), 왈토마이세스 (Waltomyces), 윅커하미아 (Wickerhamia), 윅커하미엘라 (Wickerhamiella), 빌리옵시스 (Williopsis), 야마다지마 (Yamadazyma), 야로위니아 (Yarrowia), 자이고아스쿠스 (Zygoascus), 자이고사카로마이세스 (Zygosaccharomyces), 자이고빌리옵시스 (Zygowilliopsis) 및 자이고지마 (Zygozyma)로 이루어진 군으로부터 선택되는 속에 속하는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제40항에 있어서, 상기 효모가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 피키아 패스토리스 (Pichia pastoris), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 데케라 브룩셀렌시스 (Dekkera bruxellensis), 클루이베로마이세스 락티스 (Kluyveromyces lactis) (이전 명칭: 사카로마이세스 락티스 (Saccharomyces lactis)), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 아르술라 아데니니보란스 (Arxula adeninivorans) 및 한세눌라 폴리모르파 (Hansenula polymorpha) (현재 피키아 앙구스타 (Pichia angusta)라고도 함)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제40항에 있어서, 상기 효소가 칸디다 리폴리티카 (Candida lipolytica), 칸디다 길리어몬디 (Candida guilliermondii), 칸디다 크루세이 (Candida krusei), 칸디다 슈도트로피칼리스 (Candida pseudotropicalis) 및 칸디다 유틸리스 (Candida utilis)로 이루어진 군으로부터 선택되는 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제40항에 있어서, 상기 효모가 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)인 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 제44항에 있어서, 상기 효모가 빵 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 및 AL-1으로 이루어진 군으로부터 선택되는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 균주인 것을 특징으로 하는 유전자 변형된 숙주 세포.
- 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 하나 이상의 이종의 핵산으로서, 상기 하나 이상의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산; 및
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴를 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 이소프레노이드를 생산할 수 있는 유전자 변형된 숙주 세포로서,
상기 세포는,
(a) 이소펜테닐 피로포스페이트를 제조하기 위한 메발로네이트 (MEV) 경로의 하나 이상의 효소를 코딩하는 복수의 이종 핵산으로서, 상기 복수의 효소는 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제와 NADH-가용성 HMG-CoA 리덕타제를 포함하는 것인, 핵산;
(b) 아세틸알데하이드 데하이드로게나제, 아세틸화 (ADA)를 코딩하는 이종의 핵산;
(c) 아세틸-CoA 신타제 1 (ACS1), 아세틸-CoA 신타제 2 (ACS2) 및 알데하이드 데하이드로게나제 6 (ALD6)로 이루어진 군으로부터 선택되는 천연적인 PDH-바이패스의 하나 이상의 효소의 기능적 파괴;
(d) 포스포케톨라제 (PK)를 코딩하는 이종의 핵산; 및
(e) 포스포트랜스아세틸라제 (PTA)를 코딩하는 이종의 핵산을 포함하는 것을 특징으로 하는 유전자 변형된 숙주 세포. - 이소프레노이드의 제조 방법으로서,
(a) 제1항 내지 제50항 중 어느 한항에 따른 유전자 변형된 효소 세포를, 상기 이소프레노이드 화합물을 생산하기에 적합한 조건 하에, 탄소원이 구비된 배지에서 배양하는 단계; 및
(b) 상기 이소프레노이드 화합물을 상기 배지로부터 회수하는 단계를 포함하는 것인, 제조 방법. - 제51항에 있어서, 상기 이소프레노이드 화합물이 배지 1 L 당 > 약 10 mg의 양으로 제조되는 것을 특징으로 하는 제조 방법.
- 제51항에 있어서, 상기 이소프레노이드 화합물이 건조 세포 중량 1 g 당 > 약 50 mg의 양으로 제조되는 것을 특징으로 하는 제조 방법.
- 제51항 내지 제53항 중 어느 한항에 있어서, 상기 숙주 세포가 상기 ADA를 코딩하는 이종의 뉴클레오티드 서열을 포함하지 않는 동일 숙주 세포에 비해 이소프레노이드 화합물을 증가된 양으로 제조하는 것을 특징으로 하는 제조 방법.
- 제54항에 있어서, 상기 증가된 양이 10% 이상인 것을 특징으로 하는 제조 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161557893P | 2011-11-09 | 2011-11-09 | |
US61/557,893 | 2011-11-09 | ||
PCT/US2012/064532 WO2013071172A1 (en) | 2011-11-09 | 2012-11-09 | Production of acetyl-coenzyme a derived isoprenoids |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140093981A true KR20140093981A (ko) | 2014-07-29 |
KR102021914B1 KR102021914B1 (ko) | 2019-09-17 |
Family
ID=47295179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147015594A KR102021914B1 (ko) | 2011-11-09 | 2012-11-09 | 아세틸-코엔자임 a로부터 유래되는 이소프레노이드의 제조 방법 |
Country Status (16)
Country | Link |
---|---|
US (4) | US8415136B1 (ko) |
EP (1) | EP2776571B1 (ko) |
JP (2) | JP6073350B2 (ko) |
KR (1) | KR102021914B1 (ko) |
CN (1) | CN104039974B (ko) |
AU (1) | AU2012335091B2 (ko) |
BR (1) | BR112014010750B1 (ko) |
CA (1) | CA2853679C (ko) |
DK (1) | DK2776571T3 (ko) |
ES (1) | ES2628847T3 (ko) |
IN (1) | IN2014CN03791A (ko) |
MX (1) | MX346459B (ko) |
PT (1) | PT2776571T (ko) |
SG (1) | SG11201402083XA (ko) |
WO (1) | WO2013071172A1 (ko) |
ZA (1) | ZA201402989B (ko) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0509301B1 (pt) * | 2004-03-31 | 2017-04-11 | Natureworks Llc | processo para fermentação de açucares contendo sacarídeos oligoméricos |
WO2013022799A1 (en) * | 2011-08-05 | 2013-02-14 | Danisco Us Inc. | PRODUCTION OF ISOPRENOIDS UNDER NEUTRAL pH CONDITIONS |
BR112014008278A2 (pt) | 2011-10-07 | 2017-04-18 | Danisco Us Inc | utilização de fosfocetolase na produção de mevalonato, precursores isoprenoides e isopreno |
US8415136B1 (en) * | 2011-11-09 | 2013-04-09 | Amyris, Inc. | Production of acetyl-coenzyme a derived isoprenoids |
EP3584323B1 (en) * | 2012-12-10 | 2021-03-17 | Cargill, Incorporated | Batch feed process for fermenting sugars |
MX364748B (es) | 2013-03-15 | 2019-05-06 | Amyris Inc | Uso de fosfoquetolasa y fosfotransacetilasa para la produccion de compuestos derivados de acetil-coenzima a. |
SG11201508186XA (en) | 2013-04-10 | 2015-11-27 | Danisco Us Inc | Phosphoketolases for improved production of acetyl coenzyme a-derived metabolites, isoprene, isoprenoid precursors, and isoprenoids |
US9617569B2 (en) | 2013-11-15 | 2017-04-11 | Samsung Electronics Co., Ltd. | Genetically engineered yeast cell producing lactate including acetaldehyde dehydrogenase, method of producing yeast cell, and method of producing lactate using the same |
PL3077501T3 (pl) | 2013-12-03 | 2022-01-31 | Genomatica, Inc. | Mikroorganizmy i sposoby poprawy wydajności produktu na metanolu z użyciem syntezy acetylo-coa |
EP3083958B1 (en) | 2013-12-19 | 2019-04-17 | Amyris, Inc. | Methods for genomic integration |
CN106687576B (zh) | 2014-03-28 | 2021-10-29 | 丹尼斯科美国公司 | 用于提高乙醇生产的改变的宿主细胞途径 |
JP6034332B2 (ja) * | 2014-05-30 | 2016-11-30 | トヨタ自動車株式会社 | 組換え微生物及び当該組換え微生物を用いた物質製造方法 |
WO2016029187A2 (en) | 2014-08-21 | 2016-02-25 | Givaudan Sa | Methods for production of oxygenated terpenes |
MY182911A (en) | 2014-09-08 | 2021-02-05 | Temasek Life Sciences Laboratory Ltd | Methods for efficient production of polyunsaturated fatty acids (pufa) in rhodosporidium and rhodotorula species |
JP6470532B2 (ja) * | 2014-09-17 | 2019-02-13 | 積水化学工業株式会社 | 組換え細胞、並びに、有機化合物の生産方法 |
EP3741865B1 (en) | 2014-09-18 | 2024-03-13 | Genomatica, Inc. | Non-natural microbial organisms with improved energetic efficiency |
US20180127804A1 (en) | 2014-12-05 | 2018-05-10 | Amyris, Inc. | High-throughput sequencing of polynucleotides |
DE102015103608A1 (de) * | 2015-03-11 | 2016-09-15 | Basf Se | Verfahren zur mikrobiellen de novo Synthese von Terpenen |
KR101782891B1 (ko) * | 2015-07-08 | 2017-09-29 | 한국과학기술연구원 | 미어신 생산용 벡터 및 균주, 및 이를 이용한 미어신의 생산방법 |
PT3368673T (pt) | 2015-10-29 | 2020-08-27 | Amyris Inc | Composições e métodos para a produção de mirceno |
MY190296A (en) | 2015-10-29 | 2022-04-12 | Firmenich Incorporated | High intensity sweeteners |
EP3385378A4 (en) * | 2015-11-30 | 2019-04-24 | Sekisui Chemical Co., Ltd. | RECOMBINANT CELL, PROCESS FOR PRODUCING THE RECOMBINANT CELL, AND PROCESS FOR PRODUCING AN ORGANIC COMPOUND |
US20190211364A1 (en) * | 2016-07-01 | 2019-07-11 | International Flavors & Fragrances Inc. | Compositions and methods for producing citrus terpenoids |
CN110366594B (zh) * | 2016-12-16 | 2023-12-15 | 丹尼斯科美国公司 | 双功能磷酸转酮酶-磷酸转乙酰酶融合多肽 |
US11946087B2 (en) | 2017-01-25 | 2024-04-02 | Amyris Bio Products Portugal, Unipessoal, Lda | Co-production of a sesquiterpene and a carotenoid |
CN106893726B (zh) * | 2017-02-20 | 2020-06-09 | 天津大学 | 一种启动子以及重组酵母菌株 |
WO2018155272A1 (ja) * | 2017-02-27 | 2018-08-30 | 積水化学工業株式会社 | 組換え細胞、組換え細胞の製造方法、並びに、イソプレン又はテルペンの生産方法 |
MX2019012940A (es) | 2017-05-03 | 2019-12-16 | Firmenich Incorporated | Metodos para producir edulcorantes de alta intensidad. |
WO2019030007A1 (en) | 2017-08-07 | 2019-02-14 | Total Raffinage Chimie | PROCESS FOR RECOVERING FERMENTATION PRODUCTS |
EP3665292B1 (en) | 2017-08-07 | 2024-03-06 | Total Raffinage Chimie | Process for recovering isoprenoids produced by microorganisms |
JP2019041712A (ja) * | 2017-09-05 | 2019-03-22 | 株式会社デンソー | 組み換え体及びスクアレンの製造方法 |
CN107841523A (zh) * | 2017-10-19 | 2018-03-27 | 浙江大学 | 利用群体感应分子诱导从桦褐孔菌中提取三萜类物质方法 |
CN107937431A (zh) * | 2017-10-28 | 2018-04-20 | 国际竹藤中心 | 一种提高酿酒酵母合成芳樟醇能力的方法 |
EP3720944A1 (en) | 2017-12-07 | 2020-10-14 | Zymergen Inc. | Engineered biosynthetic pathways for production of (6e)-8-hydroxygeraniol by fermentation |
CN111868047A (zh) | 2017-12-21 | 2020-10-30 | 齐默尔根公司 | 荆芥内半缩醛氧化还原酶、荆芥内半缩醛合酶和能够产生荆芥内酯的微生物 |
WO2020081468A1 (en) | 2018-10-15 | 2020-04-23 | Amyris, Inc. | Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides |
CN111378588A (zh) * | 2018-12-29 | 2020-07-07 | 中国科学院青岛生物能源与过程研究所 | 一种转化纤维素水解液合成法尼烯的基因工程菌及其应用 |
CN111378587B (zh) * | 2018-12-29 | 2022-08-05 | 中国科学院青岛生物能源与过程研究所 | 一种合成β-法尼烯的基因工程菌及其应用 |
US20220106619A1 (en) | 2019-01-24 | 2022-04-07 | Amyris, Inc. | Abc transporters for the high efficiency production of rebaudiosides |
CN109777815B (zh) * | 2019-03-28 | 2021-10-29 | 昆明理工大学 | HMG-CoA合成酶基因RKHMGCS及其应用 |
CN109929937B (zh) * | 2019-04-01 | 2023-04-21 | 广东省科学院动物研究所 | 龟嗜皮菌特异性鉴定引物、试剂盒及其鉴定方法 |
GB201907088D0 (en) * | 2019-05-20 | 2019-07-03 | C3 Bio Tech Limited | Linalool synthases |
BR112021024508A2 (pt) * | 2019-06-06 | 2022-03-22 | Amyris Inc | Métodos para desacoplar rendimento e produtividade de um composto não catabólico produzido por uma célula hospedeira |
CA3171369A1 (en) * | 2020-02-28 | 2021-09-02 | Wisconsin Alumni Research Foundation | Nonviral generation of genome edited chimeric antigen receptor t cells |
AU2021305200A1 (en) * | 2020-07-08 | 2023-02-16 | The Regents Of The University Of California | Modified yeast host cells useful for producing isoprenol |
CN113234610B (zh) * | 2021-03-05 | 2023-06-13 | 江南大学 | 一种合成角鲨烯的酿酒酵母菌株及其应用 |
CN113430215B (zh) * | 2021-06-03 | 2023-04-18 | 昆明理工大学 | 乙酰CoA合成酶基因RKACS1及其应用 |
CN116376995B (zh) * | 2022-04-02 | 2024-01-26 | 元素驱动(杭州)生物科技有限公司 | 一种利用苏氨酸制备甘氨酸、乙酰辅酶a及乙酰辅酶a衍生物的方法 |
NL2032683B1 (en) * | 2022-07-18 | 2024-01-26 | Sestina Bio Llc | Bioproduction of isoprenoids |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009005704A1 (en) * | 2007-07-03 | 2009-01-08 | The Regents Of The University Of California | Methods of increasing isoprenoid or isoprenoid precursor production |
WO2010141452A1 (en) * | 2009-06-01 | 2010-12-09 | Amyris Biotechnologies, Inc. | Genetically modified microbes producing isoprenoids |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR745875A (fr) | 1932-11-16 | 1933-05-17 | Système d'adaptation aux brouettes, de roues à bandage pneumatique | |
US5272065A (en) | 1983-10-20 | 1993-12-21 | Research Foundation Of State University Of New York | Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA |
US7192751B2 (en) | 2001-12-06 | 2007-03-20 | The Regents Of The University Of California | Biosynthesis of amorpha-4,11-diene |
US7253001B2 (en) | 2002-03-19 | 2007-08-07 | Forskarpatent I Syd Ab | Metabolic engineering for improved xylose utilisation of Saccharomyces cerevisiae |
MXPA06013502A (es) * | 2004-05-21 | 2007-03-01 | Univ California | Metodo para mejorar la produccion de compuestos isoprenoides. |
RU2004124226A (ru) | 2004-08-10 | 2006-01-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) (RU) | Использование фосфокетолазы для продукции полезных метаболитов |
CN101044243B (zh) * | 2004-08-19 | 2011-12-28 | 帝斯曼知识产权资产管理有限公司 | 类异戊二烯的生产方法 |
BRPI0614990A2 (pt) * | 2005-08-19 | 2011-04-26 | Univ California | células hospedeiras geneticamente modificadas e uso das mesmas para produção de compostos isoprenóides |
BRPI0707229B8 (pt) | 2006-01-27 | 2017-06-27 | Ajinomoto Kk | método para produzir um l-aminoácido |
DK2024504T4 (da) | 2006-05-26 | 2023-02-27 | Amyris Inc | Fremstilling af isoprenoider |
BRPI0813710B1 (pt) | 2007-07-23 | 2018-10-09 | Dsm Ip Assets Bv | método de identificar um polipeptídeo heterólogo tendo atividade enzimática para converter piruvato, acetaldeído ou acetato em acetil-coa no citosol de uma célula de levedura, vetor para a expressão de polipeptídeos heterólogos em levedura, célula de levedura recombinante e método de produzir um produto de fermentação |
BRPI0922187B1 (pt) | 2008-11-19 | 2021-05-04 | Amyris, Inc | Métodos para gerar um polinucleotídeo e para gerar uma célula hospedeira |
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
EP2277989A1 (en) * | 2009-07-24 | 2011-01-26 | Technische Universiteit Delft | Fermentative glycerol-free ethanol production |
AU2011248182A1 (en) * | 2010-05-05 | 2012-11-15 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of butadiene |
JP5056897B2 (ja) | 2010-05-14 | 2012-10-24 | トヨタ自動車株式会社 | 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物 |
DE102010029973A1 (de) * | 2010-06-11 | 2011-12-15 | Evonik Degussa Gmbh | Mikrobiologische Herstellung von C4-Körpern aus Saccharose und Kohlendioxid |
US8871488B2 (en) | 2010-06-18 | 2014-10-28 | Butamax Advanced Biofuels Llc | Recombinant host cells comprising phosphoketolases |
SG2014007991A (en) | 2011-08-04 | 2014-03-28 | Danisco Us Inc | Production of isoprene, isoprenoid precursors, and isoprenoids using acetoacetyl-coa synthase |
US8415136B1 (en) * | 2011-11-09 | 2013-04-09 | Amyris, Inc. | Production of acetyl-coenzyme a derived isoprenoids |
-
2012
- 2012-11-09 US US13/673,819 patent/US8415136B1/en active Active
- 2012-11-09 ES ES12795948T patent/ES2628847T3/es active Active
- 2012-11-09 BR BR112014010750-5A patent/BR112014010750B1/pt active IP Right Grant
- 2012-11-09 AU AU2012335091A patent/AU2012335091B2/en active Active
- 2012-11-09 MX MX2014005543A patent/MX346459B/es active IP Right Grant
- 2012-11-09 EP EP12795948.4A patent/EP2776571B1/en active Active
- 2012-11-09 JP JP2014541353A patent/JP6073350B2/ja active Active
- 2012-11-09 SG SG11201402083XA patent/SG11201402083XA/en unknown
- 2012-11-09 KR KR1020147015594A patent/KR102021914B1/ko active IP Right Grant
- 2012-11-09 IN IN3791CHN2014 patent/IN2014CN03791A/en unknown
- 2012-11-09 CA CA2853679A patent/CA2853679C/en active Active
- 2012-11-09 WO PCT/US2012/064532 patent/WO2013071172A1/en active Application Filing
- 2012-11-09 CN CN201280066027.XA patent/CN104039974B/zh active Active
- 2012-11-09 PT PT127959484T patent/PT2776571T/pt unknown
- 2012-11-09 DK DK12795948.4T patent/DK2776571T3/en active
-
2013
- 2013-01-28 US US13/752,293 patent/US8603800B2/en active Active
- 2013-10-24 US US14/062,798 patent/US8859261B2/en active Active
-
2014
- 2014-04-24 ZA ZA2014/02989A patent/ZA201402989B/en unknown
- 2014-09-02 US US14/474,976 patent/US9914941B2/en active Active
-
2017
- 2017-01-04 JP JP2017000210A patent/JP6461208B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009005704A1 (en) * | 2007-07-03 | 2009-01-08 | The Regents Of The University Of California | Methods of increasing isoprenoid or isoprenoid precursor production |
WO2010141452A1 (en) * | 2009-06-01 | 2010-12-09 | Amyris Biotechnologies, Inc. | Genetically modified microbes producing isoprenoids |
Non-Patent Citations (2)
Title |
---|
METABOLIC ENGINEERING, vol.9(2), pp.193~207(2007) * |
PROCESS BIOCHEMISTRY, vol.46(9), pp.1703~1710(2011) * |
Also Published As
Publication number | Publication date |
---|---|
AU2012335091A1 (en) | 2014-06-19 |
DK2776571T3 (en) | 2017-06-26 |
CN104039974B (zh) | 2016-10-12 |
US8859261B2 (en) | 2014-10-14 |
WO2013071172A1 (en) | 2013-05-16 |
US20140154765A1 (en) | 2014-06-05 |
CA2853679A1 (en) | 2013-05-16 |
MX2014005543A (es) | 2014-06-04 |
US8415136B1 (en) | 2013-04-09 |
PT2776571T (pt) | 2017-07-07 |
EP2776571A1 (en) | 2014-09-17 |
EP2776571B1 (en) | 2017-04-12 |
KR102021914B1 (ko) | 2019-09-17 |
SG11201402083XA (en) | 2014-06-27 |
MX346459B (es) | 2017-03-22 |
ES2628847T3 (es) | 2017-08-04 |
JP2014532444A (ja) | 2014-12-08 |
US20150093797A1 (en) | 2015-04-02 |
ZA201402989B (en) | 2015-11-25 |
AU2012335091B2 (en) | 2016-06-16 |
JP6461208B2 (ja) | 2019-01-30 |
US20130236942A1 (en) | 2013-09-12 |
JP2017055777A (ja) | 2017-03-23 |
JP6073350B2 (ja) | 2017-02-01 |
US9914941B2 (en) | 2018-03-13 |
BR112014010750B1 (pt) | 2021-09-21 |
CA2853679C (en) | 2021-05-04 |
BR112014010750A2 (pt) | 2017-06-13 |
CN104039974A (zh) | 2014-09-10 |
US8603800B2 (en) | 2013-12-10 |
IN2014CN03791A (ko) | 2015-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102021914B1 (ko) | 아세틸-코엔자임 a로부터 유래되는 이소프레노이드의 제조 방법 | |
KR101417146B1 (ko) | 이소프레노이드의 생산 방법 | |
CA2794817C (en) | Cell suitable for fermentation of a mixed sugar composition | |
AU2014227811C1 (en) | Use of phosphoketolase and phosphotransacetylase for production of acetyl-coenzyme a derived compounds | |
KR101420889B1 (ko) | 생물 유기 화합물을 제조하기 위한 장치 | |
CN106795484B (zh) | 用于在产生岩藻糖基化低聚糖时使用的α(1,2)岩藻糖基转移酶变种 | |
CN107429269B (zh) | 通过在微生物中转化戊糖用于生产至少一种感兴趣的代谢物的方法 | |
CA2767451C (en) | Fermentative production of ethanol from glucose, galactose and arabinose employing a recombinant yeast strain | |
CN109563505A (zh) | 用于真核细胞的组装系统 | |
AU2013337574B2 (en) | Cytochrome P450 and cytochrome P450 reductase polypeptides, encoding nucleic acid molecules and uses thereof | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
CN107177540A (zh) | 从经基因改造的微生物生产黏康酸 | |
KR20240005196A (ko) | 유전자 조작된 미생물로부터 개선된 뮤콘산 생산 | |
US6130070A (en) | Induction promoter gene and secretory signal gene usable in Schizosaccharomyces pombe, expression vectors having the same, and use thereof | |
KR20150086335A (ko) | 코르넥시스틴 및 히드록시코르넥시스틴의 생합성을 위한 유전자 클러스터 | |
DK3022290T3 (en) | MODIFIED ALGE STREAMS AND PROCEDURE FOR TRIACYLGYCLEROL ACCUMULATION WITH USING THESE STRAINS | |
CN108138162A (zh) | 重组细胞,重组细胞的制造方法以及有机化合物的生产方法 | |
CN114480385A (zh) | 基于来自耐酸酵母的基因的合成启动子 | |
Banuelos et al. | Subcellular localization of the homocitrate synthase in Penicillium chrysogenum | |
CN114907997B (zh) | 薯蓣皂素合成菌株构建及应用 | |
CN110607267B (zh) | 一种绵羊李斯特菌平衡致死系统、构建方法及应用 | |
CN111492059A (zh) | 在宿主细胞中进行基因组编辑的方法 | |
CN114426986B (zh) | 一种在赤霉菌中建立的基于CRISPR技术整合的URA-Blaster方法 | |
CN112080439B (zh) | 人源细胞凋亡调控蛋白Bcl-2在提高酿酒酵母橙花叔醇产量中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |