KR101735549B1 - 탄화수소를 생산하기 위한 방법과 조성물 - Google Patents
탄화수소를 생산하기 위한 방법과 조성물 Download PDFInfo
- Publication number
- KR101735549B1 KR101735549B1 KR1020107028190A KR20107028190A KR101735549B1 KR 101735549 B1 KR101735549 B1 KR 101735549B1 KR 1020107028190 A KR1020107028190 A KR 1020107028190A KR 20107028190 A KR20107028190 A KR 20107028190A KR 101735549 B1 KR101735549 B1 KR 101735549B1
- Authority
- KR
- South Korea
- Prior art keywords
- fatty
- delete delete
- seq
- cells
- aldehyde
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L1/00—Liquid carbonaceous fuels
- C10L1/02—Liquid carbonaceous fuels essentially based on components consisting of carbon, hydrogen, and oxygen only
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/026—Unsaturated compounds, i.e. alkenes, alkynes or allenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/649—Biodiesel, i.e. fatty acid alkyl esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0108—Long-chain acyl-[acyl-carrier-protein] reductase (1.2.1.80)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/99—Other Carbon-Carbon Lyases (1.4.99)
- C12Y401/99005—Octadecanal decarbonylase (4.1.99.5)
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L2200/00—Components of fuel compositions
- C10L2200/04—Organic compounds
- C10L2200/0461—Fractions defined by their origin
- C10L2200/0469—Renewables or materials of biological origin
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L2290/00—Fuel preparation or upgrading, processes or apparatus therefore, comprising specific process steps or apparatus units
- C10L2290/26—Composting, fermenting or anaerobic digestion fuel components or materials from which fuels are prepared
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T50/00—Aeronautics or air transport
- Y02T50/60—Efficient propulsion technologies, e.g. for aircraft
- Y02T50/678—Aviation using fuels of non-fossil origin
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
알데히드, 알칸, 그리고 알켄과 같은 탄화수소를 생산하기 위한 조성물과 방법이 본 명세서에 기술된다. 소정의 탄화수소가 생물연료에 이용될 수 있다.
Description
관련된 출원에 대한 교차-참조
본 출원은 2008년 5월 16일 제출된 U.S. 가출원 No. 61/053,955에 우선권을 주장하고, 이의 내용은 본 발명에 순전히 참조로서 편입된다.
본 발명의 배경기술
석유는 대지에서 액상, 가스, 또는 고형 형태로 발견되는 한정된 천연 자원이다. 석유는 주로 탄화수소로 구성되고, 이들 탄화수소는 주로 탄소와 수소로 구성된다. 이는 또한, 상당한 양의 다른 원소, 예를 들면, 질소, 산소, 또는 황을 상이한 형태로 포함한다.
석유는 귀중한 자원이긴 하지만, 석유 제품은 상당한 재정적, 환경적 비용을 대가로 하여 개발된다. 먼저, 석유의 원천이 발견되어야 한다. 석유 탐사는 많은 비용이 소요되고 위험한 작업이다. 심해 유정 (deep water well)을 탐사하는 비용은 1억 달러를 초과할 수 있다. 게다가, 이들 유정에 석유가 있을 것이라는 보장이 없다. 시추된 유정 중에서 단지 40%가 상업적인 탄화수소를 산출하는 생산 유정에 이르는 것으로 판단된다. 경제적 비용 이외에, 석유 탐사는 높은 환경적 비용을 유발한다. 가령, 근해 탐사는 주변 해양 환경을 파괴한다.
생산 유정이 발견된 이후, 석유는 많은 비용을 들여서, 대지로부터 추출되어야 한다. 1차 회수 동안, 지하 자연 압력은 유정 내에서 석유의 대략 20%를 추출할 만큼 충분하다. 이러한 자연 압력이 하락함에 따라서, 경제성이 있는 경우에 2차 회수 방법이 이용된다. 일반적으로, 2차 회수는 예로써, 물 주입 (water injection), 천연 가스 주입 (natural gas injection), 또는 가스 리프트 (gas lift)에 의해 유정의 압력을 증가시키는 단계를 필요로 한다. 2차 회수 방법을 이용하여, 추가로 5% 내지 15%의 석유가 회수된다. 2차 회수 방법이 소진되면, 경제성이 있는 경우에 3차 회수 방법이 이용될 수 있다. 3차 방법은 석유가 더욱 용이하게 추출될 수 있도록 석유의 점성도 (viscosity)를 감소시키는 단계를 필요로 한다. 3차 회수 방법을 이용하여, 추가로 5% 내지 15%의 석유가 회수된다. 따라서 최적 환경에서조차도, 유정 내에서 단지 50%의 석유만 추출될 수 있다. 석유 추출 역시 환경적 비용을 유발한다. 가령, 석유 추출은 표면으로 부상하는 대량의 석유 삼출 (seepage)을 유발할 수 있다. 게다가, 근해 시추는 주변 해양 환경을 교란하거나 파괴하는 해저 (seabed)의 준설을 수반한다.
석유 매장물이 대지 전반에서 균일하게 발견되지 않기 때문에, 석유는 석유 생산 지역에서 석유 소비 지역으로 먼 거리에 걸쳐 수송되어야 한다. 수송 비용 이외에, 파괴적인 기름 유출의 환경적 위험 역시 존재한다.
자연적인 형태에서, 대지로부터 추출된 원유는 상업적 용도가 극히 적다. 이는 다양한 길이와 복잡성 (complexity)의 탄화수소 (가령, 파라핀 (또는 알칸), 올레핀 (또는 알켄), 알킨, 나프텐 (또는 시클로알칸), 지방족 화합물, 방향족 화합물 등)의 혼합물이다. 이에 더하여, 원유는 기타 유기 화합물 (가령, 질소, 산소, 황 등을 보유하는 유기 화합물) 및 불순물 (가령, 황, 염, 산, 금속 등)을 포함한다.
이런 이유로, 원유는 상업적으로 이용되기에 앞서, 정유되고 정제되어야 한다. 높은 에너지 밀도 (energy density) 및 편의한 수송능력 (transportability)으로 인하여, 대부분의 석유는 연료, 예를 들면, 수송 연료 (가령, 가솔린, 디젤, 항공 연료 등), 난방유, 액화 석유 가스 등으로 정유된다.
원유는 또한, 석유화학제품을 생산하기 위한 원료의 일차 공급원이다. 석유로부터 유래된 원료의 2가지 주요 부류는 짧은 사슬 올레핀 (가령, 에틸렌과 프로필렌) 및 방향족 (가령, 벤젠과 크실렌 이성질체)이다. 이들 원료는 다양한 방법, 예를 들면, 접촉 분해 (catalytic cracking), 증기 분해 (steam cracking), 또는 접촉 개질공정 (catalytic reforming)을 이용하여 상당한 비용을 들여 원유를 분해 (cracking)함으로써 원유 내에서 더욱 긴 사슬 탄화수소로부터 유래된다. 이들 원료는 원유로부터 직접적으로 정유될 수 없는 석유화학제품, 예를 들면, 예를 들면, 단량체, 용매, 세정제, 또는 접착제를 만드는데 이용된다.
원유로부터 유래된 원료의 한 가지 실례는 에틸렌이다. 에틸렌은 석유화학제품, 예를 들면, 폴리에틸렌, 에탄올, 에틸렌 산화물, 에틸렌 글리콜, 폴리에스테르, 글리콜 에테르, 에톡실레이트, 비닐 아세테이트, 1,2-디클로로에탄, 트리클로로에틸렌, 테트라클로로에틸렌, 염화비닐, 그리고 폴리염화비닐을 생산하는데 이용된다. 원료의 추가적인 실례는 프로필렌인데, 이는 이소프로필 알코올, 아크릴로니트릴, 폴리프로필렌, 프로필렌 산화물, 프로필렌 글리콜, 글리콜 에테르, 부틸렌, 이소부틸렌, 1,3-부타디엔, 합성 탄성중합체, 폴리올레핀, 알파-올레핀, 지방 알코올, 아크릴산, 아크릴 중합체, 염화알릴, 에피클로로히드린, 그리고 에폭시 수지를 생산하는데 이용된다.
이들 석유화학제품은 이후, 특수 화학제품, 예를 들면, 플라스틱, 수지, 섬유, 탄성중합체, 약제, 윤활제, 또는 겔을 만드는데 이용될 수 있다. 석유화학 원료로부터 생산될 수 있는 특정한 특수 화학제품은 아래와 같다: 지방산, 탄화수소 (가령, 긴 사슬, 분지형 사슬, 포화, 불포화 등), 지방 알코올, 에스테르, 지방 알데히드, 케톤, 윤활제 등.
특수 화학제품은 많은 상업적 용도를 갖는다. 지방산은 예로써, 세정제와 비누에서 계면활성제로서 상업적으로 이용된다. 이들은 또한, 연료, 윤활유, 페인트, 래커, 초, 샐러드 오일, 쇼트닝, 화장품, 그리고 유화제에서 첨가제로서 이용될 수 있다. 이에 더하여, 지방산은 고무 제품에서 촉진 활성제 (accelerator activator)로서 이용된다. 지방산은 또한, 메틸 에스테르, 아미드, 아민, 산 염화물, 무수물, 케텐 이합체, 그리고 과산화 산과 에스테르를 생산하기 위한 공급원료 (feedstock)로서 이용될 수 있다.
탄화수소는 많은 상업적 용도를 갖는다. 가령, 더욱 짧은 사슬 알칸은 연료로서 이용된다. 메탄과 에탄은 천연 가스의 주요 성분이다. 더욱 긴 사슬 알칸 (가령, 5개 내지 16개 탄소)은 수송 연료 (가령, 가솔린, 디젤, 또는 항공 연료)로서 이용된다. 16개 초과의 탄소 원자를 갖는 알칸은 연료유와 윤활유의 중요한 성분이다. 실온에서 고체인 이보다 더욱 긴 알칸은 예로써, 파라핀 왁스로서 이용될 수 있다. 대략 35개의 탄소를 보유하는 알칸은 도로 포장 (road surfacing)에 이용되는 아스팔트 (bitumen)에서 발견된다. 이에 더하여, 더욱 긴 사슬 알칸은 상업적으로 유용한 더욱 짧은 사슬 탄화수소를 생산하기 위하여 분해 (cracking)될 수 있다.
짧은 사슬 알칸과 유사하게, 짧은 사슬 알켄은 수송 연료에 이용된다. 더욱 긴 사슬 알켄은 플라스틱, 윤활제, 그리고 합성 윤활제에 이용된다. 이에 더하여, 알켄은 알코올, 에스테르, 가소제, 계면활성제, 3차 아민, 강화된 오일 회수제 (oil recovery agent), 지방산, 티올, 알케닐숙신산 무수물, 에폭시드, 염소화된 알칸, 염소화된 알켄, 왁스, 연료 첨가제, 그리고 추진 흐름 감소제 (drag flow reducer)를 생산하기 위한 공급원료로서 이용된다.
지방 알코올은 많은 상업적 용도를 갖는다. 더욱 짧은 사슬 지방 알코올은 유화제, 연화제, 그리고 농후제로서 미용 산업과 식품 산업에 이용되고 있다. 친양쪽성 성질로 인하여, 지방 알코올은 세정제로서 유용한 비이온성 계면활성제로서 행동한다. 이에 더하여, 지방 알코올은 왁스, 검, 수지, 제약학적 연고와 로션, 윤활유 첨가제, 직물 정전기 방지제와 가공제, 가소제, 화장품, 산업 용매, 그리고 지방용 용매에 이용된다.
에스테르는 많은 상업적 용도를 갖는다. 가령, 대체 연료인 바이오디젤은 에스테르 (가령, 지방산 메틸 에스테르, 지방산 에틸 에스테르 등)로 구성된다. 일부 저분자량 에스테르는 휘발성이고 향긋한 향이 나기 때문에, 방향제 (fragrance) 또는 풍미제 (flavoring agent)로서 유용하다. 이에 더하여, 에스테르는 래커, 페인트, 그리고 니스에 대한 용매로서 이용된다. 게다가, 일부 자연 발생 물질, 예를 들면, 왁스, 지방, 그리고 오일이 에스테르로 구성된다. 에스테르는 또한, 수지와 플라스틱에서 연화제, 가소제, 난연제 (flame retardant), 그리고 가솔린과 오일에서 첨가제로서 이용된다. 이에 더하여, 에스테르는 중합체, 필름, 직물, 염료, 그리고 약제의 제조에 이용될 수 있다.
알데히드는 많은 특수 화학제품을 생산하는데 이용된다. 가령, 알데히드는 중합체, 수지 (가령, Bakelite), 염료, 향료, 가소제, 향수, 약제, 그리고 기타 화학제품을 생산하는데 이용된다. 일부는 용매, 보존제, 또는 붕해제로서 이용된다. 일부 천연과 합성 화합물, 예를 들면, 비타민과 호르몬이 알데히드이다. 이에 더하여, 많은 당이 알데히드 기를 포함한다.
케톤은 용매로서 상업적으로 이용된다. 가령, 아세톤은 용매로서 빈번하게 이용될 뿐만 아니라 중합체를 만들기 위한 원료이다. 케톤은 또한, 래커, 페인트, 폭약, 향수, 그리고 직물 가공에 이용된다. 이에 더하여, 케톤은 알코올, 알켄, 알칸, 이민, 그리고 에나민을 생산하는데 이용된다.
이에 더하여, 원유는 윤활제의 공급원이다. 석유 유래된 윤활제는 전형적으로, 올레핀, 특히 폴리올레핀과 알파-올레핀으로 구성된다. 윤활제는 원유로부터 정유되거나, 또는 원유로부터 정유된 원료를 이용하여 제조될 수 있다.
원유로부터 이들 특수 화학제품을 수득하는 것은 상당한 재정적 투자뿐만 아니라 대량의 에너지가 요구된다. 이는 또한, 비효율적인 과정인데, 그 이유는 빈번하게, 원유 내에 긴 사슬 탄화수소가 더욱 작은 단량체를 생산하기 위하여 분해 (cracking)되기 때문이다. 이들 단량체는 이후, 더욱 복합된 특수 화학제품을 제조하기 위한 원료로서 이용된다.
석유를 탐사하고, 추출하고, 수송하고, 정유하는 것과 관련된 이들 문제점 이외에, 석유는 점점 줄어들고 있는 한정된 자원이다. 세계 석유 소비의 예상치는 연간 300억 배럴 (barrel)이다. 일부 예상에 따르면, 현재의 생산 수준에서, 세계 석유 매장량은 2050년 이전에 고갈될 것으로 예측된다.
최종적으로, 석유 기초된 연료의 연소는 온실 가스 (greenhouse gas) (가령, 이산화탄소) 및 다른 형태의 공기 오염 (가령, 일산화탄소, 이산화황 등)을 방출한다. 연료에 대한 세계 수요가 증가함에 따라서, 온실 가스 및 다른 형태의 공기 오염의 방출 역시 증가하고 있다. 대기 중에서 온실 가스의 축적은 증가된 지구 온난화 (global warming)로 이어진다. 따라서 국지적인 환경 손상 (가령, 기름 유출, 해양 환경의 준설 등) 이외에, 석유 연소 역시 지구 환경을 손상시킨다.
석유에 의해 유발되는 본질적 과제로 인하여, 석유와 같이 탐사되거나, 추출되거나, 장거리에 걸쳐 수송되거나, 또는 실질적으로 정유될 필요가 없는 재생가능 석유 공급원이 요구된다. 또한, 석유 산업 및 석유 기초된 연료의 연소에 의해 유발되는 유형의 환경 손상 없이, 경제적으로 생산될 수 있는 재생가능 석유 공급원이 요구된다. 유사한 이유로, 석유로부터 전형적으로 유래되는 화학제품의 재생가능 공급원이 요구된다.
본 발명의 요약
본 발명은 적어도 부분적으로, 탄화수소 생합성 폴리펩티드를 인코딩하는 남조류 유전자의 확인에 기초된다. 따라서 한 측면에서, 본 발명은 알데히드를 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드, 또는 이의 변이체를 생산하는 단계, 그리고 알데히드를 숙주 세포로부터 분리하는 단계를 포함한다.
일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82에 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구체예에서, 폴리펩티드는 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다. 또 다른 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 가령, 상기 폴리펩티드는 아래의 보존성 아미노산 치환 중에서 하나 이상을 포함한다: 지방족 아미노산, 예를 들면, 알라닌, 발린, 류신, 그리고 이소류신의 다른 지방족 아미노산으로 교체; 세린의 트레오닌으로 교체; 트레오닌의 세린으로 교체; 산성 잔기, 예를 들면, 아스파르트산과 글루탐산의 다른 산성 잔기로 교체; 아미드 기를 보유하는 잔기, 예를 들면, 아스파라긴과 글루타민의 아미드 기를 보유하는 다른 잔기로 교체; 염기성 잔기, 예를 들면, 리신과 아르기닌의 다른 염기성 잔기로 교체; 그리고 방향족 잔기, 예를 들면, 페닐알라닌과 티로신의 다른 방향족 잔기로 교체. 일부 구체예에서, 폴리펩티드는 대략 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 구체예에서, 폴리펩티드는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함한다. 일정한 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 측면에서, 본 발명은 알데히드를 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 발현시키는 단계를 포함한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다. 일부 구체예에서, 상기 방법은 알데히드를 숙주 세포로부터 분리하는 단계를 더욱 포함한다.
다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체(complement), 또는 이의 단편에 혼성화한다.
다른 구체예에서, 뉴클레오티드 서열은 (i) SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열; 또는 (ii) 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드를 인코딩한다. 일부 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 인코딩한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81 또는 이의 단편이다. 다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체 또는 이의 단편에 혼성화한다. 일부 구체예에서, 생물학적 활성은 환원효소 활성이다.
일부 구체예에서, 상기 방법은 숙주 세포를 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환시키는 단계를 포함한다. 일부 구체예에서, 재조합 벡터는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더욱 포함한다. 일부 구체예에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구조성, 또는 세포-특이적 프로모터이다. 특정 구체예에서, 재조합 벡터는 (a) 뉴클레오티드 서열에 작동가능하게 연결된 조절 서열; (b) 뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; (c) 뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; (d) 뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티 (purification moiety); (e) 뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 그리고 (f) 뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로 구성된 군에서 선택되는 적어도 하나의 서열을 포함한다. 일정한 구체예에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정적으로 통합되고, 그리고 상기 뉴클레오티드 서열의 발현은 조절된 프로모터 영역에 의해 제어된다.
본 명세서에 기술된 이들 측면에서, 숙주 세포는 포유동물 세포, 식물 세포, 곤충 세포, 효모 세포, 진균류 세포, 섬유성 진균류 세포, 그리고 세균 세포로 구성된 군에서 선택된다.
일부 구체예에서, 숙주 세포는 그람-양성 세균 세포이다. 다른 구체예에서, 숙주 세포는 그람-음성 세균 세포이다.
일부 구체예에서, 숙주 세포는 에스체리키아 (Escherichia) 속, 바실루스 (Bacillus) 속, 락토바실루스 (Lactobacillus) 속, 로도코쿠스 (Rhodococcus) 속, 슈도모나스 (Pseudomonas) 속, 아스페르길루스 (Aspergillus) 속, 트리코더마 (Trichoderma) 속, 뉴로스포라 (Neurospora) 속, 푸사리움 (Fusarium) 속, 후미콜라 (Humicola) 속, 리조무코 (Rhizomucor) 속, 클루이베로마이세스 (Kluyveromyces) 속, 피치아 (Pichia) 속, 무코 (Mucor) 속, 미셀리오프토라 (Myceliophtora) 속, 페니실리움 (Penicillium) 속, 파네로차에테 (Phanerochaete) 속, 느타리속 (Pleurotus), 송편버섯속 (Trametes), 크리소스포륨 (Chrysosporium) 속, 사카로마이세스 (Saccharomyces) 속, 스테노트로파모나스 (Stenotrophamonas) 속, 쉬조사카로마이세스 (Schizosaccharomyces) 속, 야로위아 (Yarrowia) 속, 또는 스트렙토마이세스 (Streptomyces) 속으로부터 선택된다.
특정 구체예에서, 숙주 세포는 바실루스 렌투스 (Bacillus lentus) 세포, 바실루스 브레비스 (Bacillus brevis) 세포, 바실루스 스테아로써모필러스 (Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스 (Bacillus licheniformis) 세포, 바실루스 알칼로필루스 (Bacillus alkalophilus) 세포, 바실루스 코아굴란스 (Bacillus coagulans) 세포, 바실루스 키르쿨란스 (Bacillus circulans) 세포, 바실루스 푸밀리스 (Bacillus pumilis) 세포, 바실루스 튜링기엔시스 (Bacillus thuringiensis) 세포, 바실루스 클라우시 (Bacillus clausii) 세포, 바실루스 메가테리움 (Bacillus megaterium) 세포, 바실루스 서브틸리스 (Bacillus subtilis) 세포, 또는 바실루스 아밀로리퀴파시엔스 (Bacillus amyloliquefaciens) 세포이다.
다른 구체예에서, 숙주 세포는 트리코더마 코닌기 (Trichoderma koningii) 세포, 트리코더마 비리데 (Trichoderma viride) 세포, 트리코더마 르에세이 (Trichoderma reesei) 세포, 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리 (Aspergillus awamori) 세포, 아스페르길루스 푸미가테스 (Aspergillus fumigates) 세포, 아스페르길루스 포에티두스 (Aspergillus foetidus) 세포, 아스페르길루스 니둘란스 (Aspergillus nidulans) 세포, 아스페르길루스 니게르 (Aspergillus niger) 세포, 아스페르길루스 오리재 (Aspergillus oryzae) 세포, 후미콜라 인솔렌스 (Humicola insolens) 세포, 후미콜라 라누기노세 (Humicola lanuginose) 세포, 로도코쿠스 오파쿠스 (Rhodococcus opacus) 세포, 리조무코 미에헤이 (Rhizomucor miehei) 세포, 또는 무코 미에헤이 (Mucor michei) 세포이다.
또 다른 구체예에서, 숙주 세포는 스트렙토마이세스 리비단스 (Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스 (Streptomyces murinus) 세포이다. 다른 구체예에서, 숙주 세포는 방선균 (Actinomycetes) 세포이다.
일부 구체예에서, 숙주 세포는 CHO 세포, COS 세포, VERO 세포, BHK 세포, HeLa 세포, Cv1 세포, MDCK 세포, 293 세포, 3T3 세포, 또는 PC12 세포이다.
특정 구체예에서, 숙주 세포는 대장균 (E. coli) 세포, 예를 들면, 균주 B, 균주 C, 균주 K, 또는 균주 W 대장균 (E. coli) 세포이다.
다른 구체예에서, 숙주 세포는 남조류 (Cyanobacterial) 숙주 세포이다. 특정 구체예에서, 남조류 숙주 세포는 표 1에 열거된 세포이다.
일부 구체예에서, 알데히드는 숙주 세포에 의해서 분비된다.
일정한 구체예에서, 숙주 세포는 본 명세서에 기술된 기질을 과다발현한다. 일부 구체예에서, 상기 방법은 본 명세서에 기술된 효소를 인코딩하는 핵산으로 숙주 세포를 형질전환시키는 단계를 더욱 포함하고, 그리고 상기 숙주 세포는 본 명세서에 기술된 기질을 과다발현한다. 다른 구체예에서, 상기 방법은 본 명세서에 기술된 적어도 하나의 기질의 존재에서 상기 숙주 세포를 배양하는 단계를 더욱 포함한다. 일부 구체예에서, 기질은 지방산 유도체, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 지방 알코올, 또는 지방 에스테르이다.
일부 구체예에서, 지방산 유도체 기질은 불포화 지방산 유도체 기질, 단일불포화 지방산 유도체 기질, 또는 포화된 지방산 유도체 기질이다. 다른 구체예에서, 지방산 유도체 기질은 직쇄형 지방산 유도체 기질, 분지쇄형 지방산 유도체 기질, 또는 환형 모이어티 (cyclic moiety)를 포함하는 지방산 유도체 기질이다.
일부 구체예에서, 지방산 유도체는 C3-C25 지방산 유도체이다. 예를 들어, 지방산 유도체는 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 지방산 유도체이다. 특정 구체예에서, 지방산 유도체 기질은 테트라데카노일-ACP, 헥사데카노일-ACP, 헥사데세노일-ACP, 또는 옥타데세노일-ACP이다.
본 명세서에 기술된 일들 측면의 일정한 구체예에서, 알데히드는 C3-C25 알데히드이다. 예를 들어, 알데히드는 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 알데히드이다. 일부 구체예에서, 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 또는 메틸옥타데세날이다.
일부 구체예에서, 알데히드는 직쇄형 알데히드, 분지쇄형 알데히드, 또는 환형 알데히드이다.
일부 구체예에서, 상기 방법은 숙주 세포 또는 배양 배지로부터 알데히드를 분리하는 단계를 더욱 포함한다.
다른 측면에서, 본 발명은 미생물의 게놈 DNA 내로 안정적으로 통합된 외인성 조절 서열을 포함하는 유전자 조작된 미생물에 관계한다. 한 구체예에서, 조절 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 상류에 통합된다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다.
일부 구체예에서, 폴리뉴클레오티드는 상기 미생물에 내생적이다. 일부 구체예에서, 상기 미생물은 야생형 미생물과 비교하여 증가된 수준의 알데히드를 발현한다. 일부 구체예에서, 상기 미생물은 남조류이다.
다른 측면에서, 본 발명은 알데히드를 만드는 방법에 관계하고, 상기 방법은 유전자 발현에 적합한 조건 하에 본 명세서에 기술된 유전자 조작된 미생물을 배양하는 단계, 그리고 알데히드를 분리하는 단계를 포함한다.
다른 측면에서, 본 발명은 알데히드를 만드는 방법에 관계하고, 상기 방법은 기질을 (i) SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 적어도 70% 동일성을 갖는 폴리펩티드, 또는 이의 변이체; (ii) SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 70% 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된 폴리펩티드, 또는 이의 변이체; (iii) SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함하는 폴리펩티드와 접촉시키는 단계를 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82에 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 동일성을 갖는다. 일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 갖는다.
일부 구체예에서, 폴리펩티드는 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 폴리펩티드는 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81을 갖는 뉴클레오티드 서열에 의해 인코딩된다.
일부 구체예에서, 생물학적 기질은 지방산 유도체, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 지방 알코올, 또는 지방 에스테르이다.
일부 구체예에서, 지방산 유도체는 C3-C25 지방산 유도체이다. 예를 들어, 지방산 유도체는 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 지방산 유도체이다. 특정 구체예에서, 지방산 유도체 기질은 테트라데카노일-ACP, 헥사데카노일-ACP, 헥사데세노일-ACP, 또는 옥타데세노일-ACP이다.
일정한 구체예에서, 알데히드는 C3-C25 알데히드이다. 예를 들어, 알데히드는 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 알데히드이다. 일부 구체예에서, 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 또는 메틸옥타데세날이다.
일부 구체예에서, 알데히드는 직쇄형 알데히드, 분지쇄형 알데히드, 또는 환형 알데히드이다.
다른 측면에서, 본 발명은 본 명세서에 기술된 임의의 방법 또는 미생물에 의해 생산된 알데히드에 관계한다. 특정 구체예에서, 알데히드는 대략 -15.4 또는 그 이상의 δ13C를 갖는다. 가령, 알데히드는 대략 -15.4 내지 대략 -10.9, 예를 들면, 대략 -13.92 내지 대략 -13.84의 δ13C를 갖는다. 다른 구체예에서, 알데히드는 적어도 대략 1.003의 fM 14C를 갖는다. 가령, 알데히드는 적어도 대략 1.01 또는 적어도 대략 1.5의 fM 14C를 갖는다. 일부 구체예에서, 알데히드는 대략 1.111 내지 대략 1.124의 fM 14C를 갖는다.
다른 측면에서, 본 발명은 지방 알코올을 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드, 또는 이의 변이체를 생산하는 단계, 그리고 지방 알코올을 숙주 세포로부터 분리하는 단계를 포함한다. 일부 구체예에서, 지방 알코올은 세포에 의해서 분비된다.
일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82에 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구체예에서, 폴리펩티드는 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다. 또 다른 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 가령, 상기 폴리펩티드는 아래의 보존성 아미노산 치환 중에서 하나 이상을 포함한다: 지방족 아미노산, 예를 들면, 알라닌, 발린, 류신, 그리고 이소류신의 다른 지방족 아미노산으로 교체; 세린의 트레오닌으로 교체; 트레오닌의 세린으로 교체; 산성 잔기, 예를 들면, 아스파르트산과 글루탐산의 다른 산성 잔기로 교체; 아미드 기를 보유하는 잔기, 예를 들면, 아스파라긴과 글루타민의 아미드 기를 보유하는 다른 잔기로 교체; 염기성 잔기, 예를 들면, 리신과 아르기닌의 다른 염기성 잔기로 교체; 그리고 방향족 잔기, 예를 들면, 페닐알라닌과 티로신의 다른 방향족 잔기로 교체. 일부 구체예에서, 폴리펩티드는 대략 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 구체예에서, 폴리펩티드는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함한다. 일정한 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 측면에서, 본 발명은 지방 알코올을 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 발현시키는 단계를 포함한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다. 일부 구체예에서, 상기 방법은 지방 알코올을 숙주 세포로부터 분리하는 단계를 더욱 포함한다.
다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체, 또는 이의 단편에 혼성화한다.
다른 구체예에서, 뉴클레오티드 서열은 (i) SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열; 또는 (ii) 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드를 인코딩한다. 일부 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
다른 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 인코딩한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81 또는 이의 단편이다. 다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체 또는 이의 단편에 혼성화한다. 일부 구체예에서, 생물학적 활성은 환원효소 활성이다.
일부 구체예에서, 상기 방법은 숙주 세포를 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환시키는 단계를 포함한다. 일부 구체예에서, 재조합 벡터는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더욱 포함한다. 일부 구체예에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구조성, 또는 세포-특이적 프로모터이다. 특정 구체예에서, 재조합 벡터는 (a) 뉴클레오티드 서열에 작동가능하게 연결된 조절 서열; (b) 뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; (c) 뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; (d) 뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티 (purification moiety); (e) 뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 그리고 (f) 뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로 구성된 군에서 선택되는 적어도 하나의 서열을 포함한다. 일정한 구체예에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정적으로 통합되고, 그리고 상기 뉴클레오티드 서열의 발현은 조절된 프로모터 영역에 의해 제어된다.
일부 구체예에서, 상기 방법은 숙주 세포에서 재조합 알코올 탈수소효소를 인코딩하는 유전자를 발현시키는 단계를 더욱 포함한다.
본 명세서에 기술된 발명의 임의의 측면에서, 상기 방법은 C6-C26 지방 알코올을 포함하는 지방 알코올을 생산할 수 있다. 일부 구체예에서, 지방 알코올은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 지방 알코올이다. 특정 구체예에서, 지방 알코올은 1-데카놀, 1-도데카놀, 1-미리스틸 알코올, 1-헥사데카놀, 옥타데세놀, 테트라데세놀, 또는 헥사데세놀이다.
다른 구체예에서, 지방 알코올은 직쇄형 지방 알코올을 포함한다. 다른 구체예에서, 지방 알코올은 분지쇄형 지방 알코올을 포함한다. 또 다른 구체예에서, 지방 알코올은 환형 모이어티를 포함한다.
일부 구체예에서, 지방 알코올은 불포화 지방 알코올이다. 다른 구체예에서, 지방 알코올은 단일불포화 지방 알코올이다. 또 다른 구체예에서, 지방 알코올은 포화 지방 알코올이다.
다른 측면에서, 본 발명은 본 명세서에 기술된 임의의 방법 또는 임의의 미생물에 의해 생산된 지방 알코올, 또는 본 명세서에 기술된 임의의 방법 또는 임의의 미생물에 의해 생산된 지방 알코올을 포함하는 계면활성제에 관계한다.
일부 구체예에서, 지방 알코올은 대략 -15.4 또는 그 이상의 δ13C를 갖는다. 일정한 구체예에서, 지방 알코올은 대략 -15.4 내지 대략 -10.9, 또는 대략 -13.92 내지 대략 -13.84의 δ13C를 갖는다.
일부 구체예에서, 지방 알코올은 적어도 대략 1.003의 fM 14C를 갖는다. 일정한 구체예에서, 지방 알코올은 적어도 대략 1.01 또는 적어도 대략 1.5의 fM 14C를 갖는다. 일부 구체예에서, 지방 알코올은 대략 1.111 내지 대략 1.124의 fM 14C를 갖는다.
다른 측면에서, 본 발명은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 대략 500개 이하의 뉴클레오티드로 구성되는 분리된 핵산에 관계한다. 일부 구체예에서, 핵산은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 대략 300개 이하의 뉴클레오티드, 대략 350개 이하의 뉴클레오티드, 대략 400개 이하의 뉴클레오티드, 대략 450개 이하의 뉴클레오티드, 대략 550개 이하의 뉴클레오티드, 대략 600개 이하의 뉴클레오티드, 또는 대략 650개 이하의 뉴클레오티드로 구성된다. 일부 구체예에서, 상기 핵산은 환원효소 활성을 갖는 폴리펩티드를 인코딩한다.
다른 측면에서, 본 발명은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 뉴클레오티드 중에서 대략 99% 이하, 대략 98% 이하, 대략 97% 이하, 대략 96% 이하, 대략 95% 이하, 대략 94% 이하, 대략 93% 이하, 대략 92% 이하, 대략 91% 이하, 대략 90% 이하, 대략 85% 이하, 또는 대략 80% 이하로 구성되는 분리된 핵산에 관계한다. 일부 구체예에서, 상기 핵산은 환원효소 활성을 갖는 폴리펩티드를 인코딩한다.
다른 측면에서, 본 발명은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 중에서 대략 200 이하, 대략 175개 이하, 대략 150개 이하, 또는 대략 100개 이하로 구성되는 분리된 폴리펩티드에 관계한다. 일부 구체예에서, 상기 폴리펩티드는 환원 활성을 갖는다.
다른 측면에서, 본 발명은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 중에서 대략 99% 이하, 대략 98% 이하, 대략 97% 이하, 대략 96% 이하, 대략 95% 이하, 대략 94% 이하, 대략 93% 이하, 대략 92% 이하, 대략 91% 이하, 대략 90% 이하, 대략 85% 이하, 또는 대략 80% 이하로 구성되는 분리된 폴리펩티드에 관계한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.
정의
본 명세서 전반에서, 약칭된 유전자 명칭 또는 폴리펩티드 명칭이 언급되지만, 이런 약칭된 유전자 또는 폴리펩티드 명칭은 유전자 또는 폴리펩티드의 종류를 대표하는 것으로 이해된다. 이런 유전자 명칭은 동일한 생리학적 기능을 갖는 동일한 폴리펩티드와 상동성 폴리펩티드를 인코딩하는 모든 유전자를 포함한다. 폴리펩티드 명칭은 동일한 활성을 갖는 (가령, 동일한 기본 화학 반응을 촉매하는) 모든 폴리펩티드를 포함한다.
본 명세서에 언급된 수탁 번호는 National Institute of Health, U.S.A에 의해 관리되는 NCBI 데이터베이스 (National Center for Biotechnology Information)로부터 유래된다. 달리 명시되지 않으면, 이들 수탁 번호는 2009년 4월까지의 데이터베이스에서 제공된다.
EC 번호는 Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB)에 의해 확증된다 (http://www.chem.qmul.ac.uk/iubmb/enzyme/). 본 명세서에 언급된 EC 번호는 University of Tokyo에 의해 부분적으로 후원된, Kyoto Encyclopedia of Genes and Genomes에 의해 관리되는 KEGG 리간드 데이터베이스로부터 유래된다. 달리 명시되지 않으면, 이들 EC 번호는 2008년 3월까지의 데이터베이스에서 제공된다.
본 명세서에서, 단수 관사는 상기 관사의 문법적 목적어의 1개 또는 그 이상 (즉, 적어도 하나)을 지칭하는데 이용된다. 예로써, "요소"는 1개 또는 그 이상의 요소를 의미한다.
본 명세서에서, 용어 "대략"은 일정한 수치의 값 ± 20%를 의미하는데 이용된다. 따라서 "대략 60%"는 60 ± (60의 20%) (즉, 48 내지 70)의 값을 의미한다.
본 명세서에서, 용어 "알데히드"는 불포화 카르보닐 기 (C=O)로 특징되는 화학식 RCHO를 갖는 탄화수소를 의미한다. 바람직한 구체예에서, 알데히드는 지방산 또는 지방산 유도체로부터 만들어지는 임의의 알데히드이다. 한 구체예에서, R 기는 적어도 대략 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 탄소 길이를 갖는다.
본 명세서에서, "알데히드 생합성 유전자" 또는 "알데히드 생합성 폴리뉴클레오티드"는 알데히드 생합성 폴리펩티드를 인코딩하는 핵산이다.
본 명세서에서, "알데히드 생합성 폴리펩티드"는 알데히드의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알데히드를 산출할 수 있다. 일부 경우에, 알데히드 생합성 폴리펩티드는 환원효소 활성을 갖는다.
본 명세서에서, 용어 "알칸"은 단일 탄소-탄소 결합만을 보유하는 탄화수소를 의미한다.
본 명세서에서, "알칸 생합성 유전자" 또는 "알칸 생합성 폴리뉴클레오티드"는 알칸 생합성 폴리펩티드를 인코딩하는 핵산이다.
본 명세서에서, "알칸 생합성 폴리펩티드"는 알칸의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알칸을 산출할 수 있다. 일부 경우에, 알칸 생합성 폴리펩티드는 탈카르보닐효소 활성을 갖는다.
본 명세서에서, "알켄 생합성 유전자" 또는 "알켄 생합성 폴리뉴클레오티드"는 알켄 생합성 폴리펩티드를 인코딩하는 핵산이다.
본 명세서에서, "알켄 생합성 폴리펩티드"는 알켄의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알켄을 산출할 수 있다. 일부 경우에, 알켄 생합성 폴리펩티드는 탈카르보닐효소 활성을 갖는다.
본 명세서에서, 용어 "감약"은 약화, 축소 또는 감소를 의미한다. 가령, 폴리펩티드는 활성이 감소하도록 상기 폴리펩티드를 변형함으로써 (가령, 상기 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 변형함으로써) 감약될 수 있다.
본 명세서에서, 용어 "바이오디젤"은 석유로부터 유래되는 디젤의 대체제가 될 수 있는 생물연료를 의미한다. 바이오디젤은 "순수한 (neat)" 바이오디젤로 지칭되는 순수한 형태로, 또는 임의의 농도에서 석유-기초된 디젤과의 혼합물로서 내연 디젤 기관 (internal combustion diesel engine)에 이용될 수 있다. 바이오디젤은 에스테르 또는 탄화수소, 예를 들면, 알데히드와 알칸을 포함할 수 있다.
본 명세서에서, 용어 "생물연료"는 생물자원 (biomass)로부터 유래된 임의의 연료를 지칭한다. 생물연료는 석유 기초된 연료를 대체할 수 있다. 가령, 생물연료는 수송 연료 (가령, 가솔린, 디젤, 제트 연료 등), 난방유, 그리고 전기-발생 연료를 포함한다. 생물연료는 재생가능 에너지원이다.
본 명세서에서, 용어 "생물자원"은 생물학적 물질로부터 유래된 탄소 공급원을 지칭한다. 생물자원은 생물연료로 전환될 수 있다. 생물자원의 한 가지 예시적인 공급원은 식물성 물질이다. 가령, 옥수수, 사탕수수, 또는 스위치그래스 (switchgrass)가 생물자원으로서 이용될 수 있다. 생물자원의 다른 무제한적 실례는 동물성 물질, 예를 들면, 우분 (cow manure)이다. 생물자원에는 또한, 공업, 농업, 임업, 그리고 가정으로부터 폐기물이 포함된다. 생물자원으로서 이용될 수 있는 이런 폐기물의 실례는 발효 찌꺼기, 짚, 재목, 오수, 쓰레기, 그리고 음식 찌꺼기이다. 생물자원에는 또한, 탄소 공급원, 예를 들면, 탄수화물 (가령, 단당류, 이당류, 또는 다당류)이 포함된다.
본 명세서에서, 구(句) "탄소 공급원"은 원핵 또는 단순한 진핵 세포 성장을 위한 탄소 공급원으로서 이용하기 적합한 기질 또는 화합물을 지칭한다. 탄소 공급원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드, 그리고 가스 (가령, CO와 CO2)가 포함되지만 이들에 국한되지 않는 다양한 형태일 수 있다. 이들에는 예로써, 다양한 단당류, 예를 들면, 글루코오스, 프럭토오스, 만노오스, 그리고 갈락토오스; 올리고당류, 예를 들면, 프럭토-올리고당류와 갈락토-올리고당류; 다당류, 예를 들면, 크실로오스와 아라비노오스; 이당류, 예를 들면, 수크로오스, 말토오스, 그리고 투라노오스 (turanose); 셀룰로오스 물질, 예를 들면, 메틸 셀룰로오스와 나트륨 카르복시메틸 셀룰로오스; 포화된 또는 불포화 지방산 에스테르, 예를 들면, 숙시네이트, 락테이트, 그리고 아세테이트; 알코올, 예를 들면, 에탄올 또는 이의 혼합물이 포함된다. 탄소 공급원은 또한, 글루코오스가 포함되지만 이에 국한되지 않는 광합성 (photosynthesis)의 산물일 수 있다. 바람직한 탄소 공급원은 생물자원이다. 다른 바람직한 탄소 공급원은 글루코오스이다.
본 명세서에서, "운점 (cloud point) 저하 첨가제"는 용액의 운점을 감소 또는 저하시키기 위하여 조성물에 첨가되는 첨가제이다.
본 명세서에서, 구(句) "액체의 운점"은 용해된 고체가 더 이상 완전하게 용해될 수 없는 온도를 의미한다. 이러한 온도 미만에서, 고체는 액체에 흐린 외관을 제공하는 두 번째 상 (phase)으로서 침전하기 시작한다. 석유 산업에서, 운점은 그 미만에서, 고형화된 물질 또는 다른 중탄화수소가 원유, 정유, 또는 연료 내에서 결정화되어 흐린 외관을 형성하는 온도를 지칭한다. 고형화된 물질의 존재는 액체의 유동 행동 (flowing behavior), 연료 필터, 분사 장치 등에 들러붙는 액체의 경향, 차가운 표면 (가령, 파이프라인 또는 열 교환기 파울링 (heat exchanger fouling))에서 고형화된 물질의 축적, 그리고 물을 포함하는 액체의 에멀젼 특징에 영향을 준다.
뉴클레오티드 서열은 2개의 서열의 각 염기가 조화되면 (즉, 왓슨 크릭 염기쌍 (Watson Crick base pair)을 형성할 수 있으면) 다른 뉴클레오티드 서열에 "상보성"이다. 용어 "상보성 가닥"은 본 명세서에서, 용어 "보체"와 동의어로서 이용된다. 핵산 가닥의 보체는 코딩 가닥의 보체 또는 비-코딩 가닥의 보체일 수 있다.
본 명세서에서, 용어 "발현을 가능하게 할 만큼 충분한 조건"은 숙주 세포가 원하는 산물, 예를 들면, 본 명세서에 기술된 폴리펩티드, 알데히드, 또는 알칸을 생산할 수 있도록 하는 임의의 조건을 의미한다. 적절한 조건에는 예로써, 발효 조건이 포함된다. 발효 조건은 많은 파라미터, 예를 들면, 온도 범위, 통기 수준, 그리고 배지 조성을 포함할 수 있다. 이들 각 조건은 개별적으로, 그리고 조합으로, 숙주 세포가 성장할 수 있도록 한다. 예시적인 배양 배지에는 액체 배지 또는 겔이 포함된다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 물질 대사될 수 있는 탄소 공급원, 예를 들면, 글루코오스, 프럭토오스, 셀룰로오스 등을 포함한다. 이에 더하여, 탄소 공급원의 동원 (가령, 전분 또는 셀룰로오스의 발효가능 당으로의 해중합반응 (depolymerization)) 및 차후 물질 대사를 촉진하기 위한 효소가 배지에서 이용될 수 있다.
조건이 발현을 가능하게 할 만큼 충분한 지를 결정하기 위하여, 숙주 세포는 예로써, 대략 4, 8, 12, 24, 36, 또는 48시간 동안 배양될 수 있다. 배양 동안 및/또는 배양 이후, 샘플은 획득되고 이들 조건이 발현을 가능하게 하는 지를 결정하기 위하여 분석될 수 있다. 가령, 숙주 세포가 성장된 샘플 또는 배지 내에서 이들 숙주 세포는 원하는 산물의 존재에 대하여 조사될 수 있다. 산물의 존재에 대하여 조사할 때, 예로써 TLC, HPLC, GC/FID, GC/MS, LC/MS, MS가 포함되지만 이들에 국한되지 않는 분석법이 이용될 수 있다.
본 명세서에 기술된 폴리펩티드는 폴리펩티드 기능에 실질적인 영향을 주지 않는 추가의 보존성 또는 비-필수 아미노산 치환을 보유할 수 있는 것으로 이해된다. 특정한 치환이 관용되는 (즉, 원하는 생물학적 특성, 예를 들면, 탈탄소효소 활성에 부정적인 영향을 주지 않는) 지의 여부는 Bowie et al., Science (1990) 247:1306 1310에서 기술된 바와 같이 결정될 수 있다. "보존성 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 보유하는 아미노산 잔기로 대체되는 것이다. 유사한 측쇄를 보유하는 아미노산 잔기의 집단은 당분야에서 정의되었다. 이들 집단에는 염기성 측쇄를 보유하는 아미노산 (가령, 리신, 아르기닌, 히스티딘), 산성 측쇄를 보유하는 아미노산 (가령, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄를 보유하는 아미노산 (가령, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 측쇄를 보유하는 아미노산 (가령, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄를 보유하는 아미노산 (가령, 트레오닌, 발린, 이소류신), 그리고 방향족 측쇄를 보유하는 아미노산 (가령, 티로신, 페닐알라닌, 트립토판, 히스티딘)이 포함된다.
본 명세서에서, "제어 요소 (control element)"는 전사 제어 요소를 의미한다. 제어 요소에는 프로모터와 인핸서가 포함된다. 용어 "프로모터 요소", "프로모터", 또는 "프로모터 서열"은 유전자의 발현을 활성화시키는 스위치로서 기능하는 DNA 서열을 지칭한다. 유전자가 활성화되면, 상기 유전자는 전사되거나, 또는 전사에 참여한다. 전사는 유전자의 mRNA의 합성을 수반한다. 이런 이유로, 프로모터는 전사 조절 요소로서 기능하고, 또한 유전자의 mRNA로의 전사를 개시하기 위한 부위를 제공한다. 제어 요소는 전사에 관여하는 세포 단백질과 특이적으로 상호작용한다 (Maniatis et al., Science 236:1237, 1987).
본 명세서에서, 용어 "에스테르 신타아제 (synthase)"는 지방 에스테르를 생산할 수 있는 펩티드를 의미한다. 더욱 구체적으로, 에스테르 신타아제는 티오에스테르를 지방 에스테르로 전환시키는 펩티드이다. 바람직한 구체예에서, 에스테르 신타아제는 티오에스테르 (가령, 아실-CoA)를 지방 에스테르로 전환시킨다.
대안적 구체예에서, 에스테르 신타아제는 기질로서 티오에스테르와 알코올을 이용하여 지방 에스테르를 생산한다. 에스테르 신타아제는 기질로서 짧은, 그리고 긴 사슬 티오에스테르를 이용할 수 있다. 이에 더하여, 에스테르 신타아제는 기질로서 짧고 사슬과 긴 사슬 알코올을 이용할 수 있다.
에스테르 신타아제의 무제한적 실례는 왁스 신타아제, 왁스-에스테르 신타아제, 아실 CoA:알코올 트랜스아실라아제, 아실전이효소, 그리고 지방 아실-조효소 A:지방 알코올 아실전이효소이다. 예시적인 에스테르 신타아제는 효소 분류 번호 EC 2.3.1.75에서 분류된다. 예시적인 GenBank 수탁 번호는 도 40에서 제공된다.
본 명세서에서, 용어 "지방산"은 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족 기, 바람직하게는 알킬 기이다. R은 대략 4개 내지 대략 22개의 탄소 원자를 포함할 수 있다. 지방산은 포화되거나, 단일불포화되거나, 또는 다중불포화될 수 있다. 바람직한 구체예에서, 지방산은 지방산 생합성 경로로부터 만들어진다.
본 명세서에서, 용어 "지방산 생합성 경로"는 지방산을 생산하는 생합성 경로를 의미한다. 지방산 생합성 경로는 지방산을 생산하기 위하여 본 명세서에 기술된 바와 같이 조작될 수 있고, 그리고 일부 구체예에서 원하는 탄소 사슬 특징을 갖는 지방산을 생산하는 추가적인 효소와 함께 발현될 수 있는 지방산 효소를 포함한다.
본 명세서에서, 용어 "지방산 유도체"는 생산 숙주 생물체의 지방산 생합성 경로로부터 부분적으로 만들어지는 산물을 의미한다. "지방산 유도체"는 또한, 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 만들어진 산물을 포함한다. 지방산 생합성 경로는 지방산 유도체를 생산하기 위하여 본 명세서에 기술된 바와 같이 조작될 수 있고, 그리고 일부 구체예에서 원하는 탄소 사슬 특징을 갖는 지방산 유도체를 생산하는 추가적인 효소와 함께 발현될 수 있는 지방산 신타아제 효소를 포함한다. 예시적인 지방산 유도체에는 예로써, 지방산, 아실-CoA, 지방 알데히드, 짧은 사슬과 긴 사슬 알코올, 탄화수소, 지방 알코올, 그리고 에스테르 (가령, 왁스, 지방산 에스테르, 또는 지방 에스테르)가 포함된다.
본 명세서에서, 용어 "지방산 유도체 효소"는 지방산 유도체의 생산에서 발현되거나 과다발현될 수 있는 모든 효소를 의미한다. 이들 효소는 본 명세서에서, 총체적으로 지방산 유도체 효소로 지칭된다. 이들 효소는 지방산 생합성 경로의 일부일 수 있다. 지방산 유도체 효소의 무제한적 실례에는 지방산 신타아제, 티오에스테라아제, 아실-CoA 신타아제, 아실-CoA 환원효소, 알코올 탈수소효소, 알코올 아실전이효소, 지방 알코올-형성 아실-CoA 환원효소, 에스테르 신타아제, 알데히드 생합성 폴리펩티드, 그리고 알칸 생합성 폴리펩티드가 포함된다. 지방산 유도체 효소는 기질을 지방산 유도체로 전환시킨다. 일부 실례에서, 기질은 지방산 유도체 효소에 의해 상이한 지방산 유도체로 전환되는 지방산 유도체일 수 있다.
본 명세서에서, 용어 "지방 알코올 형성 펩티드"는 지방 알코올 형성 아실-CoA 환원효소 (FAR, EC 1.1.1.*), 아실-CoA 환원효소 (EC 1.2.1.50), 또는 알코올 탈수소효소 (EC 1.1.1.1)를 비롯하여, 아실-CoA의 지방 알코올로의 전환을 촉매할 수 있는 펩티드를 의미한다. 부가적으로, 당업자는 일부 지방 알코올 형성 펩티드가 다른 반응 역시 촉매할 것이라는 것을 인지할 것이다. 가령, 일부 아실-CoA 환원효소 펩티드는 지방산 이외에 다른 기질을 수용할 것이다. 이런 이유로, 이런 비-특이적인 펩티드 역시 포함된다. 지방 알코올 형성 펩티드를 인코딩하는 핵산 서열은 당분야에 공지되어 있고, 그리고 이런 펩티드는 공개적으로 가용하다. 예시적인 GenBank 수탁 번호는 도 40에서 제공된다.
본 명세서에서, "지방산 효소"는 지방산 생합성에 관여하는 임의의 효소를 의미한다. 지방산 효소는 지방산을 생산하기 위하여 숙주 세포에서 발현되거나 과다발현될 수 있다. 지방산 효소의 무제한적 실례에는 지방산 신타아제와 티오에스테라아제가 포함된다.
본 명세서에서, 용어 "지방 에스테르"는 에스테르를 의미한다. 바람직한 구체예에서, 지방 에스테르는 지방산으로부터 만들어진 임의의 에스테르, 예를 들면, 지방산 에스테르이다. 한 구체예에서, 지방 에스테르는 A 측면 (즉, 카르복시산염 산소에 부착된 탄소 사슬)과 B 측면 (즉, 부모 카르복시산염을 포함하는 탄소 사슬)을 포함한다. 바람직한 구체예에서, 지방 에스테르가 지방산 생합성 경로로부터 유래될 때, A 측면은 알코올에 의해 기여되고, 그리고 B 측면은 지방산에 의해 기여된다. 지방 에스테르의 A 측면을 형성하는데 임의의 알코올이 이용될 수 있다. 가령, 알코올은 지방산 생합성 경로로부터 유래될 수 있다. 대안으로, 알코올은 비-지방산 생합성 경로를 통해 생산될 수 있다. 게다가, 알코올은 외인성으로 제공될 수 있다. 가령, 알코올은 지방 에스테르가 생물체에 의해 생산되는 경우에 발효 액체 배지에 담겨 제공될 수 있다. 대안으로, 카르복실산, 예를 들면, 지방산 또는 아세트산이 지방 에스테르가 알코올 역시 생산할 수 있는 생물체에 의해 생산되는 경우에 외인성으로 제공될 수 있다.
A 측면 또는 B 측면을 포함하는 탄소 사슬은 임의의 길이일 수 있다. 한 구체예에서, 에스테르의 A 측면은 적어도 대략 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16, 또는 18개의 탄소 길이를 갖는다. 에스테르의 B 측면은 적어도 대략 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 또는 26개의 탄소 길이를 갖는다. A 측면 및/또는 B 측면은 곧은 또는 분지형 사슬일 수 있다. 분지형 사슬은 하나 이상의 분지화(branching) 지점을 보유할 수 있다. 이에 더하여, 이들 분지형 사슬은 환형 가지를 보유할 수 있다. 더 나아가, A 측면 및/또는 B 측면은 포화되거나 불포화될 수 있다. 불포화되는 경우에, A 측면 및/또는 B 측면은 하나 이상의 불포화 지점을 보유할 수 있다.
한 구체예에서, 지방 에스테르는 생합성으로 생산된다. 이러한 구체예에서, 먼저 지방산이 "활성화된다". "활성화된" 지방산의 무제한적 실례는 아실-CoA, 아실-ACP, 그리고 아실 인산염이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 산물일 수 있다. 이에 더하여, 아실-CoA는 유리 지방산, CoA, 또는 아데노신 뉴클레오티드 트리인산염 (ATP)으로부터 합성될 수 있다. 아실-CoA를 생산하는 효소의 실례는 아실-CoA 신타아제이다.
지방산은 활성화된 이후, 수령 친핵체 (recipient nucleophile)로 용이하게 이전될 수 있다. 예시적인 친핵체는 알코올, 티올, 또는 인산염이다.
한 구체예에서, 지방 에스테르는 왁스이다. 왁스는 긴 사슬 알코올 및 긴 사슬 지방산으로부터 유래될 수 있다. 다른 구체예에서, 지방 에스테르는 지방 아실-티오에스테르와 알코올로부터 유래될 수 있다. 다른 구체예에서, 지방 에스테르는 지방산 티오에스테르, 예를 들면, 지방 아실 조효소 A (CoA)이다. 다른 구체예에서, 지방 에스테르는 지방 아실 판토테네이트, 아실 운반 단백질 (ACP), 또는 지방 인산염 에스테르이다. 지방 에스테르는 다양한 용도를 갖는다. 가령, 지방 에스테르는 생물연료로서 이용될 수 있다.
본 명세서에서, "현대 탄소 (modern carbon)의 분율" 또는 "fM"은 각각, 옥살산 기준 HOxI과 HOxII로 알려져 있는, 미국 국립표준기술연구소 (National Institute of Standards and Technology, NIST) 표준 참고 물질 (Standard Reference Materials, SRMs) 4990B와 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 이러한 기본 정의는 14C /12C 동위원소 비율 HOxI (AD 1950에 기준됨)의 0.95 배에 합치한다. 이는 붕괴-보정된 산업 혁명전 목재에 거의 동등하다. 현재 생존 생물권 (living biosphere) (식물 물질)의 경우에, fM은 대략 1.1이다.
2개의 서열 사이에 "상동성"의 계산은 아래와 같이 수행될 수 있다. 이들 서열은 최적 비교 목적으로 정렬된다 (가령, 최적 정렬을 위하여 첫 번째와 두 번째 아미노산 또는 핵산 서열 중에서 한쪽 또는 양쪽에 갭 (gap)이 도입될 수 있고, 비-상동성 서열은 비교 목적을 위하여 무시될 수 있다). 바람직한 구체예에서, 비교 목적으로 정렬된 참고 서열의 길이는 상기 참고 서열의 길이의 적어도 대략 30%, 바람직하게는 적어도 대략 40%, 더욱 바람직하게는 적어도 대략 50%, 이보다 더욱 바람직하게는 적어도 대략 60%, 그리고 이보다 더욱 바람직하게는 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 90%, 또는 대략 100%이다. 이후, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 첫 번째 서열에서 위치가 두 번째 서열에서 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유되면, 이들 분자는 상기 위치에서 동일하다 (본 명세서에서, 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"에 동등하다). 2개의 서열 사이에 동일성 비율은 이들 두 서열의 최적 배열을 위하여 도입되어야 하는 갭의 총수 및 각 갭의 길이를 고려하여, 이들 서열에 의해 공유된 동일한 위치의 총수의 함수이다.
서열의 비교 및 2개의 서열 사이에 상동성 비율의 결정은 수학 알고리즘을 이용하여 달성될 수 있다. 바람직한 구체예에서, 2개의 아미노산 서열 사이에 상동성 비율은 Blossum 62 매트릭스 또는 PAM250 매트릭스, 그리고 16, 14, 12, 10, 8, 6, 또는 4의 갭 중량 (gap weight)과 1, 2, 3, 4, 5, 또는 6의 길이 중량 (length weight)을 이용하여, GCG 소프트웨어 패키지 내에 GAP 프로그램에 통합된 Needleman and Wunsch (1970), J. Mol. Biol. 48:444 453의 알고리즘에 의해 측정된다. 또 다른 바람직한 구체예에서, 2개의 뉴클레오티드 서열 사이에 상동성 비율은 NWSgapdna.CMP 매트릭스, 그리고 40, 50, 60, 70, 또는 80의 갭 중량과 1, 2, 3, 4, 5, 또는 6의 길이 중량을 이용하여, GCG 소프트웨어 패키지 내에 GAP 프로그램을 이용하여 측정된다. 특히 바람직한 세트의 파라미터 (그리고, 분자가 이들 클레임 (claim)의 상동성 한계 (homology limitation) 내에 있는 지를 결정하기 위하여 어떤 파라미터가 적용되어야 하는 지에 관하여 작업자가 확신하지 못하는 경우에 이용되어야 하는 파라미터)는 12의 갭 페널티 (gap penalty), 4의 갭 연장 페널티 (gap extend penalty), 그리고 5의 구조이동 갭 페널티 (frameshift gap penalty)를 갖는 Blosum 62 스코어링 매트릭스 (scoring matrix)이다.
본 명세서에서, "숙주 세포"는 본 명세서에 기술된 산물 (가령, 본 명세서에 기술된 알데히드 또는 알칸)을 생산하는데 이용되는 세포이다. 숙주 세포는 선택된 유전자를 발현하거나 과다발현하도록, 또는 선택된 유전자의 발현이 감약되도록 변형될 수 있다. 숙주 세포의 무제한적 실례에는 식물, 동물, 인간, 세균, 효모, 또는 섬유성 진균류 세포가 포함된다.
본 명세서에서, 용어 "낮은 엄밀도 (stringency), 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 혼성화한다"는 혼성화 (hybridization)와 세척에 대한 조건을 기술한다. 혼성화 반응을 수행하기 위한 지침은 Current Protocols in Molecular Biology , John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6에서 입수될 수 있다. 수성과 비-수성 방법은 상기 참고문헌에서 기술되고 둘 중 하나가 이용될 수 있다. 본 명세서에서 언급되는 특이적인 혼성화 조건은 아래와 같다: 1) 대략 45℃에서 6X 염화나트륨/구연산나트륨 (SSC), 그 이후에 적어도 50℃에서 0.2X SSC, 0.1% SDS에서 2회 세척의 낮은 엄밀도 혼성화 조건 (이들 세척의 온도는 낮은 엄밀도 조건의 경우에 55℃로 증가될 수 있다); 2) 대략 45℃에서 6X SSC, 그 이후에 60℃에서 0.2X SSC, 0.1% SDS에서 1회 이상의 세척의 중간 엄밀도 혼성화 조건; 3) 대략 45℃에서 6X SSC, 그 이후에 65℃에서 0.2X SSC, 0.1% SDS에서 1회 이상의 세척의 높은 엄밀도 혼성화 조건; 그리고 바람직하게는, 4) 65℃에서 0.5M 인산나트륨, 7% SDS, 그 이후에 65℃에서 0.2X SSC, 1% SDS에서 1회 이상의 세척의 매우 높은 엄밀도 혼성화 조건. 달리 명시되지 않으면, 매우 높은 엄밀도 조건 (4)이 바람직한 조건이다.
본 명세서에서, 핵산, 예를 들면, DNA 또는 RNA에 관하여, 용어 "분리된"은 각각, 상기 핵산의 자연 출처 내에 존재하는 다른 DNA 또는 RNA로부터 분리된 분자를 지칭한다. 게다가, "분리된 핵산"은 핵산 단편, 예를 들면, 자연적으로 발생하지 않는 단편을 포함한다. 용어 "분리된"은 또한, 본 명세서에서 다른 세포 단백질로부터 분리되는 폴리펩티드를 지칭하는데 이용되고, 그리고 정제된 내생적 폴리펩티드와 재조합 폴리펩티드를 모두 포함한다. 용어 "분리된"은 또한, 본 명세서에서 세포 물질, 바이러스 물질, 또는 재조합 DNA 기술에 의해 생산될 때 배양 배지가 실질적으로 존재하지 않는 핵산 또는 폴리펩티드를 지칭한다. 용어 "분리된"은 또한, 본 명세서에서 화학적으로 합성될 때 화학 전구물질 또는 기타 화학물질이 실질적으로 존재하지 않는 핵산 또는 폴리펩티드를 지칭한다.
본 명세서에서, "세포 내에서 유전자의 발현 수준"은 세포 내에서 mRNA, mRNA 전구체(pre-mRNA) 초기 전사체, 전사체 가공 중간물질, 성숙 mRNA, 및/또는 상기 유전자에 의해 인코딩된 분해 산물의 수준을 지칭한다.
본 명세서에서, 용어 "미생물"은 고대세균 (Archaea), 세균 (Bacteria)과 진핵생물 (Eucarya) 영역으로부터 원핵과 진핵 미생물 종을 의미하고, 후자에는 효모와 섬유성 진균류, 원생동물, 조류, 또는 고등 미생물 (higher Protista)이 포함된다. 본 명세서에서, 용어 "미생물 세포"는 미생물로부터 세포를 의미한다.
본 명세서에서, 용어 "핵산"은 폴리뉴클레오티드, 예를 들면, 디옥시리보핵산 (DNA), 그리고, 적절한 경우에 리보핵산 (RNA)을 지칭한다. 상기 용어는 또한, 뉴클레오티드 유사체로부터 만들어진 RNA 또는 DNA의 유사체, 그리고 기술된 구체예에 적용가능하면, 단일 (센스 또는 안티센스)과 이중-가닥 폴리뉴클레오티드, EST, 염색체, cDNA, mRNA, 그리고 rRNA를 포함한다.
본 명세서에서, 용어 "작동가능하게 연결된"은 선택된 뉴클레오티드 서열 (가령, 본 명세서에 기술된 폴리펩티드를 인코딩하는)이 프로모터와 가깝게 위치하고, 상기 프로모터가 상기 선택된 뉴클레오티드 서열의 발현을 조절할 수 있다는 것을 의미한다. 이에 더하여, 프로모터는 전사와 번역의 방향의 관점에서, 선택된 뉴클레오티드 서열의 상류에 배치된다. "작동가능하게 연결된"은 적절한 분자 (가령, 전사 활성자 단백질)가 조절 서열에 의해 결합될 때, 뉴클레오티드 서열과 조절 서열이 유전자 발현을 가능하게 하는 방식으로 연결된다는 것을 의미한다.
본 명세서에서, 용어 "또는"은 용어 "및/또는"을 의미하는데 이용되고, 달리 명시되지 않으면 용어 "및/또는"과 동의어로서 이용된다.
본 명세서에서, "과다발현"은 상응하는 야생형 세포에서 정상적으로 발현되는 농도보다 높은 농도로 세포에서 핵산, 폴리펩티드, 또는 탄화수소를 발현하거나 발현하도록 유도된다는 것을 의미한다. 가령, 폴리펩티드는 상기 폴리펩티드가 동일한 종의 비-재조합 숙주 세포에서 농도와 비교하여 재조합 숙주 세포에서 더욱 높은 농도로 존재할 때, 상기 재조합 숙주 세포에서 "과다발현"될 수 있다.
본 명세서에서, "분배 계수 (partition coefficient)" 또는 "P"는 수성 상 (가령, 발효 액체 배지)에서 평형 농도로 나눗셈된, 유기 상에서 화합물의 평형 농도로서 정의된다. 본 명세서에 기술된 이중-상 시스템의 한 구체예에서, 유기 상은 생산 과정 동안 알데히드 또는 알칸에 의해 형성된다. 하지만, 일부 실례에서, 유기 상은 예로써, 산물 분리를 용이하게 하는 옥탄 층을 제공함으로써 제공될 수 있다. 이중 상 시스템을 기술할 때, 화합물의 분배 특성은 logP로서 기술될 수 있다. 가령, 1의 logP를 갖는 화합물은 유기 상에 10:1 분배할 것이다. -1의 logP를 갖는 화합물은 유기 상에 1:10 분배할 것이다. 적절한 발효 액체 배지와 유기 상을 선택함으로써, 높은 logP 값을 갖는 알데히드 또는 알칸은 발효 용기 내에서 매우 낮은 농도에서도 유기 상 내로 분리할 수 있다.
본 명세서에서, 용어 "정제한다", "정제된", 또는 "정제"는 예로써, 분리 (isolation) 또는 이탈 (separation)에 의해 주변 환경으로부터 분자의 이전 또는 분리를 의미한다. "실질적으로 정제된" 분자는 그들이 결합되는 다른 성분으로부터 적어도 대략 60%, 바람직하게는 적어도 대략 75%, 그리고 더욱 바람직하게는 적어도 대략 90% 자유롭다. 본 명세서에서, 이들 용어는 또한, 샘플로부터 오염물질의 제거를 지칭한다. 가령, 오염물질의 제거는 샘플 내에서 알데히드 또는 알칸의 비율에서 증가를 유발할 수 있다. 가령, 알데히드 또는 알칸이 숙주 세포에서 생산될 때, 이들 알데히드 또는 알칸은 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제후, 샘플 내에서 알데히드 또는 알칸의 비율이 증가된다.
용어 "정제한다", "정제된", 그리고 "정제"는 절대 순도 (absolute purity)를 요구하지 않는다. 이들은 상대적 용어이다. 따라서 예로써, 알데히드 또는 알칸이 숙주 세포에서 생산될 때, 정제된 알데히드 또는 정제된 알칸은 다른 세포 성분 (가령, 핵산, 폴리펩티드, 지질, 탄수화물, 또는 기타 탄화수소)로부터 실질적으로 분리된 것이다. 다른 실례에서, 정제된 알데히드 또는 정제된 알칸 조제물은 이들 알데히드 또는 알칸이 오염물질, 예를 들면, 발효 이후에 존재할 수도 있는 오염물질로부터 실질적으로 자유로운 것이다. 일부 구체예에서, 알데히드 또는 알칸은 중량으로 적어도 대략 50%의 샘플이 상기 알데히드 또는 알칸으로 구성될 때 정제된다. 다른 구체예에서, 알데히드 또는 알칸은 중량으로 적어도 대략 60%, 70%, 80%, 85%, 90%, 92%, 95%, 98%, 또는 99% 또는 그 이상의 샘플이 상기 알데히드 또는 알칸으로 구성될 때 정제된다.
본 명세서에서, 용어 "재조합 폴리펩티드"는 재조합 DNA 기술에 의해 생산되는 폴리펩티드를 지칭하는데, 여기서 일반적으로, 발현된 폴리펩티드 또는 RNA를 인코딩하는 DNA는 적절한 발현 벡터 내로 삽입되고, 상기 벡터는 교대로, 상기 폴리펩티드 또는 RNA를 생산하기 위하여 숙주 세포를 형질전환시키는데 이용된다.
본 명세서에서, 용어 "실질적으로 동일한" (또는 "실질적으로 상동한")은 첫 번째 아미노산 또는 뉴클레오티드 서열이 두 번째 아미노산 또는 뉴클레오티드 서열에 충분한 숫자의 동일한 또는 동등한 (가령, 유사한 측쇄, 예를 들면, 보존된 아미노산 치환을 갖는) 아미노산 잔기 또는 뉴클레오티드를 포함하고, 따라서 첫 번째와 두 번째 아미노산 또는 뉴클레오티드 서열이 유사한 활성을 갖는 것을 지칭하는데 이용된다.
본 명세서에서, 용어 "신타아제"는 합성 과정을 촉매하는 효소를 의미한다. 본 명세서에서, 용어 신타아제에는 신타아제 (synthase), 신세타아제(synthetase), 그리고 리가아제 (ligase)가 포함된다.
본 명세서에서, 용어 "형질감염 (transfection)"은 핵산-매개된 유전자 전달에 의한 핵산 (가령, 발현 벡터를 통해)의 수용자 세포 내로의 도입을 의미한다.
본 명세서에서, "형질전환 (transformation)"은 외인성 핵산의 세포 흡수의 결과로써 세포의 유전형이 변하는 과정을 지칭한다. 이는 재조합 형태의 RNA 또는 폴리펩티드를 발현하는 형질전환된 세포를 산출할 수 있다. 전달된 유전자로부터 안티센스 발현의 경우에, 자연-발생 형태의 폴리펩티드의 발현이 차단된다.
본 명세서에서, "수송 단백질"은 세포소기관 및/또는 세포의 내외로 하나 이상의 화합물의 이동을 용이하게 하는 폴리펩티드이다.
본 명세서에서, 폴리펩티드 X의 "변이체"는 하나 이상의 아미노산 잔기가 변경된, 폴리펩티드 X의 아미노산 서열을 보유하는 폴리펩티드를 지칭한다. 변이체는 보존성 변화 또는 비-보존성 변화를 가질 수 있다. 어떤 아미노산 잔기가 생물학적 활성에 영향을 주지 않으면서, 치환되거나, 삽입되거나, 또는 결실될 수 있는 지를 결정함에 있어서 지침은 당분야에 널리 공지된 컴퓨터 프로그램, 예를 들면, LASERGENE 소프트웨어 (DNASTAR)를 이용하여 입수될 수 있다.
폴리뉴클레오티드 서열의 배경에서 이용될 때, 용어 "변이체"는 유전자의 변이체 또는 이의 코딩 서열에 관련된 폴리뉴클레오티드 서열을 포함할 수 있다. 이러한 정의는 또한, 예로써 "대립유전자 (allelic)", "절단접합 (splice)", "종 (species)", 또는 "다형성 (polymorphic)" 변이체를 포함할 수 있다. 절단접합 변이체는 참고 폴리뉴클레오티드에 현저한 동일성을 갖지만, 일반적으로 mRNA 가공 동안 엑손 (exon)의 대안적 절단접합 (alternative splicing)으로 인하여 더욱 많은 또는 더욱 적은 숫자의 폴리뉴클레오티드를 보유할 것이다. 상응하는 폴리펩티드는 추가적인 기능성 도메인 또는 도메인의 부재를 가질 수 있다. 종 변이체는 종 간에 상이한 폴리뉴클레오티드 서열이다. 생성된 폴리펩티드는 일반적으로, 서로에 대하여 현저한 아미노산 동일성을 가질 것이다. 다형성 변이체는 일정한 종의 개체 간에 특정 유전자의 폴리뉴클레오티드 서열에서 변이이다.
본 명세서에서, 용어 "벡터"는 상기 벡터와 연결되는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 유용한 벡터의 한 가지 유형은 에피솜 (episome) (즉, 염색체외 복제 (extra-chromosomal replication)가 가능한 핵산)이다. 유용한 벡터는 이들 벡터와 연결되는 핵산의 자율 복제 및/또는 발현을 달성할 수 있는 것들이다. 자신과 작동가능하게 연결되는 유전자의 발현을 주동할 수 있는 벡터는 본 명세서에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종, "플라스미드" 형태인데, 이는 일반적으로, 벡터 형태에서 염색에 결합되지 않는 원형 이중 가닥 DNA 루프 (loop)를 지칭한다. 본 명세서에서, "플라스미드"와 "벡터"는 동의어로서 이용되는데, 그 이유는 플라스미드가 벡터의 가장 일반적으로 이용되는 형태이기 때문이다. 하지만, 등가의 기능을 수행하고 당해 분야에서 공지된 다른 형태의 발현 벡터 역시 포함된다.
달리 정의되지 않으면, 본 명세서에 이용된 모든 기술 용어와 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 비록 본 명세서에 기술된 것들에 유사하거나 동등한 방법과 재료가 본 발명의 실시 또는 시험에 이용될 수 있긴 하지만, 적절한 방법과 재료가 하기에 기술된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허, 그리고 다른 참고문헌은 순전히 참조로서 편입된다. 상충되는 경우에, 본 명세서에 기술된 정의를 비롯한 본 명세서가 우선할 것이다. 이에 더하여, 이들 재료, 방법, 그리고 실례는 예시를 목적으로 하고 본 발명의 범위를 결코 제한하지 않는다.
본 발명의 다른 특징과 이점은 아래의 상세한 설명 및 특허청구범위로부터 명백할 것이다.
상세한 설명
본 발명에서는 기질, 예를 들면, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 또는 지방 알코올 기질로부터 알데히드, 지방 알코올, 그리고 탄화수소 (가령, 알칸, 알켄, 그리고 알킨)를 생산하는 조성물과 방법을 기술한다 (가령, 본 발명에 참조로서 편입되는 PCT/US08/058788에서 기술된 바와 같이). 이런 알데히드, 알칸, 그리고 알켄은 생물연료 (가령, 가솔린, 디젤, 제트 연료 등에 대한 대체제), 특수 화학제품 (가령, 윤활제, 연료 첨가제 등), 또는 진전된 화학적 전환을 위한 공급원료 (가령, 연료, 중합체, 플라스틱, 직물, 용매, 접착제 등)로서 유용하다. 본 발명은 알데히드, 알칸, 그리고 알켄 생합성에 관여하는 유전자의 확인에 부분적으로 기초된다.
이런 알칸과 알켄 생합성 유전자에는 예로서, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 Synpcc7942_1593 (SEQ ID NO:1), 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (SEQ ID NO:3), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC 73102 Npun02004178 (SEQ ID NO:5), 노스탁 종 (Nostoc sp .) PCC 7120 alr5283 (SEQ ID NO:7), 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (SEQ ID NO:9), 써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1 tll1313 (SEQ ID NO:11), 시네초코쿠스 종 (Synechococcus sp .) JA-3-3A CYA_0415 (SEQ ID NO:13), 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC 7421 gll3146 (SEQ ID NO:15), 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PM123 (SEQ ID NO:17), 프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp . pastoris) str. CCMP1986 PMM0532 (SEQ ID NO:19), 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str. NATL2A PMN2A_1863 (SEQ ID NO:21), 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (SEQ ID NO:25), 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 (SEQ ID NO:27), 시아노테세 종 (Cyanothece sp .) PCC7245 Cyan7425DRAFT_1220 (SEQ ID NO:29), 시아노테세 종 (Cyanothece sp .) PCC7245 cce_0778 (SEQ ID NO:31), 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413 YP_323043 (Ava_2533) (SEQ ID NO:33), 그리고 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301 YP_170760 (syc0050_d) (SEQ ID NO:35)이 포함된다. 다른 알칸과 알켄 생합성 유전자는 표 1과 도 38에 열거된다.
알데히드 생합성 유전자에는 예로써, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 Synpcc7942_1594 (SEQ ID NO:65), 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (SEQ ID NO:67), 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (SEQ ID NO:69), 프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp . pastoris) str. CCMP1986 PMM0533 (SEQ ID NO:71), 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 NP_96091 (gll3145) (SEQ ID NO:73), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 ZP_00108837 (Npun02004176) (SEQ ID NO:75), 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413 YP_323044 (Ava_2534) (SEQ ID NO:77), 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301 YP_170761 (syc0051_d) (SEQ ID NO:79), 그리고 노스탁 종 (Nostoc sp .) PCC 7120 alr5284 (SEQ ID NO:81)가 포함된다. 다른 알데히드 생합성 유전자는 표 1과 도 39에 열거된다.
본 명세서에 기술된 방법을 이용하여, 알데히드, 지방 알코올, 알칸, 그리고 알켄은 본 명세서에 기술된 하나 이상의 알데히드, 알칸, 및/또는 알켄 생합성 유전자 또는 폴리펩티드, 또는 이들의 변이체를 이용하여 숙주 세포 또는 세포-없는 방법에 의해 제조될 수 있다.
남조류 | 알칸 생합성 유전자 수탁 번호 %ID |
알데히드 생합성 유전자 수탁 번호 %ID |
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC 7942 |
YP_400610 100 | YP_400611 100 |
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC 6301 |
YP_170760 100 | YP_170761 100 |
마이크로콜레우스 크토노플라스테스 (Microcoleus chthonoplastes) PCC 7420 |
EDX75019 77 | EDX74978 70 |
아트로스피라 막시마 (Arthrospira maxima) CS-328 |
EDZ94963 78 | EDZ94968 68 |
링비아 종 (Lyngbya sp) PCC 8106 | ZP_01619575 77 | ZP_01619574 69 |
노둘라리아 스푸미게나 (Nodularia spumigena) CCY9414 |
ZP_01628096 77 | ZP_01628095 70 |
트리코데스미움 에리트라이움 (Trichodesmium erythraeum) IMS101 |
YP_721979 76 | YP_721978 69 |
마이크로시스티스 아에루기노사 (Microcystis aeruginosa) NIES-843 |
YP_001660323 75 | YP_001660322 68 |
마이크로시스티스 아에루기노사 (Microcystis aeruginosa) PCC 7806 |
CAO90780 74 | CAO90781 67 |
노스탁 종 (Nostoc sp) PCC 7120 | NP_489323 74 | NP_489324 72 |
노스탁 아졸라 (Nostoc azollae) 0708 | EEG05692 73 | EEG05693 70 |
아나베나 바리아빌리스 (Anabaena variabilis) ATCC 29413 |
YP_323043 74 | YP_323044 73 |
크로코스패라 왓소니 (Crocosphaera watsonii) WH 8501 |
ZP_00514700 74 | ZP_00516920 67 |
시네코시스티스 종 (Synechocystis sp) PCC 6803 | NP_442147 72 | NP_442146 68 |
시네초코쿠스 종 (Synechococcus sp .) PCC 7335 | EDX86803 73 | EDX87870 67 |
시아노테세 종 (Cyanothece sp) ATCC 51142 | YP_001802195 73 | YP_001802846 67 |
시아노테세 종 (Cyanothece sp) CCYO11O | ZP_01728578 72 | ZP_01728620 68 |
노스탁 펑크티포르메 (Nostoc punctiforme) PCC 73102 | ZP_00108838 72 | ZP_00108837 71 |
아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 |
YP_001518340 71 | YP_001518341 66 |
시아노테세 종 (Cyanothece sp) PCC 7425 | YP_002481151 71 | YP_002481152 70 |
시아노테세 종 (Cyanothece sp) PCC 8801 | ZP_02941459 70 | ZP_02942716 69 |
써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1 |
NP_682103 70 | NP_682102 70 |
시네초코쿠스 종 (Synechococcus sp .) JA-2-3B'a(2-13) | YP_478639 68 | YP_478638 63 |
시네초코쿠스 종 (Synechococcus sp .) RCC307 | YP_001227842 67 | YP_001227841 64 |
시네초코쿠스 종 (Synechococcus sp .) WH 7803 | YP_001224377 68 | YP_001224378 65 |
시네초코쿠스 종 (Synechococcus sp .) WH 8102 | NP_897829 70 | NP_897828 65 |
시네초코쿠스 종 (Synechococcus sp .) WH 7805 | ZP_01123214 68 | ZP_Ol 123215 65 |
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 3012 | ABD96376 70 | ABD96375 65 |
시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab | YP_473897 68 | YP_473896 62 |
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 306 | ABD96328 70 | ABD96327 65 |
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 3M9 | ABD96275 68 | ABD96274 65 |
시네초코쿠스 종 (Synechococcus sp .) CC9311 | YP_731193 63 | YP_731192 63 |
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) 5B2 | ABB92250 69 | ABB92249 64 |
시네초코쿠스 종 (Synechococcus sp .) WH 5701 | ZP_01085338 66 | ZP_01085337 67 |
글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC 7421 | NP_926092 63 | NP_926091 67 |
시네초코쿠스 종 (Synechococcus sp .) RS9916 | ZP_O1472594 69 | ZP_01472595 66 |
시네초코쿠스 종 (Synechococcus sp .) RS9917 | ZP_O1079772 68 | ZP_O1079773 65 |
시네초코쿠스 종 (Synechococcus sp .) CC9605 | YP_381055 66 | YP_381056 66 |
시아노비움 종 (Cyanobium sp .) PCC 7001 | EDY39806 64 | EDY38361 64 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9303 |
YP_001016795 63 | YP_001016797 66 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT9313 |
NP_895059 63 | NP_895058 65 |
시네초코쿠스 종 (Synechococcus sp .) CC9902 | YP_377637 66 | YP_377636 65 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9301 |
YP_001090782 62 | YP_001090783 62 |
시네초코쿠스 종 (Synechococcus sp .) BL107 | ZP_O1469468 65 | ZP_01469469 65 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str AS9601 |
YP_001008981 62 | YP_001008982 61 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT9312 |
YP_397029 62 | YP_397030 61 |
프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp pastoris) str CCMP1986 |
NP_892650 60 | NP_892651 63 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9211 |
YP_001550420 61 | YP_001550421 63 |
시아노테세 종 (Cyanothece sp) PCC 7425 | YP_002483683 59 | - |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str NATL2A |
YP_293054 59 | YP_293055 62 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str NATLlA |
YP_001014415 59 | YP_001014416 62 |
프로클로로코쿠스 마리누스 아종 마리누스 (Prochlorococcus marinus subsp marinus) str CCMP1375 |
NP_874925 59 | NP_874926 64 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9515_05961 |
YP_001010912 57 | YP_001010913 63 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9215_06131 |
YP_001483814 59 | YP_001483815 62 |
시네초코쿠스 종 (Synechococcus sp .) RS9917 | ZP_01080370 43 | - |
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 5D20 | ABD96480 65 |
알데히드,
알칸
, 그리고
알켄
생합성 유전자와
변이체
본 명세서에 기술된 방법과 조성물은 예로써, SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 또는 35의 뉴클레오티드 서열을 갖는 알칸 또는 알켄 생합성 유전자, 그리고 이의 폴리뉴클레오티드 변이체를 포함한다. 일부 경우에, 알칸 또는 알켄 생합성 유전자는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 인코딩한다. 가령, 알칸 또는 알켄 생합성 유전자는 SEQ ID NO:37, 38, 39, 41, 42, 43, 또는 44를 포함하는 폴리펩티드를 인코딩할 수 있다. 알칸 또는 알켄 생합성 유전자는 또한, SEQ ID NO:40 및 SEQ ID NO:37, 38, 또는 39 중에서 한 가지를 포함하는 폴리펩티드를 포함한다.
본 명세서에 기술된 방법과 조성물은 예로써, SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 뉴클레오티드 서열을 보유하는 알데히드 생합성 유전자, 그리고 이의 폴리뉴클레오티드 변이체를 포함한다. 일부 경우에, 알데히드 생합성 유전자는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 인코딩한다. 가령, 알데히드 생합성 유전자는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64를 포함하는 폴리펩티드를 인코딩할 수 있다.
이들 변이체는 자연 발생되거나, 또는 시험관내에서 산출될 수 있다. 특히, 이런 변이체는 유전자 조작 기술, 예를 들면, 특정부위 돌연변이유발 (site directed mutagenesis), 무작위 화학적 돌연변이유발 (random chemical mutagenesis), 엑소뉴클레아제 (Exonuclease) III 결실 절차, 그리고 표준 클로닝 기술을 이용하여 산출될 수 있다. 대안으로, 이런 변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차를 이용하여 산출될 수 있다.
변이체를 만드는 방법은 당분야에 널리 공지되어 있다. 이들에는 산업적 또는 실험적 적용에서 고양된 가치를 부여하는 특성을 갖는 폴리펩티드를 인코딩하는 핵산을 산출하기 위하여, 자연 분리물 (natural isolate)로부터 획득된 핵산 서열이 변형되는 절차가 포함된다. 이런 절차에서, 자연 분리물로부터 획득된 서열에 관하여 하나 이상의 뉴클레오티드 차이를 보유하는 다수의 변이체 서열이 산출되고 특성화된다. 전형적으로, 자연 분리물로부터 핵산에 의해 인코딩된 폴리펩티드에 관하여 이들 뉴클레오티드 차이는 아미노산 변화를 유발한다.
가령, 변이체는 오류 빈발 (error prone) PCR을 이용하여 산출될 수 있다 (참조: Leung et al., Technique 1:11-15, 1989; 그리고 Caldwell et al., PCR Methods Applic . 2:28-33, 1992). 오류 빈발 PCR에서, PCR은 DNA 중합효소의 복사 충실도 (copying fidelity)가 낮은 조건 하에 수행되고, 그 결과로써 높은 비율의 점 돌연변이 (point mutation)가 PCR 산물의 전장(entire length)을 따라서 획득된다. 간단히 말하면, 이런 절차에서, 돌연변이유발되는 핵산 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열)은 PCR 산물의 전장을 따라서 높은 비율의 점 돌연변이를 달성하기 위하여 PCR 프라이머, 반응 완충액, MgCl2, MnCl2, Taq 중합효소, 그리고 적절한 농도의 dNTP와 혼합된다. 가령, 반응이 20 fmole의 돌연변이유발되는 핵산 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열), 30 pmole의 각 PCR 프라이머; 50 mM KCl, 10 mM Tris HCl (pH 8.3), 그리고 0.01% 젤라틴을 포함하는 반응 완충액, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위의 Taq 중합효소, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94℃에서 1분, 45℃에서 1분, 그리고 72℃에서 1분의 30회 주기 동안 수행될 수 있다. 하지만, 이들 파라미터는 적절하게 변할 수 있는 것으로 인지될 것이다. 돌연변이유발된 핵산은 이후, 적절한 벡터 내로 클로닝되고, 그리고 이들 돌연변이유발된 핵산에 의해 인코딩된 폴리펩티드의 활성이 평가된다.
변이체는 또한, 임의의 클로닝된 목적 DNA 내에서 부위-특이적인 돌연변이를 발생시키는 올리고뉴클레오티드 지향된 돌연변이유발을 이용하여 산출될 수 있다. 올리고뉴클레오티드 돌연변이유발은 예로써, Reidhaar-Olson et al ., Science 241:53-57, 1988에서 기술된다. 간단히 말하면, 이런 절차에서 클로닝된 DNA 내로 도입되는 하나 이상의 돌연변이를 보유하는 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발되는 클로닝된 DNA (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 포함하는 클론은 회수되고, 그리고 이들이 인코딩하는 폴리펩티드의 활성이 평가된다.
변이체를 산출하기 위한 다른 방법은 조립 (assembly) PCR이다. 조립 PCR은 소형 DNA 단편의 혼합물로부터 PCR 산물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알 내에서 병행으로 발생하는데, 한 반응의 산물이 다른 반응의 산물을 기폭한다. 조립 PCR은 예로써, U.S. Pat. No. 5,965,408에서 기술된다.
변이체를 산출하는 또 다른 방법은 유성 (sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서, 서열 상동성에 기초된 DNA 분자의 무작위 단편화 (random fragmentation)의 결과로써, 상이하지만 고도로 관련된 DNA 서열의 DNA 분자 간에 강제된 상동성 재조합 (forced homologous recombination)이 시험관내에서 발생한다. 그 이후에, PCR 반응에서 프라이머 신장에 의한 교차 (crossover)의 고정이 수행된다. 유성 PCR 돌연변이유발은 예로써, Stemmer, PNAS, USA 91:10747-10751, 1994에서 기술된다.
변이체는 또한, 생체내 돌연변이유발에 의해 산출될 수 있다. 일부 구체예에서, 핵산 서열 내에서 무작위 돌연변이는 하나 이상의 DNA 복원 경로 (repair pathway)에서 돌연변이를 보유하는 세균 균주, 예를 들면, 대장균 (E. coli) 균주에서 상기 서열을 증식함으로써 산출된다. 이런 "돌연변이유발 유전자 (mutator)" 균주는 야생형 균주에서보다 높은 무작위 돌연변이율 (random mutation rate)을 갖는다. 이들 균주 중의 한 가지에서 DNA 서열 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열)의 증식은 궁극적으로, DNA 내에 무작위 돌연변이를 산출할 것이다. in vivo 돌연변이유발에 이용하기 적합한 돌연변이유발 유전자 균주는 예로써, PCT Publication No. WO 91/16427에서 기술된다.
변이체는 또한, 카세트 돌연변이유발 (cassette mutagenesis)을 이용하여 산출될 수 있다. 카세트 돌연변이유발에서, 이중 가닥 DNA 분자의 작은 영역이 고유 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 상기 올리고뉴클레오티드는 종종, 완전하게 및/또는 부분적으로 무작위화된 고유 서열을 포함한다.
순환 앙상블 돌연변이유발 (recursive ensemble mutagenesis) 역시 변이체를 산출하는데 이용될 수 있다. 순환 앙상블 돌연변이유발은 아미노산 서열에서 상이하고 표현형적으로 관련된 돌연변이체의 다양한 개체군을 생산하기 위하여 개발된, 단백질 조작 (즉, 단백질 돌연변이유발)을 위한 알고리듬이다. 이러한 방법은 연속 라운드의 조합 카세트 돌연변이유발을 제어하기 위하여 피드백 기전을 이용한다. 순환 앙상블 돌연변이유발은 예로써, Arkin et al., PNAS , USA 89:7811-7815, 1992에서 기술된다.
일부 구체예에서, 변이체는 지수 앙상블 (exponential ensemble) 돌연변이유발을 이용하여 산출된다. 지수 앙상블 돌연변이유발은 높은 비율의 독특한 기능성 돌연변이체로 조합 라이브러리를 산출하기 위한 과정인데, 여기서 잔기의 작은 기들은 기능성 단백질을 발생시키는 각 변경된 위치에서 아미노산을 확인하기 위하여 동시에 무작위화된다. 지수 앙상블 돌연변이유발은 예로써, Delegrave et al., Biotech . Res . 11:1548-1552, 1993에서 기술된다. 무작위와 특정부위 돌연변이유발은 예로써, Arnold, Curr . Opin . Biotech . 4:450-455, 1993에서 기술된다.
일부 구체예에서, 변이체는 셔플링 (shuffling) 절차를 이용하여 산출되는데, 여기서 상이한 폴리펩티드를 인코딩하는 복수의 핵산 중에서 일부는 서로 융합하여, 예로써 U.S. Pat. No. 5,965,408과 5,939,250에서 기술된 바와 같이 키메라 폴리펩티드를 인코딩하는 키메라 핵산 서열을 산출한다.
폴리뉴클레오티드 변이체는 또한, 핵산 유사체를 포함한다. 핵산 유사체는 예로써, 상기 핵산의 안정성, 혼성화, 또는 용해도를 향상시키기 위하여, 염기 모이어티 (base moiety), 당 모이어티 (sugar moiety), 또는 인산염 중추 (backbone)에서 변형될 수 있다. 염기 모이어티에서 변형은 디옥시티미딘 (deoxythymidine)에 대한 디옥시우리딘 (deoxyuridine) 및 디옥시시티딘 (deoxycytidine)에 대한 5-메틸-2'-디옥시시티딘 또는 5-브로모-2'-디옥시시티딘을 포함한다. 당 모이어티의 변형은 2'-O-메틸 또는 2'-O-알릴 당을 형성하는 리보오스 당의 2' 히드록실의 변형을 포함한다. 디옥시리보오스 인산염 중추는 모르폴리노 핵산을 생산하기 위하여 변형될 수 있고, 여기서 각 염기 모이어티는 6-원 모르폴리노 고리, 또는 펩티드 핵산에 연결되고, 여기서 디옥시인산염 중추는 슈도펩티드 (pseudopeptide) 중추로 대체되고 4개의 염기는 유지된다 (참조: Summerton et al., Antisense Nucleic Acid Drug Dev . (1997) 7:187-195; 그리고 Hyrup et al., Bioorgan . Med . Chem . (1996) 4:5-23.). 이에 더하여, 디옥시인산염 중추는 예로써, 포스포로티오에이트 (phosphorothioate) 또는 포스포로디티오에이트 (phosphorodithioate) 중추, 포스포로아미디트 (phosphoroamidite), 또는 알킬 포스포트리에스테르 (alkyl phosphotriester) 중추로 대체될 수 있다.
알데히드와 알칸 생합성 폴리펩티드 Synpcc7942_1594 (SEQ ID NO:66)와 Synpcc7942_1593 (SEQ ID NO:2)은 다른 남조류에서 동족체를 갖는다 (무제한적 실례는 표 1에 열거된다). 따라서 표 1에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알데히드 또는 알칸 생합성 폴리뉴클레오티드로서 이용될 수 있다. 표 1에 열거된 각 남조류는 양쪽 유전자의 사본을 보유한다. 이들 유전자 산물의 서열 동일성의 수준은 Synpcc7942_1594 (SEQ ID NO:66)의 경우에 61% 내지 73% 범위이고 Synpcc7942_1593 (SEQ ID NO:2)의 경우에 43% 내지 78%이다.
알데히드 생합성 폴리펩티드 Synpcc7942_1594 (SEQ ID NO:66)의 다른 동족체는 도 39에 열거되고, 그리고 도 39에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알데히드 생합성 폴리뉴클레오티드로서 이용될 수 있다. 알칸 생합성 폴리펩티드 Synpcc7942_1593 (SEQ ID NO:2)의 다른 동족체는 도 38에 열거되고, 그리고 도 38에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알칸 생합성 폴리뉴클레오티드로서 이용될 수 있다.
일정한 경우에, 알데히드, 알칸, 및/또는 알켄 생합성 유전자는 특정 숙주 세포에서 발현을 위하여 코돈 최적화된다. 가령, 대장균 (E. coli)에서 발현을 위하여, 하나 이상의 코돈은 예로써, Grosjean et al., Gene 18:199-209 (1982)에서 기술된 바와 같이 최적화될 수 있다.
알데히드,
알칸
, 그리고
알켄
생합성 폴리펩티드와
변이체
본 명세서에 기술된 방법과 조성물은 또한, SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열을 보유하는 알칸 또는 알켄 생합성 폴리펩티드, 그리고 이들의 폴리펩티드 변이체를 포함한다. 일부 경우에, 알칸 또는 알켄 생합성 폴리펩티드는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 포함한다. 가령, 알칸 또는 알켄 생합성 폴리펩티드는 SEQ ID NO:37, 38, 39, 41, 42, 43, 또는 44의 아미노산 서열을 보유할 수 있다. 알칸 또는 알켄 생합성 폴리펩티드는 또한, SEQ ID NO:40 및 SEQ ID NO:37, 38, 또는 39 중에서 한 가지의 아미노산 서열을 포함할 수 있다.
본 명세서에 기술된 방법과 조성물은 또한, SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 보유하는 알데히드 생합성 폴리펩티드, 그리고 이의 폴리펩티드 변이체를 포함한다. 일부 경우에, 알데히드 생합성 폴리펩티드는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 포함한다. 가령, 알데히드 생합성 폴리펩티드는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함할 수 있다.
알데히드, 알칸, 그리고 알켄 생합성 폴리펩티드 변이체는 하나 이상의 아미노산 잔기가 보존된 또는 비-보존된 아미노산 잔기 (바람직하게는, 보존된 아미노산 잔기)로 치환되는 변이체일 수 있다. 이런 치환된 아미노산 잔기는 유전자 코드 (genetic code)에 의해 인코딩되거나, 또는 인코딩되지 않을 수 있다.
보존성 치환은 폴리펩티드 내에서 일정한 아미노산을 유사한 특성의 다른 아미노산으로 대체하는 것이다. 전형적인 보존성 치환은 아래의 교체이다: 지방족 아미노산, 예를 들면, 알라닌, 발린, 류신, 그리고 이소류신의 다른 지방족 아미노산으로 교체; 세린의 트레오닌으로 교체, 또는 그 반대; 산성 잔기, 예를 들면, 아스파르트산과 글루탐산의 다른 산성 잔기로 교체; 아미드 기를 보유하는 잔기, 예를 들면, 아스파라긴과 글루타민의 아미드 기를 보유하는 다른 잔기로 교체; 염기성 잔기, 예를 들면, 리신과 아르기닌의 다른 염기성 잔기로 교체; 그리고 방향족 잔기, 예를 들면, 페닐알라닌과 티로신의 다른 방향족 잔기로 교체.
다른 폴리펩티드 변이체는 하나 이상의 아미노산 잔기가 치환 기 (substituent group)를 포함하는 것들이다. 또 다른 폴리펩티드 변이체는 폴리펩티드가 다른 화합물, 예를 들면, 상기 폴리펩티드의 반감기를 증가시키는 화합물 (가령, 폴리에틸렌 글리콜)과 결합되는 것들이다.
부가적인 폴리펩티드 변이체는 추가적인 아미노산, 예를 들면, 리더 서열, 분비 서열, 전단백질 (proprotein) 서열, 또는 폴리펩티드의 정제, 농축, 또는 안정화를 용이하게 하는 서열이 상기 폴리펩티드에 융합되는 것들이다.
일부 경우에, 알칸 또는 알켄 생합성 폴리펩티드 변이체는 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열을 보유하는 폴리펩티드와 동일한 생물학적 기능을 유지하고 (가령, 알칸 또는 알켄 생합성 활성을 유지하고) 상기 서열에 실질적으로 동일한 아미노산 서열을 보유한다.
다른 경우에, 알칸 또는 알켄 생합성 폴리펩티드 변이체는 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열에 적어도 대략 50%, 적어도 대략 55%, 적어도 대략 60%, 적어도 대략 65%, 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 또는 대략 95% 초과의 상동성을 갖는다. 다른 구체예에서, 이들 폴리펩티드 변이체는 상기 아미노산 서열의 적어도 대략 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속 아미노산을 포함하는 단편을 포함한다.
일부 경우에, 알데히드 생합성 폴리펩티드 변이체는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 보유하는 폴리펩티드와 동일한 생물학적 기능을 유지하고 (가령, 알데히드 생합성 활성을 유지하고) 상기 서열에 실질적으로 동일한 아미노산 서열을 보유한다.
또 다른 경우에, 알데히드 생합성 폴리펩티드 변이체는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 적어도 대략 50%, 적어도 대략 55%, 적어도 대략 60%, 적어도 대략 65%, 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 또는 대략 95% 초과의 상동성을 갖는다. 다른 구체예에서, 이들 폴리펩티드 변이체는 상기 아미노산 서열의 적어도 대략 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속 아미노산을 포함하는 단편을 포함한다.
폴리펩티드 변이체 또는 이들의 단편은 본 명세서에 기술된 기술을 이용하여 이들을 인코딩하는 핵산을 분리함으로써, 또는 이들을 인코딩하는 합성 핵산을 발현함으로써 수득될 수 있다. 대안으로, 폴리펩티드 변이체 또는 이들의 단편은 생화학적 농축 또는 정제 절차를 통해 수득될 수 있다. 폴리펩티드 변이체 또는 단편의 서열은 단백분해 절단 (proteolytic digestion), 겔 전기영동 (gel electrophoresis), 및/또는 미량서열결정 (microsequencing)에 의해 결정될 수 있다. 이후, 알칸 또는 알켄 생합성 폴리펩티드 변이체 또는 단편의 서열은 본 명세서에 기술된 임의의 프로그램을 이용하여 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열에 비교될 수 있다. 알데히드 생합성 폴리펩티드 변이체 또는 단편의 서열은 본 명세서에 기술된 임의의 프로그램을 이용하여 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 비교될 수 있다.
폴리펩티드 변이체 및 이들의 단편은 일과적인 방법을 이용하여 알데히드-, 지방 알코올-, 알칸-, 및/또는 알켄-생산 활성에 대하여 분석될 수 있다. 가령, 폴리펩티드 변이체 또는 단편은 이러한 폴리펩티드 변이체가 기능할 수 있도록 하는 조건 하에 기질 (가령, 지방산 유도체 기질 또는 본 명세서에 기술된 기타 기질)과 접촉될 수 있다. 각각, 알데히드-, 지방 알코올-, 알칸-, 또는 알켄-생산 활성을 결정하기 위하여, 기질의 수준에서 감소 또는 알데히드, 알칸, 또는 알켄의 수준에서 증가가 측정될 수 있다.
항-알데히드, 항-지방 알코올, 항-
알칸
, 그리고 항-
알켄
생합성 폴리펩티드 항체
본 명세서에 기술된 알데히드, 지방 알코올, 알칸, 그리고 알켄 생합성 폴리펩티드는 또한, 알데히드, 지방 알코올, 알칸, 그리고 알켄 생합성 폴리펩티드에 대한 항체를 생산하는데 이용될 수 있다. 이런 항체는 예로써, 당분야에 공지된 방법을 이용하여 알데히드, 지방 알코올, 알칸, 또는 알켄 생합성 폴리펩티드의 발현을 검출하는데 이용될 수 있다. 항체는 예로써, 다중클론 항체; 단일클론 항체 또는 이의 항원 결합 단편 (antigen binding fragment); 변형된 항체, 예를 들면, 키메라 항체, 재형성 항체 (reshaped antibody), 인간화 항체, 또는 이의 단편 (가령, Fab', Fab, F(ab')2); 또는 생합성 항체, 예를 들면, 단일 사슬 항체, 단일 도메인 항체 (DAB), Fv, 단일 사슬 Fv (scFv) 등일 수 있다.
다중클론과 단일클론 항체를 만들고 이용하는 방법은 예로써, Harlow et al., Using Antibodies : A Laboratory Manual : Portable Protocol I. Cold Spring Harbor Laboratory (December 1, 1998)에서 기술된다. 변형된 항체와 항체 단편 (가령, 키메라 항체, 재형성 항체, 인간화 항체, 또는 이의 단편, 예를 들면, Fab', Fab, F(ab')2 단편); 또는 생합성 항체 (가령, 단일 사슬 항체, 단일 도메인 항체 (DAB), Fv, 단일 사슬 Fv (scFv) 등)를 만드는 방법은 당분야에 공지되어 있고, 예로써 Zola, Monoclonal Antibodies : Preparation and Use of Monoclonal Antibodies and Engineered Antibody Derivatives, Springer Verlag (December 15, 2000; 1st edition)에서 찾아볼 수 있다.
기질
본 명세서에 기술된 조성물과 방법은 적절한 기질로부터 알데히드, 지방 알코올, 알칸, 및/또는 알켄을 생산하는데 이용될 수 있다. 특정 이론에 구속되지 않지만, 본 명세서에 기술된 알칸 또는 알켄 생합성 폴리펩티드는 탈카르보닐화 기전을 통해 기질로부터 알칸 또는 알켄을 생산하는 것으로 생각된다. 일부 경우에, 기질은 지방산 유도체, 예를 들면, 지방 알데히드이고, 그리고 특정한 분지화 패턴(branching pattern)과 탄소 사슬 길이를 갖는 알칸은 이러한 특정한 특징을 갖는 지방산 유도체, 예를 들면, 지방 알데히드로부터 생산될 수 있다. 다른 경우에, 기질은 불포화 지방산 유도체, 예를 들면, 불포화 지방 알데히드이고, 그리고 특정한 분지화 패턴(branching pattern)과 탄소 사슬 길이를 갖는 알켄은 이러한 특정한 특징을 갖는 불포화 지방산 유도체, 예를 들면, 불포화 지방 알데히드로부터 생산될 수 있다.
특정 이론에 구속되지 않지만, 본 명세서에 기술된 알데히드 생합성 폴리펩티드는 환원 기전을 통해 기질로부터 알데히드를 생산하는 것으로 생각된다. 일정한 경우에, 기질은 아실-ACP이다.
특정 이론에 구속되지 않지만, 본 명세서에 기술된 지방 알코올은 환원 기전을 통해 기질로부터 생산되는 것으로 생각된다. 일정한 경우에, 기질은 지방 알데히드이다.
따라서 이들 기질의 생산으로 이어지는 생합성 경로 내에 각 단계는 목적 기질을 생산하거나 과다생산하기 위하여 변형될 수 있다. 가령, 지방산 생합성 경로, 지방 알데히드 경로, 그리고 지방 알코올 경로에 관여하는 공지된 유전자는 원하는 기질을 생산하기 위하여, 숙주 세포 내에서 발현되거나, 과다발현되거나, 또는 감약될 수 있다 (가령, PCT/US08/058788, 이는 본 발명에 참조로서 편입됨). 예시적인 유전자는 도 40에서 제공된다.
기질의 합성
지방산 신타아제 (FAS)는 아실 사슬의 개시와 신장을 촉매하는 일군의 폴리펩티드이다 (Marrakchi et al., Biochemical Society, 30:1050-1055, 2002). FAS 경로에서 상기 효소와 함께 아실 운반 단백질 (ACP)은 생산되는 지방산 유도체의 길이, 포화도, 그리고 분지화를 제어한다. 상기 지방산 생합성 경로는 전구물질 (precursor) 아세틸-CoA와 말로닐-CoA를 필요로 한다. 상기 경로에서 이들 단계는 지방산 생합성 (fab)과 아세틸-CoA 탈탄산효소 (acc) 유전자 집단의 효소에 의해 촉매된다 (참조: Heath et al., Prog. Lipid Res. 40(6):467-97 (2001).
숙주 세포는 아세틸-CoA 및/또는 말로닐-CoA 신타아제 유전자를 재조합 방식으로 발현 또는 과다발현시킴으로써 지방산 유도체 기질을 발현하도록 조작될 수 있다. 가령, 아세틸-CoA 생산을 증가시키기 위하여, 아래의 유전자 중에서 하나 이상이 숙주 세포에서 발현될 수 있다: pdh , panK , aceEF (E1p 탈수소효소 성분 및 피루브산염과 2-옥소글루타르산 탈수소효소 복합체의 E2p 디히드로리포아미드 아실전이효소 성분을 인코딩), fabH , fabD , fabG , acpP , 그리고 fabF. 이들 유전자에 대한 예시적인 GenBank 수탁 번호는 아래와 같다: pdh (BAB34380, AAC73227, AAC73226), panK (일명, coaA, AAC76952), aceEF (AAC73227, AAC73226), fabH (AAC74175), fabD (AAC74176), fabG (AAC74177), acpP (AAC74178), fabF (AAC74179). 부가적으로, fadE , gpsA , ldhA , pflb , adhE, pta , poxB , ackA , 및/또는 ackB의 발현 수준은 상응하는 유전자의 전결실 (null) 또는 결실 돌연변이를 포함하는 조건적으로 복제성 또는 비-복제성 플라스미드로 형질전환에 의해, 또는 프로모터 또는 인핸서 서열을 치환함으로써, 조작된 숙주 세포 내에서 감약되거나 녹아웃 (knock-out)될 수 있다. 이들 유전자에 대한 예시적인 GenBank 수탁 번호는 아래와 같다: fadE (AAC73325), gspA (AAC76632), ldhA (AAC74462), pflb (AAC73989), adhE (AAC74323), pta (AAC75357), poxB (AAC73958), ackA (AAC75356), 그리고 ackB (BAB81430). 결과의 숙주 세포는 적절한 환경에서 성장될 때 증가된 아세틸-CoA 생산 수준을 가질 것이다.
말로닐-CoA 과다발현은 숙주 세포 내로 accABCD (가령, 수탁 번호 AAC73296, EC 6.4.1.2)를 도입함으로써 달성될 수 있다. 지방산은 리파아제를 인코딩하는 DNA 서열 (가령, 수탁 번호 CAA89087, CAA98876)을 숙주 세포 내로 도입함으로써 숙주 세포 내에서 더욱 과다발현될 수 있다.
이에 더하여, PlsB 저해는 긴 사슬 아실-ACP의 수준에서 증가로 이어질 수 있고, 이는 상기 경로에서 초기 단계 (가령, accABCD, fabH, 그리고 fabI)를 저해할 것이다. plsB (가령, 수탁 번호 AAC77011) D311E 돌연변이는 가용한 아실-CoA의 양을 증가시키는데 이용될 수 있다.
이에 더하여, 숙주 세포는 단일불포화 지방산의 생산을 증가시키기 위하여, sfa 유전자 (fabA의 억제자, 가령, 수탁 번호 AAN79592)를 과다발현하도록 조작될 수 있다 (Rock et al., J. Bacteriology 178:5382-5387, 1996).
일부 경우에, 숙주 세포는 지방산 기질 생산을 증가시키기 위하여, 티오에스테라아제를 발현하거나, 과다발현하거나, 또는 이의 발현을 감약하도록 조작될 수 있다. 지방산 기질의 사슬 길이는 티오에스테라아제에 의해 제어된다. 일부 경우에, tes 또는 fat 유전자가 과다발현될 수 있다. 다른 경우에, C18 :1-ACP를 이용하는 티오에스테라아제 C18 (가령, 수탁 번호 AAC73596과 P0ADA1)을 감약하고, 그리고 C10-ACP를 이용하는 티오에스테라아제 C10 (가령, 수탁 번호 Q39513)을 발현시킴으로써 C10 지방산이 생산될 수 있다. 이는 10의 탄소 사슬 길이를 갖는 지방산의 상대적으로 균일한 집단을 산출한다. 또 다른 경우에, 비-C14 지방산을 생산하는 내생적 티오에스테라아제를 감약하고, 그리고 C14-ACP를 이용하는 티오에스테라아제 (가령, 수탁 번호 Q39473)를 발현시킴으로써 C14 지방산이 생산될 수 있다. 일부 상황에서, C12-ACP를 이용하는 티오에스테라아제 (가령, 수탁 번호 Q41635)를 발현시키고, 그리고 비-C12 지방산을 생산하는 티오에스테라아제를 감약함으로써 C12 지방산이 생산될 수 있다. 아세틸-CoA, 말로닐-CoA, 그리고 지방산 과다생산은 예로써, 세포 용해후 방사성 전구물질, HPLC, 그리고 GC-MS를 이용함으로써, 당분야에 공지된 방법을 이용하여 증명될 수 있다. 본 명세서에 기술된 방법에 이용될 수 있는 티오에스테라아제의 무제한적 실례는 표 2에 열거된다.
수탁 번호 | 자원 생물체 | 유전자 | 우선적인 생산 산물 |
AAC73596 | 대장균 ( E. coli ) |
리더 서열
없는 tesA |
C18:1 |
AAC73555 | 대장균 ( E. coli ) | tesB | |
Q41635 , AAA34215 |
캘리포니아 월계수
( Umbellularia californica ) |
fatB | C12:0 |
Q39513 ; AAC49269 |
쿠페아
후케리아나
( Cuphea hookeriana ) |
fatB2 | C8:0 - C10:0 |
AAC49269 ; AAC72881 |
쿠페아
후케리아나
( Cuphea hookeriana ) |
fatB3 | C14:0 - C16:0 |
Q39473 , AAC49151 |
녹나무
( Cinnamonum camphorum ) |
fatB | C14:0 |
CAA85388 |
애기장대
( Arabidopsis thaliana ) |
fatB
[ M141T ]* |
C16:1 |
NP 189147; NP 193041 |
애기장대
( Arabidopsis thaliana ) |
fatA | C18:1 |
CAC39106 | 근류군 ( Bradyrhizobium japonicum ) | fatA | C18:1 |
AAC72883 |
쿠페아
후케리아나
( Cuphea hookeriana ) |
fatA | C18:1 |
AAL79361 |
해바라기
( Helianthus annus ) |
fatA1 |
* Mayer et al., BMC Plant Biology 7:1-11, 2007
분지형 알데히드, 지방 알코올, 알칸, 그리고 알켄의 형성
분지형 지방산 유도체를 기질로서 이용함으로써, 분지점(branch point)을 보유하는 알데히드, 지방 알코올, 알칸, 그리고 알켄이 생산될 수 있다. 가령, 비록 대장균 (E. coli)이 직쇄형 지방산 유도체 (sFA)를 자연적으로 생산하지만, 대장균 (E. coli)은 상기 대장균 (E. coli)에서 분지형 전구물질을 제공하는 유전자 (가령, bkd, ilv, icm, 그리고 fab 유전자 일족)를 도입하고 발현 또는 과다발현시킴으로써, 분지쇄형 지방산 유도체 (brFA)를 생산하도록 조작될 수 있다. 부가적으로, 숙주 세포는 brFA의 신장을 위한 단백질 (가령, ACP, FabF 등)을 인코딩하는 유전자를 발현 또는 과다발현시키고 및/또는 정상적으로 sFA를 발생시키는 상응하는 숙주 세포 유전자를 결실 또는 감약함으로써 조작될 수 있다.
brFA 형성에서 첫 번째 단계는 분지쇄형 아미노산 아미노기전이효소 (aminotransferase)에 의한 상응하는 α-케토산의 생산이다. 숙주 세포는 이런 효소를 인코딩하는 유전자를 내생적으로 포함하거나, 또는 이런 유전자가 재조합 방식으로 도입될 수 있다. 대장균 (E. coli)은 예로써, 이런 효소, IlvE를 내생적으로 발현한다 (EC 2.6.1.42; GenBank 수탁 YP_026247). 일부 숙주 세포에서, 이질성 분지쇄형 아미노산 아미노기전이효소가 발현되지 않는다. 하지만, 대장균 (E. coli) IlvE, 또는 임의의 다른 분지쇄형 아미노산 아미노기전이효소 (가령, 락토코쿠스 락티스 (Lactococcus lactis) (GenBank 수탁 AAF34406)로부터 IlvE, 슈도모나스 퓨티다 (Pseudomonas putida) (GenBank 수탁 NP_745648)로부터 IlvE, 또는 스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor) (GenBank 수탁 NP_629657)로부터 IlvE)가 내생적이지 않으면, 도입되고 재조합 방식으로 발현될 수 있다.
두 번째 단계는 α-케토산의 상응하는 분지쇄형 아실-CoA로의 산화성 탈카르복실화 (decarboxylation)이다. 이러한 반응은 분지쇄형 α-케토산 탈수소효소 복합체 (bkd; EC 1.2.4.4.) (Denoya et al., J. Bacteriol. 177:3504, 1995)에 의해 촉매될 수 있는데, 상기 복합체는 E1α/β (탈탄소효소), E2 (디히드로리포일 트랜스아실라아제), 그리고 E3 (디히드로리포일 탈수소효소) 아단위로 구성된다. 이들 분지쇄형 α-케토산 탈수소효소 복합체는 피루브산염과 α-케토글루타르산 탈수소효소 복합체에 유사하다. brFA를 보유하고 및/또는 분지쇄형 아미노산에서 성장하는 임의의 미생물은 숙주 세포, 예를 들면, 대장균 (E. coli)에서 발현을 위한 bkd 유전자를 분리하기 위한 근원으로서 이용될 수 있다. 게다가, 대장균 (E. coli)은 피루브산염 탈수소효소 복합체의 일부로서 E3 성분을 보유한다 (lpd, EC 1.8.1.4, GenBank 수탁 NP_414658). 따라서 이는 E1 α/β와 E2 bkd 유전자만을 발현하는데 충분할 수 있다. 표 3에서는 분지쇄형 아실-CoA 전구물질을 제공하기 위하여 숙주 세포에서 재조합 방식으로 도입되고 발현될 수 있는, 여러 미생물로부터 bkd 유전자의 무제한적 실례를 열거한다.
생물체 | 유전자 | GenBank 수탁 # |
스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor) |
bkdA1 (E1α) bkdB1 (E1β) bkdC1 (E2) |
NP_628006 NP_628005 NP_638004 |
스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor) |
bkdA2 (E1α) bkdB2 (E1β) bkdC2 (E2) |
NP_733618 NP_628019 NP_628018 |
스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) |
bkdA (E1a) bkdB (E1b) bkdC (E2) |
BAC72074 BAC72075 BAC72076 |
스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) | bkdF (E1α) bkdG (E1β) bkdH (E2) |
BAC72088 BAC72089 BAC72090 |
바실루스 서브틸리스 (Bacillus subtilis) |
bkdAA (E1α) bkdAB (E1β) bkdB (E2) |
NP_390288 NP_390288 NP_390288 |
슈도모나스 퓨티다 (Pseudomonas Putida) |
bkdA1 (E1α) bkdA2 (E1β) bkdC (E2) |
AAA65614 AAA65615 AAA65617 |
다른 실례에서, 이소부티릴-CoA는 크로토닐-CoA 환원효소 (Ccr, EC 1.6.5.5, 1.1.1.1)와 이소부티릴-CoA 무타제 (대형 아단위 IcmA, EC 5.4.99.2; 소형 아단위 IcmB, EC 5.4.99.2)의 공동발현을 통해 숙주 세포, 예를 들면, 대장균 (E. coli)에서 만들어 질 수 있다 (Han and Reynolds, J. Bacteriol . 179:5157, 1997). 크로토닐-CoA는 대장균 (E. coli) 및 기타 미생물에서 지방산 생합성에서 중간물질이다. 선택된 미생물로부터 ccr과 icm 유전자의 무제한적 실례는 표 4에 열거된다.
생물체 | 유전자 | GenBank 수탁 # |
스트렙토마이세스
코엘리칼라
( Streptomyces coelicolor ) |
Ccr
icmA icmB |
NP
_630556
NP _629554 NP _630904 |
스트렙토마이세스
신나모넨시스
( Streptomyces cinnamonensis ) |
ccr
icmA icmB |
AAD53915
AAC08713 AJ246005 |
bkd 유전자의 발현 이외에, brFA 생합성의 개시는 분지쇄형 아실-CoA에 대한 특이성 (specificity)을 갖는 β-케토아실-아실-운반-단백질 신타아제 III (FabH, EC 2.3.1.41)을 이용한다 (Li et al., J. Bacteriol. 187:3795-3799, 2005). 이런 FabH 효소의 무제한적 실례는 표 5에 열거된다. 임의의 brFA-보유 미생물의 지방산 생합성에 관여하는 fabH 유전자는 숙주 세포에서 발현될 수 있다. brFA를 자연적으로 만들지 않는 숙주 세포로부터 Bkd와 FabH 효소는 brFA 생산을 지지하지 못할 수 있다. 이런 이유로, bkd와 fabH는 재조합 방식으로 발현될 수 있다. bkd와 fabH 유전자를 포함하는 벡터는 이런 숙주 세포 내로 삽입될 수 있다. 유사하게, Bkd와 FabH 생산의 내생적 수준이 brFA를 생산하는데 충분하지 않을 수 있다. 이런 경우에, 이들은 과다발현될 수 있다. 부가적으로, 지방산 생합성 경로의 다른 성분, 예를 들면, 아실 운반 단백질 (ACP)과 β-케토아실-아실-운반-단백질 신타아제 II (fabF, EC 2.3.1.41)가 발현되거나 과다발현될 수 있다 (후보의 무제한적 실례는 표 5에 열거된다). 이들 유전자를 발현하는 것 이외에, 내생적 지방산 생합성 경로에서 일부 유전자가 숙주 세포에서 감약될 수 있다 (가령, 대장균 (E. coli) 유전자 fabH (GenBank 수탁 # NP_415609) 및/또는 fabF (GenBank 수탁 # NP_415613).
생물체 | 유전자 | GenBank 수탁 # |
스트렙토마이세스
코엘리칼라
( Streptomyces coelicolor ) |
fabH1
ACP fabF |
NP
_626634
NP _626635 NP _626636 |
스트렙토마이세스
아베르미틸리스
( Streptomyces avermitilis ) |
fabH3
fabC3 ( ACP ) fabF |
NP
_823466
NP _823467 NP _823468 |
바실루스
서브틸리스
( Bacillus subtilis ) |
fabH
_A
fabH _B ACP fabF |
NP
_389015
NP _388898 NP _389474 NP _389016 |
스테노트로포모나스
말토필리아
( Stenotrophomonas maltophilia ) |
SmalDRAFT
_0818 (
FabH
)
SmalDRAFT _0821 ( ACP ) SmalDRAFT _0822 ( FabF ) |
ZP
_01643059
ZP _01643063 ZP _01643064 |
레지오넬라
뉴모필라
( Legionella pneumophila ) |
FabH
ACP fabF |
YP
_123672
YP _123675 YP _123676 |
환형 알데히드, 지방 알코올,
알칸
, 그리고
알켄의
형성
환형 알데히드, 지방 알코올, 알칸, 그리고 알켄은 기질로서 환형 지방산 유도체를 이용함으로써 생산될 수 있다. 환형 지방산 유도체 기질을 생산하기 위하여, 환형 전구물질로부터 지방산 생합성이 개시되도록, 환형 전구물질을 제공하는 유전자 (가령, ans, chc, 그리고 plm 유전자 일족)가 숙주 세포 내로 도입되고 발현될 수 있다. 가령, 숙주 세포, 예를 들면, 대장균 (E. coli)을 ω-환형 지방산 유도체 (cyFA)를 합성할 수 있는 세포로 전환시키기 위하여, 환형 전구물질 시클로헥실카르보닐-CoA (CHC-CoA)를 제공하는 유전자 (Cropp et al., Nature Biotech . 18:980-983, 2000)가 숙주 세포에서 도입되고 발현될 수 있다. 대장균 (E. coli)에서 CHC-CoA를 제공하는 유전자의 무제한적 실례는 아래와 같다: 스트렙토마이세스 콜리누스 (S. collinus), 스트렙토마이세스 아베르미틸리스 (S. avermitilis), 또는 스트렙토마이세스 코엘리칼라 (S. coelicolor)로부터 chcB 유전자 (Patton et al., Biochem . 39:7595-7604, 2000)와 함께, 스트렙토마이세스 콜리누스 (Streptomyces collinus)의 안사트리에닌 (ansatrienin) 유전자 클러스터 (gene cluster)로부터 ansJ, ansK, ansL, chcA, 그리고 ansM (Chen et al., Eur . J. Biochem . 261: 98-107, 1999), 또는 스트렙토마이세스 종 (Streptomyces sp). HK803의 포스락토마이신 (phoslactomycin) B 유전자 클러스터로부터 plmJ, plmK, plmL, chcA, 그리고 plmM (Palaniappan et al., J. Biol. Chem . 278:35552-35557, 2003) (표 6 참조). 표 5에 열거된 이들 유전자는 이후, ω-환형 지방산의 개시와 신장이 가능하도록 발현될 수 있다. 대안으로, 이들 상동성 유전자는 cyFA를 만드는 미생물로부터 분리되고 숙주 세포 (가령, 대장균 (E. coli))에서 발현될 수 있다.
생물체 | 유전자 | GenBank 수탁 # |
스트렙토마이세스
콜리누스
( Streptomyces collinus ) |
ansJK
ansL chcA ansM chcB |
U72144
*
AF268489 |
스트렙토마이세스 종 ( Streptomyces sp. ) HK803 |
pmlJK
pmlL chcA pmlM |
AAQ84158
AAQ84159 AAQ84160 AAQ84161 |
스트렙토마이세스
코엘리칼라
( Streptomyces coelicolor ) |
chcB / caiD | NP _629292 |
스트렙토마이세스
아베르미틸리스
( Streptomyces avermitilis ) |
chcB / caiD | NP _629292 |
*chcA만 GenBank 기입 U72144에서 주해되고, ansJKLM은 Chen et al. (Eur. J. Biochem . 261:98-107, 1999)에 따른다.
표 5에 열거된 유전자 (fabH , ACP, 그리고 fabF)는 ω-환형 지방산 유도체의 개시와 신장을 가능하게 하는데, 그 이유는 이들이 넓은 기질 특이성을 갖기 때문이다. 이들 유전자 중에서 한 가지와 표 6에 열거된 유전자의 공동발현이 cyFA를 산출하지 못하면, cyFA를 만드는 미생물 (가령, 표 7에 열거된 것들)로부터 fabH , ACP , 및/또는 fabF 동족체가 분리되고 (가령, 축퇴 (degenerate) PCR 프라이머 또는 이질성 DNA 서열 프로브를 이용함으로써) 공동발현될 수 있다.
생물체 | 기준 |
쿠로토박테리움 푸실룸 (Curtobacterium pusillum) |
ATCC19096 |
알리시클로바실루스 아시도테레스트리스 (Alicyclobacillus acidoterrestris) |
ATCC49025 |
알리시클로바실루스 아시도칼다리우스 (Alicyclobacillus acidocaldarius) |
ATCC27009 |
알리시클로바실루스 시클로헵타니쿠스 (Alicyclobacillus cycloheptanicus) * |
Moore, J. Org . Chem . 62:pp. 2173, 1997. |
*cyFA 생합성을 위한 전구물질로서 시클로헵틸카르보닐-CoA는 이용되지만 시클로헥실카르보닐-CoA는 이용되지 못한다.
알데히드, 지방 알코올, 그리고
알켄
포화 수준
지방산 유도체에서 포화도 (degree of saturation)는 지방산 유도체 중간물질의 포화도를 조절함으로써 제어될 수 있다. sfa, gns, 그리고 fab 유전자 일족은 지방산의 포화를 제어하기 위하여 발현되거나 과다발현될 수 있다. 도 40에서는 본 명세서에 기술된 방법과 숙주 세포에서 이용될 수 있는 유전자 일족에서 유전자의 무제한적 실례를 열거한다.
숙주 세포는 fabB를 과다발현하도록 숙주 세포를 조작함으로써, 또는 낮은 온도 (가령, 37℃ 이하)에서 숙주 세포를 성장시킴으로써, 불포화 지방산을 생산하도록 조작될 수 있다. FabB는 시스-δ3데세노일-ACP를 선호하고 대장균 (E. coli)에서 불포화 지방산 생산을 유발한다. fabB의 과다발현은 현저한 비율의 불포화 지방산의 생산을 유발한다 (de Mendoza et al., J. Biol . Chem . 258:2098-2101, 1983). 유전자 fabB는 상기 유전자를 자연적으로 보유하지 않는 숙주 세포 내로 삽입되고 발현될 수 있다. 이들 불포화 지방산 유도체는 이후, 지방산 유도체, 예를 들면, 지방 알데히드, 지방 알코올, 또는 알켄을 생산하도록 조작된 숙주 세포에서 중간물질로서 이용될 수 있다.
다른 경우에, 지방산 생합성의 억제자, 예를 들면, fabR (GenBank 수탁 NP_418398)이 결실될 수 있고, 이는 또한, 대장균 (E. coli)에서 증가된 불포화 지방산 생산을 유발할 것이다 (Zhang et al., J. Biol . Chem . 277:15558, 2002). 유사한 결실이 다른 숙주 세포에서 만들어질 수 있다. 불포화 지방산 유도체에서 더욱 증가는 예로써, 대장균 (E. coli) fabI (트랜스-2-에노일-ACP 환원효소, GenBank 수탁 NP_415804)를 결실시키면서, fabM (트랜스-2, 시스-3-데세노일-ACP 이성화효소, GenBank 수탁 DAA05501)의 과다발현 및 폐렴구균 (Streptococcus pneumoniae)으로부터 fabK (트랜스-2-에노일-ACP 환원효소 II, GenBank 수탁 NP_357969)의 제어된 발현 (Marrakchi et al., J. Biol . Chem . 277: 44809, 2002)에 의해 달성될 수 있다. 일부 실례에서, 내생적 fabF 유전자는 감약될 수 있고, 따라서 생산되는 팔미톨레이트 (palmitoleate) (C16:1)의 비율이 증가된다.
다른 기질
본 명세서에 기술된 방법에서 알데히드, 지방 알코올, 알칸, 그리고 알켄을 생산하는데 이용될 수 있는 다른 기질은 아실-ACP, 아실-CoA, 지방 알데히드, 또는 지방 알코올인데, 이들은 예로써, PCT/US08/058788에서 기술된다. 숙주 세포에서 이들 기질을 발현 또는 과다발현하기 위하여 변형될 수 있는 예시적인 유전자는 도 40에 열거된다. 다른 예시적인 유전자는 PCT/US08/058788에서 기술된다.
알데히드, 지방 알코올,
알칸
, 그리고
알켄을
생산하기 위한 숙주 세포의 유전자 조작
본 명세서에 기술된 바와 같이, 알데히드, 지방 알코올, 알칸, 및/또는 알켄을 생산하기 위하여 다양한 숙주 세포가 이용될 수 있다. 숙주 세포는 임의의 원핵 또는 진핵 세포일 수 있다. 가령, 본 명세서에 기술된 폴리펩티드는 세균 세포 (가령, 대장균 (E. coli)), 곤충 세포, 효모 또는 포유동물 세포 (가령, 중국 햄스터 난소 (CHO) 세포, COS 세포, VERO 세포, BHK 세포, HeLa 세포, Cv1 세포, MDCK 세포, 293 세포, 3T3 세포, 또는 PC12 세포)에서 발현될 수 있다. 다른 예시적인 숙주 세포에는 에스체리키아 (Escherichia) 속, 바실루스 (Bacillus) 속, 락토바실루스 (Lactobacillus) 속, 로도코쿠스 (Rhodococcus) 속, 슈도모나스 (Pseudomonas) 속, 아스페르길루스 (Aspergillus) 속, 트리코더마 (Trichoderma) 속, 뉴로스포라 (Neurospora) 속, 푸사리움 (Fusarium) 속, 후미콜라 (Humicola) 속, 리조무코 (Rhizomucor) 속, 클루이베로마이세스 (Kluyveromyces) 속, 피치아 (Pichia) 속, 무코 (Mucor) 속, 미셀리오프토라 (Myceliophtora) 속, 페니실리움 (Penicillium) 속, 파네로차에테 (Phanerochaete) 속, 느타리속 (Pleurotus), 송편버섯속 (Trametes), 크리소스포륨 (Chrysosporium) 속, 사카로마이세스 (Saccharomyces) 속, 쉬조사카로마이세스 (Schizosaccharomyces) 속, 야로위아 (Yarrowia) 속, 또는 스트렙토마이세스 (Streptomyces) 속의 구성원으로부터 세포가 포함된다. 또 다른 예시적인 숙주 세포는 바실루스 렌투스 (Bacillus lentus) 세포, 바실루스 브레비스 (Bacillus brevis) 세포, 바실루스 스테아로써모필러스 (Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스 (Bacillus licheniformis) 세포, 바실루스 알칼로필루스 (Bacillus alkalophilus) 세포, 바실루스 코아굴란스 (Bacillus coagulans) 세포, 바실루스 키르쿨란스 (Bacillus circulans) 세포, 바실루스 푸밀리스 (Bacillus pumilis) 세포, 바실루스 튜링기엔시스 (Bacillus thuringiensis) 세포, 바실루스 클라우시 (Bacillus clausii) 세포, 바실루스 메가테리움 (Bacillus megaterium) 세포, 바실루스 서브틸리스 (Bacillus subtilis) 세포, 바실루스 아밀로리퀴파시엔스 (Bacillus amyloliquefaciens) 세포, 트리코더마 코닌기 (Trichoderma koningii) 세포, 트리코더마 비리데 (Trichoderma viride) 세포, 트리코더마 르에세이 (Trichoderma reesei) 세포, 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리 (Aspergillus awamori) 세포, 아스페르길루스 푸미가테스 (Aspergillus fumigates) 세포, 아스페르길루스 포에티두스 (Aspergillus foetidus) 세포, 아스페르길루스 니둘란스 (Aspergillus nidulans) 세포, 아스페르길루스 니게르 (Aspergillus niger) 세포, 아스페르길루스 오리재 (Aspergillus oryzae) 세포, 후미콜라 인솔렌스 (Humicola insolens) 세포, 후미콜라 라누기노세 (Humicola lanuginose) 세포, 리조무코 미에헤이 (Rhizomucor miehei) 세포, 무코 미에헤이 (Mucor michei) 세포, 스트렙토마이세스 리비단스 (Streptomyces lividans) 세포, 스트렙토마이세스 무리누스 (Streptomyces murinus) 세포, 또는 방선균 (Actinomycetes) 세포일 수 있다.
숙주 세포의 다른 무제한적 실례는 표 1에 열거된 것들이다.
바람직한 구체예에서, 숙주 세포는 대장균 (E. coli) 세포이다. 더욱 바람직한 구체예에서, 숙주 세포는 대장균 (E. coli) 균주 B, C, K, 또는 W이다. 다른 적절한 숙주 세포는 당업자에게 공지되어 있다.
알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산하도록 숙주 세포를 유전자 조작하는데 당분야에 널리 공지된 다양한 방법이 이용될 수 있다. 이들 방법에는 본 명세서에 기술된 알데히드, 지방 알코올, 알칸, 및/또는 알켄 생합성 폴리펩티드, 또는 이의 폴리펩티드 변이체 또는 단편을 인코딩하는 핵산을 포함하는 벡터, 바람직하게는 발현 벡터의 이용이 포함된다. 본 명세서에서, 용어 "벡터"는 상기 벡터와 연결되는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터의 한 가지 유형은 "플라스미드"인데, 이는 추가의 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프 (loop)를 지칭한다. 다른 유형의 벡터는 바이러스 벡터인데, 여기서 추가의 DNA 분절이 바이러스 게놈 내로 결찰될 수 있다. 일정한 벡터 (가령, 세균 복제 기점을 보유하는 세균 벡터 및 에피솜 포유동물 벡터)는 그들이 도입되는 숙주 세포 내에서 자기 복제 (autonomous replication)를 수행할 수 있다. 다른 벡터 (가령, 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입 이후에 상기 숙주 세포의 게놈 내로 통합되고, 따라서 숙주 게놈과 함께 복제된다. 게다가, 일정한 벡터, 예를 들면, 발현 벡터는 그들과 작동가능하게 연결되는 유전자의 발현을 주동할 수 있다. 일반적으로, 재조합 DNA 기술에 이용되는 발현 벡터는 종종, 플라스미드의 형태이다. 하지만, 다른 형태의 발현 벡터, 예를 들면, 바이러스 벡터 (가령, 복제 결함성 (replication defective) 레트로바이러스, 아데노바이러스, 그리고 아데노-연관된 바이러스) 역시 이용될 수 있다.
본 명세서에 기술된 재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로, 본 명세서에 기술된 핵산을 포함한다. 이들 재조합 발현 벡터는 발현에 이용되는 숙주 세포에 기초하여 선택된 하나 이상의 조절 서열을 포함할 수 있다. 조절 서열은 발현되는 핵산 서열에 작동가능하게 연결된다. 이런 조절 서열은 예로써, Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990). 조절 서열에는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구조성 발현을 주동하는 것들, 그리고 일정한 숙주 세포에서만 뉴클레오티드 서열의 발현을 주동하는 것들 (가령, 조직-특이적인 조절 서열)이 포함된다. 당업자가 인지하는 바와 같이, 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 인자에 좌우될 수 있다. 본 명세서에 기술된 발현 벡터는 본 명세서에 기술된 바와 같은 핵산에 의해 인코딩되는, 융합 폴리펩티드를 비롯한 폴리펩티드를 생산하기 위하여 숙주 세포 내로 도입될 수 있다.
재조합 발현 벡터는 원핵 또는 진핵 세포 (가령, 세균 세포, 예를 들면, 대장균 (E. coli), 곤충 세포 (배큘로바이러스 발현 벡터 이용), 효모 세포, 또는 포유동물 세포)에서 알데히드, 지방 알코올, 알칸, 및/또는 알켄 생합성 폴리펩티드 또는 변이체의 발현에 맞게 설계될 수 있다. 적절한 숙주 세포는 Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)에서 더욱 상세하게 기술된다. 대안으로, 재조합 발현 벡터는 예로써, T7 프로모터 조절 서열과 T7 중합효소를 이용함으로써, 시험관내에서 전사되고 번역될 수 있다.
원핵생물, 가령, 대장균 (E. coli)에서 폴리펩티드의 발현은 대부분의 경우에, 융합 또는 비-융합 폴리펩티드의 발현을 주동하는 구조성 또는 유도성 프로모터를 포함하는 벡터로 수행된다. 융합 벡터는 그 속에 인코딩된 폴리펩티드에, 일반적으로, 상기 재조합 폴리펩티드의 아미노 말단에 다수의 아미노산을 부가한다. 이런 융합 벡터는 전형적으로, 3가지 목적을 수행한다: (1) 재조합 폴리펩티드의 발현을 증가시키고; (2) 재조합 폴리펩티드의 용해도를 증가시키고; 그리고 (3) 친화성 정제 (affinity purification)에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 보조한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점 내에 단백분해 절단 (proteolytic cleavage) 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이런 효소, 그리고 그들의 동계 인식 서열의 실례에는 인자 Xa, 트롬빈 (thrombin), 그리고 엔테로키나아제 (enterokinase)가 포함된다. 예시적인 융합 발현 벡터에는 pGEX (Pharmacia Biotech Inc; Smith et al., Gene (1988) 67:31-40), pMAL (New England Biolabs, Beverly, Mass.), 그리고 pRITS (Pharmacia, Piscataway, N.J.)가 포함되는데, 이들은 표적 재조합 폴리펩티드에 각각, 글루타티온 S-전이효소 (glutathione S-transferase, GST), 말토오스 E 결합 단백질, 또는 단백질 A를 융합한다.
유도성, 비-융합 대장균 (E. coli) 발현 벡터의 실례에는 pTrc (Amann et al., Gene (1988) 69:301-315)와 pET 11d (Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 60-89)가 포함된다. pTrc 벡터로부터 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터 숙주 RNA 중합효소 전사에 의존한다. pET 11d 벡터로부터 표적 유전자 발현은 공동-발현된 바이러스 RNA 중합효소 (T7 gn1)에 의해 매개된 T7 gn10-lac 융합 프로모터로부터 전사에 의존한다. 이러한 바이러스 중합효소는 lacUV 5 프로모터의 전사 제어 하에, T7 gn1 유전자를 보유하는 내재성 λ 프로파지 (prophage)로부터 숙주 균주 BL21(DE3) 또는 HMS174(DE3)에 의해 공급된다.
재조합 폴리펩티드 발현을 극대화시키는 한 가지 전략은 재조합 폴리펩티드를 단백분해 절단하는 능력이 손상된 숙주 세포에서 상기 폴리펩티드를 발현하는 것이다 (참조: Gottesman, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 119-128). 다른 전략은 각 아미노산에 대한 개별 코돈이 숙주 세포에서 선호적으로 이용되는 것들이 되도록, 발현 벡터 내로 삽입되는 핵산 서열을 변경하는 것이다 (Wada et al., Nucleic Acids Res . (1992) 20:2111-2118). 핵산 서열의 이런 변경은 표준 DNA 합성 기술에 의해 수행될 수 있다.
다른 구체예에서, 숙주 세포는 효모 세포이다. 이러한 구체예에서, 발현 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비지애 (S. cerevisiae)에서 발현을 위한 벡터의 실례에는 pYepSec1 (Baldari et al., EMBO J. (1987) 6:229-234), pMFa (Kurjan et al., Cell (1982) 30:933-943), pJRY88 (Schultz et al., Gene (1987) 54:113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.), 그리고 picZ (Invitrogen Corp, San Diego, Calif.)가 포함된다.
대안으로, 본 명세서에 기술된 폴리펩티드는 배큘로바이러스 발현 벡터를 이용하여 곤충 세포에서 발현될 수 있다. 배양된 곤충 세포 (가령, Sf 9 세포)에서 단백질의 발현에 가용한 배큘로바이러스 벡터에는 예로써, pAc 시리즈 (Smith et al., Mol . Cell Biol . (1983) 3:2156-2165) 및 pVL 시리즈 (Lucklow et al., Virology (1989) 170:31-39)가 포함된다.
또 다른 구체예에서, 본 명세서에 기술된 핵산은 포유동물 발현 벡터를 이용하여 포유동물 세포에서 발현될 수 있다. 포유동물 발현 벡터의 실례에는 pCDM8 (Seed, Nature (1987) 329:840) 및 pMT2PC (Kaufman et al., EMBO J. (1987) 6:187-195)가 포함된다. 포유동물 세포에서 이용될 때, 발현 벡터의 제어 기능은 바이러스 조절 요소에 의해 제공될 수 있다. 가령, 통상적으로 이용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스와 시미안 바이러스 40으로부터 유래된다. 원핵과 진핵 세포 둘 모두에 적합한 다른 발현 시스템은 Sambrook et al., eds., Molecular Cloning: A Laboratory Manual. 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989의 16장과 17장에서 기술된다.
벡터는 전통적인 형질전환 또는 형질감염 기술을 통해 원핵 또는 진핵 세포 내로 도입될 수 있다. 본 명세서에서, 용어 "형질전환"과 "형질감염"은 인산칼슘 또는 염화칼슘 공침 (co-precipitation), DEAE-덱스트란-매개된 형질감염, 리포펙션 (lipofection), 또는 전기천공 (electroporation)을 비롯하여, 외래 핵산 (가령, DNA)을 숙주 세포 내로 도입하기 위한 당분야에서 인정되는 다양한 기술을 지칭한다. 숙주 세포를 형질전환 또는 형질감염시키는데 적절한 방법은 예로써, Sambrook et al. (supra)에서 찾아볼 수 있다.
세균 세포의 안정적인 형질전환을 위하여, 이용된 발현 벡터와 형질전환 기술에 따라, 단지 소량의 세포만 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이들 형질전환체를 확인하고 선택하기 위하여, 선택가능 마커 (가령, 항생제에 대한 내성)를 인코딩하는 유전자가 목적 유전자와 함께, 숙주 세포 내로 도입될 수 있다. 선택가능 마커에는 약물, 예를 들면, 암피실린, 카나마이신, 클로람페니콜, 또는 테트라시클린에 내성을 공여하는 것들이 포함된다. 선택가능 마커를 인코딩하는 핵산은 본 명세서에서 기술된 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입되거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산으로 안정적으로 형질감염된 세포는 약물 선택에 의해 확인될 수 있다 (가령, 선택가능 마커 유전자가 통합된 세포는 생존하는 반면, 다른 세포는 사멸한다).
포유동물 세포의 안정적인 형질감염을 위하여, 이용된 발현 벡터와 형질감염 기술에 따라, 단지 소량의 세포만 외래 DNA를 그들의 게놈 내로 통합할 수 있는 것으로 알려져 있다. 이들 통합체를 확인하고 선택하기 위하여, 선택가능 마커 (가령, 항생제에 대한 내성)를 인코딩하는 유전자가 목적 유전자와 함께, 숙주 세포 내로 도입될 수 있다. 바람직한 선택가능 마커에는 약물, 예를 들면, G418, 히그로마이신, 그리고 메토트렉세이트에 내성을 공여하는 것들이 포함된다. 선택가능 마커를 인코딩하는 핵산은 본 명세서에서 기술된 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입되거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산으로 안정적으로 형질감염된 세포는 약물 선택에 의해 확인될 수 있다 (가령, 선택가능 마커 유전자가 통합된 세포는 생존하는 반면, 다른 세포는 사멸한다).
일정한 방법에서, 알데히드 생합성 폴리펩티드와 알칸 또는 알켄 생합성 폴리펩티드가 단일 숙주 세포에서 공동-발현된다. 대안적 방법에서, 알데히드 생합성 폴리펩티드와 알코올 탈수소효소 폴리펩티드가 단일 숙주 세포에서 공동-발현된다.
수송 단백질
수송 단백질은 폴리펩티드와 탄화수소 (가령, 알데히드, 알칸, 및/또는 알켄)를 숙주 세포 외부로 이출 (export)할 수 있다. 많은 수송과 유출 단백질은 다양한 화합물을 방출하는 기능을 하고 특정 유형의 탄화수소에 선택적이도록 자연적으로 변형될 수 있다.
적절한 수송 단백질의 무제한적 실례는 ATP-결합 카세트 (ABC) 수송 단백질, 유출 단백질, 그리고 지방산 수송체 단백질 (FATP)이다. 적절한 수송 단백질의 추가의 무제한적 실례에는 생물체, 예를 들면, 예쁜꼬마선충 (Caenorhabditis elegans), 애기장대 (Arabidopsis thalania ), 알칼리제네스 유트로퍼스 (Alkaligenes eutrophus), 그리고 로도코쿠스 에리트로폴리스 (Rhodococcus erythropolis)로부터 ABC 수송 단백질이 포함된다. 이용될 수 있는 예시적인 ABC 수송 단백질은 도 40에 열거된다 (가령, CER5, AtMRP5, AmiS2, 그리고 AtPGP1). 숙주 세포는 또한, 탄화수소를 분비하는 내생적 능력에 대하여 선택될 수 있다. 숙주 세포 환경 (가령, 배양 배지, 발효 액체 배지) 내로 탄화수소 생산과 분비의 효율은 세포내 산물 대(對) 세포외 산물의 비율로서 표시될 수 있다. 일부 실례에서, 상기 비율은 대략 5:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 또는 1:5일 수 있다.
발효
알데히드, 지방 알코올, 알칸 및/또는 알켄의 생산과 분리는 유익한 발효 기술을 이용함으로써 강화될 수 있다. 비용을 줄이면서 생산을 극대화시키는 한 가지 방법은 탄화수소 산물로 전환되는 탄소 공급원의 비율을 증가시키는 것이다.
정상적인 세포 수명 동안, 탄소는 세포 기능, 예를 들면, 지질, 당류, 단백질, 유기 산, 그리고 핵산 생산에 이용된다. 성장-관련된 활성에 필요한 탄소 양의 감소는 산물로의 탄소 공급원 전환의 효율을 증가시킬 수 있다. 이는 예로써, 먼저 숙주 세포를 원하는 밀도 (가령, 성장의 대수기 (log phase)의 피크에서 달성되는 밀도)로 성장시킴으로써 달성될 수 있다. 이런 시점에서, 세포의 성장을 중단시키기 위하여 복제 체크포인트 (replication checkpoint) 유전자가 동력화될 수 있다. 구체적으로, 정원 인식 (quorum sensing) 기전 (Camilli et al., Science 311:1113, 2006; Venturi FEMS Microbio . Rev . 30:274-291, 2006; 그리고 Reading et al., FEMS Microbiol . Lett . 254:1-11, 2006에서 재조사됨)이 체크포인트 유전자, 예를 들면, p53, p21, 또는 다른 체크포인트 유전자를 활성화시키는데 이용될 수 있다.
대장균 (E. coli)에서 세포 복제와 성장을 중단시키기 위하여 활성화될 수 있는 유전자에는 umuDC 유전자가 포함된다. umuDC 유전자의 과다발현은 정지기 (stationary phase)에서 지수 성장 (exponential growth)으로의 진행을 중단시킨다 (Murli et al., J. of Bact . 182:1127, 2000). UmuC는 비-코딩 병소에서 장애관통 종합 (translesion synthesis) - 대부분의 UV와 화학적 돌연변이유발의 기계적 기초를 수행할 수 있는 DNA 중합효소이다. umuDC 유전자 산물은 장애관통 종합의 과정에 관여하고, 또한 DNA 서열 손상 체크포인트로서 기능한다. umuDC 유전자 산물에는 UmuC, UmuD, umuD', UmuD'2C, UmuD'2, 그리고 UmuD2가 포함된다. 유사하게, 알데히드, 알칸 및/또는 알켄이 만들어지는 동안, 산물-생산 유전자가 활성화될 수 있고, 따라서 복제와 유지 경로가 이용되는 필요성을 최소화시킨다. 숙주 세포는 또한, 적절한 최종-산물 생산 유전자로 상기 유전자의 de novo 합성을 통해 prpBCDE 프로모터 시스템 하에 pBAD24에서 대장균 (E. coli)으로부터 umuC와 u muD를 발현하도록 조작될 수 있다.
알데히드, 지방 알코올, 알칸 및/또는 알켄으로 전환되는 입력 탄소의 비율은 원가 동인 (cost driver)일 수 있다. 이러한 과정이 더욱 효율적일수록 (즉, 알데히드, 지방 알코올, 알칸 및/또는 알켄으로 전환되는 입력 탄소의 비율이 높을수록), 상기 과정은 더욱 적은 비용이 소요될 것이다. 산소-포함 탄소 공급원 (가령, 글루코오스 및 기타 탄수화물 기초된 공급원)의 경우에, 산소는 이산화탄소의 형태로 방출될 것이다. 방출되는 2개의 산소 원자 마다, 탄소 원자 역시 방출되고 대략 34% (w/w)의 최대 이론적 물질대사 효율에 이른다 (지방산 유래된 산물의 경우에). 하지만, 이러한 수치는 다른 탄화수소 산물과 탄소 공급원의 경우에 변한다. 기존 문헌에서 전형적인 효율은 대략 5% 이하이다. 알데히드, 알칸 및/또는 알켄을 생산하도록 조작된 숙주 세포는 대략 1, 3, 5, 10, 15, 20, 25, 그리고 30% 이상의 효율을 가질 수 있다. 한 가지 실례에서, 숙주 세포는 대략 10% 내지 대략 25%의 효율을 나타낼 수 있다. 다른 실례에서, 이런 숙주 세포는 대략 25% 내지 대략 30%의 효율을 나타낼 수 있다. 다른 실례에서, 숙주 세포는 30% 초과의 효율을 나타낼 수 있다.
숙주 세포는 재조합 셀룰로좀 (cellulosomes), 예를 들면, PCT 출원 번호 PCT/US2007/003736에서 기술된 것들을 발현하도록 추가적으로 조작될 수 있다. 이들 셀룰로좀은 숙주 세포가 세포 물질을 탄소 공급원으로서 이용할 수 있도록 할 수 있다. 가령, 숙주 세포는 수크로오스가 탄소 공급원으로서 이용될 수 있도록 하기 위하여, 인베르타아제 (invertase)를 발현하도록 추가적으로 조작될 수 있다 (EC 3.2.1.26). 유사하게, 숙주 세포는 탄소를 효율적으로 동화시키고 세포 물질을 탄소원으로서 이용할 수 있도록 하기 위하여, U.S. Patent No. 5,000,000; 5,028,539; 5,424,202; 5,482,846; 그리고 5,602,030에서 기술된 교시를 이용하여 조작될 수 있다.
한 가지 실례에서, 발효 챔버는 연속 환원을 겪는 발효액을 집어넣을 수 있다. 이러한 경우에, 안정적인 환원 환경이 산출될 수 있다. 전자 균형 (electron balance)은 이산화탄소 (가스 형태로)의 방출에 의해 유지될 수 있다. NAD/H와 NADP/H 균형을 증가시키는 노력 역시 전자 균형의 안정화를 촉진할 수 있다. 세포내 NADPH의 이용가능성은 또한, NADH:NADPH 트랜스수소화효소 (transhydrogenase)를 발현하도록 숙주 세포를 조작함으로써 강화될 수 있다. 하나 이상의 NADH:NADPH 트랜스수소화효소의 발현은 해당 (glycolysis)에 의해 생산된 NADH를 NADPH로 전환시키고, 이는 알데히드, 알칸 및/또는 알켄의 생산을 강화시킬 수 있다.
소규모 생산의 경우에, 조작된 숙주 세포는 예로써, 대략 100 ㎖, 500 ㎖, 1 ℓ, 2 ℓ, 5 ℓ, 또는 10 ℓ의 배치 (batch)에서 성장되고; 발효되고; 그리고, 적절한 플라스미드에서 인코딩된 특정 유전자에 기초된 원하는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 발현하도록 유도될 수 있다. 가령, pBAD24 (암피실린 내성 및 알데히드, 지방 알코올, 알칸, 또는 알켄 합성 경로 보유), 그리고 pUMVC1 (카나마이신 내성 및 아세틸 CoA/말로닐 CoA 과다발현 시스템)을 포함하는 대장균 (E. coli) BL21(DE3) 세포는 배양액이 > 0.8의 OD600에 도달할 때까지 75 ㎍/㎖ 암피실린과 50 ㎍/㎖ 카나마이신으로 보충된 500 ㎖ LB 배지에서 > 200 rpm으로 교반된 2 ℓ 플라스크에서, 37℃에서 하룻밤동안 배양될 수 있다. > 0.8의 OD600을 달성한 이후에, 세포는 생산을 위한 조작된 유전자 시스템을 활성화시키고, 그리고 UmuC와 UmuD 단백질을 활성화시켜 세포 증식을 중단시키기 위하여, 25 mM 프로피온산나트륨 (pH 8.0)으로 보충될 수 있다. 유도는 30℃에서 6시간 동안 수행될 수 있다. 배양후, 배지는 GC-MS를 이용하여 알데히드, 지방 알코올, 알칸 및/또는 알켄에 대하여 검사될 수 있다.
대규모 생산의 경우에, 조작된 숙주 세포는 10 ℓ, 100 ℓ, 1000 ℓ, 또는 그 이상의 배치 (batch)에서 성장되고; 발효되고; 그리고, 적절한 플라스미드에서 인코딩된 특정 유전자에 기초된 원하는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 발현하도록 유도될 수 있다. 가령, pBAD24 (암피실린 내성 및 알데히드 및/또는 알칸 합성 경로 보유), 그리고 pUMVC1 (카나마이신 내성 및 아세틸-CoA/말로닐-CoA 과다발현 시스템)을 포함하는 대장균 (E. coli) BL21(DE3) 세포는 50 ㎍/㎖ 카나마이신과 75 ㎍/㎖ 암피실린을 포함하는 LB 배지 (글리세롤 없음)에서 10 ℓ 발효를 위한 500 ㎖ 접종 배양액 (seed culture) (100 ℓ 발효의 경우 5 ℓ 등)으로부터 37℃에서 배양되고, 그리고 배양액이 > 0.8의 OD600에 도달할 때 (전형적으로 16시간)까지 > 200 rpm으로 교반될 수 있다. 배지는 생산을 위한 조작된 유전자 시스템을 활성화시키고, 그리고 UmuC와 UmuD 단백질을 활성화시켜 세포 증식을 중단시키기 위하여, 25 mM 프로피온산나트륨 (pH 8.0)을 유지하도록 연속적으로 보충될 수 있다. 배지는 25 g/100 ㎖의 농도를 유지하기 위하여 글루코오스로 연속적으로 보충될 수 있다.
첫 1시간의 유도후, 전체 세포 용적의 단지 10%의 분액 (aliquot)이 1시간마다 이전되고, 알데히드, 알칸 및/또는 알켄이 표면으로 상승하여 자발적 상 분리 (spontaneous phase separation)가 진행되도록 교반 없이 방치될 수 있다. 알데히드, 지방 알코올, 알칸 및/또는 알켄 성분은 이후, 수집되고, 그리고 수성 상은 반응 챔버로 환원되었다. 반응 챔버는 연속적으로 가동될 수 있다. OD600이 0.6 미만으로 하락할 때, 세포는 접종 배양액으로부터 성장된 새로운 배치로 교체될 수 있다.
세포-없는 방법을 이용한 알데히드, 지방 알코올,
알칸과
알켄
생산
본 명세서에 기술된 일부 방법에서, 알데히드, 지방 알코올, 알칸 및/또는 알켄은 본 명세서에 기술된 정제된 폴리펩티드 및 본 명세서에 기술된 기질을 이용하여 생산될 수 있다. 가령, 숙주 세포는 본 명세서에 기술된 바와 같은 알데히드, 지방 알코올, 알칸 및/또는 알켄 생합성 폴리펩티드 또는 변이체를 발현하도록 조작될 수 있다. 숙주 세포는 폴리펩티드의 발현을 가능하게 하는데 적합한 조건 하에 배양될 수 있다. 세포 없는 추출물은 이후, 공지된 방법을 산출될 수 있다. 가령, 숙주 세포는 세정제를 이용하여, 또는 초음파처리에 의해 용해될 수 있다. 발현된 폴리펩티드는 공지된 방법을 이용하여 정제될 수 있다. 세포 없는 추출물을 획득한 이후, 본 명세서에 기술된 기질은 상기 세포 없는 추출물에 첨가되고 이들 기질의 알데히드, 지방 알코올, 알칸 및/또는 알켄으로의 전환을 가능하게 하는 조건 하에 유지될 수 있다. 알데히드, 지방 알코올, 알칸 및/또는 알켄은 이후, 공지된 기술을 이용하여 분리되고 정제될 수 있다.
생산후
처리
발효 동안 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 발효 배지로부터 분리될 수 있다. 수성 배지로부터 알데히드, 지방 알코올, 알칸 및/또는 알켄을 분리하기 위한 임의의 공지된 기술이 이용될 수 있다. 한 가지 예시적인 분리 공정은 2가지 상 (이중-상) 분리 공정이다. 이러한 공정은 알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산할 만큼 충분한 조건 하에 유전자 조작된 숙주 세포를 발효시키는 단계, 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄이 유기 상에 집합되도록 하는 단계, 그리고 수성 발효 액체 배지로부터 상기 유기 상을 분리하는 단계를 수반한다. 이러한 방법은 배치 (batch) 및 연속 발효 설정 (continuous fermentation setting) 둘 모두에서 실시될 수 있다.
이중-상 분리는 분리를 촉진하기 위하여 알데히드, 지방 알코올, 알칸 및/또는 알켄의 상대적 비혼화성 (relative immiscibility)을 이용한다. 비혼화성은 물에서 용해되는 화합물의 상대적인 무능을 지칭하고 상기 화합물의 분배 계수에 의해 정의된다. 당업자가 인지하는 바와 같이, 생산되는 알데히드, 알칸 및/또는 알켄이 높은 logP 값을 갖도록 발효 액체 배지와 유기 상을 선택함으로써, 상기 알데히드, 알칸 및/또는 알켄은 발효 용기 내에서 매우 낮은 농도에서도 유기 상 내로 분리할 수 있다.
본 명세서에 기술된 방법에 의해 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 발효 액체 배지에서, 그리고 세포질에서 상대적으로 비혼화성일 수 있다. 이런 이유로, 알데히드, 지방 알코올, 알칸 및/또는 알켄은 세포내에서 또는 세포외에서 유기 상에 집합될 수 있다. 유기 상에서 산물의 집합은 세포 기능에 대한 알데히드, 지방 알코올, 알칸 및/또는 알켄의 영향을 감소시킬 수 있고, 그리고 숙주 세포가 더욱 많은 산물을 생산할 수 있도록 할 수 있다.
본 명세서에 기술된 방법은 균질성 화합물을 생산할 수 있고, 여기서 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄의 적어도 대략 60%, 70%, 80%, 90%, 또는 95%가 대략 6개 이하의 탄소, 대략 4개 이하의 탄소, 또는 대략 2개 이하의 탄소에 의해 변화하는 탄소 사슬 길이를 가질 것이다. 이들 화합물은 또한, 상대적으로 균일한 포화도로 생산될 수 있다. 이들 화합물은 연료, 연료 첨가제, 특수 화학제품; 다른 화학 화합물 (가령, 중합체, 계면활성제, 플라스틱, 직물, 용매, 첨가제 등)의 생산을 위한 출발 물질, 또는 개인 관리 제품 첨가제로서 직접적으로 이용될 수 있다. 이들 화합물은 또한, 다른 산물을 만들기 위한 차후 반응, 예를 들면, 수소첨가, 촉매 분해 (catatalytic cracking) (수소첨가, 열분해 (pyrolisis), 또는 둘 모두를 통해)를 위한 공급원료로서 이용될 수 있다.
일부 구체예에서, 본 명세서에 기술된 방법을 이용하여 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 대략 50% 내지 대략 90% 탄소; 또는 대략 5% 내지 대략 25% 수소를 포함할 수 있다. 다른 구체예에서, 본 명세서에 기술된 방법을 이용하여 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 대략 65% 내지 대략 85% 탄소; 또는 대략 10% 내지 대략 15% 수소를 포함할 수 있다.
연료 조성물 및 특수 화학 조성물
본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 연료로서 이용되거나 연료로 전환될 수 있고, 또는 특수 화합제품으로서 이용될 수 있다. 당업자가 인지하는 바와 같이, 연료 또는 특수 화학제품의 의도된 목적에 따라, 상이한 알데히드, 지방 알코올, 알칸 및/또는 알켄이 생산되고 이용될 수 있다. 가령, 분지형 알데히드, 지방 알코올, 알칸 및/또는 알켄은 추운 날씨에 이용되도록 의도되는 자동차 연료에 바람직할 수 있다. 이에 더하여, 본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄이 연료 또는 특수 화학제품 생산을 위한 공급원료로서 이용될 때, 당업자는 알데히드, 지방 알코올, 알칸 및/또는 알켄 공급원료의 특징이 생산되는 연료 또는 특수 화학제품의 특징에 영향을 줄 것이라는 것을 인지할 것이다. 따라서 연료 또는 특수 화학제품의 특징은 공급원료로서 이용을 위한 특정한 알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산함으로써 선택될 수 있다.
본 명세서에 기술된 방법을 이용하여, 원하는 연료 속성을 갖는 생물연료가 알데히드, 지방 알코올, 알칸 및/또는 알켄으로부터 생산될 수 있다. 생물학적으로 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 제트 연료, 디젤, 또는 가솔린으로서 이용될 수 있는 생물연료의 새로운 공급원을 대표한다. 알데히드, 지방 알코올, 알칸 및/또는 알켄을 이용하여 만들어진 일부 생물연료는 재생가능 공급원으로부터 생산된 적이 없으며 신규한 물질 조성물이다. 이들 신규한 연료 또는 특수 화학제품은 이중 탄소-동위원소 지문감정 (dual carbon-isotopic fingerprinting)에 기초하여 석유화학 탄소 (petrochemical carbon)로부터 유래된 연료 또는 특수 화학제품과 구별될 수 있다. 부가적으로, 생물자원 탄소 (biosourced carbon)의 특이적인 공급원 (가령, 글루코오스 vs. 글리세롤)은 이중 탄소-동위원소 지문감정에 의해 결정될 수 있다 (참조: U.S. Patent No. 7,169,588, 특히 col. 4, 라인 31 내지 col. 6, 라인 8).
상기 알데히드, 지방 알코올, 알칸 및/또는 알켄 및 연관된 생물연료, 특수 화학제품, 그리고 혼합물은 14C (fM) 및 이중 탄소-동위원소 지문감정에 기초하여 그들의 석유제품 유래된 대응물로부터 구별될 수 있다. 일부 실례에서, 생물연료 조성물에서 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄은 예로써, 적어도 대략 1.003, 1.010, 또는 1.5의 현대 탄소의 분율 (fM 14C)을 가질 수 있다.
일부 실례에서, 대략 -15.4 내지 대략 -10.9의 δ13C를 갖는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 포함하는 생물연료 조성물이 만들어질 수 있는데, 여기서 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄은 상기 조성물 내에서 생물자원 물질 (즉, 재생가능 자원, 예를 들면, 생물자원, 세포 물질, 그리고 당으로부터 유래됨)의 적어도 대략 85%를 차지한다.
이들 생물학적으로 유래된 산물을 구별하는 능력은 거래 중에 이들 물질을 추적하는데 유익하다. 가령, 생물학적으로 유래된, 그리고 석유-기초된 탄소 동위원소 프로필 둘 모두를 포함하는 연료 또는 특수 화학제품은 석유-기초된 물질로만 만들어진 연료와 특수 화학제품으로부터 구별될 수 있다. 따라서 본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 그들의 독특한 프로필에 기초하여 생물연료로서 거래 중에 추적되거나, 또는 거래 중에 확인될 수 있다. 이에 더하여, 다른 경쟁 물질이 생물학적으로 유래되거나, 또는 석유화학 공급원으로부터 유래되는 것으로 확인될 수 있다.
연료 첨가제는 연료 또는 엔진의 성능을 향상시키는데 이용된다. 가령, 연료 첨가제는 응고점 (freezing point)/겔화점 (gelling point), 운점 (cloud point), 윤활성 (lubricity), 점성도 (viscosity), 산화 안정성 (oxidative stability), 착화성 (ignition quality), 옥탄 수준 및/또는 인화점 (flash point)을 변화시키는데 이용될 수 있다. 미국에서, 모든 연료 첨가제는 환경보호국 (Environmental Protection Agency)에 등록되어야 한다. 연료 첨가제의 명칭 및 이들 연료 첨가제를 판매하는 회사는 EPA에 연락함으로써, 또는 환경보호국의 웹사이트를 살펴봄으로써 공개적으로 확인가능하다. 당업자가 인지하는 바와 같이, 본 명세서에 기술된 알데히드- 및/또는 알칸-기초된 생물연료는 원하는 속성을 부여하기 위하여 하나 이상의 연료 첨가제와 혼합될 수 있다.
본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄-기초된 생물연료는 다른 연료, 예를 들면, 다양한 알코올, 예를 들면, 에탄올과 부탄올, 그리고 석유-유래된 산물, 예를 들면, 가솔린, 디젤, 또는 제트 연료와 혼합될 수 있다.
일부 실례에서, 혼합물은 중량으로 적어도 대략 10%, 15%, 20%, 30%, 40%, 50%, 또는 60%의 알데히드, 지방 알코올, 알칸, 또는 알켄을 포함할 수 있다. 다른 실례에서, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개 탄소 길이의 탄소 사슬을 갖는 적어도 대략 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 알데히드, 지방 알코올, 알칸, 또는 알켄을 포함하는 생물연료 조성물이 만들어질 수 있다. 이런 생물연료 조성물은 운점을 대략 5℃ 이하, 또는 0℃로 저하시킬 수 있는 운점 저하 첨가제; 계면활성제; 마이크로에멀젼; 트리글리세리드 (triglyceride)로부터 적어도 대략 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 또는 95% 디젤 연료; 석유-유래된 가솔린; 또는 석유로부터 디젤 연료에서 선택되는 적어도 하나의 첨가제를 부가적으로 포함할 수 있다.
도면의 간단한 설명
도 1A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 1B는 도 1A의 7.55 min에서 피크의 질량 분열 패턴 (mass fragmentation pattern)이다.
도 2A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 2B는 도 2A의 8.73 min에서 피크의 질량 분열 패턴이다.
도 3A는 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC29082 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 3B는 도 3A의 8.72 min에서 피크의 질량 분열 패턴이다.
도 4A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 4B는 도 4A의 7.36 min에서 피크의 질량 분열 패턴이다.
도 5A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 5B는 sll0208과 sll0209 유전자가 결실된 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 6A는 대장균 (E. coli) MG1655 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 6B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 7은 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (YP_001802846) (SEQ ID NO:69)을 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 8A는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)를 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 8B에서는 도 8A의 6.98 min에서 피크 및 펜타데칸의 질량 분열 패턴을 도시한다. 도 8C에서는 도 8A의 8.12 min에서 피크 및 8-헵타데센의 질량 분열 패턴을 도시한다.
도 9는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 10은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 11은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323) (SEQ ID NO:7)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 12는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:46)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 13은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus ) BP-1 tll1313 (NP_682103) (SEQ ID NO:47)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 14는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415 (YP_473897) (SEQ ID NO:48)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 15는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 gll3146 (NP_926092) (SEQ ID NO:15)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 16은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:49)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 17은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 18은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO:51)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 19는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (ZP_01079772) (SEQ ID NO:52)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 20은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (ZP_01080370) (SEQ ID NO:53)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 21은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) ATCC51142 cce_0778 (YP_001802195) (SEQ ID NO:27)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 22는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_0398 (YP_002481151) (SEQ ID NO:29)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 23은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_2986 (YP_002483683) (SEQ ID NO:31)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 24A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 24B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 25A는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 25B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:9)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 26A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67)를 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 26B는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 27A는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 27B는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 △fadD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 28은 단독으로, 또는 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (SEQ ID NO:7), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (SEQ ID NO:5), 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532 (SEQ ID NO:19), 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146 (SEQ ID NO:15), 시네초코쿠스 종 (Synechococcus sp .) RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917_12945 (SEQ ID NO:25), 또는 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041 (SEQ ID NO:9)과의 조합으로, 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 그래프를 도시한다.
도 29A는 클래스 I 리보뉴클레아제 환원효소 아단위 β 단백질, RNRβ의 3-차원 구조를 도시한다. 도 29B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 3-차원 구조를 도시한다. 도 29C는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 활성 부위의 3-차원 구조를 도시한다.
도 30A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30B는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y123F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30C는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y126F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 31은 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6) 및 옥타데카날 (A); Npun02004178 (ZP_00108838) (SEQ ID NO:6), 옥타데카날, 시금치 페레독신 환원효소, 그리고 NADPH (B); 옥타데카날, 시금치 페레독신, 시금치 페레독신 환원효소, 그리고 NADPH (C); 또는 Npun02004178 (ZP_00108838) (SEQ ID NO:6), 시금치 페레독신, 그리고 시금치 페레독신 (D)을 이용하여 시험관내에서 생산된 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 32는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6), NADPH, 옥타데카날, 그리고 (A) 시금치 페레독신과 시금치 페레독신 환원효소; (B) 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02001001 (ZP_00111633) (SEQ ID NO:90); (C) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003530 (ZP_00109422) (SEQ ID NO:92); 또는 (D) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO:94)을 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 33A는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADH, 그리고 Mg2 +를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33B는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADPH, 그리고 Mg2 +를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33C는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66)과 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 34A는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 표지화되지 않은 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34B는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 S-(4-2H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34C는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 R-(4-2H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 35는 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 36은 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 37은 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (NP_489323) (SEQ ID NO:7) 및 노스탁 종 (Nostoc sp .) PCC7120 alr5284 (NP_489324) (SEQ ID NO:81)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 38은 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)의 동족체의 실례의 목록이다.
도 39는 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)의 동족체의 실례의 목록이다.
도 40은 특정한 기질의 생산을 증가시키기 위하여 발현되거나, 과다발현되거나, 또는 감약될 수 있는 다양한 유전자를 확인하는 표이다.
도 1A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 1B는 도 1A의 7.55 min에서 피크의 질량 분열 패턴 (mass fragmentation pattern)이다.
도 2A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 2B는 도 2A의 8.73 min에서 피크의 질량 분열 패턴이다.
도 3A는 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC29082 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 3B는 도 3A의 8.72 min에서 피크의 질량 분열 패턴이다.
도 4A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 4B는 도 4A의 7.36 min에서 피크의 질량 분열 패턴이다.
도 5A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 5B는 sll0208과 sll0209 유전자가 결실된 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 6A는 대장균 (E. coli) MG1655 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 6B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 7은 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (YP_001802846) (SEQ ID NO:69)을 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 8A는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)를 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 8B에서는 도 8A의 6.98 min에서 피크 및 펜타데칸의 질량 분열 패턴을 도시한다. 도 8C에서는 도 8A의 8.12 min에서 피크 및 8-헵타데센의 질량 분열 패턴을 도시한다.
도 9는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 10은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 11은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323) (SEQ ID NO:7)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 12는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:46)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 13은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus ) BP-1 tll1313 (NP_682103) (SEQ ID NO:47)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 14는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415 (YP_473897) (SEQ ID NO:48)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 15는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 gll3146 (NP_926092) (SEQ ID NO:15)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 16은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:49)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 17은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 18은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO:51)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 19는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (ZP_01079772) (SEQ ID NO:52)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 20은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (ZP_01080370) (SEQ ID NO:53)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 21은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) ATCC51142 cce_0778 (YP_001802195) (SEQ ID NO:27)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 22는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_0398 (YP_002481151) (SEQ ID NO:29)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 23은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_2986 (YP_002483683) (SEQ ID NO:31)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 24A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 24B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 25A는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 25B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:9)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 26A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67)를 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 26B는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 27A는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 27B는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 △fadD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 28은 단독으로, 또는 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (SEQ ID NO:7), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (SEQ ID NO:5), 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532 (SEQ ID NO:19), 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146 (SEQ ID NO:15), 시네초코쿠스 종 (Synechococcus sp .) RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917_12945 (SEQ ID NO:25), 또는 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041 (SEQ ID NO:9)과의 조합으로, 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P trc -' tesA 세포에 의해 생산된 탄화수소의 그래프를 도시한다.
도 29A는 클래스 I 리보뉴클레아제 환원효소 아단위 β 단백질, RNRβ의 3-차원 구조를 도시한다. 도 29B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 3-차원 구조를 도시한다. 도 29C는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 활성 부위의 3-차원 구조를 도시한다.
도 30A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30B는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y123F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30C는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y126F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 31은 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6) 및 옥타데카날 (A); Npun02004178 (ZP_00108838) (SEQ ID NO:6), 옥타데카날, 시금치 페레독신 환원효소, 그리고 NADPH (B); 옥타데카날, 시금치 페레독신, 시금치 페레독신 환원효소, 그리고 NADPH (C); 또는 Npun02004178 (ZP_00108838) (SEQ ID NO:6), 시금치 페레독신, 그리고 시금치 페레독신 (D)을 이용하여 시험관내에서 생산된 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 32는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6), NADPH, 옥타데카날, 그리고 (A) 시금치 페레독신과 시금치 페레독신 환원효소; (B) 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02001001 (ZP_00111633) (SEQ ID NO:90); (C) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003530 (ZP_00109422) (SEQ ID NO:92); 또는 (D) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO:94)을 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 33A는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADH, 그리고 Mg2 +를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33B는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADPH, 그리고 Mg2 +를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33C는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66)과 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 34A는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 표지화되지 않은 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34B는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 S-(4-2H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34C는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 R-(4-2H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 35는 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 36은 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 37은 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (NP_489323) (SEQ ID NO:7) 및 노스탁 종 (Nostoc sp .) PCC7120 alr5284 (NP_489324) (SEQ ID NO:81)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 38은 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)의 동족체의 실례의 목록이다.
도 39는 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)의 동족체의 실례의 목록이다.
도 40은 특정한 기질의 생산을 증가시키기 위하여 발현되거나, 과다발현되거나, 또는 감약될 수 있는 다양한 유전자를 확인하는 표이다.
실시예
본 발명은 아래의 실시예에서 더욱 상술되고, 이들 실시예는 특허청구범위에서 기술된 본 발명의 범위를 결코 제한하지 않는다.
실시예
1. 선택된 남조류에서
알칸
생합성의 검출과 검증
전체 게놈 서열이 공개된 7가지 남조류가 알칸 생합성의 검증 및/또는 검출을 위하여 선택되었다: 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301, 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413, 시네코시스티스 종 (Synechocystis sp .) PCC6803, 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102, 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC 29082, 그리고 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986. 상기 목록으로부터 첫 3가지 남조류 균주만 알칸을 보유하는 것으로 이전에 보고되었다 (Han et al., J. Am . Chem . Soc . 91:5156-5159 (1969); Fehler et al., Biochem. 9:418-422 (1970). 이들 균주는 3-7일 동안 30℃에서 대략 3,500 lux의 광도 (light intensity)에서, 교반 플라스크 내에 100 ㎖의 적절한 배지 (표 8에 열거됨)에서 광독립영양으로 성장되었다. 세포는 알칸 검출을 위하여 아래와 같이 추출되었다: 1 ㎖ 배양 용적으로부터 세포는 13,000 rpm에서 1분 동안 원심분리되고, 그리고 세포 펠릿은 메탄올에서 재현탁되고, 1분 동안 와동되고, 그 이후에 30분 동안 초음파처리되었다. 13,000 rpm에서 3분 동안 원심분리후, 상층액은 새로운 바이알로 이전되고 GC-MS에 의해 분석되었다. 샘플은 아래의 방법을 이용하여, 30 m DP-5 모세관 칼럼 (0.25 mm 내부 직경) 또는 30 m 고온 DP-5 모세관 칼럼 (0.25 mm 내부 직경)에서 분석되었다.
GC/MS 칼럼 내로 1 ㎕ 분할없는 주입 (입구 온도 300℃에 유지) 이후, 오븐은 100℃에 3분 동안 유지되었다. 온도는 20℃/min의 비율로 320℃까지 상승되었다. 오븐은 추가로 5분 동안 320℃에 유지되었다. 운반 가스 헬륨의 유속 (flow rate)은 1.3 ㎖/min이었다. MS 사중극 (quadrapole)은 50 내지 550 m/z 주사하였다. 산물 피크의 체류 시간 (Retention time)과 분열 패턴은 피크 동일성을 확인하기 위하여 인증된 참고 (authentic reference)와 비교되었다.
7가지 균주 중에서, 6가지는 헵타데칸을 주로 생산하고, 1가지는 펜타데칸 (프로클로로코쿠스 마리누스 (P. marinus) CCMP1986)을 생산하였다; 이들 균주 중에서 하나는 헵타데칸 이외에 메틸-헵타데칸을 생산하였다 (아나베나 바리아빌리스 (A. variabilis) ATCC29413) (표 8 참조). 이런 이유로, 이전에 보고된 3가지 남조류에서 알칸 생합성이 확인되었고, 그리고 알칸 생합성이 알칸을 생산하는 것으로 이전에 알려지지 않았던 4가지 남조류에서 검출되었다: 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 (도 1 참조), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 (도 2 참조), 글로에오박터 비올라세우스 (G. violaceus) ATCC 29082 (도 3 참조), 그리고 시네코시스티스 종 (Synechocystis sp.) PCC6803 (도 4 참조).
도 1A에서는 메탄올로 추출된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 세포의 GC/MS 추적을 도시한다. 7.55 min에서 피크는 펜타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 1B에서, 펜타데칸 피크의 질량 분열 패턴이 도시된다. 212 피크는 펜타데칸의 분자량에 상응한다.
도 2A에서는 메탄올로 추출된 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 세포의 GC/MS 추적을 도시한다. 8.73 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 2B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.
도 3A에서는 메탄올로 추출된 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC29082 세포의 GC/MS 추적을 도시한다. 8.72 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 3B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.
도 4A에서는 메탄올로 추출된 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포의 GC/MS 추적을 도시한다. 7.36 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 4B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.
남조류 | ATCC# | 게놈 | 배지 | 알칸 | |
보고됨 | 확인됨2 | ||||
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 |
27144 | 2.7 Mb | BG-11 | C17:0 | C17 :0, C15:0 |
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301 |
33912 | 2.7 Mb | BG-11 | C17:0 | C17 :0, C15:0 |
아나베나 바리아빌리스 (Anabaena variabilis) |
29413 | 6.4 Mb | BG-11 | C17:0, 7- 또는 8-Me-C17:0 | C17 :0, Me-C17:0 |
시네초코쿠스 종 (Synechococcus sp .) PCC6803 |
27184 | 3.5 Mb | BG-11 | - | C17 :0, C15:0 |
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP19861 |
- | 1.7 Mb | - | - | C15 :0 |
노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 |
29133 | 9.0 Mb | ATCC819 | - | C17 :0 |
글로에오박터 비올라세우스 (Gloeobacter violaceus) |
29082 | 4.6 Mb | BG11 | - | C17 :0 |
1. 추출을 위한 세포는 Jacob Waldbauer (NIT)로부터 선물받았다.
2. 주요 탄소는 굵게 표시된다.
게놈 분석에서, 이들 알칸-생산 균주 내에 존재하는 2가지 유전자가 산출되었다. 이들 유전자의 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 동족체는 표 9에 제시되고 Synpcc7942_1593 (SEQ ID NO:1)과 Synpcc7942_1594 (SEQ ID NO:65)이다.
유전자 대상 ID |
좌위 태그 |
Genbank 수탁 | 유전자 명칭 |
길이 | COG | Pfam | Interpro | 비고 |
637800026 | Synpcc 7942_1593 | YP-400610 | 가상 단백질 |
231 aa | - | pfam02915 | IPR009078 IPR003251 |
페리틴/리보뉴클레오티드 환원효소-유사 루브레리트린 |
637800027 | Synpcc 7942_1594 | YP-400611 | 가상 단백질 |
341 aa | COG5322 | pfam00106 | IPR000408 IPR016040 IPR002198 | 예측된 탈수소효소 NAD(P)-결합 짧은 사슬 탈수소효소 |
실시예
2.
시네코시스티스
종 (
Synechocystis
sp
.
)
PCC6803
에서
sll0208
과
sll0209
유전자의 결실은
알칸
생합성의 상실로 이어진다
시네코시스티스 종 (Synechocystis sp .) PCC6803의 추정 탈카르보닐효소 (sll0208; NP_442147)를 인코딩하는 유전자 (SEQ ID NO:3) 및 알데히드-산출 효소 (sll0209; NP_442146)를 인코딩하는 유전자 (SEQ ID NO:67)는 아래와 같이 결실되었다. 대략 1 kb의 상류와 하류 측면 DNA는 각각, 프라이머 sll0208/9-KO2 (CACGCACCTAGGTTCACACTCCCATGGTATAACAGGGGCGTTGGACTCCTGTG)와 함께 프라이머 sll0208/9-KO1 (CGCGGATCCCTTGATTCTACTGCGGCGAGT) 및 프라이머 sll0208/9-KO4 (CGCGGATCCAACGCATCCTCACTAGTCGGG)와 함께 프라이머 sll0208/9-KO3 (GTTATACCATGGGAGTGTGAACCTAGGTGCGTGGCCGACAGGATAGGG-CGTGT)을 이용하여 증폭되었다. PCR 산물은 대략 2 kb sll0208/sll0209 결실 카세트를 증폭하기 위하여 프라이머 sll0208/9-KO1과 sll0208/9-KO4를 이용한 크로스-오버 (cross-over) PCR에 이용되고, 상기 카세트는 클로닝 벡터 pUC19의 BamHI 부위 내로 클로닝되었다. 이후, 카나마이신 내성 카세트 (aph, KanR)는 프라이머 Kan-aph-F (CATGCCATGGAAAGCCACGTTGTGTCTCAAAATCTCTG)와 Kan-aph-R (CTAGTCTAGAGCGCTGAGGTCTGCCTCGTGAA)을 이용하여 플라스미드 pRL27 (Larsen et al., Arch . Microbiol . 178:193 (2002)로부터 증폭되고, 이는 NcoI와 XbaI로 절단되고 sll0208/sll0209 결실 카세트의 NcoI와 AvrII 부위 내로 클로닝되고, pUC19 내에 sll0208/sll0209-결실 KanR-삽입 카세트를 산출하였다. 남조류에서 복제하지 않는 상기 카세트-포함 벡터는 시네코시스티스 종 (Synechocystis sp.) PCC6803 (Zang et al., 2007, J. Microbiol., vol. 45, pp. 241) 내로 형질전환되고, 그리고 형질전환체 (가령, 이중-상동성 재조합 (double-homologous recombination)에 의한 염색체 통합체 (chromosomal integrant))는 광-구비된 배양기 내에 30℃에서, 100 ㎍/㎖ 카나마이신을 내포하는 BG-11 아가 평판에서 선택되었다. 카나마이신 내성 콜로니는 1회 개주 (restreaking)되고, 그 이후 진단 프라이머로 PCR을 이용한 유전형 분석 (genotypic 분석)에 종속되었다.
확증된 결실-삽입 돌연변이체는 4일 동안 광-구비된 교반-배양기 내에 30℃에서, 50 ㎍/㎖ 카나마이신을 포함하는 12 ㎖의 BG11 배지에서 배양되었다. 이후, 1 ㎖의 액체 배지는 원심분리되고 (13,000 g에서 1분), 그리고 세포 펠릿은 0.1 ㎖ 메탄올로 추출되었다. 추출후, 샘플은 다시 원심분리되고, 그리고 상층액은 실시예 1에 기술된 바와 같은 GC-MS 분석에 종속되었다.
도 5에 도시된 바와 같이, sll0208과 sll0209 유전자가 결실된 시네코시스티스 종 (Synechocystis sp .) PCC6803 균주는 헵타데센과 옥타데세날을 생산하는 능력을 상실하였다. 이러한 결과는 시네코시스티스 종 (Synechocystis sp.) PCC6803에서 sll0208과 sll0209 유전자, 그리고 기타 남조류 (표 1 참조)에서 오르토로거스 (orthologous) 유전자가 이들 생물체에서 알칸과 지방 알데히드 생합성을 담당한다는 것을 증명한다.
실시예
3.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594의 이질성 발현을 통한 대장균 (
E.
coli
) 지방 알데히드와 지방
알코올의 의
생산
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 추정 알데히드-산출 효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체 ("OP80-PCC7942_1594")는 대장균 (E. coli) MG1655 내로 형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 1% (w/v) 글루코오스를 포함하고 100 ㎍/㎖ 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 배양액이 0.8-1.0의 OD600에 도달하면, 이는 1mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 18-20시간 동안 성장되었다. 0.5 ㎖의 배양액으로부터 세포는 0.5 ㎖의 에틸 아세테이트로 추출되었다. 60분 동안 초음파처리후, 샘플은 15,000 rpm에서 5분 동안 원심분리되었다. 용매 층은 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 6에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 -보유 벡터로 형질전환된 대장균 (E. coli) 세포는 아래의 지방 알데히드와 지방 알코올을 생산하였다: 헥사데카날, 옥타데세날, 테트라데세놀, 헥사데세놀, 헥사데카놀과 옥타데세놀. 이러한 결과는 PCC7942 orf1594가 (i) 생체내에서 탈카르보닐화 (decarbonylation)를 위한 가능 기질로서 알데히드를 생산하고, 그리고 (ii) 야생형 대장균 (E. coli) 세포에서 활성화된 지방산의 가장 풍부한 형태인 아실-ACP를 기질로서 환원시킬 수 있다는 것을 지시한다. 이런 이유로, 상기 효소는 아실-ACP 환원효소로 명명되었다. 생체내에서, 이들 지방 알데히드는 내생적 대장균 (E. coli) 알데히드 환원효소 활성에 의해 상응하는 지방 알코올로 명백하게 더욱 환원된다.
실시예
4.
시아노테세
종 (
Cyanothece
sp
.
)
ATCC51142
cce_1430의 이질성 발현을 통한 대장균 (
E.
coli
)에서 지방 알데히드와 지방 알코올의 생산
시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (YP_001802846; 추정 알데히드-산출 효소)을 인코딩하는 게놈 DNA (SEQ ID NO:69)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝된다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 1% (w/v) 글루코오스를 포함하고 100 ㎍/㎖ 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같이 GC-MS에 의해 분석되었다.
도 7에 도시된 바와 같이, 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 -보유 벡터로 형질전환된 대장균 (E. coli) 세포는 아래의 지방 알데히드와 지방 알코올을 생산하였다: 헥사데카날, 옥타데세날, 테트라데세놀, 헥사데세놀, 헥사데카놀과 옥타데세놀. 이러한 결과는 ATCC51142 cce_1430이 (i) 생체내에서 탈카르보닐화를 위한 가능 기질로서 알데히드를 생산하고, 그리고 (ii) 야생형 대장균 (E. coli) 세포에서 활성화된 지방산의 가장 풍부한 형태인 아실-ACP를 기질로서 환원시킬 수 있다는 것을 지시한다. 이러한 이유로, 상기 효소 역시 아실-ACP 환원효소이다.
실시예
5.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594 및
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1593의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1593 (YP_400610; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:1)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝된다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 8에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1593-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PCC7942_1593이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
6.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
노스탁
펑크티포르메
(
Nostoc
punctiforme
)
PCC73102
Npun02004178
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 9에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
7.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시네코시스티스
종 (
Synechocystis
sp
.
)
PCC6803
sll0208
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:3)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 10에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
8.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
노스탁
종 (
Nostoc
sp
.
)
PCC7210
alr5283
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:7)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 11에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 노스탁 종 (Nostoc sp .) PCC7210 alr5283-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 alr5283이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
9.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
아칼요클로리스
마리나 (
Acaryochloris
marina
)
MBIC11017
AM1
_4041의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:9)는 대장균 (E. coli) (SEQ ID NO:46)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 12에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 AM1_4041이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
10.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
써모시네초코쿠스
이롱가투스
(
Thermosynechococcus
elongatus
)
BP
-1 tll1313의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1 tll1313 (NP_682103; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:11)는 대장균 (E. coli) (SEQ ID NO:47)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 13에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 써모시네초코쿠스 이롱가투스 (T. elongatus) BP-1 tll1313-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 tll1313이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
11.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시네초코쿠스
종 (
Synechococcus
sp
.
)
JA
-3-3
Ab
CYA
_0415의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415 (YP_473897; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:13)는 대장균 (E. coli) (SEQ ID NO:48)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 14에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
12.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
글로에오박터
비올라세우스
(
Gloeobacter
violaceus
)
PCC7421
gll3146의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 gll3146 (NP_926092; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:15)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 15에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 gll3146이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
13.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
프로클로로코쿠스
마리누스
(
Prochlorococcus
marinus
)
MIT9313
PMT1231의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:17)는 대장균 (E. coli) (SEQ ID NO:49)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 16에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus ) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) MIT9313 PMT1231-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMT1231이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
14.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
프로클로로코쿠스
마리누스
(
Prochlorococcus
marinus
)
CCMP1986
PMM0532의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:19)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 17에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus ) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMM0532가 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
15.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
프로클로로코쿠스
마리누스
(
Prochlorococcus
marinus
)
NATL2A
PMN2A_1863의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) NATL2A PMN2A_1863 (YP_293054; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:21)는 대장균 (E. coli) (SEQ ID NO:51)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 18에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) NATL2A PMN2A_1863-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMN2A_1863이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
16.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시네초코쿠스
종 (
Syne
chococcus
sp
.)
RS9917
RS9917
_09941의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (ZP_01079772; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:23)는 대장균 (E. coli) (SEQ ID NO:52)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 벡터 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 19에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 RS9917_09941이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
17.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시네초코쿠스
종 (
Synechococcus
sp
.
)
RS9917
RS9917
_12945의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (ZP_01080370; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:25)는 대장균 (E. coli) (SEQ ID NO:53)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 20에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp.) RS9917 RS9917_12945-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 RS9917_12945가 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
18.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시아노테세
종 (
Cyanothece
sp
.
)
ATCC51142
cce_0778의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 (YP_001802195; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:27)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 21에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 -보유 벡터 로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 ATCC51142 cce_0778이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
19.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시아노테세
종 (
Cyanothece
sp
.
)
PCC7425
Cyan7425
_0398의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_0398 (YP_002481151; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:29)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 22에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_0398 -보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Cyan7425_0398이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
20.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
시아노테세
종 (
Cyanothece
sp
.
)
PCC7425
Cyan7425
_2986의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_2986 (YP_002483683; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:31)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되어다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 23에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_2986-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Cyan7425_2986이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.
실시예
21.
프로클로로코쿠스
마리누스
(
Prochlorococcus
marinus
)
CCMP1986
PMM0533
과
프로클로로코쿠스
마리누스
(
Prochlorococcus
marinus
) CCMP1986
PMM0532
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0533 (NP_892651; 추정 알데히드-산출 효소)을 인코딩하는 게놈 DNA (SEQ ID NO:71) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:19)는 증폭되고 각각, 벡터 OP-80의 NcoI와 EcoRI 부위, 그리고 벡터 OP-183의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 개별적으로 형질전환되고 대장균 (E. coli) MG1655 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 24A에 도시된 바와 같이, 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0533-보유 벡터 단독으로 형질전환된 대장균 (E. coli) 세포는 지방 알데히드 또는 지방 알코올을 생산하지 못하였다. 하지만, PMM0533과 PMM0532-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 헥사데카놀, 펜타데칸과 헵타데센을 생산하였다 (도 24B). 이러한 결과는 PMM0533이 탈카르보닐효소, 예를 들면, PMM0532와 상호작용할 때에만 탈카르보닐화 반응을 위한 지방 알데히드 기질을 제공한다는 것을 지시한다.
실시예
22.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
아칼요클로리스
마리나 (
Acaryochloris
marina
)
MBIC11017
AM1
_4041의 이질성 발현을 통한 지방 아실-
CoA
-생산 대장균 (
E.
coli
) 균주에서
알칸과
알켄의 생산
아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:9)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 내로 OP80-PCC7942_1594와 공동-형질전환되었다. 상기 균주는 Ptrc 프로모터의 제어 하에, 대장균 (E. coli) 티오에스테라아제의 세포질 이형, 'TesA, 그리고 대장균 (E. coli) 아실-CoA 신세타아제, FadD를 발현하고, 이런 이유로 지방 아실-CoA를 생산한다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 25에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041로 공동-형질전환된 이들 대장균 (E. coli) 세포 역시 알칸과 지방 알코올을 생산하였다. 이러한 결과는 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594가 아실-CoA를 기질로서 이용하여 헥사데세날, 헥사데카날과 옥타데세날을 생산될 수 있고, 이들이 이후, 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041에 의해 각각, 펜타데센, 펜타데칸과 헵타데센으로 전환된다는 것을 지시한다.
실시예
23.
시네코시스티스
종 (
Synechocystis
sp
.
)
PCC6803
sll0209
와 시네코시스티스 종 (
Synechocystis
sp
.
)
PCC6803
sll0208
의 이질성 발현을 통한 지방 아실-
CoA
-생산 대장균
(E.
coli
) 균주에서
알칸과
알켄의
생산
시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:3)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:67)는 합성되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE lacZ::P trc 'tesA - fadD 내로 공동-형질전환되었다. 상기 균주는 Ptrc 프로모터의 제어 하에, 대장균 (E. coli) 티오에스테라아제의 세포질 이형, 'TesA, 그리고 대장균 (E. coli) 아실-CoA 신세타아제, FadD를 발현하고, 이런 이유로 지방 아실-CoA를 생산한다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 26에 도시된 바와 같이, 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209로 형질전환된 이들 대장균 (E. coli) 세포는 지방 알데히드 또는 지방 알코올을 생산하지 못하였다. 하지만, 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208과 sll0209로 공동-형질전환될 때, 이들은 알칸, 지방 알데히드와 지방 알코올을 생산하였다. 이러한 결과는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209가 지방 알데히드 탈카르보닐효소와 공동-발현될 때에만, 아실-CoA를 기질로서 이용하여 지방 알데히드, 예를 들면, 테트라데카날, 헥사데카날과 옥타데세날을 생산할 수 있음을 지시한다. 이들 지방 알데히드는 내생적 대장균 (E. coli) 알데히드 환원효소 활성에 의해 상응하는 지방 알코올, 테트라데카놀, 헥사데카놀과 옥타데세놀로 명백하게 더욱 환원된다. 상기 실험에서, 옥타데세날은 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208에 의해 헵타데센으로 전환되었다.
실시예
24.
노스탁
펑크티포르메
(
Nostoc
punctiforme
)
PCC73102
Npun02004178 및 이의 여러 동족체의 이질성 발현을 통한 지방 알데히드-생산 대장균 (
E.
coli
) 균주에서
알칸과
알켄의
생산
노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 마이코박테리움 스메그마티스 (Mycobacterium smegmatis) 균주 MC2 155 orf MSMEG_5739 (YP_889972, 추정 카르복실산 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:85)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-180 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 2가지 생성된 구조체는 대장균 (E. coli) MG1655 △fadD lacZ::P trc -'tesA 내로 공동-형질전환되었다. 상기 균주에서, 지방 알데히드는 MSMEG_5739에 의해 제공되었는데, 이는 유리 지방산 ('TesA의 작용에 의해 형성됨)을 지방 알데히드로 환원시킨다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 27에 도시된 바와 같이, 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178과 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739-보유 벡터로 공동-형질전환된 이들 대장균 (E. coli) 세포는 트리데칸, 펜타데센과 펜타데칸을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 카르복실산 환원효소 MSMEG_5739에 의해 제공된 테트라데카날, 헥사데세날과 헥사데카날을 트리데칸, 펜타데센과 펜타데칸으로 전환시킨다는 것을 제시한다. 도 28에 도시된 바와 같이, 동일한 실험 설정에서, 대장균 (E. coli) MG1655 △fadD lacZ :: P trc -' tesA: 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (SEQ ID NO:7), 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532 (SEQ ID NO:19), 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146 (SEQ ID NO:15), 시네초코쿠스 종 (Synechococcus sp .) RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917_12945 (SEQ ID NO:25), 그리고 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041 (SEQ ID NO:9)에서 발현될 때, 아래의 지방 알데히드 탈카르보닐효소 역시 MSMEG_5739에 의해 제공된 지방 알데히드를 상응하는 알칸으로 전환시켰다.
실시예
25: 남조류 지방 알데히드
탈카르보닐효소는
비-헴
이철
(
non
-heme
Diiron
) 단백질의 종류에 속한다.
노스탁
펑크티포르메
(
Nostoc
punctiforme
)
PCC73102
Npun02004178
에서 보존된 히스티딘의 페닐알라닌으로의 특정부위 돌연변이유발은 이의 촉매 기능을 소멸시키지 않는다
실시예 13에서 논의된 바와 같이, 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313로부터 가상적 단백질 PMT1231 (SEQ ID NO:18)은 활성 지방 알데히드 탈카르보닐효소이다. 1.8 Å 해상도 (pdb2OC5A)에서 가능한, PMT1231의 3-차원 구조 (도 29B 참조)에 기초하여, 남조류 지방 알데히드 탈카르보닐효소는 비-헴 이철 단백질, 특히 클래스 I 리보뉴클레아제 환원효소 아단위 β 단백질, RNRβ과 구조적 유사성을 갖는다 (Stubbe and Riggs-Gelasco, TIBS 1998, vol. 23., pp. 438) (도 29A 참조). 클래스 Ia와 Ib RNRβ는 RNRα의 촉매 활성 (리보뉴클레오티드의 디옥시리보뉴클레오티드로의 환원)을 매개하는 이철 티로실 라디칼 (diferric tyrosyl radical)을 보유한다. 대장균 (E. coli) RNRβ에서, 상기 티로신은 122번 위치에 존재하고 활성 부위의 철 분자 중에서 하나에 가까이 근접한다. 구조 배열은 PMT1231이 RNRb tyr122와 동일한 위치에서 페닐알라닌을 보유한다는 것을 보여주는데, 이는 남조류 지방 알데히드 탈카르보닐효소에 대한 상이한 촉매 기전을 암시하였다. 하지만, 모든 탈카르보닐효소의 배열은 2개의 티로신 잔기, PMT1231에 대하여 tyr135와 tyr138이 모든 서열에서 완전하게 보존되고, tyr135가 활성 부위 철 분자 중에서 하나에 가깝게 근접 (5.5 Å)한다는 것을 보였다 (도 29C 참조). 이들 2개의 보존된 티로신 잔기 중에서 어느 쪽이 남조류 지방 알데히드 탈카르보닐효소의 촉매 기전에 관여하는 지를 조사하기 위하여, 이들 잔기는 아래와 같이, Npun02004178 (tyr123과 tyr126)에서 페닐알라닌으로 대체되었다.
시네초코쿠스 이롱가투스 (S. elongatus) PCC7942 ORF1594를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178을 인코딩하는 게놈 DNA (SEQ ID NO:5) 역시 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC177 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 후자 구조체는 탈카르보닐효소 단백질의 123과 126번 위치에서 돌연변이를 도입하기 위한 주형으로서 이용되었는데, 이들 티로신은 각각, 프라이머 gttttgcgatcgcagcatttaacatttacatccccgttgccgacg와 gttttgcgatcgcagcatataacattttcatccccgttgccgacg를 이용하여 페닐알라닌으로 치환되었다. 생성된 구조체는 이후, 대장균 (E. coli) MG1655 내로 형질전환되었다. 이들 세포는 37℃에서 1% 글루코오스 (w/v), 그리고 100 ㎍/㎖ 카르베니실린과 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되었다.
도 30에 도시된 바와 같이, 이들 2가지 Npun02004178 Tyr → Phe 단백질 변이체는 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942 ORF1594와 공동-발현될 때 활성이고 알칸을 생산하였다. 이러한 결과는 클래스 Ia와 Ib RNRβ 단백질에 대조적으로, 지방 알데히드 탈카르보닐효소의 촉매 기전이 티로실 라디칼을 수반하지 않는다는 것을 지시한다.
실시예
26:
노스탁
펑크티포르메
(
Nostoc
punctiforme
)
PCC73102
Npun02004178의 생화학적 특성화
노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 T7 프로모터의 제어 하에 벡터 pET-15b의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 Npun02004178 단백질은 N-말단 His-태그를 포함하였다. 대장균 (E. coli) BL21 균주 (DE3) (Invitrogen)는 일과적인 화학적 형질전환 기술에 의해 상기 플라스미드로 형질전환되었다. 단백질 발현은 100 ㎎/ℓ의 카르베니실린으로 보충되고 37℃에서 하룻밤동안 교반된 5 ㎖의 LB 배지에 상기 대장균 (E. coli) 균주의 콜로니를 최초 접종하여 접종용 균액 (starter culture)을 생산함으로써 수행되었다. 상기 접종용 균액은 100 ㎎/ℓ의 카르베니실린으로 보충된 0.5 ℓ의 LB 배지를 접종하는데 이용되었다. 배양액은 0.8의 OD600 값에 도달할 때까지 37℃에서 교반되고, 그 이후 1 mM의 최종 농도로 IPTG가 첨가되었다. 배양액은 이후, 37℃에서 대략 3시간 동안 추가로 교반되었다. 배양액은 이후, 3,700 rpm에서 20분 동안 4℃에서 원심분리되었다. 생성된 펠릿은 이후, Bacterial ProteaseArrest (GBiosciences)로 보충된 pH 7.2에서 100 mM 인산나트륨 완충액을 포함하는 10 ㎖의 완충액에서 재현탁되었다. 이들 세포는 이후, 1.5 s 초음파처리, 그 이후에 1.5 s 휴지로 9 s 동안 얼음 위에서 12 W로 초음파처리되었다. 이러한 절차는 각 초음파처리 주기 간에 1분 간격으로 5회 반복되었다. 세포 없는 추출물은 10,000 rpm에서 30분 동안 4℃에서 원심분리되었다. 5 ㎖의 Ni-NTA (Qiagen)가 상층액에 첨가되고, 그리고 생성된 혼합물은 4℃에서 부드럽게 교반되었다. 슬러리는 수지 (resin)를 용해질로부터 제거하는 칼럼에 통과되었다. 수지는 이후, pH 7.2에서 100 mM 인산나트륨 완충액 + 30 mM 이미다졸을 포함하는 30 ㎖의 완충액으로 세척되었다. 최종적으로, 단백질은 10 ㎖의 pH 7.2에서 100 mM 인산나트륨 완충액 + 250 mM 이미다졸로 용리되었다. 단백질 용액은 20% 글리세롤을 포함하는 200 볼륨 (volume)의 pH 7.2에서 100 mM 인산나트륨 완충액으로 투석되었다. 단백질 농도는 Bradford 분석 (Biorad)을 이용하여 측정되었다. 5.6 ㎎/㎖의 Npun02004178 단백질이 획득되었다.
탈카르보닐효소 반응을 위한 옥타데카날을 합성하기 위하여, 500 ㎎의 옥타데카놀 (Sigma)이 25 ㎖의 디클로로메탄에 용해되었다. 그 다음, 200 ㎎의 피리디늄 클로로크로메이트 (pyridinium chlorochromate) (TCI America)가 상기 용액에 첨가되고 하룻밤동안 교반되었다. 반응 혼합물은 디클로로메탄을 제거하기 위하여 진공 하에 건조되었다. 남아있는 산물은 헥산에 재현탁되고 Whatman 필터 페이터를 통해 여과되었다. 여과액은 이후, 진공하에 건조되고, 5 ㎖의 헥산에서 재현탁되고, 실리카 플래시 크로마토그래피 (silica flash chromatography)로 정제되었다. 혼합물은 헥산 내에서 중력 공급 (gravity fed) 칼럼 상에 적하되고, 그 이후 2 칼럼 용적 (column volume)의 헥산으로 세척되었다. 이후, 옥타데카날은 헥산과 에틸 아세테이트의 8:1 혼합물로 용리되었다. 옥타데카날을 포함하는 분획물은 모아지고 아래에 기술된 GC/MS 방법을 이용하여 분석되었다. 최종 산물은 이러한 방법에 의한 측정에서, 95% 순수하였다.
탈카르보닐화 활성에 대하여 Npun02004178 단백질을 시험하기 위하여, 아래의 효소 분석이 설정되었다. 200 ㎕ 반응물이 개별 최종 농도로 아래의 성분을 포함하는 pH 7.2에서 100 mM 인산나트륨 완충액에 설정되었다: 30 μM의 정제된 Npun02004178 단백질, 200 μM 옥타데카날, 0.11 ㎍/㎖ 시금치 페레독신 (Sigma), 0.05 단위/㎖ 시금치 페레독신 환원효소 (Sigma), 그리고 1 mM NADPH (Sigma). 음성 대조 (negative control)에는 Npun02004178이 없는 상기 반응물, 옥타데카날이 없는 상기 반응물, 그리고 시금치 페레독신, 페레독신 환원효소와 NADPH가 없는 상기 반응물이 포함되었다. 각 반응물은 100 ㎕ 에틸 아세테이트로 추출에 앞서 37℃에서 2시간 동안 배양되었다. 샘플은 아래의 파라미터를 이용한 GC/MS로 분석되었다: 동작 시간 (run time): 13.13 min; 칼럼: HP-5-MS Part No. 19091S-433E (30 미터의 길이; I.D.: 0.25 mm narrowbore; 필름: 0.25iM); 주입: 1 il Agilent 6850 입구; 입구: 300C 분할없음; 운반 가스: 헬륨; 유동: 1.3 ㎖/min; 오븐 온도: 5분 동안 75℃ 유지, 40℃/min으로 320℃, 2분 동안 320℃ 유지; 검출: Agilent 5975B VL MSD; 검출 온도: 330℃; 주사: 50-550 M/Z. 헵타데칸 (Sigma)이 화합물 체류 시간과 분열 패턴을 결정하기 위한 인증된 참고로서 이용되었다.
도 31에 도시된 바와 같이, 옥타데카날의 헵타데칸으로의 시험관내 전환 (in-vitro conversion)이 Npun02004178의 존재에서 관찰되었다. Npun02004178에 의한 옥타데카날의 효소적 탈카르보닐화는 시금치 페레독신 환원효소, 페레독신과 NADPH의 첨가에 의존하였다.
그 다음, 시험관내 지방 알데히드 탈카르보닐효소 분석에서 남조류 페레독신과 페레독신 환원효소가 시금치 단백질을 대체할 수 있는 지가 조사되었다. 아래의 4가지 유전자가 pET-15b의 NdeI와 XhoI 부위 내로 개별적으로 클로닝되었다: 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003626 (ZP_00109192, N-말단 알로피코시아닌 링커 도메인이 없는 페레독신 산화환원효소 petH) (SEQ ID NO:87), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02001001 (ZP_00111633, 페레독신 1) (SEQ ID NO:89), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003530 (ZP_00109422, 페레독신 2) (SEQ ID NO:91), 그리고 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003123 (ZP_00109501, 페레독신 3) (SEQ ID NO:93). 이들 4가지 단백질은 앞서 기술된 바와 같이 발현되고 정제되었다. 1 ㎎/㎖의 각 페레독신 및 4 ㎎/㎖의 페레독신 산화환원효소가 획득되었다. 3가지 남조류 페레독신은 아래와 같이 수정된 앞서 기술된 효소적 설정을 이용하여, 남조류 페레독신 산화환원효소로 조사되었다. 페레독신 환원효소의 최종 농도가 60 ㎍/㎖이고, 페레독신은 50 ㎍/㎖이었다. 추출된 효소적 반응물은 아래의 파라미터를 이용한 GC/MS로 분석되었다: 동작 시간: 6.33 min; 칼럼: J&W 122-5711 DB-5ht (15 미터의 길이; I.D.: 0.25 mm narrowbore; 필름: 0.10μM); 주입: 1 ㎕ Agilent 6850 입구; 입구: 300℃ 분할없음; 운반 가스: 헬륨; 유동: 1.3 ㎖/min; 오븐 온도: 5분 동안 100℃ 유지, 30℃/min으로 260℃, 0.5분 동안 260℃ 유지; 검출: Agilent 5975B VL MSD; 검출 온도: 230℃; 주사: 50-550 M/Z.
도 32에 도시된 바와 같이, 옥타데카날의 헵타데칸으로의 Npun02004178-의존성 시험관내 전환이 NADPH, 남조류 페레독신 산화환원효소, 그리고 3가지 남조류 페레독신 중에서 한 가지의 존재에서 관찰되었다.
실시예
27.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594의 생화학적 특성화
시네초코쿠스 이롱가투스 (S. elongatus) PCC7492 orf1594를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 T7 프로모터의 제어 하에 벡터 pET-28b의 NcoI와 XhoI 부위 내로 클로닝되었다. 생성된 PCC7942_orf1594 단백질은 C-말단 His-태그를 포함하였다. 대장균 (E. coli) BL21 균주 (DE3) (Invitrogen)는 상기 플라스미드로 형질전환되고, 그리고 PCC7942_orf1594 단백질은 실시예 22에 기술된 바와 같이 발현되고 정제되었다. 단백질 용액은 아래의 완충액에서 보관되었다: 50 mM 인산나트륨, pH 7.5, 100 mM NaCl, 1 mM THP, 10% 글리세롤. 단백질 농도는 Bradford 분석 (Biorad)을 이용하여 측정되었다. 2 ㎎/㎖의 PCC7942_orf1594 단백질이 획득되었다.
아실-ACP 또는 아실-CoA 환원효소 활성에 대하여 PCC7942_orf1594 단백질을 조사하기 위하여, 아래의 효소 분석이 설정되었다. 100 ㎕ 반응물은 개별 최종 농도로 아래의 성분을 포함하는 pH 7.5에서 50 mM Tris-HCl 완충액에서 설정되었다: 10 μM의 정제된 PCC7942_orf1594 단백질, 0.01-1 mM 아실-CoA 또는 아실-ACP, 2 mM MgCl2, 0.2-2 mM NADPH. 이들 반응물은 37℃에서 1시간 동안 배양되고 100 ㎕ 에틸 아세테이트 (내부 기준 (internal standard)으로서 5 ㎎/ℓ 1-옥타데센 포함)를 첨가함으로써 정지되었다. 샘플은 15분 동안 와동되고 상 분리 (phase separation)를 위하여 최대 속도로 3분 동안 원심분리되었다. 80 ㎕의 상부층 (top layer)은 GC 유리 바이알 내로 이전되고 실시예 26에 기술된 바와 같이 GC/MS로 분석되었다. 형성된 알데히드의 양은 내부 기준에 기초하여 계산되었다.
도 33에 도시된 바와 같이, PCC7942_orf1594는 옥타데카노일-CoA를 옥타데카날로 환원시킬 수 있었다. 환원효소 활성은 전자 공여자 (electron donor)로서 이가 양이온 (divalent cation), 예를 들면, Mg2 +, Mn2 + 또는 Fe2 +와 NADPH를 필요로 하였다. NADH는 환원효소 활성을 지지하지 못하였다. PCC7942_orf1594는 또한, 옥타데세노일-CoA와 옥타데세노일-ACP를 옥타데세날로 환원시킬 수 있었다. 2 mM NADPH의 존재에서 옥타데카노일-CoA, 옥타데세노일-CoA와 옥타데세노일-ACP의 환원에 대한 Km 값은 각각, 45 ± 20 μM, 82 ± 22 μM과 7.8 ± 2 μM로서 결정되었다. 이들 결과는 시험관내에서, PCC7942_orf1594가 아실-CoA와 아실-ACP 둘 모두를 환원시키고, 상기 효소가 아실-CoA에 비하여 아실-ACP에 대하여 명백하게 더욱 높은 친화성 (affinity)을 갖는다는 것을 증명한다. PCC7942_orf1594의 경우에 0.5 mM 옥타데카노일-CoA의 존재에서 NADPH에 대한 Km 값은 400 ± 80 μM로서 결정되었다.
그 다음, PCC7942_orf1594에 의해 촉매된, NADPH에서 지방 알데히드로 입체특이적 수소화물 이전 (stereospecific hydride transfer)이 조사되었다. 중수소 (deutero)-NADPH가 아래의 프로토콜에 따라 준비되었다. 5 ㎎의 NADP+와 3.6 ㎎의 D-글루코오스-1-d가 2.5 ㎖의 50 mM 인산나트륨 완충액 (pH 7.0)에 첨가되었다. 표지화된 NADPH의 효소적 생산은 R-(4-2H)NADPH 생산을 위하여 바실루스 메가테리움 (Bacillus megaterium) (USB Corporation)로부터, 또는 S-(4-2H)NADPH 생산을 위하여 테르모플라스마 아키도필룸(Thermoplasma acidophilum) (Sigma)로부터 5 단위의 글루코오스 탈수소효소의 첨가에 의해 개시되었다. 반응물은 37℃에서 15분 동안 배양되고, 10 KDa MWCO Amicon Ultra 원심분리 필터 (Millipore)를 이용하여 원심분리-여과되고, 드라이아이스에서 급속 동결되고, 그리고 -80℃에서 보관되었다.
시험관내 분석 반응물은 100 ㎕의 총 부피로, 50 mM Tris-HCl (pH 7.5), 10 μM의 정제된 PCC7942_orf1594 단백질, 1 mM 옥타데카노일-CoA, 2 mM MgCl2, 그리고 50 ㎕ 중수소-NADPH (앞서 기술된 바와 같이 준비됨)를 포함하였다. 1시간 배양후, 효소적 반응의 산물은 앞서 기술된 바와 같이 추출되고 분석되었다. GC/MS에 의해 검출된 결과의 지방 알데히드는 옥타데카날이었다 (도 34 참조). NADPH로부터 수소화물 이전이 입체특이적이기 때문에, R-(4-2H)NADPH와 S-(4-2H)NADPH 둘 모두 합성되었다. +1 단위 질량 (unit mass)을 갖는 옥타데카날은 S-(4-2H)NADPH를 단독으로 이용할 때 관찰되었다. 상기 지방 알데히드가 표지화되었다는 사실은 중수소화된 수소가 표지화된 NADPH에서 표지화된 지방 알데히드로 이전되었음을 지시한다. 이는 NADPH가 이러한 효소적 반응에 이용되고, PCC7942_orf1594에 의해 촉매된 수소화물 이전이 입체특이적이라는 것을 증명한다.
실시예
28.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594의 이질성 발현을 통한 대장균 (
E.
coli
)에서 지방 알데히드와 지방 알코올의
세포내와
세포외
생산
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che-9 최소 배지에서 성장되었다. 배양액은 0.8-1.0의 OD600에 도달될 때, 1mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 24-48 시간 동안 성장되었다. Che-9 최소 배지는 아래와 같이 정의된다: 6 g/ℓ Na2HPO4, 3 g/ℓ KH2PO4, 0.5 g/ℓ NaCl, 2 g/ℓ NH4Cl, 0.25 g/ℓ MgSO4 x 7 H2O, 11 ㎎/ℓ CaCl2 , 27 ㎎/ℓ Fe3Cl x 6 H2O, 2 ㎎/ℓ ZnCl x 4 H2O, 2 ㎎/ℓ Na2MoO4 x 2 H2O, 1.9 ㎎/ℓ CuSO4 x 5 H2O, 0.5 ㎎/ℓ H3BO3, 1 ㎎/ℓ 티아민, 200 mM Bis-Tris (pH 7.25), 그리고 0.1% (v/v) Triton-X100. 배양액은 1.0-1.2의 OD600에 도달될 때, 1 mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 40시간 동안 성장되었다. 0.5 ㎖의 배양액으로부터 세포는 실시예 26에 기술된 바와 같이 전체 탄화수소 생산을 위하여 0.5 ㎖의 에틸 아세테이트로 추출되었다. 부가적으로, 세포와 상층액은 원심분리 (RT에서 10분 동안 4,000 g)로 분리되고 별개로 추출되었다.
상기 배양액은 620 ㎎/ℓ 지방 알데히드 (테트라데카날, 헵타데세날, 헵타데카날과 옥타데세날) 및 1670 ㎎/ℓ 지방 알코올 (도데카놀, 테트라데세놀, 테트라데카놀, 헵타데세놀, 헵타데카놀과 옥타데세놀). 도 35에서는 추출된 상층액의 크로마토그램을 도시한다. 이들 지방 알데히드와 지방 알코올 중에서 73 %는 세포-없는 상층액에 존재하는 것으로 확인되었다.
실시예
29.
시네초코쿠스
이롱가투스
(
Synechococcus
elongatus
)
PCC7942
orf1594와
노스탁
펑크티포르메
(
Nostoc
punctiforme
)
PCC73102
Npun02004178
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
세포내와
세포외
생산
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che9 최소 배지에서 성장되었다. 이들 세포는 성장되고, 액체 배지로부터 분리되고, 추출되고, 그리고 실시예 28에서 기술된 바와 같이 분석되었다.
상기 배양액은 323 ㎎/ℓ 알칸과 알켄 (트리데칸, 펜타데센, 펜타데칸과 헵타데센), 367 ㎎/ℓ 지방 알데히드 (테트라데카날, 헵타데세날, 헵타데카날과 옥타데세날), 그리고 819 ㎎/ℓ 지방 알코올 (테트라데카놀, 헵타데세놀, 헵타데카놀과 옥타데세놀)을 생산하였다. 도 36에서는 추출된 상층액의 크로마토그램을 도시한다. 이들 알칸, 알켄, 지방 알데히드와 지방 알코올 중에서 86%는 세포-없는 상층액에 내에 존재하는 것으로 확인되었다.
실시예
30.
노스탁
종 (
Nostoc
sp
.
)
PCC7210
alr5284
와
노스탁
종 (
Nostoc
sp
.
)
PCC7210
alr5283
의 이질성 발현을 통한 대장균 (
E.
coli
)에서
알칸과
알켄의
생산
노스탁 종 (Nostoc sp .) PCC7210 alr5284 (NP_489324; 추정 알데히드-산출 효소)를 인코딩하는 게놈 DNA (SEQ ID NO:81)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:7)는 증폭되고 Ptrc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che9 최소 배지에서 성장되었다 (실시예 28에서 기술된 바와 같음). 0.5 ㎖의 배양액으로부터 세포는 실시예 3에서 기술된 바와 같이 추출되고 분석되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.
도 37에 도시된 바와 같이, 노스탁 종 (Nostoc sp .) PCC7210 alr5284와 노스탁 종 (Nostoc sp .) PCC7210 alr5283-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 트리데칸, 펜타데센, 펜타데칸, 테트라데카놀과 헥사데카놀을 생산하였다. 이러한 결과는 대장균 (E. coli)이 지방 알코올, 알칸과 알켄을 생산하기 위하여 노스탁 종 (Nostoc sp .) PCC7210 alr5284와 alr5283의 공동-발현이 충분하다는 것을 지시한다.
다른
구체예
본 발명이 상세한 설명과 관련하여 기술되긴 했지만, 상기 설명은 예시를 목적으로 하고 본 발명의 범위를 한정하지 않으며, 상기 범위는 첨부된 특허청구범위에 의해 정의되는 것으로 이해된다. 다른 측면, 이점, 그리고 변형은 아래의 특허청구범위에 속한다.
SEQUENCE LISTING
<110> LS9, Inc.
<120> METHODS AND COMPOSITIONS FOR PRODUCING HYDROCARBONS
<130> LS00020 PCT
<140> PCT/US2009/044409
<141> 2009-05-18
<150> 61/053,955
<151> 2008-05-16
<160> 100
<170> PatentIn version 3.5
<210> 1
<211> 696
<212> DNA
<213> Synechococcus elongatus
<400> 1
atgccgcagc ttgaagccag ccttgaactg gactttcaaa gcgagtccta caaagacgct 60
tacagccgca tcaacgcgat cgtgattgaa ggcgaacaag aggcgttcga caactacaat 120
cgccttgctg agatgctgcc cgaccagcgg gatgagcttc acaagctagc caagatggaa 180
cagcgccaca tgaaaggctt tatggcctgt ggcaaaaatc tctccgtcac tcctgacatg 240
ggttttgccc agaaattttt cgagcgcttg cacgagaact tcaaagcggc ggctgcggaa 300
ggcaaggtcg tcacctgcct actgattcaa tcgctaatca tcgagtgctt tgcgatcgcg 360
gcttacaaca tctacatccc agtggcggat gcttttgccc gcaaaatcac ggagggggtc 420
gtgcgcgacg aatacctgca ccgcaacttc ggtgaagagt ggctgaaggc gaattttgat 480
gcttccaaag ccgaactgga agaagccaat cgtcagaacc tgcccttggt ttggctaatg 540
ctcaacgaag tggccgatga tgctcgcgaa ctcgggatgg agcgtgagtc gctcgtcgag 600
gactttatga ttgcctacgg tgaagctctg gaaaacatcg gcttcacaac gcgcgaaatc 660
atgcgtatgt ccgcctatgg ccttgcggcc gtttga 696
<210> 2
<211> 231
<212> PRT
<213> Synechococcus elongatus
<400> 2
Met Pro Gln Leu Glu Ala Ser Leu Glu Leu Asp Phe Gln Ser Glu Ser
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Phe Asp Asn Tyr Asn Arg Leu Ala Glu Met Leu Pro Asp
35 40 45
Gln Arg Asp Glu Leu His Lys Leu Ala Lys Met Glu Gln Arg His Met
50 55 60
Lys Gly Phe Met Ala Cys Gly Lys Asn Leu Ser Val Thr Pro Asp Met
65 70 75 80
Gly Phe Ala Gln Lys Phe Phe Glu Arg Leu His Glu Asn Phe Lys Ala
85 90 95
Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Ala Phe Ala Arg Lys Ile Thr Glu Gly Val Val Arg Asp Glu
130 135 140
Tyr Leu His Arg Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp
145 150 155 160
Ala Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg Gln Asn Leu Pro Leu
165 170 175
Val Trp Leu Met Leu Asn Glu Val Ala Asp Asp Ala Arg Glu Leu Gly
180 185 190
Met Glu Arg Glu Ser Leu Val Glu Asp Phe Met Ile Ala Tyr Gly Glu
195 200 205
Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Ala Ala Val
225 230
<210> 3
<211> 696
<212> DNA
<213> Synechocystis sp.
<400> 3
atgcccgagc ttgctgtccg caccgaattt gactattcca gcgaaattta caaagacgcc 60
tatagccgca tcaacgccat tgtcattgaa ggcgaacagg aagcctacag caactacctc 120
cagatggcgg aactcttgcc ggaagacaaa gaagagttga cccgcttggc caaaatggaa 180
aaccgccata aaaaaggttt ccaagcctgt ggcaacaacc tccaagtgaa ccctgatatg 240
ccctatgccc aggaattttt cgccggtctc catggcaatt tccagcacgc ttttagcgaa 300
gggaaagttg ttacctgttt attgatccag gctttgatta tcgaagcttt tgcgatcgcc 360
gcctataaca tatatatccc tgtggcggac gactttgctc ggaaaatcac tgagggcgta 420
gtcaaggacg aatacaccca cctcaactac ggggaagaat ggctaaaggc caactttgcc 480
accgctaagg aagaactgga gcaggccaac aaagaaaacc tacccttagt gtggaaaatg 540
ctcaaccaag tgcaggggga cgccaaggta ttgggcatgg aaaaagaagc cctagtggaa 600
gattttatga tcagctacgg cgaagccctc agtaacatcg gcttcagcac cagggaaatt 660
atgcgtatgt cttcctacgg tttggccgga gtctag 696
<210> 4
<211> 231
<212> PRT
<213> Synechocystis sp.
<400> 4
Met Pro Glu Leu Ala Val Arg Thr Glu Phe Asp Tyr Ser Ser Glu Ile
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Ser Asn Tyr Leu Gln Met Ala Glu Leu Leu Pro Glu
35 40 45
Asp Lys Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Asn Arg His Lys
50 55 60
Lys Gly Phe Gln Ala Cys Gly Asn Asn Leu Gln Val Asn Pro Asp Met
65 70 75 80
Pro Tyr Ala Gln Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln His
85 90 95
Ala Phe Ser Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu
100 105 110
Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Thr His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala Asn Phe Ala
145 150 155 160
Thr Ala Lys Glu Glu Leu Glu Gln Ala Asn Lys Glu Asn Leu Pro Leu
165 170 175
Val Trp Lys Met Leu Asn Gln Val Gln Gly Asp Ala Lys Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser
210 215 220
Ser Tyr Gly Leu Ala Gly Val
225 230
<210> 5
<211> 699
<212> DNA
<213> Nostoc punctiforme
<400> 5
atgcagcagc ttacagacca atctaaagaa ttagatttca agagcgaaac atacaaagat 60
gcttatagcc ggattaatgc gatcgtgatt gaaggggaac aagaagccca tgaaaattac 120
atcacactag cccaactgct gccagaatct catgatgaat tgattcgcct atccaagatg 180
gaaagccgcc ataagaaagg atttgaagct tgtgggcgca atttagctgt taccccagat 240
ttgcaatttg ccaaagagtt tttctccggc ctacaccaaa attttcaaac agctgccgca 300
gaagggaaag tggttacttg tctgttgatt cagtctttaa ttattgaatg ttttgcgatc 360
gcagcatata acatttacat ccccgttgcc gacgatttcg cccgtaaaat tactgaagga 420
gtagttaaag aagaatacag ccacctcaat tttggagaag tttggttgaa agaacacttt 480
gcagaatcca aagctgaact tgaacttgca aatcgccaga acctacccat cgtctggaaa 540
atgctcaacc aagtagaagg tgatgcccac acaatggcaa tggaaaaaga tgctttggta 600
gaagacttca tgattcagta tggtgaagca ttgagtaaca ttggtttttc gactcgcgat 660
attatgcgct tgtcagccta cggactcata ggtgcttaa 699
<210> 6
<211> 232
<212> PRT
<213> Nostoc punctiforme
<400> 6
Met Gln Gln Leu Thr Asp Gln Ser Lys Glu Leu Asp Phe Lys Ser Glu
1 5 10 15
Thr Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly
20 25 30
Glu Gln Glu Ala His Glu Asn Tyr Ile Thr Leu Ala Gln Leu Leu Pro
35 40 45
Glu Ser His Asp Glu Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His
50 55 60
Lys Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ala Val Thr Pro Asp
65 70 75 80
Leu Gln Phe Ala Lys Glu Phe Phe Ser Gly Leu His Gln Asn Phe Gln
85 90 95
Thr Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser
100 105 110
Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro
115 120 125
Val Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Glu
130 135 140
Glu Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe
145 150 155 160
Ala Glu Ser Lys Ala Glu Leu Glu Leu Ala Asn Arg Gln Asn Leu Pro
165 170 175
Ile Val Trp Lys Met Leu Asn Gln Val Glu Gly Asp Ala His Thr Met
180 185 190
Ala Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly
195 200 205
Glu Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Asp Ile Met Arg Leu
210 215 220
Ser Ala Tyr Gly Leu Ile Gly Ala
225 230
<210> 7
<211> 696
<212> DNA
<213> Nostoc sp.
<400> 7
atgcagcagg ttgcagccga tttagaaatt gatttcaaga gcgaaaaata taaagatgcc 60
tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatacga gaattacatt 120
caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180
agccgtcaca aaaaaggatt tgaagcttgt ggacggaacc tacaagtatc accagatatg 240
gagtttgcca aagaattctt tgctggacta cacggtaact tccaaaaagc ggcggctgaa 300
ggtaaaatcg ttacctgtct attgattcag tccctgatta ttgaatgttt tgcgatcgcc 360
gcatacaata tctacattcc cgttgctgac gattttgctc gtaaaatcac tgagggtgta 420
gtcaaagatg aatacagcca cctcaacttc ggcgaagttt ggttacagaa aaattttgcc 480
caatccaaag cagaattaga agaagctaat cgtcataatc ttcccatagt ttggaaaatg 540
ctcaatcaag tcgcggatga tgccgcagtc ttagctatgg aaaaagaagc cctagtcgaa 600
gattttatga ttcagtacgg cgaagcgtta agtaatattg gcttcacaac cagagatatt 660
atgcggatgt cagcctacgg acttacagca gcttaa 696
<210> 8
<211> 231
<212> PRT
<213> Nostoc sp.
<400> 8
Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp
35 40 45
Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Met
65 70 75 80
Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Ala Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala
145 150 155 160
Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile
165 170 175
Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Thr Ala Ala
225 230
<210> 9
<211> 696
<212> DNA
<213> Acaryochloris marina
<400> 9
atgccccaaa ctcaggctat ttcagaaatt gacttctata gtgacaccta caaagatgct 60
tacagtcgta ttgacggcat tgtgatcgaa ggtgagcaag aagcgcatga aaactatatt 120
cgtcttggcg aaatgctgcc tgagcaccaa gacgacttta tccgcctgtc caagatggaa 180
gcccgtcata agaaagggtt tgaagcctgc ggtcgcaact taaaagtaac ctgcgatcta 240
gactttgccc ggcgtttctt ttccgactta cacaagaatt ttcaagatgc tgcagctgag 300
gataaagtgc caacttgctt agtgattcag tccttgatca ttgagtgttt tgcgatcgca 360
gcttacaaca tctatatccc cgtcgctgat gactttgccc gtaagattac agagtctgtg 420
gttaaggatg agtatcaaca cctcaattat ggtgaagagt ggcttaaagc tcacttcgat 480
gatgtgaaag cagaaatcca agaagctaat cgcaaaaacc tccccatcgt ttggagaatg 540
ctgaacgaag tggacaagga tgcggccgtt ttaggaatgg aaaaagaagc cctggttgaa 600
gacttcatga tccagtatgg tgaagccctt agcaatattg gtttctctac aggcgaaatt 660
atgcggatgt ctgcctatgg tcttgtggct gcgtaa 696
<210> 10
<211> 231
<212> PRT
<213> Acaryochloris marina
<400> 10
Met Pro Gln Thr Gln Ala Ile Ser Glu Ile Asp Phe Tyr Ser Asp Thr
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asp Gly Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala His Glu Asn Tyr Ile Arg Leu Gly Glu Met Leu Pro Glu
35 40 45
His Gln Asp Asp Phe Ile Arg Leu Ser Lys Met Glu Ala Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Cys Asp Leu
65 70 75 80
Asp Phe Ala Arg Arg Phe Phe Ser Asp Leu His Lys Asn Phe Gln Asp
85 90 95
Ala Ala Ala Glu Asp Lys Val Pro Thr Cys Leu Val Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu
130 135 140
Tyr Gln His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala His Phe Asp
145 150 155 160
Asp Val Lys Ala Glu Ile Gln Glu Ala Asn Arg Lys Asn Leu Pro Ile
165 170 175
Val Trp Arg Met Leu Asn Glu Val Asp Lys Asp Ala Ala Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Gly Glu Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Val Ala Ala
225 230
<210> 11
<211> 696
<212> DNA
<213> Thermosynechococcus elongatus
<400> 11
atgacaacgg ctaccgctac acctgttttg gactaccata gcgatcgcta caaggatgcc 60
tacagccgca ttaacgccat tgtcattgaa ggtgaacagg aagctcacga taactatatc 120
gatttagcca agctgctgcc acaacaccaa gaggaactca cccgccttgc caagatggaa 180
gctcgccaca aaaaggggtt tgaggcctgt ggtcgcaacc tgagcgtaac gccagatatg 240
gaatttgcca aagccttctt tgaaaaactg cgcgctaact ttcagagggc tctggcggag 300
ggaaaaactg cgacttgtct tctgattcaa gctttgatca tcgaatcctt tgcgatcgcg 360
gcctacaaca tctacatccc aatggcggat cctttcgccc gtaaaattac tgagagtgtt 420
gttaaggacg aatacagcca cctcaacttt ggcgaaatct ggctcaagga acactttgaa 480
agcgtcaaag gagagctcga agaagccaat cgcgccaatt tacccttggt ctggaaaatg 540
ctcaaccaag tggaagcaga tgccaaagtg ctcggcatgg aaaaagatgc ccttgtggaa 600
gacttcatga ttcagtacag tggtgcccta gaaaatatcg gctttaccac ccgcgaaatt 660
atgaagatgt cagtttatgg cctcactggg gcataa 696
<210> 12
<211> 231
<212> PRT
<213> Thermosynechococcus elongatus
<400> 12
Met Thr Thr Ala Thr Ala Thr Pro Val Leu Asp Tyr His Ser Asp Arg
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala His Asp Asn Tyr Ile Asp Leu Ala Lys Leu Leu Pro Gln
35 40 45
His Gln Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ser Val Thr Pro Asp Met
65 70 75 80
Glu Phe Ala Lys Ala Phe Phe Glu Lys Leu Arg Ala Asn Phe Gln Arg
85 90 95
Ala Leu Ala Glu Gly Lys Thr Ala Thr Cys Leu Leu Ile Gln Ala Leu
100 105 110
Ile Ile Glu Ser Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Met
115 120 125
Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Ile Trp Leu Lys Glu His Phe Glu
145 150 155 160
Ser Val Lys Gly Glu Leu Glu Glu Ala Asn Arg Ala Asn Leu Pro Leu
165 170 175
Val Trp Lys Met Leu Asn Gln Val Glu Ala Asp Ala Lys Val Leu Gly
180 185 190
Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Ser Gly
195 200 205
Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Lys Met Ser
210 215 220
Val Tyr Gly Leu Thr Gly Ala
225 230
<210> 13
<211> 732
<212> DNA
<213> Synechococcus sp.
<400> 13
atggccccag cgaacgtcct gcccaacacc cccccgtccc ccactgatgg gggcggcact 60
gccctagact acagcagccc aaggtatcgg caggcctact cccgcatcaa cggtattgtt 120
atcgaaggcg aacaagaagc ccacgacaac tacctcaagc tggccgaaat gctgccggaa 180
gctgcagagg agctgcgcaa gctggccaag atggaattgc gccacatgaa aggcttccag 240
gcctgcggca aaaacctgca ggtggaaccc gatgtggagt ttgcccgcgc ctttttcgcg 300
cccttgcggg acaatttcca aagcgccgca gcggcagggg atctggtctc ctgttttgtc 360
attcagtctt tgatcatcga gtgctttgcc attgccgcct acaacatcta catcccggtt 420
gccgatgact ttgcccgcaa gatcaccgag ggggtagtta aggacgagta tctgcacctc 480
aattttgggg agcgctggct gggcgagcac tttgccgagg ttaaagccca gatcgaagca 540
gccaacgccc aaaatctgcc tctagttcgg cagatgctgc agcaggtaga ggcggatgtg 600
gaagccattt acatggatcg cgaggccatt gtagaagact tcatgatcgc ctacggcgag 660
gccctggcca gcatcggctt caacacccgc gaggtaatgc gcctctcggc ccagggtctg 720
cgggccgcct ga 732
<210> 14
<211> 243
<212> PRT
<213> Synechococcus sp.
<400> 14
Met Ala Pro Ala Asn Val Leu Pro Asn Thr Pro Pro Ser Pro Thr Asp
1 5 10 15
Gly Gly Gly Thr Ala Leu Asp Tyr Ser Ser Pro Arg Tyr Arg Gln Ala
20 25 30
Tyr Ser Arg Ile Asn Gly Ile Val Ile Glu Gly Glu Gln Glu Ala His
35 40 45
Asp Asn Tyr Leu Lys Leu Ala Glu Met Leu Pro Glu Ala Ala Glu Glu
50 55 60
Leu Arg Lys Leu Ala Lys Met Glu Leu Arg His Met Lys Gly Phe Gln
65 70 75 80
Ala Cys Gly Lys Asn Leu Gln Val Glu Pro Asp Val Glu Phe Ala Arg
85 90 95
Ala Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Ser Ala Ala Ala Ala
100 105 110
Gly Asp Leu Val Ser Cys Phe Val Ile Gln Ser Leu Ile Ile Glu Cys
115 120 125
Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val Ala Asp Asp Phe
130 135 140
Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Leu His Leu
145 150 155 160
Asn Phe Gly Glu Arg Trp Leu Gly Glu His Phe Ala Glu Val Lys Ala
165 170 175
Gln Ile Glu Ala Ala Asn Ala Gln Asn Leu Pro Leu Val Arg Gln Met
180 185 190
Leu Gln Gln Val Glu Ala Asp Val Glu Ala Ile Tyr Met Asp Arg Glu
195 200 205
Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly Glu Ala Leu Ala Ser
210 215 220
Ile Gly Phe Asn Thr Arg Glu Val Met Arg Leu Ser Ala Gln Gly Leu
225 230 235 240
Arg Ala Ala
<210> 15
<211> 708
<212> DNA
<213> Gloeobacter violaceus
<400> 15
gtgaaccgaa ccgcaccgtc cagcgccgcg cttgattacc gctccgacac ctaccgcgat 60
gcgtactccc gcatcaatgc catcgtcctt gaaggcgagc gggaagccca cgccaactac 120
cttaccctcg ctgagatgct gccggaccat gccgaggcgc tcaaaaaact ggccgcgatg 180
gaaaatcgcc acttcaaagg cttccagtcc tgcgcccgca acctcgaagt cacgccggac 240
gacccgtttg caagggccta cttcgaacag ctcgacggca actttcagca ggcggcggca 300
gaaggtgacc ttaccacctg catggtcatc caggcactga tcatcgagtg cttcgcaatt 360
gcggcctaca acgtctacat tccggtggcc gacgcgtttg cccgcaaggt gaccgagggc 420
gtcgtcaagg acgagtacac ccacctcaac tttgggcagc agtggctcaa agagcgcttc 480
gtgaccgtgc gcgagggcat cgagcgcgcc aacgcccaga atctgcccat cgtctggcgg 540
atgctcaacg ccgtcgaagc ggacaccgaa gtgctgcaga tggataaaga agcgatcgtc 600
gaagacttta tgatcgccta cggtgaagcc ttgggcgaca tcggtttttc gatgcgcgac 660
gtgatgaaga tgtccgcccg cggccttgcc tctgcccccc gccagtga 708
<210> 16
<211> 235
<212> PRT
<213> Gloeobacter violaceus
<400> 16
Met Asn Arg Thr Ala Pro Ser Ser Ala Ala Leu Asp Tyr Arg Ser Asp
1 5 10 15
Thr Tyr Arg Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Leu Glu Gly
20 25 30
Glu Arg Glu Ala His Ala Asn Tyr Leu Thr Leu Ala Glu Met Leu Pro
35 40 45
Asp His Ala Glu Ala Leu Lys Lys Leu Ala Ala Met Glu Asn Arg His
50 55 60
Phe Lys Gly Phe Gln Ser Cys Ala Arg Asn Leu Glu Val Thr Pro Asp
65 70 75 80
Asp Pro Phe Ala Arg Ala Tyr Phe Glu Gln Leu Asp Gly Asn Phe Gln
85 90 95
Gln Ala Ala Ala Glu Gly Asp Leu Thr Thr Cys Met Val Ile Gln Ala
100 105 110
Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Val Tyr Ile Pro
115 120 125
Val Ala Asp Ala Phe Ala Arg Lys Val Thr Glu Gly Val Val Lys Asp
130 135 140
Glu Tyr Thr His Leu Asn Phe Gly Gln Gln Trp Leu Lys Glu Arg Phe
145 150 155 160
Val Thr Val Arg Glu Gly Ile Glu Arg Ala Asn Ala Gln Asn Leu Pro
165 170 175
Ile Val Trp Arg Met Leu Asn Ala Val Glu Ala Asp Thr Glu Val Leu
180 185 190
Gln Met Asp Lys Glu Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly
195 200 205
Glu Ala Leu Gly Asp Ile Gly Phe Ser Met Arg Asp Val Met Lys Met
210 215 220
Ser Ala Arg Gly Leu Ala Ser Ala Pro Arg Gln
225 230 235
<210> 17
<211> 732
<212> DNA
<213> Prochlorococcus marinus
<400> 17
atgcctacgc ttgagatgcc tgtggcagct gttcttgaca gcactgttgg atcttcagaa 60
gccctgccag acttcacttc agatagatat aaggatgcat acagcagaat caacgcaata 120
gtcattgagg gcgaacagga agcccatgac aattacatcg cgattggcac gctgcttccc 180
gatcatgtcg aagagctcaa gcggcttgcc aagatggaga tgaggcacaa gaagggcttt 240
acagcttgcg gcaagaacct tggcgttgag gctgacatgg acttcgcaag ggagtttttt 300
gctcctttgc gtgacaactt ccagacagct ttagggcagg ggaaaacacc tacatgcttg 360
ctgatccagg cgctcttgat tgaagccttt gctatttcgg cttatcacac ctatatccct 420
gtttctgacc cctttgctcg caagattact gaaggtgtcg tgaaggacga gtacacacac 480
ctcaattatg gcgaggcttg gctcaaggcc aatctggaga gttgccgtga ggagttgctt 540
gaggccaatc gcgagaacct gcctctgatt cgccggatgc ttgatcaggt agcaggtgat 600
gctgccgtgc tgcagatgga taaggaagat ctgattgagg atttcttaat cgcctaccag 660
gaatctctca ctgagattgg ctttaacact cgtgaaatta cccgtatggc agcggcagct 720
cttgtgagct ga 732
<210> 18
<211> 243
<212> PRT
<213> Prochlorococcus marinus
<400> 18
Met Pro Thr Leu Glu Met Pro Val Ala Ala Val Leu Asp Ser Thr Val
1 5 10 15
Gly Ser Ser Glu Ala Leu Pro Asp Phe Thr Ser Asp Arg Tyr Lys Asp
20 25 30
Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala
35 40 45
His Asp Asn Tyr Ile Ala Ile Gly Thr Leu Leu Pro Asp His Val Glu
50 55 60
Glu Leu Lys Arg Leu Ala Lys Met Glu Met Arg His Lys Lys Gly Phe
65 70 75 80
Thr Ala Cys Gly Lys Asn Leu Gly Val Glu Ala Asp Met Asp Phe Ala
85 90 95
Arg Glu Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Thr Ala Leu Gly
100 105 110
Gln Gly Lys Thr Pro Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu
115 120 125
Ala Phe Ala Ile Ser Ala Tyr His Thr Tyr Ile Pro Val Ser Asp Pro
130 135 140
Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His
145 150 155 160
Leu Asn Tyr Gly Glu Ala Trp Leu Lys Ala Asn Leu Glu Ser Cys Arg
165 170 175
Glu Glu Leu Leu Glu Ala Asn Arg Glu Asn Leu Pro Leu Ile Arg Arg
180 185 190
Met Leu Asp Gln Val Ala Gly Asp Ala Ala Val Leu Gln Met Asp Lys
195 200 205
Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ser Leu Thr
210 215 220
Glu Ile Gly Phe Asn Thr Arg Glu Ile Thr Arg Met Ala Ala Ala Ala
225 230 235 240
Leu Val Ser
<210> 19
<211> 717
<212> DNA
<213> Prochlorococcus marinus
<400> 19
atgcaaacac tcgaatctaa taaaaaaact aatctagaaa attctattga tttacccgat 60
tttactactg attcttacaa agacgcttat agcaggataa atgcaatagt tattgaaggt 120
gaacaagagg ctcatgataa ttacatttcc ttagcaacat taattcctaa cgaattagaa 180
gagttaacta aattagcgaa aatggagctt aagcacaaaa gaggctttac tgcatgtgga 240
agaaatctag gtgttcaagc tgacatgatt tttgctaaag aattcttttc caaattacat 300
ggtaattttc aggttgcgtt atctaatggc aagacaacta catgcctatt aatacaggca 360
attttaattg aagcttttgc tatatccgcg tatcacgttt acataagagt tgctgatcct 420
ttcgcgaaaa aaattaccca aggtgttgtt aaagatgaat atcttcattt aaattatgga 480
caagaatggc taaaagaaaa tttagcgact tgtaaagatg agctaatgga agcaaataag 540
gttaaccttc cattaatcaa gaagatgtta gatcaagtct cggaagatgc ttcagtacta 600
gctatggata gggaagaatt aatggaagaa ttcatgattg cctatcagga cactctcctt 660
gaaataggtt tagataatag agaaattgca agaatggcaa tggctgctat agtttaa 717
<210> 20
<211> 238
<212> PRT
<213> Prochlorococcus marinus
<400> 20
Met Gln Thr Leu Glu Ser Asn Lys Lys Thr Asn Leu Glu Asn Ser Ile
1 5 10 15
Asp Leu Pro Asp Phe Thr Thr Asp Ser Tyr Lys Asp Ala Tyr Ser Arg
20 25 30
Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala His Asp Asn Tyr
35 40 45
Ile Ser Leu Ala Thr Leu Ile Pro Asn Glu Leu Glu Glu Leu Thr Lys
50 55 60
Leu Ala Lys Met Glu Leu Lys His Lys Arg Gly Phe Thr Ala Cys Gly
65 70 75 80
Arg Asn Leu Gly Val Gln Ala Asp Met Ile Phe Ala Lys Glu Phe Phe
85 90 95
Ser Lys Leu His Gly Asn Phe Gln Val Ala Leu Ser Asn Gly Lys Thr
100 105 110
Thr Thr Cys Leu Leu Ile Gln Ala Ile Leu Ile Glu Ala Phe Ala Ile
115 120 125
Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe Ala Lys Lys
130 135 140
Ile Thr Gln Gly Val Val Lys Asp Glu Tyr Leu His Leu Asn Tyr Gly
145 150 155 160
Gln Glu Trp Leu Lys Glu Asn Leu Ala Thr Cys Lys Asp Glu Leu Met
165 170 175
Glu Ala Asn Lys Val Asn Leu Pro Leu Ile Lys Lys Met Leu Asp Gln
180 185 190
Val Ser Glu Asp Ala Ser Val Leu Ala Met Asp Arg Glu Glu Leu Met
195 200 205
Glu Glu Phe Met Ile Ala Tyr Gln Asp Thr Leu Leu Glu Ile Gly Leu
210 215 220
Asp Asn Arg Glu Ile Ala Arg Met Ala Met Ala Ala Ile Val
225 230 235
<210> 21
<211> 726
<212> DNA
<213> Prochlorococcus marinus
<400> 21
atgcaagctt ttgcatccaa caatttaacc gtagaaaaag aagagctaag ttctaactct 60
cttccagatt tcacctcaga atcttacaaa gatgcttaca gcagaatcaa tgcagttgta 120
attgaagggg agcaagaagc ttattctaat tttcttgatc tcgctaaatt gattcctgaa 180
catgcagatg agcttgtgag gctagggaag atggagaaaa agcatatgaa tggtttttgt 240
gcttgcggga gaaatcttgc tgtaaagcct gatatgcctt ttgcaaagac ctttttctca 300
aaactccata ataatttttt agaggctttc aaagtaggag atacgactac ctgtctccta 360
attcaatgca tcttgattga atcttttgca atatccgcat atcacgttta tatacgtgtt 420
gctgatccat tcgccaaaag aatcacagag ggtgttgtcc aagatgaata cttgcatttg 480
aactatggtc aagaatggct taaggccaat ctagagacag ttaagaaaga tcttatgagg 540
gctaataagg aaaacttgcc tcttataaag tccatgctcg atgaagtttc aaacgacgcc 600
gaagtccttc atatggataa agaagagtta atggaggaat ttatgattgc ttatcaagat 660
tcccttcttg aaataggtct tgataataga gaaattgcaa gaatggctct tgcagcggtg 720
atataa 726
<210> 22
<211> 241
<212> PRT
<213> Prochlorococcus marinus
<400> 22
Met Gln Ala Phe Ala Ser Asn Asn Leu Thr Val Glu Lys Glu Glu Leu
1 5 10 15
Ser Ser Asn Ser Leu Pro Asp Phe Thr Ser Glu Ser Tyr Lys Asp Ala
20 25 30
Tyr Ser Arg Ile Asn Ala Val Val Ile Glu Gly Glu Gln Glu Ala Tyr
35 40 45
Ser Asn Phe Leu Asp Leu Ala Lys Leu Ile Pro Glu His Ala Asp Glu
50 55 60
Leu Val Arg Leu Gly Lys Met Glu Lys Lys His Met Asn Gly Phe Cys
65 70 75 80
Ala Cys Gly Arg Asn Leu Ala Val Lys Pro Asp Met Pro Phe Ala Lys
85 90 95
Thr Phe Phe Ser Lys Leu His Asn Asn Phe Leu Glu Ala Phe Lys Val
100 105 110
Gly Asp Thr Thr Thr Cys Leu Leu Ile Gln Cys Ile Leu Ile Glu Ser
115 120 125
Phe Ala Ile Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe
130 135 140
Ala Lys Arg Ile Thr Glu Gly Val Val Gln Asp Glu Tyr Leu His Leu
145 150 155 160
Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Leu Glu Thr Val Lys Lys
165 170 175
Asp Leu Met Arg Ala Asn Lys Glu Asn Leu Pro Leu Ile Lys Ser Met
180 185 190
Leu Asp Glu Val Ser Asn Asp Ala Glu Val Leu His Met Asp Lys Glu
195 200 205
Glu Leu Met Glu Glu Phe Met Ile Ala Tyr Gln Asp Ser Leu Leu Glu
210 215 220
Ile Gly Leu Asp Asn Arg Glu Ile Ala Arg Met Ala Leu Ala Ala Val
225 230 235 240
Ile
<210> 23
<211> 732
<212> DNA
<213> Synechococcus sp.
<400> 23
atgccgaccc ttgagacgtc tgaggtcgcc gttcttgaag actcgatggc ttcaggctcc 60
cggctgcctg atttcaccag cgaggcttac aaggacgcct acagccgcat caatgcgatc 120
gtgatcgagg gtgagcagga agcgcacgac aactacatcg ccctcggcac gctgatcccc 180
gagcagaagg atgagctggc ccgtctcgcc cgcatggaga tgaagcacat gaaggggttc 240
acctcctgtg gccgcaatct cggcgtggag gcagaccttc cctttgctaa ggaattcttc 300
gcccccctgc acgggaactt ccaggcagct ctccaggagg gcaaggtggt gacctgcctg 360
ttgattcagg cgctgctgat tgaagcgttc gccatttccg cctatcacat ctacatcccg 420
gtggcggatc ccttcgctcg caagatcact gaaggtgtgg tgaaggatga gtacacccac 480
ctcaattacg gccaggaatg gctgaaggcc aattttgagg ccagcaagga tgagctgatg 540
gaggccaaca aggccaatct gcctctgatc cgctcgatgc tggagcaggt ggcagccgac 600
gccgccgtgc tgcagatgga aaaggaagat ctgatcgaag atttcctgat cgcttaccag 660
gaggccctct gcgagatcgg tttcagctcc cgtgacattg ctcgcatggc cgccgctgcc 720
ctcgcggtct ga 732
<210> 24
<211> 243
<212> PRT
<213> Synechococcus sp.
<400> 24
Met Pro Thr Leu Glu Thr Ser Glu Val Ala Val Leu Glu Asp Ser Met
1 5 10 15
Ala Ser Gly Ser Arg Leu Pro Asp Phe Thr Ser Glu Ala Tyr Lys Asp
20 25 30
Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala
35 40 45
His Asp Asn Tyr Ile Ala Leu Gly Thr Leu Ile Pro Glu Gln Lys Asp
50 55 60
Glu Leu Ala Arg Leu Ala Arg Met Glu Met Lys His Met Lys Gly Phe
65 70 75 80
Thr Ser Cys Gly Arg Asn Leu Gly Val Glu Ala Asp Leu Pro Phe Ala
85 90 95
Lys Glu Phe Phe Ala Pro Leu His Gly Asn Phe Gln Ala Ala Leu Gln
100 105 110
Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu
115 120 125
Ala Phe Ala Ile Ser Ala Tyr His Ile Tyr Ile Pro Val Ala Asp Pro
130 135 140
Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His
145 150 155 160
Leu Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Phe Glu Ala Ser Lys
165 170 175
Asp Glu Leu Met Glu Ala Asn Lys Ala Asn Leu Pro Leu Ile Arg Ser
180 185 190
Met Leu Glu Gln Val Ala Ala Asp Ala Ala Val Leu Gln Met Glu Lys
195 200 205
Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ala Leu Cys
210 215 220
Glu Ile Gly Phe Ser Ser Arg Asp Ile Ala Arg Met Ala Ala Ala Ala
225 230 235 240
Leu Ala Val
<210> 25
<211> 681
<212> DNA
<213> Synechococcus sp.
<400> 25
atgacccagc tcgactttgc cagtgcggcc taccgcgagg cctacagccg gatcaacggc 60
gttgtgattg tgggcgaagg tctcgccaat cgccatttcc agatgttggc gcggcgcatt 120
cccgctgatc gcgacgagct gcagcggctc ggacgcatgg agggagacca tgccagcgcc 180
tttgtgggct gtggtcgcaa cctcggtgtg gtggccgatc tgcccctggc ccggcgcctg 240
tttcagcccc tccatgatct gttcaaacgc cacgaccacg acggcaatcg ggccgaatgc 300
ctggtgatcc aggggttgat cgtggaatgt ttcgccgtgg cggcttaccg ccactacctg 360
ccggtggccg atgcctacgc ccggccgatc accgcagcgg tgatgaacga tgaatcggaa 420
cacctcgact acgctgagac ctggctgcag cgccatttcg atcaggtgaa ggcccgggtc 480
agcgcggtgg tggtggaggc gttgccgctc accctggcga tgttgcaatc gcttgctgca 540
gacatgcgac agatcggcat ggatccggtg gagaccctgg ccagcttcag tgaactgttt 600
cgggaagcgt tggaatcggt ggggtttgag gctgtggagg ccaggcgact gctgatgcga 660
gcggccgccc ggatggtctg a 681
<210> 26
<211> 226
<212> PRT
<213> Synechococcus sp.
<400> 26
Met Thr Gln Leu Asp Phe Ala Ser Ala Ala Tyr Arg Glu Ala Tyr Ser
1 5 10 15
Arg Ile Asn Gly Val Val Ile Val Gly Glu Gly Leu Ala Asn Arg His
20 25 30
Phe Gln Met Leu Ala Arg Arg Ile Pro Ala Asp Arg Asp Glu Leu Gln
35 40 45
Arg Leu Gly Arg Met Glu Gly Asp His Ala Ser Ala Phe Val Gly Cys
50 55 60
Gly Arg Asn Leu Gly Val Val Ala Asp Leu Pro Leu Ala Arg Arg Leu
65 70 75 80
Phe Gln Pro Leu His Asp Leu Phe Lys Arg His Asp His Asp Gly Asn
85 90 95
Arg Ala Glu Cys Leu Val Ile Gln Gly Leu Ile Val Glu Cys Phe Ala
100 105 110
Val Ala Ala Tyr Arg His Tyr Leu Pro Val Ala Asp Ala Tyr Ala Arg
115 120 125
Pro Ile Thr Ala Ala Val Met Asn Asp Glu Ser Glu His Leu Asp Tyr
130 135 140
Ala Glu Thr Trp Leu Gln Arg His Phe Asp Gln Val Lys Ala Arg Val
145 150 155 160
Ser Ala Val Val Val Glu Ala Leu Pro Leu Thr Leu Ala Met Leu Gln
165 170 175
Ser Leu Ala Ala Asp Met Arg Gln Ile Gly Met Asp Pro Val Glu Thr
180 185 190
Leu Ala Ser Phe Ser Glu Leu Phe Arg Glu Ala Leu Glu Ser Val Gly
195 200 205
Phe Glu Ala Val Glu Ala Arg Arg Leu Leu Met Arg Ala Ala Ala Arg
210 215 220
Met Val
225
<210> 27
<211> 696
<212> DNA
<213> Cyanothece sp.
<400> 27
atgcaagagc ttgctttacg ctcagagctt gattttaaca gcgaaaccta taaagatgct 60
tacagtcgca tcaatgctat tgtcattgaa ggggaacaag aagcctatca aaattatctt 120
gatatggcgc aacttctccc agaagacgag gctgagttaa ttcgtctctc caagatggaa 180
aaccgtcaca aaaaaggctt tcaagcctgt ggcaagaatt tgaatgtgac cccagatatg 240
gactacgctc aacaattttt tgctgaactt catggcaact tccaaaaggc aaaagccgaa 300
ggcaaaattg tcacttgctt attaattcaa tctttgatca tcgaagcctt tgcgatcgcc 360
gcttataata tttatattcc tgtggcagat ccctttgctc gtaaaatcac cgaaggggta 420
gttaaggatg aatataccca cctcaatttt ggggaagtct ggttaaaaga gcattttgaa 480
gcctctaaag cagaattaga agacgcaaat aaagaaaatt taccccttgt ttggcaaatg 540
ctcaaccaag ttgaaaaaga tgccgaagtg ttagggatgg agaaagaagc cttagtggaa 600
gatttcatga ttagttatgg agaagcttta agtaatattg gtttctctac ccgtgagatc 660
atgaaaatgt ctgcttacgg gctacgggct gcttaa 696
<210> 28
<211> 231
<212> PRT
<213> Cyanothece sp.
<400> 28
Met Gln Glu Leu Ala Leu Arg Ser Glu Leu Asp Phe Asn Ser Glu Thr
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Gln Asn Tyr Leu Asp Met Ala Gln Leu Leu Pro Glu
35 40 45
Asp Glu Ala Glu Leu Ile Arg Leu Ser Lys Met Glu Asn Arg His Lys
50 55 60
Lys Gly Phe Gln Ala Cys Gly Lys Asn Leu Asn Val Thr Pro Asp Met
65 70 75 80
Asp Tyr Ala Gln Gln Phe Phe Ala Glu Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Lys Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Thr His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe Glu
145 150 155 160
Ala Ser Lys Ala Glu Leu Glu Asp Ala Asn Lys Glu Asn Leu Pro Leu
165 170 175
Val Trp Gln Met Leu Asn Gln Val Glu Lys Asp Ala Glu Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Lys Met Ser
210 215 220
Ala Tyr Gly Leu Arg Ala Ala
225 230
<210> 29
<211> 696
<212> DNA
<213> Cyanothece sp.
<400> 29
atgcctcaag tgcagtcccc atcggctata gacttctaca gtgagaccta ccaggatgct 60
tacagccgca ttgatgcgat cgtgatcgag ggagaacagg aagcccacga caattacctg 120
aagctgacgg aactgctgcc ggattgtcaa gaagatctgg tccggctggc caaaatggaa 180
gcccgtcaca aaaaagggtt tgaagcttgt ggccgcaatc tcaaggtcac acccgatatg 240
gagtttgctc aacagttctt tgctgacctg cacaacaatt tccagaaagc tgctgcggcc 300
aacaaaattg ccacctgtct ggtgatccag gccctgatta ttgagtgctt tgccatcgcc 360
gcttataaca tctatattcc tgtcgctgat gactttgccc gcaaaattac cgaaaacgtg 420
gtcaaagacg aatacaccca cctcaacttt ggtgaagagt ggctcaaagc taactttgat 480
agccagcggg aagaagtgga agcggccaac cgggaaaacc tgccgatcgt ctggcggatg 540
ctcaatcagg tagagactga tgctcacgtt ttaggtatgg aaaaagaggc tttagtggaa 600
agcttcatga tccaatatgg tgaagccctg gaaaatattg gtttctcgac ccgtgagatc 660
atgcgcatgt ccgtttacgg cctctctgcg gcataa 696
<210> 30
<211> 231
<212> PRT
<213> Cyanothece sp.
<400> 30
Met Pro Gln Val Gln Ser Pro Ser Ala Ile Asp Phe Tyr Ser Glu Thr
1 5 10 15
Tyr Gln Asp Ala Tyr Ser Arg Ile Asp Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala His Asp Asn Tyr Leu Lys Leu Thr Glu Leu Leu Pro Asp
35 40 45
Cys Gln Glu Asp Leu Val Arg Leu Ala Lys Met Glu Ala Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Pro Asp Met
65 70 75 80
Glu Phe Ala Gln Gln Phe Phe Ala Asp Leu His Asn Asn Phe Gln Lys
85 90 95
Ala Ala Ala Ala Asn Lys Ile Ala Thr Cys Leu Val Ile Gln Ala Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Asn Val Val Lys Asp Glu
130 135 140
Tyr Thr His Leu Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp
145 150 155 160
Ser Gln Arg Glu Glu Val Glu Ala Ala Asn Arg Glu Asn Leu Pro Ile
165 170 175
Val Trp Arg Met Leu Asn Gln Val Glu Thr Asp Ala His Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Ser Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Glu Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser
210 215 220
Val Tyr Gly Leu Ser Ala Ala
225 230
<210> 31
<211> 702
<212> DNA
<213> Cyanothece sp.
<400> 31
atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60
taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120
cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180
gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240
gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300
ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360
gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420
gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480
cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540
ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600
gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660
ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702
<210> 32
<211> 233
<212> PRT
<213> Cyanothece sp.
<400> 32
Met Ser Asp Cys Ala Thr Asn Pro Ala Leu Asp Tyr Tyr Ser Glu Thr
1 5 10 15
Tyr Arg Asn Ala Tyr Arg Arg Val Asn Gly Ile Val Ile Glu Gly Glu
20 25 30
Lys Gln Ala Tyr Asp Asn Phe Ile Arg Leu Ala Glu Leu Leu Pro Glu
35 40 45
Tyr Gln Ala Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Gln
50 55 60
Lys Ser Phe Val Ala Cys Gly Gln Asn Leu Lys Val Ser Pro Asp Leu
65 70 75 80
Asp Phe Ala Ala Gln Phe Phe Ala Glu Leu His Gln Ile Phe Ala Ser
85 90 95
Ala Ala Asn Ala Gly Gln Val Ala Thr Cys Leu Val Val Gln Ala Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Thr Tyr Leu Pro Val
115 120 125
Ala Asp Glu Phe Ala Arg Lys Val Thr Ala Ser Val Val Gln Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Asn Ala Phe Glu
145 150 155 160
Gln Cys Lys Asp Glu Ile Ile Thr Ala Asn Arg Leu Ala Leu Pro Leu
165 170 175
Ile Trp Lys Met Leu Asn Gln Val Thr Gly Glu Leu Arg Ile Leu Gly
180 185 190
Met Asp Lys Ala Ser Leu Val Glu Asp Phe Ser Thr Arg Tyr Gly Glu
195 200 205
Ala Leu Gly Gln Ile Gly Phe Lys Leu Ser Glu Ile Leu Ser Leu Ser
210 215 220
Val Gln Gly Leu Gln Ala Val Thr Pro
225 230
<210> 33
<211> 696
<212> DNA
<213> Anabaena variabilis
<400> 33
atgcagcagg ttgcagccga tttagaaatc gatttcaaga gcgaaaaata taaagatgcc 60
tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatatga gaattacatt 120
caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180
agtcgccaca aaaaaggatt tgaagcttgt ggacggaacc tgcaagtatc cccagacata 240
gagttcgcta aagaattctt tgccgggcta cacggtaatt tccaaaaagc ggcagctgaa 300
ggtaaagttg tcacttgcct attgattcaa tccctgatta ttgaatgttt tgcgatcgcc 360
gcatacaata tctacatccc cgtggctgac gatttcgccc gtaaaatcac tgagggtgta 420
gttaaagatg aatacagtca cctcaacttc ggcgaagttt ggttacagaa aaatttcgct 480
caatcaaaag cagaactaga agaagctaat cgtcataatc ttcccatagt ctggaaaatg 540
ctcaatcaag ttgccgatga tgcggcagtc ttagctatgg aaaaagaagc cctagtggaa 600
gattttatga ttcagtacgg cgaagcacta agtaatattg gcttcacaac cagagatatt 660
atgcggatgt cagcctacgg actcacagca gcttaa 696
<210> 34
<211> 231
<212> PRT
<213> Anabaena variabilis
<400> 34
Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp
35 40 45
Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Ile
65 70 75 80
Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala
145 150 155 160
Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile
165 170 175
Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Thr Ala Ala
225 230
<210> 35
<211> 765
<212> DNA
<213> Synechococcus elongatus
<400> 35
gtgcgtaccc cctgggatcc accaaatccc acattctccc tctcatccgt gtcaggagac 60
cgcagactca tgccgcagct tgaagccagc cttgaactgg actttcaaag cgagtcctac 120
aaagacgctt acagccgcat caacgcgatc gtgattgaag gcgaacaaga ggcgttcgac 180
aactacaatc gccttgctga gatgctgccc gaccagcggg atgagcttca caagctagcc 240
aagatggaac agcgccacat gaaaggcttt atggcctgtg gcaaaaatct ctccgtcact 300
cctgacatgg gttttgccca gaaatttttc gagcgcttgc acgagaactt caaagcggcg 360
gctgcggaag gcaaggtcgt cacctgccta ctgattcaat cgctaatcat cgagtgcttt 420
gcgatcgcgg cttacaacat ctacatccca gtggcggatg cttttgcccg caaaatcacg 480
gagggggtcg tgcgcgacga atacctgcac cgcaacttcg gtgaagagtg gctgaaggcg 540
aattttgatg cttccaaagc cgaactggaa gaagccaatc gtcagaacct gcccttggtt 600
tggctaatgc tcaacgaagt ggccgatgat gctcgcgaac tcgggatgga gcgtgagtcg 660
ctcgtcgagg actttatgat tgcctacggt gaagctctgg aaaacatcgg cttcacaacg 720
cgcgaaatca tgcgtatgtc cgcctatggc cttgcggccg tttga 765
<210> 36
<211> 254
<212> PRT
<213> Synechococcus elongatus
<400> 36
Met Arg Thr Pro Trp Asp Pro Pro Asn Pro Thr Phe Ser Leu Ser Ser
1 5 10 15
Val Ser Gly Asp Arg Arg Leu Met Pro Gln Leu Glu Ala Ser Leu Glu
20 25 30
Leu Asp Phe Gln Ser Glu Ser Tyr Lys Asp Ala Tyr Ser Arg Ile Asn
35 40 45
Ala Ile Val Ile Glu Gly Glu Gln Glu Ala Phe Asp Asn Tyr Asn Arg
50 55 60
Leu Ala Glu Met Leu Pro Asp Gln Arg Asp Glu Leu His Lys Leu Ala
65 70 75 80
Lys Met Glu Gln Arg His Met Lys Gly Phe Met Ala Cys Gly Lys Asn
85 90 95
Leu Ser Val Thr Pro Asp Met Gly Phe Ala Gln Lys Phe Phe Glu Arg
100 105 110
Leu His Glu Asn Phe Lys Ala Ala Ala Ala Glu Gly Lys Val Val Thr
115 120 125
Cys Leu Leu Ile Gln Ser Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala
130 135 140
Tyr Asn Ile Tyr Ile Pro Val Ala Asp Ala Phe Ala Arg Lys Ile Thr
145 150 155 160
Glu Gly Val Val Arg Asp Glu Tyr Leu His Arg Asn Phe Gly Glu Glu
165 170 175
Trp Leu Lys Ala Asn Phe Asp Ala Ser Lys Ala Glu Leu Glu Glu Ala
180 185 190
Asn Arg Gln Asn Leu Pro Leu Val Trp Leu Met Leu Asn Glu Val Ala
195 200 205
Asp Asp Ala Arg Glu Leu Gly Met Glu Arg Glu Ser Leu Val Glu Asp
210 215 220
Phe Met Ile Ala Tyr Gly Glu Ala Leu Glu Asn Ile Gly Phe Thr Thr
225 230 235 240
Arg Glu Ile Met Arg Met Ser Ala Tyr Gly Leu Ala Ala Val
245 250
<210> 37
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (13)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(18)
<223> Any amino acid
<400> 37
Tyr Xaa Xaa Ala Tyr Xaa Arg Xaa Xaa Xaa Xaa Val Xaa Xaa Gly Glu
1 5 10 15
Xaa Xaa Ala
<210> 38
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (9)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (13)..(14)
<223> Any amino acid
<400> 38
Leu Xaa Xaa Met Glu Xaa Xaa His Xaa Xaa Xaa Phe Xaa Xaa Cys
1 5 10 15
<210> 39
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(15)
<223> Any amino acid
<400> 39
Cys Xaa Xaa Xaa Gln Xaa Xaa Xaa Xaa Glu Xaa Phe Ala Xaa Xaa Ala
1 5 10 15
Tyr
<210> 40
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (5)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (9)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(17)
<223> Any amino acid
<400> 40
Thr Xaa Xaa Val Xaa Xaa Xaa Glu Xaa Xaa His Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Trp Leu
<210> 41
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Lys, Arg or Gln
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Ser or Arg
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Ile or Val
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Asp or Asn
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Gly or Ala
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Val or Ile
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(18)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(21)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (22)..(22)
<223> Asn or His
<220>
<221> MOD_RES
<222> (23)..(23)
<223> Tyr or Phe
<400> 41
Tyr Xaa Xaa Ala Tyr Xaa Arg Xaa Xaa Xaa Xaa Val Xaa Xaa Gly Glu
1 5 10 15
Xaa Xaa Ala Xaa Xaa Xaa Xaa
20
<210> 42
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Ala, Ser or Gly
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Arg, Asp or Lys
<220>
<221> MOD_RES
<222> (9)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ala, Ser or Gly
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Ala, Ser or Gly
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Ala or Gly
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Val or Ile
<400> 42
Leu Xaa Xaa Met Glu Xaa Xaa His Xaa Xaa Xaa Phe Xaa Xaa Cys Xaa
1 5 10 15
Xaa Asn Leu Xaa Xaa
20
<210> 43
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Leu, Met or Phe
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Val or Leu
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Ile or Val
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Leu or Ile
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Ile, Leu or Met
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Ile or Val
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Ile or Val
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Ala or Ser
<220>
<221> MOD_RES
<222> (18)..(18)
<223> Asn, His or Arg
<220>
<221> MOD_RES
<222> (19)..(19)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Ile or Leu
<400> 43
Cys Xaa Xaa Xaa Gln Xaa Xaa Xaa Xaa Glu Xaa Phe Ala Xaa Xaa Ala
1 5 10 15
Tyr Xaa Xaa Tyr Xaa
20
<210> 44
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Phe or Tyr
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Arg or Lys
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Ile or Val
<220>
<221> MOD_RES
<222> (9)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Val or Met
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Asp or Glu
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Tyr or Ser
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (19)..(19)
<223> Leu or Arg
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Asn or Asp
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Tyr or Phe
<220>
<221> MOD_RES
<222> (22)..(22)
<223> Ala or Gly
<220>
<221> MOD_RES
<222> (23)..(23)
<223> Glu or Gln
<220>
<221> MOD_RES
<222> (24)..(24)
<223> Any amino acid
<400> 44
Asp Xaa Xaa Ala Xaa Xaa Xaa Thr Xaa Xaa Val Xaa Xaa Xaa Glu Xaa
1 5 10 15
Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Trp Leu
20 25
<210> 45
<211> 699
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
atgcagcaac tgacggatca gagcaaagaa ctggacttca aaagcgaaac ctacaaggac 60
gcgtattctc gtatcaacgc tatcgttatc gagggtgaac aagaagcgca cgagaattac 120
attaccctgg cgcagctgct gcctgaatcc cacgatgaac tgattcgtct gagcaaaatg 180
gagtcgcgtc acaaaaaggg ttttgaggcc tgcggtcgta acctggcggt cactccggac 240
ctgcagttcg ctaaggagtt cttcagcggc ctgcatcaaa actttcagac ggcagcggcg 300
gaaggtaagg ttgtcacctg cctgctgatt caaagcctga tcattgagtg tttcgctatc 360
gcagcctata acatttacat cccggtggcg gacgattttg cacgcaagat cactgagggt 420
gtggttaaag aagaatacag ccacctgaac ttcggtgagg tctggttgaa ggagcacttt 480
gcggaaagca aggcggagct ggaattggca aatcgtcaaa acctgccgat cgtgtggaaa 540
atgctgaatc aagtggaggg tgatgcacac acgatggcta tggaaaaaga cgctctggtg 600
gaggacttca tgatccagta cggcgaggcg ctgagcaaca ttggctttag cacccgtgac 660
attatgcgcc tgagcgcgta tggcctgatc ggtgcgtaa 699
<210> 46
<211> 696
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 46
atgccgcaaa cgcaagctat tagcgaaatt gatttctatt ctgacaccta taaggacgct 60
tactctcgta tcgatggtat cgtgatcgag ggtgagcaag aggcgcatga gaactacatt 120
cgtctgggtg aaatgttgcc tgagcatcaa gacgacttta tccgtttgag caagatggag 180
gcccgtcaca agaagggctt tgaggcttgt ggtcgtaact tgaaggtgac ttgcgatctg 240
gacttcgcgc gtcgcttctt ctcggacctg cacaagaact tccaagatgc tgcggccgag 300
gataaagttc cgacctgctt ggttattcag tccctgatca tcgaatgctt cgcgattgca 360
gcgtataaca tttacatccc ggttgccgat gatttcgctc gtaagattac cgagagcgtc 420
gtcaaggacg aataccagca tctgaactat ggcgaggagt ggctgaaggc ccatttcgac 480
gacgtgaagg ccgagatcca ggaagcaaat cgcaagaatc tgccgatcgt ttggcgtatg 540
ctgaacgagg ttgacaagga cgcagcagtg ctgggcatgg agaaggaagc gttggttgaa 600
gacttcatga ttcaatacgg tgaggccctg tccaacattg gcttttctac cggcgagatc 660
atgcgtatgt ctgcgtacgg tctggtggca gcctaa 696
<210> 47
<211> 696
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
atgaccaccg cgaccgcaac gccggtgctg gactatcaca gcgaccgcta caaggacgca 60
tacagccgca tcaacgcgat tgtcatcgaa ggtgaacaag aggcccacga caattacatt 120
gatctggcta aactgctgcc tcaacaccaa gaagagctga cccgtctggc gaagatggag 180
gcccgccaca agaagggttt tgaagcgtgc ggtcgcaatc tgtccgttac cccggatatg 240
gagttcgcga aagcgttctt tgagaagctg cgcgcgaact ttcagcgtgc cctggcggag 300
ggtaagaccg caacctgtct gctgatccag gcgttgatca ttgaatcctt cgcaattgcc 360
gcgtacaaca tttacatccc tatggccgat ccgtttgcgc gcaagattac cgaaagcgtc 420
gtcaaggatg aatactctca cttgaacttt ggcgaaatct ggttgaagga acatttcgag 480
agcgtcaagg gcgagttgga ggaagctaac cgtgcgaatc tgccgctggt ttggaagatg 540
ttgaatcagg tcgaggcaga cgcaaaggtc ctgggcatgg agaaggatgc tctggtggaa 600
gactttatga tccagtactc cggtgcgctg gagaacatcg gctttaccac ccgtgaaatc 660
atgaaaatgt ctgtgtatgg cctgaccggc gcgtaa 696
<210> 48
<211> 732
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 48
atggcgcctg caaacgtgct gccaaatacg ccgccgagcc cgaccgatgg tggtggtacg 60
gccctggact acagctctcc gcgttaccgt caggcgtaca gccgtatcaa tggcattgtt 120
atcgaaggcg agcaggaagc gcacgataac tacctgaagt tggcggagat gctgcctgag 180
gctgccgagg aactgcgtaa gctggcaaag atggaattgc gtcacatgaa gggctttcag 240
gcttgcggca agaacttgca ggtggagcct gacgtcgagt ttgcccgcgc tttcttcgcg 300
ccgctgcgcg acaacttcca atccgcagca gcggccggtg atctggtttc ctgtttcgtc 360
atccaaagcc tgatcatcga gtgttttgcg atcgctgcgt ataacattta catcccggtt 420
gcagacgact tcgcccgtaa gatcacggag ggcgtggtta aggacgagta tctgcatctg 480
aatttcggcg agcgttggtt gggtgaacac ttcgcagagg ttaaagcaca gatcgaggca 540
gccaatgccc agaacctgcc gctggtgcgc caaatgctgc agcaagttga ggcggacgtc 600
gaggcaatct atatggaccg tgaggcgatc gttgaggatt tcatgattgc ttatggcgaa 660
gcgctggcaa gcattggctt caacacgcgc gaagtgatgc gtctgagcgc acagggcttg 720
cgtgcagcat aa 732
<210> 49
<211> 732
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
atgccgacgt tggagatgcc ggtcgctgcg gtcctggaca gcacggtcgg tagctctgag 60
gcgctgccgg actttaccag cgaccgctac aaagacgctt attcgcgtat caacgcgatt 120
gtgatcgagg gtgaacaaga agcccacgac aactacatcg caattggcac cctgttgccg 180
gaccatgtgg aagaactgaa acgtctggcg aaaatggaaa tgcgtcacaa gaaaggtttc 240
accgcgtgcg gtaagaactt gggtgtggaa gccgatatgg acttcgcccg tgagttcttt 300
gccccgttgc gcgacaactt tcaaaccgcg ctgggtcaag gcaagacccc tacgtgtctg 360
ttgatccaag cgctgctgat tgaagcgttc gcgatctcgg cctaccacac ttacattccg 420
gttagcgatc cgttcgcacg taagatcact gaaggtgtcg ttaaggacga atacacccat 480
ctgaactacg gtgaggcatg gctgaaggcg aatctggaga gctgccgcga ggaactgctg 540
gaagcgaacc gtgagaatct gccgctgatc cgccgcatgc tggatcaggt cgcgggcgac 600
gcggcagtcc tgcagatgga taaggaagac ctgatcgaag acttcctgat tgcttaccaa 660
gagagcttga ctgagatcgg ctttaacacg cgtgaaatca cccgtatggc cgcagcggcg 720
ctggtcagct aa 732
<210> 50
<211> 717
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 50
atgcaaaccc tggagagcaa caagaaaacc aacctggaaa acagcattga cctgccagat 60
ttcacgacgg acagctacaa ggatgcgtat tcccgtatca atgctatcgt cattgaaggt 120
gaacaggaag cccatgacaa ctatatcagc ctggccaccc tgatcccgaa tgaactggag 180
gaattgacca aactggccaa gatggagctg aaacacaaac gtggctttac ggcatgcggt 240
cgcaatctgg gtgttcaggc cgatatgatc tttgcgaaag agtttttctc taagctgcac 300
ggcaacttcc aagttgcgct gagcaacggt aagacgacca cctgcttgct gatccaggcc 360
atcttgattg aagccttcgc gatttccgcg taccacgtgt acattcgtgt cgcggacccg 420
tttgcgaaaa agattactca aggtgtggtg aaggatgagt acctgcacct gaactatggt 480
caggaatggt tgaaggagaa tctggcaacc tgtaaggacg aactgatgga agcaaacaaa 540
gttaatctgc cgctgattaa gaaaatgctg gatcaggtga gcgaggatgc ctctgtgttg 600
gctatggatc gtgaggagct gatggaggag ttcatgatcg cgtatcagga caccctgttg 660
gaaatcggtc tggacaatcg tgaaattgcg cgtatggcaa tggctgcgat tgtgtaa 717
<210> 51
<211> 726
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
atgcaggcct tcgcaagcaa taacctgacg gtcgaaaagg aagaactgag ctccaatagc 60
ctgccggatt tcaccagcga gagctataag gatgcatact ctcgtatcaa tgccgtggtt 120
atcgaaggtg aacaagaggc ttattctaac tttctggacc tggccaagct gatcccggag 180
cacgccgacg agctggtgcg cttgggtaag atggaaaaga aacacatgaa cggcttctgc 240
gcgtgtggtc gtaacttggc agttaaacca gacatgccgt tcgcgaagac gttctttagc 300
aagctgcaca acaatttcct ggaggcgttt aaggtgggcg atacgacgac ctgtttgttg 360
atccaatgca tcttgatcga gtcctttgcc atcagcgcgt accacgtgta cattcgcgtg 420
gcagatccgt ttgccaagcg tatcacggaa ggtgttgttc aagacgagta cctgcatttg 480
aattacggtc aagagtggct gaaagcgaac ctggagactg tgaagaaaga cctgatgcgc 540
gcgaacaaag agaatctgcc attgattaag tctatgctgg acgaagtctc caacgacgct 600
gaagtgctgc acatggataa agaagagctg atggaagagt ttatgattgc atatcaggac 660
agcctgctgg aaattggcct ggacaaccgc gagatcgcac gcatggcgct ggcagcggtt 720
atttaa 726
<210> 52
<211> 732
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
atgccgaccc tggaaactag cgaggtggca gttctggaag actcgatggc cagcggtagc 60
cgcctgccgg actttaccag cgaggcctat aaggacgcgt atagccgtat caatgcgatc 120
gtgattgaag gcgagcaaga agcgcatgac aactacattg cactgggcac gctgatccca 180
gaacagaagg acgagctggc tcgcctggct cgtatggaaa tgaaacacat gaagggcttt 240
accagctgtg gtcgtaacct gggtgtggaa gcggatctgc cgttcgcgaa ggagttcttc 300
gcaccgctgc atggtaactt tcaggcggcg ctgcaggaag gtaaggtggt gacctgtctg 360
ctgattcagg cactgctgat tgaggcgttc gccattagcg cttatcacat ttacattccg 420
gttgctgacc cgtttgcacg caagattacc gaaggtgttg tgaaagacga gtatacccat 480
ctgaactacg gtcaagagtg gttgaaggcg aatttcgaag cctccaaaga cgaactgatg 540
gaagccaaca aggcgaatct gccgctgatc cgttctatgc tggaacaagt cgctgctgat 600
gcggccgtgc tgcaaatgga gaaagaggac ctgattgaag acttcctgat cgcatatcaa 660
gaagctctgt gtgagattgg cttctcgtcc cgtgatatcg cccgcatggc ggcagccgca 720
ctggcggttt aa 732
<210> 53
<211> 681
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
atgacccaat tggactttgc atctgcggca taccgtgagg catacagccg tatcaatggt 60
gtcgttattg ttggcgaggg cctggcgaat cgtcacttcc aaatgctggc gcgtcgcatt 120
ccggcagacc gtgacgaatt gcaacgtttg ggccgcatgg agggtgacca cgcaagcgcc 180
tttgttggtt gcggtcgcaa tctgggtgtg gtcgctgatc tgccgctggc acgccgcctg 240
ttccagccgc tgcatgatct gttcaagcgt cacgaccacg acggtaaccg tgctgaatgc 300
ctggtgatcc agggtctgat tgttgagtgc tttgcggttg ccgcgtatcg tcattacctg 360
ccggtggcag acgcgtatgc ccgtccgatc accgctgcgg ttatgaatga cgagagcgaa 420
cacctggact acgcagaaac ctggctgcag cgccacttcg accaagttaa agcccgcgtg 480
agcgctgtgg ttgtggaggc gctgccgctg acgctggcga tgttgcaaag cctggctgca 540
gatatgcgcc aaatcggcat ggacccggtg gaaacgctgg cgagcttcag cgagctgttt 600
cgtgaagcgc tggaaagcgt tggttttgaa gcggtcgaag cgcgccgttt gctgatgcgt 660
gctgcagctc gtatggttta a 681
<210> 54
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (9)..(12)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(26)
<223> Any amino acid and this region may encompass 12 or 13
residues
<400> 54
Gly Ala Xaa Gly Asp Ile Gly Ser Xaa Xaa Xaa Xaa Trp Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Arg
20 25
<210> 55
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Val or Ile
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Cys or Thr
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Asp or Ile
<220>
<221> MOD_RES
<222> (22)..(22)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (24)..(27)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (28)..(28)
<223> Asp or Glu
<220>
<221> MOD_RES
<222> (30)..(30)
<223> Ile, Leu or Phe
<220>
<221> MOD_RES
<222> (32)..(32)
<223> Thr, Ile or Val
<400> 55
Ala Thr Val Ala Xaa Xaa Gly Ala Thr Gly Asp Ile Gly Ser Ala Val
1 5 10 15
Xaa Arg Trp Leu Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Leu Xaa Leu Xaa
20 25 30
Ala Arg
<210> 56
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Any amino acid except Lys
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Phe, Leu or Trp
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<400> 56
Xaa Leu Xaa Xaa Xaa Arg Phe Thr Thr Gly Asn
1 5 10
<210> 57
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (8)..(13)
<223> Any amino acid
<400> 57
Met Phe Gly Leu Ile Gly His Xaa Xaa Xaa Xaa Xaa Xaa Ala
1 5 10
<210> 58
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Asp or Glu
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Phe, Leu, Val or Met
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Cys or Ser
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Gln or Val
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Leu or Val
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Asp or Glu
<220>
<221> MOD_RES
<222> (14)..(16)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Val or Ile
<220>
<221> MOD_RES
<222> (18)..(18)
<223> Any amino acid
<400> 58
Leu Xaa Xaa Trp Xaa Xaa Ala Pro Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Ser
<210> 59
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (5)..(6)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(13)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Any amino acid
<400> 59
Ser Xaa Xaa Gly Xaa Xaa Ile Xaa Gly Xaa Tyr Xaa Xaa Ser Xaa Phe
1 5 10 15
Xaa Pro Glu Met Leu
20
<210> 60
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (16)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (22)..(23)
<223> Any amino acid
<400> 60
Lys Xaa Ala Xaa Arg Lys Xaa Xaa Xaa Ala Met Xaa Xaa Xaa Gln Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Ile Xaa Xaa Leu Gly Gly Phe
20 25
<210> 61
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Leu, Val or Met
<220>
<221> MOD_RES
<222> (3)..(4)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Ala or Ser
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Asp or Asn
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (8)..(9)
<223> Val or Ile
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Leu, Met or Ile
<400> 61
Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Ala Ser Xaa
1 5 10
<210> 62
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (2)..(5)
<223> Any amino acid
<400> 62
Pro Xaa Xaa Xaa Xaa Asp Gly Gly Tyr Pro Lys Asn
1 5 10
<210> 63
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(16)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (19)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (22)..(23)
<223> Any amino acid
<400> 63
Asn Phe Ser Trp Gly Arg Asn Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Ile Gly Xaa Xaa Ser Xaa Xaa His Gly
20 25
<210> 64
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic peptide
<400> 64
Phe Thr Thr Gly Asn Thr His Thr Ala
1 5
<210> 65
<211> 1026
<212> DNA
<213> Synechococcus elongatus
<400> 65
atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60
atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120
atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180
gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240
gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300
tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360
accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420
caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480
gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540
gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600
ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660
tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720
gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780
tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840
gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900
ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960
aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020
atttga 1026
<210> 66
<211> 341
<212> PRT
<213> Synechococcus elongatus
<400> 66
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp
1 5 10 15
Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu
20 25 30
Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr
35 40 45
Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser
85 90 95
Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala
100 105 110
Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala
130 135 140
Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu
180 185 190
Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro
195 200 205
Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser
210 215 220
Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys
225 230 235 240
Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln
245 250 255
Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu
290 295 300
Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro
325 330 335
Leu Ala Leu Ala Ile
340
<210> 67
<211> 1023
<212> DNA
<213> Synechocystis sp.
<400> 67
atgtttggtc ttattggtca tctcacgagt ttagaacacg cccaagcggt tgctgaagat 60
ttaggctatc ctgagtacgc caaccaaggc ctggattttt ggtgttcggc tcctccccaa 120
gtggttgata attttcaggt gaaaagtgtg acggggcagg tgattgaagg caaatatgtg 180
gagtcttgct ttttgccgga aatgttaacc caacggcgga tcaaagcggc cattcgtaaa 240
atcctcaatg ctatggccct ggcccaaaag gtgggcttgg atattacggc cctgggaggc 300
ttttcttcaa tcgtatttga agaatttaac ctcaagcaaa ataatcaagt ccgcaatgtg 360
gaactagatt ttcagcggtt caccactggt aatacccaca ccgcttatgt gatctgccgt 420
caggtcgagt ctggagctaa acagttgggt attgatctaa gtcaggcaac ggtagcggtt 480
tgtggcgcca cgggagatat tggtagcgcc gtatgtcgtt ggttagatag caaacatcaa 540
gttaaggaat tattgctaat tgcccgtaac cgccaaagat tggaaaatct ccaagaggaa 600
ttgggtcggg gcaaaattat ggatttggaa acagccctgc cccaggcaga tattattgtt 660
tgggtggcta gtatgcccaa gggggtagaa attgcggggg aaatgctgaa aaagccctgt 720
ttgattgtgg atgggggcta tcccaagaat ttagacacca gggtgaaagc ggatggggtg 780
catattctca agggggggat tgtagaacat tcccttgata ttacctggga aattatgaag 840
attgtggaga tggatattcc ctcccggcaa atgttcgcct gttttgcgga ggccattttg 900
ctagagtttg agggctggcg cactaatttt tcctggggcc gcaaccaaat ttccgttaat 960
aaaatggagg cgattggtga agcttctgtc aagcatggct tttgcccttt agtagctctt 1020
tag 1023
<210> 68
<211> 340
<212> PRT
<213> Synechocystis sp.
<400> 68
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Glu Asp Leu Gly Tyr Pro Glu Tyr Ala Asn Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Val Val Asp Asn Phe Gln Val Lys
35 40 45
Ser Val Thr Gly Gln Val Ile Glu Gly Lys Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Thr Gln Arg Arg Ile Lys Ala Ala Ile Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Leu Ala Gln Lys Val Gly Leu Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Val Phe Glu Glu Phe Asn Leu Lys
100 105 110
Gln Asn Asn Gln Val Arg Asn Val Glu Leu Asp Phe Gln Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ser
130 135 140
Gly Ala Lys Gln Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Val
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Ser Lys His Gln Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Arg Gln
180 185 190
Arg Leu Glu Asn Leu Gln Glu Glu Leu Gly Arg Gly Lys Ile Met Asp
195 200 205
Leu Glu Thr Ala Leu Pro Gln Ala Asp Ile Ile Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Ala Gly Glu Met Leu Lys Lys Pro Cys
225 230 235 240
Leu Ile Val Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Arg Val Lys
245 250 255
Ala Asp Gly Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Thr Trp Glu Ile Met Lys Ile Val Glu Met Asp Ile Pro Ser
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu
290 295 300
Gly Trp Arg Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Ser Val Asn
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Lys His Gly Phe Cys Pro
325 330 335
Leu Val Ala Leu
340
<210> 69
<211> 1023
<212> DNA
<213> Cyanothece sp.
<400> 69
atgtttggtt taattggtca tcttacaagt ttagaacacg cccactccgt tgctgatgcc 60
tttggctatg gcccatacgc cactcaggga cttgatttgt ggtgttctgc tccaccccaa 120
ttcgtcgagc attttcatgt tactagcatc acaggacaaa ccatcgaagg aaagtatata 180
gaatccgctt tcttaccaga aatgctgata aagcgacgga ttaaagcagc aattcgcaaa 240
atactgaatg cgatggcctt tgctcagaaa aataacctta acatcacagc attagggggc 300
ttttcttcga ttatttttga agaatttaat ctcaaagaga atagacaagt tcgtaatgtc 360
tctttagagt ttgatcgctt caccaccgga aacacccata ctgcttatat catttgtcgt 420
caagttgaac aggcatccgc taaactaggg attgacttat cccaagcaac ggttgctatt 480
tgcggggcaa ccggagatat tggcagtgca gtgtgtcgtt ggttagatag aaaaaccgat 540
acccaggaac tattcttaat tgctcgcaat aaagaacgat tacaacgact gcaagatgag 600
ttgggacggg gtaaaattat gggattggag gaggctttac ccgaagcaga tattatcgtt 660
tgggtggcga gtatgcccaa aggagtggaa attaatgccg aaactctcaa aaaaccctgt 720
ttaattatcg atggtggtta tcctaagaat ttagacacaa aaattaaaca tcctgatgtc 780
catatcctga aagggggaat tgtagaacat tctctagata ttgactggaa gattatggaa 840
actgtcaata tggatgttcc ttctcgtcaa atgtttgctt gttttgccga agccatttta 900
ttagagtttg aacaatggca cactaatttt tcttggggac gcaatcaaat tacagtgact 960
aaaatggaac aaataggaga agcttctgtc aaacatgggt tacaaccgtt gttgagttgg 1020
taa 1023
<210> 70
<211> 340
<212> PRT
<213> Cyanothece sp.
<400> 70
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala His Ser
1 5 10 15
Val Ala Asp Ala Phe Gly Tyr Gly Pro Tyr Ala Thr Gln Gly Leu Asp
20 25 30
Leu Trp Cys Ser Ala Pro Pro Gln Phe Val Glu His Phe His Val Thr
35 40 45
Ser Ile Thr Gly Gln Thr Ile Glu Gly Lys Tyr Ile Glu Ser Ala Phe
50 55 60
Leu Pro Glu Met Leu Ile Lys Arg Arg Ile Lys Ala Ala Ile Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Phe Ala Gln Lys Asn Asn Leu Asn Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Glu Phe Asn Leu Lys
100 105 110
Glu Asn Arg Gln Val Arg Asn Val Ser Leu Glu Phe Asp Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Ala Lys Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Arg Lys Thr Asp Thr Gln Glu Leu Phe Leu Ile Ala Arg Asn Lys Glu
180 185 190
Arg Leu Gln Arg Leu Gln Asp Glu Leu Gly Arg Gly Lys Ile Met Gly
195 200 205
Leu Glu Glu Ala Leu Pro Glu Ala Asp Ile Ile Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Ala Glu Thr Leu Lys Lys Pro Cys
225 230 235 240
Leu Ile Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Lys Ile Lys
245 250 255
His Pro Asp Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Glu Thr Val Asn Met Asp Val Pro Ser
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu
290 295 300
Gln Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Thr
305 310 315 320
Lys Met Glu Gln Ile Gly Glu Ala Ser Val Lys His Gly Leu Gln Pro
325 330 335
Leu Leu Ser Trp
340
<210> 71
<211> 1041
<212> DNA
<213> Prochlorococcus marinus
<400> 71
atgtttgggc ttataggtca ttcaactagt tttgaagatg caaaaagaaa ggcttcatta 60
ttgggctttg atcatattgc ggatggtgat ttagatgttt ggtgcacagc tccacctcaa 120
ctagttgaaa atgtagaggt taaaagtgct ataggtatat caattgaagg ttcttatatt 180
gattcatgtt tcgttcctga aatgctttca agatttaaaa cggcaagaag aaaagtatta 240
aatgcaatgg aattagctca aaaaaaaggt attaatatta ccgctttggg ggggttcact 300
tctatcatct ttgaaaattt taatctcctt caacataagc agattagaaa cacttcacta 360
gagtgggaaa ggtttacaac tggtaatact catactgcgt gggttatttg caggcaatta 420
gagatgaatg ctcctaaaat aggtattgat cttaaaagcg caacagttgc tgtagttggt 480
gctactggag atataggcag tgctgtttgt cgatggttaa tcaataaaac aggtattggg 540
gaacttcttt tggtagctag gcaaaaggaa cccttggatt ctttgcaaaa ggaattagat 600
ggtggaacta tcaaaaatct agatgaagca ttgcctgaag cagatattgt tgtatgggta 660
gcaagtatgc caaagacaat ggaaatcgat gctaataatc ttaaacaacc atgtttaatg 720
attgatggag gttatccaaa gaatctagat gaaaaatttc aaggaaataa tatacatgtt 780
gtaaaaggag gtatagtaag attcttcaat gatataggtt ggaatatgat ggaactagct 840
gaaatgcaaa atccccagag agaaatgttt gcatgctttg cagaagcaat gattttagaa 900
tttgaaaaat gtcatacaaa ctttagctgg ggaagaaata atatatctct cgagaaaatg 960
gagtttattg gagctgcttc tgtaaagcat ggcttctctg caattggcct agataagcat 1020
ccaaaagtac tagcagtttg a 1041
<210> 72
<211> 346
<212> PRT
<213> Prochlorococcus marinus
<400> 72
Met Phe Gly Leu Ile Gly His Ser Thr Ser Phe Glu Asp Ala Lys Arg
1 5 10 15
Lys Ala Ser Leu Leu Gly Phe Asp His Ile Ala Asp Gly Asp Leu Asp
20 25 30
Val Trp Cys Thr Ala Pro Pro Gln Leu Val Glu Asn Val Glu Val Lys
35 40 45
Ser Ala Ile Gly Ile Ser Ile Glu Gly Ser Tyr Ile Asp Ser Cys Phe
50 55 60
Val Pro Glu Met Leu Ser Arg Phe Lys Thr Ala Arg Arg Lys Val Leu
65 70 75 80
Asn Ala Met Glu Leu Ala Gln Lys Lys Gly Ile Asn Ile Thr Ala Leu
85 90 95
Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asn Leu Leu Gln His
100 105 110
Lys Gln Ile Arg Asn Thr Ser Leu Glu Trp Glu Arg Phe Thr Thr Gly
115 120 125
Asn Thr His Thr Ala Trp Val Ile Cys Arg Gln Leu Glu Met Asn Ala
130 135 140
Pro Lys Ile Gly Ile Asp Leu Lys Ser Ala Thr Val Ala Val Val Gly
145 150 155 160
Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Ile Asn Lys
165 170 175
Thr Gly Ile Gly Glu Leu Leu Leu Val Ala Arg Gln Lys Glu Pro Leu
180 185 190
Asp Ser Leu Gln Lys Glu Leu Asp Gly Gly Thr Ile Lys Asn Leu Asp
195 200 205
Glu Ala Leu Pro Glu Ala Asp Ile Val Val Trp Val Ala Ser Met Pro
210 215 220
Lys Thr Met Glu Ile Asp Ala Asn Asn Leu Lys Gln Pro Cys Leu Met
225 230 235 240
Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Glu Lys Phe Gln Gly Asn
245 250 255
Asn Ile His Val Val Lys Gly Gly Ile Val Arg Phe Phe Asn Asp Ile
260 265 270
Gly Trp Asn Met Met Glu Leu Ala Glu Met Gln Asn Pro Gln Arg Glu
275 280 285
Met Phe Ala Cys Phe Ala Glu Ala Met Ile Leu Glu Phe Glu Lys Cys
290 295 300
His Thr Asn Phe Ser Trp Gly Arg Asn Asn Ile Ser Leu Glu Lys Met
305 310 315 320
Glu Phe Ile Gly Ala Ala Ser Val Lys His Gly Phe Ser Ala Ile Gly
325 330 335
Leu Asp Lys His Pro Lys Val Leu Ala Val
340 345
<210> 73
<211> 1053
<212> DNA
<213> Gloeobacter violaceus
<400> 73
atgtttggcc tgatcggaca cttgaccaat ctttcccatg cccagcgggt cgcccgcgac 60
ctgggctacg acgagtatgc aagccacgac ctcgaattct ggtgcatggc ccctccccag 120
gcggtcgatg aaatcacgat caccagcgtc accggtcagg tgatccacgg tcagtacgtc 180
gaatcgtgct ttctgccgga gatgctcgcc cagggccgct tcaagaccgc catgcgcaag 240
atcctcaatg ccatggccct ggtccagaag cgcggcatcg acattacggc cctgggaggc 300
ttctcgtcga tcatcttcga gaatttcagc ctcgataaat tgctcaacgt ccgcgacatc 360
accctcgaca tccagcgctt caccaccggc aacacccaca cggcctacat cctttgtcag 420
caggtcgagc agggtgcggt acgctacggc atcgatccgg ccaaagcgac cgtggcggta 480
gtcggggcca ccggcgacat cggtagcgcc gtctgccgat ggctcaccga ccgcgccggc 540
atccacgaac tcttgctggt ggcccgcgac gccgaaaggc tcgaccggct gcagcaggaa 600
ctcggcaccg gtcggatcct gccggtcgaa gaagcacttc ccaaagccga catcgtcgtc 660
tgggtcgcct cgatgaacca gggcatggcc atcgaccccg ccggcctgcg caccccctgc 720
ctgctcatcg acggcggcta ccccaagaac atggccggca ccctgcagcg cccgggcatc 780
catatcctcg acggcggcat ggtcgagcac tcgctcgaca tcgactggca gatcatgtcg 840
tttctaaatg tgcccaaccc cgcccgccag ttcttcgcct gcttcgccga gtcgatgctg 900
ctggaattcg aagggcttca cttcaatttt tcctggggcc gcaaccacat caccgtcgag 960
aagatggccc agatcggctc gctgtctaaa aaacatggct ttcgtcccct gcttgaaccc 1020
agtcagcgca gcggcgaact cgtacacgga taa 1053
<210> 74
<211> 350
<212> PRT
<213> Gloeobacter violaceus
<400> 74
Met Phe Gly Leu Ile Gly His Leu Thr Asn Leu Ser His Ala Gln Arg
1 5 10 15
Val Ala Arg Asp Leu Gly Tyr Asp Glu Tyr Ala Ser His Asp Leu Glu
20 25 30
Phe Trp Cys Met Ala Pro Pro Gln Ala Val Asp Glu Ile Thr Ile Thr
35 40 45
Ser Val Thr Gly Gln Val Ile His Gly Gln Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Gln Gly Arg Phe Lys Thr Ala Met Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Leu Val Gln Lys Arg Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Ser Leu Asp
100 105 110
Lys Leu Leu Asn Val Arg Asp Ile Thr Leu Asp Ile Gln Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Leu Cys Gln Gln Val Glu Gln
130 135 140
Gly Ala Val Arg Tyr Gly Ile Asp Pro Ala Lys Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Thr
165 170 175
Asp Arg Ala Gly Ile His Glu Leu Leu Leu Val Ala Arg Asp Ala Glu
180 185 190
Arg Leu Asp Arg Leu Gln Gln Glu Leu Gly Thr Gly Arg Ile Leu Pro
195 200 205
Val Glu Glu Ala Leu Pro Lys Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Asn Gln Gly Met Ala Ile Asp Pro Ala Gly Leu Arg Thr Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Met Ala Gly Thr Leu Gln
245 250 255
Arg Pro Gly Ile His Ile Leu Asp Gly Gly Met Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Phe Leu Asn Val Pro Asn Pro Ala
275 280 285
Arg Gln Phe Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Gly Leu His Phe Asn Phe Ser Trp Gly Arg Asn His Ile Thr Val Glu
305 310 315 320
Lys Met Ala Gln Ile Gly Ser Leu Ser Lys Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Glu Pro Ser Gln Arg Ser Gly Glu Leu Val His Gly
340 345 350
<210> 75
<211> 1020
<212> DNA
<213> Nostoc punctiforme
<400> 75
atgtttggtc taattggaca tctgactagt ttagaacacg ctcaagccgt agcccaagaa 60
ttgggatacc cagaatatgc cgatcaaggg ctagactttt ggtgcagcgc cccgccgcaa 120
attgtcgata gtattattgt caccagtgtt actgggcaac aaattgaagg acgatatgta 180
gaatcttgct ttttgccgga aatgctagct agtcgccgca tcaaagccgc aacacggaaa 240
atcctcaacg ctatggccca tgcacagaag cacggcatta acatcacagc tttaggcgga 300
ttttcctcga ttatttttga aaactttaag ttagagcagt ttagccaagt ccgaaatatc 360
aagctagagt ttgaacgctt caccacagga aacacgcata ctgcctacat tatttgtaag 420
caggtggaag aagcatccaa acaactggga attaatctat caaacgcgac tgttgcggta 480
tgtggagcaa ctggggatat tggtagtgcc gttacacgct ggctagatgc gagaacagat 540
gtccaagaac tcctgctaat cgcccgcgat caagaacgtc tcaaagagtt gcaaggcgaa 600
ctggggcggg ggaaaatcat gggtttgaca gaagcactac cccaagccga tgttgtagtt 660
tgggttgcta gtatgcccag aggcgtggaa attgacccca ccactttgaa acaaccctgt 720
ttgttgattg atggtggcta tcctaaaaac ttagcaacaa aaattcaata tcctggcgta 780
cacgtgttaa atggtgggat tgtagagcat tccctggata ttgactggaa aattatgaaa 840
atagtcaata tggacgtgcc agcccgtcag ttgtttgcct gttttgccga atcaatgcta 900
ctggaatttg agaagttata cacgaacttt tcgtggggac ggaatcagat taccgtagat 960
aaaatggagc agattggccg ggtgtcagta aaacatggat ttagaccgtt gttggtttag 1020
<210> 76
<211> 339
<212> PRT
<213> Nostoc punctiforme
<400> 76
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp Ser Ile Ile Val Thr
35 40 45
Ser Val Thr Gly Gln Gln Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asn Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Ile Lys Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Lys Gln Val Glu Glu
130 135 140
Ala Ser Lys Gln Leu Gly Ile Asn Leu Ser Asn Ala Thr Val Ala Val
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Arg Thr Asp Val Gln Glu Leu Leu Leu Ile Ala Arg Asp Gln Glu
180 185 190
Arg Leu Lys Glu Leu Gln Gly Glu Leu Gly Arg Gly Lys Ile Met Gly
195 200 205
Leu Thr Glu Ala Leu Pro Gln Ala Asp Val Val Val Trp Val Ala Ser
210 215 220
Met Pro Arg Gly Val Glu Ile Asp Pro Thr Thr Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Ala Thr Lys Ile Gln
245 250 255
Tyr Pro Gly Val His Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Arg Val Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 77
<211> 1020
<212> DNA
<213> Anabaena variabilis
<400> 77
atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60
ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgcagcgc tccaccgcaa 120
atagttgacc acattaaagt tactagcatt actggtgaaa taattgaagg gaggtatgta 180
gaatcttgct ttttaccaga aatgctagcc agccgtagga ttaaagccgc aacccgcaaa 240
gtcctcaatg ctatggctca tgctcaaaaa catggcattg acatcaccgc tttgggtggt 300
ttctcctcca ttatttttga aaacttcaaa ttggaacagt ttagccaagt tcgtaatgtc 360
acactagagt ttgaacgctt cactacaggc aacactcaca cagcttatat catttgtcgg 420
caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480
tgtggggcta ctggtgacat tggtagtgca gttactcgct ggctggatgc caaaacagac 540
gtaaaagaat tactgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600
ttgggacgcg gtaaaatcat gagcctagat gaagcattgc ctcaagctga tattgtagtt 660
tgggtagcta gtatgcctaa aggcgtggaa attaatcctc aagttttgaa acaaccctgt 720
ttattgattg atggtggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780
tatgtactga acggaggtat cgtcgaacat tccctagata ttgactggaa aatcatgaaa 840
atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900
ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960
aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020
<210> 78
<211> 339
<212> PRT
<213> Anabaena variabilis
<400> 78
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr
35 40 45
Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu
180 185 190
Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser
195 200 205
Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln
245 250 255
Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 79
<211> 1026
<212> DNA
<213> Synechococcus elongatus
<400> 79
atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60
atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120
atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180
gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240
gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300
tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360
accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420
caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480
gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540
gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600
ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660
tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720
gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780
tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840
gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900
ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960
aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020
atttga 1026
<210> 80
<211> 340
<212> PRT
<213> Synechococcus elongatus
<400> 80
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp
1 5 10 15
Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu
20 25 30
Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr
35 40 45
Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser
85 90 95
Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala
100 105 110
Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala
130 135 140
Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu
180 185 190
Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro
195 200 205
Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser
210 215 220
Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys
225 230 235 240
Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln
245 250 255
Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu
290 295 300
Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro
325 330 335
Leu Ala Leu Ala
340
<210> 81
<211> 1020
<212> DNA
<213> Nostoc sp.
<400> 81
atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60
ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgtagcgc tccaccgcaa 120
atagttgacc acattaaagt tactagtatt actggtgaaa taattgaagg gaggtatgta 180
gaatcttgct ttttaccgga gatgctagcc agtcgtcgga ttaaagccgc aacccgcaaa 240
gtcctcaatg ctatggctca tgctcaaaag aatggcattg atatcacagc tttgggtggt 300
ttctcctcca ttatttttga aaactttaaa ttggagcagt ttagccaagt tcgtaatgtg 360
acactagagt ttgaacgctt cactacaggc aacactcaca cagcatatat tatttgtcgg 420
caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480
tgtggggcta ctggtgatat tggtagtgca gttactcgct ggctggatgc taaaacagac 540
gtgaaagaat tgctgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600
ctgggacgcg gtaaaatcat gagccttgat gaagcactgc cccaagctga tatcgtagtt 660
tgggtagcca gtatgcctaa aggtgtggaa attaatcctc aagttttgaa gcaaccctgt 720
ttgctgattg atgggggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780
tatgtactga acggcggtat cgtcgaacat tcgctggata ttgactggaa aatcatgaaa 840
atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900
ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960
aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020
<210> 82
<211> 339
<212> PRT
<213> Nostoc sp.
<400> 82
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr
35 40 45
Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ala His Ala Gln Lys Asn Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu
180 185 190
Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser
195 200 205
Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln
245 250 255
Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 83
<211> 1026
<212> DNA
<213> Synechococcus elongatus
<400> 83
atgtttggtc tgattggtca cctgaccagc ttggaacaag cgcgtgacgt cagccgccgt 60
atgggttatg atgaatacgc tgatcaaggc ctggagtttt ggagcagcgc gccaccgcag 120
atcgtcgatg agatcaccgt gacctccgca accggtaagg tcatccacgg ccgctacatt 180
gagtcctgct tcctgcctga gatgctggca gctcgccgtt tcaaaacggc cactcgtaag 240
gttctgaatg cgatgtccca tgcgcaaaag catggcattg acattagcgc cttgggcggt 300
tttacgtcga ttatcttcga gaacttcgat ctggcctctt tgcgccaggt gcgtgacacg 360
accttggagt ttgagcgttt taccacgggt aatacgcaca ccgcttacgt tatctgtcgc 420
caagtcgaag cagcagccaa aaccctgggt attgatatca cccaggccac cgtcgccgtg 480
gtgggtgcta ccggtgatat tggttccgcg gtttgccgtt ggctggatct gaaactgggt 540
gttggcgatc tgatcctgac ggcgcgtaat caggagcgtc tggacaacct gcaagccgag 600
ttgggtcgcg gtaagatcct gccgttggag gcagcgttgc cggaggcaga cttcatcgtc 660
tgggttgcgt ctatgccgca gggtgttgtt atcgacccgg cgaccttgaa acagccgtgc 720
gtgctgattg atggcggcta tccgaaaaac ctgggcagca aggtccaagg cgagggtatc 780
tatgtcctga atggcggtgt ggttgagcat tgcttcgaca ttgactggca gatcatgagc 840
gcagcagaaa tggcgcgtcc ggagcgccaa atgtttgcct gttttgcaga agccatgctg 900
ctggagttcg aaggctggca tacgaatttc agctggggtc gtaatcagat taccattgaa 960
aagatggaag cgattggtga agcaagcgtg cgtcatggtt ttcagccact ggcgctggct 1020
atttaa 1026
<210> 84
<211> 1041
<212> DNA
<213> Prochlorococcus marinus
<400> 84
atgtttggtc tgattggcca cagcacgagc tttgaggacg caaagcgtaa ggcgagcctg 60
ctgggctttg atcatattgc tgatggcgac ctggacgtct ggtgcacggc acctccgcaa 120
ctggttgaga atgtcgaggt gaaatcggcg attggcattt ccatcgaagg ctcctacatc 180
gacagctgtt tcgtgccgga gatgttgagc cgtttcaaaa ccgcacgtcg caaagttctg 240
aatgcaatgg agctggcaca aaagaagggc atcaacatca cggcgctggg tggtttcacc 300
agcattatct ttgagaactt caatctgttg cagcataaac agatccgtaa taccagcctg 360
gagtgggaac gctttaccac gggtaacacc cacaccgcgt gggtgatctg ccgccagctg 420
gagatgaatg cgccgaaaat cggtattgac ctgaaaagcg cgacggtggc agttgttggc 480
gcaactggcg acattggttc ggccgtttgt cgctggctga ttaacaagac cggtatcggt 540
gaattgttgc tggtcgctcg ccagaaggag cctctggaca gcctgcaaaa agagctggac 600
ggtggtacga tcaagaacct ggatgaagcg ctgccagaag cggacatcgt cgtctgggtc 660
gcatctatgc cgaaaactat ggaaatcgat gccaacaatc tgaaacaacc gtgcctgatg 720
atcgatggcg gctacccgaa gaacttggat gagaagtttc aaggcaataa catccacgtt 780
gtgaagggtg gtattgtccg tttcttcaat gatatcggtt ggaacatgat ggaactggct 840
gaaatgcaga acccgcaacg tgagatgttc gcttgttttg cggaggccat gattctggag 900
ttcgagaaat gccataccaa tttcagctgg ggtcgcaaca acattagcct ggagaaaatg 960
gagttcatcg gcgctgcgag cgttaagcac ggcttcagcg cgattggttt ggataaacat 1020
ccgaaggtcc tggcagttta a 1041
<210> 85
<211> 3522
<212> DNA
<213> Mycobacterium smegmatis
<400> 85
atgaccagcg atgttcacga cgccacagac ggcgtcaccg aaaccgcact cgacgacgag 60
cagtcgaccc gccgcatcgc cgagctgtac gccaccgatc ccgagttcgc cgccgccgca 120
ccgttgcccg ccgtggtcga cgcggcgcac aaacccgggc tgcggctggc agagatcctg 180
cagaccctgt tcaccggcta cggtgaccgc ccggcgctgg gataccgcgc ccgtgaactg 240
gccaccgacg agggcgggcg caccgtgacg cgtctgctgc cgcggttcga caccctcacc 300
tacgcccagg tgtggtcgcg cgtgcaagcg gtcgccgcgg ccctgcgcca caacttcgcg 360
cagccgatct accccggcga cgccgtcgcg acgatcggtt tcgcgagtcc cgattacctg 420
acgctggatc tcgtatgcgc ctacctgggc ctcgtgagtg ttccgctgca gcacaacgca 480
ccggtcagcc ggctcgcccc gatcctggcc gaggtcgaac cgcggatcct caccgtgagc 540
gccgaatacc tcgacctcgc agtcgaatcc gtgcgggacg tcaactcggt gtcgcagctc 600
gtggtgttcg accatcaccc cgaggtcgac gaccaccgcg acgcactggc ccgcgcgcgt 660
gaacaactcg ccggcaaggg catcgccgtc accaccctgg acgcgatcgc cgacgagggc 720
gccgggctgc cggccgaacc gatctacacc gccgaccatg atcagcgcct cgcgatgatc 780
ctgtacacct cgggttccac cggcgcaccc aagggtgcga tgtacaccga ggcgatggtg 840
gcgcggctgt ggaccatgtc gttcatcacg ggtgacccca cgccggtcat caacgtcaac 900
ttcatgccgc tcaaccacct gggcgggcgc atccccattt ccaccgccgt gcagaacggt 960
ggaaccagtt acttcgtacc ggaatccgac atgtccacgc tgttcgagga tctcgcgctg 1020
gtgcgcccga ccgaactcgg cctggttccg cgcgtcgccg acatgctcta ccagcaccac 1080
ctcgccaccg tcgaccgcct ggtcacgcag ggcgccgacg aactgaccgc cgagaagcag 1140
gccggtgccg aactgcgtga gcaggtgctc ggcggacgcg tgatcaccgg attcgtcagc 1200
accgcaccgc tggccgcgga gatgagggcg ttcctcgaca tcaccctggg cgcacacatc 1260
gtcgacggct acgggctcac cgagaccggc gccgtgacac gcgacggtgt gatcgtgcgg 1320
ccaccggtga tcgactacaa gctgatcgac gttcccgaac tcggctactt cagcaccgac 1380
aagccctacc cgcgtggcga actgctggtc aggtcgcaaa cgctgactcc cgggtactac 1440
aagcgccccg aggtcaccgc gagcgtcttc gaccgggacg gctactacca caccggcgac 1500
gtcatggccg agaccgcacc cgaccacctg gtgtacgtgg accgtcgcaa caacgtcctc 1560
aaactcgcgc agggcgagtt cgtggcggtc gccaacctgg aggcggtgtt ctccggcgcg 1620
gcgctggtgc gccagatctt cgtgtacggc aacagcgagc gcagtttcct tctggccgtg 1680
gtggtcccga cgccggaggc gctcgagcag tacgatccgg ccgcgctcaa ggccgcgctg 1740
gccgactcgc tgcagcgcac cgcacgcgac gccgaactgc aatcctacga ggtgccggcc 1800
gatttcatcg tcgagaccga gccgttcagc gccgccaacg ggctgctgtc gggtgtcgga 1860
aaactgctgc ggcccaacct caaagaccgc tacgggcagc gcctggagca gatgtacgcc 1920
gatatcgcgg ccacgcaggc caaccagttg cgcgaactgc ggcgcgcggc cgccacacaa 1980
ccggtgatcg acaccctcac ccaggccgct gccacgatcc tcggcaccgg gagcgaggtg 2040
gcatccgacg cccacttcac cgacctgggc ggggattccc tgtcggcgct gacactttcg 2100
aacctgctga gcgatttctt cggtttcgaa gttcccgtcg gcaccatcgt gaacccggcc 2160
accaacctcg cccaactcgc ccagcacatc gaggcgcagc gcaccgcggg tgaccgcagg 2220
ccgagtttca ccaccgtgca cggcgcggac gccaccgaga tccgggcgag tgagctgacc 2280
ctggacaagt tcatcgacgc cgaaacgctc cgggccgcac cgggtctgcc caaggtcacc 2340
accgagccac ggacggtgtt gctctcgggc gccaacggct ggctgggccg gttcctcacg 2400
ttgcagtggc tggaacgcct ggcacctgtc ggcggcaccc tcatcacgat cgtgcggggc 2460
cgcgacgacg ccgcggcccg cgcacggctg acccaggcct acgacaccga tcccgagttg 2520
tcccgccgct tcgccgagct ggccgaccgc cacctgcggg tggtcgccgg tgacatcggc 2580
gacccgaatc tgggcctcac acccgagatc tggcaccggc tcgccgccga ggtcgacctg 2640
gtggtgcatc cggcagcgct ggtcaaccac gtgctcccct accggcagct gttcggcccc 2700
aacgtcgtgg gcacggccga ggtgatcaag ctggccctca ccgaacggat caagcccgtc 2760
acgtacctgt ccaccgtgtc ggtggccatg gggatccccg acttcgagga ggacggcgac 2820
atccggaccg tgagcccggt gcgcccgctc gacggcggat acgccaacgg ctacggcaac 2880
agcaagtggg ccggcgaggt gctgctgcgg gaggcccacg atctgtgcgg gctgcccgtg 2940
gcgacgttcc gctcggacat gatcctggcg catccgcgct accgcggtca ggtcaacgtg 3000
ccagacatgt tcacgcgact cctgttgagc ctcttgatca ccggcgtcgc gccgcggtcg 3060
ttctacatcg gagacggtga gcgcccgcgg gcgcactacc ccggcctgac ggtcgatttc 3120
gtggccgagg cggtcacgac gctcggcgcg cagcagcgcg agggatacgt gtcctacgac 3180
gtgatgaacc cgcacgacga cgggatctcc ctggatgtgt tcgtggactg gctgatccgg 3240
gcgggccatc cgatcgaccg ggtcgacgac tacgacgact gggtgcgtcg gttcgagacc 3300
gcgttgaccg cgcttcccga gaagcgccgc gcacagaccg tactgccgct gctgcacgcg 3360
ttccgcgctc cgcaggcacc gttgcgcggc gcacccgaac ccacggaggt gttccacgcc 3420
gcggtgcgca ccgcgaaggt gggcccggga gacatcccgc acctcgacga ggcgctgatc 3480
gacaagtaca tacgcgatct gcgtgagttc ggtctgatct ga 3522
<210> 86
<211> 1173
<212> PRT
<213> Mycobacterium smegmatis
<400> 86
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile
1010 1015 1020
Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val
1025 1030 1035
Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg
1040 1045 1050
Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly
1055 1060 1065
Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His
1070 1075 1080
Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe
1085 1090 1095
Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr
1100 1105 1110
Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu
1115 1120 1125
Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg
1130 1135 1140
Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala
1145 1150 1155
Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile
1160 1165 1170
<210> 87
<211> 921
<212> DNA
<213> Nostoc punctiforme
<400> 87
atgactcaag cgaaagccaa aaaagaccac ggtgacgttc ctgttaacac ttaccgtccc 60
aatgctccat ttattggcaa ggtaatatct aatgaaccat tagtcaaaga aggtggtatt 120
ggtattgttc aacaccttaa atttgaccta tctggtgggg atttgaagta tatagaaggt 180
caaagtattg gcattattcc gccaggttta gacaagaacg gcaagcctga aaaactcaga 240
ctatattcca tcgcctcaac tcgtcatggt gatgatgtag atgataagac agtatcactg 300
tgcgtccgcc agttggagta caagcaccca gaaactggcg aaacagtcta cggtgtttgc 360
tctacgcacc tgtgtttcct caagccaggg gaagaggtaa aaattacagg gcctgtgggt 420
aaggaaatgt tgttacccaa tgaccctgat gctaatgtta tcatgatggc tactggaaca 480
ggtattgcgc cgatgcgggc ttacttgtgg cgtcagttta aagatgcgga aagagcggct 540
aacccagaat accaatttaa aggattctct tggctaatat ttggcgtacc tacaactcca 600
aaccttttat ataaggaaga actggaagag attcaacaaa aatatcctga gaacttccgc 660
ctaactgctg ccatcagccg cgaacagaaa aatccccaag gcggtagaat gtatattcaa 720
gaccgcgtag cagaacatgc tgatgaattg tggcagttga ttaaaaatga aaaaacccac 780
acttacattt gcggtttgcg cggtatggaa gaaggtattg atgcagcctt aactgctgct 840
gctgctaagg aaggcgtaac ctggagtgat taccagaagc aactcaagaa agccggtcgc 900
tggcacgtag aaacttacta a 921
<210> 88
<211> 437
<212> PRT
<213> Nostoc punctiforme
<400> 88
Met Tyr Asn Gln Gly Ala Val Glu Gly Ala Ala Asn Ile Glu Leu Gly
1 5 10 15
Ser Arg Ile Phe Val Tyr Glu Val Val Gly Leu Arg Gln Gly Glu Glu
20 25 30
Thr Asp Gln Thr Asn Tyr Pro Ile Arg Lys Ser Gly Ser Val Phe Ile
35 40 45
Arg Val Pro Tyr Asn Arg Met Asn Gln Glu Met Arg Arg Ile Thr Arg
50 55 60
Leu Gly Gly Thr Ile Val Ser Ile Gln Pro Ile Thr Ala Leu Glu Pro
65 70 75 80
Val Asn Gly Lys Ala Ser Phe Gly Asn Ala Thr Ser Val Val Ser Glu
85 90 95
Leu Ala Lys Ser Gly Glu Thr Ala Asn Ser Glu Gly Asn Gly Lys Ala
100 105 110
Thr Pro Val Asn Ala His Ser Ala Glu Glu Gln Asn Lys Asp Lys Lys
115 120 125
Gly Asn Thr Met Thr Gln Ala Lys Ala Lys Lys Asp His Gly Asp Val
130 135 140
Pro Val Asn Thr Tyr Arg Pro Asn Ala Pro Phe Ile Gly Lys Val Ile
145 150 155 160
Ser Asn Glu Pro Leu Val Lys Glu Gly Gly Ile Gly Ile Val Gln His
165 170 175
Leu Lys Phe Asp Leu Ser Gly Gly Asp Leu Lys Tyr Ile Glu Gly Gln
180 185 190
Ser Ile Gly Ile Ile Pro Pro Gly Leu Asp Lys Asn Gly Lys Pro Glu
195 200 205
Lys Leu Arg Leu Tyr Ser Ile Ala Ser Thr Arg His Gly Asp Asp Val
210 215 220
Asp Asp Lys Thr Val Ser Leu Cys Val Arg Gln Leu Glu Tyr Lys His
225 230 235 240
Pro Glu Thr Gly Glu Thr Val Tyr Gly Val Cys Ser Thr His Leu Cys
245 250 255
Phe Leu Lys Pro Gly Glu Glu Val Lys Ile Thr Gly Pro Val Gly Lys
260 265 270
Glu Met Leu Leu Pro Asn Asp Pro Asp Ala Asn Val Ile Met Met Ala
275 280 285
Thr Gly Thr Gly Ile Ala Pro Met Arg Ala Tyr Leu Trp Arg Gln Phe
290 295 300
Lys Asp Ala Glu Arg Ala Ala Asn Pro Glu Tyr Gln Phe Lys Gly Phe
305 310 315 320
Ser Trp Leu Ile Phe Gly Val Pro Thr Thr Pro Asn Leu Leu Tyr Lys
325 330 335
Glu Glu Leu Glu Glu Ile Gln Gln Lys Tyr Pro Glu Asn Phe Arg Leu
340 345 350
Thr Ala Ala Ile Ser Arg Glu Gln Lys Asn Pro Gln Gly Gly Arg Met
355 360 365
Tyr Ile Gln Asp Arg Val Ala Glu His Ala Asp Glu Leu Trp Gln Leu
370 375 380
Ile Lys Asn Glu Lys Thr His Thr Tyr Ile Cys Gly Leu Arg Gly Met
385 390 395 400
Glu Glu Gly Ile Asp Ala Ala Leu Thr Ala Ala Ala Ala Lys Glu Gly
405 410 415
Val Thr Trp Ser Asp Tyr Gln Lys Gln Leu Lys Lys Ala Gly Arg Trp
420 425 430
His Val Glu Thr Tyr
435
<210> 89
<211> 300
<212> DNA
<213> Nostoc punctiforme
<400> 89
atgccaactt ataaagtgac actaattaac gaggctgaag ggctgaacac aacccttgat 60
gttgaggacg atacctatat tctagacgca gctgaagaag ctggtattga cctgccctac 120
tcttgccgcg ctggtgcttg ctctacttgt gcaggtaaac tcgtatcagg taccgtcgat 180
caaggcgatc aatcattctt agatgacgat caaatagaag ctggatatgt actgacctgt 240
gttgcttacc caacttctaa tgtcacgatc gaaactcaca aagaagaaga actctattaa 300
<210> 90
<211> 99
<212> PRT
<213> Nostoc punctiforme
<400> 90
Met Pro Thr Tyr Lys Val Thr Leu Ile Asn Glu Ala Glu Gly Leu Asn
1 5 10 15
Thr Thr Leu Asp Val Glu Asp Asp Thr Tyr Ile Leu Asp Ala Ala Glu
20 25 30
Glu Ala Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ala Cys Ser
35 40 45
Thr Cys Ala Gly Lys Leu Val Ser Gly Thr Val Asp Gln Gly Asp Gln
50 55 60
Ser Phe Leu Asp Asp Asp Gln Ile Glu Ala Gly Tyr Val Leu Thr Cys
65 70 75 80
Val Ala Tyr Pro Thr Ser Asn Val Thr Ile Glu Thr His Lys Glu Glu
85 90 95
Glu Leu Tyr
<210> 91
<211> 369
<212> DNA
<213> Nostoc punctiforme
<400> 91
atgtcccgta catacacaat taaagttcgc gatcgcgcca ctggcaaaac acacacccta 60
aaagtgccag aagaccgtta tatcctgcac actgccgaaa aacaaggtgt ggaactaccg 120
ttttcctgtc gcaacggagc ttgcaccgct tgtgctgtga gggtattgtc aggagaaatt 180
tatcaaccag aggcgatcgg attgtcacca gatttacgtc agcaaggtta tgccctgttg 240
tgtgtgagtt atccccgttc tgacttggaa gtagagacac aagacgaaga tgaagtctac 300
gaactccagt ttgggcgcta ttttgctaag gggaaagtta aagcgggttt accgttagat 360
gaggaataa 369
<210> 92
<211> 122
<212> PRT
<213> Nostoc punctiforme
<400> 92
Met Ser Arg Thr Tyr Thr Ile Lys Val Arg Asp Arg Ala Thr Gly Lys
1 5 10 15
Thr His Thr Leu Lys Val Pro Glu Asp Arg Tyr Ile Leu His Thr Ala
20 25 30
Glu Lys Gln Gly Val Glu Leu Pro Phe Ser Cys Arg Asn Gly Ala Cys
35 40 45
Thr Ala Cys Ala Val Arg Val Leu Ser Gly Glu Ile Tyr Gln Pro Glu
50 55 60
Ala Ile Gly Leu Ser Pro Asp Leu Arg Gln Gln Gly Tyr Ala Leu Leu
65 70 75 80
Cys Val Ser Tyr Pro Arg Ser Asp Leu Glu Val Glu Thr Gln Asp Glu
85 90 95
Asp Glu Val Tyr Glu Leu Gln Phe Gly Arg Tyr Phe Ala Lys Gly Lys
100 105 110
Val Lys Ala Gly Leu Pro Leu Asp Glu Glu
115 120
<210> 93
<211> 321
<212> DNA
<213> Nostoc punctiforme
<400> 93
atgcccaaaa cttacaccgt agaaatcgat catcaaggca aaattcatac cttgcaagtt 60
cctgaaaatg aaacgatctt atcagttgcc gatgctgctg gtttggaact gccgagttct 120
tgtaatgcag gtgtttgcac aacttgcgcc ggtcaaataa gccagggaac tgtggatcaa 180
actgatggca tgggcgttag tccagattta caaaagcaag gttacgtatt gctttgtgtt 240
gcgaaacccc tttctgattt gaaacttgaa acagaaaagg aagacatagt ttatcagtta 300
caatttggca aagacaaata a 321
<210> 94
<211> 106
<212> PRT
<213> Nostoc punctiforme
<400> 94
Met Pro Lys Thr Tyr Thr Val Glu Ile Asp His Gln Gly Lys Ile His
1 5 10 15
Thr Leu Gln Val Pro Glu Asn Glu Thr Ile Leu Ser Val Ala Asp Ala
20 25 30
Ala Gly Leu Glu Leu Pro Ser Ser Cys Asn Ala Gly Val Cys Thr Thr
35 40 45
Cys Ala Gly Gln Ile Ser Gln Gly Thr Val Asp Gln Thr Asp Gly Met
50 55 60
Gly Val Ser Pro Asp Leu Gln Lys Gln Gly Tyr Val Leu Leu Cys Val
65 70 75 80
Ala Lys Pro Leu Ser Asp Leu Lys Leu Glu Thr Glu Lys Glu Asp Ile
85 90 95
Val Tyr Gln Leu Gln Phe Gly Lys Asp Lys
100 105
<210> 95
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 95
cgcggatccc ttgattctac tgcggcgagt 30
<210> 96
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 96
cacgcaccta ggttcacact cccatggtat aacaggggcg ttggactcct gtg 53
<210> 97
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 97
gttataccat gggagtgtga acctaggtgc gtggccgaca ggatagggcg tgt 53
<210> 98
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 98
cgcggatcca acgcatcctc actagtcggg 30
<210> 99
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 99
catgccatgg aaagccacgt tgtgtctcaa aatctctg 38
<210> 100
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 100
ctagtctaga gcgctgaggt ctgcctcgtg aa 32
Claims (65)
- 지방 알데히드를 생산하는 방법에 있어서,
(a) SEQ ID NO: 66, 70, 74, 76, 78, 80, 또는 82의 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환된 유전자 조작된 숙주 세포를 제공하는 단계로, 상기 폴리펩티드는 환원효소 활성을 가지는 단계;
(b) 탄소 공급원을 포함하는 배양 배지에서 상기 폴리뉴클레오티드 서열을 발현시키는데 유효한 조건 하에서 상기 유전자 조작된 숙주 세포를 배양하는 단계; 및
(c) 상기 유전자 조작된 숙주 세포에서 지방 알데히드를 생산하는 단계를
포함하는 것을 특징으로 하는 방법. - 지방 알데히드를 생산하는 방법에 있어서,
(a) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 폴리뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환된 유전자 조작된 숙주 세포로, 상기 폴리뉴클레오티드는 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 유전자 조작된 숙주세포를 제공하는 단계;
(b) 탄소 공급원을 포함하는 배양 배지에서 상기 폴리뉴클레오티드 서열을 발현시키는데 유효한 조건 하에서 상기 유전자 조작된 숙주세포를 배양하는 단계; 및
(c) 상기 유전자 조작된 숙주 세포에서 지방 알데히드를 생산하는 단계를
포함하는 것을 특징으로 하는 방법. - 청구항 1 또는 청구항 2에 있어서,
세포 배양액(culture)으로부터 지방 알데히드를 분리하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 청구항 3에 있어서,
재조합 벡터는 상기 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함하는 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 유전자 조작된 숙주 세포 배양액은 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 지방 알데히드를 포함하는 것을 특징으로 하는 방법. - 청구항 5에 있어서,
상기 지방 알데히드는 C10, C12, C14 또는 C16 알데히드인 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 지방 알데히드는 C13-C21 지방 알데히드를 포함하는 것을 특징으로 하는 방법. - 청구항 7에 있어서,
상기 지방 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 및 메틸옥타데세날로 구성된 군에서 선택되는 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 지방 알데히드는 불포화 지방 알데히드인 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 지방 알데히드는 포화 지방 알데히드인 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 지방 알데히드는 상기 배양 배지에서 발견되는 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 지방 알데히드는 배양액에서 추출된 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 숙주세포에서 지방 알코올을 생산하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 숙주세포에서 재조합 알코올 탈수소효소를 인코딩하는 유전자를 발현시키는 단계를 더 포함하는 것을 특징으로 하는 방법. - 청구항 13 또는 청구항 14에 있어서,
상기 지방 알코올은 숙주 세포에 의해 분비되는 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 C6-C26 지방 알코올을 포함하는 것을 특징으로 하는 방법. - 청구항 16에 있어서,
상기 지방 알코올은 1-데카놀, 1-도데카놀, 1-미리스틸 알코올, 1-헥사데카놀, 옥타데세놀, 테트라데세놀, 또는 헥사데세놀인 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 직쇄형(straight chain) 지방 알코올을 포함하는 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 분지쇄형(branched chain) 지방 알코올을 포함하는 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 환형 모이어티를 포함하는 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 불포화 지방 알코올인 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 단일불포화 지방 알코올인 것을 특징으로 하는 방법. - 청구항 13에 있어서,
상기 지방 알코올은 포화 지방 알코올인 것을 특징으로 하는 방법. - 지방 알데히드 또는 지방 알코올을 생산하는데 사용하기 위한 비-인간(non-human) 숙주 세포로,
(a) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 핵산 서열을 포함하는 폴리뉴클레오티드로, 상기 핵산 서열은 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 폴리뉴클레오티드, 또는
(b) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 핵산 서열의 보체(complement) 또는 이의 단편과 혼성화하는 폴리뉴클레오티드로, 상기 폴리뉴클레오티드는 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
로 구성된 군에서 선택되는 폴리뉴클레오티드를 발현시키도록 유전자 조작된 세포. - 청구항 24에 있어서,
상기 폴리뉴클레오티드는 재조합 벡터에 의해 포함되는 것을 특징으로 하는 비-인간 숙주 세포. - 청구항 24에 있어서,
상기 폴리뉴클레오티드는 숙주 세포의 게놈 DNA에 안정적으로 통합되는 것을 특징으로 하는 비-인간 숙주 세포. - 청구항 24에 있어서,
상기 숙주 세포는 미생물 세포인 것을 특징으로 하는 비-인간 숙주 세포. - 청구항 24에 있어서,
상기 숙주 세포는 세균 세포인 것을 특징으로 하는 비-인간 숙주 세포. - 청구항 28에 있어서,
상기 숙주 세포는 에스체리키아 (Escherichia) 세포 또는 남조류 세포인 것을 특징으로 하는 비-인간 숙주 세포. - 청구항 24에 있어서,
상기 환원효소 활성은 아실-ACP 또는 아실-CoA 환원효소 활성인 것을 특징으로 하는 비-인간 숙주 세포. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US5395508P | 2008-05-16 | 2008-05-16 | |
US61/053,955 | 2008-05-16 | ||
PCT/US2009/044409 WO2009140696A2 (en) | 2008-05-16 | 2009-05-18 | Methods and compositions for producing hydrocarbons |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110019745A KR20110019745A (ko) | 2011-02-28 |
KR101735549B1 true KR101735549B1 (ko) | 2017-05-16 |
Family
ID=41056736
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107028136A KR101739511B1 (ko) | 2008-05-16 | 2009-05-18 | 탄화수소를 생산하기 위한 방법과 조성물 |
KR1020107028190A KR101735549B1 (ko) | 2008-05-16 | 2009-05-18 | 탄화수소를 생산하기 위한 방법과 조성물 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107028136A KR101739511B1 (ko) | 2008-05-16 | 2009-05-18 | 탄화수소를 생산하기 위한 방법과 조성물 |
Country Status (11)
Country | Link |
---|---|
US (11) | US8323924B2 (ko) |
EP (5) | EP2288694B1 (ko) |
JP (2) | JP2011520455A (ko) |
KR (2) | KR101739511B1 (ko) |
CN (5) | CN105112455B (ko) |
AU (2) | AU2009246082A1 (ko) |
BR (2) | BR122020013701B1 (ko) |
CA (3) | CA2722442C (ko) |
ES (4) | ES2667469T3 (ko) |
MX (3) | MX350285B (ko) |
WO (2) | WO2009140695A1 (ko) |
Families Citing this family (112)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100242345A1 (en) | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
US8110670B2 (en) * | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
DK2262901T3 (en) | 2008-03-05 | 2019-01-21 | Genomatica Inc | ORGANISMS PRODUCING PRIMARY ALCOHOL |
BR122020013701B1 (pt) | 2008-05-16 | 2021-06-01 | Genomatica, Inc | Microorganismo geneticamente modificado para produção de um hidrocarboneto, método de produção de um alcano ou alceno e cultura de células |
US20110146142A1 (en) * | 2008-08-18 | 2011-06-23 | Ls9, Inc. | Systems and methods for production of mixed fatty esters |
CA3038491A1 (en) * | 2008-10-07 | 2010-04-15 | REG Life Sciences, LLC | Bacterial host cells engineered to express a carboxylic acid reductase and a thioesterase |
ES2701501T3 (es) | 2008-10-28 | 2019-02-22 | Reg Life Sciences Llc | Célula microbiana para producir alcoholes grasos |
WO2013082309A1 (en) * | 2011-11-29 | 2013-06-06 | Kiverdi, Inc. | Process for growing natural or engineered high lipid accumulating strain on crude glycerol and/or other sources of waste carbon for the production of oils, fuels, oleochemicals, and other valuable organic compounds |
US9957534B2 (en) * | 2008-11-06 | 2018-05-01 | Kiverdi, Inc. | Engineered CO2-fixing chemotrophic microorganisms producing carbon-based products and methods of using the same |
US9879290B2 (en) * | 2008-11-06 | 2018-01-30 | Kiverdi, Inc. | Industrial fatty acid engineering general system for modifying fatty acids |
US20150017694A1 (en) * | 2008-11-06 | 2015-01-15 | Kiverdi, Inc. | Engineered CO2-Fixing Chemotrophic Microorganisms Producing Carbon-Based Products and Methods of Using the Same |
CN102325864B (zh) | 2008-12-23 | 2016-01-27 | Reg生命科学有限责任公司 | 硫酯酶相关的方法和组合物 |
CA2758301A1 (en) * | 2009-04-10 | 2010-10-14 | Ls9, Inc. | Production of fatty acid derivatives |
CN102459622B (zh) | 2009-04-27 | 2020-08-18 | 基因组股份公司 | 脂肪酸酯的产生 |
EP2449124B1 (en) | 2009-06-30 | 2015-05-27 | Codexis, Inc. | Production of fatty alcohols with fatty alcohol forming acyl-coa reductases (far) |
AU2012200694B2 (en) * | 2009-07-09 | 2012-11-01 | Joule Unlimited Technologies, Inc. | Methods and compositions for the recombinant biosynthesis of N-alkanes |
US7794969B1 (en) | 2009-07-09 | 2010-09-14 | Joule Unlimited, Inc. | Methods and compositions for the recombinant biosynthesis of n-alkanes |
AU2011204785B2 (en) * | 2009-07-09 | 2013-08-15 | Joule Unlimited Technologies, Inc. | Methods and compositions for the recombinant biosynthesis of N-alkanes |
US7955820B1 (en) | 2009-07-09 | 2011-06-07 | Joule Unlimited, Inc. | Methods and compositions for the recombinant biosynthesis of n-alkanes |
CN105969710A (zh) * | 2009-09-25 | 2016-09-28 | Reg生命科学有限责任公司 | 脂肪酸衍生物的产生 |
EP2480673B1 (en) | 2009-09-27 | 2018-05-23 | OPX Biotechnologies, Inc. | Method for producing 3-hydroxypropionic acid and other products |
US20110124071A1 (en) * | 2009-11-17 | 2011-05-26 | LS9, Inc | Methods and compositions for producing hydrocarbons |
WO2011069105A2 (en) | 2009-12-04 | 2011-06-09 | Richard Allen Kohn | Process for producing fermentation products and fermentation medium compositions therefor |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
US8859259B2 (en) | 2010-02-14 | 2014-10-14 | Ls9, Inc. | Surfactant and cleaning compositions comprising microbially produced branched fatty alcohols |
AR084377A1 (es) * | 2010-04-08 | 2013-05-15 | Ls9 Inc | Metodos y composiciones relacionados con enzimas de alcohol graso biosintetico |
JP5723977B2 (ja) * | 2010-06-10 | 2015-05-27 | コリア アドバンスド インスティチュート オブ サイエンス アンド テクノロジィ | 炭化水素生成能を有する変異微生物及びこれを利用した炭化水素の製造方法 |
WO2012006114A2 (en) | 2010-06-28 | 2012-01-12 | Codexis, Inc. | Fatty alcohol forming acyl reductases (fars) and methods of use thereof |
WO2012037285A2 (en) * | 2010-09-14 | 2012-03-22 | Joule Unlimited Technologies, Inc. | Methods and compositions for targeting heterologous integral membrane proteins to the cyanobacterial plasma membrane |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
US20140004580A1 (en) * | 2010-12-20 | 2014-01-02 | Matrix Genetics, Llc | Modified photosynthetic microorganisms for producing lipids |
US20130035513A1 (en) * | 2011-01-26 | 2013-02-07 | Ls9, Inc. | Methods and compositions for enhanced production of fatty aldehydes and fatty alcohols |
CA2827658A1 (en) * | 2011-02-17 | 2012-08-23 | The Procter & Gamble Company | Bio-based linear alkylphenyl sulfonates |
EP2678410B1 (en) | 2011-02-17 | 2017-09-13 | The Procter and Gamble Company | Composiitons comprising mixtures of c10-c13 alkylphenyl sulfonates |
MX2013010076A (es) | 2011-03-03 | 2014-04-07 | Tersus Pharmaceuticals Llc | Composiciones y metodos que comprenden c16:1n7 palmitoleato. |
WO2012129537A1 (en) | 2011-03-23 | 2012-09-27 | Joule Unlimited Technologies, Inc. | Photoalkanogens with increased productivity |
EP2691510A4 (en) | 2011-03-31 | 2014-11-12 | Exxonmobil Res & Eng Co | METABOLISM DIRECTIONS BY TRANSCRIPTION FACTOR OVEREXPRESSION |
US9334508B2 (en) | 2011-06-17 | 2016-05-10 | Invista North America S.A.R.L. | Methods of producing carboxylic acids |
AU2012272856A1 (en) | 2011-06-22 | 2013-05-02 | Genomatica, Inc. | Microorganisms for producing 1,4-butanediol and methods related thereto |
US9650653B2 (en) | 2011-06-30 | 2017-05-16 | Invista North America S.A.R.L. | Bioconversion process for producing nylon-7, nylon-7,7 and polyesters |
DE102011110945A1 (de) | 2011-08-15 | 2013-02-21 | Evonik Degussa Gmbh | Biotechnologisches Syntheseverfahren von organischen Verbindungen mit alkIL-Genprodukt |
DE112011105535B4 (de) | 2011-08-15 | 2018-08-16 | Toyota Jidosha Kabushiki Kaisha | Verfahren zum Herstellen eines Alkans und rekombinanter Mikroorganismus, der in der Lage ist, das Alkan zu synthetisieren |
DE102011110946A1 (de) | 2011-08-15 | 2016-01-21 | Evonik Degussa Gmbh | Biotechnologisches Syntheseverfahren von omegafunktionalisierten Carbonsäuren und Carbonsäure-Estern aus einfachen Kohlenstoffquellen |
CN102952818B (zh) | 2011-08-26 | 2016-03-02 | 中国科学院青岛生物能源与过程研究所 | 用于在蓝细菌中提高脂肪醇产量的构建体和方法 |
US20140370563A1 (en) * | 2011-08-26 | 2014-12-18 | Brookhaven Science Associates, Llc | Compositions and methods for the relief of inhibition of aldehyde decarbonylase |
MX355504B (es) | 2011-09-27 | 2018-04-19 | Exxonmobil Res & Eng Co | Éster de cera de proteína portadora de acil-acil sintasas. |
WO2013063513A1 (en) | 2011-10-27 | 2013-05-02 | The Regents Of The University Of California | Bacterial production of methyl ketones |
US9102960B2 (en) | 2011-12-16 | 2015-08-11 | Invista North America S.á.r.l. | Methods of producing 6-carbon chemicals via CoA-dependent carbon chain elongation associated with carbon storage |
US9102958B2 (en) | 2011-12-16 | 2015-08-11 | Invista North America S.á.r.l. | Methods of producing 6-carbon chemicals via CoA-dependent carbon chain elongation associated with carbon storage |
CN103194418B (zh) * | 2012-01-04 | 2014-09-03 | 武汉臻智生物科技有限公司 | 一种制备脂肪烷烃及其中间体烯烃的方法 |
US20130224818A1 (en) * | 2012-02-24 | 2013-08-29 | Shell Oil Company | Method for preparing a hydrocarbon |
US9096834B2 (en) | 2012-02-24 | 2015-08-04 | Exxonmobil Research And Engineering Company | Recombinant microorganisms comprising thioesterase and lysophosphatidic acid acyltransferase genes for fatty acid production |
EP2814972B1 (en) | 2012-02-24 | 2020-04-22 | ExxonMobil Research and Engineering Company | Enhanced production of fatty acids and fatty acid derivatives by recombinant microorganisms |
US9663799B2 (en) | 2012-02-27 | 2017-05-30 | Toyota Jidosha Kabushiki Kaisha | Hydrocarbon synthase gene and use thereof |
KR102353113B1 (ko) | 2012-04-02 | 2022-01-19 | 게노마티카 인코포레이티드 | 지방산 유도체들의 개선된 생산 |
US9163267B2 (en) | 2012-04-11 | 2015-10-20 | REG Life Sciences, LLC | Metathesis transformations of microbially-produced fatty acids and fatty acid derivatives |
US9181568B2 (en) | 2012-04-23 | 2015-11-10 | Exxonmobil Research And Engineering Company | Cell systems and methods for improving fatty acid synthesis by expression of dehydrogenases |
DE102012207921A1 (de) | 2012-05-11 | 2013-11-14 | Evonik Industries Ag | Mehrstufiges Syntheseverfahren mit Synthesegas |
IN2014DN09551A (ko) | 2012-05-17 | 2015-07-17 | Shell Int Research | |
AU2013262764B2 (en) | 2012-05-17 | 2015-08-20 | Shell Internationale Research Maatschappij B.V. | Methods and systems for processing biomass material |
WO2014012055A1 (en) * | 2012-07-13 | 2014-01-16 | Calysta Energy, Llc | Biorefinery system, methods and compositions thereof |
KR20150040359A (ko) | 2012-08-10 | 2015-04-14 | 오피엑스 바이오테크놀로지스, 인크. | 지방산 및 지방산 유도된 산물의 생산을 위한 미생물 및 방법 |
AU2013342143B2 (en) | 2012-11-09 | 2017-08-10 | Calysta, Inc. | Compositions and methods for biological production of fatty acid derivatives |
JP2016500261A (ja) | 2012-12-12 | 2016-01-12 | アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー | 脂肪酸誘導体のacp媒介性生産方法 |
BR112015013413A2 (pt) | 2012-12-14 | 2017-11-14 | Invista Tech Sarl | método para biosintetizar um produto e hospedeiro recombinante |
US9637764B2 (en) | 2012-12-31 | 2017-05-02 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals via carbon chain elongation associated with cyclohexane carboxylate synthesis |
EP2938730A2 (en) | 2012-12-31 | 2015-11-04 | Invista Technologies S.A R.L. | Methods of producing 6-carbon chemicals via methyl-ester shielded carbon chain elongation |
CN105026569A (zh) | 2012-12-31 | 2015-11-04 | 英威达技术有限责任公司 | 通过丙酮酸和琥珀酸半醛羟醛缩合生产7-碳化学物的方法 |
US9920336B2 (en) | 2012-12-31 | 2018-03-20 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals from long chain fatty acids via oxidative cleavage |
US9580731B2 (en) | 2012-12-31 | 2017-02-28 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals via c1 carbon chain elongation associated with coenzyme B synthesis |
EP2938733A2 (en) | 2012-12-31 | 2015-11-04 | Invista North America S.a.r.l. | Methods of producing 7-carbon chemicals via methyl-ester shielded carbon chain elongation |
EP2938734A2 (en) | 2012-12-31 | 2015-11-04 | Invista Technologies S.A R.L. | Methods of producing 7-carbon chemicals via aromatic compounds |
MX346830B (es) | 2013-01-16 | 2017-04-03 | Reg Life Sciences Llc | Acil-acp reductasa con propiedades mejoradas. |
US9034629B2 (en) | 2013-01-25 | 2015-05-19 | Joule Unlimited Technologies, Inc. | Recombinant synthesis of medium chain-length alkanes |
CA2904406C (en) * | 2013-03-07 | 2021-03-02 | REG Life Sciences, LLC | Downstream processing of fatty alcohol compositions produced by recombinant host cells |
US9267158B2 (en) | 2013-03-14 | 2016-02-23 | Intrexon Corporation | Biological production of multi-carbon compounds from methane |
WO2014146026A1 (en) | 2013-03-15 | 2014-09-18 | Opx Biotechnologies, Inc. | Bioproduction of chemicals |
EP2984490B1 (en) * | 2013-06-14 | 2020-05-20 | Genomatica, Inc. | Methods of producing omega-hydroxylated fatty acid derivatives |
EP3022310B1 (en) | 2013-07-19 | 2019-10-16 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
JP2016529259A (ja) | 2013-08-19 | 2016-09-23 | アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー | 部分精製された廃グリセロールの製造 |
US9469586B2 (en) | 2013-08-19 | 2016-10-18 | REG Life Sciences, LLC | Production of partially refined waste glycerol |
CA2923730C (en) | 2013-09-13 | 2023-03-14 | REG Life Sciences, LLC | Improved acetyl-coa carboxylase variants |
KR20210134820A (ko) | 2013-12-05 | 2021-11-10 | 게노마티카 인코포레이티드 | 지방족 아민의 미생물 생성 |
EP3739057A1 (en) | 2014-04-10 | 2020-11-18 | Genomatica, Inc. | Semisynthetic routes to organic compounds |
BR112016026461A2 (pt) | 2014-05-15 | 2017-12-12 | Invista Tech Sarl | métodos de produção de produtos químicos com 6 carbonos com uso de 2,6-diaminopimelato como precursor para 2-aminopimelato |
JP6034332B2 (ja) | 2014-05-30 | 2016-11-30 | トヨタ自動車株式会社 | 組換え微生物及び当該組換え微生物を用いた物質製造方法 |
JP6189793B2 (ja) | 2014-05-30 | 2017-08-30 | トヨタ自動車株式会社 | 組換え微生物及び当該組換え微生物を用いた物質製造方法 |
CN106574209B (zh) | 2014-06-09 | 2020-02-14 | 斯泰潘公司 | 用于冷水清洗的洗涤剂 |
WO2015195697A1 (en) | 2014-06-16 | 2015-12-23 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptides with improved properties |
US9920339B2 (en) | 2014-06-16 | 2018-03-20 | Invista North America S.A.R.L. | Methods, reagents and cells for biosynthesizing compounds |
CN106795530A (zh) | 2014-06-16 | 2017-05-31 | 英威达技术有限责任公司 | 用于生物合成化合物的方法、试剂和细胞 |
BR112016029375A2 (pt) | 2014-06-16 | 2017-10-17 | Invista Tech Sarl | métodos, reagentes e células para biossintetizar compostos |
US9816117B2 (en) | 2014-06-16 | 2017-11-14 | Invista North America S.A.R.L. | Methods, reagents and cells for biosynthesizing compounds |
CA2955370A1 (en) | 2014-07-18 | 2016-01-21 | REG Life Sciences, LLC | Microbial production of fatty diols |
EP2993228B1 (en) | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
EP3868890A1 (en) | 2015-11-18 | 2021-08-25 | Provivi, Inc. | Microorganisms for the production of insect pheromones and related compounds |
WO2017101987A1 (en) | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
WO2017214133A2 (en) | 2016-06-06 | 2017-12-14 | Provivi, Inc. | Semi-biosynthetic production of fatty alcohols and fatty aldehydes |
SI3795576T1 (sl) | 2016-09-14 | 2023-08-31 | Genomatica, Inc. | 1,3-maščobne spojine diola in njihovi glikozilirani derivati |
JP6607204B2 (ja) * | 2017-01-17 | 2019-11-20 | トヨタ自動車株式会社 | アルカン合成能を有する組換え微生物及びアルカンの製造方法 |
EP3577227A4 (en) | 2017-02-02 | 2020-12-30 | Cargill Inc. | GENETICALLY MODIFIED CELLS PRODUCING C6-C10 FATTY ACID DERIVATIVES |
JP2018143192A (ja) * | 2017-03-08 | 2018-09-20 | 花王株式会社 | 脂肪族アルコールの生産方法 |
EP3607059A2 (en) | 2017-04-03 | 2020-02-12 | Genomatica, Inc. | Thioesterase variants having improved activity for the production of medium-chain fatty acid derivatives |
BR112019024258A2 (pt) | 2017-05-17 | 2020-08-18 | Provivi, Inc. | Microorganismos yarrowia lipolytica recombinante e método para produzir um c6-c24 álcool graxo mono- ou poliinsaturado a partir de uma fonte endógena ou exógena de c6-c24 ácidograxo saturado |
CN109207415B (zh) | 2017-07-07 | 2022-09-16 | 苏州华赛生物工程技术有限公司 | 一种生产胞二磷胆碱的重组微生物及生产胞二磷胆碱的方法 |
US11541105B2 (en) | 2018-06-01 | 2023-01-03 | The Research Foundation For The State University Of New York | Compositions and methods for disrupting biofilm formation and maintenance |
JP2020080705A (ja) * | 2018-11-22 | 2020-06-04 | トヨタ自動車株式会社 | 変異型デカルボニラーゼ遺伝子、当該変異型デカルボニラーゼ遺伝子を有する組換え微生物及びアルカンの製造方法 |
CN109486835B (zh) * | 2018-12-05 | 2022-02-11 | 中国科学院合肥物质科学研究院 | 一种源于蓝藻的产烷烃关键基因突变子及其应用 |
JP7131416B2 (ja) * | 2019-02-01 | 2022-09-06 | トヨタ自動車株式会社 | 変異型デカルボニラーゼ遺伝子、当該変異型デカルボニラーゼ遺伝子を有する組換え微生物及びアルカンの製造方法 |
JP2020141560A (ja) | 2019-03-04 | 2020-09-10 | トヨタ自動車株式会社 | 新規アルデヒド合成酵素遺伝子、当該遺伝子を有する組換え微生物及びこれを用いたアルカンの製造方法 |
WO2023178193A1 (en) | 2022-03-16 | 2023-09-21 | Genomatica, Inc. | Acyl-acp thioesterase variants and uses thereof |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3149170A1 (de) | 1980-12-15 | 1982-07-29 | Institut Français du Pétrole, 92502 Rueil-Malmaison, Hauts-de-Seine | Brennbare komposition, welche gasoel, methanol und einen fettsaeureester enthalten und als dieseltreibstoff brauchbar sind |
US5482846A (en) | 1988-08-31 | 1996-01-09 | University Of Florida | Ethanol production in Gram-positive microbes |
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5028539A (en) | 1988-08-31 | 1991-07-02 | The University Of Florida | Ethanol production using engineered mutant E. coli |
US7053267B2 (en) | 1990-03-16 | 2006-05-30 | Calgene Llc | Plant seed oils |
EP0528881A4 (en) | 1990-04-24 | 1993-05-26 | Stratagene | Methods for phenotype creation from multiple gene populations |
EP0563191B2 (en) | 1990-12-20 | 2000-01-19 | E.I. Du Pont De Nemours And Company | Nucleotide sequences of soybean acyl-acp thioesterase genes |
CA2079113A1 (en) * | 1991-02-22 | 1992-08-23 | Calgene, Inc. | Seed plant fatty acyl reductase proteins and genes |
EP0700376A4 (en) | 1993-05-25 | 1996-05-22 | Auckland Uniservices Ltd | NITROBENZILE MUSTARD QUARTERARY SALTS AND THEIR USE AS CYTOTOXIC AGENTS SELECTIVELY ACTING AGAINST HYPOXIA |
US6583266B1 (en) | 1993-08-19 | 2003-06-24 | Genome Therapeutics Corporation | Nucleic acid and amino acid sequences relating to mycobacterium tuberculosis and leprae for diagnostics and therapeutics |
US5807893A (en) | 1993-11-18 | 1998-09-15 | Voelker; Toni Alois | Plant thioesterases and use for modification of fatty acid composition in plant seed oils |
US5602030A (en) | 1994-03-28 | 1997-02-11 | University Of Florida Research Foundation | Recombinant glucose uptake system |
WO1998055632A1 (en) | 1997-06-05 | 1998-12-10 | Calgene Llc | FATTY ACYL-CoA: FATTY ALCOHOL ACYLTRANSFERASES |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US20080178519A1 (en) | 1996-11-18 | 2008-07-31 | Bp Oil International Limited | Fuel composition |
RU2212447C2 (ru) | 2000-04-26 | 2003-09-20 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Штамм escherichia coli - продуцент аминокислоты (варианты) и способ получения аминокислот (варианты) |
US7786355B2 (en) * | 2000-11-17 | 2010-08-31 | Metabolix, Inc. | Production of medium chain length polyhydroxyalkanoates from fatty acid biosynthetic pathways |
AU2002302919A1 (en) | 2001-02-22 | 2002-10-03 | Institut Pasteur | Comparative mycobacterial geneomics as a tool for identifying targets for the diagnosis, prophylaxis or treatment of mycobacterioses |
US6686133B2 (en) | 2001-03-29 | 2004-02-03 | Agfa-Gevaert | Photothermographic materials processable at lower temperatures and recording processes therefor |
US7314974B2 (en) | 2002-02-21 | 2008-01-01 | Monsanto Technology, Llc | Expression of microbial proteins in plants for production of plants with improved properties |
WO2003074676A2 (en) | 2002-03-01 | 2003-09-12 | Monsanto Technology Llc | Wax ester synthase dna sequence, protein and uses thereof |
US7056714B2 (en) * | 2003-03-11 | 2006-06-06 | University Of Iowa Research Foundation, Inc. | Carboxylic acid reductase polypeptide, nucleotide sequence encoding same and methods of use |
US7070958B2 (en) | 2003-04-18 | 2006-07-04 | Thrombolytic Science, Inc. | Methods of making pro-urokinase mutants |
US7608700B2 (en) | 2004-03-08 | 2009-10-27 | North Carolina State University | Lactobacillus acidophilus nucleic acid sequences encoding stress-related proteins and uses therefor |
CA2554948A1 (en) | 2004-03-18 | 2005-09-22 | Sca Hygiene Products Ab | Method and device for producing a multi-ply web of flexible material, such as paper and nonwoven, and multi-ply material produced by the method |
BRPI0510115B1 (pt) | 2004-05-21 | 2022-09-27 | The Regents Of The University Of California | Método para produzir um isoprenóide ou precursor de isoprenóide através de uma via de mevalonato em escherichia coli e célula hospedeira geneticamente modificada que os produz |
US7756833B2 (en) * | 2004-09-22 | 2010-07-13 | Microsoft Corporation | Method and system for synthetic backup and restore |
US7960519B2 (en) | 2005-05-31 | 2011-06-14 | Pierce Biotechnology, Inc. | Extraction of cellular components with fatty acid derivatives |
FR2888034B1 (fr) | 2005-06-29 | 2010-10-08 | Philippe Magnier | Dispositif de prevention contre l'explosion d'un transformateur electrique |
WO2007022169A1 (en) | 2005-08-15 | 2007-02-22 | Arizona Chemical Company | Low sulfur tall oil fatty acid |
US7482480B2 (en) * | 2005-10-10 | 2009-01-27 | Council Of Scientific & Industrial Research | Process for the preparation of hydrocarbon fuel |
US7998339B2 (en) * | 2005-12-12 | 2011-08-16 | Neste Oil Oyj | Process for producing a hydrocarbon component |
AU2006325187B2 (en) * | 2005-12-12 | 2010-05-13 | Neste Oil Oyj | Base oil |
US8535916B2 (en) | 2006-02-13 | 2013-09-17 | Ls9, Inc. | Modified microorganisms and uses therefor |
ITTO20060239A1 (it) | 2006-03-30 | 2007-09-30 | Rotthapharm S P A | Formulazione per somministrazione orale con effetti salutistici sull'apparato cardiovascolare |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US20100242345A1 (en) * | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
CN101490241A (zh) * | 2006-05-19 | 2009-07-22 | Ls9公司 | 脂肪酸及其衍生物的制备 |
EP2157170B1 (en) * | 2006-05-19 | 2014-01-15 | LS9, Inc. | Production of fatty acids and derivatives thereof |
WO2007142784A1 (en) | 2006-05-31 | 2007-12-13 | Archer-Daniels-Midland Company | Enzymatic method of making aldehydes from fatty acids |
DE102006054324A1 (de) | 2006-11-17 | 2008-05-21 | Robert Bosch Gmbh | Verfahren zur bildbasierten Vermessung |
WO2008113041A2 (en) | 2007-03-14 | 2008-09-18 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
CN106987532B (zh) * | 2007-03-28 | 2021-06-08 | 基因组股份公司 | 提高脂肪酸衍生物的产量 |
MY154965A (en) * | 2007-06-01 | 2015-08-28 | Solazyme Inc | Production of oil in microorganisms |
US7897369B2 (en) | 2007-08-27 | 2011-03-01 | Regents Of The University Of Minnesota | Isoprenoid wax ester synthases, isoprenoid acyl CoA-synthetases, and uses thereof |
AU2008304180B2 (en) * | 2007-09-27 | 2014-02-27 | Genomatica, Inc. | Reduction of the toxic effect of impurities from raw materials by extractive fermentation |
TWI351779B (en) | 2007-12-03 | 2011-11-01 | Advance Smart Ind Ltd | Apparatus and method for correcting residual capac |
WO2009085278A1 (en) | 2007-12-21 | 2009-07-09 | Ls9, Inc. | Methods and compositions for producing olefins |
DK2262901T3 (en) | 2008-03-05 | 2019-01-21 | Genomatica Inc | ORGANISMS PRODUCING PRIMARY ALCOHOL |
BR122020013701B1 (pt) | 2008-05-16 | 2021-06-01 | Genomatica, Inc | Microorganismo geneticamente modificado para produção de um hidrocarboneto, método de produção de um alcano ou alceno e cultura de células |
US8232924B2 (en) | 2008-05-23 | 2012-07-31 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
WO2010021711A1 (en) | 2008-08-18 | 2010-02-25 | Ls9, Inc. | Systems and methods for the production of mixed fatty esters |
CA3038491A1 (en) | 2008-10-07 | 2010-04-15 | REG Life Sciences, LLC | Bacterial host cells engineered to express a carboxylic acid reductase and a thioesterase |
ES2701501T3 (es) | 2008-10-28 | 2019-02-22 | Reg Life Sciences Llc | Célula microbiana para producir alcoholes grasos |
CN102325864B (zh) | 2008-12-23 | 2016-01-27 | Reg生命科学有限责任公司 | 硫酯酶相关的方法和组合物 |
WO2010118410A1 (en) | 2009-04-10 | 2010-10-14 | Ls9, Inc. | Production of fatty acid derivatives |
CA2758301A1 (en) | 2009-04-10 | 2010-10-14 | Ls9, Inc. | Production of fatty acid derivatives |
CN102459622B (zh) | 2009-04-27 | 2020-08-18 | 基因组股份公司 | 脂肪酸酯的产生 |
WO2010127318A2 (en) | 2009-05-01 | 2010-11-04 | The Regents Of The University Of California | Product of fatty acid esters from biomass polymers |
US7955820B1 (en) * | 2009-07-09 | 2011-06-07 | Joule Unlimited, Inc. | Methods and compositions for the recombinant biosynthesis of n-alkanes |
US7794969B1 (en) * | 2009-07-09 | 2010-09-14 | Joule Unlimited, Inc. | Methods and compositions for the recombinant biosynthesis of n-alkanes |
CN105969710A (zh) | 2009-09-25 | 2016-09-28 | Reg生命科学有限责任公司 | 脂肪酸衍生物的产生 |
US20110124071A1 (en) | 2009-11-17 | 2011-05-26 | LS9, Inc | Methods and compositions for producing hydrocarbons |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
US8859259B2 (en) | 2010-02-14 | 2014-10-14 | Ls9, Inc. | Surfactant and cleaning compositions comprising microbially produced branched fatty alcohols |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
US20130084608A1 (en) | 2011-09-30 | 2013-04-04 | Codexis, Inc. | Fungal proteases |
-
2009
- 2009-05-18 BR BR122020013701-0A patent/BR122020013701B1/pt active IP Right Grant
- 2009-05-18 CN CN201510578739.5A patent/CN105112455B/zh active Active
- 2009-05-18 AU AU2009246082A patent/AU2009246082A1/en not_active Abandoned
- 2009-05-18 EP EP09747776.4A patent/EP2288694B1/en active Active
- 2009-05-18 ES ES09747776.4T patent/ES2667469T3/es active Active
- 2009-05-18 EP EP15153942.6A patent/EP2927315B1/en active Active
- 2009-05-18 WO PCT/US2009/044403 patent/WO2009140695A1/en active Application Filing
- 2009-05-18 EP EP15179791.7A patent/EP2998393B1/en active Active
- 2009-05-18 KR KR1020107028136A patent/KR101739511B1/ko active IP Right Grant
- 2009-05-18 CN CN201510870936.4A patent/CN105483068A/zh active Pending
- 2009-05-18 JP JP2011509796A patent/JP2011520455A/ja not_active Ceased
- 2009-05-18 MX MX2016013850A patent/MX350285B/es unknown
- 2009-05-18 CA CA2722442A patent/CA2722442C/en active Active
- 2009-05-18 CA CA3101888A patent/CA3101888A1/en not_active Abandoned
- 2009-05-18 CN CN2009801176639A patent/CN102027108A/zh active Pending
- 2009-05-18 AU AU2009246083A patent/AU2009246083A1/en not_active Abandoned
- 2009-05-18 ES ES15153942T patent/ES2696773T3/es active Active
- 2009-05-18 MX MX2010012192A patent/MX2010012192A/es active IP Right Grant
- 2009-05-18 JP JP2011509795A patent/JP2011522525A/ja not_active Ceased
- 2009-05-18 WO PCT/US2009/044409 patent/WO2009140696A2/en active Application Filing
- 2009-05-18 EP EP09747777.2A patent/EP2283121B1/en active Active
- 2009-05-18 EP EP18195170.8A patent/EP3483265B1/en active Active
- 2009-05-18 CN CN201510575363.2A patent/CN105112454B/zh active Active
- 2009-05-18 ES ES15179791.7T patent/ES2667718T3/es active Active
- 2009-05-18 KR KR1020107028190A patent/KR101735549B1/ko active IP Right Grant
- 2009-05-18 CN CN200980117664.3A patent/CN102027109B/zh active Active
- 2009-05-18 ES ES09747777.2T patent/ES2536194T3/es active Active
- 2009-05-18 MX MX2010012197A patent/MX343063B/es active IP Right Grant
- 2009-05-18 BR BRPI0912690-2A patent/BRPI0912690A2/pt not_active Application Discontinuation
- 2009-05-18 CA CA2722441A patent/CA2722441C/en active Active
-
2010
- 2010-02-22 US US12/710,237 patent/US8323924B2/en active Active
- 2010-02-22 US US12/710,238 patent/US8268599B2/en active Active
-
2012
- 2012-07-18 US US13/552,522 patent/US8658404B2/en active Active
- 2012-09-24 US US13/625,107 patent/US8846371B2/en active Active
-
2013
- 2013-10-23 US US14/061,512 patent/US9670512B2/en active Active
-
2014
- 2014-08-28 US US14/472,192 patent/US9481899B2/en active Active
-
2016
- 2016-10-04 US US15/284,727 patent/US10150975B2/en active Active
-
2017
- 2017-05-11 US US15/592,772 patent/US20180080053A1/en not_active Abandoned
-
2018
- 2018-12-04 US US16/209,711 patent/US10563231B2/en not_active Expired - Fee Related
-
2020
- 2020-01-07 US US16/736,405 patent/US11186854B2/en active Active
-
2021
- 2021-10-22 US US17/508,400 patent/US20220259623A1/en active Pending
Non-Patent Citations (6)
Title |
---|
Anabaena variabilis ATCC 29413, complete genome, GenBank: CP000117.1(2007.10.4)* |
Appl Microbiol Biotechnol. 1986, Vo.25, pp.52-54* |
conserved hypothetical protein [Anabaena variabilis ATCC 29413], GenBank: ABA22149.1(2007.10.4)* |
Journal of General Microbiology. 1983, Vol.129, pp.407-412* |
Synechococcus elongatus PCC 7942, complete genome, GenBank: CP000100.1(2005.11.8)* |
Synechocystis sp. PCC 6803 DNA, complete genome,GenBank: BA000022.2,(2007.12.27)* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101735549B1 (ko) | 탄화수소를 생산하기 위한 방법과 조성물 | |
US20110124071A1 (en) | Methods and compositions for producing hydrocarbons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
GRNT | Written decision to grant |