KR20220062331A - 알파-이오논 및 베타-이오논의 생합성 - Google Patents
알파-이오논 및 베타-이오논의 생합성 Download PDFInfo
- Publication number
- KR20220062331A KR20220062331A KR1020227011349A KR20227011349A KR20220062331A KR 20220062331 A KR20220062331 A KR 20220062331A KR 1020227011349 A KR1020227011349 A KR 1020227011349A KR 20227011349 A KR20227011349 A KR 20227011349A KR 20220062331 A KR20220062331 A KR 20220062331A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- nucleic acid
- leu
- ala
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P23/00—Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11051—9-Cis-epoxycarotenoid dioxygenase (1.13.11.51)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11069—Carlactone synthase (1.13.11.69)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/1107—All-trans-10'-apo-beta-carotenal 13,14-cleaving dioxygenase (1.13.11.70)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11071—Carotenoid-9',10'-cleaving dioxygenase (1.13.11.71)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13129—Beta-carotene 3-hydroxylase (1.14.13.129)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/102—Plasmid DNA for yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11063—Beta-carotene 15,15'-dioxygenase (1.13.11.63)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11068—9-Cis-beta-carotene 9',10'-cleaving dioxygenase (1.13.11.68)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01022—2-Acylglycerol O-acyltransferase (2.3.1.22)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Botany (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 명세서에는 아로마 화합물 알파-이오논 또는 베타-이오논을 제조하기 위한 재조합 핵산 분자, 핵산 작제물, 융합 효소, 형질전환된 숙주 세포, 및 방법이 제공된다.
Description
관련 출원
본 출원은 2019년 10월 4일자로 출원된 미국 특허 가출원 제62/911,116호를 우선권으로 주장하고, 이러한 문헌의 내용은 전문이 본 명세서에 참조에 의해 원용된다.
발명의 분야
본 발명의 분야는 알파-이오논(alpha-ionone) 및 베타-이오논과 같은 아로마 화합물을 포함하는 카로테노이드 화합물의 생합성 생산을 위한 조성물 및 공정에 관한 것이다. 더욱 구체적으로, 본 방법 및 공정은 카로테노이드 분열 다이옥시게나제(carotenoid cleavage dioxygenase: CCD) 도메인에 결합된 지질체 구획화 신호 태그(lipid body compartmentalization signal tag: LBT) 도메인을 갖는 융합 효소를 인코딩하는 이종 핵산을 포함하도록 형질전환된 미생물 숙주 세포를 사용한다.
소비자는 맛과 향이 좋은 식품, 방향제, 및 화장품을 요구한다. 여러 경우에, 이러한 유쾌한 냄새 및 맛의 특성은 이의 냄새 역치가 서브-ppb 범위이기 때문에, 특별한 아로마 특징을 갖는 알파-이오논 및 베타-이오논과 같은 카로테노이드의 유도체를 통해 제공된다. 알파-이오논 및 베타-이오논에 대한 현재 공급은 주로 식물로부터의 추출 공정 또는 화학적 합성을 통해 해결된다. 더 많은 소비자가 천연 구성성분을 선호하기 때문에, 천연 소스로부터의 이오논에 대한 시장 수요는 급격하게 증가하고 있다. 그러나, 알파-이오논 대략 1 그램을 생산하기 위해 대략 1백 톤의 라즈베리, 또는 20 헥타르의 농경지가 필요하다. 또한, 식물 추출-기반 생산은 관심 화합물의 강도 및 존재비에 대한 풍화 효과, 식물 질환 및/또는 낮은 수확의 위험, 화합물의 안정성, 증가된 생산의 환경적 영향, 및 무역 제한과 같은 상당한 단점을 갖는다. 구조적으로, 알파-이오논은 키랄 중심을 갖는다. 식물(예를 들어, 라즈베리)로부터의 천연 알파-이오논은 (R)-(+)-(E)-알파-이오논이다. 대조적으로, 화학적으로 합성된 α-이오논은 2개의 이성질체(R 및 S)를 갖는다(도 1). R-거울상 이성질체는 바이올렛-유사, 과일-유사 또는 라즈베리-유사 풍미로서 기술된, 독특하고 강한 플로랄 풍미(floral flavor) 및 아로마를 갖는 반면, S-거울상 이성질체는 베타-이오논과 유사한 목질 향미를 갖는다. 이에 따라, 화학적으로 합성된 알파-이오논은 라세믹 혼합물로서 존재하고, 2개의 상이한 향미를 갖는 거울상 이성질체를 함유한다. 이에 따라, 방향제 산업에 대한 이의 유용성이 제한된다. 신규한 방법이 (S)-알파-이오논 또는 (R)-알파-이오논의 거울상-선택적 합성에 대한 새로운 방법이 보고되었지만, 지금까지 보고된 합성된 (R)-알파-이오논의 최고 거울상 이성질체 순도는 약 97%인데, 이는 실질적인 양의 (S)-거울상 이성질체가 여전히 존재함을 의미한다. 또한, 화학적 합성 생산은 환경 문제를 야기시킬 수 있고, 독성 전구체를 사용할 수 있으며, 생산 공정 자체는 중요한 출발 물질 비용으로 인해 비용을 증가시킬 수 있다.
이에 따라, 식물 추출 및 화학적 합성에 의해 야기되는 한계 없이 경제적으로 및 신뢰성 있게 "천연" 알파-이오논 및 베타-이오논을 생산하는 신규한 방법이 당해 기술분야에서 요구되고 있다.
본 교시내용에 따르면, 알파-이오논 및 베타-이오논은 미생물 세포 배양물을 사용하는 효소 공학 및 발효 기술에 의해 고수율로 신뢰성 있게 생산될 수 있다. 이러한 미생물 세포 배양물은 "천연" 알파-이오논 또는 베타-이오논을 상업적으로 상당한 수율로 데노보 합성할 수 있다. 이에 따라, 새로운 생합성 방법은 본 명세서에서 알파-이오논 및 베타-이오논 생산 비용을 감소시키고 이러한 아로마 화합물이 통상적으로 추출되는 천연 소스의 대규모 재배 및 가공의 환경적 영향을 줄이기 위해 제공된다.
더욱 상세하게는, 본 교시내용은 미생물 발효에 의해 이오논 화합물(예를 들어, 알파-이오논, 베타-이오논)을 제조하기 위한 방법 및 조성물을 포함하고, 여기서, 이러한 방법 및 조성물은 카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 갖는 융합 효소를 인코딩하는 이종 핵산 분자로 진핵 세포의 형질전환을 포함한다.
알파-이오논 및 베타-이오논의 발효 생산은 이의 개개 전구체 엡실론-카로텐 또는 베타-카로텐을 분열시키는 반응 단계의 효율에 의해 방해되었다. 본 개시내용은 부분적으로, 특정 구획화 신호 태그가 지질체를 표적화할 수 있으며, 여기서, 엡실론-카로텐 및 베타-카로텐이 축적되어 이러한 지질체에 대한 CCD 효소의 결합 친화력을 증가시키고 이에 따라 CCD 효소의 촉매 효율을 급격하게 증가시킨다는 발견을 기초로 한 것이다. 지질체 구획화 신호 태그 융합된 CCD를 인코딩하는 핵산 분자의 과발현과 다양한 카로테노이드 전구체 생합성 유전자의 과발현을 조합함으로써, 이오논 화합물의 생산은 가용성 태그, 부위-지정 돌연변이유발의 사용과 같은 대체 전략보다 훨씬 더 높은 역가를 제공함으로써, 또는 EC-CCD 융합 효소를 단독으로 생성시킴으로써 개선될 수 있다. 이에 따라, 본 개시내용은 화학적 합성 또는 식물 추출과 관련된 단점 없이 "천연" 알파-이오논 및 베타-이오논을 생산하는 경제적이고 신뢰성 있는 방법을 제공한다.
일 양상에서, 본 교시내용은 이오논 화합물을 제조하기 위한 재조합 미생물 생산 숙주 세포에 관한 것이고, 여기서, 숙주 세포는 융합 효소를 인코딩하는 코딩 서열을 함유하는 적어도 하나의 핵산 작제물을 포함하고, 여기서, 융합 효소는 카로테노이드 분열 활성을 갖는 제2 도메인에 융합된 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인을 포함한다. 다양한 실시형태에서, 지질체 구획화 신호 태그(LBT)는 지질체 구조 단백질(예를 들어, 올레오신 및 칼레오신), 유지성 유도 지방구 단백질(oleaginicity inducing lipid droplet protein)(예를 들어, Oil1), 오렌지 카로테노이드-결합 단백질 및 막 수송체 단백질(예를 들어, 당 수송체, 예를 들어, STL1)일 수 있다. 제2 도메인은 카로테노이드 분열 다이옥시게나제(CCD) 또는 기능적 등가물, 예를 들어, 알파-이오논 및 베타-이오논을 제공하기 위해 엡실론-카로텐 및 베타-카로텐의 적절한 결합을 분열시킬 수 있는 다른 모노옥시게나제, 다이옥시게나제, 및 퍼옥시다제일 수 있다.
다양한 실시형태에서, 본 교시내용은 제1 핵산 서열 및 제2 핵산 서열을 포함하는 합성 또는 재조합 핵산 분자(즉, LBT-CCD 융합 효소 코딩 서열)에 관한 것이고, 여기서, 제1 핵산 서열 및 제2 핵산 서열은 함께 융합 효소를 인코딩하고, 여기서, 이러한 융합 효소는 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인 및 카로테노이드 분열 활성을 갖는 제2 도메인을 포함한다. 일부 실시형태에서, 지질체 구획화 신호 태그는 지질체 구조 단백질, 유지성-유도 지방구 단백질, 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택될 수 있다. 특정 실시형태에서, 지질체 구획화 신호 태그는 작은 지질체 구조 단백질, 예를 들어, 15 kDa 내지 26 kDa의 분자량을 갖는 지질체 구조 단백질일 수 있다. 예를 들어, 이의 분자량은 25 kDa 미만, 20 kDa 미만, 또는 대략 17 또는 18 kDa일 수 있다. 바람직한 실시형태에서, 융합 효소의 제1 도메인은 올레오신 또는 칼레오신일 수 있다. 특정 실시형태에서, 융합 효소의 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 아라비돕시스 탈리아나(Arabidopsis thaliana), 리시누스 콤뮤니스(Ricinus communis), 글리신 맥스(Glycine max), 세사뭄 인디쿰(Sesamum indicum), 코익스 라크리마(Coix lacryma), 아스퍼질러스 니게르(Aspergillus niger), 또는 뉴로스포라 크라사(Neurospora crassa)로부터의 칼레오신일 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 제아 메이즈(Zea mays) 16 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 2와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 17 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 4와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 림노스피라 막시마(Limnospira maxima) 오렌지 카로테노이드 결합 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 오렌지 카로테노이드 결합 단백질은 서열번호 5와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 6과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카(Yarrowia lipolytica) 막 수송체 Stl1p 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 막 수송체 Stl1p 단백질은 서열번호 7과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 8과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 지방구 단백질 Oil1p 또는 이의 기능성 변이체일 수 있다. 예를 들어, 지방구 단백질 Oil1p는 서열번호 9와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 10과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 아라비돕시스 탈리아나 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 아라비돕시스 탈리아나 칼레오신은 서열번호 31과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 32와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰은 서열번호 33과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 34와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, 본 교시내용에 따른 융합 효소는 용해도-향상 태그를 포함하지 않는다. 이러한 용해도-향상 태그의 예는 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(small ubiquitin-like modifier: SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함한다.
다양한 실시형태에서, 카로테노이드 분열 활성을 갖는 제2 도메인은 카로테노이드-분열 다이옥시게나제(CCD)일 수 있다. 예를 들어, CCD 효소는 광범위한 카로테노이드의 5,6(5', 6'), 7,8(7', 8') 및 9,10(9', 10') 이중 결합을 분열시킬 수 있는 CCD1 또는 CCD4 효소일 수 있다. 예를 들어, 제2 도메인은 페튜니아 x 하이브리다(Petunia x hybrida) CCD1(PhCCD1) 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 11과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 11의 아미노산 서열을 포함한다. 제2 또는 CCD 도메인은 서열번호 11의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 12 또는 서열번호 13과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다른 실시형태에서, 제2 도메인은 오스만투스 프라그란스(Osmanthus fragrans) CCD1 효소 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 14와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 14의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 14의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 15와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
또 다른 실시형태에서, 제2 도메인은 제아 메이즈 CCD1 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 16과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 16의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 16의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 17과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다른 실시형태에서, 제2 도메인은 다양한 시아노박테리아, 예를 들어, 비제한적으로, 노스토칼레스 시아노박테리움(Nostocales cyanobacterium), 칼로트릭스 종 칼로트릭스 브레비시마(Calothrix sp. Calothrix brevissima), 및 스키토네마 밀레이(Scytonema millei)로부터의, 카로테노이드 옥시게나제, 9-시스에폭시카로테노이드 다이옥시게나제, 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
일부 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리드, 오스만투스 프라그란스, 제아 메이즈, 아라비돕시스 탈리아나, 비티스 비니페라(Vitis vinifera), 다우쿠스 카로타(Daucus carota), 리코퍼시콘 에스쿨렌텀(Lycopersicon esculentum), 및 루부스 이다에우스(Rubus idaeus)로부터의 CCD1 효소를 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 아라비돕시스 탈리아나, 빅사 오렐라나 (Bixa Orellana), 크리산데뮴 모리폴리움(Chrysanthemum morifolium), 크로커스 사티부스(Crocus sativus), 무사 아쿠미나타(Musa acuminata), 말루스 도메스티카(Malus domestica), 프루누스 퍼시카(Prunus persica), 로사 다마센(Rosa damascene), 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함할 수 있다. 원하는 이오논 화합물이 알파-이오논인 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 크리산데뮴 모리폴리움으로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다. 원하는 이오논 화합물이 베타-이오논인 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 프루누스 퍼시카로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다.
다양한 실시형태에서, 핵산 분자는 일단부에서 제1 핵산 서열에 그리고 타단부에서 제2 핵산 서열에 작동 가능하게 연결된 제3 핵산 서열을 포함할 수 있으며, 여기서, 제3 핵산 서열은 제2 도메인에 제1 도메인을 결합하는 링커를 인코딩한다. 예를 들어, 링커는 길이가 3 내지 30개인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다.
본 교시내용의 다른 양상은 핵산 작제물에 관한 것이다. 핵산 작제물은 이종 핵산 서열에 작동 가능하게 연결된 상기에 기술된 핵산 분자의 다양한 실시형태를 포함할 수 있다. 예를 들어, 이종 핵산 서열은 발현 제어 서열, 예를 들어, 프로모터 서열을 인코딩할 수 있다. 일부 실시형태에서, 핵산 작제물은 또한, 리코펜 엡실론-사이클라제, 예를 들어, 락투카 사티바(Lactuca sativa) 리코펜 엡실론-사이클라제(EC) 또는 이의 기능적 상동체를 인코딩하는 이종 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 핵산 작제물은 또한, 파이토엔 신타제(CarRP)를 인코딩하는 이종 핵산 서열을 포함할 수 있다.
본 교시내용의 또 다른 양상은 본 명세서에 기술된 카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 포함하는 융합 효소에 관한 것이다. LBT 도메인은 링커를 통해 CCD 도메인에 결합될 수 있다. 예를 들어, 링커는 길이가 3 내지 30인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다. 다양한 실시형태에서, 융합 효소는 링커를 통해 CCD 도메인에 융합된 LBT 도메인으로 이루어질 수 있다.
본 교시내용의 또 다른 양상은 숙주 세포를 형질전환하는 방법에 관한 것일 수 있다. 본 방법은 숙주 세포에 전술한 임의의 본 핵산 분자 또는 핵산 작제물을 도입하고, 카로테노이드(예를 들어, 이오논) 화합물의 생산을 위해 사용될 수 있는 형질전화된 숙주 세포를 선택 또는 스크리닝하는 것을 포함할 수 있다. 일부 실시형태에서, 숙주 세포는 미생물 세포, 예를 들어, 박테리아 세포, 효모 세포, 조류(algal) 세포 또는 진균 세포일 수 있다. 다른 실시형태에서, 숙주 세포는 관심 카로테노이드 또는 이오논을 자연적으로 생산하지 않는 식물 세포일 수 있다. 특정 실시형태에서, 숙주 세포는 야로위아, 에스케리키아(Escherichia); 살모넬라(Salmonella); 바실러스(Bacillus); 아시네토박터(Acinetobacter); 스트렙토마이세스(Streptomyces); 코리네박테리움(Corynebacterium); 메틸로시너스(Methylosinus); 메틸로모나스(Methylomonas); 로도코커스(Rhodococcus); 슈도모나스(Pseudomonas); 로도박터(Rhodobacter); 시네코시스티스(Synechocystis); 사카로마이세스(Saccharomyces); 자이고사카로마이세스(ZygoSaccharomyces); 클루이베로마이세스(Kluyveroumyces); 칸디다(Candida); 한세눌라(Hansenula); 베바리오마이세스(Debaryomyces); 뮤코르(Mucor); 피치아(Pichia); 토룰롭시스(Torulopsis); 아스페르길루스(Aspergillus); 아르트로보트리스(Arthrobotlys); 브레비박테리아(Brevibacteria); 마이크로박테리움(Microbacterium); 아트로박터(Arthrobacter); 시트로박터(Citrobacter); 클렙시엘라(Klebsiella); 판토이아(Pantoea); 및 클로스트리듐(Clostridium)으로부터 선택될 수 있다. 특정 실시형태에서, 숙주 세포는 야로위아 리폴리티카, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 또는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)일 수 있다.
본 교시내용의 또 다른 양상은 임의의 전술한 본 핵산 분자를 포함하는 재조합 세포에 관한 것일 수 있다. 재조합 세포는 원핵 세포 또는 진핵 세포일 수 있다. 일부 실시형태에서, 재조합 세포는 미생물 세포, 예를 들어, 박테리아 세포, 효모 세포, 조류 세포, 또는 진균 세포일 수 있다. 다른 실시형태에서, 재조합 세포는 관심 이오논을 자연적으로 생성하지 않는 식물 세포일 수 있다. 특정 실시형태에서, 재조합 세포는 야로위아, 에스케리키아; 살모넬라; 바실러스; 아시네토박터; 스트렙토마이세스; 코리네박테리움; 메틸로시너스; 메틸로모나스; 로도코커스; 슈도모나스; 로도박터; 시네코시스티스; 사카로마이세스; 자이고사카로마이세스; 클루이베로마이세스; 칸디다; 한세눌라; 베바리오마이세스; 뮤코르; 피치아; 토룰롭시스; 아스페르길루스; 아르트로보트리스; 브레비박테리아; 마이크로박테리움; 아트로박터; 시트로박터; 클렙시엘라; 판토이아; 및 클로스트리듐으로부터 선택될 수 있다. 특정 실시형태에서, 재조합 세포는 야로위아 리폴리티카, 사카로마이세스 세레비지에, 또는 코리네박테리움 글루타미쿰일 수 있다.
본 교시내용의 또 다른 양상은 이오논 화합물, 예를 들어, 알파-이오논 또는 베타-이오논을 제조하는 방법에 관한 것일 수 있다. 본 방법은 이오논 화합물을 생성하는 조건 하에서 적합한 배지(예를 들어, 글루코스 또는 글리세롤을 포함하는 배지) 중에서 본 교시내용에 따른 재조합 숙주 세포를 배양하는 것을 포함할 수 있다. 재조합 숙주 세포는 전술한 임의의 본 핵산 분자 또는 작제물을 포함할 수 있으며, 여기서, 배양 단계는 본 교시내용에 따른 융합 효소의 발현을 야기시켜, 재조합 숙주 세포에 의해 알파-이오논 또는 베타-이오논의 생산을 증가시킨다. 일부 실시형태에서, 재조합 숙주 세포는 메발로네이트 경로에 관련된 하나 이상의 유전자를 과발현시키기 위해 추가로 형질전환될 수 있다. 예를 들어, 리코펜의 생산을 증가시키기 위해, 알파-이오논 및 베타-이오논 둘 모두의 생산을 위한 전구체인 리코펜의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 하이드록시메틸글루타릴-CoA 신타제(HMGS), 하이드록시메틸글루타릴-CoA 리덕타제(HMGR), 아이소펜테닐 다이포스페이트 이소머라제(IPI), 파르네실 다이포스페이트 신타제(FPPS), 및 게라닐게라닐 다이포스페이트 신타제(GGPPS) 중 하나 이상을 과발현시키기 위해 형질전환될 수 있다. 일부 실시형태에서, 형질전환되는 숙주 세포는 GGPPS에 인프레임으로 융합된 FPPS(FPPS::GGPPS)를 포함하는 융합 효소를 인코딩하는 합성 핵산 분자를 과발현시키기 위해 형질전환될 수 있다. 일부 실시형태에서, 형질전환되는 숙주 세포는 파이토엔 데하이드로게나제(CarB), 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP) 또는 이의 돌연변이체(예를 들어, 돌연변이체 CarRP-E78K(CarRP*), 여기서, 돌연변이는 CarRP 효소의 리코펜 사이클라제 활성을 넉아웃함)를 과발현시키기 위해 추가로 형질전환될 수 있다. 예를 들어, 베타-이오논에 대한 즉시 전구체(imediate precursor)인 베타-카로텐의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 CarRP 및 CarB를 과발현시키기 위해 형질전환될 수 있으며, 이는 또한, 베타-이오논의 생산을 증가시킨다. 대안적으로, 엡실론-카로텐의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 CarRP*, CarB, 및 엡실론-사이클라제(EC) 유전자를 과발현시키기 위해 형질전환될 수 있다. 예를 들어, 엡실론-사이클라제 유전자는 락투카 사티바 EC 유전자일 수 있다. 이러한 실시형태에서, 형질전환되는 숙주 세포는 서열번호 26과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 갖는 핵산 분자를 과발현시키기 위해 형질전환될 수 있다. 특정 실시형태에서, 형질전환되는 숙주 세포는 제1 EC 도메인 및 제2 CCD 도메인을 갖는 융합 효소를 인코딩하는 핵산 분자를 과발현시키기 위해 형질전환될 수 있으며, 여기서, EC 도메인은 엡실론-카로텐, 및 또한, 알파-이오논의 생산을 추가로 개선시키기 위해, 본 교시내용에 따라 링커를 통해 CCD 도메인에 결합된다.
본 교시내용은 또한, 카로테노이드 화합물을 생산하기 위한 재조합 숙주 세포를 포함한다. 숙주 세포는 베타-카로텐 케톨라제(BKT 또는 CrtW) 또는 베타-카로텐 하이드록실라제(CrtR-B)에 융합된 LBT 도메인(예를 들어, 올레오신 또는 칼레오신 폴리펩타이드)을 갖는 융합 효소를 인코딩하는 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함할 수 있다. 일부 실시형태에서, 숙주 세포는 LBT-BKT 융합 효소를 인코딩하는 코딩 서열 및 LBT-CrtR-B 융합 효소를 인코딩하는 코딩 서열 둘 모두를 포함할 수 있다. 베타-카로텐 케톨라제 및 베타-카로텐 하이드록실라제는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 파라코커스 종(Paracoccus sp.) 및 판토이아 아나나티스(Pantoea ananatis)로부터 선택될 수 있다. 일 실시형태에서, 본 발명은 아스타잔틴을 생산하는 조건 하에서 LBT-BKT 융합 효소를 인코딩하는 코딩 서열 및 LBT-CrtR-B 융합 효소를 인코딩하는 코딩 서열 둘 모두로 형질전환된 재조합 숙주 세포를 배양하는 것을 포함하는, 아스타잔틴(astaxanthin)을 생산하는 방법에 관한 것이다. 다른 실시형태에서, 본 발명은 칸타잔틴을 생산하는 조건 하에서 LBT-CrtW 융합 효소를 인코딩하는 코딩 서열로 형질전환된 재조합 숙주 세포를 배양하는 것을 포함하는, 칸타잔틴(canthaxanthin)을 생산하는 방법에 관한 것이다.
본 개시내용에는 다양한 변형 및 대안적인 형태가 적용되기 쉽지만, 이의 구체적인 실시형태는 도면에서 예로서 도시되고, 본 명세서에서 상세히 기재될 것이다. 그러나, 본 명세서에서 제시되는 도면 및 상세한 설명은 본 개시내용을 개시된 특정 실시형태로 제한하려는 것이 아니라, 반대로, 본 발명은 첨부된 청구범위에 의해 정의되는 바와 같은 본 개시내용의 정신과 범위 내에 들어가는 모든 변형, 등가물 및 대안을 커버하기 위한 것임이 이해되어야 한다.
본 발명의 다른 특징 및 이점은, 첨부 도면을 참조하여, 본 발명의 바람직한 실시형태의 이하의 상세한 설명에서 명확해질 것이다.
하기 도면은 본 명세서의 일부를 형성하고, 본 개시내용의 특정 양상을 추가로 설명하기 위해 포함되고, 이는 본 명세서에 제시된 특정 실시형태의 상세한 설명과 함께 이러한 도면들 중 하나 이상을 참조하여 더 잘 이해될 수 있다.
도 1은 (R)-알파-이오논(상단), (S)-알파-이오논(중앙), 및 베타-이오논(하단)의 화학 구조를 도시한 것이다.
도 2는 본 개시에 따른 알파-이오논 및 베타-이오논에 대한 생합성 경로를 예시한 것이다. 상단 부분은 선택된 숙주 세포에서 내인성으로 일어날 수 있는 메발로네이트 경로를 예시한 것이다. 하단 부분은 게라닐게라닐 다이포스페이트(GGPP)로부터 파이토엔 내지 리코펜까지 이종 생합성 경로를 예시한 것이고, 이는 엡실론-사이클라제(EC) 유전자 또는 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP)가 과발현되는 지의 여부에 따라, 엡실론-카로텐 또는 베타-카로텐 각각으로 이어진다. 본 교시내용에 따른 LBT-CCD 융합 효소의 존재 하에서, 엡실론-카로텐은 알파-이오논으로 전환되고, 베타-카로텐은 베타-이오논으로 전환된다. 회색 음영으로 나타낸 유전자는 형질전환되는 숙주 세포에서 과발현되는 것이다.
도 3은 야로위아 리폴리티카(A 및 B) 및 코리네박테륨 글루타미쿰(C)의 지질체 또는 지방구에서 카로테노이드의 축적의 현미경 이미지를 도시한 것이다.
도 4는 본 발명자가 도 2에서 강조된 다양한 유전자를 과발현시키도록 발생시킨 플라스미드를 도시한 것이다. 이러한 유전자 카세트는 실시예 1, 3, 5, 7 및 8에서 더욱 상세히 기술된 야로위아 리폴리티카 ATCC 90811 균주의 염색체에 통합되었다.
도 5는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 엡실론-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 6은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 7은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 알파-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 8은 실시예 7에 기술된 상이한 전략을 이용하여 이종 CCD 유전자(PhCCD1)를 과발현시키기 위해 형질전환된 야로위아 리폴리티카 균주에 의한 알파-이오논의 생산 역가를 비교한 것이다.
도 9는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 10은 헤마토코쿠스 플루비알리스(좌측) 및 클로렐라 조핀지엔시스(우측)에서 아스타잔틴 생합성 경로를 예시한 것이다. 효소는 이의 유전자의 명칭에 따라 명명된다. BKT, 베타-카로테노이드 케톨라제; CrtR-B, 베타-카로테노이드 하이드록실라제. 칸타잔틴은 베타-카로텐으로부터 베타-카로테노이드 케톨라제 CrtW를 경유하여 에키네논으로, 및 에키네논으로부터 CrtW를 경유하여 칸타잔틴으로 합성될 수 있다.
도 11은 CrtRB 효소를 인코딩하는 코딩 서열 및 BKT 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtRB-BKT)로 형질전환된 균주와 비교하여, LBT-CrtRB 융합 효소를 인코딩하는 코딩 서열 및 LBT-BKT 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtRB-올레오신::BKT)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 아스타잔틴(AS) 및 제아잔틴(ZX)의 증가된 생산을 도시한 것이다. CX는 칸타잔틴을 나타내며, BC는 베타-카로텐을 나타낸다.
도 12는 CrtW 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtW)로 형질전환된 균주와 비교하여, LBT-CrtW 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtW)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 칸타잔틴(CX)의 증가된 생산을 도시한 것이다. BC는 베타-카로텐을 나타낸다.
도 1은 (R)-알파-이오논(상단), (S)-알파-이오논(중앙), 및 베타-이오논(하단)의 화학 구조를 도시한 것이다.
도 2는 본 개시에 따른 알파-이오논 및 베타-이오논에 대한 생합성 경로를 예시한 것이다. 상단 부분은 선택된 숙주 세포에서 내인성으로 일어날 수 있는 메발로네이트 경로를 예시한 것이다. 하단 부분은 게라닐게라닐 다이포스페이트(GGPP)로부터 파이토엔 내지 리코펜까지 이종 생합성 경로를 예시한 것이고, 이는 엡실론-사이클라제(EC) 유전자 또는 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP)가 과발현되는 지의 여부에 따라, 엡실론-카로텐 또는 베타-카로텐 각각으로 이어진다. 본 교시내용에 따른 LBT-CCD 융합 효소의 존재 하에서, 엡실론-카로텐은 알파-이오논으로 전환되고, 베타-카로텐은 베타-이오논으로 전환된다. 회색 음영으로 나타낸 유전자는 형질전환되는 숙주 세포에서 과발현되는 것이다.
도 3은 야로위아 리폴리티카(A 및 B) 및 코리네박테륨 글루타미쿰(C)의 지질체 또는 지방구에서 카로테노이드의 축적의 현미경 이미지를 도시한 것이다.
도 4는 본 발명자가 도 2에서 강조된 다양한 유전자를 과발현시키도록 발생시킨 플라스미드를 도시한 것이다. 이러한 유전자 카세트는 실시예 1, 3, 5, 7 및 8에서 더욱 상세히 기술된 야로위아 리폴리티카 ATCC 90811 균주의 염색체에 통합되었다.
도 5는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 엡실론-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 6은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 7은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 알파-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 8은 실시예 7에 기술된 상이한 전략을 이용하여 이종 CCD 유전자(PhCCD1)를 과발현시키기 위해 형질전환된 야로위아 리폴리티카 균주에 의한 알파-이오논의 생산 역가를 비교한 것이다.
도 9는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 10은 헤마토코쿠스 플루비알리스(좌측) 및 클로렐라 조핀지엔시스(우측)에서 아스타잔틴 생합성 경로를 예시한 것이다. 효소는 이의 유전자의 명칭에 따라 명명된다. BKT, 베타-카로테노이드 케톨라제; CrtR-B, 베타-카로테노이드 하이드록실라제. 칸타잔틴은 베타-카로텐으로부터 베타-카로테노이드 케톨라제 CrtW를 경유하여 에키네논으로, 및 에키네논으로부터 CrtW를 경유하여 칸타잔틴으로 합성될 수 있다.
도 11은 CrtRB 효소를 인코딩하는 코딩 서열 및 BKT 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtRB-BKT)로 형질전환된 균주와 비교하여, LBT-CrtRB 융합 효소를 인코딩하는 코딩 서열 및 LBT-BKT 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtRB-올레오신::BKT)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 아스타잔틴(AS) 및 제아잔틴(ZX)의 증가된 생산을 도시한 것이다. CX는 칸타잔틴을 나타내며, BC는 베타-카로텐을 나타낸다.
도 12는 CrtW 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtW)로 형질전환된 균주와 비교하여, LBT-CrtW 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtW)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 칸타잔틴(CX)의 증가된 생산을 도시한 것이다. BC는 베타-카로텐을 나타낸다.
유지성 효모 야로위아 리폴리티카는 이의 큰 세포간 풀 크기의 아세틸-CoA(카로테노이드 골격의 출발 물질, 도 2 참조), 및 잘 규명된 유전자 툴박스로 인해 카로테노이드 생산을 위한 대부분의 프로파일 이종 숙주들 중 하나이다. 본 발명자는 다수의 상이한 카로테노이드 전구체 생합성 유전자의 조합을 스크리닝하였다. HMGS, HMGR, IPI, FPPS 및 GGPPS 유전자의 공동-과발현을 통해, 본 발명자는 카로테노이드 생산을 위한 다양한 고도로 효율적인 숙주 균주를 생성하였다. 야로위아 리폴리티카 카로테노이드 숙주 균주에서 CarRP*/CarB, CarRP/CarB, 또는 carRP*/CarB/EC 유전자의 과발현은 리코펜(2 g/ℓ), 베타-카로텐(4 g/ℓ) 또는 엡실론-카로텐(1.5 g/ℓ)의 고-역가 생산을 초래한다.
숙주로서 리코펜-생산 야로위아 리폴리티카 균주를 사용하여, 본 발명자는 이오논 생산을 위한 28개의 CCD 효소를 스크리닝하였다. 스크리닝된 다양한 CCD 효소들 중에서, 식물 페튜니아 하이브리다(Petunia hybrida)에서 비롯된 PhCCD1(서열번호 11)은 가장 높은 활성을 나타낸다. 그러나, 야생형 PhCCD1로 형질전환된 균주는 단지 시험관 기반 세포 배양물로부터 3 ㎎/ℓ 미만의 알파-이오논을 생산할 수 있다. CCD 효소의 촉매 효율이 이오논 화합물의 발효 생산의 주요 병목현상이라고 보고되었다. 야로위아 리폴리티카 숙주 세포의 유성 특성은 카로테노이드의 축적에 매우 도움이 된다. 도 3a 및 도 3b에 도시된 바와 같이, 적색의 리코펜 및 오렌지색 엡실론-카로텐은 야로위아 리폴리티카 세포의 지질체에 축적된다. 유사하게는, 카로테노이드를 함유한 지방구는 코리네박테리움 글루타미쿰 카로텐-생산 균주에서 관찰되었다(도 3c). 이에 따라, 본 발명자는 지질체(방울)에서 카로텐의 축적이 CCD 효소에 대한 카로텐 기질 분자 결합을 방해할 수 있다는 가설을 세웠다. 이에 따라, PhCCD1 효소 자체에 대한 단백질 엔지니어링 노력 외에도, 본 발명자는 상이한 추정적 구획화 신호 태그에 결합된 PhCCD1을 포함하는 다수의 융합 효소를 스크리닝함으로써 지질체 기반 세포아래 구획 엔지니어링을 기반으로 한 신규한 방법을 조사하기로 결정하였다. 하기 실시예와 같이, 이러한 방법은 카로테노이드 분열 효소의 효율의 상당한 개선을 초래하였다. 이에 따라, 본 발명은 상업적 스케일-업 생산에 적합한 "천연" 알파-이오논 및 베타-이오논을 생산하기 위한 경제적이고 신뢰할 수 있는 방법을 제공한다.
알파-이오논 및 베타-이오논을 제조하는 방법
일부 실시형태에서, 본 명세서에 기술된 방법은 이러한 융합 효소를 발현시키기 위해 형질전환된 재조합 숙주 세포 및 융합 효소를 사용하여 "천연" 알파-이오논 및 베타-이오논의 생산을 제공한다. 다양한 실시형태에서, 본 방법은 핵산 분자로 형질전환된 성장하는 세포를 포함하는 세포계를 포함하고, 여기서, 이러한 핵산 분자는 제1 핵산 서열 및 제2 핵산 서열을 포함하고, 이러한 제1 및 제2 핵산 서열은 함께 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인(때때로 본 명세서에서 LBT 도메인으로도 지칭됨) 및 카로테노이드 분열 활성을 갖는 제2 도메인(때때로 본 명세서에서 카로테노이드 분열 다이옥시게나제(CCD) 도메인으로도 지칭됨)을 포함하는 이종 융합 효소를 인코딩한다. 일부 실시형태에서, 세포계는 관심 이오논을 자연적으로 생산하지 않는 박테리아 세포, 효모 세포, 식물 세포, 지질체 구획화 신호 태그 및/또는 본 명세서에 기술된 CCD를 자연적으로 인코딩하지 않는 조류 세포, 박테리아 세포 및/또는 진균 세포를 포함할 수 있다. 특정 실시형태에서, 세포계는 야로위아, 에스케리키아; 살모넬라; 바실러스; 아시네토박터; 스트렙토마이세스; 코리네박테리움; 메틸로시너스; 메틸로모나스; 로도코커스; 슈도모나스; 로도박터; 시네코시스티스; 사카로마이세스; 자이고사카로마이세스; 클루이베로마이세스; 칸디다; 한세눌라; 베바리오마이세스; 뮤코르; 피치아; 토룰롭시스; 아스페르길루스; 아르트로보트리스; 브레비박테리아; 마이크로박테리움; 아트로박터; 시트로박터; 클렙시엘라; 판토이아; 및 클로스트리듐으로 이루어진 군으로부터 선택된 성장하는 박테리아 및/또는 효모 세포를 포함할 수 있다.
생합성 알파-이오논 또는 베타-이오논을 위한 경로 및 효소
도 2를 참조하면, 글루코스 또는 글리세롤과 같은 탄소 소스로부터 알파-이오논 및 베타-이오논의 생합성 생산은 미생물 숙주 세포에서 일련의 고유 및 이종 유전자의 생체내 과발현을 통해 수행될 수 있다. 아이소펜테닐 다이포스페이트(IPP) 및 이의 이성질체 다이메틸알릴 다이포스페이트(DMAPP)는 게라닐게라닐 다이포스페이트(GGPP)를 제조하기 위한 C5 빌딩 블록이고, 이는 카로테노이드의 직접 전구체이다. 식물 또는 진균 숙주 세포에서, IPP 및 DMAPP는 메발로네이트(MVA) 경로로부터 생성될 수 있다. 아세틸-CoA의 2개의 분자는 아세틸-CoA 아세틸트랜스페라제(AtoB)에 의해 아세토아세틸-CoA의 하나의 분자로 축합된다. 아세토아세틸-CoA는 HMG-CoA 신타제(HMGS) 및 HMG-CoA 리덕타제(HMGR) 각각에 의해 중간 하이드록시메틸글루타릴-CoA(HMG-CoA)를 경유하여 메발론산으로 전환된다. 이후에, IPP는 3개의 효소, 즉, 메발로네이트 키나제(MevK), 포스포메발로네이트 키나제(PMK) 및 포스포메발로네이트 데카복실라제(PMD)에 의해 메발론산으로부터 생산된다. MVA 경로는 IPP로부터 DMAPP를 생성하기 위해 아이소펜테닐 다이포스페이트 이소머라제(IPI)를 필요로 한다. 다수의 IPP 및 DMAPP 분자의 결합을 통해, GGPP가 형성된다. 이작용성 리코펜 사이클라제/파이토엔 신타제 CarRP에 의해 촉매화된 2개의 GGPP 단위의 축합을 통해, 파이토엔이 생산되고, 이는 이후에 파이토엔 데하이드로게나제 CarB에 의해 리코펜으로 전환된다. 리코펜은 엡실론-사이클라제(EC)에 의해 엡실론-카로텐으로, 또는 CarRP에 의해 베타-카로텐으로 환형화될 수 있다. CCD 효소에 의한 엡실론-카로텐 또는 베타-카로텐의 분열은 알파-이오논 또는 베타-이오논 각각의 생산을 초래한다.
도 2를 계속 참조하면, 본 교시내용에 따른 형질전환되는 미생물 숙주 세포에서 과발현된 유전자는 회색으로 강조/음영으로 표시된다. 상세하게는, 이러한 것은 HMGS(NCBI RefSeq XP 506052.1); HMGR(GenBank 수탁 번호 RDW25091.1); IPI(NCBI RefSeq XP_504974.1); FPPS(NCBI RefSeq XP 503599.1); GGPPS(NCBI RefSeq XP_502923.1); CarRP(UniProtKB/Swiss-Prot: Q9UUQ6.1); CarRP*(위치 78에서 라이신으로 돌연변이된 글루탐산을 갖는 돌연변이체 CarRP-E78K); CarB(GenBank 수탁 번호 OAD07725.1); EC(GenBank 수탁 번호 AAK07434.1); 및 PhCCD1(GenBank 수탁 번호 AAT68189.1)을 포함한다.
지질체 구획화 신호 태그
도 3을 참조하면, 본 발명자는 야로위아 리폴리티카(A 및 B) 및 코리네박테리움 글루타미쿰(C)에서 지질체(방울)에서 카로텐 기질의 축적을 관찰하였다. 지질체(방울)는 트리아실글리세롤 및 스테릴 에스테르와 같은 중성 지질 형태로 대사 에너지를 저장하는 유비쿼터스 소기관이다. 추정 지질체 구획화 신호 태그는 지질체 형성을 촉진하는 지질 합성 효소, 및 지질체 어셈블리를 위한 구조 또는 막 단백질을 포함할 수 있다. 또한, 오렌지 카로테노이드 결합 단백질은 카로테노이드에 대한 이의 높은 친화력으로 인해 유용할 수 있다. 다수의 후보 단백질의 엄격한 스크리닝을 수행한 후에, 본 발명자는 지질체 구획화 신호 태그 및 CCD 효소가 융합 효소로서 함께 발현될 때, 야로위아 리폴리티카 세포에서 CCD 효소의 생체내 카로테노이드 분열 효율을 개선시킨 특정의 추정 지질체 구획화 신호 태그를 식별하였다. 이러한 지질체 구획화 신호 태그는 지질체 구조 단백질(예를 들어, 다양한 올레오신 및 칼레오신), 유지성 유도 지방구 단백질(예를 들어, Oil1), 오렌지 카로테노이드-결합 단백질 및 막 수송체 단백질(예를 들어, 당 수송체, 예를 들어, STL1)을 포함할 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 서열번호 29 또는 서열번호 30과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 올레오신일 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 아라비돕시스 탈리아나, 리시누스 콤뮤니스, 글리신 맥스, 세사뭄 인디쿰, 코익스 라크리마, 아스퍼질러스 니게르, 또는 뉴로스포라 크라사로부터의 칼레오신일 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질, 야로위아 리폴리티카 막 수송체 Stl1p 단백질, 야로위아 리폴리티카 지방구 단백질 Oil1p, 제아 메이즈 16 kDa 올레오신, 세사뭄 인디쿰 17 kDa 올레오신, 아라비돕시스 탈리아나 칼레오신, 및 세사뭄 인디쿰 칼레오신으로 이루어진 군으로부터 선택될 수 있다. 임의의 특정 이론으로 얽매이고자 하지 않으면서, 본 발명자는 제아 메이즈 올레오신 및 세사뭄 인디쿰 올레오신 각각의 보존된 도메인에 해당하는, 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드가 본 교시내용에 따른 지질체 구획화 신호 태그로서 유용할 수 있다고 여긴다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 제아 메이즈 16 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 2와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 17 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 4와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 오렌지 카로테노이드 결합 단백질은 서열번호 5와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 6과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 막 수송체 Stl1p 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 막 수송체 Stl1p 단백질은 서열번호 7과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 8과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 지방구 단백질 Oil1p 또는 이의 기능성 변이체일 수 있다. 예를 들어, 지방구 단백질 Oil1p는 서열번호 9와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 10의 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 아라비돕시스 탈리아나 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 아라비돕시스 탈리아나 칼레오신은 서열번호 31과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 32와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰은 서열번호 33과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 34와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.
카로테노이드-분열 도메인
카로테노이드 분열 활성을 나타내는 효소는 다양한 카로테노이드 분열 다이옥시게나제(CCD)를 포함할 수 있다. 예를 들어, 본 융합 효소의 카로테노이드-분열 도메인은 광범위한 카로테노이드의 5,6(5', 6'), 7,8(7', 8') 및 9,10(9', 10') 이중 결합을 분열시킬 수 있는 CCD1 또는 CCD4 효소일 수 있다. 예를 들어, CCD는 페튜니아 x 하이브리다 CCD(PhCCD1) 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 11과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 11의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 11의 아미노산 서열로 이루어질 수 있다. 다른 실시형태에서, CCD는 오스만투스 프라그란스 CCD 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 14와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 14의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 14의 아미노산 서열로 이루어질 수 있다. 또 다른 실시형태에서, CCD는 제아 메이즈 CCD 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 16과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 16의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 16의 아미노산 서열로 이루어질 수 있다.
일부 실시형태에서, CCD는 PhCCD1의 동족체일 수 있다. 예를 들어, CCD는 카로테노이드 옥시게나제, 9-시스에폭시카로테노이드 다이옥시게나제, 또는 이의 기능성 변이체일 수 있다. 이러한 동족체는 다양한 시아노박테리아, 예를 들어, 비제한적으로, 노스토칼레스 시아노박테리움, 칼로트릭스 종 칼로트릭스 브레비시마, 및 스키토네마 밀레이로부터 비롯될 수 있다. 예를 들어, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열로 이루어질 수 있다.
일부 실시형태에서, CCD 도메인은 아라비돕시스 탈리아나, 비티스 비니페라, 다우쿠스 카로타, 리코퍼시콘 에스쿨렌텀, 및 루부스 이다에우스로부터의 CCD1 효소를 포함할 수 있다. 다른 실시형태에서, CCD 도메인은 아라비돕시스 탈리아나, 빅사 오렐라나, 크리산데뮴 모리폴리움, 크로커스 사티부스, 무사 아쿠미나타, 말루스 도메스티카, 프루누스 퍼시카, 로사 다마센, 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함할 수 있다. 원하는 이오논 화합물이 알파-이오논인 실시형태에서, CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 크리산데뮴 모리폴리움으로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다. 원하는 이오논 화합물이 베타-이오논인 실시형태에서, CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 프루누스 퍼시카로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다.
융합 효소
융합 효소를 포함하는 융합 단백질은 다중-기능성 특성을 갖는 한 부류의 신규한 생체분자로서 개발되었다. 2개 이상의 단백질 도메인을 함께 유전적으로 융합함으로써, 융합 단백질 산물은 이의 성분 모이어티 각각으로부터 유도된 여러 고유 기능을 얻을 수 있다. 재조합 융합 단백질의 성공적인 구성은 2개의 필수 요소를 필요로 한다: 성분 단백질 및 링커. 성분 단백질의 선택은 융합 단백질 산물의 원하는 기능을 기초로 하고, 본 교시내용에 따르면, 상기에 기술된 CCD 도메인 및 LBT 도메인을 포함한다. 부적합한 링커가 융합 단백질의 미스폴딩, 단백질 생산의 낮은 수율, 또는 손상된 생체활성을 초래할 수 있기 때문에, 단백질 도메인을 함께 결합하기 위한 적합한 링커의 선택은 복잡할 수 있다.
일부 실시형태에서, 제2 CCD 도메인에 제1 LBT 도메인을 결합시키기 위해 사용되는 링커는 길이가 3 내지 30인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다.
본 융합 효소는 링커를 통해 CCD 도메인에 융합된 LBT 도메인으로 이루어질 수 있다. 융합 효소는 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(SUMO) 단백질, 말토스 결합 단백질(MBP), 티오레독신(TrxA), 또는 이의 임의의 기능적 동족체를 포함하는 임의의 성분을 배제할 수 있다.
핵산 및 핵산 작제물
본 교시내용에 따른 핵산 분자는 함께 LBT 도메인 및 CCD 도메인을 포함하는 융합 효소를 인코딩하는 제1 핵산 서열 및 제2 핵산 서열을 갖는 합성 및 재조합 핵산 분자를 포함한다. 다양한 실시형태에서, 제1 핵산 서열은 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 또는 서열번호 10과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다. 다양한 실시형태에서, 제2 핵산 서열은 서열번호 12, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다. 다양한 실시형태에서, 본 핵산 분자는 또한, 본 명세서에 기술된 링커를 인코딩하는 제3 핵산 서열을 포함한다.
본 교시내용에 따른 핵산 작제물은 다른 이종 핵산 서열에 작동 가능하게 연결될 수 있는 본 명세서에 제공된 합성 또는 재조합 핵산 분자를 포함할 수 있다. 예를 들어, 본 명세서에 제공된 작제물은 본 명세서에 기술된 하나 이상의 융합 효소를 인코딩하는 핵산 서열을 포함할 수 있으며, 여기서, 핵산 서열은 다른 이종 핵산 서열에 작동 가능하게 연결된 프로모터를 추가로 포함한다. 일부 실시형태에서, 이종 핵산 서열은 조절 요소를 포함할 수 있다. 일부 실시형태에서, 본 명세서에 기술된 하나 이상의 융합 효소를 인코딩하는 핵산 서열은 종결자 서열에 작동 가능하게 연결될 수 있다. 일부 실시형태에서, 핵산 작제물은 야로위아 세포에서 기능적이다. 일부 실시형태에서, 본 명세서에 제공된 핵산 작제물은 발현 카세트 또는 벡터로서 추가로 규정된다.
세포계
본 명세서에서 언급되는 본 방법에 따른 세포계는 CCD 도메인에 결합된 LBT 도메인을 포함하는 본 융합 효소를 발현시키기 위해 사용될 수 있는 임의의 세포 또는 세포들을 포함할 수 있다. 이러한 세포계는 박테리아 세포, 효모 세포, 식물 세포, 및 동물 세포를 포함할 수 있지만, 이로 제한되지 않는다. 일부 실시형태에서, 세포계는 박테리아 세포, 효모 세포, 또는 이들의 조합을 포함한다. 일부 실시형태에서, 세포계는 원핵 세포, 진핵 세포, 및 이들의 조합을 포함한다.
본 개시내용의 박테리아 세포는 에스케리키아 종, 스트렙토마이세스 종, 지모모나스(Zymomonas) 종, 아세토박터(Acetobacter) 종, 시트로박터 종, 시네코시스티스 종, 리조븀(Rhizobium) 종, 클로스트리듐 종, 코리네박테리움 종, 스트렙토코커스(Streptococcus) 종, 잔토모나스(Xanthomonas) 종, 락토바실러스 종, 락토코커스 종, 바실러스 종, 알칼리게네스(Alcaligenes) 종, 슈도모나스 종, 아에로모나스(Aeromonas) 종, 아조토박터(Azotobacter) 종, 코마모나스(Comamonas) 종, 미코박테리움(Mycobacterium) 종, 로도코커스 종, 글루코노박터(Gluconobacter) 종, 랄스토니아(Ralstonia) 종, 아시디티오바실러스 종, 마이크로루나투스(Microlunatus) 종, 지오박터(Geobacter) 종, 지오바실러스 종, 아트로박터 종, 플라보박테리움(Flavobacterium) 종, 세라티아(Serratia) 종, 사카로폴리스포라(Saccharopolyspora) 종, 테르무스(Thermus) 종, 스테노트로포모나스(Stenotrophomonas) 종, 크로모박테리움(Chromobacterium) 종, 시노리조븀(Sinorhizobium) 종, 사카로폴리스포라 종, 아그로박테리움(Agrobacterium) 종, 판토이아 종, 및 비브리오 나트리에겐스(Vibrio natriegens)를 포함하지만, 이로 제한되지 않는다.
본 개시내용의 효모 세포는 사카로마이세스 종, 스키조사카로마이세스, 한세눌라, 칸디다, 클루이베로마이세스, 야로위아, 칸디다 보이디니이 및 피치아를 포함하지만, 이로 제한되지 않는다. 본 개시내용에 따르면, 본 명세서에서 청구된 효모는 진균계(fungus kingdom)의 구성원으로서 분류되는 진핵의 단세포 미생물이다. 효모는 다세포 조상으로부터 진화한 단세포 유기체이지만, 본 개시내용에 유용한 일반 종은 가균사 또는 거짓 균사로서 알려진 연결된 신진 세포의 스트링(string)을 형성함으로써 다세포 특징을 나타낼 수 있는 것이다.
세포 배양물
세포 배양물은 배양물 중에 있는 임의의 세포 또는 세포들을 지칭한다. 배양 또는 인큐베이션은 통상적으로, 이의 자연 환경을 벗어난 제어된 조건 하에서 세포가 성장되는 과정이다. 예를 들어, 세포, 예를 들어, 효모 세포는 액체 영양소 브로쓰에서의 세포 현탁액으로서 성장될 수 있다. 세포 배양물은 박테리아 세포 배양물, 효모 세포 배양물, 식물 세포 배양물, 및 동물 세포 배양물을 포함하지만, 이로 제한되지 않는다. 일부 실시형태에서, 세포 배양물은 박테리아 세포, 효모 세포, 또는 이들의 조합을 포함한다.
본 개시내용의 박테리아 세포 배양물은 에스케리키아 종, 스트렙토마이세스 종, 지모모나스 종, 아세토박터 종, 시트로박터 종, 시네코시스티스 종, 리조븀 종, 클로스트리듐 종, 코리네박테리움 종, 스트렙토코커스 종, 잔토모나스 종, 락토바실러스 종, 락토코커스 종, 바실러스 종, 알칼리게네스 종, 슈도모나스 종, 아에로모나스 종, 아조토박터 종, 코마모나스 종, 미코박테리움 종, 로도코커스 종, 글루코노박터 종, 랄스토니아 종, 아시디티오바실러스 종, 마이크로루나투스 종, 지오박터 종, 지오바실러스 종, 아트로박터 종, 플라보박테리움 종, 세라티아 종, 사카로폴리스포라 종, 테르무스 종, 스테노트로포모나스 종, 크로모박테리움 종, 시노리조븀 종, 사카로폴리스포라 종, 아그로박테리움 종, 판토이아 종, 및 비브리오 나트리에겐스를 포함하지만, 이로 제한되지 않는 박테리아 세포를 포함한다.
본 개시내용의 효모 세포 배양물은 사카로마이세스 종, 스키조사카로마이세스, 한세눌라, 칸디다, 클루이베로마이세스, 야로위아, 칸디다 보이디니이 및 피치아를 포함하지만, 이로 제한되지 않는 효모 세포를 포함한다.
일부 실시형태에서, 본 명세서에 기술된 세포 배양물은 당해 기술분야에 공지된 하나 이상의 영양 물질을 포함하는 수성 배지일 수 있다. 이러한 액체 배지는 하나 이상의 탄소 소스, 질소 소스, 무기 염, 및/또는 성장 인자를 포함할 수 있다. 적합한 탄소 소스는 글루코스, 프룩토스, 자일로스, 수크로스, 말토스, 락토스, 만니톨, 소르비톨, 글리세롤, 및 옥수수 시럽을 포함할 수 있다. 적합한 질소 소스의 예는 유기 및 무기 질소-함유 물질, 예를 들어, 펩톤, 옥수수 침지액, 민 추출물(mean extract), 효모 추출물, 카제인, 우레아, 아미노산, 암모늄 염, 니트레이트 및 이들의 혼합물을 포함할 수 있다. 무기 염의 예는 포스페이트, 설페이트, 마그네슘, 나트륨, 칼슘, 및 칼륨 염을 포함할 수 있다. 액체 배지는 또한, 하나 이상의 비타민 및/또는 미네랄을 포함할 수 있다.
일부 실시형태에서, 세포는 16℃ 내지 40℃의 온도에서 배양된다. 예를 들어, 세포는 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 또는 40℃의 온도에서 배양될 수 있다.
일부 실시형태에서, 세포는 약 3 내지 약 9의 pH 범위, 바람직하게는, 약 4 내지 약 8의 범위에서 배양된다. pH는 무기 또는 유기산 또는 염기, 예를 들어, 염산, 아세트산, 나트륨 하이드록사이드, 칼슘 카보네이트, 암모니아의 첨가에 의해 또는 완충제, 예를 들어, 포스페이트, 프탈레이트 또는 Tris®의 첨가에 의해 조절될 수 있다.
일부 실시형태에서, 세포는 0.5시간 내지 96시간 또는 그 이상의 기간 동안 배양된다. 예를 들어, 세포는 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72시간의 기간 동안 배양될 수 있다. 통상적으로, 세포, 예를 들어, 박테리아 세포는 12 내지 24시간의 기간 동안 배양된다. 일부 실시형태에서, 세포는 37℃의 온도에서 12 내지 24시간 동안 배양된다. 일부 실시형태에서, 세포는 16℃의 온도에서 12 내지 24시간 동안 배양된다.
일부 실시형태에서, 세포는 1×108(OD600<1) 내지 2×1011(OD ~ 200) 생존 세포/㎖ 세포 배양 배지의 밀도로 배양된다. 일부 실시형태에서, 세포는 1×108, 2×108, 3×108, 4×108, 5×108, 6×108, 7×108, 8×108, 9×108, 1×109, 2×109, 3×109, 4×109, 5×109, 6×109, 7×109, 8×109, 9×109, 1×1010, 2×1010, 3×1010, 4×1010, 5×1010, 6×1010, 7×1010, 8×1010, 9×1010, 1×1011, 또는 2×1011 생존 세포/㎖의 밀도로 배양된다. (전환 인자: OD 1 = 8×108 세포/㎖).
합성 생물학
여기에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기술은 당해 기술분야에 널리 공지되어 있고, 예를 들어, 문헌[Sambrook, J, Fritsch, E. F. and Maniatis, T. MOLECULAR CLONING: A LABORATORY MANUAL, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1989 (하기에서 "Maniatis"); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. EXPERIMENTS WITH GENE FUSIONS; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1984; 및 Ausubel, F. M. et al., IN CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, published by GREENE PUBLISHING AND WILEY-INTERSCIENCE, 1987]에 기술되어 있으며, 이러한 문헌 각각 전문은 본 명세서에 참조에 의해 원용된다.
미생물 생산 시스템
형질전환된 숙주 세포에서 단백질의 발현은 융합 또는 비-융합 단백질의 발현을 유도하는 구성 또는 유도성 프로모터를 함유하는 벡터를 갖는 박테리아 또는 효모 숙주 세포에서 가장 자주 수행된다. 융합 벡터는 그 안에 인코딩된 단백질에, 대개 재조합 단백질의 아미노 말단에 다수의 아미노산을 추가한다. 이러한 융합 벡터는 통상적으로 3가지 목적을 제공한다: 1) 재조합 단백질의 발현을 증가시키기 위함; 2) 재조합 단백질의 용해도를 증가시키기 위함; 및 3) 친화력 정제에서 리간드로서 작용함으로써 재조합 단백질의 정제를 돕기 위함. 종종, 단백질분해 분열 사이트는 융합 단백질의 정제에 후속하여 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 하기 위해 융합 모이어티 및 재조합 단백질의 접합에 도입된다. 이러한 벡터는 본 개시내용의 범위 내에 속한다.
일 실시형태에서, 발현 벡터는 미생물 세포에서 재조합 폴리펩타이드의 발현을 위한 그러한 유전적 요소를 포함한다. 미생물 세포에서 전사 및 번역을 위한 요소는 프로모터, 단백질 복합체를 위한 코딩 영역, 및 전사 종결자를 포함할 수 있다.
당업자는 발현 벡터의 제조를 위해 이용 가능한 분자 생물학 기술을 알고 있을 것이다. 본 명세서에 기술된 바와 같이, 본 기술의 발현 벡터에 도입하기 위해 사용되는 폴리뉴클레오타이드는 폴리머라제 연쇄 반응(PCR)과 같은 일상적인 기술에 의해 제조될 수 있다.
상보적 돌출 말단(complementary cohesive termini)을 통해 DNA를 벡터에 작동 가능하게 연결하기 위해 많은 분자 생물학 기술이 개발되었다. 일 실시형태에서, 상보적 동종중합체 관(tract)이 벡터 DNA 내로 삽입될 핵산 분자에 첨가될 수 있다. 이어서, 벡터와 핵산 분자는 상보적 동종중합체 꼬리 사이의 수소 결합에 의해 연결되어 재조합 DNA 분자를 형성한다.
대안적인 실시형태에서, 하나 이상의 제한 부위를 함유하는 합성 링커는 대상 기술의 폴리뉴클레오타이드를 발현 벡터에 작동 가능하게 연결하기 위하여 사용된다. 일 실시형태에서, 폴리뉴클레오타이드는 제한 엔도뉴클레아제 소화에 의해 생성된다. 일 실시형태에서, 핵산 분자는, 3'-5'-엑소뉴클레오라이틱 활성을 갖는 돌출된 3'-단일-가닥 말단을 제거하고 중합 활성을 갖는 오목한 3'-말단에 채우는 효소인 박테리오파지 T4 DNA 중합효소 또는 이.콜라이(E. coli) DNA 중합효소 I로 처리됨으로써, 평활말단(blunt-ended) DNA 분절을 생성한다. 이어서, 평활말단 분절을 평활말단 DNA 분자의 결찰을 촉매할 수 있는 효소, 예컨대, 박테리오파지 T4 DNA 리가제의 존재 하에 몰 과량의 링커 분자와 인큐베이션한다. 따라서, 반응 산물은 그의 말단에 중합체성 링커 서열을 보유하는 폴리뉴클레오타이드이다. 이어서, 이러한 폴리뉴클레오타이드를 적절한 제한 효소로 절단하고, 폴리뉴클레오타이드의 것과 양립 가능한 말단을 생성하는 효소로 절단된 발현 벡터에 결찰시킨다.
대안적으로, 결찰-무관 클로닝(ligation-independent cloning: LIC) 부위를 갖는 벡터가 이용될 수 있다. 이어서 요구되는 PCR 증폭 폴리뉴클레오타이드가 제한효소 소화 또는 결찰 없이 LIC 벡터 내로 클로닝될 수 있다(문헌[Aslanidis and de Jong, NUCL. ACID. RES. 18 6069-74, (1990), Haun, et al, BIOTECHNIQUES 13, 515-18 (1992)], 이와 일치하는 정도로 본 명세서에 참조에 의해 원용됨).
일 실시형태에서, 선택된 플라스미드 내로의 삽입을 위해 관심 폴리뉴클레오타이드를 단리시키고/시키거나 변형시키기 위해, PCR을 사용하는 것이 적합하다. 핵산 분자의 요구되는 코딩 영역을 단리시키고, 제한효소 엔도뉴클레아제 또는 LIC 부위를 부가하고, 목적하는 해독틀에 코딩 영역을 배치하기 위해 서열의 PCR 제조에서 사용하기 위해 적절한 프라이머가 설계될 수 있다.
일 실시형태에서, 주제 기술의 발현 벡터 내로의 혼입을 위한 폴리뉴클레오타이드는 적절한 올리고뉴클레오타이드 프라이머를 사용하는 PCR을 이용하여 제조된다. 프라이머 자체가 증폭된 서열 산물 내로 혼입되는 동안 코딩 영역이 증폭된다. 일 실시형태에서, 증폭 프라이머는 제한효소 엔도뉴클레아제 인식 부위를 함유하고, 이는 증폭된 서열 산물이 적절한 벡터 내로 클로닝될 수 있도록 한다.
발현 벡터는 통상적인 형질전환 또는 형질감염 기법에 의해 식물 또는 미생물 숙주 세포 내로 도입될 수 있다. 주제 기술의 발현 벡터로의 적절한 세포의 형질전환은 당분야에 알려진 방법에 의해 달성되고 전형적으로 벡터 및 세포 유형 모두에 의존한다. 적합한 기법은 인산칼슘 또는 염화칼슘 공침, DEAE-덱스트란 매개 형질감염, 리포펙션, 화학천공 또는 전기천공을 포함한다.
성공적으로 형질전환된 세포, 즉, 발현 벡터를 함유하는 세포는 당분야에 널리 알려진 기법에 의해 확인될 수 있다. 예를 들어, 주제 기술의 발현 벡터로 형질감염된 세포를 배양하여 본 명세서에 기재된 폴리펩타이드를 제조할 수 있다. 세포는 당분야에 널리 알려진 기법에 의해 발현 벡터 DNA의 존재에 대해 조사될 수 있다.
숙주 세포는 이전에 기재된 발현 벡터의 단일 카피 또는 대안적으로 발현 벡터의 복수 카피를 함유할 수 있다.
몇몇 실시형태에서, 형질전환된 세포는 박테리아 세포, 효모 세포, 조류 세포, 진균 세포, 식물 세포, 곤충 세포 또는 동물 세포일 수 있다. 몇몇 실시형태에서, 세포는 유채 식물 세포, 평지씨 식물 세포, 야자 식물 세포, 해바라기 식물 세포, 목화 식물 세포, 옥수수 식물 세포, 땅콩 식물 세포, 아마 식물 세포, 참깨 식물 세포, 대두 식물 세포 및 페튜니아 식물 세포로 이루어진 군으로부터 선택되는 식물 세포이다.
외래 단백질의 고수준 발현을 지시하는 조절 서열을 함유하는 미생물 숙주 세포 발현 시스템 및 발현 벡터는 당업자에게 널리 알려져 있다. 이들 중 임의의 것이 미생물 숙주 세포에서 주제 기술의 재조합 폴리펩타이드의 발현을 위한 벡터를 구축하기 위해 사용될 수 있다. 이어서 이들 벡터는 주제 기술의 재조합 폴리펩타이드의 고수준 발현을 허용하기 위해 형질전환을 통해 적절한 미생물 내로 도입될 수 있다.
적합한 미생물 숙주 세포의 형질전환에 유용한 벡터 또는 카세트는 당분야에 널리 알려져 있다. 전형적으로 벡터 또는 카세트는 관련 폴리뉴클레오타이드의 전사 및 번역을 지시하는 서열, 선별 마커 및 자가 복제 또는 염색체 통합을 허용하는 서열을 함유한다. 적합한 벡터는 전사 개시 제어부를 보유하는 폴리뉴클레오타이드의 5' 영역 및 전사 종결을 제어하는 DNA 단편의 3' 영역을 포함한다. 이러한 제어 영역이 숙주로서 선택된 특정 종에 대해 원상태인 유전자로부터 유래될 필요가 없음이 이해되지만, 두 제어 영역이 모두 형질전환된 숙주 세포와 상동성인 유전자로부터 유래되는 것이 바람직하다.
원하는 미생물 숙주 세포에서 재조합 폴리펩타이드의 발현을 유도하는 데 유용한 개시 제어 영역 또는 프로모터는 다수이고, 당업자에게 잘 알려져 있다. 이러한 유전자를 유도할 수 있는 거의 모든 프로모터는 CYCI, HIS3, GALI, GALIO, ADHI, PGK, PH05, GAPDH, ADCI, TRPI, URA3, LEU2, ENO, TPI(사카로마이세스의 발현을 위해 유용함); TEF(야로위아의 발현을 위해 유용함); AOXI(피치아의 발현을 위해 유용함); 및 lac, trp, JPL, IPR, T7, tac 및 trc(에스케리키아 콜라이의 발현을 위해 유용함))를 포함하지만, 이로 제한되지 않는 본 기술에 적합하다.
종결 제어 영역은 또한, 미생물 숙주에 고유한 다양한 유전자로부터 유도될 수 있다. 종결 사이트는 본 명세서에 기술된 미생물 숙주를 위해 선택적으로 포함될 수 있다.
식물 세포에서, 본 기술의 발현 벡터는 원하는 발달 단계에서 원하는 조직에서 본 기술의 재조합 폴리펩타이드의 발현을 유도할 수 있는 프로모터에 작동 가능하게 연결된 코딩 영역을 포함할 수 있다. 편의상, 발현되는 폴리뉴클레오타이드는 동일한 폴리뉴클레오타이드로부터 유도된 번역 리더 서열 및 프로모터 서열을 포함할 수 있다. 전사 종료 신호를 인코딩하는 3' 비-코딩 서열이 또한 존재해야 한다. 발현 벡터는 또한, 폴리뉴클레오타이드 발현을 촉진하기 위해 하나 이상의 인트론을 포함할 수 있다.
식물 숙주 세포의 경우, 코딩 영역의 발현을 유도할 수 있는 임의의 종결인자 및 임의의 프로모터의 임의의 조합은 본 기술의 벡터 서열에서 사용될 수 있다. 프로모터 및 종결인자의 일부 적합한 예는 노팔린 신타제(nos), 옥토핀 신타제(ocs) 및 카울리플라워 모자이크 바이러스(CaMV) 유전자로부터의 것을 포함한다. 사용될 수 있는 한 타입의 효율적인 식물 프로모터는 높은 수준의 식물 프로모터이다. 이러한 프로모터는 본 기술의 발현 벡터와 작동 가능하게 연결되어, 벡터의 발현을 촉진시킬 수 있어야 한다. 본 기술에서 사용될 수 있는 높은 수준의 식물 프로모터는 예를 들어, 대두로부터의 리불로스-1,5-비스포스페이트 카복실레이트의 작은 하위단위(들)의 프로모터(Berry-Lowe et al., J. MOLECULAR AND APP. GEN., 1 :483-98 (1982), 이러한 문헌 전문은 본 명세서에서 이와 일치하는 범위 내에서 포함됨), 및 클로로필 결합 단백질의 프로모터를 포함한다. 이러한 2개의 프로모터는 식물 세포에서 광-유도되는 것으로 알려져 있다(예를 들어, 문헌[GENETIC ENGINEERING OF PLANTS, AN AGRICULTURAL PERSPECTIVE, A. Cashmore, Plenum, N.Y. (1983), pages 29-38; Coruzzi, G. et al., THE JOURNAL OF BIOLOGICAL CHEMISTRY, 258: 1399 (1983), 및 Dunsmuir, P. et al., JOURNAL OF MOLECULAR AND APPLIED GENETICS, 2:285 (1983)] 참조, 이러한 문헌 각각은 이와 일치하는 범위로 본 명세서에 참조에 의해 원용됨).
동일성 스코어링을 이용한 서열 유사성의 분석
본 명세서에서 사용되는 "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오타이드 또는 펩타이드 서열이 성분, 예를 들어, 뉴클레오타이드 또는 아미노산의 정렬의 윈도우 전반에 걸쳐 불변하는 정도를 지칭한다. 시험 서열 및 기준 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 기준 서열 세그먼트, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분에서 성분들의 총 수로 나누어진 2개의 정렬된 서열에 의해 공유된 동일한 성분의 수이다.
본 명세서에서 사용되는 용어 "퍼센트 서열 동일성" 또는 "퍼센트 동일성"은 2개의 서열이 (비교 윈도우에서 기주 서열의 총 20% 미만으로 적절한 뉴클레오타이드 삽입, 결실, 또는 갭을 갖도록) 최적으로 정렬될 때 시험("대상체") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)와 비교하여 기준("질의") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)의 선형 폴리뉴클레오타이드 서열에서 동일한 뉴클레오타이드의 백분율을 지칭한다. 비교 윈도우를 정렬하기 위한 서열의 최적 정렬은 당업자에게 널리 공지되어 있고, Smith and Waterman의 국소 동족체 알고리즘, Needleman and Wunsch의 동족체 정렬 알고리즘, Pearson and Lipman의 유사성 방법을 위한 조사와 같은 툴에 의해, 및 바람직하게는, GCG® Wisconsin Package®(Accelrys Inc., 매사추세츠주 벌링톤 소재)의 부분으로부터 입수 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 전산화된 구현에 의해 수행될 수 있다. 시험 서열 및 기준 서열의 정렬된 세그먼트에 대한 "일치성 분율"은 기준 서열 세그먼트의 성분들의 총 수, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분으로 나누어진 2개의 정렬된 서열에 의해 공유된 동일한 성분의 수이다. 퍼센트 서열 동일성은 곱해진 동일성 분율을 100으로 나눔으로써 나타낸다. 하나 이상의 폴리뉴클레오타이드 서열의 비교는 전장 폴리뉴클레오타이드 서열 또는 이의 부분, 또는 더 긴 폴리뉴클레오타이드 서열에 대한 것일 수 있다. 본 개시내용의 목적을 위해, "퍼센트 동일성"은 또한, 번역된 뉴클레오타이드 서열을 위한 BLASTX 버전 2.0 및 폴리뉴클레오타이드 서열을 위한 BLASTN 버전 2.0을 이용하여 결정될 수 있다.
서열 동일성의 퍼센트는 바람직하게는, Sequence Analysis Software Package™의 "Best Fit" 또는 "Gap" 프로그램(버전 10; Genetics Computer Group, Inc., 위스콘신주, 매디슨 소재)을 이용하여 결정된다. "Gap"은 매칭 수를 최대화하고 갭의 수를 최소화하는 2개의 서열의 정렬을 찾기 위해 Needleman and Wunsch의 정렬(Needleman and Wunsch, JOURNAL OF MOLECULAR BIOLOGY 48:443-53, 1970)을 사용한다. "BestFit"는 Smith 및 Waterman의 국소 동족체 알고리즘을 이용하여 매칭 수를 최대화하기 위해 2개의 서열과 삽입물 갭 간의 유사성의 최상의 세그먼트의 최적의 정렬을 수행한다(IN APPLIED MATHEMATICS, 2:482-489, 1981, Smith et al., NUCLEIC ACIDS RESEARCH 11:2205-2220, 1983). 퍼센트 동일성은 가장 바람직하게는 "Best Fit" 프로그램을 이용하여 결정된다.
서열 동일성을 결정하기 위한 유용한 방법은 또한, 국립보건원(Bethesda, Md. 20894)의 국립의학 도서관에서 국립 센터 생명공학 정보(NCBI)로부터 공개적으로 입수 가능한 Basic Local Alignment Search Tool(BLAST) 프로그램(BLAST Manual, Altschul et al., NCBI, NLM, NIH; Altschul et al., J. MOL. BIOL. 215:403-10 (1990) 참조)에 개시되어 있으며, 버전 2.0 또는 더 높은 BLAST 프로그램은 정렬에 갭(결실 및 삽입)의 도입을 가능하게 하고, 펩타이드 서열의 경우 BLASTX는 서열 동일성을 결정하기 위해 사용될 수 있으며, 폴리뉴클레오타이드 서열의 경우 BLASTN은 서열 동일성을 결정하기 위해 사용될 수 있다.
본 명세서에서 사용되는 용어 "실질적인 퍼센트 서열 동일성"은 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 훨씬 더 높은 서열 동일성, 예를 들어, 약 98% 또는 약 99% 서열 동일성의 퍼센트 서열 동일성을 지칭한다. 이에 따라, 본 개시내용의 일 실시형태는 본 명세서에 기술된 폴리뉴클레오타이드 서열과 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 훨씬 더 높은 서열 동일성, 예를 들어, 약 98% 또는 약 99% 서열 동일성을 갖는 폴리뉴클레오타이드 분자이다.
동일성 및 유사성
동일성은 서열의 정렬 후 한 쌍의 서열 간에 동일한 아미노산의 분율이고(이는 단지 서열 정보 또는 구조 정보 또는 일부 다른 정보를 이용하여 수행될 수 있지만, 대개 이는 서열 정본만을 기반으로 함), 유사성은 일부 유사성 매트릭스를 사용하여 정렬을 기초로 하여 할당된 스코어이다. 유사성 지수는 하기 BLOSUM62, PAM250, 또는 GONNET, 또는 단백질의 서열 정렬을 위해 당업자에 의해 사용되는 임의의 매트릭스 중 어느 하나일 수 있다.
동일성은 2개의 하위-서열 사이의 대응 정도(서열들 사이에 갭이 없음)이다. 25% 이상의 동일성은 기능의 유사성을 시사하고, 18 내지 25%는 구조 또는 기능의 유사성을 시사한다. 2개의 완전히 관련되지 않거나 무작위 서열들(100개 초과의 잔기임)이 20%보다 높은 동일성을 가질 수 있다는 것을 명심한다. 유사성은 서열들을 비교할 때 2개의 서열 간의 유사함의 정도이다. 이는 이의 동일성에 의존적이다.
본 명세서에서 사용되는 용어의 설명:
본 명세서에서 사용되는 바와 같이, 단수 형태는, 내용이 명확히 달리 나타내지 않는 한, 복수의 지시대상을 포함한다.
용어 "포함된다", "갖는다" 등이 설명 또는 청구범위에서 사용되는 정도까지, 이러한 용어는 "포함한다"가 청구범위에서의 전환어로서 사용될 경우 해석되는 것처럼 용어 "포함한다"와 유사하게 포괄적인 것으로 의도된다.
단어 "예시적인"은 본 명세서에서 "실시예, 예 또는 예시로서 작용하는" 것을 의미하기 위해 사용된다. "예시적인" 것으로서 본 명세서에 기재된 임의의 실시형태가 반드시 다른 실시형태에 비해서 바람직하거나 유리한 것으로 간주되어야 하는 것은 아니다.
용어 "상보적인"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 서로 혼성화할 수 있는 뉴클레오타이드 염기 간 관계를 설명하기 위하여 사용된다. 예를 들어, DNA에 관하여, 아데노신은 티민과 상보적이고, 사이토신은 구아닌과 상보적이다. 따라서, 종속 기술은 실질적으로 유사한 핵산 서열뿐만 아니라 첨부된 서열목록에서 보고된 바와 같은 전체 서열과 상보적인 단리된 핵산 단편도 포함한다.
용어 "핵산" 및 "뉴클레오타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 단일쇄 또는 이중쇄 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 및 이의 중합체를 지칭하기 위하여 사용된다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 가지며 천연 발생 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포괄한다. 달리 나타내지 않는 한, 특정 핵산 서열은 명시적으로 나타낸 서열뿐만 아니라, 묵시적으로 보존적으로 변형된 서열 또는 이의 축퇴성 변이체(예컨대, 축퇴성 코돈 치환) 및 상보적인 서열 또한 포괄한다.
"코딩 서열"은 당업자에게 그의 통상적이고 관례적인 의미를 부여해야 하고, 제한 없이, 특정 아미노산 서열을 인코딩하는 DNA 서열을 지칭하는데 사용된다.
용어 "단리된"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 단리된 핵산 또는 단리된 폴리펩타이드의 맥락에서 사용되는 경우, 비제한적으로 인간의 손에 의해, 그 원상태 환경으로부터 벗어나 존재하고 이에 따라 천연 산물이 아닌 핵산 또는 폴리펩타이드를 지칭하기 위하여 사용된다. 단리된 핵산 또는 폴리펩타이드는 정제된 형태로 존재할 수 있거나, 비-원상태 환경에서, 예컨대, 트랜스제닉 숙주 세포에서 존재할 수 있다.
본 명세서에서 사용되는 바와 같은 용어 "인큐베이션시키는" 및 "인큐베이션"은 2개 이상의 화학적 또는 생물학적 실체(예컨대, 화학적 화합물 및 효소)를 혼합하고, 이들이 목적하는 조성물을 제조하기에 바람직한 조건 하에 상호작용하도록 두는 공정을 의미한다.
용어 "축퇴성 변이체"는 하나 이상의 축퇴성 코돈 치환에 의해 참조 핵산 서열과는 상이한 잔기 서열을 갖는 핵산서열을 지칭한다. 축퇴성 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합된 염기 및/또는 데옥시이노신 잔기로 치환되는 서열을 생성함으로써 달성될 수 있다. 핵산 서열 및 이의 모든 축퇴성 변이체는 동일한 아미노산 또는 폴리펩타이드를 발현할 것이다.
용어 "폴리펩타이드", "단백질" 및 "펩타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어진다; 이러한 3개 용어는 때때로 호환 가능하게 사용되고, 그 크기 또는 기능과 무관하게 비제한적으로 아미노산 또는 아미노산 유사체의 중합체를 나타내기 위하여 사용된다. "단백질"은 종종 상대적으로 큰 폴리펩타이드를 나타내는 데 사용되고 "펩타이드"는 종종 작은 폴리펩타이드를 나타내는 데 사용되지만, 당업계에서 이들 용어의 사용은 중첩되고 변한다. 본 명세서에서 사용되는 바와 같은 용어 "폴리펩타이드"는, 달리 언급되지 않는 한, 펩타이드, 폴리펩타이드 및 단백질을 지칭한다. 용어 "단백질", "폴리펩타이드" 및 "펩타이드"는 폴리뉴클레오타이드 산물을 나타내는 경우 본 명세서에서 호환 가능하게 사용된다. 따라서, 예시적인 폴리펩타이드는 폴리뉴클레오타이드 산물, 천연 발생 단백질, 상동체, 오쏘로그, 파라로그, 단편 및 이의 다른 등가물, 변이체 및 유사체를 포함한다.
참조 폴리펩타이드에 대해 사용되는 경우, 용어 "폴리펩타이드 단편" 및 "단편"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 아미노산 잔기가 참조 폴리펩타이드 자체에 비해 결실되지만, 잔여 아미노산 서열이 보통 참조 폴리펩타이드에서의 대응 위치와 동일한 폴리펩타이드를 나타내기 위하여 사용된다. 이러한 결실은 참조 폴리펩타이드의 아미노-말단 또는 카복시-말단 또는 대안적으로 둘 다에서 일어날 수 있다.
용어 폴리펩타이드 또는 단백질의 "기능적 단편"은 전장 폴리펩타이드 또는 단백질의 일부이고, 전장 폴리펩타이드 또는 단백질과 실질적으로 동일한 생물학적 활성을 갖거나 실질적으로 동일한 기능을 수행하는(예컨대, 동일한 효소 반응을 수행하는) 펩타이드 단편을 나타낸다.
호환 가능하게 사용되는 용어 "변이체 폴리펩타이드", "변형된 아미노산 서열" 또는 "변형된 폴리펩타이드"는 하나 이상의 아미노산에 의해, 예컨대, 하나 이상의 아미노산 치환, 결실 및/또는 부가에 의해 참조 폴리펩타이드와는 상이한 아미노산 서열을 나타낸다. 하나의 양상에서, 변이체는 참조 폴리펩타이드의 일부 또는 모든 능력을 보유하는 "기능적 변이체"이다.
용어 "기능적 변이체"는 보존적으로 치환된 변이체를 더 포함한다. 용어 "보존적으로 치환된 변이체"는 하나 이상의 보존적 아미노산 치환에 의해 참조 펩타이드와는 상이하고 참조 펩타이드의 일부 또는 모든 활성을 유지하는 아미노산 서열을 갖는 펩타이드를 나타낸다. "보존적 아미노산 치환"은 아미노산 잔기의 기능적으로 유사한 잔기로의 치환이다. 보존적 치환의 예는 하나의 비극성(소수성) 잔기, 예컨대, 아이소류신, 발린, 류신 또는 메티오닌의 또 다른 비극성(소수성) 잔기로의 치환; 하나의 하전된 또는 극성(친수성) 잔기의 또 다른 극성(친수성) 잔기, 예컨대, 아르기닌과 라이신 간, 글루타민과 아스파라긴 간, 트레오닌과 세린 간 치환; 하나의 염기성 잔기, 예컨대, 라이신 또는 아르기닌의 또 다른 염기성 잔기로의 치환; 또는 하나의 산성 잔기, 예컨대, 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환; 또는 하나의 방향족 잔기, 예컨대, 페닐알라닌, 티로신 또는 트립토판의 또 다른 방향족 잔기로의 치환이 포함된다. 이러한 치환은 단백질 또는 폴리펩타이드의 겉보기 분자량 또는 등전점에 대한 효과를 거의 또는 전혀 갖지 않을 것으로 예상된다. 어구 "보존적으로 치환된 변이체"는, 생성 펩타이드가 본 명세서에 기재된 바와 같은 참조 펩타이드의 일부 또는 모든 활성을 유지하는 한, 잔기가 화학적으로 유도체화된 잔기로 대체되는 펩타이드를 또한 포함한다.
주제 기술의 폴리펩타이드에 관한 용어 "변이체"는, 참조 폴리펩타이드의 아미노산 서열과 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가진 기능적으로 활성인 폴리펩타이드를 더 포함한다.
본 기술의 변종 폴리펩타이드 서열과 관련하여 "퍼센트(%) 아미노산 서열 동일성"은 필요한 경우, 서열 동일성의 부분으로서 임의의 보존적 치환을 고려하지 않고 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후에, 기준 폴리펩타이드의 아미노산 잔기와 동일한, 후보 서열에서 아미노산 잔기의 백분율을 지칭하는 것이다.
퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은 예를 들어, BLAST, BLAST-2, ALIGN, ALIGN-2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당해 기술분야의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하는, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다. 예를 들어, % 아미노산 서열 동일성은 서열 비교 프로그램 NCBI-BLAST2를 사용하여 결정될 수 있다. NCBI-BLAST2 서열 비교 프로그램은 ncbi.nlm.nih.gov로부터 다운로딩될 수 있다. NCBI BLAST2는 여러 조사 파라미터를 사용하고, 여기서, 그러한 조사 파라미터 모두는 예를 들어, 언마스크 예스(unmask yes), 스트랜드=모두, 예상된 발생 10, 최소 낮은 복잡성 길이=15/5, 다중-패스 e-값=0.01, 다중-패스에 대한 상수 =25, 최종 갭 정렬에 대한 드롭오프=25, 및 스코어링 매트릭스=BLOSUM62를 포함하는 디폴트 값으로 설정된다. 아미노산 서열 비교를 위해 NCBI-BLAST2를 사용하는 상황에서, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 제공된 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 특정 % 아미노산 서열 동일성을 갖거나 이를 포함하는 제공된 아미노산 서열 A로서 표현될 수 있음)은 하기와 같이 계산된다: 100 × 분수 X/Y (상기 식에서, X는 A 및 B의 그러한 프로그램 정렬에서 서열 정렬 프로그램 NCBI-BLAST2에 의해 동일한 매치로서 스코어링된 아미노산 잔기의 수이고, Y는 B에서 아미노산 잔기의 총 수임). 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동일하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성이 A에 대한 B의 % 아미노산 서열 동일성과 동일하지 않는다는 것이 인식될 것이다.
이러한 의미에서, 아미노산 서열 "유사성"을 결정하기 위한 기술은 당해 기술분야에 널리 공지되어 있다. 일반적으로, "유사성"은 적절한 장소에서 둘 이상의 폴리펩타이드의 정확한 아미노산 대 아미노산 비교를 지칭하고, 여기서, 아미노산은 동일하거나 유사한 화학적 및/또는 물리적 특성, 예를 들어, 전하 또는 소수성을 지닌다. 소위 "퍼센트 유사성"은 이후에, 비교된 폴리펩타이드 서열 간에 결정될 수 있다. 핵산 및 아미노산 서열 동일성을 결정하기 위한 기술은 또한, 당해 기술분야에 널리 공지되어 있고, (대개 cDNA 중간체를 통해) 그러한 유전자에 대한 mRNA의 뉴클레오타이드 서열을 결정하고, 그 안에 인코딩된 아미노산 서열을 결정하고, 이를 제2 아미노산 서열과 비교하는 것을 포함한다. 일반적으로, "동일성"은 2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열 각각의 정확한 뉴클레오타이드 또는 아미노산 대 아미노산 대응을 지칭한다. 2개 이상의 폴리뉴클레오타이드 서열은 2개 이상의 아미노산 서열과 같이, 이의 "퍼센트 동일성"을 결정함으로써 비교될 수 있다. Wisconsin Sequence Analysis Package, Version 8(Genetics Computer Group(위스콘신주 매디슨 소재)로부터 입수 가능함)에서 입수 가능한 프로그램, 예를 들어, GAP 프로그램은 2개의 폴리뉴클레오타이드 간의 동일성 및 2개의 폴리펩타이드 서열 간의 유사성 둘 모두를 계산할 수 있다. 서열들 간의 동일성 또는 유사성을 계산하기 위한 다른 프로그램은 당업자에 의해 알려져 있다.
기준 위치에 "상응하는" 아미노산 위치는 아미노산 서열을 정렬시킴으로써 식별되는 바와 같이, 기준 서열과 정렬하는 위치를 지칭한다. 이러한 정렬은 수작업으로 또는 ClustalW2, Blast 2, 등과 같은 널리 공지된 서열 정렬 프로그램을 사용함으로써 수행될 수 있다.
달리 기술하지 않는 한, 2개의 폴리펩타이드 또는 폴리뉴클레오타이드 서열의 퍼센트 동일성은 2개의 서열의 짧은 부분의 전체 길이에 걸쳐 동일한 아미노산 잔기 또는 뉴클레오타이드의 백분율을 지칭한다.
모든 문법적 형태 및 철자 변형에 있어서의 용어 "상동성(homologous)"은 수퍼 패밀리로부터의 폴리뉴클레오타이드 또는 폴리펩타이드 및 상이한 종으로부터의 상동성 폴리뉴클레오타이드 또는 단백질을 포함하는, "공통 진화 기원"을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드 간 관계를 나타낸다(Reeck et al., CELL 50:667, 1987). 이러한 폴리뉴클레오타이드 또는 폴리펩타이드는, 보존된 위치에서의 동일성 백분율 또는 특정 아미노산 또는 모티브의존재의 관점과 무관하게, 이의 서열 유사성으로 반영되는 서열 상동성을 갖는다. 예를 들어, 2개의 상동성 폴리펩타이드는 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 900 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가질 수 있다.
"적합한 조절 서열"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 코딩 서열의 상류(5' 비-코딩 서열), 코딩 서열 내 또는 하류(3' 비-코딩 서열)에 위치하고 연관된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 나타내기 위하여 사용된다. 조절 서열은 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인식 서열을 포함할 수 있다.
"프로모터"는 당업자에게 통상적이고 관례적인 의미로 주어지며 비제한적으로 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 DNA 서열을 나타내기 위하여 사용된다. 일반적으로, 코딩 서열은 프로모터 서열의 3'에 위치한다. 프로모터는 이의 전체가 원상태 유전자로부터 유래될 수 있거나, 자연에서 확인되는 상이한 프로모터로부터 유래되는 상이한 요소로 이루어질 수 있거나, 심지어 합성 DNA 절편을 포함할 수 있다. 당업자라면 상이한 프로모터가 상이한 조직 또는 세포 유형에서 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 유전자가 대부분의 시기에 대부분의 세포 유형에서 발현되도록 유도하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 대부분의 경우, 조절 서열의 정확한 경계가 완벽하게 정의되지 않았으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 추가로 인식된다.
용어 "작동 가능하게 연결된"은 하나의 기능이 다른 기능에 의해 영향받도록 하는 단일 핵산 단편 상에서의 핵산 서열의 회합을 나타낸다. 예를 들어, 프로모터는 이것이 해당 코딩 서열(즉, 프로모터의 전사 제어 하에 있는 코딩 서열)의 발현에 영향을 미칠 수 있는 경우 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다.
본 명세서에서 사용되는 바와 같은 용어 "발현"은, 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로, 주제 기술의 핵산 단편으로부터 유래되는 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타내기 위하여 사용된다. "과발현"은 정상 또는 형질전환되지 않은 유기체에서의 생산 수준을 초과하는 트랜스제닉 또는 재조합 유기체에서의 유전자 산물의 생산을 나타낸다.
"형질전환"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 그 세포에 의한 더 한층의 발현을 위하여 표적 세포 내로의 폴리뉴클레오타이드의 전달을 지칭하기 위하여 사용된다. 전달된 폴리뉴클레오타이드는 표적 세포의 게놈 또는 염색체 DNA 내로 혼입되어, 유전적으로 안정한 유전을 야기할 수 있거나, 숙주 염색체와 무관하게 복제할 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 지칭된다.
숙주 세포와 관련하여 본 명세서에서 사용되는 경우, 용어 "형질전환된", "트랜스제닉" 및 "재조합"은 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 이종성 핵산 분자가 도입된 숙주 유기체의 세포, 예컨대, 식물 또는 미생물 세포를 지칭하기 위하여 사용된다. 핵산 분자는 숙주 세포의 게놈 내로 안정적으로 통합될 수 있거나, 또는 핵산 분자는 염색체외 분자로서 존재할 수 있다. 이러한 염색체외 분자는 자가-복제할 수 있다. 형질전환된 세포, 조직 또는 대상체는 형질전환 공정의 최종 산물뿐만 아니라, 이의 트랜스제닉 자손도 포괄하는 것으로 이해된다.
폴리뉴클레오타이드와 관련하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 특정 숙주 세포에 대한 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리뉴클레오타이드(예컨대, DNA 서열 또는 유전자)를 지칭하기 위하여 사용된다. 따라서, 숙주 세포 내의 이종성 유전자는 특정 숙주 세포에 내인성이지만, 예를 들어, 부위-지정 돌연변이화 또는 다른 재조합 기법의 사용을 통해 변형된 유전자를 포함한다. 이 용어는 또한 천연 발생 DNA 서열의 여러 비-천연 발생 카피가 포함된다. 따라서, 이 용어는 세포에 대해 외래이거나 이종성인, 또는 세포와 상동성이지만 요소가 보통 확인되지 않는 숙주 세포 내의 위치에 있거나 형태인 DNA 절편을 나타낸다.
유사하게, 폴리펩타이드 또는 아미노산 서열에 관하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 특정 숙주 세포에 대해 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리펩타이드 또는 아미노산 서열을 의미한다. 따라서, 재조합 DNA 절편은 숙주 세포에서 발현되어 재조합 폴리펩타이드를 생산할 수 있다.
용어 "플라스미드", "벡터" 및 "카세트"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 종종 세포의 중심 대사의 일부가 아닌 유전자를 운반하고 보통 원형 이중쇄 DNA 분자 형태인 염색체외 요소를 나타내기 위하여 사용된다. 이러한 요소는 임의의 출처로부터 유래되는, 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 선형 또는 원형, 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 여기서 다수의 뉴클레오타이드 서열이 세포 내로 적절한 3' 미번역 서열을 따라 프로모터 단편 및 선택된 유전자 산물에 대한 DNA 서열을 도입할 수 있는 고유한 구성으로 연결되거나 재조합되었다. "형질전환 카세트"는 외래 유전자를 함유하고 특정 숙주 세포의 형질전환을 촉진하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 외래 유전자를 함유하고 외래 숙주에서 그 유전자의 발현 증강을 허용하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있지만, 바람직한 물질 및 방법이 아래에 기재된다.
본 개시내용은 이하의 비제한적 실시예들의 고려 시 보다 완전히 이해될 것이다. 이들 실시예는 주제 기술의 바람직한 실시형태를 시사하지만, 단지 예시로서 부여되는 것이 이해되어야 한다. 상기 논의 및 이들 실시예로부터, 당업자라면 주제 기술의 본질적 특징을 확인할 수 있고, 이의 정신 및 범위에서 벗어나지 않고 다양한 용도 및 조건에 맞게 주제 기술을 다양하게 변화 및 변형시킬 수 있다.
실시예
실시예 1: 엡실론-카로텐 생산 야로위아 리폴리티카 균주의 생성
일반적으로, 구성적 TEF 프로모터 및 XPR2 종결인자를 야로위아 리폴리티카 ATCC 90811 숙주 세포에서 개개 유전자의 과발현을 위해 사용하였다. TEF 프로모터 및 XPR2 종결인자 둘 모두를 지니는 pUC57-Kan 기반 벡터를 클로닝하였다. 개개 유전자를 Gibson 어셈블리를 이용하여 TEF 프로모터와 XPR2 종결인자 사이에서 클로닝하였다. TEF 프로모터, 과발현을 위한 하나 이상의 유전자, 및 XPR2 종결인자를 함유한 카세트를 PCR로 증폭시키고, 이후에, 고 카피수 야로위아 통합 벡터, 예를 들어, pYlex-SDH, pYconVec-Leu, 및 pYconVec-Leu에 클로닝하였으며, 이는 영양요구성 라이신, 류신 및 우라실 마커 각각을 갖는다.
카로테노이드 전구체 공급을 증가시키기 위해, 자체 TEF 프로모터 및 XPR2 종결인자와 함께 HMGS, HMGR 및 IPI를 인코딩하는 유전자를 포함하는 3개의 유전자를 pYlex-SDH 벡터에 클로닝하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS 작제물을 생성하였다(도 4a). pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS 작제물을 이후에 사용하여 야로위아 리폴리티카 ATCC 90811 숙주를 형질전환하고, 라이신 없이 최소 배지 플레이트 상에서 선택하였다.
자체 TEF 프로모터 및 XPR2 종결인자와 함께, 리코펜 생산을 위한 2개의 유전자, 상세하게는, CarRP*(이의 리코펜 사이클라제 활성을 완전히 상실하는 돌연변이체 CarRP) 및 CarB를 인코딩하는 유전자, 및 GGPPS에 프레임내 융합된 FPPS를 포함하는 융합 단백질을 인코딩하는 유전자를 pYconVec-Leu 벡터에 클로닝하여 pYconVec-Leu-TEF-carB-TEF-carRP*-TEF-GGPPS::FPPS 작제물을 생성하였다(도 4b). pYconVec-Leu-TEF-carB-TEF-carRP*-TEF-GGPPS::FPPS 작제물을 이후에 사용하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS를 호스팅하는 야로위아 리폴리티카 ATCC 90811 균주를 형질전환하고, 류신 없이 최소 배지 플레이트 상에서 선택하였다. 적색 클론은 야로위아 리폴리티카 리코펜 생산자이다. 최고 리코펜 함량을 갖는 콜로니는 LYC-40으로 명명되었고, 엡실론-카로텐 및 알파-이오논 생산을 위한 숙주로서 선택되었다.
TEF 프로모터 및 XPR2 종결인자와 함께, 엡실론-사이클라제(EC) 유전자를 pYconVec-Ura 벡터에 클로닝하여 pYconVec-Ura-TEF-EC 작제물을 생성하였다. pYconVec-Ura-TEF-EC를 이후에 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 오렌지색 엡실론-카로텐 생산 야로위아 리폴리티카 균주를 생성하였다.
실시예 2: HPLC 분석을 위한 엡실론-카로텐의 추출
엡실론-카로텐 생산 야로위아 리폴리티카 균주를 YPD 아가 플레이트 상에서 스트리킹하고(streak), 30℃에서 성장시켰다. 2일의 인큐베이션 후, 오렌지색 콜로니를 5㎖의 YPD 액체 배치 중에서 250 rpm 및 30℃에서 4일 동안 성장시켰다. 0.2㎖의 세포 배양물을 원심분리에 의해 수확하고, 세포 펠렛을 0.8㎖의 메탄올 및 0.2㎖의 디클로로메탄으로 재현탁하였다. 0.5㎜ 직경의 유리 비드를 이후에 첨가하였다. 야로위아 리폴리티카 세포를 1분 동안 비드 비터 균질기에서 파쇄하였다. 이후에, 혼합물을 15,000 rpm에서 10분 동안 원심분리하고, 상청액을 HPLC 분석을 위해 수집하였다.
엡실론-카로텐의 HPLC 분석을, 4차 펌프, 온도 제어 컬럼 구획, 자동 샘플러 및 UV 흡광도 검출기를 포함한, Ultimate 3000 HPLC System(Dionex, 캘리포니아주 서니베일 소재)을 이용하여 수행하였다. 가드 컬럼을 갖는 Gemini C18(150㎜ x 4.6㎜ 3㎛)을 리코펜, 델타-카로텐 및 엡실론-카로텐의 특징분석을 위해 사용하였다. 1.0 ㎖/분의 유량을 적용하였으며, 이동상은 아이소프로판올(A) 및 아세토나이트릴(B)을 포함하였다. 프로그램은 0 내지 5분 85% B; 5 내지 13분 85%에서 60% B까지; 13 내지 14분 60%에서 85% B까지; 14 내지 16분 85% B였다. 검출 파장은 리코펜, 델타-카로텐 및 엡실론-카로텐의 경우 474㎚였다.
도 5에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP*, CarB, FPPS:: GGPPS 및 EC의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 공지된 표준물에 대한 추출된 생성물의 체류 시간(상단) 및 UV 스펙트럼(하단)을 비교함으로써 리코펜(10분 피크), 델타-카로텐(11.5분 피크) 및 엡실론-카로텐(13분 피크)을 축적하였다.
실시예 3: 베타-카로텐 생산 야로위아 리폴리티카 균주의 생성
자체 TEF 프로모터 및 XPR2 종결인자와 함께, 베타-카로텐 생산을 위한 2개의 유전자, 상세하게는, CarRP 및 CarB를 인코딩하는 유전자, 및 GGPPS에 프레임내 융합된 FPPS를 포함하는 융합 단백질을 인코딩하는 유전자를 pYconVec-Leu 벡터에 클로닝하여 pYconVec-Leu-TEF-carB-TEF-carRP-TEF-GGPPS::FPPS 작제물을 생성하였다. 이후에, pYconVec-Leu-TEF-carB-TEF-carRP-TEF-GGPPS::FPPS 작제물을 사용하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS를 호스팅하는 야로위아 리폴리티카 ATCC 90811 균주를 형질전환시키고, 류신 없이 최소 배지 플레이트 상에서 선택하였다. 오렌지색 클론은 야로위아 리폴리티카 베타-카로텐 생산자였다. 최고 베타-카로텐 함량을 갖는 콜로니는 BC-3으로서 명명되었고, 베타-이오논 생산을 위한 숙주로서 선택하였다.
실시예 4: HPLC 분석을 위한 베타-카로텐의 추출
베타-카로텐 생산 야로위아 리폴리티카 균주를 YPD 아가 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 2일의 인큐베이션 후에, 오렌지색 콜로니를 5㎖의 YPD 액체 배지 중에서 250 rpm 및 30℃에서 4일 동안 성장시켰다. 0.2㎖의 세포 배양물을 원심분리에 의해 수확하고, 세포 펠렛을 0.8㎖의 메탄올 및 0.2㎖의 디클로로메탄으로 재현탁하였다. 0.5㎜ 직경 유리 비드를 이후에 첨가하였다. 야로위아 리폴리티카 세포를 비드 비터 균질기에서 1분 동안 파쇄하였다. 이후에, 혼합물을 15,000 rpm에서 10분 동안 원심분리하고, 상청액을 HPLC 분석을 위해 수집하였다.
베타-카로텐의 HPLC 분석을 4차 펌프, 온도-제어 컬럼 구획, 자동 샘플러 및 UV 흡광도 검출기를 포함한 Ultimate 3000 HPLC System(Dionex, 캘리포니아주 서니베일 소재)을 사용하여 수행하였다. 가드 컬럼을 갖는 Gemini C18(150㎜×4.6㎜ 3㎛)을 베타-카로텐의 특징분석을 위해 사용하였다. 1.0 ㎖/분의 유량을 적용하였으며, 이동상은 아이소프로판올(A) 및 아세토나이트릴(B)을 포함하였다. 프로그램은 0 내지 5분 85% B; 5 내지 13분 85%에서 60% B까지; 13 내지 14분 60%에서 85% B까지; 14 내지 16분 85% B였다. 검출 파장은 베타-카로텐의 경우 474㎚였다.
도 6에 도시된 바와 같이, MGS, HMGR, IPI, carRP, carB 및 FPPS:: GGPPS의 유전자를 호스팅하는 야로위아 리폴리티카는 베타-카로텐 표준물에 대한 추출된 베타-카로텐의 체류 시간(상단) 및 UV 스펙트럼(하단)을 비교함으로써 베타-카로텐(13.5분 피크)을 축적하였다.
실시예 5: 9,10(9',10') 카로테노이드 분열 활성을 갖는 후보 CCD 효소를 식별함
카로테노이드 분열 다이옥시게나제(CCD) 효소는 다양한 이오논 화합물(알파-이오논 및 베타-이오논을 포함함)을 생성하기 위해 다양한 카로텐 기질(도 5에 도시된 엡실론-카로텐 및 도 6에 도시된 베타-카로텐을 포함함)의 분열을 촉매화할 수 있다. 도 2를 참조하면, 효율적인 CCD는 알파-이오논 또는 베타-이오논에 대한 생합성 경로에서 결정 인자 및 핵심 병목 현상이다.
일부 식물 또는 시아노박테리아가 이오논 화합물을 제조할 수 있다는 것이 보고되었다. 공개된 문헌 및 공지된 CCD 유전자 서열의 서열 유사성 네트워크(SSN) 분석을 기초로 하여, 28개의 후보 CCD 유전자를 야로위아 리폴리티카에서 가장 효율적인 CCD 효소의 생체내 스크리닝을 위해 선택하였다. 후보 CCD 유전자를 pUC57-Kan-TEF-XPR2 벡터에 개별적으로 클로닝하였다. 각 후보 CCD 유전자를, 자체 TEF 프로모터 및 XPR2 종결인자와 함께, pYconVec-Ura-TEF-EC 벡터에 클로닝하여 pYconVec-Ura-TEF-EC-TEF-CCD 작제물을 생성하였다. 각 pYconVec-Ura-TEF-EC-TEF-CCD 작제물을 이후에 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 오렌지색 또는 황색 알파-이오논 생산 야로위아 리폴리티카 균주를 생산하였다. 스크리닝한 모든 CCD 효소 중에서, 본 발명자는 가장 높은 활성을 갖는 CCD 효소로서 PhCCD1(식물 페튜니아 하이브리다로부터 비롯됨)을 확인하였지만, 시험관 기반 세포 배양물로부터의 이의 알파-이오논 역가는 여전이 매우 낮았다(< 3 ㎎/ℓ). 코돈-최적화된 PhCCD1 유전자(서열번호 12 및 서열번호 13을 포함함)의 3개의 상이한 버전을 이후에 동일한 전략을 이용하여 스크리닝하여 야로위아 리폴리티카 ATCC 90811(서열번호 13)에서 가장 효율적인 PhCCD1 유전자를 확인하였다.
실시예 6: GC-MS 분석을 위한 알파-이오논의 추출
추정 오렌지색 또는 황색 알파-이오논 생산 야로위아 리폴리티카 클론을 우라실 없이 최소 배지 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 3일의 인큐베이션 후, 콜로니를 5㎖의 YPD 액체 배지에서 250 rpm 및 30℃에서 5일 동안 성장시켰다. 알파-이오논 생산을 분석하기 위해, 1.0㎖의 야로위아 리폴리티카 세포 배양물을 획득하고, 효모 슬러리를 철저한 혼합을 위해 적어도 1분 동안 1.0㎖의 n-헥산으로 추출하였다. 2,000 rpm에서 10분 동안 원심분리 후에, n-헥산 상을 GC/MS 분석을 위해 사용하였다.
GC/MS 분석을 GCMS-QP2010S 검출기가 결합된 Shimadzu GC-2010 시스템 상에서 수행하였다. 분석 컬럼은 SHRXI-5MS(두께 0.25㎛; 길이 30 m; 직경 0.25㎜)이었으며, 주입 온도는 분할 모드 하에서 265℃이다. 온도 구배는 0 내지 1분 110℃; 1 내지 8.75분 110℃에서 265℃까지, 20의 구배; 8.75 내지 9.75분, 265℃이다.
도 7에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP*, CarB, FPPS:: GGPPS, EC 및 CCD의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 정통 알파-이오논 표준물(하단)에 대한 추출된 생성물(상단, 중앙)의 체류 시간 및 질량 분광 데이터를 비교하였을 때 알파-이오논(4.3분 피크)을 축적하는 것으로 나타났다.
실시예 7: PhCCD1 9,10(9',10') 카로테노이드 분열 활성을 개선시키기 위한 후보 지질체 구획화 신호 태그의 확인
도 2를 참조하면, 알파-이오논 및 베타-이오논에 대한 생합성 경로에서의 최종 효소, 즉, CCD는 이의 불량한 활성으로 인해 이오논 생산에 대한 핵심 병목현상이다. 카로테노이드 플랫폼으로서 이.콜라이를 사용하여 CCD 카로테노이드 분열 활성을 개선시키기 위해 노력하였다. CCD에 가용성 태그를 부가하고, 부위-지정 돌연변이유발을 사용하고, 카로텐 사이클라제-CCD 융합 효소를 생성하는 것을 포함하는, 여러 전략이 이.콜라이의 CCD1의 촉매 특성을 개선시킬 수 있다는 것이 보고되었다. 또한, 부위-지정 돌연변이유발과 펩타이드-CCD 발현의 조합이 사카로마이세스 세레비지에 플랫폼을 이용하여 PhCCD1 활성을 약간 개선시킬 수 있다는 것이 보고되었다. 그러나, 본 발명자들의 지식에 따라, 야로위아 리폴리티카 플랫폼을 사용하여 CCD 활성을 개선하는 데 성공을 달성하였다. CCD 효소에 대한 단백질 엔지니어링 노력 외에도, 본 발명자는 PhCCD1과 같은 CCD의 분열 활성을 개선시키기 위해 지질체 기반 하위세포 구획 엔지니어링 방식을 조사하기 위해 선택하였다.
생합성 경로 또는 효소의 구획화는 화학적 생산을 증가시키기 위한 효율적인 전략이다. 경로 또는 효소 구획화는 기질 또는 필수 보조 인자에 더 가깝게 효소를 배치하거나, 기질의 유효 농도를 증가시키거나, 효소 반응에 더욱 적합한 화학적 환경을 제공함으로써 화학적 생산을 돕는다. 도 3을 참조하면, 본 발명자는 현미경으로, 적색 리코펜 및 오렌지색 카로텐이 코리네박테리움 글루타미쿰 세포에서 야로위아 리폴리티카 세포 및 지방구에서의 지질체에 축적하였음을 관찰하였다. 이에 따라, 본 발명자는 숙주로서 야로위아 리폴리티카 리코펜-생산 균주 LYC-40을 사용하여 추정 지질체 구획화 신호 태그(다양한 지질 합성 효소, 지질체 어셈블리를 위한 막 단백질, 및 지질체 구조 단백질뿐만 아니라 오렌지 카로테노이드 결합 단백질을 포함함)의 수의 생체내 스크리닝을 수행한다는 것을 결정하였다.
pYconVec-Ura-TEF-EC-TEF-PhCCD1 벡터를 코돈-최적화된 PhCCD1 유전자와 TEF 프로모터 사이에 BsaI 부위를 갖도록 생성하였다. 추정 지질체 구획화 신호 태그(LBT)를 인코딩하는 후보 유전자를 BsaI 부위에 개별적으로 클로닝하여 pYconVec-Ura-TEF-EC-TEF-LBT_CCD 작제물을 생성하였다(도 4c). 이후에 각 작제물을 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 황색 추정 알파-이오논 생산 야로위아 리폴리티카 균주를 가장 효율적인 지질체 구획화 신호 태그의 GC/MS 스크리닝을 위해 생성하였다.
도 8에 도시된 바와 같이, 가용성 태그(예를 들어, TrxA 태그화된 PhCCD1, 아미노산 서열 및 TrxA에 대한 코돈-최적화된 핵산 서열은 서열번호 27 및 서열번호 28로서 제공됨)의 첨가, 부위-지정 돌연변이유발(PhCCD1-K164L, PhCCD1-T170A, PhCCD1-A327S, PhCCD1-S428N, PhCCD1-K164L_T170A_A327S, PhCCD 1-K 164L_T 170 A_A327 S_S428N, 이는 서열번호 11의 돌연변이체에 해당함), 및 엡실론 사이클라제(EC)-CCD 융합 효소(EC-LGS-PhCCD1)의 생성의 전략과 비교하면, 다수의 지질체 구획화 신호 태그는 야로위아 리폴리티카 세포에서 PhCCD1의 생체내 카로테노이드 분열 효율을 급격하게 개선시킬 수 있다. 이러한 지질체 구획화 신호 태그는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질, 야로위아 리폴리티카 막 수송체 Stl1p 단백질, 야로위아 리폴리티카 지방구 단백질 Oil1p, 제아 메이즈 16 kDa 올레오신 및 세사뭄 인디쿰 17 kDa 올레오신을 포함한다. 도 8을 계속 참조하면, 기술된 대안적인 전략을 통해 약 5배 역가 증가로 제한되는 대신에, CCD 효소에 결합된 지질체 구획화 신호 태그를 포함하는 융합 효소를 사용하는 본 방법에서, 역가의 증가가 11배 내지 33배 이상의 범위임을 나타낸다.
실시예 8: 베타-이오논 생산 야로위아 리폴리티카 균주의 생성
TEF 프로모터 및 XPR2 종결인자와 함께, 지질체 구획화 태그화된 PhCCD1을 인코딩하는 유전자를 pYconVec-Ura 벡터에 클로닝하여 pYconVec-Ura-TEF-LBT_PhCCD1 작제물을 생산하였다. 이후에, pYconVec-Ura-TEF-LBT_PhCCD1 작제물을 사용하여 베타-카로텐 생산 야로위아 리폴리티카 ATCC 90811 숙주 BC-3을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 황색 베타-이오논 생산 야로위아 리폴리티카 균주를 생산하였다. 황색 클론을 우라실 없이 최소 배지 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 3일 인큐베이션 후에, 콜로니를 5㎖ YPD 액체 배지 중에서 250 rpm 및 30℃에서 5일 동안 성장시켰다. 베타-이오논 생산을 분석하기 위해, 1.0㎖의 야로위아 리폴리티카 세포 배양물을 획득하고, 효모 슬러리를 철저한 혼합을 위해 적어도 1분 와류와 함께 1.0㎖의 n-헥산으로 추출하였다. 2,000 rpm에서 10분 동안 원심분리 후에, n-헥산 상을 GC/MS 분석을 위해 사용하였다.
GC/MS 분석을 GCMS-QP2010S 검출기가 결합된 Shimadzu GC-2010 시스템 상에서 수행하였다. 분석 컬럼은 SHRXI-5MS(두께 0.25㎛; 길이 30 m; 직경 0.25㎜)이고, 주입 온도는 분할 모드 하에서 265℃이다. 온도 구배는 0 내지 1분 110℃; 1 내지 8.75분, 110℃에서 265℃까지, 20의 구배; 8.75 내지 9.75분, 265℃.
도 9에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP, CarB, FPPS:: GGPPS 및 지질체 구획화 태그화된 PhCCD1의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 전통 베타-이오논 표준물(하단)에 대한 추출된 생성물(상단, 중앙)의 체류 시간 및 질량 분광 데이터를 비교함으로써 베타-이오논(4.7분 피크)을 축적하였다.
실시예 9: 융합 단백질 올레오신::crtRB 및 올레오신::BKT을 발현시킴으로써 아스타잔틴의 생산 증가
본 명세서에 기술된 LBT 펩타이드는 다른 카로테노이드 화합물의 생산을 증가하기 위해 다른 카로테노이드-생성 효소에 융합될 수 있다. 도 11은 태그화되지 않은 CrtRB 효소를 인코딩하는 코딩 서열 및 태그화되지 않은 BKT 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtRB-BKT)로 형질전환된 균주와 비교하여, LBT-CrtRB 융합 효소를 인코딩하는 코딩 서열 및 LBT-BKT 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtRB-올레오신::BKT)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 아스타잔틴(AS) 및 제아잔틴(ZX)의 증가된 생산을 나타낸다.
실시예 10: 융합 단백질 올레오신::crt를 발현시킴으로써 칸타잔틴의 생산 증가
도 12는 태그화되지 않은 CrtW 효소(crtW)를 인코딩하는 코딩 서열을 포함한느 핵산 작제물로 형질전환된 균주와 비교하여 LBT-CrtW 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtW)로 형질전환된 재조합 이생물 생산 균주를 사용할 때 칸타잔틴(CX)의 증가된 생산을 도시한다.
관심 서열
제아 메이즈 올레오신 16 kDa
단백질 NP_001336922.1의 아미노산 서열(서열번호 1):
야로위아 리폴리티카에 대한 NP_001336922.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 2):
세사뭄 인디쿰 올레오신 17 kDa
단백질의 아미노산 서열(서열번호 3):
야로위아 리폴리티카에 대한 AAG23840.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 4):
림노스피라 막시마 오렌지 카로테노이드 결합 단백질
단백질 P83689.1의 아미노산 서열(서열번호 5):
야로위아 리폴리티카에 대한 P83689.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 6):
야로위아 리폴리티카 막 수송체 Stl 1p
단백질 XP_501907.1의 아미노산 서열(서열번호 7):
야로위아 리폴리티카에 대한 XP_501907.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 8):
야로위아 리폴리티카 지방구 단백질 Oil1p
단백질 XP_505819.1의 아미노산 서열(서열번호 9):
야로위아 리폴리티카에 대한 XP_505819.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 10):
페튜니아 x 하이브리다 카로테노이드 분열 다이옥시게나제 1
단백질 AAT68189.1의 아미노산 서열(서열번호 11):
야로위아 리폴리티카 버전 1에 대한 AAT68189.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 12):
야로위아 리폴리티카 버전 2에 대한 AAT68189.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 13):
오스만투스 프라그란스 카로테노이드 분열 다이옥시게나제 1
단백질 BAJ05401.1의 아미노산 서열(서열번호 14):
카로테노이드 분열 다이옥시게나제 1에 대한 오스만투스 프라그란스 CCD1 mRNA, AB526197.1의 뉴클레오타이드 서열(서열번호 15):
제아 메이즈 카로테노이드 분열 다이옥시게나제 1
단백질 ACG46084.1의 아미노산 서열(서열번호 16):
제아 메이즈 카로테노이드 분열 다이옥시게나제 1(CCD1) mRNA, DQ100346.1의 뉴클레오타이드 서열(서열번호 17):
노스토칼레스 시아노박테리움 HT-58-29-시스-에폭시카로테노이드 다이옥시게나제
단백질 WP_087544521.1의 아미노산 서열(서열번호 18):
야로위아 리폴리티카에 대한 WP_087544521.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 19):
칼로트릭스 종 NIES-2098 카로테노이드 옥시게나제
단백질 BAY08575.1의 아미노산 서열(서열번호 20):
야로위아 리폴리티카에 대한 BAY08575.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 21):
칼로트릭스 브레비시마 NIES-22 카로테노이드 옥시게나제
단백질 BAY62420.1의 아미노산 서열(서열번호 22):
야로위아 리폴리티카에 대한 BAY62420.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 23):
스키토네마 밀레이 9-시스-에폭시카로테노이드 다이옥시게나제
단백질 WP_069349917.1의 아미노산 서열(서열번호 24):
야로위아 리폴리티카에 대한 WP_069349917.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 25):
락투카 사티바 리코펜 엡실론-사이클라제
야로위아 리폴리티카에 대한 락투카 사티바 리코펜 엡실론-사이클라제의 코돈-최적화된 뉴클레오타이드 서열(서열번호 26):
이.콜라이 티오레독신(TrxA) 태그
TrxA의 아미노산 서열(서열번호 27):
야로위아 리폴리티카에 대한 trxA 유전자의 코돈-최적화된 뉴클레오타이드 서열(서열번호 28):
제아 메이즈 올레오신에서 보존된 도메인
제아 메이즈 올레오신에서 보존된 도메인의 아미노산 서열(서열번호 29):
세사뭄 인디쿰 올레오신에서 보존된 도메인
세사뭄 인디쿰 올레오신에서 보존된 도메인의 아미노산 서열(서열번호 30):
아라비돕시스 탈리아나 칼레오신
아라비돕시스 탈리아나 칼레오신의 아미노산 서열(서열번호 31):
아라비돕시스 탈리아나 칼레오신의 뉴클레오타이드 서열(서열번호 32):
아라비돕시스 탈리아나 칼레오신
세사뭄 인디쿰 칼레오신의 아미노산 서열(서열번호 33):
세사뭄 인디쿰 칼레오신의 뉴클레오타이드 서열(서열번호 34):
SEQUENCE LISTING
<110> Conagen Inc.
<120> Biosynthesis of Alpha-Ionone and Beta-Ionone
<130> WO2021/067974
<140> PCT/US2020/054323
<141> 2020-10-05
<150> US 62/911,116
<151> 2019-10-04
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 159
<212> PRT
<213> Zea mays
<400> 1
Met Ala Thr Ala His His Ala Asp Asp His Arg Ala Gly Arg Arg Ser
1 5 10 15
Glu Ala Val Gly Glu Asn Tyr Met Arg Gly Leu Tyr Gly Asp Asp Asp
20 25 30
Tyr Asn Ala Thr His Tyr Gly His Gln Gln Gln Gln Arg Pro Pro Pro
35 40 45
Ala Pro Met Ala Val Ala Lys Ala Leu Ala Thr Ala Thr Ala Ala Phe
50 55 60
Ser Met Leu Leu Leu Ser Gly Leu Ala Val Thr Gly Thr Val Leu Ala
65 70 75 80
Leu Ile Val Ala Thr Pro Leu Met Val Ile Phe Ser Pro Val Leu Val
85 90 95
Pro Ala Ala Ile Thr Val Ala Leu Leu Thr Val Gly Ile Val Ser Ser
100 105 110
Gly Gly Phe Gly Val Ala Ala Val Ala Val Leu Ala Trp Val Tyr Arg
115 120 125
Tyr Leu Gln Thr Thr Thr Ser Ser Ser Gly Gln Gln Pro His Ile Val
130 135 140
Lys Asp Trp Ala Gln Gln His Arg Leu Glu Gln Thr Arg Ala His
145 150 155
<210> 2
<211> 477
<212> DNA
<213> Zea mays
<400> 2
atggccacgg cacaccatgc tgatgatcac agagctggtc gtcgatctga ggccgtcggt 60
gaaaattaca tgagaggcct ctacggagac gacgactaca atgcaaccca ttacggccac 120
caacaacaac aaagaccccc tcctgcccct atggctgttg caaaagctct tgcaactgca 180
accgccgctt tctcgatgct cctccttagc ggtctggccg ttacgggaac cgtgctcgca 240
ctgattgttg ccacgcctct catggtcatc ttctcccccg tccttgtgcc cgccgcaatc 300
accgtggccc tcctgacagt cggcattgtc tcgtctggcg gttttggtgt cgctgctgtt 360
gcagttctcg cttgggtgta tcgttacctc caaacgacaa ctagcagctc gggtcagcag 420
cctcacattg ttaaagattg ggcacaacag caccgtcttg agcaaacccg tgctcac 477
<210> 3
<211> 166
<212> PRT
<213> Sesamum indicum
<400> 3
Met Ala Asp Arg Asp Arg Pro His Pro His Gln Ile Gln Val His Pro
1 5 10 15
Gln His Pro His Arg Tyr Glu Gly Gly Val Lys Ser Leu Leu Pro Gln
20 25 30
Lys Gly Pro Ser Thr Thr Gln Ile Leu Ala Ile Ile Thr Leu Leu Pro
35 40 45
Ile Ser Gly Thr Leu Leu Cys Leu Ala Gly Ile Thr Leu Val Gly Thr
50 55 60
Leu Ile Gly Leu Ala Val Ala Thr Pro Val Phe Val Ile Phe Ser Pro
65 70 75 80
Val Leu Val Pro Ala Ala Ile Leu Ile Ala Gly Ala Val Thr Ala Phe
85 90 95
Leu Thr Ser Gly Ala Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp
100 105 110
Val Leu Asn Ser Phe Arg Arg Ala Thr Gly Gln Gly Pro Leu Glu Tyr
115 120 125
Ala Lys Arg Gly Val Gln Glu Gly Thr Leu Tyr Val Gly Glu Lys Thr
130 135 140
Lys Gln Ala Gly Glu Ala Ile Lys Ser Thr Ala Lys Glu Gly Gly Arg
145 150 155 160
Glu Gly Thr Ala Arg Thr
165
<210> 4
<211> 498
<212> DNA
<213> Sesamum indicum
<400> 4
atggccgacc gtgatagacc tcaccctcac caaattcaag tgcatcctca acacccccat 60
agatacgagg gtggtgttaa gtccctcctc cctcagaaag gcccctcgac cacccagatt 120
ctcgctatca ttacccttct ccctattagc ggaacactgc tctgcctggc cggaatcacg 180
ctggttggaa ccctcatcgg cctcgccgtc gcaacacctg tcttcgttat tttctctcct 240
gtgctcgtcc ccgcagccat cctgatcgcc ggtgccgtta cagcatttct cacttctggc 300
gcatttggtc ttaccggcct cagctctctc tcctgggtgc tcaactcgtt cagacgagct 360
acgggacagg gaccccttga atacgctaag cgaggtgttc aggagggtac gctctacgtt 420
ggtgagaaaa cgaagcaagc aggcgaggca atcaagtcca cggccaaaga aggaggtcga 480
gagggcactg cccgaaca 498
<210> 5
<211> 317
<212> PRT
<213> Limnospira maxima
<400> 5
Met Pro Phe Thr Ile Asp Thr Ala Arg Ser Ile Phe Pro Glu Thr Leu
1 5 10 15
Ala Ala Asp Val Val Pro Ala Thr Ile Ala Arg Phe Lys Gln Leu Ser
20 25 30
Ala Glu Asp Gln Leu Ala Leu Ile Trp Phe Ala Tyr Leu Glu Met Gly
35 40 45
Lys Thr Ile Thr Ile Ala Ala Pro Gly Ala Ala Asn Met Gln Phe Ala
50 55 60
Glu Asn Thr Leu Gln Glu Ile Arg Gln Met Thr Pro Leu Gln Gln Thr
65 70 75 80
Gln Ala Met Cys Asp Leu Ala Asn Arg Thr Asp Thr Pro Ile Cys Arg
85 90 95
Thr Tyr Ala Ser Trp Ser Pro Asn Ile Lys Leu Gly Phe Trp Tyr Glu
100 105 110
Leu Gly Arg Phe Met Asp Gln Gly Leu Val Ala Pro Ile Pro Glu Gly
115 120 125
Tyr Lys Leu Ser Ala Asn Ala Asn Ala Ile Leu Val Thr Ile Gln Gly
130 135 140
Ile Asp Pro Gly Gln Gln Ile Thr Val Leu Arg Asn Cys Val Val Asp
145 150 155 160
Met Gly Phe Asp Thr Ser Lys Leu Gly Ser Tyr Gln Arg Val Ala Glu
165 170 175
Pro Val Val Pro Pro Gln Glu Met Ser Gln Arg Thr Lys Val Gln Ile
180 185 190
Glu Gly Val Thr Asn Ser Thr Val Leu Gln Tyr Met Asp Asn Leu Asn
195 200 205
Ala Asn Asp Phe Asp Asn Leu Ile Ser Leu Phe Ala Glu Asp Gly Ala
210 215 220
Leu Gln Pro Pro Phe Gln Lys Pro Ile Val Gly Lys Glu Asn Thr Leu
225 230 235 240
Arg Phe Phe Arg Glu Glu Cys Gln Asn Leu Lys Leu Ile Pro Glu Arg
245 250 255
Gly Val Ser Glu Pro Thr Glu Asp Gly Tyr Thr Gln Ile Lys Val Thr
260 265 270
Gly Lys Val Gln Thr Pro Trp Phe Gly Gly Asn Val Gly Met Asn Ile
275 280 285
Ala Trp Arg Phe Leu Leu Asn Pro Glu Asn Lys Val Phe Phe Val Ala
290 295 300
Ile Asp Leu Leu Ala Ser Pro Lys Glu Leu Leu Asn Leu
305 310 315
<210> 6
<211> 951
<212> DNA
<213> Limnospira maxima
<400> 6
atgcctttca ctatcgatac ggctagaagc atcttccctg agacactggc agccgacgtt 60
gtccccgcca caatcgcccg atttaagcag ctcagcgcag aagaccagct tgcccttatc 120
tggttcgctt acctcgagat gggaaagact atcactatcg cagcacccgg agctgccaat 180
atgcagttcg ccgagaacac acttcaagag atccggcaga tgactcctct ccagcagacc 240
caggccatgt gtgatctggc taatcgtacc gatactccta tttgtagaac ttacgcttct 300
tggtccccca atattaaact tggtttctgg tatgaactcg gccggtttat ggaccagggt 360
cttgtggccc ccattcccga aggttacaag ctctctgcta atgcaaatgc aattcttgtg 420
accatccaag gaattgatcc tggacagcaa atcacggtcc tgcggaattg cgttgttgat 480
atgggtttcg acacatctaa gctcggttcg taccagcggg ttgctgagcc cgtcgttccc 540
ccccaggaga tgtcccaacg aactaaggtt caaattgagg gagttactaa ctctaccgtc 600
cttcagtaca tggataatct gaacgcaaac gattttgata atcttatctc gcttttcgcc 660
gaggatggtg ctcttcagcc cccttttcaa aagcctatcg ttggcaaaga gaatacactc 720
agatttttcc gagaggaatg ccagaacctc aaactcatcc ctgagcgtgg agtttcggaa 780
cccacagagg atggatacac acagattaag gtcacgggca aagttcagac accctggttc 840
ggcggaaatg tgggaatgaa catcgcttgg cgtttccttc ttaaccctga gaacaaggtt 900
ttctttgttg caatcgatct gctcgcaagc cccaaagagc tcctcaacct t 951
<210> 7
<211> 578
<212> PRT
<213> Yarrowia lipolytica
<400> 7
Met Lys Leu Gln Val Pro Ala Phe Ala Arg Ser Ser Ser Asp Val Lys
1 5 10 15
Thr Ser Phe Met Gly Ala Arg Gly Gln Lys Leu His Asn Leu Val Ala
20 25 30
Ala Ile Ala Gly Leu Gly Phe Leu Leu Phe Gly Tyr Asp Gln Gly Val
35 40 45
Met Gly Gly Leu Leu Thr Leu Asp Thr Phe Ile Gln Gln Phe Pro Lys
50 55 60
Met Asp Thr Ser Asp Tyr Leu Pro Pro Lys Val Lys Thr Phe Asn Thr
65 70 75 80
Thr Ile Gln Gly Thr Ala Val Gly Ile Tyr Glu Ile Gly Cys Met Ile
85 90 95
Gly Ala Leu Phe Thr Met Trp Ala Gly Asp Lys Leu Gly Arg Arg Tyr
100 105 110
Met Ile Phe Phe Gly Ser Ile Ile Met Thr Ile Gly Ala Ile Leu Gln
115 120 125
Cys Ala Ser Tyr Ser Leu Gly Gln Phe Ile Ala Gly Arg Val Ile Ser
130 135 140
Gly Ile Gly Asn Gly Phe Ile Thr Ala Thr Val Pro Met Leu Gln Ser
145 150 155 160
Glu Cys Ala Lys Pro Glu Arg Arg Gly Lys Leu Val Met Leu Glu Gly
165 170 175
Ala Leu Ile Thr Ala Gly Ile Ala Leu Ser Tyr Trp Ile Asp Phe Gly
180 185 190
Phe Tyr Trp Val Arg Thr Asn Asp Ala Asp Trp Arg Phe Pro Ile Ala
195 200 205
Phe Gln Ile Val Phe Ser Leu Val Leu Thr Phe Thr Ile Met Ser Leu
210 215 220
Pro Glu Ser Pro Arg Trp Leu Val Lys Lys Gln Arg Phe Glu Glu Ala
225 230 235 240
Ala Gly Val Phe Ala Ala Leu Glu Asp Val Pro Leu Asp Asp Pro Tyr
245 250 255
Val Ile Asn Gln Ile Thr Ser Val Lys Glu Ser Ile Met Met Glu Gln
260 265 270
Leu Ala Gln Leu Gly Val Asp Gly Val Asp Ala Arg Arg Lys Ile Gln
275 280 285
Ser Gly Glu Phe Gln Met Gly Gln Glu Leu Ser Phe Ile Gly Gln Met
290 295 300
Lys Leu Met Phe Thr Phe Gly Lys Lys Lys Asn Phe His Arg Thr Met
305 310 315 320
Leu Ala Tyr Trp Asn Gln Val Met Gln Gln Val Thr Gly Ile Asn Leu
325 330 335
Ile Thr Tyr Tyr Ala Ala Tyr Ile Tyr Gln Thr Ser Val Gly Met Asn
340 345 350
Ala Thr Asp Ser Arg Ile Leu Ala Ala Cys Asn Gly Thr Glu Tyr Phe
355 360 365
Met Ala Ser Trp Val Ala Phe Tyr Thr Ile Glu Arg Phe Gly Arg Arg
370 375 380
Lys Leu Met Leu Phe Gly Ala Val Gly Gln Ala Cys Thr Met Ala Ile
385 390 395 400
Leu Thr Gly Cys Val Tyr Ala Ala Ser Lys Pro Glu Asp Gly Gly Leu
405 410 415
Asp Met Gln Gly Ala Gly Ile Ala Ala Ala Val Phe Leu Phe Val Phe
420 425 430
Asn Thr Phe Phe Ala Ile Gly Trp Leu Gly Met Thr Trp Leu Tyr Pro
435 440 445
Ala Glu Ile Ser Ser Leu Glu Ile Arg Ala Pro Ala Asn Gly Leu Ser
450 455 460
Thr Ser Gly Asn Trp Ala Phe Asn Phe Met Val Val Met Ile Thr Pro
465 470 475 480
Val Ala Phe Asn Ser Ile Lys Trp Lys Thr Tyr Ile Ile Phe Ala Cys
485 490 495
Ile Asn Ala Phe Met Val Pro Met Val Tyr Phe Phe Tyr Pro Glu Thr
500 505 510
Ala Gly Arg Ser Leu Glu Glu Ile Asp Met Ile Phe Ala Glu Ser Asn
515 520 525
Pro Arg Thr Pro Trp Asp Val Val Gly Ile Ala Asn Arg Leu Pro Lys
530 535 540
Asn Ser Val Ala Thr Tyr Asp Asp Tyr Glu Ala Gly Glu Gln Glu Glu
545 550 555 560
Lys Ala Ile Val Glu Thr Ala Glu Ser Val Ser His Asp Ser Ala Glu
565 570 575
Phe Gln
<210> 8
<211> 1734
<212> DNA
<213> Yarrowia lipolytica
<400> 8
atgaaactgc aagtgcccgc tttcgctcgg tcctcctccg acgtgaagac ctctttcatg 60
ggtgcacgtg gacaaaaact tcataacctt gttgccgcaa tcgccggtct tggatttctt 120
ctgttcggat acgaccaagg cgtcatgggt ggcctgctta cgctcgatac gttcatccaa 180
cagtttccca aaatggatac ctccgattat ctgcccccta aggttaagac gtttaacacg 240
acaattcagg gaacagctgt gggaatttac gaaattggtt gtatgattgg cgctctcttc 300
acaatgtggg ctggtgataa gctgggccga cgatacatga tcttctttgg ctctattatc 360
atgaccatcg gtgccattct tcagtgtgcc agctattccc tgggccaatt cattgctgga 420
agagtgattt ctggtatcgg aaacggtttc atcacggcta ctgtccctat gcttcagtcg 480
gaatgcgcca agcccgaaag acgtggcaaa ctggtgatgc tggaaggagc tctgatcacg 540
gcaggaattg cactcagcta ctggattgat ttcggttttt attgggtccg aactaacgat 600
gcagattggc ggtttcctat cgcttttcag atcgtgtttt ctcttgttct gacttttact 660
attatgtccc ttcccgagag ccccagatgg ctcgtcaaaa agcagcgatt cgaggaggct 720
gcaggtgtct tcgctgcact tgaggatgtt ccccttgatg atccctacgt tatcaaccag 780
atcacatccg tcaaagaatc tatcatgatg gaacagctgg cccaacttgg tgttgacggt 840
gttgatgcta gaagaaaaat tcagagcgga gagttccaaa tgggtcagga gctttctttt 900
atcggccaga tgaagctgat gttcaccttc ggtaagaaaa aaaattttca ccgtacaatg 960
ctggcctatt ggaatcaagt gatgcaacag gtgacaggta ttaacctcat cacttactat 1020
gccgcctaca tttaccagac cagcgttgga atgaatgcca ccgactcccg tattctcgct 1080
gcctgcaatg gtacggaata tttcatggct tcctgggttg ccttctacac gattgaacgg 1140
ttcggtcgtc ggaaacttat gctgttcggc gctgtgggcc aagcctgcac tatggctatc 1200
ctcacgggct gcgtttatgc agcctccaag cccgaagatg gaggcctcga catgcaaggc 1260
gccggtattg ctgcagctgt tttccttttc gttttcaaca cattcttcgc catcggatgg 1320
cttggtatga cctggctcta tcccgctgaa atttcctcgc tcgagattcg agcacctgct 1380
aatggactca gcactagcgg taactgggct ttcaatttca tggtcgttat gattacgccc 1440
gttgcattta attctattaa atggaagacc tacattattt ttgcatgcat caacgcattt 1500
atggtgccta tggtgtattt cttctacccc gaaactgcag gtcggtccct ggaggaaatt 1560
gacatgattt tcgccgaatc caatccccga acaccctggg atgtcgtcgg cattgctaac 1620
cggctgccca agaatagcgt ggccacgtat gatgattacg aggctggcga gcaggaagaa 1680
aaagccatcg tcgaaactgc agagtctgtc tcccacgatt ccgccgagtt tcaa 1734
<210> 9
<211> 351
<212> PRT
<213> Yarrowia lipolytica
<400> 9
Met Pro Ile Lys Asp Phe Thr Asn Pro Ala Phe Ser Asn Pro Gln Glu
1 5 10 15
Thr Ser Ser Gln His Thr His Thr Lys Met Pro Ser Val Ala Asp Asn
20 25 30
Thr Ser Asn Gly Pro Ile Glu Gly Asn Val Leu Pro Gln Ser Lys Phe
35 40 45
Ile Gln His Leu Ser Glu Tyr Pro Ala Val Ala Ala Val Thr Gly Phe
50 55 60
Ala Ala Ser Phe Pro Val Val Lys Ile Phe Ala Ser Asn Ala Val Pro
65 70 75 80
Leu Ile Gln Ala Ile Gln Asn Arg Gly Ala Pro Val Ala Glu Pro Val
85 90 95
Val Lys Arg Ala Ala Pro Tyr Ile Ser Gln Ile Asp Asn Ala Ala Asp
100 105 110
Glu Ala Leu Asn Arg Leu Asp Lys Ala Val Pro Ser Leu Lys Asn Thr
115 120 125
Lys Pro Asp Glu Val Tyr Ser Arg Ile Val Thr Gln Pro Leu Glu Asn
130 135 140
Val Arg Gly Thr Val Asp Lys Tyr Ala Asp Glu Thr Lys Asn Thr Val
145 150 155 160
Ser Arg Val Val Val Gln Pro Ile Arg Asp Val Ala Ser Arg Val Gln
165 170 175
Ser Gln Val Val Thr Tyr Tyr Asp Ala His Gly Lys Pro Ile Val His
180 185 190
Ala Arg Leu Asp Pro Ile Phe His Pro Leu Asn Asp Arg Leu Glu Ala
195 200 205
Leu Ile Asn Ala Tyr Leu Pro Lys Gly Gln Glu Ile Val Thr Asp Ala
210 215 220
Glu Asn Glu Leu Ala Arg Ala Trp Arg Leu Thr Val Val Ala Phe Asp
225 230 235 240
Arg Ala Arg Pro Leu Ile Glu Gln Gln Thr Ser Gln Ile Gln Glu Ile
245 250 255
Asn Gln His Thr Arg Glu His Ile Gln Lys Val Tyr Asp Gly Lys Arg
260 265 270
Ser Glu Ile Asp Asp Lys Lys Thr Val Ser Gly Pro Val Tyr Ala Thr
275 280 285
Val Ala Thr Val Arg Asp Leu Ser Gln Glu Gly Leu Gln Tyr Ala Gln
290 295 300
Ser Ile Leu Asn Ala Lys Lys Pro Glu Glu Lys Ala Asp Ser Asn Ser
305 310 315 320
Gly Val Ala Pro Val Ser Gln Pro His Thr Thr Ser Ala Val Asp Asn
325 330 335
Ser Leu Ala Ala Pro Thr Ala Val His Glu Val Thr Ala Ser Ala
340 345 350
<210> 10
<211> 1053
<212> DNA
<213> Yarrowia lipolytica
<400> 10
atgcctatta aggattttac caatcctgca ttttccaatc cccaagaaac atcctctcag 60
cacacacata caaagatgcc ttcggtcgct gataatacct ccaacggccc cattgaggga 120
aacgtgctgc ctcaatccaa gttcattcag catctctctg agtaccctgc agttgcagca 180
gtcacaggtt tcgccgcatc cttccctgtt gtcaaaattt ttgccagcaa tgctgttccc 240
cttatccaag ccattcagaa ccgtggagct cccgtggcag aacctgtggt caaacgtgca 300
gccccttata tctcccagat tgataacgct gccgacgagg ctctgaatcg gctggataag 360
gcagtccctt ctctcaaaaa taccaaaccc gatgaagttt attccagaat tgtgacccaa 420
cccctggaaa acgtgcgtgg cactgtggac aaatatgcag atgagacgaa aaacacagtc 480
tcccgggttg ttgttcagcc tatcagagat gttgcctcta gagttcagtc tcaggttgtt 540
acatattatg atgctcatgg aaaacccatc gtgcatgcac ggctcgatcc cattttccac 600
ccccttaatg atagacttga agctctgatt aatgcttacc tgcctaaggg acaggagatc 660
gtgacggatg ccgagaacga gctcgcacga gcctggcgac ttacagttgt tgcattcgat 720
cgagcccgtc ctcttattga gcaacaaacc tcgcagattc aagagatcaa tcaacacact 780
cgggagcata ttcaaaaggt ctacgacggc aaacgatccg agatcgacga caagaagact 840
gtttctggac ctgtgtatgc aaccgtggcc acggttcggg atctgtccca agaaggactt 900
caatatgctc aatctattct gaacgcaaag aagcccgaag agaaagccga cagcaacagc 960
ggcgtcgcac ccgtctcgca accccacacc acgtccgctg tggataatag ccttgctgcc 1020
cctactgctg tgcatgaagt cactgccagc gca 1053
<210> 11
<211> 546
<212> PRT
<213> Petunia x hybrida
<400> 11
Met Gly Arg Lys Glu Ser Asp Asp Gly Val Glu Arg Ile Glu Gly Gly
1 5 10 15
Val Val Val Val Asn Pro Lys Pro Lys Lys Gly Ile Thr Ala Lys Ala
20 25 30
Ile Asp Leu Leu Glu Lys Val Ile Ile Lys Leu Met His Asp Ser Ser
35 40 45
Lys Pro Leu His Tyr Leu Ser Gly Asn Phe Ala Pro Thr Asp Glu Thr
50 55 60
Pro Pro Leu Asn Asp Leu Pro Ile Lys Gly His Leu Pro Glu Cys Leu
65 70 75 80
Asn Gly Glu Phe Val Arg Val Gly Pro Asn Pro Lys Phe Ala Pro Val
85 90 95
Ala Gly Tyr His Trp Phe Asp Gly Asp Gly Met Ile His Gly Leu Arg
100 105 110
Ile Lys Asp Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val Arg Thr Ser
115 120 125
Arg Leu Lys Gln Glu Glu Phe Phe Glu Gly Ala Lys Phe Met Lys Ile
130 135 140
Gly Asp Leu Lys Gly Leu Phe Gly Leu Phe Thr Val Tyr Met Gln Met
145 150 155 160
Leu Arg Ala Lys Leu Lys Ile Leu Asp Thr Ser Tyr Gly Asn Gly Thr
165 170 175
Ala Asn Thr Ala Leu Val Tyr His His Gly Lys Leu Leu Ala Leu Ser
180 185 190
Glu Ala Asp Lys Pro Tyr Ala Leu Lys Val Leu Glu Asp Gly Asp Leu
195 200 205
Gln Thr Leu Gly Met Leu Asp Tyr Asp Lys Arg Leu Leu His Ser Phe
210 215 220
Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Phe Thr Phe
225 230 235 240
Gly Tyr Ala His Glu Pro Pro Tyr Ile Thr Tyr Arg Val Ile Ser Lys
245 250 255
Asp Gly Ile Met Gln Asp Pro Val Pro Ile Thr Ile Pro Glu Ala Ile
260 265 270
Met Met His Asp Phe Ala Ile Thr Glu Asn Tyr Ala Ile Met Met Asp
275 280 285
Leu Pro Leu Cys Phe Arg Pro Lys Glu Met Val Lys Asn Asn Gln Leu
290 295 300
Ala Phe Thr Phe Asp Thr Thr Lys Lys Ala Arg Phe Gly Val Leu Pro
305 310 315 320
Arg Tyr Ala Lys Ser Glu Ala Leu Ile Arg Trp Phe Glu Leu Pro Asn
325 330 335
Cys Phe Ile Phe His Asn Ala Asn Ala Trp Glu Glu Gly Asp Glu Val
340 345 350
Val Leu Ile Thr Cys Arg Leu Pro His Pro Asp Leu Asp Met Val Asn
355 360 365
Gly Glu Val Lys Glu Asn Leu Glu Asn Phe Ser Asn Glu Leu Tyr Glu
370 375 380
Met Arg Phe Asn Met Lys Ser Gly Ala Ala Ser Gln Lys Lys Leu Ser
385 390 395 400
Glu Ser Ser Val Asp Phe Pro Arg Ile Asn Glu Asn Tyr Thr Gly Arg
405 410 415
Lys Gln Arg Tyr Val Tyr Gly Thr Thr Leu Asn Ser Ile Ala Lys Val
420 425 430
Thr Gly Ile Ile Lys Phe Asp Leu His Ala Glu Pro Glu Thr Gly Lys
435 440 445
Lys Gln Leu Glu Val Gly Gly Asn Val Gln Gly Ile Phe Asp Leu Gly
450 455 460
Pro Gly Arg Phe Gly Ser Glu Ala Val Phe Val Pro Ser Gln Pro Gly
465 470 475 480
Thr Glu Cys Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe Val His Asp
485 490 495
Glu Asn Thr Gly Lys Ser Ala Val Asn Val Ile Asp Ala Lys Thr Met
500 505 510
Ser Ala Glu Pro Val Ala Val Val Glu Leu Pro Lys Arg Val Pro Tyr
515 520 525
Gly Phe His Ala Phe Phe Val Thr Glu Glu Gln Ile Gln Glu Gln Ala
530 535 540
Lys Leu
545
<210> 12
<211> 1641
<212> DNA
<213> Petunia x hybrida
<400> 12
atggggcgaa aggagtcgga cgacggcgtt gagcgaatcg agggcggcgt ggtggttgtt 60
aaccccaagc ccaagaaggg catcaccgcc aaggcaattg atctcctgga gaaggttata 120
attaagctta tgcacgactc ctccaagccc ctgcattacc tgtctgggaa cttcgctccc 180
accgacgaga ctccacccct gaacgatctg cccataaagg ggcacctgcc cgagtgtctg 240
aacggagagt tcgtgcgagt gggaccgaac cccaagttcg cccccgtggc cggctatcat 300
tggttcgacg gcgacgggat gatccatggg ctgcgcatca aggacggcaa ggctacgtac 360
gtatccagat acgttcgaac cagtagactt aagcaggagg agtttttcga gggcgccaag 420
ttcatgaaga tcggcgacct gaaggggctt ttcggacttt ttaccgtgta catgcagatg 480
cttcgagcta agctgaagat cctggataca agctacggca acgggaccgc caacaccgcc 540
cttgtttacc atcacgggaa gctgctggct ctgtctgagg ccgacaagcc ctacgctctg 600
aaggtgcttg aggacggcga cctccagacc ctggggatgc ttgactacga taagcgactg 660
ctgcactctt ttaccgcaca ccccaaggtg gatcccgtta ccggagagat gttcacattc 720
gggtatgccc atgagccgcc ctatataacc taccgagtga tttccaagga cggcatcatg 780
caggacccgg tacccattac cattcccgag gccataatga tgcacgactt cgccatcacc 840
gagaactacg ctatcatgat ggaccttccc ctgtgctttc gccccaagga gatggttaag 900
aacaatcagc ttgccttcac atttgacacc accaagaagg cccggttcgg cgtactgccc 960
cggtacgcta agtcggaggc acttatacga tggtttgagc tgcccaactg ttttattttc 1020
cataatgcaa acgcctggga ggagggcgac gaggtagttc tgatcacatg tcgcctgccg 1080
caccccgatc ttgatatggt aaacggcgag gtgaaggaga acctggagaa ctttagcaac 1140
gagctttacg agatgcgatt caatatgaag tcgggagctg cctcccagaa gaagctgtcc 1200
gagtcctctg tggacttccc ccgcataaac gagaattata ccggccgaaa gcagagatac 1260
gtttacggca caaccctgaa tagcatcgca aaggttaccg gcataataaa gttcgacctg 1320
cacgccgagc ccgaaaccgg gaagaagcag ctggaggtgg gcggcaacgt gcaggggata 1380
ttcgatcttg gccccgggcg attcggaagt gaggccgttt tcgtgccatc tcagcccgga 1440
accgagtgcg aggaggacga cggctatctg attttttttg ttcacgacga gaataccggc 1500
aagtccgccg ttaacgttat cgacgctaag accatgtccg ctgagcccgt tgctgtggtg 1560
gagcttccaa agcgagtgcc ctacggcttt cacgcatttt tcgtaaccga ggagcagatc 1620
caggagcagg caaagcttta a 1641
<210> 13
<211> 1641
<212> DNA
<213> Petunia x hybrida
<400> 13
atgggccgaa aggagtctga cgacggcgtg gagcgaatcg agggcggcgt ggtggtggtg 60
aaccccaagc ccaagaaggg catcaccgcc aaggccatcg acctgctgga gaaggtgatc 120
atcaagctga tgcacgactc ttctaagccc ctgcactacc tgtctggcaa cttcgccccc 180
accgacgaga ctccccccct gaacgacctg cccatcaagg gccacctgcc cgagtgcctg 240
aacggcgagt tcgtgcgagt gggccccaac cccaagttcg cccccgtggc cggctaccac 300
tggttcgacg gcgacggcat gatccacggc ctgcgaatca aggacggcaa ggccacctac 360
gtgtctcgat acgtgcgaac ctctcgactg aagcaggagg agttcttcga gggcgccaag 420
ttcatgaaga tcggcgacct gaagggcctg ttcggcctgt tcaccgtgta catgcagatg 480
ctgcgagcca agctgaagat cctggacacc tcttacggca acggcaccgc caacaccgcc 540
ctggtgtacc accacggcaa gctgctggcc ctgtctgagg ccgacaagcc ctacgccctg 600
aaggtgctgg aggacggcga cctccagacc ctgggcatgc tggactacga caagcgactg 660
ctgcactctt tcaccgccca ccccaaggtg gaccccgtga ccggcgagat gttcaccttc 720
ggctacgccc acgagccccc ctacatcacc taccgagtga tctctaagga cggcatcatg 780
caggaccccg tgcccatcac catccccgag gccatcatga tgcacgactt cgccatcacc 840
gagaactacg ccatcatgat ggacctgccc ctgtgcttcc gacccaagga gatggtgaag 900
aacaaccagc tggccttcac cttcgacacc accaagaagg cccgattcgg cgtgctgccc 960
cgatacgcca agtctgaggc cctgatccga tggttcgagc tgcccaactg cttcatcttc 1020
cacaacgcca acgcctggga ggagggcgac gaggtggtgc tgatcacctg ccgactgccc 1080
caccccgacc tggacatggt gaacggcgag gtgaaggaga acctggagaa cttctctaac 1140
gagctgtacg agatgcgatt caacatgaag tctggcgccg cctctcagaa gaagctgtct 1200
gagtcctctg tggacttccc ccgaatcaac gagaactaca ccggccgaaa gcagcgatac 1260
gtgtacggca ccaccctgaa ctctatcgcc aaggtgaccg gcatcatcaa gttcgacctg 1320
cacgccgagc ccgagactgg caagaagcag ctggaggtgg gcggcaacgt gcagggcatc 1380
ttcgacctgg gccccggccg attcggctct gaggccgtgt tcgtgccctc tcagcccggc 1440
accgagtgcg aggaggacga cggctacctg atcttcttcg tgcacgacga gaacaccggc 1500
aagtctgccg tgaacgtgat cgacgccaag accatgtctg ccgagcccgt ggccgtggtg 1560
gagctgccca agcgagtgcc ctacggcttc cacgccttct tcgtgaccga ggagcagatc 1620
caggagcagg ccaagctgta a 1641
<210> 14
<211> 543
<212> PRT
<213> Osmanthus fragrans
<400> 14
Met Gly Met Gln Gly Glu Asp Ala Gln Arg Thr Gly Asn Ile Val Ala
1 5 10 15
Val Lys Pro Lys Pro Ser Gln Gly Leu Thr Ser Lys Ala Ile Asp Trp
20 25 30
Leu Glu Trp Leu Phe Val Lys Met Met His Asp Ser Lys Gln Pro Leu
35 40 45
His Tyr Leu Ser Gly Asn Phe Ala Pro Val Asp Glu Thr Pro Pro Leu
50 55 60
Lys Asp Leu Pro Val Thr Gly His Leu Pro Glu Cys Leu Asn Gly Glu
65 70 75 80
Phe Val Arg Val Gly Pro Asn Pro Lys Phe Ala Ser Ile Ala Gly Tyr
85 90 95
His Trp Phe Asp Gly Asp Gly Met Ile His Gly Met Arg Ile Lys Asp
100 105 110
Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val Gln Thr Ser Arg Leu Lys
115 120 125
Gln Glu Glu Phe Phe Gly Arg Ala Met Phe Met Lys Ile Gly Asp Leu
130 135 140
Lys Gly Met Phe Gly Leu Leu Met Val Asn Met Gln Met Leu Arg Ala
145 150 155 160
Lys Leu Lys Val Leu Asp Ile Ser Tyr Gly Ile Gly Thr Ala Asn Thr
165 170 175
Ala Leu Val Tyr His His Gly Lys Leu Leu Ala Leu Ser Glu Ala Asp
180 185 190
Lys Pro Tyr Ala Ile Lys Val Leu Glu Asp Gly Asp Leu Gln Thr Ile
195 200 205
Gly Leu Leu Asp Tyr Asp Lys Arg Leu Ala His Ser Phe Thr Ala His
210 215 220
Pro Lys Val Asp Pro Phe Thr Gly Glu Met Phe Thr Phe Gly Tyr Ser
225 230 235 240
His Thr Pro Pro Tyr Val Thr Tyr Arg Val Ile Ser Lys Asp Gly Ala
245 250 255
Met Asn Asp Pro Val Pro Ile Thr Val Ser Gly Pro Ile Met Met His
260 265 270
Asp Phe Ala Ile Thr Glu Asn Tyr Ala Ile Phe Met Asp Leu Pro Leu
275 280 285
Tyr Phe Lys Pro Lys Glu Met Val Lys Asp Lys Lys Phe Ile Phe Ser
290 295 300
Phe Asp Ala Thr Gln Lys Ala Arg Phe Gly Ile Leu Pro Arg Tyr Ala
305 310 315 320
Lys Asn Glu Leu Leu Ile Lys Trp Phe Glu Leu Pro Asn Cys Phe Ile
325 330 335
Phe His Asn Ala Asn Ala Trp Glu Glu Gly Asp Glu Val Val Leu Ile
340 345 350
Thr Cys Arg Leu Glu Asn Pro Asp Leu Asp Met Val Asn Ser Thr Val
355 360 365
Lys Glu Arg Leu Asp Asn Phe Lys Asn Glu Leu Tyr Glu Met Arg Phe
370 375 380
Asn Leu Gln Asn Gly Leu Ala Ser Gln Lys Lys Leu Ser Val Ser Ala
385 390 395 400
Val Asp Phe Pro Arg Val Asn Glu Ser Tyr Thr Thr Arg Lys Gln Arg
405 410 415
Tyr Val Tyr Gly Thr Thr Leu Asp Lys Ile Ala Lys Val Thr Gly Ile
420 425 430
Ile Lys Phe Asp Leu His Ala Glu Pro Glu Thr Gly Lys Glu Lys Leu
435 440 445
Glu Leu Gly Gly Asn Val Lys Gly Ile Phe Asp Leu Gly Pro Gly Arg
450 455 460
Phe Gly Ser Glu Ala Val Phe Val Pro Arg His Pro Gly Ile Thr Ser
465 470 475 480
Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe Val His Asp Glu Asn Thr
485 490 495
Gly Lys Ser Ala Val Asn Val Ile Asp Ala Lys Thr Met Ser Pro Asp
500 505 510
Pro Val Ala Val Val Glu Leu Pro Lys Arg Val Pro Tyr Gly Phe His
515 520 525
Ala Phe Phe Val Thr Glu Asp Gln Leu Gln Glu Gln Ala Lys Val
530 535 540
<210> 15
<211> 1632
<212> DNA
<213> Osmanthus fragrans
<400> 15
atggggatgc aaggagagga tgcgcagcgg actgggaata ttgttgctgt aaagccgaaa 60
cccagtcaag ggctcacttc caaggccata gactggttgg aatggctgtt tgtgaaaatg 120
atgcatgact ccaaacagcc tctccattat ctttctggga attttgctcc agttgatgag 180
actcctcctc ttaaggacct tcctgttaca gggcacctcc ctgagtgtct gaatggtgaa 240
tttgtgaggg ttggtcctaa ccccaagttt gcttcaattg ctggttatca ttggtttgat 300
ggagatggaa tgattcatgg tatgcggata aaagatggga aagcaacata tgtctcgcgt 360
tatgtgcaga catctcgcct taaacaagaa gagttttttg gcagagctat gtttatgaag 420
attggagacc tgaaagggat gtttggattg ctcatggtta acatgcaaat gctcagagca 480
aaactgaaag tattagatat ttcctatgga attggtacag ctaatactgc tctggtatac 540
caccatggaa agcttttggc acttagtgag gcagataaac catatgccat taaagttttg 600
gaagatggag atctgcaaac tattggcttg ctggactatg ataaaagact ggcacattca 660
tttactgctc atcctaaggt tgacccattt accggagaga tgtttacctt tggctattca 720
catacaccac cttatgtcac atacagagtt atatcgaagg atggagcgat gaatgatccc 780
gttccaataa cagtatcagg cccaatcatg atgcatgatt ttgcgattac tgaaaattat 840
gcaattttta tggacctccc tttatacttt aagccaaagg aaatggtgaa ggataaaaag 900
tttattttca gttttgatgc tacccagaaa gctcgttttg gcatccttcc gcggtatgca 960
aagaatgagc tactaatcaa atggtttgag cttccaaatt gcttcatatt ccataatgca 1020
aatgcttggg aggaaggaga tgaagttgtt ctgatcactt gtcgccttga gaatccagat 1080
cttgacatgg ttaacagcac cgttaaagaa aggcttgata atttcaaaaa cgaactgtac 1140
gagatgaggt tcaacctcca aaatggtctg gcttcacaga aaaaactatc tgtatccgct 1200
gtagattttc caagggtgaa cgaaagttac actactagga aacagcgata tgtatatgga 1260
acaacactgg acaagattgc taaggtaact gggattatca agtttgattt gcatgcggaa 1320
ccagagactg gaaaagaaaa gctagaactt ggaggaaatg ttaaaggtat ctttgatcta 1380
ggacctggaa gatttggttc agaggctgtc tttgttccgc ggcatcctgg tatcacatct 1440
gaagaagatg atggctactt gattttcttt gtacatgatg agaacactgg aaagtcggca 1500
gtgaatgtaa ttgatgcaaa aacaatgtca cctgatcctg ttgctgttgt cgaactgccc 1560
aagagagttc cgtacggatt tcatgccttc ttcgtgacag aagaccaact tcaagaacag 1620
gcaaaggttt ga 1632
<210> 16
<211> 550
<212> PRT
<213> Zea mays
<400> 16
Met Gly Thr Glu Ala Glu Gln Pro Asp Met Asp Ser His Arg Asn Asp
1 5 10 15
Gly Val Val Val Val Pro Ala Pro Arg Pro Arg Lys Gly Leu Ala Ser
20 25 30
Trp Ala Leu Asp Leu Leu Glu Ser Leu Ala Val Arg Leu Gly His Asp
35 40 45
Lys Thr Lys Pro Leu His Trp Leu Ser Gly Asn Phe Ala Pro Val Val
50 55 60
Glu Glu Thr Pro Pro Ala Pro Asn Leu Thr Val Arg Gly His Leu Pro
65 70 75 80
Glu Cys Leu Asn Gly Glu Phe Val Arg Val Gly Pro Asn Pro Lys Phe
85 90 95
Ala Pro Val Ala Gly Tyr His Trp Phe Asp Gly Asp Gly Met Ile His
100 105 110
Ala Met Arg Ile Lys Asp Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val
115 120 125
Lys Thr Ala Arg Leu Lys Gln Glu Glu Tyr Phe Gly Gly Ala Lys Phe
130 135 140
Met Lys Ile Gly Asp Leu Lys Gly Phe Phe Gly Leu Phe Met Val Gln
145 150 155 160
Met Gln Gln Leu Arg Lys Lys Phe Lys Val Leu Asp Phe Thr Tyr Gly
165 170 175
Phe Gly Thr Ala Asn Thr Ala Leu Ile Tyr His His Gly Lys Leu Met
180 185 190
Ala Leu Ser Glu Ala Asp Lys Pro Tyr Val Val Lys Val Leu Glu Asp
195 200 205
Gly Asp Leu Gln Thr Leu Gly Leu Leu Asp Tyr Asp Lys Arg Leu Lys
210 215 220
His Ser Phe Thr Ala His Pro Lys Val Asp Pro Phe Thr Asp Glu Met
225 230 235 240
Phe Thr Phe Gly Tyr Ser His Glu Pro Pro Tyr Cys Thr Tyr Arg Val
245 250 255
Ile Asn Lys Glu Gly Ala Met Leu Asp Pro Val Pro Ile Thr Ile Pro
260 265 270
Glu Ser Val Met Met His Asp Phe Ala Ile Thr Glu Asn Tyr Ser Ile
275 280 285
Phe Met Asp Leu Pro Leu Leu Phe Arg Pro Lys Glu Met Val Lys Asn
290 295 300
Gly Glu Phe Ile Tyr Lys Phe Asp Pro Thr Lys Lys Gly Arg Phe Gly
305 310 315 320
Ile Leu Pro Arg Tyr Ala Lys Asp Asp Lys Leu Ile Arg Trp Phe Gln
325 330 335
Leu Pro Asn Cys Phe Ile Phe His Asn Ala Asn Ala Trp Glu Glu Gly
340 345 350
Asp Glu Val Val Leu Ile Thr Cys Arg Leu Glu Asn Pro Asp Leu Asp
355 360 365
Lys Val Asn Gly Tyr Gln Ser Asp Lys Leu Glu Asn Phe Gly Asn Glu
370 375 380
Leu Tyr Glu Met Arg Phe Asn Met Lys Thr Gly Ala Ala Ser Gln Lys
385 390 395 400
Gln Leu Ser Val Ser Ala Val Asp Phe Pro Arg Val Asn Glu Ser Tyr
405 410 415
Thr Gly Arg Lys Gln Arg Tyr Val Tyr Cys Thr Ile Leu Asp Ser Ile
420 425 430
Ala Lys Val Thr Gly Ile Ile Lys Phe Asp Leu His Ala Glu Pro Glu
435 440 445
Ser Gly Val Lys Val Leu Glu Val Gly Gly Asn Val Gln Gly Ile Tyr
450 455 460
Asp Leu Gly Pro Gly Arg Phe Gly Ser Glu Ala Ile Phe Val Pro Lys
465 470 475 480
His Pro Gly Val Ser Gly Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe
485 490 495
Val His Asp Glu Asn Thr Gly Lys Ser Glu Val Asn Val Ile Asp Ala
500 505 510
Lys Thr Met Ser Ala Asp Pro Val Ala Val Val Glu Leu Pro Asn Arg
515 520 525
Val Pro Tyr Gly Phe His Ala Phe Phe Val Thr Glu Asp Gln Leu Ala
530 535 540
Arg Gln Ala Glu Gly Gln
545 550
<210> 17
<211> 1653
<212> DNA
<213> Zea mays
<400> 17
atggggacgg aggcggagca gccggacatg gacagccacc gaaacgacgg cgtcgtggtg 60
gtgccagcgc cgcgcccgcg taaggggctc gcttcctggg cgctcgacct gcttgagtcc 120
ctcgccgtgc gcctcggcca cgacaagacc aagccgctcc actggctctc cggcaacttc 180
gcccccgtcg tcgaggagac cccgccggcc ccaaacctta ccgtccgcgg acacctcccg 240
gagtgcttga atggagagtt tgtcagggtt gggcctaatc cgaagtttgc tcctgttgcg 300
gggtatcact ggtttgatgg agacgggatg attcatgcca tgcgtattaa ggatggaaaa 360
gctacctatg tatcaagata tgtgaagact gcccgcctca aacaagagga gtattttggt 420
ggagcaaagt ttatgaagat tggagacctt aagggatttt ttggattgtt tatggtccaa 480
atgcagcaac ttcggaaaaa attcaaagtc ttggatttta cctatggatt tgggacagct 540
aatactgcac ttatatatca tcatggtaaa ctcatggcct tgtcagaagc agataagcca 600
tatgttgtta aggtccttga agatggagac ttgcagactc ttggcttgtt ggattatgac 660
aaaaggttga aacattcttt tactgcccat ccaaaggttg acccttttac agatgaaatg 720
ttcacattcg gatattcaca tgaacctcca tactgtacat accgtgtgat taacaaagaa 780
ggagctatgc ttgatcctgt gccaataaca ataccggaat ctgtaatgat gcatgatttt 840
gccatcacag agaattactc tatttttatg gacctccctt tattgttccg accaaaggaa 900
atggtgaaga acggtgagtt tatctacaag tttgatccta caaagaaagg tcgttttggt 960
attctccccc gctatgcaaa ggatgacaaa ctcatcagat ggtttcaact ccctaattgt 1020
ttcatattcc ataatgctaa tgcttgggaa gagggtgatg aagttgttct aattacctgc 1080
cgccttgaga atccagattt ggacaaggtg aatggatatc aaagtgacaa gctcgaaaac 1140
ttcgggaatg agctgtacga gatgagattc aacatgaaaa cgggtgctgc ttcacaaaag 1200
caattgtctg tttctgctgt ggattttcct cgtgttaatg agagctatac tggcagaaag 1260
cagcggtatg tctactgcac tatacttgac agcattgcga aggtgactgg catcataaag 1320
tttgatctgc atgctgaacc ggaaagtggt gtgaaagtac ttgaagtggg aggaaatgta 1380
caaggcatat atgacctggg acctggtaga tttggttcag aggcgatttt tgttcccaag 1440
catccaggtg tgtctggaga agaagatgac ggctatttga tattctttgt acacgacgag 1500
aacacaggga aatctgaagt aaatgttatc gatgcaaaga caatgtctgc tgatccagtt 1560
gcggtggttg agcttcctaa tagggttcct tatggattcc atgccttttt tgtaactgag 1620
gaccaactgg ctcgacaggc ggaggggcag tga 1653
<210> 18
<211> 466
<212> PRT
<213> Nostocales cyanobacterium
<400> 18
Met Ala Ile Lys Gln Val Asn Pro Phe Leu Asp Gly Asn Phe Ala Pro
1 5 10 15
Val Glu Glu Glu Ile Thr Thr Asn Thr Leu Gln Val Ile Gly Glu Leu
20 25 30
Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn Gly Pro Asn Pro Gln
35 40 45
Trp Thr Pro Ile Gly Gln Tyr His Trp Phe Asp Gly Asp Gly Met Leu
50 55 60
His Gly Val Arg Ile Ser Asn Gly Lys Ala Thr Tyr Arg Asn Arg Tyr
65 70 75 80
Val Arg Thr Lys Gly Trp Lys Ile Glu Asn Glu Ala Gly Lys Ala Val
85 90 95
Trp Thr Gly Leu Leu Glu Pro Arg Pro Lys His Thr Pro His Gly Gln
100 105 110
Ser Lys Asn Thr Ala Asn Thr Ala Leu Val Trp His Ala Gly Gln Leu
115 120 125
Leu Ala Leu Trp Glu Gly Gly Ala Pro His Ala Ile Lys Val Pro Glu
130 135 140
Leu Lys Thr Ile Gly Glu Tyr Thr Tyr Asn Gly Lys Leu Val Ser Ala
145 150 155 160
Val Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Met Phe
165 170 175
Phe Gly Tyr Ser Phe Ala Pro Pro Tyr Leu Gln Tyr Ser Val Val Ser
180 185 190
Pro Gln Gly Glu Leu Leu Gln Thr Glu Thr Ile Asp Ile Pro Met Ala
195 200 205
Val Met Met His Asp Phe Ala Ile Thr Glu Asp Tyr Thr Ile Phe Met
210 215 220
Asp Leu Pro Leu Thr Phe Ser Gln Glu Arg Ile Lys Arg Gly Glu Pro
225 230 235 240
Leu Met Met Phe Glu Arg Asp Lys Pro Ser Arg Phe Gly Ile Val Pro
245 250 255
Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe Glu Ser Pro Ala Cys
260 265 270
Tyr Ile Phe His Thr Val Asn Ala Tyr Glu Glu Gly Asp Glu Val Val
275 280 285
Leu Val Ala Cys Arg Met Ser Ser Thr Thr Val Leu Gly Ala Pro Gln
290 295 300
Asp Thr His Val Asp Ser Glu Ala Asp Ile Pro Arg Leu His Arg Trp
305 310 315 320
Arg Phe Asn Leu Lys Thr Gly Lys Val Ser Glu Glu Met Leu Asp Asp
325 330 335
Val Pro Ser Glu Phe Pro Arg Val Asn Glu Asn Leu Leu Gly Gln Lys
340 345 350
Thr Arg Tyr Gly Tyr Thr Gly Arg Met Ala Lys Ser Ser Leu Pro Leu
355 360 365
Phe Asp Gly Leu Ile Lys Tyr Asp Leu Asn Asn Gly Lys Ser Gln Thr
370 375 380
His Glu Phe Gly Ser Gly Arg Tyr Gly Gly Glu Ala Val Phe Val Pro
385 390 395 400
Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Val Thr Phe Val
405 410 415
His Asp Thr Ala Lys Asp Thr Ser Glu Leu Val Val Val Ser Ala Gln
420 425 430
Asp Val Thr Gly Glu Pro Val Ala Arg Val Leu Ile Pro Gln Arg Val
435 440 445
Pro Tyr Gly Phe His Gly Ala Trp Val Ser Glu Glu Gln Leu Lys Ala
450 455 460
Ser Met
465
<210> 19
<211> 1401
<212> DNA
<213> Nostocales cyanobacterium
<400> 19
atggcaatta agcaggtcaa tcccttcctt gacggtaact tcgcacccgt tgaagaggag 60
atcacaacca acacgctgca ggtgattgga gaactgcccc ctgacctctc gggaatgttt 120
gttcgaaatg gccctaatcc ccagtggacc cctatcggac agtatcactg gttcgacggc 180
gatggcatgc tccacggcgt tcgtatttcg aacggcaaag ctacttaccg taatcggtac 240
gttcgaacaa aaggatggaa gatcgaaaac gaagctggta aagccgtgtg gaccggactc 300
cttgagcccc gacctaaaca cactcctcat ggtcaatcga agaacacagc aaacacagcc 360
cttgtgtggc atgcaggcca actgctggca ctctgggagg gcggcgcccc tcacgcaatc 420
aaagttcctg agctcaagac gatcggcgaa tatacttaca atggaaaact cgtgtctgct 480
gtcactgccc atcccaaagt ggatcccgtc acgggcgaga tgatgttctt tggatactcg 540
ttcgcccctc cttacctgca gtactctgtg gtttcccccc agggagaact tctgcaaacg 600
gaaaccatcg acattcctat ggcagtgatg atgcacgact ttgctattac tgaagattat 660
actattttca tggaccttcc ccttacattt tctcaggaga gaatcaagcg aggagagccc 720
cttatgatgt ttgaaagaga taagcctagc cgattcggta ttgtgcctcg ttatggaaat 780
aactctaaca ttagatggtt cgaatcgccc gcatgctata tcttccacac ggttaatgca 840
tacgaagaag gagatgaggt tgtcctggtg gcctgtcgaa tgtcctctac gactgtcctg 900
ggagcacctc aagacacaca tgtcgattct gaagccgata ttcccagact ccatcgatgg 960
cggttcaatc tgaagactgg taaggtgtcg gaggaaatgc ttgacgacgt cccctcggaa 1020
tttcctcgag ttaatgaaaa tctcctgggt caaaagaccc gatacggtta cactggtcgg 1080
atggctaagt cctccctgcc tctttttgac ggcctcatca agtatgacct gaacaatggc 1140
aagagccaga ctcatgaatt cggttctggt cgatatggag gagaagccgt gtttgtgcct 1200
cgacccggtg caactgctga ggacgacggc tggctggtta ccttcgtcca cgatactgct 1260
aaagacactt ccgaactcgt ggtcgtgtcg gcacaggacg tcaccggtga gcccgtcgct 1320
agagtgctta tcccccagcg agttccttac ggttttcatg gcgcatgggt gtctgaggag 1380
caactgaagg catcgatgtg a 1401
<210> 20
<211> 470
<212> PRT
<213> Calothrix sp.
<400> 20
Met Thr Thr Asn Thr Ile Pro Thr Thr Ala Ile Asn Pro Tyr Leu Asp
1 5 10 15
Gly Asn Phe Ala Pro Val Arg Glu Glu Ile Thr Thr Asp Thr Leu Gln
20 25 30
Val Val Gly Gln Leu Pro Pro Asp Leu Ala Gly Met Phe Val Arg Asn
35 40 45
Gly Pro Asn Pro Gln Trp Pro Pro Ile Gly Lys Tyr His Trp Phe Asp
50 55 60
Gly Asp Gly Met Leu His Gly Val Arg Ile Ser Asn Gly Gln Ala Thr
65 70 75 80
Tyr Arg Asn Arg Tyr Ile Gln Thr Arg Gly Trp Lys Ile Glu Arg Glu
85 90 95
Ala Gly Lys Ala Ile Trp Thr Gly Phe Met Glu Pro Pro Arg Met Asp
100 105 110
Asn Pro Tyr Gly Gly Tyr Lys Asn Thr Gly Asn Thr Ala Leu Ile Trp
115 120 125
His Ala Gly Gln Leu Leu Ala Leu Asn Glu Gly Gly Ala Pro His Ala
130 135 140
Met Thr Leu Pro Glu Leu Gly Thr Ile Gly Glu Tyr Thr Tyr Asp Gly
145 150 155 160
Lys Leu Ile Ser Ala Phe Thr Ala His Pro Lys Val Asp Pro Val Thr
165 170 175
Gly Glu Met Met Phe Phe Gly Tyr Ser Phe Ala Pro Pro Tyr Leu Gln
180 185 190
Tyr Ser Gln Val Ser Ala Ala Gly Glu Leu Leu Gln Thr Val Pro Ile
195 200 205
Asp Leu Pro Thr Pro Val Met Met His Asp Phe Ala Ile Thr Glu Asn
210 215 220
Tyr Thr Ile Phe Met Asp Leu Pro Leu Thr Leu Ser Ala Glu Arg Leu
225 230 235 240
Gln Arg Gly Glu Pro Met Leu Met Phe Glu Arg Asp Arg Ser Ser Arg
245 250 255
Phe Gly Ile Val Pro Arg Tyr Gly Asp Asn Ser Asn Ile Arg Trp Phe
260 265 270
Glu Ser Ser Pro Cys Tyr Val Phe His Thr Leu Asn Ala Tyr Glu Val
275 280 285
Gly Asp Glu Val Val Leu Ile Gly Cys Arg Met Ser Ser Thr Ser Val
290 295 300
Leu Val Thr Glu Asp Asn Gln Thr Asp Ala Asp Gly Asn Ile Pro Arg
305 310 315 320
Leu His Gln Trp Arg Phe Asn Leu Lys Thr Gly Thr Val Arg Glu Gln
325 330 335
Gln Leu Asp Asp Leu Ala Ala Glu Phe Pro Arg Val Asn Glu Asp Phe
340 345 350
Leu Gly Arg Gln Thr Arg Tyr Gly Tyr Ala Gly Lys Leu Ala Asn Ser
355 360 365
Pro Leu Pro Leu Phe Asp Gly Val Ile Lys Tyr Asp Leu Asn Gly Glu
370 375 380
Thr Ser Gln Ile His His Phe Gly Gln Gly Arg Tyr Gly Gly Glu Ala
385 390 395 400
Val Phe Ala Pro Arg Pro Gly Ala Thr His Glu Asp Asp Gly Trp Leu
405 410 415
Ile Thr Phe Val Tyr Asp Glu Gly Ser Asp Thr Ser Glu Leu Val Val
420 425 430
Ile Asn Ala Gln Asp Ile Thr Ser Glu Pro Val Ala Arg Val Ile Ile
435 440 445
Pro Gln Arg Val Pro Tyr Gly Phe His Gly Thr Trp Val Ser Glu Glu
450 455 460
Gln Leu Met Thr Asn Ser
465 470
<210> 21
<211> 1413
<212> DNA
<213> Calothrix sp.
<400> 21
atgaccacaa atacgatccc cactaccgcc atcaacccct atcttgacgg caatttcgca 60
cctgtgcggg aagaaatcac tacggacacc cttcaagttg ttggtcaact ccctcctgat 120
ctggccggca tgttcgtgcg gaatggtccc aatccccagt ggcctcctat cggtaaatat 180
cactggttcg atggtgacgg catgctccat ggagtgcgta tctcgaatgg tcaggcaacc 240
tatcggaacc gatacatcca aacccgtgga tggaaaattg agcgtgaagc cggcaaagct 300
atctggactg gatttatgga gcctcctcga atggacaatc cttatggtgg atataaaaac 360
acgggcaata cagctctgat ttggcatgca ggtcagcttc tggcacttaa cgaaggtgga 420
gcccctcacg ctatgactct tcctgagctc ggaaccatcg gagaatacac ctatgacggt 480
aaactcatct ccgcattcac tgctcacccc aaggtggatc ctgttaccgg cgagatgatg 540
ttctttggat actccttcgc acctccttat cttcaataca gccaggtgtc tgcagcaggc 600
gagctccttc aaactgtgcc tatcgatctc cctacgcctg tgatgatgca tgactttgcc 660
atcactgaga actacacaat ctttatggac cttcccctga cgctttcggc agagcgtctt 720
caaagaggcg aacctatgct tatgttcgaa cgagatcgat cgagccggtt cggtatcgtt 780
ccccgttatg gtgataattc gaatattcgt tggtttgagt cctctccctg ctacgtgttt 840
catacactga atgcctatga ggtgggagac gaggtcgtgc ttattggatg ccggatgagc 900
tccacctccg tgcttgtgac ggaggacaat cagaccgacg cagacggtaa tattcccaga 960
cttcaccaat ggagatttaa tctcaagact ggtacagttc gggagcagca gctcgacgat 1020
ctcgccgccg aatttccccg agttaacgag gacttcctcg gaagacaaac tcggtacggc 1080
tatgctggaa aactggctaa ctcgcccctg cctctgtttg acggagttat caaatatgac 1140
ctcaacggcg agacttccca gatccaccat tttggacagg gaagatacgg cggcgaagcc 1200
gtttttgccc ccagacctgg tgccacccat gaagacgacg gatggctcat cacatttgtc 1260
tacgacgagg gatccgacac gagcgagctc gtggtcatca acgctcaaga tattacgtcc 1320
gaacccgttg ctcgtgtgat tattccccaa cgtgtgccct acggatttca cggtacttgg 1380
gtcagcgaag aacagctcat gacaaacagc taa 1413
<210> 22
<211> 468
<212> PRT
<213> Calothrix brevissima
<400> 22
Met Thr Ser Asn Ile Ile Ser Thr Thr Ala Asp Asn Pro Tyr Leu Ser
1 5 10 15
Gly Asn Phe Ala Pro Val Gly Gln Glu Ile Ala Thr Asp Ser Leu Pro
20 25 30
Val Leu Gly Glu Leu Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn
35 40 45
Gly Pro Asn Pro Gln Trp Pro Pro Ile Gly Asn Tyr His Trp Phe Asp
50 55 60
Gly Asp Gly Met Leu His Cys Val His Val Ser Glu Gly Lys Ala Thr
65 70 75 80
Tyr Arg Asn Arg Tyr Val Gln Thr Gln Gly Trp Lys Ile Glu Arg Glu
85 90 95
Ala Gly Lys Ala Val Trp Ser Gly Leu Leu Glu Pro Pro Gln Met Asp
100 105 110
Asn Pro Tyr Gly Ala Tyr Lys Arg Thr Ala Asn Thr Ala Leu Ile Trp
115 120 125
His Gly Gly Gln Met Leu Ala Leu His Glu Gly Ser Ala Pro His Ala
130 135 140
Ile Lys Val Pro Glu Leu Glu Thr Ile Gly Glu Tyr Thr Tyr Asn Asp
145 150 155 160
Lys Leu Val Ser Ala Phe Thr Ala His Pro Lys Val Asp Pro Val Thr
165 170 175
Gly Glu Met Met Phe Phe Gly Tyr Ser Phe Thr Pro Pro Tyr Leu Gln
180 185 190
Tyr Ser Val Val Ser Ala Val Gly Glu Leu Leu Gln Thr Val Pro Ile
195 200 205
Asp Leu Pro Val Ala Val Met Met His Asp Phe Ala Ile Thr Lys Asn
210 215 220
Tyr Ser Ile Phe Leu Asp Leu Pro Leu Thr Met Arg Gly Glu Arg Leu
225 230 235 240
Gln Arg Gly Glu Pro Leu Phe Met Phe Glu Arg Asp Arg Pro Ser Arg
245 250 255
Phe Gly Ile Ile Pro Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe
260 265 270
Glu Ser Glu Pro Cys Tyr Ile Phe His Ile Tyr Asn Ala Tyr Glu Ile
275 280 285
Gly Asp Glu Val Val Leu Leu Gly Cys Arg Met Ser Ser Thr Thr Val
290 295 300
Leu Gly Asp Asp Asn Ser Ser Asp Pro Asp Ala Asn Val Pro Arg Leu
305 310 315 320
His Glu Trp Arg Phe Asn Leu Lys Thr Gly Thr Val Ser Asp Gln Arg
325 330 335
Leu Asp Asp Ile Pro Ala Glu Phe Pro Arg Ile Asn Glu Asn Tyr Val
340 345 350
Gly Leu Pro Thr Arg Tyr Gly Tyr Ala Gly Lys Ala Ala Asn Thr Pro
355 360 365
Val Pro Leu Phe Asp Gly Leu Ile Lys Tyr Asp Phe Ser Ser Gly Lys
370 375 380
Ser Gln Thr His Glu Phe Gly Gln Gly Arg Phe Gly Gly Glu Ala Val
385 390 395 400
Phe Ala Pro Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Ile
405 410 415
Thr Phe Val His Asp Glu Thr Ser Asp Thr Ser Glu Leu Leu Val Val
420 425 430
His Ala Gln Asp Val Ser Ser Glu Pro Val Ala Arg Val Ile Ile Pro
435 440 445
Gln Arg Val Pro Tyr Gly Phe His Gly Ala Trp Ile Ser Glu Ala Gln
450 455 460
Leu Lys Gly Ala
465
<210> 23
<211> 1407
<212> DNA
<213> Calothrix brevissima
<400> 23
atgactagca atatcatttc cactacagct gataatccct acctgtccgg aaatttcgct 60
cctgtcggcc aggaaatcgc cacagattcc ctccccgtcc tgggtgaact ccctcccgat 120
ctgagcggta tgttcgtccg gaatggaccc aacccccaat ggcctcctat cggaaactat 180
cattggttcg acggagatgg tatgctgcac tgtgttcacg tttcggaagg aaaagccact 240
tatagaaatc gttatgtgca gacccagggt tggaaaattg agcgggaagc tggaaaggct 300
gtttggtcgg gtctgctcga acctcctcag atggacaatc cttacggtgc atataaaaga 360
accgctaata cagcactgat ttggcacgga ggtcaaatgc tcgcactcca tgagggatct 420
gcaccccacg ctattaaggt ccccgagctg gaaacgatcg gcgagtacac atataatgat 480
aagctggtgt cggcttttac ggcacatccc aaagtggatc ccgtgacggg cgagatgatg 540
ttctttggct actcctttac acccccctat ctgcaatatt cggttgtgag cgctgttggt 600
gagctgcttc agactgtgcc catcgatctc cccgtcgccg ttatgatgca tgactttgcc 660
atcactaaaa actacagcat tttcctggat cttcctctta ctatgcgtgg agagcgtctt 720
caacggggag aacctctttt tatgtttgag cgggaccgtc cttctcgatt tggtattatc 780
cctcgttatg gtaataattc taatattcgt tggtttgaaa gcgaaccttg ctatattttc 840
cacatctaca acgcttatga aatcggagac gaggtcgtgc tcctgggttg tcgaatgagc 900
tctaccaccg ttctgggaga tgacaactcg tcggaccccg acgccaatgt tcctcgactt 960
catgagtgga gatttaatct gaagacggga acggtgtctg atcaacgact tgacgacatt 1020
cctgctgaat tccctcgaat caacgagaat tatgtcggcc tccccaccag atatggctac 1080
gcaggaaagg ccgcaaacac gcctgtcccc ctcttcgatg gacttattaa gtatgatttt 1140
tcgtcgggta agagccaaac ccatgaattt ggacagggcc gttttggcgg cgaagctgtc 1200
ttcgcaccca gacctggtgc tactgctgaa gatgatggat ggctcatcac ctttgtccac 1260
gacgaaacgt ctgacacctc cgaacttctt gtcgttcacg ctcaggatgt gtcttctgag 1320
cccgttgccc gagtcatcat tcctcagcgg gtcccctacg gtttccacgg agcatggatt 1380
tctgaagctc aactgaaagg agcctaa 1407
<210> 24
<211> 466
<212> PRT
<213> Scytonema millei
<400> 24
Met Ala Thr Thr Gln Val Asn Pro Tyr Leu Asp Gly Asn Phe Ala Pro
1 5 10 15
Val Arg Glu Glu Ser Thr Ala Asn Thr Leu Gln Val Ile Gly Glu Leu
20 25 30
Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn Gly Pro Asn Pro Gln
35 40 45
Trp Thr Pro Ile Gly Lys Tyr His Trp Phe Asp Gly Asp Gly Met Leu
50 55 60
His Gly Val Arg Ile Ser Asn Gly Lys Ala Thr Tyr Arg Asn Arg Tyr
65 70 75 80
Val Arg Thr Lys Lys Trp Lys Ile Glu Asn Glu Ala Gly Lys Ala Leu
85 90 95
Leu Ser Gly Leu Leu Glu Pro Pro Gln Lys Lys Asn Pro Pro Gly Ala
100 105 110
Ser Lys Asn Thr Ala Asn Thr Ala Leu Val Trp His Ala Gly Gln Leu
115 120 125
Leu Ala Leu Trp Glu Gly Gly Ala Pro His Ala Ile Arg Val Pro Glu
130 135 140
Leu Lys Thr Lys Gly Glu Tyr Thr Tyr Asn Gly Lys Leu Ala Ser Ala
145 150 155 160
Phe Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Met Phe
165 170 175
Phe Gly Tyr Gly Phe Ala Pro Pro Tyr Leu Gln Tyr Ser Val Val Ser
180 185 190
Pro Glu Gly Glu Leu Leu Gln Thr Glu Pro Ile Asp Ile Pro Met Ala
195 200 205
Val Met Met His Asp Phe Ala Ile Thr Gln Asp Tyr Thr Ile Phe Met
210 215 220
Asp Leu Pro Leu Thr Phe Ser Gln Glu Arg Arg Lys Arg Gly Glu Pro
225 230 235 240
Met Met Lys Phe Glu Arg Asp Lys Pro Ser Arg Phe Gly Ile Val Pro
245 250 255
Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe Glu Ser Pro Ala Cys
260 265 270
Tyr Ile Phe His Thr Leu Asn Ala Tyr Glu Glu Gly Asp Glu Val Val
275 280 285
Leu Ile Ala Cys Arg Met Asn Ser Thr Thr Val Leu Asp Val Pro Gln
290 295 300
Asp Thr His Thr Asp Ser Glu Ala Asp Ile Pro Arg Leu His Arg Trp
305 310 315 320
Arg Phe Asn Leu Lys Thr Gly Lys Val Ser Glu Glu Met Leu Asp Asp
325 330 335
Thr Ala Ser Glu Phe Pro Arg Ile Asn Glu Asn Leu Leu Gly Gln Lys
340 345 350
Thr Arg Tyr Gly Tyr Thr Gly Lys Met Ala Lys Ser Ser Met Pro Leu
355 360 365
Phe Asp Gly Leu Ile Lys Tyr Asp Phe Asn Thr Gly Lys Ser Gln Thr
370 375 380
His Glu Phe Gly Arg Gly Arg Tyr Gly Gly Glu Ala Val Phe Val Pro
385 390 395 400
Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Val Thr Phe Val
405 410 415
His Asp Thr Val Glu Glu Thr Ser Glu Leu Val Val Val Ser Ala Gln
420 425 430
Asp Ile Thr Gly Glu Pro Val Ala Arg Val Leu Ile Pro Gln Arg Val
435 440 445
Pro Tyr Gly Phe His Gly Ala Trp Val Ser Glu Glu Gln Leu Lys Ala
450 455 460
Ser Val
465
<210> 25
<211> 1401
<212> DNA
<213> Scytonema millei
<400> 25
atggcaacta cccaggttaa cccctacctg gacggaaact tcgcccccgt gagagaagag 60
agcaccgcta atacactgca ggtcatcgga gagcttcccc ctgatctctc gggcatgttc 120
gttagaaatg gtcccaaccc tcaatggaca cctatcggta agtatcactg gtttgacggc 180
gatggcatgc tccacggcgt gcgtatcagc aatggcaaag ctacctatag aaatcggtac 240
gttcggacca aaaagtggaa gattgagaat gaagcaggaa aagctctcct ttctggcctt 300
cttgaacccc ctcaaaagaa aaacccccct ggcgcttcca agaacaccgc caataccgcc 360
cttgtgtggc atgccggaca acttctggct ctttgggaag gtggtgcacc tcacgcaatt 420
agagtccctg agctcaagac gaaaggtgag tatacgtaca atggaaagct ggccagcgcc 480
tttacagccc atcccaaggt tgatcctgtc acaggagaga tgatgttttt tggttacggc 540
tttgcccctc cttatctgca atattcggtc gtttctcccg aaggcgaact gctgcaaaca 600
gagcccattg acattcctat ggccgtcatg atgcacgatt ttgccattac ccaggattac 660
accattttta tggacctgcc ccttacgttt tctcaggaac gtcggaaacg aggtgagccc 720
atgatgaaat tcgagcggga taaaccctcg cgtttcggaa ttgtccccag atacggaaat 780
aatagcaaca tccgttggtt tgaaagccct gcttgttaca ttttccatac cctcaacgca 840
tacgaagaag gtgacgaggt ggttcttatc gcttgccgga tgaactcgac aacagtgctt 900
gatgtccctc aagacaccca taccgatagc gaggctgata tcccccgact gcatcgatgg 960
cgttttaacc ttaagactgg aaaagtctcg gaagagatgc ttgatgacac ggcatccgaa 1020
tttcctcgaa ttaatgaaaa ccttctgggt cagaaaacac gatatggata caccggcaaa 1080
atggctaaaa gcagcatgcc tcttttcgac ggcctcatta agtatgactt taacacgggt 1140
aaatcccaga cacacgaatt tggacgtgga cgatatggtg gtgaagccgt gttcgtccct 1200
cgacctggtg ccaccgccga ggatgatggt tggcttgtca cgtttgtcca cgacactgtc 1260
gaggaaacgt cggagctcgt tgtcgtgtct gcacaggaca tcactggtga acccgtggcc 1320
agagtcctca ttcctcagcg ggttccctat ggcttccatg gagcttgggt gagcgaagaa 1380
cagctgaagg cctcggtttg a 1401
<210> 26
<211> 1455
<212> DNA
<213> Lactuca sativa
<400> 26
atgaagtgct ccgcgaagtc cgatcgttgc gtggtggata agcagggtat ctccgtggcc 60
gacgaagagg attacgtcaa ggccggaggc tccgaacttt tcttcgtcca gatgcagcgg 120
accaagtcta tggagtcaca gagcaagttg agcgaaaagc tcgctcagat tccaatcgga 180
aactgcattt tggatttggt tgtcatcggc tgcggcccag ctggcctcgc tttggcggcg 240
gaatcggcaa agcttggcct caacgtgggc ctgatcggtc cagatctgcc attcaccaac 300
aactacggtg tgtggcagga cgagttcatt ggcctgggtc ttgaaggctg catcgaacac 360
tcttggaagg acaccctcgt ctacctggat gacgccgatc caatccgcat tggacgtgct 420
tacggacgcg ttcaccgtga cctcctgcac gaagagctgc tgcgtcgctg cgttgagtcc 480
ggcgtgtctt acctcagcag caaggttgaa cgcatcaccg aagcaccaaa cggctactca 540
ctcatcgagt gcgaaggtaa catcaccatc ccttgccgcc tcgcaaccgt ggcttcgggc 600
gccgcctccg gcaagttcct ggagtacgag ttgggcggac ctcgcgtgtg cgtgcagacc 660
gcgtacggca tcgaggttga ggtcgaaaac aacccatacg accctgatct gatggttttc 720
atggactacc gtgacttctc gaagcacaag cctgaatccc ttgaggcaaa gtacccaact 780
ttcctttacg tcatggctat gtccccaacc aagatcttct tcgaggaaac ttgcctcgct 840
tctcgcgaag ctatgccttt caacttgttg aagagcaagc tgatgtcccg cctgaaggct 900
atgggcatcc gcatcacccg cacctacgag gaagaatggt cgtacatccc ggtgggcggc 960
agcctgccaa acaccgagca gaagaacctc gccttcggtg cagcagcctc gatggtgcac 1020
ccagccaccg gttactctgt ggttcgctct ctgagcgaag caccaaacta cgccgccgtt 1080
attgcgaaga tcctgcgcca ggaccagtca aaggagatga tttccctcgg taagtacact 1140
aacatctcca agcaggcctg ggaaactctc tggccacttg agcgcaagcg ccagcgtgcc 1200
ttcttcctct tcggcttgtc acacatcgtg ctcatggacc tggaaggcac tcgcactttc 1260
ttccgtacct tcttccgcct gcctaagtgg atgtggtggg gcttcctggg ctcttcgctt 1320
tcctccaccg atttgattat cttcgctctc tacatgttcg tcatcgctcc gcactccttg 1380
cgtatggagc tcgtccgtca cctgttgtcc gatccgaccg gtgccactat ggtgaaggca 1440
tacctgacca tctaa 1455
<210> 27
<211> 109
<212> PRT
<213> Escherichia coli
<400> 27
Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp
1 5 10 15
Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp
20 25 30
Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp
35 40 45
Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn
50 55 60
Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu
65 70 75 80
Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser
85 90 95
Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala
100 105
<210> 28
<211> 327
<212> DNA
<213> Escherichia coli
<400> 28
atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60
gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120
ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180
atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240
ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300
aaagagttcc tcgacgctaa cctggcg 327
<210> 29
<211> 80
<212> PRT
<213> Zea mays
<400> 29
Met Ala Val Ala Lys Ala Leu Ala Thr Ala Thr Ala Ala Phe Ser Met
1 5 10 15
Leu Leu Leu Ser Gly Leu Ala Val Thr Gly Thr Val Leu Ala Leu Ile
20 25 30
Val Ala Thr Pro Leu Met Val Ile Phe Ser Pro Val Leu Val Pro Ala
35 40 45
Ala Ile Thr Val Ala Leu Leu Thr Val Gly Ile Val Ser Ser Gly Gly
50 55 60
Phe Gly Val Ala Ala Val Ala Val Leu Ala Trp Val Tyr Arg Tyr Leu
65 70 75 80
<210> 30
<211> 80
<212> PRT
<213> Sesamum indicum
<400> 30
Thr Gln Ile Leu Ala Ile Ile Thr Leu Leu Pro Ile Ser Gly Thr Leu
1 5 10 15
Leu Cys Leu Ala Gly Ile Thr Leu Val Gly Thr Leu Ile Gly Leu Ala
20 25 30
Val Ala Thr Pro Val Phe Val Ile Phe Ser Pro Val Leu Val Pro Ala
35 40 45
Ala Ile Leu Ile Ala Gly Ala Val Thr Ala Phe Leu Thr Ser Gly Ala
50 55 60
Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp Val Leu Asn Ser Phe
65 70 75 80
<210> 31
<211> 245
<212> PRT
<213> Arabidopsis thaliana
<400> 31
Met Gly Ser Lys Thr Glu Met Met Glu Arg Asp Ala Met Ala Thr Val
1 5 10 15
Ala Pro Tyr Ala Pro Val Thr Tyr His Arg Arg Ala Arg Val Asp Leu
20 25 30
Asp Asp Arg Leu Pro Lys Pro Tyr Met Pro Arg Ala Leu Gln Ala Pro
35 40 45
Asp Arg Glu His Pro Tyr Gly Thr Pro Gly His Lys Asn Tyr Gly Leu
50 55 60
Ser Val Leu Gln Gln His Val Ser Phe Phe Asp Ile Asp Asp Asn Gly
65 70 75 80
Ile Ile Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Met Leu Gly Phe
85 90 95
Asn Ile Ile Gly Ser Leu Ile Ile Ala Ala Val Ile Asn Leu Thr Leu
100 105 110
Ser Tyr Ala Thr Leu Pro Gly Trp Leu Pro Ser Pro Phe Phe Pro Ile
115 120 125
Tyr Ile His Asn Ile His Lys Ser Lys His Gly Ser Asp Ser Lys Thr
130 135 140
Tyr Asp Asn Glu Gly Arg Phe Met Pro Val Asn Leu Glu Leu Ile Phe
145 150 155 160
Ser Lys Tyr Ala Lys Thr Leu Pro Asp Lys Leu Ser Leu Gly Glu Leu
165 170 175
Trp Glu Met Thr Glu Gly Asn Arg Asp Ala Trp Asp Ile Phe Gly Trp
180 185 190
Ile Ala Gly Lys Ile Glu Trp Gly Leu Leu Tyr Leu Leu Ala Arg Asp
195 200 205
Glu Glu Gly Phe Leu Ser Lys Glu Ala Ile Arg Arg Cys Phe Asp Gly
210 215 220
Ser Leu Phe Glu Tyr Cys Ala Lys Ile Tyr Ala Gly Ile Ser Glu Asp
225 230 235 240
Lys Thr Ala Tyr Tyr
245
<210> 32
<211> 738
<212> DNA
<213> Arabidopsis thaliana
<400> 32
atggggtcaa agacggagat gatggagaga gacgcaatgg ctacggtggc tccctatgcg 60
ccggtcactt accatcgccg tgctcgtgtt gacttggatg atagacttcc taaaccttat 120
atgccaagag cattgcaagc accagacaga gaacacccgt acggaactcc aggccataag 180
aattacggac ttagtgttct tcaacagcat gtctccttct tcgatatcga tgataatggc 240
atcatttacc cttgggagac ctactctgga ctgcgaatgc ttggtttcaa tatcattggg 300
tcgcttataa tagccgctgt tatcaacctg acccttagct atgccactct tccggggtgg 360
ttaccttcac ctttcttccc tatatacata cacaacatac acaagtcaaa gcatggaagt 420
gattcaaaaa catatgacaa tgaaggaagg tttatgccgg tgaatcttga gttgatattt 480
agcaaatatg cgaaaacctt gccagacaag ttgagtcttg gagaactatg ggagatgaca 540
gaaggaaacc gtgacgcttg ggacattttt ggatggatcg caggcaaaat agagtgggga 600
ctgttgtact tgctagcaag ggatgaagaa gggtttttgt caaaagaagc tattaggcgg 660
tgtttcgatg gaagcttgtt cgagtactgt gccaaaatct acgctggtat cagtgaagac 720
aagacagcat actactaa 738
<210> 33
<211> 245
<212> PRT
<213> Sesamum indicum
<400> 33
Met Ala Thr His Val Leu Ala Ala Ala Ala Glu Arg Asn Ala Ala Leu
1 5 10 15
Ala Pro Asp Ala Pro Leu Ala Pro Val Thr Met Glu Arg Pro Val Arg
20 25 30
Thr Asp Leu Glu Thr Ser Ile Pro Lys Pro Tyr Met Ala Arg Gly Leu
35 40 45
Val Ala Pro Asp Met Asp His Pro Asn Gly Thr Pro Gly His Val His
50 55 60
Asp Asn Leu Ser Val Leu Gln Gln His Cys Ala Phe Phe Asp Gln Asp
65 70 75 80
Asp Asn Gly Ile Ile Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Gln
85 90 95
Ile Gly Phe Asn Val Ile Ala Ser Leu Ile Met Ala Ile Val Ile Asn
100 105 110
Val Ala Leu Ser Tyr Pro Thr Leu Pro Gly Trp Ile Pro Ser Pro Phe
115 120 125
Phe Pro Ile Tyr Leu Tyr Asn Ile His Lys Ala Lys His Gly Ser Asp
130 135 140
Ser Gly Thr Tyr Asp Thr Glu Gly Arg Tyr Leu Pro Met Asn Phe Glu
145 150 155 160
Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu
165 170 175
Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu
180 185 190
Phe Gly Trp Ile Ala Ser Lys Met Glu Trp Thr Leu Leu Tyr Ile Leu
195 200 205
Ala Arg Asp Gln Asp Gly Phe Leu Ser Lys Glu Ala Ile Arg Arg Cys
210 215 220
Tyr Asp Gly Ser Leu Phe Glu Tyr Cys Ala Lys Met Gln Arg Gly Ala
225 230 235 240
Glu Asp Lys Met Lys
245
<210> 34
<211> 738
<212> DNA
<213> Sesamum indicum
<400> 34
atggcaactc atgttttggc tgctgcggcg gagagaaatg ctgcgttggc gccggacgcc 60
ccgcttgctc cggtgactat ggagcgccca gtgcgcactg acttggagac ttcgatcccg 120
aagccctata tggcaagagg attggttgca cctgatatgg atcaccccaa cggaacacca 180
ggccatgtgc atgataattt gagtgtgctg caacagcatt gtgctttctt tgatcaggat 240
gataacggaa tcatctatcc atgggagact tactctggac ttcgccaaat tggtttcaat 300
gtgatagctt cccttataat ggctatcgtc attaatgtgg cgctgagtta tcctactctc 360
ccgggttgga ttccttctcc ttttttcccc atatatttgt acaacataca caaggccaaa 420
catggaagcg actccggaac ctatgatact gaaggaaggt acctacctat gaattttgag 480
aacctgttca gcaagcatgc ccggacaatg cccgataggc tcactctagg ggagctatgg 540
agcatgactg aagctaacag agaagcattt gacattttcg gctggatcgc aagcaaaatg 600
gagtggactc tcctctacat tcttgcaaga gaccaggacg gtttcctgtc gaaagaagcc 660
atcaggcggt gttacgatgg cagtttgttc gagtactgtg caaagatgca aaggggagcc 720
gaggacaaga tgaaatga 738
Claims (70)
- 이오논 화합물(ionone compound)을 생산하기 위한 재조합 미생물 생산 숙주 세포로서,
상기 숙주 세포는 제1 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함하되, 상기 제1 코딩 서열은 카로테노이드 분열 활성을 갖는 제2 도메인에 융합된 지질체 구획화 신호 태그(lipid body compartmentalization signal tag: LBT)로서 기능할 수 있는 제1 도메인을 포함하는 융합 효소를 인코딩하고, 상기 제1 도메인은 지질체 구조 단백질, 유지성-유도 지방구 단백질(oleaginicity-inducing lipid droplet protein), 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택되고, 상기 제1 도메인은 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(small ubiquitin-like modifier: SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함하지 않는, 숙주 세포. - 제1항에 있어서, 상기 제1 도메인은 서열번호 5, 서열번호 7 또는 서열번호 9와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제1 도메인은 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 올레오신 폴리펩타이드인, 숙주 세포.
- 제1항에 있어서, 상기 제1 도메인은 아라비돕시스 탈리아나(Arabidopsis thaliana), 리시누스 콤뮤니스(Ricinus communis), 글리신 맥스(Glycine max), 세사뭄 인디쿰(Sesamum indicum), 코익스 라크리마(Coix lacryma), 아스퍼질러스 니게르(Aspergillus niger) 또는 뉴로스포라 크라사(Neurospora crassa)로부터의 칼레오신을 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제2 도메인은 카로테노이드 분열 다이옥시게나제 또는 카로테노이드 옥시게나제인, 숙주 세포.
- 제6항에 있어서, 상기 제2 도메인은 서열번호 11, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제2 도메인은 페튜니아 x 하이브리드(Petunia x hybrid), 오스만투스 프라그란스(Osmanthus fragrans), 제아 메이즈(Zea mays), 아라비돕시스 탈리아나(Arabidopsis thaliana), 비티스 비니페라(Vitis vinifera), 다우쿠스 카로타(Daucus carota), 리코퍼시콘 에스쿨렌텀(Lycopersicon esculentum), 또는 루부스 이다에우스(Rubus idaeus)로부터의 CCD1 효소, 또는 아라비돕시스 탈리아나(Arabidopsis thaliana), 빅사 오렐라나(Bixa Orellana), 크리산데뮴 모리폴리움(Chrysanthemum morifolium), 크로커스 사티부스(Crocus sativus), 무사 아쿠미나타(Musa acuminata), 말루스 도메스티카(Malus domestica), 프루누스 퍼시카(Prunus persica), 로사 다마센(Rosa damascene), 비티스 비니페라(Vitis vinifera) 및 오스만투스 프라그란스(Osmanthus fragrans)로부터의 CCD4 효소를 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제1 도메인은 길이가 3 내지 30개인 아미노산을 포함하고 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는 링커를 통해 상기 제2 도메인에 융합되는, 숙주 세포.
- 제9항에 있어서, 상기 링커는 글리신-세린 링커를 포함하는, 숙주 세포.
- 제1항에 있어서, 상기 제1 코딩 서열은 TEF 프로모터에 작동 가능하게 연결된, 숙주 세포.
- 제1항에 있어서, 알파-이오논을 제조하기 위한 것으로서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서, 카로테노이드 분열 다이옥시게나제 또는 카로테노이드 옥시게나제 도메인에 융합된 리코펜 엡실론-사이클라제 도메인을 포함하는 융합 효소 또는 리코펜 엡실론-사이클라제를 인코딩하는 제2 코딩 서열을 추가로 포함하는, 숙주 세포.
- 제1항에 있어서, 베타-이오논을 제조하기 위한 것으로서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서, 파이토엔 신타제(phytoene synthase)를 인코딩하는 제2 코딩 서열을 추가로 포함하는, 숙주 세포.
- 제13항에 있어서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서 파이토엔 데하이드로게나제를 인코딩하는 제3 코딩 서열을 추가로 포함하는, 숙주 세포.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 하나 이상의 코딩 서열을 포함하는 하나 이상의 핵산 작제물을 추가로 포함하되, 상기 하나 이상의 코딩 서열은 숙주 세포에 대해 천연 메발로네이트 경로 효소로부터 선택되는, 숙주 세포.
- 제15항에 있어서, 상기 천연 메발로네이트 경로 효소는 하이드록시메틸글루타릴-CoA 신타제(HMGS), 하이드록시메틸글루타릴-CoA 리덕타제(HMGR) 및 아이소펜테닐-다이포스페이트-아이소머라제(IPI)로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제16항에 있어서, 하나 이상의 코딩 서열을 포함하는 하나 이상의 핵산 작제물을 추가로 포함하되, 상기 하나 이상의 코딩 서열은 파르네실 다이포스페이트 신타제(FPPS), 게라닐게라닐 다이포스페이트 신타제(GGPPS), GGPPS::FPPS 융합 효소, 파이토엔 데하이드로게나제(CarB), 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP) 및 리코펜 사이클라제 활성을 가지지 않은 돌연변이체 CarRP(CarRP*)로 이루어진 군으로부터 선택된 하나 이상의 효소를 인코딩하는, 숙주 세포.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 숙주 세포는 효모인, 숙주 세포.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카(Yarrowia lipolytica), 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제19항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카인, 숙주 세포.
- 카로테노이드 화합물을 생산하기 위한 재조합 미생물 생산 숙주 세포로서, 상기 숙주 세포는 베타-카로텐 케톨라제 또는 베타-카로텐 하이드록실라제에 융합된 올레오신 폴리펩타이드 또는 칼레오신 폴리펩타이드를 포함하는 융합 효소를 인코딩하는 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함하는, 숙주 세포.
- 제21항에 있어서, 베타-카로텐 케톨라제에 융합된 올레오신 폴리펩타이드를 포함하는 제1 융합 효소를 인코딩하는 제1 코딩 서열, 및 베타-카로텐 하이드록실라제에 융합된 올레오신 폴리펩타이드 또는 칼레오신 폴리펩타이드를 포함하는 제2 융합 효소를 인코딩하는 제2 코딩 서열을 포함하는, 숙주 세포.
- 제21항 또는 제22항에 있어서, 상기 베타-카로텐 케톨라제는 조류(algal) 또는 박테리아 BKT 또는 CrtW인, 숙주 세포.
- 제23항에 있어서, 상기 베타-카로텐 케톨라제는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 파라코커스 종(Paracoccus sp.) 및 판토이아 아나나티스(Pantoea ananatis)로부터의 것인, 숙주 세포.
- 제21항 또는 제22항에 있어서, 상기 베타-카로텐 하이드록실라제는 조류 CrtR-B인, 숙주 세포.
- 제21항 또는 제22항에 있어서, 상기 조류 CrtR-b는 헤마토코쿠스 플루비알리스 또는 클라미도모나스 레인하티로부터의 것인, 숙주 세포.
- 제21항 내지 제26항 중 어느 한 항에 있어서, 상기 올레오신 폴리펩타이드는 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하고, 칼레오신 폴리펩타이드가 서열번호 31 또는 서열번호 33의 아미노산 서열을 포함하는, 숙주 세포.
- 제21항에 있어서, 상기 카로테노이드 화합물은 아스타잔틴인, 숙주 세포.
- 제21항에 있어서, 상기 카로테노이드 화합물은 칸타잔틴인, 숙주 세포.
- 제21항 내지 제29항 중 어느 한 항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카인, 숙주 세포.
- 제1 핵산 서열 및 제2 핵산 서열을 포함하는 합성 또는 재조합 핵산 분자로서,
상기 제1 핵산 서열 및 상기 제2 핵산 서열은 함께, 융합 효소를 인코딩하고, 상기 융합 효소는 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인 및 카로테노이드 분열 활성을 갖는 제2 도메인을 포함하고, 상기 제1 도메인은 지질체 구조 단백질, 유지성-유도 지방구 단백질, 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택되고, 상기 제1 도메인은 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함하지 않는, 핵산 분자. - 제31항에 있어서, 상기 제1 도메인은 25 kDa 미만의 분자량을 갖는 지질체 구조체인, 핵산 분자.
- 제32항에 있어서, 상기 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하는, 핵산 분자.
- 제33항에 있어서, 상기 제1 도메인은 서열번호 1 또는 서열번호 3과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
- 제33항 또는 제34항에 있어서, 상기 제1 핵산 서열이 서열번호 2 또는 서열번호 4와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
- 제31항에 있어서, 상기 제1 도메인은 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
- 제36항에 있어서, 상기 제1 핵산 서열이 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 32, 또는 서열번호 34와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
- 제31항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 도메인은 카로테노이드 분열 다이옥시게나제인, 핵산 분자.
- 제38항에 있어서, 상기 제2 도메인은 서열번호 11, 서열번호 14, 또는 서열번호 16과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
- 제39항에 있어서, 상기 제2 핵산 서열이 서열번호 12, 서열번호 13, 서열번호 15, 또는 서열번호 17과 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
- 제31항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 도메인은 카로테노이드 옥시게나제 또는 9-시스-에폭시카로테노이드 다이옥시게나제인, 핵산 분자.
- 제41항에 있어서, 제2 도메인이 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
- 제42항에 있어서, 상기 제2 핵산 서열이 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
- 제31항에 있어서, 상기 제2 도메인은 페튜니아 x 하이브리드, 오스만투스 프라그란스, 제아 메이즈, 아라비돕시스 탈리아나, 비티스 비니페라, 다우쿠스 카로타, 리코퍼시콘 에스쿨렌텀, 또는 루부스 이다에우스로부터의 CCD1 효소, 또는 아라비돕시스 탈리아나, 빅사 오렐라나, 크리산데뮴 모리폴리움, 크로커스 사티부스, 무사 아쿠미나타, 말루스 도메스티카, 프루누스 퍼시카, 로사 다마센, 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함하는, 핵산 분자.
- 제31항 내지 제44항 중 어느 한 항에 있어서, 일단부에서 상기 제1 핵산 서열에 그리고 타단부에서 상기 제2 핵산 서열에 작동 가능하게 연결된 제3 핵산 서열을 추가로 포함하되, 상기 제3 핵산 서열은 상기 제2 도메인에 상기 제1 도메인을 결합시키는 링커를 인코딩하는, 핵산 분자.
- 제45항에 있어서, 상기 링커는 길이가 3 내지 30개인 아미노산을 포함하는, 핵산 분자.
- 제45항 또는 제46항에 있어서, 상기 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는, 핵산 분자.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 링커는 GGGGS의 하나 이상의 단위를 선택적으로 포함하는, 글리신-세린 링커를 포함하는, 핵산 분자.
- 제45항 내지 제48항 중 어느 한 항에 있어서, 상기 링커는 GGGGS인, 핵산 분자.
- 제45항 내지 제49항 중 어느 한 항에 있어서, 상기 링커는 GGGGSGGGGSGGGGSGGGGS인, 핵산 분자.
- 이종 핵산 서열에 작동 가능하게 연결된 제31항 내지 제50항 중 어느 한 항의 핵산 분자를 포함하는 핵산 작제물로서,
선택적으로, 상기 이종 핵산 서열은 프로모터 서열인, 핵산 작제물. - 제51항에 있어서, 엡실론-사이클라제 또는 파이토엔 신타제를 인코딩하는 이종 핵산 서열을 추가로 포함하는, 핵산 작제물.
- 카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 포함하는 융합 효소.
- 제53항에 있어서, 상기 LBT 도메인이 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하는, 융합 효소.
- 제54항에 있어서, 상기 LBT 도메인이 서열번호 1 또는 서열번호 3과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
- 제53항에 있어서, 상기 LBT 도메인이 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
- 제53항 내지 제56항 중 어느 한 항에 있어서, 상기 CCD 도메인이 서열번호 11, 서열번호 14, 또는 서열번호 16과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
- 제53항 내지 제56항 중 어느 한 항에 있어서, 상기 CCD 도메인이 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
- 제53항 내지 제58항 중 어느 한 항에 있어서, 상기 LBT 도메인이 링커를 통해 CCD 도메인에 결합된, 융합 효소.
- 제59항에 있어서, 상기 링커는 길이가 3 내지 30개인 아미노산을 포함하는, 융합 효소.
- 제59항 또는 제60항에 있어서, 상기 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는, 융합 효소.
- 제61항에 있어서, 상기 링커는 글리신-세린 링커를 포함하는, 융합 효소.
- 제62항에 있어서, 상기 링커는 GGGGS의 하나 이상의 단위를 선택적으로 포함하는, 융합 효소.
- 제31항 내지 제50항 중 어느 한 항에 따른 핵산 분자, 또는 제51항 또는 제52항에 따른 핵산 작제물을 포함하는, 재조합 야로위아 리폴리티카 세포.
- 이오논 화합물을 제조하는 방법으로서,
제1항 내지 제20항 중 어느 한 항의 재조합 숙주 세포를, 이오논 화합물이 제조되는 조건 하에서 글루코스 또는 글리세롤을 포함하는 배지 중에서 배양하는 단계를 포함하는, 이오논 화합물을 제조하는 방법. - 제65항에 있어서, 상기 이오논 화합물은 알파-이오논인, 이오논 화합물을 제조하는 방법.
- 제65항에 있어서, 상기 이오논 화합물은 베타-이오논인, 이오논 화합물을 제조하는 방법.
- 카로테노이드 화합물을 제조하는 방법으로서, 제21항 내지 제30항 중 어느 한 항의 재조합 숙주 세포를, 카로테노이드 화합물이 제조되는 조건 하에서 글루코스 또는 글리세롤을 포함하는 배지 중에서 배양하는 단계를 포함하는, 이오논 화합물을 제조하는 방법.
- 제68항에 있어서, 상기 카로테노이드 화합물은 아스타잔틴인, 이오논 화합물을 제조하는 방법.
- 제68항에 있어서, 상기 카로테노이드 화합물은 칸타잔틴인, 이오논 화합물을 제조하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962911116P | 2019-10-04 | 2019-10-04 | |
US62/911,116 | 2019-10-04 | ||
PCT/US2020/054323 WO2021067974A1 (en) | 2019-10-04 | 2020-10-05 | Biosynthesis of alpha-ionone and beta-ionone |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220062331A true KR20220062331A (ko) | 2022-05-16 |
Family
ID=75337534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227011349A KR20220062331A (ko) | 2019-10-04 | 2020-10-05 | 알파-이오논 및 베타-이오논의 생합성 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220325313A1 (ko) |
EP (1) | EP4022032A4 (ko) |
JP (1) | JP7525185B2 (ko) |
KR (1) | KR20220062331A (ko) |
CN (1) | CN114502718A (ko) |
WO (1) | WO2021067974A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023167638A2 (en) * | 2022-03-01 | 2023-09-07 | Agency For Science, Technology And Research | Biosynthesis of apocarotenoids by controlling oxidative stress |
CN118006476B (zh) * | 2024-04-10 | 2024-07-19 | 齐鲁工业大学(山东省科学院) | 一株产CCD酶的酿酒酵母及其在合成β-紫罗兰酮上的应用 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ID23301A (id) * | 1998-04-23 | 2000-04-05 | Hoffmann La Roche | Produksi yang berlebihan dari riboflavin di dalam ragi |
EP2078092A2 (en) * | 2006-09-28 | 2009-07-15 | Microbia, Inc. | Production of carotenoids in oleaginous yeast and fungi |
CA2778150C (en) * | 2009-10-30 | 2022-07-26 | Agresearch Limited | Modified neutral lipid encapsulating proteins and uses thereof |
WO2016154314A1 (en) * | 2015-03-23 | 2016-09-29 | Arch Innotek, Llc | Compositions and methods of biosynthesizing carotenoids and their derivatives |
WO2017029129A1 (en) * | 2015-08-06 | 2017-02-23 | Glycotope Gmbh | Heteromers with enzymatic activity |
HUE055431T2 (hu) * | 2015-08-28 | 2021-11-29 | Phytowelt Greentechnologies Gmbh | Eljárás fermentatív alfa-jonon elõállítására |
US11124809B2 (en) * | 2017-12-21 | 2021-09-21 | Centrome, Inc. | Production of alpha-(R)-(E)-(+)-ionone in recombinant Saccharomyces cerevisiae |
CN108949599A (zh) * | 2018-06-29 | 2018-12-07 | 华南理工大学 | 一种产β-紫罗兰酮基因工程菌及其构建方法与应用 |
CN109748956A (zh) * | 2019-01-15 | 2019-05-14 | 广州天宝颂原生物科技开发有限公司 | 一种红色类胡萝卜素蛋白的制备方法 |
-
2020
- 2020-10-05 JP JP2022520244A patent/JP7525185B2/ja active Active
- 2020-10-05 WO PCT/US2020/054323 patent/WO2021067974A1/en unknown
- 2020-10-05 EP EP20870672.1A patent/EP4022032A4/en active Pending
- 2020-10-05 CN CN202080069370.4A patent/CN114502718A/zh active Pending
- 2020-10-05 KR KR1020227011349A patent/KR20220062331A/ko active Search and Examination
-
2022
- 2022-04-04 US US17/712,452 patent/US20220325313A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114502718A (zh) | 2022-05-13 |
WO2021067974A1 (en) | 2021-04-08 |
EP4022032A4 (en) | 2022-12-14 |
EP4022032A1 (en) | 2022-07-06 |
US20220325313A1 (en) | 2022-10-13 |
JP2022551440A (ja) | 2022-12-09 |
JP7525185B2 (ja) | 2024-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210403965A1 (en) | Production of cannabinoids in yeast | |
US20220325313A1 (en) | Biosynthesis of alpha-ionone and beta-ionone | |
JP2004530402A (ja) | p−ヒドロキシケイ皮酸の生物生産 | |
CN112176000A (zh) | 用于生产芳香醇的方法 | |
US20220403346A1 (en) | Production of cannabinoids | |
WO2022245988A2 (en) | Production of carotenoids | |
EP3877525A2 (en) | Co-production pathway for 3-hp and acetyl-coa derivatives from malonate semialdehyde | |
CN114072507A (zh) | 香草醛从异丁香酚的生物合成 | |
CN113767173A (zh) | 香草醛从异丁香酚的生物合成 | |
US20220213513A1 (en) | Production of cannabinoids | |
WO2022051433A1 (en) | Production of sesqui-cannabinoids | |
JP7210577B2 (ja) | セレノネインの製造方法 | |
CN108779444A (zh) | 生产脂肪酸的方法 | |
WO2006134374A2 (en) | A method for production of l-ascorbic acid | |
GB2416769A (en) | Biosynthesis of raspberry ketone | |
CN107109393B (zh) | 用于生产冷杉醇的方法 | |
WO2022133274A1 (en) | Biosynthesis of vanillin from isoeugenol | |
EP1231266B1 (en) | Arabidopsis-origin gdp-4-keto-6-deoxy-d-mannose-3,5-epimerase-4-reductase gene | |
CN118339307A (zh) | 维生素a化合物的生物合成制备 | |
WO2022102595A1 (ja) | 形質転換体並びにそれを用いるカロテノイド組成物の製造方法 | |
WO2024059813A2 (en) | Biosynthesis of salidroside | |
KR101736919B1 (ko) | 신규 이소프렌 신타아제 및 이를 이용한 이소프렌의 제조방법 | |
WO2024124165A2 (en) | Methods and compositions for purifying cannabinoids | |
JP2024538156A (ja) | カンナビノイド生合成のための最適化された生合成経路 | |
KR20130121420A (ko) | P450 효소의 촉매활성을 증대시키는 cpr 유전자를 포함하는 재조합 벡터, 이에 의하여 형질전환된 세균 및 이를 이용한 p450 촉매반응 화합물의 제조방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |