KR102469382B1

KR102469382B1 - 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨을 생성하는 테르펜 신타아제

Info

Publication number: KR102469382B1
Application number: KR1020207009265A
Authority: KR
Inventors: 마르티누스 줄리어스 비크와일더; 아델 마르가레타 마리아 리두이나 반 호우웰링겐; 헨드릭 잔 보쉬; 조지 프리드리히 렌첸; 엘레나 멜릴로
Original assignee: 아이소바이오닉스 비.브이.
Priority date: 2017-09-01
Filing date: 2018-09-01
Publication date: 2022-11-21
Also published as: BR112020004093A2; KR20200043472A; WO2019045568A1; MX2020002329A; US20210102224A1; US11584941B2; NL2019473B1; EP3676382A1; CN111225979B; CN111225979A; JP2021502054A; JP7183254B2

Abstract

본 발명은 패추롤 신타아제, 상기 패추롤 신타아제를 인코딩하는 핵산, 상기 핵산을 포함하는 발현 벡터, 상기 발현 벡터를 포함하는 숙주 세포, 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 제조 방법, 및 패추롤 신타아제의 제조 방법에 관한 것이다.

Description

패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨을 생성하는 테르펜 신타아제

본 발명은 패추롤(patchoulol) 신타아제, 상기 패추롤 신타아제를 인코딩하는 핵산, 상기 핵산을 포함하는 발현 벡터, 상기 발현 벡터를 포함하는 숙주 세포, 패추롤 및 엘레몰(elemol), 및 바람직하게는 또한 포고스톨(pogostol)을 제조하는 방법, 및 패추롤 신타아제를 제조하는 방법에 관한 것이다.

많은 유기체는 다양한 테르펜과 테르페노이드를 생산할 수 있는 능력이 있다. 테르펜은 실제로 또는 개념적으로 분자식 C₅H₈을 갖는, 일반적으로 이소프렌 단위로 지칭되는 2-메틸부탄 잔기로 구성된다. 이소프렌 단위는 자연의 공통 빌딩 블록 중 하나로 간주할 수 있다. 테르펜의 기본 분자식은 식: (C₅H₈)_n의 배수이며, 여기서 n은 연결된 이소프렌 단위의 수이다. 이것을 이소프렌 규칙이라고 하며, 이에 따라 테르펜은 이소프레노이드라고도 한다. 이소프렌 단위는 "헤드-투-테일(head to tail)"로 서로 연결되어 선형 사슬을 형성할 수 있거나 고리를 형성하도록 배열될 수 있다. 이의 생합성에서, 테르펜은 일반적인 5개의 탄소 전구체 이소펜테닐 디포스페이트 (IPP) 및 이의 이성질체, 디메틸알릴 디포스페이트 (DMAPP)로부터 형성된다. 따라서, 테르펜 탄소 골격은 일반적으로 5개의 탄소 원자의 배수를 포함한다. 헤미테르펜, 모노테르펜, 세스퀴테르펜, 디테르펜, 트리테르펜 및 테트라테르펜으로 각각 언급되는 5개, 10개, 15개, 20개, 30개 및 40개 탄소 테르펜이 가장 일반적이다. "헤드-투-테일" 연결 외에도, 트리테르펜 및 테트라테르펜은 또한 중심에 하나의 "테일-투-테일" 연결이 포함된다. 테르펜은 알코올 및 이의 글리코시드, 에테르, 알데히드, 케톤, 카복실산 및 에스테르와 같은 추가의 작용기를 포함할 수 있다. 이러한 작용화된 테르펜은 본원에서 테르페노이드로 지칭된다. 테르펜과 같이, 테르페노이드는 일반적으로 5개 탄소 원자의 배수를 갖는 탄소 골격을 갖는다. 테르페노이드의 총 탄소수는 5의 배수일 필요는 없으며, 예를 들어 작용기는 임의의 수의 탄소 원자를 갖는 알킬 라디칼을 포함하는 에스테르 기일 수 있음에 유의해야 한다.

상기 제공된 정의와는 별도로, 용어 "테르펜", "테르페노이드" 및 "이소프레노이드"는 공개 문헌 뿐만 아니라 특허 문헌에서 상호교환적으로 자주 사용된다는 점에 유의하는 것이 중요하다.

패추롤은 박하과 (꿀풀과(Lamiaceae))의 초본 식물인 파출리 (포고스테몬 카블린(Pogostemon cablin))와 같은 특정 식물에서 생산되는 자연적으로 발생하는 세스퀴테르펜 알코올이다. 패추롤은 파출리 오일의 주요 성분이다. 파출리 오일은 포고스테몬의 마른 잎을 증기 증류하여 얻은 중요한 향수 성분이다. 파출리 오일은 고급 향수, 화장품 예를 들어 스킨 크림, 립스틱, 파우더, 샴푸, 면도 크림, 헤어 오일 및 비누 향수(soap perfume)에 사용되는 중요한 향기 성분이다. 파출리 오일은 따뜻한, 초본(herbaceous), 장뇌 성질(camphoraceous) 및 목질(woody)로 설명된 특징적인 냄새 프로파일을 갖는다. 패추롤은 파출리 오일의 주요 성분일 뿐만 아니라 주요 냄새 성분이다 (N

f 등 Helvetica Chimica Acta 64, no. 5 (July 22, 1981): 1387-97). 그러나, 파출리 오일은 파출리 냄새 프로파일에 중요한 기여자로 설명된 노르파출레놀 및 포고스톨인, 추가 성분을 함유할 수 있다 (Leffingwell 등 Chemistry Today (2006): 24: 36-38).

포고스테몬 카블린 유래 단일 패추롤 신타아제는 다수의 파출리 오일 성분을 생산하는 역할을 하는 것으로 밝혀졌다 (Deguerry 등 Archives of Biochemistry and Biophysics (2006): 454: 123-36). 에나티오퓨어(enatiopure) 패추롤에 대한 화학적 경로가 이용가능하지만 (N

f 등 elvetica Chimica Acta 64, no. 5 (July 22, 1981): 1387-97, 및 Srikrishna 등 Tetrahedron: Asymmetry (2005): 16: 3992-97), 패추롤의 비용-효율적인 생산이 가능하지 않다. 따라서 패추롤은 주로 파출리 식물의 건조된 잎의 증기-증류로부터 얻어진다. 파출리 오일의 공급원은 주로 인도네시아이다. 이러한 공급은 프라이즈(prize), 품질 및 가용성에 큰 변동이 있다. 이러한 변동은 기후 변화, 무역 투기(trade speculation), 경작법, 생산 비용의 변동, 생산 면적의 변화 및 식물 질병 등 여러 가지 요인에 의해 발생한다 (Tekriwal S (2009) Naturals in Indonesia (www.scribd.com/document/251903018/Naturals-in-Indonesia-IFEAT-Shanghai-By-Sandeep-Tekriwal)).

패추롤 신타아제 활성을 갖는 단백질을 코딩하는 유전자의 도입에 의해 유전자 변형된 미생물을 이용하여 미생물적으로 패추롤을 제조하는 것이 제안되어 왔다. 패추롤 신타아제는 FPP로부터 패추롤의 제조에 사용될 수 있으며, 전환은 단리된 반응으로 (시험관내) 또는 궁극적으로 당으로부터 패추롤의 생성으로 이어지는 보다 긴 대사 경로의 일부로서 (생체내) 실행될 수 있다.

US20090205060은 포고스테몬 카블린으로부터 패추롤 신타아제를 사용하여 패추롤을 생성하는 방법을 설명한다. 미국 특허 8993284, WO2011141855는 패추롤 및 7-에피-알파-셀리넨을 동시에 생산하는 발레리아나 자타만시(Valeriana jatamansi) 유래 테르펜 신타아제를 설명하고 있다.

피르메니히(Firmenich)는 2014년에 CLEARWOOD™ 파출리 오일 대체제를 출시하였는데, 이 대체재는 설탕의 발효 생산에서 비롯되며, "천연 오일에서 발견되는 토질의, 가죽 같고 고무 같은 특징이 없는 부드럽고 깨끗한 파출리 버전"으로 설명된다 (Leffingwell 등 Leffingwell Reports (2015) 7: 1-11).

패추롤을 형성하는 것으로 알려진 유일한 테르펜 신타아제는 지금까지 포고 스테몬 및 발레리아나 속에서 확인되었다. 그러나, 다른 식물도 일부 패추롤형 세스퀴테르펜을 생산하는 것으로 설명되었지만 (Choudhury 등 India. J. Essent. Res. (1996): 8, 633), 상응하는 신타아제 효소는 알려지지 않았다.

현재 공지된 패추롤 신타아제는, 패추롤이 FPP로부터 예를 들어 단리된 패추롤 신타아제 또는 (투과된) 전세포를 사용하여 단리된 반응 (시험관내)으로, 또는 그렇지 않으면 예를 들어 보다 긴 대사 경로의 일부인 발효 공정으로 제조되는 산업적 패추롤 생산 공정에 적용될 때 특히 바람직하지 않은 다수의 뚜렷한 단점을 갖는다. 따라서, 패추롤의 제조에 사용될 수 있는 대안적인 패추롤 신타아제가 필요하다. 특히 적어도 선택된 숙주 세포에서의 발현이 개선된 패추롤 신타아제; 적어도 특정 조건 하에서 예컨대 중성 또는 알칼리성 pH 및/또는 그것이 생성된 세포의 세포내에서 높은 효소 활성을 갖는 대안적인 패추롤 신타아제; 및/또는 매우 특이적인, 특히 적어도 특정 조건 하에서, 예컨대 대략 중성 또는 알칼리성 pH에서 및/또는 그것이 생성된 세포의 세포내에서 FPP의 패추롤 다른 패추롤-유사 테르펜으로의 전환을 촉매하는 것과 관련하여, 포고스테몬 카블린 유래 패추롤 신타아제에 비해 특이성이 개선된 대안적인 패추롤 신타아제가 필요하다.

지금까지 알려지지 않은 특정 폴리펩티드는 패추롤 신타아제 활성을 가지며,이 폴리펩티드는 공지된 패추롤 신타아제의 대안으로서 작용할 수 있는 촉매로서 사용될 수 있는 것으로 밝혀졌다. 또한, 이 패추롤 신타아제는 세스퀴테르펜 알코올 포고스톨 및 엘레몰도 생성하는 것으로 밝혀졌다. 엘레몰을 또한 합성하는 패추롤 합성 효소는 지금까지 알려져 있지 않았으며, 이 새로운 패추롤 신타아제의 패추롤 및 엘레몰의 동시 합성은 산업적 패추롤 생산 공정에 특히 유리하다. 엘레몰은 달콤한 나무 냄새가 나는 것으로 설명되었으며, 엘레몰이 풍부한 에센셜 오일 분획 (예를 들어 엘레미 오일(Elemi oil) 및 시트로넬라 오일(Citronella oil))은 향료에서 고정제, 블렌더 또는 개질제로 사용된다 (Ansari & Curtis, J. Soc. Cosmet Chem (1974): 25, 203-231.

따라서, 본 발명은 서열 번호: 4로 나타낸 아미노산 서열을 포함하는 패추롤 신타아제, 또는 이의 기능적 동족체에 관한 것으로, 상기 기능적 동족체는 서열 번호: 4와 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 상기 동족체는 특히 서열 번호: 4와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% or 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 패추롤 신타아제일 수 있다.

본 발명은 또한, 본 발명에 따른 패추롤 신타아제를 인코딩하는 핵산 서열을 포함하거나 상기 인코딩 서열에 상보적인 핵산 서열을 포함하는 핵산에 관한 것이다. 특히, 핵산은 서열 번호: 3 또는 서열 번호: 5로 나타낸 핵산 서열, 및 본 발명에 따른 패추롤 신타아제를 인코딩하는 다른 핵산 서열 (상기 다른 서열은 서열 번호: 3 또는 서열 번호: 5로 나타낸 핵산 서열과 적어도 75%, 특히 of 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함함)을 포함하는 핵산, 또는 이에 각각 상보적인 핵산으로부터 선택될 수 있다. 본 발명에 따른 패추롤 신타아제를 인코딩하는 상기 다른 핵산 서열은 이하 기능적 유사체로 언급될 수 있다.

본 발명에 따른 패추롤 신타아제 또는 핵산은 천연 화합물 또는 이의 천연 공급원 (예를 들어 나르도스타키스 자타만시(Nardostachys jatamansi))으로부터 단리된 화합물의 단편, 화학적으로 또는 효소적으로 합성된 화합물 또는 화합물의 단편 또는 재조합 세포에서 생성된 화합물 또는 화합물의 단편 (이는 재조합 세포에 존재할 수 있거나 재조합 세포로부터 단리될 수 있음)일 수 있다.

본 발명은 또한, 본 발명에 따른 핵산을 포함하는 발현 벡터에 관한 것이다.

본 발명은 또한 숙주 세포에 관한 것으로, 이는 본 발명에 따른 핵산, 바람직하게는 상기 숙주 세포와 이종인 핵산을 포함하는 발현 벡터를 포함하는, 유기체 자체 또는 다세포 유기체의 일부일 수 있다. 숙주 세포는 바람직하게는 박테리아 세포, 진균 세포 (효모 포함) 및 식물 세포의 군으로부터 선택된다.

본 발명은 또한, 본 발명에 따른 패추롤 신타아제의 존재 하에 FPP를 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨로 전환하는 단계를 포함하는, 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨을 제조하는 방법에 관한 것이다. FPP의 4가지 상이한 기하 이성질체, 즉 2E,6E-FPP, 2Z,6E-FPP, 2E,6Z-FPP, 및 2Z,6Z-FPP가 존재할 수 있다. 원칙적으로 FPP의 임의의 다른 이성질체가 본 발명에 따른 효소에 적합한 기질일 수 있지만, 2E,6E-FPP로 양호한 결과가 얻어졌다.

본 발명은 또한, 패추롤 신타아제의 생성을 촉진하는 조건 하에서 본 발명에 따른 숙주 세포를 배양하는 단계, 및 선택적으로, 숙주 세포로부터 패추롤 신타아제를 회수하는 단계를 포함하는, 본 발명에 따른 패추롤 신타아제를 생성하는 방법에 관한 것이다.

본 발명에 따른 패추롤 신타아제는 놀랍게도 패추롤뿐만 아니라 엘레몰을 생성하는 것으로 밝혀졌다. 본 발명 이전에, 패추롤 및 엘레몰 둘 다를 생성하는 테르펜 신타아제는 이용가능하지 않았다. 또한, 본 발명에 따른 패추롤 신타아제는 포고스톨을 생산한다. 따라서, 본 발명에 따른 패추롤 신타아제는 특히 시험관내 분석에서 또는 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨이 본 발명에 따른 패추롤 신타아제 및 포고스테몬 카블린 패추롤 신타아제를 각각 생산하도록 유전자 변형된 숙주 세포의 세포내에서 합성되는 방법에서 중성 pH에서 또는 그 근처에서 예를 들어, 포고스테몬 카블린 유래 패추롤 신타아제에 비해 유리한 생성물 스펙트럼을 갖는다. 따라서, 바람직하게는, 본 발명에 따른 패추롤 신타아제는 바람직하게는 엘레몰 대 패추롤의 비가 1:5 - 1:9, 바람직하게는 1:6 - 1:8, 더 바람직하게는 1:6.5 - 1:7.5, 가장 바람직하게는 약 1:6.9가 되도록 패추롤 및 엘레몰을 생성한다.

바람직하게는, 본 발명에 따른 패추롤 신타아제는 또한, 바람직하게는 포고스톨 대 패추롤 비가 1:4 - 1:7, 바람직하게는 1:4.5 - 1:65, 더 바람직하게는 1:5 - 1.6, 가장 바람직하게는 약 1:5.6가 되도록 포고스톨을 생성한다. 더 바람직하게는, 엘레몰 대 포고스톨의 비는 1:0.7 - 1:2.25, 바람직하게는 1:0.9 - 1:1.75, 더 바람직하게는 1:1.1 - 1:1.5, 가장 바람직하게는 약 1:1.3이다.

본 발명에 따르면, 패추롤 신타아제를 별개의 유기체에서 우수한 수율로 발현시키는 것이 가능하다는 것이 밝혀졌다. 예를 들어, 패추롤 신타아제는 이. 콜라이(E. coli), 로도박터 스패로이데스(Rhodobacter sphaeroides) 및 니코티아나 벤타미아나(Nicotiana benthamiana) 식물에서 잘 발현되는 것으로 밝혀졌다.

따라서, 유리한 구현예에서, 본 발명은 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 제조 방법에 사용될 때, 특히 포고스테몬 카블린 유래 패추롤 신타아제 또는 본원에 인용된 선행 기술에 따른 또 다른 패추롤 신타아제에 비해 패추롤 합성의 촉매 작용에 대한 특이성이 개선되고, 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 생산 속도가 개선된 패추롤 신타아제를 제공한다.

바람직한 구현예에서, 본 발명에 따른 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 제조 방법이 제공되며, 여기서 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨은 상기 패추롤 신타아제를 발현시키는, 본 발명에 따른, 숙주 세포, 식물 또는 식물 배양물, 또는 버섯 또는 버섯 배양물에서 제조된다. 바람직하게는, 본 발명에 따른 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 제조 방법은 또한, 상기 숙주 세포, 식물 또는 식물 배양물, 또는 버섯 또는 버섯 배양물로부터 패추롤, 포고스톨 및/또는 엘레몰을 단리하는 단계를 포함한다. 바람직하게는, 본 발명에 따른 패추롤의 제조 방법은 1:4 - 1:7, 바람직하게는 1:4.5 - 1:65, 더 바람직하게는 1:5 - 1.6, 가장 바람직하게는 약 1:5.6의 포고스톨 대 패추롤 비, 1:5 - 1:9, 바람직하게는 1:6 - 1:8, 더 바람직하게는 1:6.5 - 1:7.5 가장 바람직하게는 약 1:6.9의 엘레몰 대 패추롤 비, 및/또는 1:0.7 - 1:2.25, 바람직하게는 1:0.9 - 1:1.75, 더 바람직하게는 1:1.1 - 1:1.5, 가장 바람직하게는 약 1:1.3의 엘레몰 대 포고스톨 비를 초래한다.

이론에 결부되지 않고, 중성 또는 약 알칼리성 pH에서 패추롤 합성의 촉매 작용에 대한 높은 특이성은 다양한 숙주 세포가 중성 또는 약 알칼리성 세포내 pH, 예컨대 pH 7.0-8.5를 갖는 것으로 생각되기 때문에 패추롤이 세포내에서 제조되는 방법에 특히 바람직한 것으로 간주되는 것으로 생각된다 (박테리아의 세포내 pH 값에 대해서는, 예를 들어 하기를 참조한다: Booth, Microbiological Reviews (1985) 49: 359-378). 예를 들어, 이. 콜라이 세포가 5.5 내지 8.0 범위의 pH 값에 노출될 때, 세포내 pH는 7.1 내지 7.9였다 (Olsen 등, Appl. Environ. Microbiol. (2002) 68: 4145-4147). 이것은 또한 세포내에서 본 발명에 따른 패추롤 신타아제의 패추롤 합성에 대한 개선된 특이성을 설명할 수 있다.

본원에 사용된 용어 "또는"은 달리 명시되지 않는 한 "및/또는"으로 정의된다.

본원에 사용된 용어 "a" 또는 "an"은 달리 명시되지 않는 한 "적어도 하나"로 정의된다.

명사 (예를 들어, 화합물, 첨가제 등)가 단수로 언급될 경우, 복수를 포함하는 것으로 의도된다.

본원에 상호교환적으로 사용된 용어 파르네실 디포스페이트 및 파르네실피로포스페이트 (둘 다 FPP로 약칭됨)는 화합물 3,7,11-트리메틸-2,6,10-도데카트리엔-1-일 피로포스페이트를 지칭하며, 이 화합물의 모든 공지된 이성질체를 포함한다.

본원에 사용된 재조합 세포, 벡터, 핵산 등과 관련하여 용어 "재조합"은 세포, 벡터, 핵산 등에서 자연적으로 발생하지 않고/않거나 동일한 위치에서 자연적으로 발생하지 않는 핵산을 함유하는 세포, 벡터, 핵산 등을 지칭한다. 일반적으로, 상기 핵산은 재조합 DNA 기술을 사용하여 균주 (세포)에 도입되었다.

핵산 (DNA 또는 RNA) 또는 단백질에 대해 사용될 때 용어 "이종"은 그것이 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 자연적으로 발생하지 않거나 또는 자연에서 발견된 것과는 다른 세포, 또는 게놈 또는 DNA 또는 RNA 서열의 위치 또는 위치들에서 발견되는 핵산 또는 단백질을 지칭한다. 이종 핵산 또는 단백질은 이들이 도입되는 세포에 대해 내인성이지 않지만, 또 다른 세포로부터 수득되거나 합성적으로 또는 재조합적으로 생성되었다. 일반적으로, 반드시 그런 것은 아니지만, 그와 같은 핵산은 DNA가 발현되는 세포에 의해 정상적으로 생성되지 않는 단백질을 인코딩한다.

특정 숙주 세포에 내인성이지 않지만, 예를 들어, DNA 셔플링(DNA shuffling)을 사용하여 이의 천연 형태로부터 변형된 유전자를 이종이라고도 한다. 용어 "이종"은 또한 자연 발생 DNA 서열의 비-자연 발생 다중 카피를 포함한다. 따라서, 용어 "이종"은 세포에 대해 이질적 또는 이종성이거나, 또는 세포와 상동성이지만, 세그먼트가 통상적으로 발견되지 않는 숙주 세포 핵산 내의 위치 및/또는 번호에 있는 DNA 세그먼트를 지칭할 수 있다. 외인성 DNA 세그먼트는 외인성 폴리펩티드를 생성하도록 발현된다. "상동성" DNA 서열은 그것이 도입되는 숙주 세포와 자연적으로 연관된 DNA 서열이다.

당업자가 그것이 발현되는 세포에 대해 이종성 또는 이질적인 것으로 인식할 수 있는 임의의 핵산 또는 단백질은 본원에서 용어 이종 핵산 또는 단백질에 포함된다.

단백질 또는 폴리펩티드와 관련하여 본원에 사용된 용어 "돌연변이된" 또는 "돌연변이"는 야생형 또는 자연 발생 단백질 또는 폴리펩티드 서열에서 적어도 하나의 아미노산이 상이한 아미노산으로 대체되거나, 또는 이들 아미노산을 인코딩하는 핵산의 돌연변이유발을 통해 서열로부터 결실되거나 서열 내로 삽입되었음을 의미한다. 돌연변이유발은 당해 분야에 잘 알려진 방법이며, 예를 들어, PCR 또는 하기에 기재된 바와 같이 올리고뉴클레오티드-매개 돌연변이유발을 통한 부위 특이적 돌연변이유발을 포함한다: Sambrook, J., and Russell, D.W. Molecular Cloning: A Laboratory Manual.3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (2001). 유전자와 관련하여 본원에 사용된 용어 "돌연변이된" 또는 "돌연변이"는 상기 유전자의 뉴클레오티드 서열 또는 이의 조절 서열에서 적어도 하나의 뉴클레오티드가 상이한 뉴클레오티드로 대체되거나 돌연변이유발을 통해 서열로부터 결실되거나 서열 내로 삽입된 것을 의미한다.

용어 "오픈 리딩 프레임(open reading frame)" 및 "ORF"는 코딩 서열의 번역 개시 및 종료 코돈 사이에 인코딩된 아미노산 서열을 지칭한다. 용어 "개시 코돈" 및 "종료 코돈"은 각각 단백질 합성 (mRNA 번역)의 개시 및 사슬 종결을 특정하는 코딩 서열에서 3개의 인접한 뉴클레오티드의 단위 ('코돈')를 지칭한다.

용어 "유전자"는 생물학적 기능과 관련된 핵산의 임의의 세그먼트를 지칭하는데 널리 사용된다. 따라서, 유전자는 이의 발현에 필요한 코딩 서열 및/또는 조절 서열을 포함한다. 예를 들어, 유전자는 mRNA 또는 기능적 RNA를 발현시키거나 특정 단백질을 인코딩하고, 조절 서열을 포함하는 핵산 단편을 지칭한다. 유전자는 또한, 예를 들어, 다른 단백질에 대한 인식 서열을 형성하는 미발현 DNA 세그먼트를 포함한다. 유전자는 관심있는 공급원으로부터의 클로닝 또는 공지되거나 예측된 서열 정보로부터의 합성을 포함하여 다양한 출처로부터 수득될 수 있으며, 원하는 파라미터를 갖도록 설계된 서열을 포함할 수 있다.

용어 "키메라 유전자"는 1) 자연에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는 DNA 서열, 또는 2) 자연적으로 인접하지 않은 단백질의 일부를 인코딩하는 서열, 또는 3) 자연적으로 인접하지 않은 프로모터의 일부를 함유하는 임의의 유전자를 지칭한다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코팅 서열을 포함하거나, 또는 동일한 공급원으로부터 유래되지만 자연에서 발견되는 것과 상이한 방식으로 배열되는 조절 서열 및 코딩 서열을 포함할 수 있다.

본원에 사용된 트랜스제닉 세포 또는 유기체에 대한 용어 "트랜스제닉"은 유기체 또는 세포에서 자연적으로 발생하지 않는 핵산을 함유하고, 재조합 DNA 기술을 사용하여 핵산이 유기체 또는 세포에 도입된 (즉, 유기체 또는 세포 자체 또는 유기체의 조상 또는 세포가 분리된 유기체의 조상 유기체에 도입된) 유기체 또는 세포 (상기 세포는 유기체 자체이거나, 또는 그것이 단리된 다세포 유기체의 세포일 수 있음)를 지칭한다.

"전이유전자(transgene)"는 형질전환에 의해 게놈에 도입되고 바람직하게는 안정적으로 유지되는 유전자를 지칭한다. 전이유전자는, 예를 들어, 형질전환될 특정 식물의 유전자에 이종성 또는 상동성인 유전자를 포함할 수 있다. 추가로, 전이유전자는 비-천연 유기체에 삽입된 천연 유전자, 또는 키메라 유전자를 포함할 수 있다. 용어 "내인성 유전자"는 유기체의 게놈에서 이의 자연적 위치에 있는 천연 유전자를 지칭한다. "이질적" 유전자는 숙주 유기체에서 정상적으로 발견되지 않지만 유전자 전달에 의해 도입되는 유전자를 지칭한다.

본원에 사용된 "형질전환" 및 "형질전환하는"은 삽입에 사용된 방법, 예를 들어, 직접 흡수, 형질도입, 접합, f-메이팅 또는 전기천공법에 관계없이 이종성 뉴클레오티드 서열의 숙주 세포로의 도입을 지칭한다. 외인성 폴리뉴클레오티드는 비-통합 벡터, 예를 들어, 플라스미드로서 유지될 수 있거나, 대안적으로 숙주 세포 게놈에 통합될 수 있다.

"코딩 서열"은 특정 아미노산 서열을 코딩하고 비-코딩 서열을 배제하는 DNA 또는 RNA 서열을 지칭한다. 이는 "중단되지 않은 코딩 서열", 즉 cDNA에서와 같이 인트론이 결여된 코딩 서열을 구성할 수 있거나 적절한 스플라이스 접합에 의해 결합된 하나 이상의 인트론을 포함할 수 있다. "인트론"은 1차 전사체에 함유되지만 단백질로 번역될 수 있는 성숙한 mRNA를 생성하기 위해 세포 내에서 RNA의 절단 및 재연결을 통해 제거되는 RNA의 서열이다.

"조절 서열"은 코딩 서열의 업스트림 (5' 비-코딩 서열), 내부 또는 다운스트림 (3' 비-코딩 서열)에 위치하고, 전사, RNA 프로세싱 또는 안정성, 또는 관련된 코딩 서열의 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 인핸서, 프로모터, 번역 리더 서열, 인트론, 및 폴리아데닐화 신호 서열을 포함한다. 이들은 천연 및 합성 서열뿐만 아니라 합성 및 천연 서열의 조합일 수 있는 서열을 포함한다. 상기 언급된 바와 같이, 용어 "적합한 조절 서열"은 프로모터에 제한되지 않는다.

조절 서열의 예는 프로모터 (예컨대 전사 프로모터, 구성 프로모터, 유도성 프로모터), 작동유전자(operator), 또는 인핸서, mRNA 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 적절한 서열을 포함한다. 핵산 서열은 조절 서열이 본 발명의 cDNA 서열과 기능적으로 관련될 때 "작동가능하게 연결"된다.

조절 서열 각각은 이종 및 상동성 조절 서열로부터 독립적으로 선택될 수 있다.

"프로모터"는 RNA 폴리머라제 및 적절한 전사에 필요한 다른 인자에 대한 인식을 제공함으로써 상기 코딩 서열의 발현을 제어하는 뉴클레오티드 서열, 일반적으로 이의 코딩 서열의 업스트림 (5')의 뉴클레오티드 서열을 지칭한다. "프로모터"는 TATA 박스로 구성된 짧은 DNA 서열 및 전사 개시 부위를 특정하는 역할을 하는 다른 서열인 최소 프로모터를 포함하며, 여기에는 조절 요소가 발현의 제어를 위해 첨가된다. "프로모터"는 또한, 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 조절 요소와 최소 프로모터를 포함하는 뉴클레오티드 서열을 지칭한다. 이러한 유형의 프로모터 서열은 근위 및 보다 원위의 업스트림 요소로 구성되며, 후자의 요소는 종종 인핸서로 지칭된다. 따라서, "인핸서"는 프로모터 활성을 자극할 수 있고, 프로모터의 선천적 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종 요소일 수 있는 DNA 서열이다. 이는 두 방향 (정방향 또는 역방향)으로 작동할 수 있으며, 프로모터로부터 업스트림 또는 다운스트림으로 이동할 때에도 기능할 수 있다. 인핸서 및 다른 업스트림 프로모터 요소 둘 다는 이들의 효과를 매개하는 서열-특이적 DNA- 결합 단백질에 결합한다. 프로모터는 천연 유전자로부터 온전히 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래된 상이한 요소로 구성되거나, 심지어 합성 DNA 세그먼트로 구성될 수 있다. 프로모터는 또한, 생리적 또는 발달 조건에 반응하여 전사 개시의 효과를 제어하는 단백질 인자의 결합에 관여하는 DNA 서열을 함유할 수 있다.

본원에 사용된 용어 "핵산"은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 폴리머, 즉 단일 또는 이중 가닥 형태의 폴리뉴클레오티드에 대한 언급을 포함하며, 달리 제한되지 않는 한, 이들은 자연 발생 뉴클레오티드 (예를 들어, 펩티드 핵산)와 유사한 방식으로 단일 가닥 핵산에 혼성화한다는 점에서 천연 뉴클레오티드의 필수 성질을 갖는 공지된 유사체를 포함한다. 폴리뉴클레오티드는 고유 또는 이종 구조적 또는 조절 유전자의 전장 또는 하위 서열일 수 있다. 달리 지시되지 않는 한, 상기 용어는 명시된 서열뿐만 아니라 이의 상보적 서열에 대한 언급을 포함한다. 따라서, 안정성 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 용어가 본원에서 의도된 바와 같은 "폴리뉴클레오티드"이다. 더욱이, 단지 두 가지 예를 들자면, 이노신과 같은 특이한 염기, 또는 트리틸화된 염기와 같은 변형된 염기를 포함하는 DNA 또는 RNA는 용어가 본원에 사용된 바와 같이 "폴리뉴클레오티드"이다. 당업자에게 공지된 많은 유용한 목적을 제공하는 DNA 및 RNA에 대한 매우 다양한 변형이 이루어진 것으로 이해될 것이다. 본원에 사용된 용어 "폴리뉴클레오티드"는 그와 같은 화학적으로, 효소적으로 또는 대사적으로 변형된 형태의 폴리뉴클레오티드뿐만 아니라 무엇보다도, 단순 및 복합 세포를 포함하여, 바이러스 및 세포에 특유한 DNA 및 RNA의 화학적 형태를 포함한다.

또한, 유전 암호를 참조하여 폴리펩티드를 인코딩하는 본원의 모든 핵산 서열은 핵산의 모든 가능한 침묵 변이를 기술한다. 용어 "보존적으로 변형된 변이체"는 아미노산 및 핵산 서열 모두에 적용된다. 특정 핵산 서열과 관련하여, 용어 "보존적으로 변형된 변이체"는 유전 암호의 퇴화로 인해 아미노산 서열의 동일하거나 보존적으로 변형된 변이체를 인코딩하는 핵산을 지칭한다. 용어 "유전 암호의 퇴화"는 기능적으로 동일한 다수의 핵산이 임의의 주어진 단백질을 인코딩한다는 사실을 지칭한다. 예를 들어, 코돈 GCA, GCC, GCG 및 GCU 모두는 아미노산 알라닌을 인코딩한다. 따라서, 알라닌이 코돈으로 지정된 모든 위치에서, 코돈은 인코딩된 폴리펩티드를 변경하지 않고 기재된 상응하는 코돈 중 어느 것으로 변경될 수 있다. 그와 같은 핵산 변이는 "침묵 변이(silent variation)"이며 보존적으로 변형된 변이의 한 종을 나타낸다. "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 폴리머를 지칭하기 위해 본원에 상호교환적으로 사용된다. 상기 용어는 자연 발생 아미노산 폴리머뿐만 아니라 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학 유사체인 아미노산 폴리머에 적용된다. 그와 같은 자연 발생 아미노산 유사체의 본질적인 특성은, 단백질로 혼입될 때, 단백질이 동일 단백질로 유도되지만 완전히 자연 발생 아미노산으로 구성된 항체에 특이적으로 반응한다는 것이다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 또한, 비제한적으로, 글리코실화, 지질 부착, 황화, 글루탐산 잔기의 감마-카복실화, 하이드록실화 및 ADP-리보실화를 포함하는 변형을 포함한다.

본 출원의 맥락 내에서, 올리고머 (예컨대, 올리고뉴클레오티드, 올리고펩티드)는 폴리머 군의 종으로 간주된다. 올리고머는 비교적 적은 수의 모노머 단위, 일반적으로 2-100, 특히 6-100개의 모노머 단위를 갖는다.

본원에 사용된 "발현 카세트"는 종결 신호에 작동 가능하게 연결된 관심 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는, 적절한 숙주 세포에서 특정 뉴클레오티드 서열의 발현을 지시할 수 있는 DNA 서열을 의미한다. 이는 또한 전형적으로 뉴클레오티드 서열의 적절한 번역에 필요한 서열을 포함한다. 코딩 영역은 일반적으로 관심있는 단백질을 코딩하지만 센스 또는 안티센스 방향으로 관심있는 기능성 RNA, 예를 들어 안티센스 RNA 또는 비번역 RNA를 코딩할 수도 있다. 관심 뉴클레오티드 서열을 포함하는 발현 카세트는 키메라성일 수 있는데, 이는 그 성분 중 적어도 하나가 이의 다른 성분 중 적어도 하나에 대해 이종임을 의미한다. 발현 카세트는 또한 자연적으로 발생하지만 이종 발현에 유용한 재조합 형태로 수득된 것일 수 있다. 발현 카세트에서 뉴클레오티드 서열의 발현은 숙주 세포가 특정 외부 자극에 노출될 때만 전사를 개시하는 구성적 프로모터 또는 유도성 프로모터의 제어 하에 있을 수 있다. 다세포 유기체의 경우, 프로모터는 또한 특정 조직 또는 기관 또는 발달 단계에 특이적일 수 있다.

본원에 사용된 용어 "벡터"는 표적 세포의 형질전환을 지시하도록 설계된 유전 물질로 구성된 구조물을 지칭한다. 벡터는 위치 및 순차적으로 배향된, 즉 핵산 카세트 내의 핵산이 형질전환된 세포에서 전사될 수 있고, 필요한 경우, 번역될 수 있도록 다른 필요한 요소와 작동적으로 연결된 다수의 유전 요소를 함유한다.

특히, 벡터는 바이러스 벡터 (박테리오)파지, 코스미드 및 플라스미드의 군으로부터 선택될 수 있다. 벡터는 또한 효모 인공 염색체 (YAC), 박테리아 인공 염색체 (BAC) 또는 아그로박테리움 이원 벡터일 수 있다. 벡터는 자가 전달성 또는 이동성일 수 있거나 아닐 수 있고, 세포 게놈 내로의 통합에 의해 원핵 또는 진핵 숙주를 형질전환시키거나 염색체외로 (예를 들어, 복제 기원을 갖는 자율 복제 플라스미드) 존재할 수 있는 이중 또는 단일 가닥 선형 또는 원형 형태일 수 있다. 구체적으로, 방선균 및 관련 종, 박테리아 및 진핵 생물 (예를 들어, 고등 식물, 포유동물, 효모 또는 진균 세포)로부터 선택될 수 있는, 2개의 상이한 숙주 유기체에서 자연적으로 또는 의도적으로 복제할 수 있는 DNA 비히클을 의미하는 셔틀 벡터가 포함된다. 바람직하게는 벡터 내의 핵산은 미생물, 예를 들어, 박테리아 또는 식물 세포와 같은 숙주 세포에서 전사시키기 위한 적절한 프로모터 또는 다른 조절 요소의 제어 하에 있고, 이에 작동 가능하게 연결되어 있다. 벡터는 다수의 숙주에서 기능하는 이작용성 발현 벡터일 수 있다. 게놈 DNA의 경우, 이것은 자체의 프로모터 또는 다른 조절 요소를 함유할 수 있고, cDNA의 경우, 이것은 숙주 세포에서의 발현을 위한 적절한 프로모터 또는 다른 조절 요소의 제어 하에 있을 수 있다.

본 발명에 따른 다중핵산을 함유하는 벡터는 그 자체로 당해 분야에 공지된 방법론에 기초하여 제조될 수 있다. 예를 들어 전사 또는 번역 조절 핵산 서열과 같은 적합한 조절 요소에 작동 가능하게 연결된 본 발명에 따른 폴리펩티드를 인코딩하는 cDNA 서열이 사용될 수 있다.

본원에 사용된 용어 "벡터"는 표준 클로닝 작업을 위한 벡터 ("클로닝 벡터")뿐만 아니라 (상염색체) 발현 벡터 및 숙주 세포의 염색체로의 통합에 사용되는 클로닝 벡터 ("통합 벡터")와 같은 보다 특수화된 유형의 벡터에 대한 언급을 포함한다.

"클로닝 벡터"는 전형적으로 벡터의 필수 생물학적 기능의 손실 없이 외래 DNA 서열이 결정 가능한 방식으로 삽입될 수 있는 하나 또는 소수의 제한 엔도뉴클레아제 인식 부위, 뿐만 아니라 클로닝 벡터로 형질전환된 세포의 식별 및 선택에 사용하기에 적합한 마커 유전자를 포함한다.

용어 "발현 벡터"는 이의 전사를 제공하는 추가 핵산 세그먼트의 제어 하에 (즉, 작동 가능하게 연결된) 관심 폴리펩티드를 인코딩하는 세그먼트를 포함하는 선형 또는 원형의 DNA 분자를 지칭한다. 그와 같은 추가 세그먼트는 프로모터 및 터미네이터 서열을 포함할 수 있고, 하나 이상의 복제 기원, 하나 이상의 선택 가능한 마커, 인핸서, 폴리아데닐화 신호 등을 선택적으로 포함할 수 있다. 발현 벡터는 일반적으로 플라스미드 또는 바이러스 DNA로부터 유래되거나, 또는 둘 다의 요소를 함유할 수 있다. 특히, 발현 벡터는 5' 내지 3' 방향으로 하기를 포함하고 작동 가능하게 연결된 뉴클레오티드 서열을 포함한다: (a) 숙주 유기체에 의해 인식되는 전사 및 번역 개시 영역, (b) 관심 폴리펩티드에 대한 코딩 서열, 및 (c) 숙주 유기체에 의해 인식되는 전사 및 번역 종결 영역. "플라스미드"는 미생물의 게놈에 통합되지 않고 일반적으로 자연에서 원형인 염색체외 DNA를 자율적으로 복제하는 것을 지칭한다.

"통합 벡터"는 미생물 게놈에 통합될 수 있고 관심 폴리펩티드를 인코딩하는 유전자의 안정적인 유전을 제공하는 선형 또는 원형의 DNA 분자를 지칭한다. 통합 벡터는 일반적으로 이의 전사를 제공하는 추가 핵산 세그먼트의 제어 하에 (즉, 작동 가능하게 연결된) 관심 폴리펩티드를 인코딩하는 유전자 서열을 포함하는 하나 이상의 세그먼트를 포함한다. 그와 같은 추가의 세그먼트는 프로모터 및 터미네이터 서열, 및 일반적으로 상동 재조합 과정에 의해 관심 유전자의 표적 세포의 게놈 내로의 통합을 유도하는 하나 이상의 세그먼트를 포함할 수 있다. 전형적으로, 통합 벡터는 표적 세포로 전달될 수 있지만, 그 유기체에서 기능하지 않는 레플리콘을 갖는 것일 수 있다. 적절한 마커가 관심 유전자를 포함하는 세그먼트 내에 포함되는 경우, 상기 세그먼트의 통합이 선택될 수 있다.

본원에 사용된 용어 "작동 가능하게 연결된" 또는 "작동적으로 연결된"은 기재된 성분이 의도된 방식으로 기능하도록 하는 관계에 있는 병렬 배치된 것을 의미한다. 또 다른 제어 서열 및/또는 코딩 서열에 "작동 가능하게 연결된" 제어 서열은 코딩 서열의 전사 및/또는 발현이 제어 서열과 양립되는 조건 하에서 달성되는 방식으로 결찰된다. 일반적으로, 작동 가능하게 연결된 것은 연결되는 핵산 서열이 인접하고, 필요한 경우 두 개의 단백질 코딩 영역에 연결하기 위해, 인접하고 동일한 리딩 프레임에 있음을 의미한다.

용어 "패추롤 신타아제"는 패추롤, 및 바람직하게는 또한 패추롤-유사 테르펜 예를 들어 엘레몰 또는 포고스톨의 형성에서 촉매 활성을 갖는 폴리펩티드, 및 그와 같은 폴리펩티드를 포함하는 다른 모이어티에 대해 본원에서 사용된다. 그와 같은 다른 모이어티의 예는 하나 이상의 다른 폴리펩티드와 상기 폴리펩티드의 복합체, 펩티드 또는 단백질 태그 서열에 융합된 패추롤 신타아제 폴리펩티드를 포함하는 융합 단백질, 상기 폴리펩티드의 다른 복합체 (예를 들어, 금속단백질 복합체), 상기 폴리펩티드 및 또 다른 유기 모이어티를 포함하는 거대분자 화합물, 지지체 물질에 결합된 상기 폴리펩티드 등을 포함한다. 패추롤 신타아제는 자연 환경, 즉 그것이 생산된 세포 내에서, 또는 그것을 생산하는 세포에 의해 분비된 배지 내에서 제공될 수 있다. 또한, 폴리펩티드를 생산한 공급원으로부터 분리되어 제공될 수 있고, 라벨링 모이어티 등으로 라벨링된 담체에 부착함으로써 조작될 수 있다.

본원에서 사용된 용어 서열의 "기능적 동족체" 또는 간단히 "동족체"는 하나 이상의 아미노산이 치환, 결실, 첨가 및/또는 삽입된다는 단서 하에 상기 특정 서열을 포함하는 폴리펩티드를 지칭하는데, 상기 폴리펩티드는 용어 "기능적 동족체", 즉 파르네실 디포스페이트로부터의 패추롤의 형성에서 촉매 활성을 갖는 서열 번호: 4를 갖는 서열의 동족체가 효소로 사용되는 경우에 기질 전환에 대해 (정성적으로) 동일한 효소 기능성을 갖는다. 예로, 폴리펩티드 또는 폴리펩티드를 포함하는 모이어티가 패추롤 신타아제인지를 확인하기에 적합한 시험 ("패추롤 신타아제 활성 시험")이 설명된다. 더욱이, 숙련가는 본 발명에 포함된 등가 뉴클레오티드 서열이 본 발명의 청구범위의 일반적인 범위 내에 있는 뉴클레오티드 서열과, 낮은, 중간 및/또는 엄격한 조건 하에서, 혼성화하는 능력에 의해 정의될 수 있음을 인식한다.

본 발명에 따른 서열 번호: 4에 대한 바람직한 동족체는 1:4 - 1:7, 바람직하게는 1:4.5 - 1:65, 더 바람직하게는 1:5 - 1.6, 가장 바람직하게는 약 1:5.6의 포고스톨 대 패추롤 몰비, 1:5 - 1:9, 바람직하게는 1:6 - 1:8, 더 바람직하게는 1:6.5 - 1:7.5, 가장 바람직하게는 약 1:6.9의 엘레몰 대 패추롤 비, 및/또는 1:0.7 - 1:2.25, 바람직하게는 1:0.9 - 1:1.75, 더 바람직하게는 1:1.1 - 1:1.5, 가장 바람직하게는 약 1:1.3의 엘레몰 대 포고스톨 비로 표현되는, 패추롤 형성의 촉매에 대한 특이성을 갖는다.

서열 동일성 또는 유사성은 본원에서 이들 서열을 비교함으로써 결정되는 2개 이상의 폴리펩티드 서열 또는 2개 이상의 핵산 서열 사이의 관계로서 정의된다. 일반적으로, 서열 동일성 또는 유사성은 서열의 전체 길이에 대해 비교되지만, 또한 서로 정렬되는 서열의 일부에 대해서만 비교될 수 있다. 당해 분야에서, "동일성" 또는 "유사성"은 또한, 경우에 따라, 그와 같은 서열들 간의 일치에 의해 결정되는 바와 같이, 폴리펩티드 서열 또는 핵산 서열 사이의 서열 관련성의 정도를 의미한다. 본원에 사용된 서열 동일성은, 예를 들어 유럽 생물정보학 연구소의 서버 (www.ebi.ac.uk/Tools/emboss/align/)의 EMBOSS 페어와이즈 정렬 알고리즘 "니들(Needle)"에 의해 결정된 값이다. 아미노산 서열의 정렬을 위한 디폴트 파라미터는 다음과 같다: 매트릭스 = Blosum62; 오픈 갭 페널티(Open Gap Penalty) = 10.0; 갭 확장 페널티 = 0.5. 핵산 서열의 정렬을 위해 디폴트 파라미터는 다음과 같다: 매트릭스 = DNAfull; 오픈 갭 페널티 = 10.0; 갭 확장 페널티 = 0.5.

서열 번호: 4에 따른 패추롤 신타아제 또는 서열 번호: 3 또는 서열 번호: 5에 따른 핵산과 상기 패추롤 신타아제의 기능적 동족체 사이의 불일치는 특히, 당업자에게 공지된 생물학적 기술, 예를 들어, 분자 진화 또는 합리적인 디자인에 의해, 또는 당해 분야에 공지된 돌연변이유발 기술 (랜덤 돌연변이유발, 부위-특이적 돌연변이유발, 유도 진화, 유전자 재조합 등)을 사용하여 패추롤 신타아제 또는 다중핵산의 특성을 개선 (예를 들어, 발현을 개선)시키도록 수행된 변형의 결과일 수 있다. 패추롤 신타아제의 아미노산 서열 또는 코딩 핵산 서열은 하나 이상의 자연 발생 변이의 결과로서 각각 서열 번호: 4 및 서열 번호: 3 또는 서열 번호: 5의 서열과 비교하여 변경될 수 있다. 그와 같은 자연 변형/변이의 예는 글리코실화의 차이 (보다 광범위하게 "번역후 변형"으로 정의됨), 대안적 스플라이싱으로 인한 차이, 및 단일-핵산 다형성 (SNP)이다. 핵산은 서열 번호: 4의 폴리펩티드와 적어도 하나의 아미노산이 상이한 폴리펩티드를 인코딩하도록 변형될 수 있어서, 서열 번호: 4와 비교하여 하나 이상의 아미노산 치환, 결실 및/또는 삽입을 포함하는 폴리펩티드를 암호화하며, 상기 폴리펩티드는 여전히 서열 번호: 4의 것과 본질적으로 동일한 패추롤 신타아제 활성을 갖는다. 또한, 예를 들어 WO 2008/000632에 기재되거나 DNA2.0, Geneart, 및 GenScript와 같은 상업적 DNA 합성 회사에 의해 제공되는 방법에 기반한 코돈 최적화 또는 코돈 쌍 최적화가 사용될 수 있다. 하나의 코돈 최적화된 서열의 예는 서열 번호: 5이다.

본 발명의 폴리펩티드와 자연적으로 관련되지 않은 적절한 신호 펩티드를 인코딩하는 하나 이상의 서열은 (발현) 벡터에 통합될 수 있다. 예를 들어, 신호 펩티드 리더에 대한 DNA 서열은 본 발명의 핵산 서열에 인프레임 융합되어 본 발명의 폴리펩티드가 신호 펩티드를 포함하는 융합 단백질로서 초기에 번역될 수 있다. 신호 펩티드의 성질에 따라, 발현된 폴리펩티드는 다르게 표적화될 것이다. 의도된 숙주 세포에서 기능하는 분비 신호 펩티드는, 예를 들어, 발현된 폴리펩티드의 세포외 분비를 향상시킨다. 다른 신호 펩티드는 발현된 폴리펩티드를 엽록체, 미토콘드리아 및 퍼옥시좀과 같은 특정 소기관으로 유도한다. 신호 펩티드는 의도된 소기관으로 또는 세포로부터 수송될 때 폴리펩티드로부터 절단될 수 있다. 서열 번호: 4에 따른 폴리펩티드 또는 이의 동족체의 아미노 또는 카복실 말단에서 추가의 펩티드 서열의 융합체를 제공할 수 있다.

상기 언급된 바와 같이, 본 발명은 또한 본 발명에 따른 벡터를 포함하는 숙주 세포에 관한 것이다. "숙주 세포"는 벡터를 함유하고 벡터의 복제 및/또는 발현을 지원하는 세포를 의미한다.

본 발명의 핵산은 본 발명의 숙주 세포에 이종성이다. 숙주 세포는 원핵 세포, 진핵 세포 또는 고세균(Archaea)의 구성원으로부터의 세포일 수 있다. 숙주 세포는 임의의 유기체, 특히 임의의 비-인간 유기체로부터 유래될 수 있다. 특히, 숙주 세포는 박테리아 세포, 진균 세포, 고세균, 원생생물, 식물 세포 (조류 포함), 동물 유래 (특히 상기 동물로부터 단리된) 세포로부터 선택될 수 있다. 숙주 세포는 (서열 번호: 4의 패추롤 신타아제의 경우에 나르도스타키스 자타만시와 같이) 효소가 자연적으로 유래하는 유기체 또는 인간 이외의 다세포 유기체의 일부를 형성할 수 있다. 특정 구현예에서, 본 발명의 숙주 세포는 다세포 유기체로부터 기원하지만 이로부터 단리된 세포의 배양물에 존재한다.

일반적으로, 숙주 세포는 보편적인 이소프레노이드 빌딩 블록인, C5 프레닐 디포스페이트 이소펜테닐 디포스페이트 (IPP) 및 디메틸알릴 디포스페이트 (DMAPP)의 생산을 가능하게 하는 메발로네이트 경로 또는 또 다른 대사 경로 (예컨대 데옥시자일룰로스-5-포스페이트 (DXP) 경로)의 반응 단계를 촉매하기 위한 효소를 발현하기 위한 유전자를 포함하는 단리된 세포이다. 알기로는, 특정 유전자가 녹아웃(knock-out)되지 않는 한, 모든 알려진 유기체는 그와 같은 경로를 포함한다. 진핵생물은 일반적으로 메발로네이트 경로를 통해 IPP를 자연적으로 제조할 수 있다. 이어서, 이 IPP는 효소 이소펜테닐 디포스페이트 이소머라아제 (Idi)의 작용에 의해 DMAPP로 이성질화된다. IPP 및 DMAPP를 5:1 비율로 제공하는 DXP 경로는 원핵생물에 공통적이지만, 일부 원핵생물은 메발로네이트 경로를 통해 IPP를 자연적으로 제조할 수 있다. 이들 경로는 당해 분야에 공지되어 있으며, 예를 들어, 하기에 기재되었다: Withers & Keasling in Appl. Microbiol. Biotechnol. (2007) 73: 980-990. 이들 경로의 유전자는 각각 독립적으로 세포에 대해 상동성 또는 이종성일 수 있다.

숙주 세포는 또한, 내생적으로 또는 이종 공급원으로부터 더 긴 프레닐 디포스페이트를 생성하는 C5 프레닐 디포스페이트의 헤드-투-테일 축합을 촉매하는 프레닐 트랜스퍼라제 활성을 갖는 효소를 발현하기 위한 하나 이상의 유전자를 포함할 것이다. 예를 들어, 보편적인 세스퀴테르펜 전구체 파르네실 디포스페이트 (FPP)는 2 분자의 IPP의 1 분자의 DMAPP로의 연속적인 헤드-투-테일 첨가를 통한 이들 효소의 작용에 의해 형성된다.

일 구현예에서, 숙주 세포는 박테리아이다. 박테리아는 그램-양성 또는 그램-음성일 수 있다. 그램-양성 박테리아는 바실러스(Bacillus), 락토바실러스(Lactobacillus), 및 코리네박테리움 종(Corynebacterium spp)의 속으로부터, 특히 바실러스 서브틸리스(Bacillus subtilis), 락토바실러스 카세이(Lactobacillus casei), 및 코르니네박테리움 글루타미쿰(corn ynebacterium glutamicum)의 종으로부터 선택될 수 있다.

바람직한 구현예에서, 박테리아는 그램-음성 박테리아의 군, 특히 로도박터(Rhodobacter), 파라코쿠스(Paracoccus) 및 에스케리키아(Escherichia)의 군, 더 특히 로도박터 캅술라투스(Rhodobacter capsulatus), 로도박터 스패로이데스, 파라코쿠스 카로티니파시엔스(Paracoccus carotinifaciens), 파라코쿠스 제아잔티니파 시엔스(Paracoccus zeaxanthinifaciens) 및 에스케리키아 콜라이(Escherichia coli)의 군으로부터 선택된다. 로도박터 스패로이데스는 IPP 및 DMAPP의 세포내 생산을 가능하게 하는 DXP 경로의 다양한 반응 단계를 촉매하는 효소를 발현시키는데 필요한 모든 유전자를 자연적으로 함유하는 유기체의 예이며, 특히 바람직한 것이다.

바람직한 구현예에서, 숙주 세포는 진균 세포, 특히 아스퍼길러스(Aspergillus), 블라케슬레아(Blakeslea), 페니실리움(Penicillium), 파피아(Phaffia) (크산토필로마이세스(Xanthophyllomyces)), 피치아(Pichia), 사카로마이세스(Saccharomyces) 및 야로위아(Yarrowia)의 군, 더 특히 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 니게르(Aspergillus niger), 아스퍼길러 스 오리재(Aspergillus oryzae), 블라케슬레아 트리스포라(Blakeslea trispora), 페니실리움 크리소게눔(Penicillium chrysogenum), 파피아 로도지마(Phaffia rhodozyma) (크산토필로마이세스 덴드로로우스(Xanthophyllomyces dendrorhous)), 피치아 파스토리스(Pichia pastoris), 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 및 야로위아 리폴리티카(Yarrowia lipolytica)의 군으로부터 선택된 진균 세포이다.

식물 세포 및 곤충 세포와 같은 동물 세포 또는 마우스, 랫트 또는 인간의 세포와 같은 고등 진핵 생물로부터 유래된 세포에서 본 발명의 핵산을 발현시키는 것이 또한 가능하다. 상기 세포는 세포 또는 조직 배양물에서 유지될 수 있고, 패추롤 신타아제의 시험관내 생산에 사용될 수 있다.

본 발명에 따른 숙주 세포를 포함하는 다세포 유기체는 특히 다세포 식물 및 버섯 (바시디오마이세테스(Basidiomycetes))의 군으로부터 선택될 수 있다.

따라서, 특정 구현예에서, 본 발명은 트랜스제닉 식물 세포를 포함하는 트랜스제닉 식물 또는 식물 세포 또는 조직 배양물에 관한 것으로, 상기 식물 또는 배양물은 본 발명에 따른 식물 숙주 세포를 포함한다. 트랜스제닉 식물 또는 트랜스제닉 식물 세포의 배양물은 특히 니코티아나 종(Nicotiana spp.), 솔라눔 종(Solanum spp.), 시코룸 인티부스(Cichorum intybus), 락투카 사티바(Lactuca sativa), 멘타 종(Mentha spp .), 아르테미시아 아누아(Artemisia annua), 괴경 형성 식물, 예컨대 헬리안투스 투베로수스(Helianthus tuberosus), 카사바 및 베타 불가리스(Beta vulgaris), 유료 작물(oil crop), 예컨대 브라시카 종(Brassica spp.), 엘라에이스 종(Elaeis spp .) (오일 야자 나무), 헬리안투스 아누스(Helianthus annuus), 글리신 맥스(Glycine max) 및 아라키스 히포가에아(Arachis hypogaea), 액체 배양 식물, 예컨대 좀개구리밥(duckweed) 렘나 종(Lemna spp.), 담배 BY2 세포 및 피스코 미트렐라 파텐스(Physcomitrella patens), 소나무 및 포플러와 같은 나무, 및 상기 식물 중 어느 것의 각각의 세포 배양물 또는 조직 배양물로부터 선택될 수 있다. 특정 구현예에서, 조직 배양물은 모상근 배양물이다.

추가의 특정 구현예에서, 본 발명은 트랜스제닉 버섯 또는 트랜스제닉 버섯 세포를 포함하는 배양물에 관한 것이다. 트랜스제닉 숙주 세포를 포함하는 트랜스제닉 버섯 또는 배양물은 특히 스키조필룸(Schizophyllum), 아가리쿠스(Agaricus) 및 플레우로투스(Pleurotus), 더 특히 스키조필룸 코뮤네(Schizophyllum commune), 일반적인 버섯 (아가리쿠스 비스포루스(Agaricus bisporus)), 느타리 버섯(플레우로투스 오 스트레오투스(Pleurotus ostreotus) 및 플레우로투스 사피두스(Pleurotus sapidus))의 군, 상기 버섯 중 어느 것의 세포를 포함하는 각각의 배양물로부터 선택될 수 있다.

본 발명에 따른 숙주 세포는 예를 들어 하기에 기재된 바와 같이 당해 분야에 일반적으로 공지된 표준 유전 및 분자 생물학 기술을 토대로 생성될 수 있다: Sambrook, J., and Russell, D.W. "Molecular Cloning: A Laboratory Manual" 3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (2001); 및 F.M. Ausubel 등, eds., "Current protocols in molecular biology", John Wiley and Sons, Inc., New York (1987), 및 이에 대한 이후 보충물.

바시디오마이세테스를 형질전환하는 방법은, 예를 들어, 하기에 공지되어 있다: Alves 등 (Appl. Environ. Microbiol. (2004) 70: 6379-6384), Godio 등 (Curr. Genet. (2004) 46: 287-294), Schuurs 등 (Genetics (1997) 147: 589-596), 및 WO　06/096050. 바시디오마이세테스에 적합한 패추롤 신타아제 유전자의 발현을 달성하기 위해, 이의 완전한 오픈 리딩 프레임은 전형적으로 바시디오마이세테스의 형질전환에 적합한 발현 벡터로 클로닝된다. 발현 벡터는 바람직하게는 또한, 전사 개시 및 종결을 조절하는 핵산 서열을 포함한다. 형질전환체의 선택을 가능하게 하기 위해 적어도 하나의 선택 가능한 마커 유전자를 포함시키는 것이 또한 바람직하다. 패추롤 신타아제의 발현은 바시디오마이세테 프로모터, 예를 들어 구성적 프로모터 또는 유도성 프로모터를 사용하여 달성될 수 있다. 강력한 구성적 프로모터의 예는 글리세르알데히드-3-포스페이트 데하이드로게나제 (gpdA) 프로모터이다. 이 프로모터는 재조합 DNA 물질이 바시디오마이세테 숙주에서 발현될 때 구성적 발현에 바람직하다. 다른 예는 바시디오마이세테의 포스포글리세레이트 키나제 (pgk) 프로모터, 피루베이트 키나제 (pki) 프로모터, TPI, 트리오스 포스페이트 이소머라제 (tpi) 프로모터, APC 합성효소 서브유닛 g (oliC) 프로모터, sc3 프로모터 및 아세타미다제 (amdS) 프로모터 (WO 96/41882)이다.

필요한 경우, 패추롤 신타아제 유전자의 1차 뉴클레오티드 서열은 바시디오마이세테 숙주의 코돈 사용에 적합할 수 있다.

또한, 발현은 특히 (단핵성) 균사체 또는 (이핵성) 자실체(fruiting body)에 대해 지시된 것일 수 있다. 후자의 경우, 플레우로티스(Pleurotis)의 Fbh1 프로모터가 특히 유용하다 (Penas, M.M. 등, Mycologia (2004) 96: 75-82).

식물 형질전환 작제물의 구축을 위한 방법론은 당해 분야에 기재되어 있다. 과발현은 선택된 유전자의 하나 이상의 여분의 카피를 삽입함으로써 달성될 수 있다. 과발현을 나타내기 위해 뉴클레오티드 서열의 하나 이상의 여분의 카피로 원래 형질전환된 식물 또는 이들의 자손에 대해서는 알려져 있지 않다.

적절한 식물 조직에서 충분한 수준의 트랜스제닉 발현을 얻는 것이 유전자 조작 작물 생산에서 중요한 측면이다. 식물 숙주에서 이종 DNA 서열의 발현은 식물 숙주 내에서 기능하는 작동 가능하게 연결된 프로모터의 존재에 의존한다. 프로모터 서열의 선택은 유기체 내에서 이종 DNA 서열이 언제 어디서 발현되는지를 결정할 것이다. 쌍자엽식물로부터의 많은 프로모터가 단자엽식물에서 작동하는 것으로 나타났고 그 반대도 마찬가지이지만, 이상적으로는 쌍자엽식물 프로모터가 쌍자엽식물에서의 발현을 위해 선택되고, 단자엽식물 프로모터가 단자엽식물에서의 발현을 위해 선택된다. 그러나, 선택된 프로모터의 기원에 대한 제한은 없으며; 이들이 원하는 세포 또는 조직에서 뉴클레오티드 서열의 발현을 유도하는데 작동하는 것으로 충분하다. 일부 경우에, 다중 조직에서의 발현이 바람직하고, 35S 프로모터 시리즈와 같은 구성적 프로모터가 이러한 관점에서 사용될 수 있다. 그러나, 본 발명의 일부 구현예에서 트랜스제닉 식물에서의 발현은 잎-특이적인 것이 바람직하고,더 바람직하게는, 유전자의 발현은 잎 색소체에서 발생한다. 포풀루스 알 바(Populus alba) (PaIspS)로부터의 이소프렌 신타아제 유전자의 프로모터 (Sasaki 등, FEBS Letters (2005) 579: 2514-2518)는 색소체-특이적 발현을 유도하는 것으로 보인다. 따라서, 이 프로모터는 본 발명의 발현 벡터에 사용하기에 매우 적합한 프로모터이다.

다른 적합한 잎-특이적 프로모터는 rbcS (Rubisco) 프로모터 (예를 들어 커피 유래, WO 02/092822 참고); 브라시카(Brassica) 유래, US 7,115,733 참고; 대두 유래, Dhanker, O., 등, Nature Biotechnol. (2002) 20: 1140-1145 참고), cy-FBPase 프로모터 (US 6,229,067 참고), 오일-팜으로부터의 빛-수확 클로로필 a/b 결합 단백질의 프로모터 서열 (US 2006/0288409 참고), 아라비돕시스 탈리아 나(Arabidopsis thaliana)로부터의 STP3 프로모터 (B

ttner, M. 등, Plant cell & Environ. (2001) 23: 175-184 참고), 콩 PAL2 유전자의 프로모터 (Sablowski, R.W. 등, Proc. Natl. Acad. Sci. USA (1995) 92: 6901-6905 참고), 감자 ST-LS1 프로모터의 인핸서 서열 (Stockhaus, J. 등, Proc. Natl. Acad. Sci. USA (1985) 84: 7943-7947 참고), 밀 CAB1 프로모터 (Gotor, C. 등, Plant J. (1993) 3: 509-518 참고), 감자 ADP-글루코스-포스포릴라아제 유전자로부터의 기공-특이적 프로모터 (US 5,538,879 참고), 쌀의 P(D540) 유전자로부터의 LPSE1 요소 (CN 2007/10051443 참고), 및 아라비돕시스 탈리아나로부터의 기공 특이적 프로모터, pGC1(At1g22690) (Yang, Y. 등, Plant Methods (2008) 4: 6 참고)이다.

식물 종은, 예를 들어, 식물 세포 원형질체의 DNA-매개된 형질전환에 의해 형질전환될 수 있고, 당해 분야에 잘 알려진 절차에 따라 형질전환된 원형질체로부터 식물을 후속적으로 재생시킬 수 있다.

식물 세포를 형질전환시키는 방법의 추가 예는 미량주사법 (Crossway 등, Mol. Gen. Genet. (1986) 202: 179-185), 전기천공법 (Riggs, C.D. and Bates, G.W., Proc. Natl. Acad. Sci. USA (1986), 83: 5602-5606), 아그로박테리움-매개된 형질전환 (Hinchee 등, Bio/Technol. (1988) 6: 915-922), 직접 유전자 전달 (Paszkowski, J. 등, EMBO J. (1984) 3: 2717-2722), 및 위스콘신주 매디슨 소재 Agracetus, Inc. 및 캘리포니아주 허큘리스 소재 BioRad로부터 입수가능한 장치를 사용한 탄도 입자 가속화 (예를 들어, Sanford 등, 미국 특허 번호 4,945,050 및 유럽 특허 출원 EP 0 332 581 참고)를 포함한다.

옥수수를 위한 원형질체 형질전환 방법을 사용할 수도 있다 (유럽 특허 출원 EP 0 292 435, 미국 특허 번호 5,350,689).

아그로박테리움(Agrobacterium) 종의 Ti 및 Ri 플라스미드의 이원형 벡터를 사용하는 것이 특히 바람직하다. Ti-유래 벡터는 대두, 면화, 유채, 담배 및 쌀과 같은 단자엽 식물 및 쌍자엽 식물을 포함한 다양한 고급 식물을 형질전환시킨다 (Pacciotti 등, Bio/technol. (1985) 3: 241; Byrne M.C. 등, Plant Cell Tissue and Organ Culture (1987) 8: 3-15; Sukhapinda, K. 등, Plant Mol. Biol. (1987) 8: 209-217; Hiei, Y. 등, The Plant J. (1994) 6: 271-282). 식물 세포를 형질전환시키는 T-DNA의 사용은 광범위하게 연구되어 왔으며 충분히 설명되어 있다 (예를 들어, EP-A 120 516). 식물로의 도입을 위해, 본 발명의 키메라 유전자는 실시예에 기재된 바와 같이 이원 벡터에 삽입될 수 있다.

외래 DNA 작제물의 직접적인 흡수 (EP-A 295　959 참고), 전기천공 기술 (Fromm, M.E. 등, Nature (1986), 319: 791-793) 또는 핵산 작제물로 코팅된 금속 입자에 의한 고속 탄도 충격 (예를 들어 US 4,945,050)과 같은 다른 형질전환 방법이 당업자에게 이용가능하다. 형질전환되면, 세포는 당업자에 의해 재생될 수 있다. 외래 유전자를, 유채씨 (De Block, M. 등, Plant Physiol. (1989) 91: 694-701), 해바라기 (Everett, N.P. 등, Bio/Technology (1987) 5: 1201-1204), 대두 (EP-A 301 749), 쌀 (Hiei, Y. 등, The Plant J. (1994) 6: 271-282), 및 옥수수 (Fromm 등, 1990, Bio/Technology 8: 833-839)와 같이 상업적으로 중요한 작물로 형질전환시키는 방법이 특히 적합하다.

당업자는 방법의 선택이 식물의 유형, 즉, 단자엽식물 또는 쌍자엽식물인지에 의존할 수 있음을 이해할 것이다.

또 다른 구현예에서, 본원에 기재된 벡터는 색소체 게놈으로 직접 형질전환될 수 있다. 색소체 형질전환 기술은, 예를 들어, US 5,451,513, US 5,545,817, US 5, 545,818 및 WO 95/16783에 광범위하게 기재되어 있다. 엽록체 형질전환을 위한 기본 기술은, 예를 들어, 유전자총법(biolistics) 또는 원형질체 형질전환 (예를 들어 염화칼슘 또는 PEG 매개된 형질전환)을 사용하여 관심있는 유전자와 함께 선택가능한 마커가 측면에 배치된 클로닝된 색소체 DNA 영역을 적합한 표적 조직 내로 도입하는 것을 포함한다.

본 발명에 따른 벡터 (여기서 벡터는 Ti 플라스미드를 포함함)를 함유하는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 세포는 형질전환된 식물을 제조하는 방법에 유용하다. 식물 세포를 상기 기재된 아그로박테리움 투메파시 엔스로 감염시켜 형질전환된 식물 세포를 생성한 후, 식물을 형질전환된 식물 세포로부터 재생시킨다. 본 발명을 수행하는데 유용한 수많은 아그로박테리움 벡터 시스템이 공지되어 있다. 이들은 전형적으로 적어도 하나의 T-DNA 경계 서열(border sequence)을 갖고 pBINl9와 같은 벡터를 포함한다 (Bevan, Nucl. Acids Res. (1984) 12: 8711-8720).

직접 유전자 전달 또는 아그로박테리움-매개된 전달의 형태를 사용하는 방법은 반드시 그런 것은 아니지만 일반적으로 항생제 (예를 들어 카나마이신, 하이그로마이신 또는 메토트렉세이트) 또는 제초제 (예를 들어 포스피노트리신)에 대한 내성을 제공할 수 있는 선택가능한 마커로 수행된다. 그러나, 식물 형질전환을 위한 선택가능한 마커의 선택은 본 발명에서 중요하지 않다.

식물 조직을 배양하는 일반적인 방법은 예를 들어 하기에 제공되어 있다: Maki, K.Y. 등, Plant Physiol. (1993) 15: 473-497; 및 Phillips, R.I. 등 In: Sprague GF, Dudley JW, eds. Corn and corn improvement. 3rd edn. Madison (1988) 345-387.

형질전환 후, 트랜스제닉 식물 세포를 트랜스제닉 세포의 선택을 위해 적절한 선택 배지에 넣은 후 캘러스(callus)까지 성장시킨다. 캘러스로부터 싹이 자라고, 발근 배지에서 성장시킴으로써 싹에서 묘목이 생성된다. 사용된 특정 마커는 DNA가 도입되지 않은 세포와 비교하여 형질전환된 세포의 선택을 가능하게 할 것이다.

트랜스제닉 세포 및 식물에서 전이유전자의 존재를 확인하기 위해, 다양한 분석이 수행될 수 있다. 그와 같은 분석은, 예를 들어, 서던 및 노던 블랏팅, 제자리 부합법(in situ hybridization) 및 핵산-기반 증폭 방법 예컨대 PCR 또는 RT-PCR과 같은 당업자에게 잘 알려진 "분자 생물학적" 분석 및 예를 들어, 면역학적 수단 (ELISA 및 웨스턴 블랏) 또는 효소 작용에 의해 단백질 생성물의 존재를 검출하는 "생화학적" 분석을 포함한다. 효소적으로 활성인 패추롤 신타아제의 존재는 식물의 휘발성 생성물 (패추롤)의 화학적 분석에 의해 규명될 수 있다.

본 발명에 따른 패추롤 신타아제는 패추롤의 산업적 생산에 사용될 수 있으며, 상기 패추롤은 그 자체로 예를 들어 식료품에서 풍미제 또는 방향제로서, 또는 예를 들어 가정용 제품에서 향료로서, 또는 산탈롤과 같이 또 다른 이소프레노이드의 생산을 위한 중간체로서 사용될 수 있다.

본 발명에 따른 패추롤을 생성하는 방법은 패추롤 신타아제의 존재 하에 패추롤을 제조하는 단계를 포함한다. 원칙적으로, 그와 같은 방법은 관심 화합물의 제조에 효소를 사용하기 위한 임의의 기술에 기반할 수 있다.

상기 방법은 FPP 또는 이의 전구체 중 어느 것 (예컨대 파르네솔, IPP, 이소펜테닐 포스페이트, 3-메틸부트-3-엔-1-올 및 심지어 메발로네이트)이 패추롤 신타아제를 포함하는 세포에 기질로서 공급되는 방법일 수 있다. 대안적으로, 상기 방법은 또한, 적합한 탄소 공급원으로부터 FPP를 형성할 수 있는 효소 시스템을 포함하는 살아있는 유기체를 사용하여 패추롤로의 완전한 발효 경로를 확립하는 방법일 수 있다. 용어 "발효"는 본원에서, 적합한 공급 원료 (예를 들어 탄수화물, 아미노산 공급원, 지방산 공급원)로부터 화합물을 합성하기 위해 유기체의 배양물이 사용되는 공정에 대해 넓은 의미로 사용된다는 점에 유의해야 한다. 따라서, 본원에서 의미하는 발효 공정은 혐기성 조건으로 제한되지 않으며, 호기성 조건 하의 공정으로 확장된다. 특정 종의 유기체 (미생물)에 대해 적합한 공급 원료가 일반적으로 공지되어 있다.

또한, 예를 들어 기질 (FPP) 및 패추롤 신타아제가 적합한 조건 (pH, 용매, 온도) 하에서 접촉되는 반응 시스템에서 패추롤 신타아제가 생산되는 세포로부터 단리된 패추롤 신타아제가, 선택적으로 일부 일상적인 시험과 조합하여, 사용될 수 있으며, 상기 조건은 본 명세서 및 본 개시내용에 언급된 선행 기술에 기반할 수 있다. 패추롤 신타아제는 예를 들어 FPP도 존재하는 수성 배지에서 가용화될 수 있거나 또는 패추롤 신타아제는 당해 분야에 공지된 방식으로 지지 물질에 고정된 후 FPP를 포함하는 액체와 접촉될 수 있다. 효소는 FPP로부터 패추롤로의 촉매작용에 대해 높은 활성 및/또는 선택성을 갖기 때문에, 본 발명은 또한 산성 조건 하에서뿐만 아니라 pH가 대략 중성 또는 알칼리성인 경우에도 그러한 시험관내 방법에 유리하다. 적합한 조건은, 예를 들어 본원에 언급된 문헌, 본원에 개시된 정보, 보통의 일반적인 지식 및 선택적으로 일부 일상적인 실험에서 언급된, 공지된 패추롤 신타아제에 대해 공지된 방법론에 기반할 수 있다.

본 발명의 특히 유리한 방법에서, 패추롤은 발효적으로, 즉 배양 배지에서 패추롤 신타아제를 발현시키는 세포를 배양함으로써 제조된다. 패추롤 신타아제에 의해 촉매된 실제 반응은 세포내에서 또는, 패추롤 신타아제가 배양 배지 내로 분비되는 경우, 배양 배지에서 세포외로 일어날 수 있다.

본 발명에 따른 패추롤을 제조하는 방법에 사용되는 세포는 특히 본 발명에 따른 숙주 세포일 수 있다. 원하는 경우, 이들 숙주 세포는 증가되는 양으로 FPP를 패추롤 신타아제로 공급하도록 조작될 수 있다. 이것은 예를 들어 FPP에 대한 탄소 플럭스를 향상시킴으로써 행해질 수 있으며, 그 자체가 상이한 방식으로 실현될 수 있다. 내인성 DXP 경로를 갖는 숙주 세포 (예컨대 이. 콜라이 및 알. 스패로이데 스)에서, 이들 경로의 효소의 발현의 탈조절은 이소프레노이드 형성에 명백한 긍정적 효과를 가질 수 있다. DXP 경로의 첫 번째 효소인, 1-데옥시-d-자일룰로스-5-포스페이트 신타아제 (DXP-신타아제)를 인코딩하는 dxs의 과발현 및 이에 따라 대사공학을 위한 주요 표적 중 하나는 몇몇 이소프레노이드의 생합성을 증가시켰다 (예를 들어, Matthews and Wurtzel, Appl. Microbiol. Biotechnol. (2000) 53: 396-400; Huang 등, Bioorg. Med. Chem. (2001) 9: 2237-2242; Harker and Bramley, FEBS Lett (1999) 448: 115-119; Jones 등 Metab. Eng. (2000) 2: 328-338; 및 Yuan 등 Metab. Eng. (2006) 8: 79-90). 또한, DXP 경로의 두 번째 및 결정적 단계를 촉매하는 효소인, DXP 이소머리덕타제(isomeroreductase) (1-데옥시-D-자일룰로스-5-포스페이트 리덕토이소머라제로도 공지됨)를 코딩하는 dxr의 과발현은 이소프레노이드 생산 증가로 이어질 수 있으며 (Albrecht 등, Biotechnol. Lett. (1999) 21: 791-795), 이 효과는 dxs를 동시에 공-과발현시킴으로써 더욱 증가될 수 있다 (Kim & Keasling, Biotechnol Bioeng (2001) 72: 408-415). 이소프레노이드 생합성의 긍정적 효과는 IPP의 디메틸알릴 디포스페이트, DMAPP로의 상호전환을 촉매하는 효소인, 이소펜테닐 디포스페이트 이소머라제 (IPP 이소머라제, Idi) (예를 들어, Kajiwara 등 Biochem. J. (1997) 324: 421-426); Misawa and Shimada, J. Biotech. (1998) 59: 169-181; 및 Yuan 등 Metab. Eng. (2006) 8: 79-90) 및 효소 MEP 시티딜릴트랜스퍼라제 (4-디포스포시티딜-2-C-메틸-D-에리트리톨 신타아제, IspD로도 알려짐) 및 이. 콜라이에서 하나의 오페론 ispDF로 전사되는 2C-메틸-D-에리트리톨 2,4-사이클로디포스페이트 신타아제 (IspF) (Yuan 등 Metab. Eng. (2006) 8: 79-90)의 과발현에 의해 추가로 얻어졌다.

이소프레노이드의 고수준 생산을 위한 내인성 DXP 경로를 갖는 균주를 조작하는 대안적이고 보다 효율적인 접근법은 이종 메발로네이트 경로의 도입이다. 합성 아모르파-4,11-디엔 신타아제 유전자와 사카로마이세스 세레비시애 메발로네이트 경로의 이. 콜라이에서의 공발현은 재조합 이 . 콜라이 균주가 LB+ 글리세롤 배지에서 배양될 때 110 mg/L 초과의 역가로 세스퀴테르펜 아모르파디엔의 형성을 초래하였다 (Martin 등 Nat. Biotechnol. (2003) 21: 796-802). 이러한 이. 콜라이 균주는 효모 효소 3-하이드록시-3-메틸-글루타릴-코엔자임 A (HMG-CoA) 리덕타제의 C-말단 촉매 도메인을 인코딩하는 유전자 tHMG1의 여분의 카피를 도입함으로써 이후 개선되었다. 이 효소의 형성 및 이에 따른 활성을 증가시킴으로써, 독성 메발로네이트 경로 중간체 HMG-CoA의 세포내 수준이 감소되어 성장 억제를 극복하고 메발로네이트의 생산을 증가시켰다 (Pitera 등 Metab. Eng. (2007) 9: 193-207). 이종 메발로네이트 경로를 통한 플럭스의 추가 개선은 야생형 lac 프로모터를 2배 더 강력한 lacUV5 프로모터로 대체하는 것과 조합하여 이 경로의 처음 3개 유전자의 코돈 최적화에 의해 얻어졌다 (Anthony 등 Met. Eng. (2009) 11: 13-19). HMG-CoA 신타아제 및 HMG-CoA 리덕타제에 대한 효모 유전자를 그램 양성 박테리아 스타필로코쿠스 아우레우스(Staphylococcus aureus)로부터의 동등한 유전자로 대체함으로써 아모르파디엔의 생산을 더욱 더 증가시킬 수 있다. 최적화된 발효 프로토콜과 조합하여, 이 신규 조작된 이. 콜라이 균주의 배양으로 27.4 g/L의 아모르파디엔 역가가 산출되었다 (Tsuruta 등 PloS ONE (2009) 4(2): e4489. doi:10.1371/journal.pone.0004489). 유사하게, 아그로박테리움 투메파시엔스 데카프레닐 디포스페이트 신타아제 (ddsA) 유전자와 조합하여 스트렙토코쿠스 뉴모니 애(Streptococcus pneumoniae)로부터의 메발로네이트 경로로 조작된 이. 콜라이 균주는 2400 μg/g 초과의 세포 건조 중량으로 코엔자임 Q10 (CoQ₁₀)을 생성하였다 (Zahiri 등 Met. Eng. (2006) 8: 406-416. CoQ₁₀의 생산 증가는 또한, 고유 (WO 2005/005650) 및 돌연변이 형태 (WO 2006/018211)의 파라코쿠스 제아잔티니파시엔 스로부터의 메발로네이트 경로로 로도박터 스패로 이데스 균주를 조작함으로써 얻어졌다.

또한, 내인성 MEV 경로 (예컨대 에스. 세레비시애)를 갖는 숙주 세포는 이소프레노이드 과잉 생산 균주를 수득하기 위한 다중 공학 연구의 대상이 되어 왔다. 시트러스 패추롤 신타아제를 인코딩하는 유전자와 조합된 이종 이. 콜라이 유래 DXP 경로의 에스. 세레비시애로의 도입은 패추롤 신타아제만을 발현시키는 균주에 비해 대략 10배 더 많은 패추롤을 축적하는 균주를 초래하였다 (WO 2007/093962). 그러나, 산업적으로 중요한 효모인 칸디다 유틸리스(Candida utilis)와 에스. 세레비시애에서의 대부분의 개선은 상동성 MEV 경로의 조작에 중점을 두었다. 특히, 전장 또는 절단된 형태의, DXP 경로에서 주요 조절 효소인 것으로 여겨지는 효소 HMG-CoA 리덕타제의 과발현은 이소프레노이드의 생산을 증가시키는 효율적인 방법인 것으로 나타났다. N-말단 절단된 HMG-CoA 리덕타제의 과발현의 이러한 자극 효과는, 예를 들어, 씨. 유틸리스에서 리코펜 생산 (Shimada 등 Appl. Env. Microbiol. (1998) 64: 2676-2680) 및 에스. 세레비시애에서 에피-세드롤 생산 (Jackson 등 Org. Lett. (2003) 5: 1629-1632)의 경우에 관측되었다. 마지막으로,이 세스퀴테르펜의 생산은 스테롤 생합성에 대한 대사 플럭스의 증가를 유발하는 대립유전자인, upc2-1의 도입에 의해 더욱 향상될 수 있다. MEV 경로를 통한 플럭스를 증가시키는 또 다른 방법은 FPP 및 다른 이소프레노이드 전구체에 의한 피드백 억제에 덜 민감한 메발로네이트 키나제 변이체를 사용하는 것이다. 예를 들어, WO 2006/063752는 에스. 세레비시애 메발로네이트 키나제 돌연변이체 N66K/I152M 및 피. 제아잔티니파시엔스로부터의 ddsA 유전자 ATCC 21588의 도입 후, 내인성 MEV 경로를 갖는 박테리아인, 파라코쿠스 제아잔티니파시엔스 R114가 야생형 에스. 세레비시애 메발로네이트 키나제를 발현시키는 상응하는 피. 제아잔티니파시엔스 균주보다 현저히 더 많은 코엔자임 Q₁₀을 생산한다는 것을 보여준다. 피. 제아잔티니파시엔스 R114를 사용한 CoQ₁₀ 생산에 대한 유사한 긍정적 결과는 피. 제아잔티니파시엔스 메발로네이트 키나제의 피드백 내성 변이체 K93E로도 얻어졌다 (WO 2004/111214).

FPP의 양 증가에 대한 두 번째 접근법은 FPP에 대한 효소적 측면 활성의 감소 또는 제거에 기초한다. 효모에서, 유전자 ERG9는 2개의 파르네실 디포스페이트 모이어티의 축합을 촉매하여 스쿠알렌을 형성하는 효소 파르네실 디포스페이트 파르네실 트랜스퍼라제 (스쿠알렌 신타아제)를 인코딩한다. 이것은 스테롤 생합성에서 FPP 이후의 첫 번째 단계이므로 스테롤 경로로의 이소프렌 단위의 플럭스를 조절하므로, ERG9는 세스퀴테르펜 및 카로티노이드 생산 증가를 위한 효모 대사 공학에서 빈번한 표적이다. 효모 씨. 유틸리스에서 tHMG-CoA 리덕타제의 과발현과 조합하여 ERG9의 파괴는 리코펜의 생산 증가로 이어졌다 (Shimada 등 Appl. Env. Microbiol. (1998) 64: 2676-2680). 메티오닌 억제성 프로모터를 사용한 tHMG-CoA 리덕타제의 과발현 및 ERG9의 하향조절의 유사한 조합은 효모에서 세스퀴테르펜 아모르파디엔의 생산을, 아모르파디엔 신타아제 유전자만을 발현시키는 효모 균주와 비교하여 대략 10배 증가시켰다 (Ro 등 Nature (2006) 440: 940-943; Lenihan 등 Biotechnol. Prog. (2008) 24: 1026-1032). 에르고스테롤은 효모 성장에 필수적이며, 효모 세포는 호기성 성장 동안 외부에서 공급된 에르고스테롤을 동화시킬 수 없기 때문에, ERG9의 하향조절/녹아웃은 효모 균주가 배양 배지로부터 에르고스테롤을 효율적으로 호기성 흡수하게 하는 돌연변이와 자주 조합된다. 예로는 sue 대립유전자 (Takahishi 등 Biotechnol. Bioeng. (2007) 97: 170-181) 및 upc2-1 대립유전자 (Jackson 등 Org. Lett. (2003) 5: 1629-1632)가 있다. 다카하시 등(Takahashi 등 Biotechnol. Bioeng. (2007) 97: 170-181)은 또한, 효모에서 포스파타아제 유전자 dpp1을 녹아웃함으로써 내인성 포스파타아제 활성을 제한하는 효과를 조사하였다. 이러한 녹아웃은 훨씬 적은 파르네솔 축적으로 반영된 FPP의 탈인산화를 분명히 제한했지만, 적용된 성장 조건 하에서 조합된 erg9/sue 돌연변이의 것보다 세스퀴테르펜 생산을 개선시키지는 않았다.

패추롤을 발효적으로 제조하기 위한 반응 조건은 사용된 숙주 세포 종 (예를 들어 로도박터 캅술라투스, 로도박터 스패로이데스, 파라코쿠스 제아잔티니파시엔스, 에스케리키아 콜라이, 아스퍼길러스 니둘란스, 아스퍼길러스 니게르, 아스퍼길러스 오리재, 사카로마이세스 세레비시애, 페니실리움 크리소게눔, 파피아 로도지마 및 피치아 파스토리스)에 대한 공지된 조건, 본원에 개시된 정보, 보통의 일반적인 지식 및 선택적으로 일부 일상적인 실험에 따라 선택될 수 있다.

원칙적으로, 본 발명에 따른 방법에 사용된 반응 배지 (배양 배지)의 pH는 (숙주 세포에서) 패추롤 신타아제가 활성화되고 pH 조건 하에서 원하는 특이성을 나타내는 한 넓은 범위 내에서 선택될 수 있다. 상기 방법이 패추롤 신타아제를 발현시키기 위한 세포의 사용을 포함하는 경우, 세포가 의도된 기능 또는 기능들을 수행할 수 있도록 하는 pH가 선택된다. pH는 특히 중성 pH 이하의 4개의 pH 단위 및 중성 pH 이상의 2개의 pH 단위, 즉 25℃에서 본질적으로 수성 시스템의 경우 pH 3 내지 pH 9 사이의 범위 내에서 선택될 수 있다. 예를 들어 6.8 내지 7.5 범위의 pH를 갖는 수성 반응 배지에서 좋은 결과가 달성되었다.

물이 유일한 용매 또는 주된 용매 (총 액체를 기준으로 50 중량% 초과, 특히 90 중량% 초과)인 경우, 시스템은 수성으로 간주되며, 여기서 예를 들어 소량의 알코올 또는 또 다른 용매 (총 액체를 기준으로 50 중량% 미만, 특히 10 중량% 미만)는 존재하는 미생물이 활성 상태를 유지하는 그와 같은 농도로 (예를 들어, 완전 발효 접근법의 경우 탄소원으로) 용해될 수 있다.

특히, 효모 및/또는 진균이 사용되는 경우, 산성 조건이 바람직할 수 있으며, 특히 pH는 25℃에서의 본질적으로 수성 시스템을 기준으로 pH 3 내지 pH 8의 범위일 수 있다. 원하는 경우, 산 및/또는 염기를 사용하여 pH를 조정하거나 산 및 염기의 적절한 조합으로 완충시킬 수 있다.

혐기성 조건은 본원에서 임의의 산소가 없거나 배양된 세포, 특히 미생물에 의해 실질적으로 산소가 소비되지 않는 조건으로 정의되며, 일반적으로 5 mmol/l.h 미만의 산소 소비, 바람직하게는 2.5 mmol/l.h 미만의 산소 소비, 또는 더 바람직하게는 1 mmol/l.h 미만의 산소 소비에 해당한다. 호기성 조건은 무제한 성장을 위한 충분한 수준의 산소가 배지에 용해되어 적어도 10 mmol/l.h, 더 바람직하게는 20 mmol/l.h 초과, 더욱 더 바람직하게는 50 mmol/l.h 초과, 가장 바람직하게는 100 mmol/l.h 초과의 산소 소비율을 지원할 수 있는 조건이다.

산소-제한 조건은 가스에서 액체로의 산소 전달에 의해 산소 소비가 제한되는 조건으로 정의된다. 산소-제한 조건의 하한은 혐기성 조건에 대한 상한에 의해 결정되며, 즉 일반적으로 적어도 1 mmol/l.h, 특히 적어도 2.5 mmol/l.h, 또는 적어도 5 mmol/l.h이다. 산소-제한 조건의 상한은 호기성 조건에 대한 하한에 의해 결정되며, 즉 100 mmol/l.h 미만, 50 mmol/l.h 미만, 20 mmol/l.h 미만, 또는 10 mmol/l.h 미만이다.

조건이 호기성, 혐기성 또는 산소-제한적인지의 여부는 상기 방법이 수행되는 조건, 특히 유입 기체 흐름의 양 및 조성, 사용된 장비의 실제 혼합/질량 전달 특성, 사용된 미생물의 유형 및 미생물 밀도에 따라 달라진다.

원칙적으로, 사용되는 온도는 (세포에서) 패추롤 신타아제가 실질적인 활성을 나타내는 한 중요하지 않다. 일반적으로, 온도는 적어도 0℃, 특히 적어도 15℃, 더 특히 적어도 20℃일 수 있다. 바람직한 최대 온도는 패추롤 신타아제를 발현시키기 위한 세포를 사용하는 방법의 경우, 패추롤 신타아제 및 세포에 따라 달라진다. 온도는 70° 이하, 바람직하게는 50℃ 이하, 더 바람직하게는 40℃ 이하, 특히 35℃ 이하이다.

발효 공정의 경우, 세포가 충분한 활성 및/또는 성장을 나타내는 한 인큐베이션 조건은 넓은 범위 내에서 선택될 수 있다. 이는 호기성, 산소-제한 및 혐기성 조건을 포함한다.

특히, 패추롤이 형성되는 촉매 반응이 숙주 세포 외부에서 수행된다면, 유기 용매를 포함하는 반응 배지는, 사용되는 패추롤 신타아제가 그와 같은 배지에 충분한 활성 및 특이성을 보유하는 경우, 고농도 (예를 들어, 총 액체를 기준으로 50% 초과, 또는 90 중량% 초과)로 사용될 수 있다.

필요하다면, 본 발명에 따른 방법으로 제조된 패추롤, 포고스톨, 및 엘레몰은 그것이 제조된 반응 배지로부터 회수된다. 적합한 방법은 반응 배지와 비-혼화성인 추출 액체를 사용한 액체-액체 추출이다.

특히, 액체 탄화수소와 같은 액체 유기 용매로 추출하는 것이 (수성 반응 배지로부터 추출하기에) 적합하다. 초기 결과로부터, 이 방법은 또한 패추롤 (또는 추가 생성물)의 회수를 위해 세포를 용해시킬 필요 없이, 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨을, 이의 생산에 사용된 본 발명에 따른 세포를 포함하는 반응 배지로부터 추출하는데 적합하다는 것이 명백하다. 특히, 유기 용매는 액체 알칸, 액체 장쇄 알코올 (적어도 12개의 탄소 원자를 갖는 알코올), 및 장쇄 지방산 (적어도 12개의 탄소 원자를 갖는 산)의 액체 에스테르로부터 선택될 수 있다. 적합한 액체 알칸은 특히 C6-C16 알칸, 예컨대 헥산, 옥탄, 데칸, 도데칸, 이소도데칸 및 헥사데칸을 포함한다. 적합한 장쇄 지방족 알코올은 특히 올레일 알코올 및 팔미톨레일 알코올과 같은 C12-C18 지방족 알코올을 포함한다. 장쇄 지방산의 적합한 에스테르는 특히 이소프로필 미리스테이트 및 에틸 올레에이트와 같은 C12-C18 지방산의 C1-C4 알코올의 에스테르를 포함한다.

유리한 구현예에서, 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨은 제1 액체상 (반응상) 및 제2 액체상 (접촉될 때 제1 상과 본질적으로 상-분리된 상태로 유지되는 유기상)을 포함하는 반응기에서 생성되며, 상기 제1 액체상은 패추롤 (또는 추가 생성물)이 생성되는 본 발명에 따른 세포를 함유하며, 상기 제2 액체상은 추출 상으로, 형성된 생성물은 더 높은 친화성을 갖는다. 이 방법은 동일계에서 생성물을 회수할 수 있다는 점에서 유리하다. 또한, 이는 제2 상의 존재로 인해, 반응상에서 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨 농도가 공정 내내 상대적으로 낮게 유지될 수 있기 때문에, 세포에 대한 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨의 잠재적 독성 효과를 예방하거나 적어도 감소시키는데 기여한다. 마지막으로, 추출 단계가 반응 단계에서 패추롤, 포고스톨, 및 엘레몰을 추출하는데 기여한다는 강한 징조가 있다.

본 발명의 바람직한 방법에서 추출상은 반응상 위에 층을 형성하거나 반응상과 혼합되어 추출상에서 반응상의 분산액 또는 반응상에서 추출상의 분산액을 형성한다. 따라서, 추출상은 반응상으로부터 생성물을 추출할뿐만 아니라 오프-가스를 통한 반응기로부터 형성된 생성물의 손실을 감소시키거나 완전히 피하는데 도움을 주며, 이는 패추롤이 (수성) 반응상에서 생성되거나 (수성) 반응상으로 분비되는 경우 발생할 수 있다. 패추롤은 물에 잘 녹지 않으므로 물에서 쉽게 휘발된다. (층 또는 분산액으로서) 유기상에서 용매화된 패추롤은 적어도 실질적으로 휘발이 방지되는 것으로 고려된다.

추출상으로 사용하기에 적합한 액체는 반응상보다 낮은 밀도와 우수한 생체적합성 (살아있는 세포의 생존력에 대한 간섭 없음), 낮은 휘발성, 및 수성 반응상과의 거의 절대적 불혼화성을 겸비한다. 본 출원에 적합한 액체의 예는 데칸, 도데칸, 이소도데칸, 테트라데칸, 및 헥사데칸과 같은 액체 알칸, 또는 올레일 알코올과 같은 장쇄 지방족 알코올, 및 팔미톨레일 알코올, 또는 이소프로필 미리스테이트 및 에틸 올레에이트와 같은 장쇄 지방산의 에스테르이다 (예를 들어 Asadollahi 등 (Biotechnol. Bioeng. (2008) 99: 666-677), Newman 등 (Biotechnol. Bioeng. (2006) 95: 684-691) 및 WO　2009/042070 참고).

본 발명에 따라 생성된 패추롤은 예를 들어 풍미제 또는 향료, 또는 방충제로서 사용하기 위해 그렇게 사용될 수 있거나, 또는 또 다른 화합물, 특히 또 다른 풍미제 또는 향료의 출발 물질로서 사용될 수 있다.

또한, 본 개시내용은 효소의 존재 하에 폴리프레닐 디포스페이트 기질을 패추롤, 포고스톨 및 엘레몰로 전환시키는 단계를 포함하는, 패추롤, 포고스톨 및 엘레몰을 제조하는 방법에 관한 것으로, 상기 효소는 태그-펩티드를 포함하는 제1 세그먼트 및 본 발명에 따른 패추롤 신타아제를 포함하는 제2 세그먼트를 포함한다. 상기 제1 및 상기 제2 세그먼트를 포함하는 효소는 본원에서 "태그된 효소"로 지칭될 수 있다.

패추롤 포고스톨 및 엘레몰 제조를 위해, 특히 본원에 기재된 방법, 아미노산 서열, 핵산 서열 또는 숙주 세포가 사용될 수 있다. 산탈롤은, 예를 들어, 자체로 공지된 방식으로 패추롤의 산소화/산화에 의해 제조될 수 있다.

태그-펩티드는 바람직하게는 질소 이용 단백질 (NusA), 티오레독신 (Trx), 말토오스-결합 단백질 (MBP), 글루타티온 S-트랜스퍼라제 (GST), 소형 유비퀴틴-유사 개질제 (SUMO) 또는 칼슘-결합 단백질 (Fh8) 및 이의 기능적 동족체의 군으로부터 선택된다. 본원에 사용된 태그 펩티드의 기능적 동족체는 비-태그된 효소와 비교하여, 태그된 효소의 용해도에 대해 적어도 거의 동일한 효과를 갖는 태그 펩티드이다. 전형적으로 동족체는 하나 이상의 아미노산이 동족체인 펩티드로 삽입, 치환, 결실 또는 연장되었다는 점에서 상이하다. 동족체는 특히 친수성 아미노산의 또 다른 친수성 아미노산으로의 하나 이상의 치환 또는 소수성 아미노산의 또 다른 소수성 아미노산으로의 하나 이상의 치환을 포함할 수 있다. 동족체는 특히, NusA, Trx, MBP, GST, SUMO 또는 Fh8의 서열과 적어도 40%, 더 특히 적어도 50%, 바람직하게는 적어도 55%, 더 바람직하게는 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%의 서열 동일성을 가질 수 있다.

에스케리키아 콜라이로부터의 말토오스 결합 단백질 또는 이의 기능적 동족체가 특히 적합하다.

본 발명에 따른 태그된 효소의 사용은 그것이 패추롤, 포고스톨 및 엘레몰과 같은 테르페노이드 또는 테르펜의 증가된 생산, 특히 증가된 세포 생산에 기여할 수 있다는 점에서 특히 유리하다.

(태그가 없는 효소와 비교하여) 태그된 효소의 개선된 용해도를 위해, 효소의 제1 세그먼트는 바람직하게는 이의 C-말단에서 제2 세그먼트의 N-말단에 결합된다. 대안적으로, 태그된 효소의 제1 세그먼트는 이의 N-말단에서 제2 세그먼트의 C-말단에 결합된다.

또한, 본 개시내용은 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 핵산에 관한 것으로, 상기 폴리펩티드는 태그-펩티드, 바람직하게는 MBP, NusA, Trx, GST, SUMO 또는 anFh8-태그 또는 이들 중 어느 것의 기능적 동족체를 포함하는 제1 세그먼트, 및 패추롤 신타아제를 포함하는 제2 세그먼트를 포함한다. 제2 세그먼트는 예를 들어 서열 번호: 3에 나타낸 아미노산 서열, 또는 이의 기능적 유사체를 포함할 수 있다.

또한, 본 개시내용은 상기 태그된 패추롤 신타아제를 인코딩하는 상기 핵산을 포함하는 숙주 세포에 관한 것이다. 태그된 효소를 인코딩하는 본 발명에 따른 특정 핵산은 서열 번호: 10, 서열 번호: 14, 서열 번호: 18, 서열 번호: 22, 서열 번호: 26, 및 서열 번호: 30에 나타나 있다. 숙주 세포는 특히 이들 서열 중 어느 것 또는 이의 기능적 유사체를 포함하는 유전자를 포함할 수 있다.

또한, 본 개시내용은 태그-펩티드를 포함하는 제1 세그먼트 및 폴리프레닐 디포스페이트를 테르펜으로 전환시키기 위한 효소 활성, 특히 패추롤 신타아제를 갖는 폴리펩티드를 포함하는 제2 세그먼트를 포함하는 효소에 관한 것으로, 상기 태그-펩티드는 바람직하게는 MBP, NusA, Trx 또는 SET의 군으로부터 선택된다. 본 발명에 따른 태그된 효소를 포함하는 특정 효소는 서열 번호: 11, 서열 번호: 15, 서열 번호: 19, 서열 번호: 23, 서열 번호: 27, 및 서열 번호: 31에 나타나 있다.

본 발명은 이제 하기 실시예에 의해 예시될 것이다.

도 1: NjPAT 유전자가 MBP 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-MBP-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 2: NjPAT 유전자가 Fh8 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-Fh8-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 3: NjPAT 유전자가 SUMO 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-SUMO-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 4: NjPAT 유전자가 NusA 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-NusA-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 5: NjPAT 유전자가 RsTRX 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-RsTRX-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 6: NjPAT 유전자가 GST 태그에 융합되고 프로모터 SPppa에 의해 조절되는 플라스미드 p-m-SPppa-GST-NjPAT-mpmii alt의 특징을 보여주는 유전자 지도
도 6: NjPAT 테르펜 알코올 추출물의 GC-FID 크로마토그램. A: 엘레몰; B: 포고스톨; C: 패추롤
도 8: NjPAT 추출물의 GC-QTOF 크로마토그램. A: 구아이아(guaia)-11-디엔; B: β-파출렌(patchoulene); C: 바이사이클로제르마크렌; D: 세이첼렌(seychellene); E: α-파출렌; F: δ-파출렌; G: δ-구아이엔; H: γ-파출렌; I: 엘레몰; J: 포고스톨; K: 이소롱기폴롤 아세테이트; L: 비리디플로롤/이에돌; M: 패추롤.

실시예:

실시예 1:

나르도스타키스 자타만시의 GC-MS 분석

약 20cm 높이의 나르도스타키스 자타만시 식물은 스코틀랜드 로스 앤 크로마티 (Ross & Cromarty) 딩월 IV7 8LX, 블랙 아일의 Poyntzfield Herb Nursery로부터 구입하였다. 식물을 잎과 뿌리 재료로 절단하였다. 사전 냉각된 유리 튜브에서 0.5 g의 식물 재료를 칭량하고, 2 mL의 디클로로메탄을 첨가하였다. 현탁액을 1분 동안 와동시키고, 초음파 욕에서 5분 동안 초음파처리하고, 실온에서 1500 g에서 5분 동안 원심분리하였다. 상청액을 수집하고 1 g의 황산나트륨 컬럼 상에서 여과하였다. 약 2 마이크로리터는 칸카르(Cankar) 등 (2015)에 의해 상세히 설명된 바와 같이 가스 크로마토그래프를 사용하여 GC/MS에 의해 분석되었다. 패추롤은 체류 시간 및 질량 스펙트럼을 파출리 오일 5 (Sigma-Aldrich)의 것과 비교하여 식별하였다.

결과:

엔. 자타만시의 뿌리는 패추롤 (Rt 16.4분) 및 알파 파출렌 (Rt 13.9분)에 해당하는 화합물을 함유하는 것으로 나타났다. 따라서, 이 조직은 RNA 추출을 위해 추가로 취해졌다.

실시예 2:

RNA 추출 및 분석

엔. 자타만시 뿌리 재료의 RNA를 다음과 같이 단리하였다: 약 15 mL 20 추출 버퍼 (2% 헥사데실-트리메틸암모늄 브로마이드, 2% 폴리비닐피롤리디논 K 30, 100 mM Tris-HCl (pH 8.0), 25 mM EDTA, 2.0 M NaCl, 0.5 g/L 스페르미딘 및 2% β-머캅토에탄올)를 65℃로 가온한 후, 3 g의 분쇄된 조직을 첨가하고 혼합하였다. 상기 혼합물을 동일한 용적의 클로로포름:이소아밀알코올 (1:24)로 2회 추출하고, 1/4 용적의 10 M LiCl을 상청액에 첨가하고 혼합하였다. RNA를 4℃에서 밤새 침전시키고 20분 동안 10 000 g에서 원심분리하여 수확하였다. 펠렛을 500 마이크로리터의 SSTE [1.0 M NaCl, 0.5% SDS, 10 mM Tris-HC1 (pH 8.0), 1 mM EDTA (pH 8.0)]에 용해시키고 동일한 용적의 클로로포름:이소아밀알코올로 1회 추출하였다. 2 용적의 에탄올을 상청액에 첨가하고, -20℃에서 적어도 2시간 동안 인큐베이션하고, 13 000 g에서 원심분리하고, 상청액을 제거하였다. 상기 펠렛을 공기-건조시키고 물에 재현탁시켰다. 총 RNA (60 Vg)를 Vertis Biotechnology AG (Freising, Germany)로 발송하였다. PolyA+ RNA를 단리하고, 무작위화된 N6 어댑터 프라이머 및 M-MLV H-역전사효소를 사용하여 랜덤 프라이밍된 cDNA를 합성하였다. cDNA를 전단 및 분별하고, 5 및 500 bp 크기의 단편을 추가 분석에 사용하였다. cDNA는 5' 및 3' 말단에 부착되어 Illumina에서 명시된 대로 어댑터 서열 A 및 B를 운반한다.

이어서 상기 물질을 Illumina MiSeq 시퀀싱 장치에서 분석하였다. MiSeq에 의해 총 28,331,910개의 서열이 판독되었고, 총 서열 길이는 11,064,059,151 염기쌍이다. Trimmomatic-0.32를 사용하여 Illumina 시퀀싱 어댑터의 서열을 트리밍하고, Seqprep를 사용하여 쌍을 이룬 말단 서열을 중첩시켰으며, bowtie2 (버전 2.2.1)를 사용하여 phiX 오염을 제거하였다 (phiX DNA는 스파이크-인(spike-in) 대조군으로 사용되며, 일반적으로 1% 미만으로 존재함). Trinity 어셈블리 (trinityrnaseq-2.0.2)에는 쌍을 이룬 말단 판독(paired end read) 및 단일 판독이 사용되었다. Trinity에 의해 총 160871개의 콘티그를 어셈블리하였다. 세스퀴테르펜 신타아제를 식별하기 위해, 엔. 자타만시 콘티그를 사용하여 cDNA 서열의 데이터베이스를 생성하였다. 이 데이터베이스에서, 포고스테몬 카블린의 패추롤 신타아제, 발레리아나(Valeriana)의 패추롤 신타아제를 포함하여, 세스퀴테르펜 신타아제의 단백질 서열과 동일성을 나타내는 단백질을 인코딩하는 cDNA 서열을 식별하기 위해 TBLASTN 프로그램을 사용하였다. 엔. 자타만시 cDNA 데이터베이스에서 세스퀴테르펜 신타아제와 유의미한 상동성을 갖는 총 77개의 콘티그가 식별되었다. 이러한 77개의 콘티그는 UniProt 데이터베이스에 존재하는 단백질 서열 (2015년 8월 28일 다운로드됨)에 정렬하기 위해 BLASTX 프로그램을 사용하여 이들을 분석함으로써 추가로 특성화되었고, UniProt에 존재하는 테르펜 신타아제 서열에 대한 상동성에 따라, 이들 중 24개는 추정 세스퀴테르펜 신타아제 서열로 식별되었고, 다른 11개는 추정 모노테르펜 신타아제로 식별되었다. BLASTX 분석에 의해 제공된 정렬에 기초하여, 전장 테르펜 신타아제 단백질을 인코딩하는 오픈 리딩 프레임에 대해 콘티그를 스크리닝하였다. RNA 서열을 인코딩하는 2개의 전장 추정 세스퀴테르펜-신타아제가 식별되었고, 이들 중 하나는 콘티그 27692였다.

실시예 3: 나르도스타키스 자타만시 패추롤 신타아제 (NjPAT)의 클로닝

엔. 자타만시의 cDNA로부터 전장 오픈 리딩 프레임을 증폭시켰다. 표 1에 나타낸 바와 같은 정방향 및 역방향 프라이머는 판독 프레임이 플라스미드 pCDF-DUET-1 (Novagen corporation)에서 His-6 태그의 C-말단에 융합되는 방식으로 전체 오픈 리딩 프레임을 증폭시키도록 설계되고 사용되었다. 총 5개의 상이한 테르펜 신타아제 ORF가 클로닝되었다. 프라이머 27692-Fw (서열 번호: 1) 및 27692-Re (서열 번호: 2)를 사용하여, 2개의 상이한 밀접하게 관련된 cDNA가 클로닝되었다. 이들 중 하나 (pTS11-1)는 상기 기재된 콘티그 27692에 의해 인코딩된 단백질과 비교하여 70개 아미노산이 없는 단백질을 인코딩하였다. 다른 클론 (pTS11-2)은 단백질 서열 번호: 4를 인코딩한 cDNA 서열 (서열 번호: 3)을 포함하였다.

클로닝된 변이체는 TS 삽입체를 시퀀싱하여 분석하였다. 열 충격 형질전환에 의해 상이한 변이체가 화학 적격성 이. 콜라이 BL21-RIL (Stratagene)에 도입되고, 1% 글루코스, 50 ug/ml 스펙티노마이신 및 50 ul/ml 클로람페니콜을 갖는 LB- 한천에서 선별되었다. 형질전환체를 1% 글루코스 50 ug/ml 스펙티노마이신 및 50 ug/ml 클로람페니콜을 갖는 5 ml LB 액체 배지로 옮기고 37℃ 및 250 rpm에서 밤새 성장시켰다.

배양물 중 200 마이크로리터를 100 mL 삼각 플라스크에서 적절한 항생제를 갖는 5 LB 배지 20 mL로 옮기고, A600이 0.4 내지 0.6이 될 때까지 37℃, 250 rpm에서 인큐베이션하였다. 이어서, 1 mM IPTG를 첨가하고 배양물을 18℃ 및 250 rpm에서 밤새 인큐베이션하였다. 다음날, 세포를 원심분리 (10분 8000xg)에 의해 수확하고, 배지를 제거하고, 세포를 1mL 재현탁 버퍼 (50 mM Tris-HCl pH = 7.5, 1.4 mM β-머캅토에탄올; 4℃)에 재현탁시켰다. Fastprep 기계에서 0.2 g의 지르코늄 모래를 사용하여 속도 6.5로 10초 동안 2회 진탕시켜 세포를 파괴시켰다. 불용성 입자는 이후 원심분리 (10분 13,000xg, 4℃)에 의해 제거되었다. 가용성 단백질은 효소 분석에 즉시 사용되었다.

실시예 4: 시험관내 효소 분석

효소 분석을 위해, 유리 튜브에서 800 μL의 MOPSO 버퍼 (15 mM MOPSO (3-[N-모르폴리노]-2-하이드록시프로판 설폰산) pH = 7.0, 12.5% 글리세롤, 1 mM MgCl2, 0.1% 트윈 20, 1 mM 아스코르브산, 1 mM 디티오트레이톨), 100 마이크로리터의 정제된 효소 용액 및 5 μL의 파르네실 디포스페이트 또는 제라닐 디포스페이트 (10 mM, 건조-증발되고 50% 에탄올에 용해된 Sigma FPP) 및 20 μL Na-오르토바나데이트 250 mM을 혼합하였다. 이 혼합물을 2시간 동안 온화한 교반과 함께 30℃에서 인큐베이션하였다. 이어서, 수상을 2 mL 에틸아세테이트로 추출하였다. 에틸아세테이트 상을 수집하고, 1200xg에서 원심분리하고, 황산나트륨 컬럼 상에서 건조시키고, GC-MS로 분석하였다.

GC-MS 분석은 7980A GC 시스템, 597C 불활성 MSD 검출기 (70 eV), 7683 오토-샘플러 및 인젝터, 및 Guardian 전치 컬럼 (5 m)을 갖는 30m 길이 x 0.25 mm 내부 직경 및 0.25 μm 정지상의 Phenomenex Zebron ZB-5ms 컬럼을 포함하는 Agilent Technologies 시스템에서 수행되었다. 이 시스템에서, 1 마이크로리터의 샘플이 주입되었다. 주입 챔버는 250℃였고, 주입은 분할되지 않았으며, ZB5 컬럼은 2분 동안 45℃로 유지된 후, 300℃까지 분당 10℃의 구배가 시작되었다. 총 이온 수의 크로마토그램에서 피크가 검출되었다. 화합물은 질량 스펙트럼과 라이브러리 (NIST8 및 인-하우스(in-house))의 비교와 함께 이들의 체류 지수 및 질량 스펙트럼에 의해 식별되었다.

클론 TS11-2는 이 시험관내 분석에서 패추롤을 생성하며, 따라서 패추롤 신타아제를 인코딩하는 것으로 밝혀졌고, NjPAT로 명명되었다. 밀접하게 관련된 클론 TS11-1은 시험관내 분석에서 어떠한 세스퀴테르펜도 생성하지 않았다.

실시예 5: 용해도 태그가 있는 로도박터 스패로이데스에서의 발현을 위한 NjPAT의 클로닝

프로모터 SPppa의 조절 하에서 상이한 용해도 태그와 조합된 NjPAT 유전자의 발현을 위해, 작제물 SPppa-MBP, SPppa-Fh8, SPppa-SUMO, SPppa-NusA, SPppa-RsTRX 및 SPppa-GST, 및 NjPAT 유전자가 Genscript USA Inc. (Piscataway, New Jersey, USA)에 의해 합성되었다. NjPAT 유전자 (서열 번호: 5) 및 용해도 태그를 코딩하는 모든 서열 모두는 알. 스패로이데스에서의 발현에 대해 코돈 최적화되었다.

플라스미드 p-m-SPppa-MBP-NjPAT-mpmii alt (도 1)를 표준 Infusion® 프로토콜에 따라 얻었다. 간략하게, 작제물 SPppa-MBP를 프라이머 Pppa-Fw (서열 번호: 6)- 및 MBP_NjPAT_Rv (서열 번호: 7)를 사용하여 증폭시켰다. NjPAT를 프라이머 MBP_NjPAT_Fw (서열 번호: 8) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 벡터 p-m-mpmii alt를 제한 효소 EcoRI 및 BamHI로 분해하였다. 이어서, Clontech의 InFusion® 효소 혼합물을 사용하여 앰플리콘 및 분해된 벡터를 어셈블리하였다. 반응 혼합물을 이. 콜라이 S17-1 세포로 형질전환시켰다. 작제물 SPppa-MBP-NjPAT의 뉴클레오티드 서열은 서열 번호: 10에 제공되며; 단백질 서열은 서열 번호: 11로 표시된다.

플라스미드 p-m-SPppa-Fh8-NjPAT-mpmii alt (도 2)를 플라스미드 p-m-SPppa-MBP-NjPAT-mpmii alt와 유사한 방식으로 얻었고; 작제물 SPppa-Fh8을 프라이머 Pppa-Fw (서열 번호: 6)- 및 Fh8_NjPAT_Rv (서열 번호: 12)를 사용하여 증폭시키고 NjPAT 유전자를 프라이머 Fh8_NjPAT_Fw (서열 번호: 13) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 추가의 클로닝 과정은 플라스미드 p-m-SPppa-MBP-NjPAT-mpmii alt와 동일하였다. 작제물 SPppa-Fh8-NjPAT의 뉴클레오티드 서열은 서열 번호: 14에 제공되며; 단백질 서열은 서열 번호: 15로 표시된다.

다른 작제물에 대해서도 동일한 클로닝 절차를 따랐다.

작제물 SPppa-SUMO를 프라이머 Pppa-Fw (서열 번호: 6)- 및 SUMO_NjPAT_Rv (서열 번호: 16)를 사용하여 증폭시키고, NjPAT 유전자를 프라이머 SUMO_NjPAT_Fw (서열 번호: 17) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 작제물 SPppa-SUMO-NjPAT의 뉴클레오티드 서열은 서열 번호: 18에 제공되며; 단백질 서열은 서열 번호: 19로 표시된다. 최종 플라스미드 p-m-SPppa-SUMO-NjPAT-mpmii alt의 지도가 도 3에 도시되어 있다.

작제물 SPppa-NusA를 프라이머 Pppa-Fw (서열 번호: 6)- 및 NusA_NjPAT_Rv (서열 번호: 20)를 사용하여 증폭시키고 NjPAT 유전자를 프라이머 NusA_NjPAT_Fw (서열 번호: 21) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 작제물 SPppa-NusA-NjPAT의 뉴클레오티드 서열은 서열 번호: 22에 제공되며; 단백질 서열은 서열 번호: 23으로 표시된다. 최종 플라스미드 p-m-SPppa-NusA-NjPAT-mpmii alt의 지도가 도 4에 도시되어 있다.

작제물 SPppa-RsTRX를 프라이머 Pppa-Fw (서열 번호: 6)- 및 RsTRX_NjPAT_Rv (서열 번호: 24)를 사용하여 증폭시키고 NjPAT 유전자를 프라이머 RsTRX_NjPAT_Fw (서열 번호: 25) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 작제물 SPppa-RsTRX-NjPAT의 뉴클레오티드 서열은 서열 번호: 26에 제공되며; 단백질 서열은 서열 번호: 27로 표시된다. 최종 플라스미드 p-m-SPppa-RsTRX-NjPAT-mpmii alt의 지도가 도 5에 도시되어 있다.

작제물 SPppa-GST를 프라이머 Pppa-Fw (서열 번호: 6)- 및 GST_NjPAT_Rv (서열 번호: 28)를 사용하여 증폭시키고 NjPAT 유전자를 프라이머 GST_NjPAT_Fw (서열 번호: 29) NjPAT_Rv (서열 번호: 9)로 증폭시켰다. 작제물 SPppa-GST-NjPAT의 뉴클레오티드 서열은 서열 번호: 30에 제공되며; 단백질 서열은 서열 번호: 31로 표시된다. 최종 플라스미드 p-m-SPppa-GST-NjPAT-mpmii alt의 지도가 도 6에 도시되어 있다.

S17-1로부터 알. 스패로이데스 Rs265-9c로의 접합에 의한 플라스미드의 전달은 표준 절차를 사용하여 수행되었다 (특허 US 9260709B2).

실시예 6: 성장 조건 진탕 플라스크 실험.

100mg/L 네오마이신를 갖는 20 ml RS102 배지 (특허 US 9260709B2) 및 글리세롤 스톡 루프가 있는 배플이 없는 100 ml 진탕 플라스크에서 종균 배양을 수행하였다. 플라스크를 110 rpm에서 50 mm의 궤도를 갖는 진탕 인큐베이터에서 30℃에서 72시간 동안 성장시켰다.

72시간 종료시, 배양물의 OD600을 평가하여 더 큰 플라스크로 옮길 정확한 배양량을 계산하였다.

2개의 바닥 배플이 있는 300 ml 진탕 플라스크에서 진탕 플라스크 실험을 수행하였다. 100 mg/L의 최종 농도로 RS102 배지 및 네오마이신 20 ml를 2 ml의 멸균 n-도데칸과 함께 플라스크에 첨가하였다. 접종물 용적을 20 ml 배지에서 0.05의 최종 OD600 값을 얻도록 조정하였다.

플라스크를 110 rpm에서 50 mm의 궤도를 갖는 진탕 인큐베이터에서 30℃에서 72시간 동안 유지시켰다.

실시예 7: 유기상에서 이소프레노이드 함량 분석을 위한 샘플 제조.

접종 후 72시간 후에 배양물을 사전-칭량된 50 ml PP 튜브에 수집한 다음 4500xg에서 20분 동안 원심분리하였다. n-도데칸 층을 추후 GC 분석을 위해 마이크로원심분리 튜브로 옮겼다.

10 마이크로리터의 에틸 라우레이트를 10-ml 유리 바이알에서 칭량하고, 여기에 단리된 도데칸 용액 800 μl를 첨가하고 칭량하였다. 이어서, 더 정확한 GC 분석을 위해 8 ml의 아세톤을 바이알에 첨가하여 도데칸 농도를 희석시켰다. 아세톤 용액 중 약 1.5 ml의 테르펜-함유 도데칸을 크로마토그래피 바이알로 옮겼다.

실시예 8: 기체 크로마토그래피 불꽃 이온화 검출기 (GC-FID)

가스 크로마토그래피는 Restek RTX-5Sil MS 모세관 컬럼 (30 m x 0.25 mm, 0.5 μm)이 장착된 Shimadzu GC2010 Plus에서 수행되었다. 인젝터 및 FID 검출기 온도는 각각 280℃ 및 300℃로 설정되었다. 컬럼을 통한 가스 흐름을 40 mL/분으로 설정하였다. 오븐의 초기 온도는 160℃였고, 2℃/분의 속도로 180℃까지 증가시키고, 추가로 50℃/분의 속도로 300℃까지 증가시키고, 3분 동안 그 온도에서 유지시켰다. 주입된 샘플 용적은 1:50 분할-비율로 1 μL였고, 질소 메이크업 흐름은 30 ml/분이었다.

실시예 9: NjPAT에 의해 생성된 테르펜의 기체 크로마토그래피 정량적 비행 시간 (GC-QTOF) 분석

알. 스패로이데스 배양물로부터의 도데칸 추출물의 스톡 용액을 헥산 중 1 mg/ml로 제조한 다음 메탄올에서 20 μg/ml로 희석하였다.

2 μl의 희석액을 Tenax 튜브로 옮기고, 200 ml/분 헬륨의 스트림으로 2시간 동안 건식퍼지하여 용매를 제거하였다. 테낙스 튜브(Tenax tube)는 240℃에서 5분 동안 Markes 열 탈착기(thermal desorber) (Unity TD100)를 사용하여 멀티베드 패킹을 갖는 콜드트랩 (0℃)으로 탈착되었다. 포획된 물질은 9 ml/분의 분류(splitflow) 및 1.2 ml/분 헬륨의 컬럼 흐름으로 260℃까지 40℃/초로 가열함으로써 주입되었다. 주입된 물질을 Agilent 7890B GC의 DB5 MS 컬럼 (Agilent, 30 M, 0.25 mm id, 1 μm df)에서 분석하였다.

온도 프로그램은 다음과 같았다: 2분 40℃, 이어서 280℃까지 10℃/분으로 상승. 50 내지 350 amu의 질량 범위를 갖는 Agilent 7200 QTOF MS를 사용하여 화합물을 검출하였다.

데이터 분석을 위해 Masshunter (Agilent, 버전 B.07.00)가 사용되었다. NIST 라이브러리 (NIST 버전 2.2 2014)와 비교하여 스펙트럼을 분리하였다(deconvoluted).

실시예 10: 알. 스패로이데스 균주에 의한 테르펜 생산 분석

플라스미드 p-m-SPppa-MBP-NjPAT-mpmii alt를 보유한 로도박터 균주는 테르펜 종, 그 중에서도 패추롤, 포고스톨, 및 놀랍게도 엘레몰 (도 7)의 생산이 가장 많았다. 패추롤과 엘레몰 사이의 비는 6.9:1이었고, 패추롤과 포고스톨 사이의 비는 5.6:1이었고, 마지막으로 포고스톨과 엘레몰 사이의 비는 1.3:1이었다. Fh8 태그의 NjPAT로의 융합은 파르네솔 (FPP의 탈인산화로부터 유래된 생성물)만을 생성할 수 있는 효소를 완전히 불활성화시켰다. 용해도 태그 SUMO를 갖는 NjPAT를 발현시키는 균주로 수득된 역가는 MBP 균주로 수득된 것의 74%였으며, 이는 NusA-NjPAT 균주로부터 유래된 73% 역가와 매우 유사하였다. NjPAT가 GST 또는 RsTRX와 결합될 때 더 낮은 역가가 얻어졌다 (MBP-NjPAT 역가와 비교하여 각각 43% 및 7%)

서열

서열 번호: 1

27692-fw 뉴클레오티드 서열

atatgagctcaATGTCAATTATTATTGCAACAAACAGTACTGAGCATCC

서열 번호: 2

27692-re 뉴클레오티드 서열

atatgcggccgcTTATATGGATACGGGATCTACGAACAACGATATGATGTG

서열 번호: 3

NjPAT 뉴클레오티드 서열

서열 번호: 4

NjPAT 아미노산 서열

서열 번호: 5

NjPAT 코돈 최적화된 뉴클레오티드 서열

서열 번호: 6

Pppa_Fw 뉴클레오티드 서열

actggcctcagaattcAAAtttatttgctttgtgagcggataac

서열 번호: 7

MBP_NjPAT_Rv 뉴클레오티드 서열

GGCGATGATGATCGACATGATCTTG

서열 번호: 8

MBP_NjPAT_Fw 뉴클레오티드 서열

CAAGATCATGTCGATCATCATCGC

서열 번호: 9

NjPAT_Rv 뉴클레오티드 서열

tttatgatttggatcCTCAGATGCTGACGGGGT

서열 번호: 10

SPppa-MBP-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 MBP이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 11

MBP-NjPAT 아미노산 서열

밑줄친 서열은 MBP 태그이다

서열 번호: 12

Fh8_NjPAT_Rv 뉴클레오티드 서열

GATCGACATCGACGAGAGGATCGAG

서열 번호: 13

Fh8_NjPAT_Fw 뉴클레오티드 서열

CTCGTCGATGTCGATCATCATCGCC

서열 번호: 14

SPppa-Fh8-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 Fh8이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 15

Fh8-NjPAT 아미노산 서열

밑줄친 서열은 Fh8 태그이다

서열 번호: 16

SUMO_NjPAT_Rv 뉴클레오티드 서열

GATCGACATGCCGATCTGCTCGCG

서열 번호: 17

SUMO_NjPAT_Fw 뉴클레오티드 서열

GATCGGCATGTCGATCATCATCGCC

서열 번호: 18

SPppa-SUMO-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 SUMO이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 19

SUMO-NjPAT 아미노산 서열

밑줄친 서열은 SUMO 태그이다

서열 번호: 20

NusA_NjPAT_Rv 뉴클레오티드 서열

TGATCGACATCGCCTCGTCGCCGAAC

서열 번호: 21

NusA_NjPAT_Fw 뉴클레오티드 서열

CGAGGCGATGTCGATCATCATCGCC

서열 번호: 22

SPppa-NusA-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 NusA이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 23

NusA-NjPAT 아미노산 서열

밑줄친 서열은 NusA 태그이다

서열 번호: 24

RsTRX_NjPAT_Rv 뉴클레오티드 서열

TGATCGACATGAGCGCCGAGGCGATC

서열 번호: 25

RsTRX_NjPAT_Fw 뉴클레오티드 서열

ggcgctcATGTCGATCATCATCGCC

서열 번호: 26

SPppa-RsTRX-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 RsTRX이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 27

RsTRX-NjPAT 아미노산 서열

밑줄친 서열은 RsTRX 태그이다

서열 번호: 28

GST_NjPAT_Rv 뉴클레오티드 서열

ATCGACATCTTGGGCGGATGG

서열 번호: 29

GST_NjPAT_Fw 뉴클레오티드 서열

GCCCAAGATGTCGATCATCATCGCC

서열 번호: 30

SPppa-GST-NjPAT 뉴클레오티드 서열

이탤릭체의 서열은 SPppa 프로모터이고; 밑줄친 서열은 코돈 최적화된 GST이고 정상 폰트의 서열은 코돈 최적화된 NjPAT이다.

서열 번호: 31

GST-NjPAT 아미노산 서열

밑줄친 서열은 GST 태그이다

<110> Isobionics B.V. <120> Terpene Synthase producing Patchoulol, Pogostol and Elemol <130> 0005.0008.PC01 <150> NL2019473 <151> 2017-09-01 <160> 31 <170> KoPatentIn version 3.0 <210> 1 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> 27692-fw Nucleotide sequence <400> 1 atatgagctc aatgtcaatt attattgcaa caaacagtac tgagcatcc 49 <210> 2 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> 27692-re Nucleotide sequence <400> 2 atatgcggcc gcttatatgg atacgggatc tacgaacaac gatatgatgt g 51 <210> 3 <211> 1677 <212> DNA <213> Nardostachys jatamansii <400> 3 atgtcaatta ttattgcaac aaacagtact gagcatccaa tttttcgtcc attagcaaat 60 tttccaccaa gtttatgggg caatcttttc acttcattct ccatggataa tcaggctagg 120 gaaatatatg ctaaagaaca tgaaggttta aaagaaaaag tgagaatgat gtttttagat 180 acaacaaatt acaaaatttc agagaaaatc aatttcataa acacagtgga aagattaggt 240 gtatcatatc attttgagaa agagattgaa gaactacttc atcaaatgtt tgatgctcat 300 tctaaacacc tagatgatat tcaagaattt gatttgttca ctttgggaat ttacttcagg 360 attctaaggc aacatggtta taaaatctct tgtgatgttt tcaataagtt gaaagatagc 420 aatggcgaat tcaaggacga acttaaagat gatgtgaatg gtatgctaag tttctatgaa 480 gcaacacatg taagaacaca tggagaaaat attttagatg aagctctcat ttatacaaaa 540 gctcaacttg aatccatggc cgctgcaagt ttaagcccat ttctcgcgaa ccaagttaag 600 catgctttga tgcaagctct ccacaaaggg atcccaagaa tcgaagcacg taactatatc 660 tctgtttacg aagaagatcc taacaaaaat gatttgttat tgaggttctc aaagatagat 720 ttcaatctag tacaaatgat tcacaagcaa gaattgtgcg atacctttag gtggtggaaa 780 gatttggagt tcgaatcgaa actatctttt gcaaggaata gagtggtgga agcctactta 840 tggactctta gcgcgtacta cgaaccaaaa tactcttccg ctcggattat attagtcaaa 900 ctaatggtta taatatctgt tacggatgac acatatgatg catatggtac attagatgaa 960 cttcaacttt ttacagatgc aatacaaagg ttggatatga gttctatcaa tcaacttcca 1020 gattacatga agaccatcta taaagctctc ctagatcttt ttgacgaaat agaagatcga 1080 ttatcgaagc atgaaactga tcattcttac cgcgttgctt atgcgaaata tgtgtataaa 1140 gagatcgtta ggtgctacga tatggagtac aaatggttca acaaaaatta cgtgccggca 1200 tttgaagaat atatgcagaa agcgttagtc acatcaggta accgtttgct cataacgttt 1260 tcctttctgg gaatggacga agtcgcaact attcaagcgt tcgagtgggt aaaaagtaat 1320 gccaaaatga tagtctcttc caataaagta ttacgactta ttgatgacat aatgagtcac 1380 gaggaagagg atgaaagggg acatgttgca acagggattg aatgctttgt aaaagaacat 1440 ggactaacta gggaagaggt tatcgttgaa tttcataaga ggattgatga tgcttggaag 1500 gatataaatg aggaatttat aacgccaaat aatttaccga ttgagatact tacgcgtgtt 1560 ctaaacctta caagaattgg agatgttgtt tacaagtatg atgacgggta tactcatccg 1620 gagaaagcgt tgaaagatca catcatatcg ttgttcgtag atcccgtatc catataa 1677 <210> 4 <211> 558 <212> PRT <213> Nardostachys jatamansii <400> 4 Met Ser Ile Ile Ile Ala Thr Asn Ser Thr Glu His Pro Ile Phe Arg 1 5 10 15 Pro Leu Ala Asn Phe Pro Pro Ser Leu Trp Gly Asn Leu Phe Thr Ser 20 25 30 Phe Ser Met Asp Asn Gln Ala Arg Glu Ile Tyr Ala Lys Glu His Glu 35 40 45 Gly Leu Lys Glu Lys Val Arg Met Met Phe Leu Asp Thr Thr Asn Tyr 50 55 60 Lys Ile Ser Glu Lys Ile Asn Phe Ile Asn Thr Val Glu Arg Leu Gly 65 70 75 80 Val Ser Tyr His Phe Glu Lys Glu Ile Glu Glu Leu Leu His Gln Met 85 90 95 Phe Asp Ala His Ser Lys His Leu Asp Asp Ile Gln Glu Phe Asp Leu 100 105 110 Phe Thr Leu Gly Ile Tyr Phe Arg Ile Leu Arg Gln His Gly Tyr Lys 115 120 125 Ile Ser Cys Asp Val Phe Asn Lys Leu Lys Asp Ser Asn Gly Glu Phe 130 135 140 Lys Asp Glu Leu Lys Asp Asp Val Asn Gly Met Leu Ser Phe Tyr Glu 145 150 155 160 Ala Thr His Val Arg Thr His Gly Glu Asn Ile Leu Asp Glu Ala Leu 165 170 175 Ile Tyr Thr Lys Ala Gln Leu Glu Ser Met Ala Ala Ala Ser Leu Ser 180 185 190 Pro Phe Leu Ala Asn Gln Val Lys His Ala Leu Met Gln Ala Leu His 195 200 205 Lys Gly Ile Pro Arg Ile Glu Ala Arg Asn Tyr Ile Ser Val Tyr Glu 210 215 220 Glu Asp Pro Asn Lys Asn Asp Leu Leu Leu Arg Phe Ser Lys Ile Asp 225 230 235 240 Phe Asn Leu Val Gln Met Ile His Lys Gln Glu Leu Cys Asp Thr Phe 245 250 255 Arg Trp Trp Lys Asp Leu Glu Phe Glu Ser Lys Leu Ser Phe Ala Arg 260 265 270 Asn Arg Val Val Glu Ala Tyr Leu Trp Thr Leu Ser Ala Tyr Tyr Glu 275 280 285 Pro Lys Tyr Ser Ser Ala Arg Ile Ile Leu Val Lys Leu Met Val Ile 290 295 300 Ile Ser Val Thr Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Leu Asp Glu 305 310 315 320 Leu Gln Leu Phe Thr Asp Ala Ile Gln Arg Leu Asp Met Ser Ser Ile 325 330 335 Asn Gln Leu Pro Asp Tyr Met Lys Thr Ile Tyr Lys Ala Leu Leu Asp 340 345 350 Leu Phe Asp Glu Ile Glu Asp Arg Leu Ser Lys His Glu Thr Asp His 355 360 365 Ser Tyr Arg Val Ala Tyr Ala Lys Tyr Val Tyr Lys Glu Ile Val Arg 370 375 380 Cys Tyr Asp Met Glu Tyr Lys Trp Phe Asn Lys Asn Tyr Val Pro Ala 385 390 395 400 Phe Glu Glu Tyr Met Gln Lys Ala Leu Val Thr Ser Gly Asn Arg Leu 405 410 415 Leu Ile Thr Phe Ser Phe Leu Gly Met Asp Glu Val Ala Thr Ile Gln 420 425 430 Ala Phe Glu Trp Val Lys Ser Asn Ala Lys Met Ile Val Ser Ser Asn 435 440 445 Lys Val Leu Arg Leu Ile Asp Asp Ile Met Ser His Glu Glu Glu Asp 450 455 460 Glu Arg Gly His Val Ala Thr Gly Ile Glu Cys Phe Val Lys Glu His 465 470 475 480 Gly Leu Thr Arg Glu Glu Val Ile Val Glu Phe His Lys Arg Ile Asp 485 490 495 Asp Ala Trp Lys Asp Ile Asn Glu Glu Phe Ile Thr Pro Asn Asn Leu 500 505 510 Pro Ile Glu Ile Leu Thr Arg Val Leu Asn Leu Thr Arg Ile Gly Asp 515 520 525 Val Val Tyr Lys Tyr Asp Asp Gly Tyr Thr His Pro Glu Lys Ala Leu 530 535 540 Lys Asp His Ile Ile Ser Leu Phe Val Asp Pro Val Ser Ile 545 550 555 <210> 5 <211> 1677 <212> DNA <213> Artificial Sequence <220> <223> NjPAT codon optimized Nucleotide sequence <400> 5 atgtcgatca tcatcgccac caacagcacc gagcatccca tcttccgccc gctcgccaac 60 ttcccgccgt cgctctgggg caacctgttc acctcgttca gcatggacaa ccaggcgcgc 120 gagatctacg ccaaggagca cgagggcctc aaggagaagg tccggatgat gttcctggac 180 accacgaact acaagatctc ggagaagatc aacttcatca acaccgtcga gcgcctgggc 240 gtgagctatc acttcgagaa ggagatcgag gagctgctcc atcagatgtt cgacgcccac 300 tcgaagcatc tggacgacat ccaggagttc gacctcttca cgctgggcat ctacttccgc 360 atcctgcggc agcatggcta taagatctcg tgcgacgtct tcaacaagct gaaggacagc 420 aacggcgagt tcaaggacga gctcaaggac gacgtcaacg gcatgctgtc gttctatgag 480 gccacccatg tgcgcaccca tggcgagaac atcctcgacg aggcgctgat ctacacgaag 540 gcccagctgg agtcgatggc ggccgcctcg ctcagcccgt tcctggccaa ccaggtgaag 600 cacgcgctca tgcaggccct gcataagggc atcccgcgca tcgaggcgcg gaactacatc 660 tcggtctatg aggaagaccc gaacaagaac gacctgctcc tgcgcttcag caagatcgac 720 ttcaacctgg tgcagatgat ccacaagcag gagctgtgcg acaccttccg gtggtggaag 780 gacctggagt tcgagtcgaa gctgtcgttc gcccgcaacc gggtggtgga ggcctacctc 840 tggacgctgt cggcgtacta tgagccgaag tattcgagcg cccgcatcat cctcgtgaag 900 ctgatggtca tcatctcggt gaccgacgac acgtacgacg cctatggcac cctggacgag 960 ctccagctgt tcacggacgc gatccagcgc ctcgacatgt cgagcatcaa ccagctgccc 1020 gactacatga agaccatcta taaggcgctc ctggacctct tcgacgagat cgaggaccgc 1080 ctgtcgaagc acgagacgga ccatagctac cgggtggcgt atgccaagta cgtctataag 1140 gagatcgtgc gctgctacga catggagtat aagtggttca acaagaacta cgtccccgcc 1200 ttcgaggagt atatgcagaa ggccctggtg acctcgggca accggctcct gatcacgttc 1260 agcttcctgg gcatggacga ggtcgcgacc atccaggcct tcgagtgggt gaagtcgaac 1320 gccaagatga tcgtgtcgtc gaacaaggtg ctccgcctga tcgacgacat catgtcgcac 1380 gaggaagagg acgagcgcgg ccatgtggcc acgggcatcg agtgcttcgt gaaggagcac 1440 ggcctgaccc gcgaggaagt gatcgtcgag ttccataagc ggatcgacga cgcgtggaag 1500 gacatcaacg aggagttcat caccccgaac aacctgccga tcgagatcct gacccgcgtg 1560 ctcaacctga cccggatcgg cgacgtggtc tacaagtatg acgacggcta cacgcacccc 1620 gagaaggccc tcaaggacca tatcatcagc ctgttcgtgg accccgtcag catctga 1677 <210> 6 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Pppa_Fw Nucleotide sequence <400> 6 actggcctca gaattcaaat ttatttgctt tgtgagcgga taac 44 <210> 7 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> MBP_NjPAT_Rv Nucleotide sequence <400> 7 ggcgatgatg atcgacatga tcttg 25 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> MBP_NjPAT_Fw Nucleotide sequence <400> 8 caagatcatg tcgatcatca tcgc 24 <210> 9 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> NjPAT_Rv Nucleotide sequence <400> 9 tttatgattt ggatcctcag atgctgacgg ggt 33 <210> 10 <211> 2886 <212> DNA <213> Artificial Sequence <220> <223> SPppa-MBP-NjPAT Nucleotide sequence <400> 10 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg aagatcgagg aaggcaagct cgtgatctgg 120 atcaacggcg acaagggcta caacggcctg gccgaggtgg gcaagaagtt cgagaaggac 180 accggcatca aggtgacggt ggagcacccg gacaagctcg aggagaagtt cccgcaggtg 240 gcggccacgg gcgacggccc ggacatcatc ttctgggccc atgaccgctt cggcggctac 300 gcccagtcgg gcctgctggc cgagatcacc ccggacaagg cgttccagga caagctctat 360 cccttcacgt gggacgccgt gcgctacaac ggcaagctga tcgcgtatcc catcgcggtg 420 gaggccctgt cgctcatcta taacaaggac ctgctcccga acccgcccaa gacctgggag 480 gagatccccg ccctcgacaa ggagctgaag gccaagggca agtcggcgct catgttcaac 540 ctgcaggagc cgtacttcac ctggcccctg atcgcggccg acggcggcta cgcgttcaag 600 tatgagaacg gcaagtatga catcaaggac gtgggcgtgg acaacgcggg cgccaaggcc 660 ggcctgacct tcctcgtgga cctgatcaag aacaagcaca tgaacgccga cacggactac 720 tcgatcgcgg aggccgcgtt caacaagggc gagaccgcca tgacgatcaa cggcccgtgg 780 gcgtggtcga acatcgacac ctcgaaggtg aactatggcg tgaccgtgct ccccacgttc 840 aagggccagc cctcgaagcc cttcgtgggc gtgctgtcgg cgggcatcaa cgccgcgtcg 900 ccgaacaagg agctcgcgaa ggagttcctg gagaactacc tgctcaccga cgagggcctg 960 gaggccgtga acaaggacaa gcccctgggc gccgtggccc tgaagtcgta tgaggaagag 1020 ctggtgaagg acccgcgcat cgcggccacc atggagaacg cgcagaaggg cgagatcatg 1080 ccgaacatcc cccagatgtc ggccttctgg tatgcggtgc gcaccgccgt gatcaacgcg 1140 gcctcgggcc gccagaccgt ggacgaggcc ctcaaggacg cccagaccgg cgacgacgac 1200 gacaagatca tgtcgatcat catcgccacc aacagcaccg agcatcccat cttccgcccg 1260 ctcgccaact tcccgccgtc gctctggggc aacctgttca cctcgttcag catggacaac 1320 caggcgcgcg agatctacgc caaggagcac gagggcctca aggagaaggt ccggatgatg 1380 ttcctggaca ccacgaacta caagatctcg gagaagatca acttcatcaa caccgtcgag 1440 cgcctgggcg tgagctatca cttcgagaag gagatcgagg agctgctcca tcagatgttc 1500 gacgcccact cgaagcatct ggacgacatc caggagttcg acctcttcac gctgggcatc 1560 tacttccgca tcctgcggca gcatggctat aagatctcgt gcgacgtctt caacaagctg 1620 aaggacagca acggcgagtt caaggacgag ctcaaggacg acgtcaacgg catgctgtcg 1680 ttctatgagg ccacccatgt gcgcacccat ggcgagaaca tcctcgacga ggcgctgatc 1740 tacacgaagg cccagctgga gtcgatggcg gccgcctcgc tcagcccgtt cctggccaac 1800 caggtgaagc acgcgctcat gcaggccctg cataagggca tcccgcgcat cgaggcgcgg 1860 aactacatct cggtctatga ggaagacccg aacaagaacg acctgctcct gcgcttcagc 1920 aagatcgact tcaacctggt gcagatgatc cacaagcagg agctgtgcga caccttccgg 1980 tggtggaagg acctggagtt cgagtcgaag ctgtcgttcg cccgcaaccg ggtggtggag 2040 gcctacctct ggacgctgtc ggcgtactat gagccgaagt attcgagcgc ccgcatcatc 2100 ctcgtgaagc tgatggtcat catctcggtg accgacgaca cgtacgacgc ctatggcacc 2160 ctggacgagc tccagctgtt cacggacgcg atccagcgcc tcgacatgtc gagcatcaac 2220 cagctgcccg actacatgaa gaccatctat aaggcgctcc tggacctctt cgacgagatc 2280 gaggaccgcc tgtcgaagca cgagacggac catagctacc gggtggcgta tgccaagtac 2340 gtctataagg agatcgtgcg ctgctacgac atggagtata agtggttcaa caagaactac 2400 gtccccgcct tcgaggagta tatgcagaag gccctggtga cctcgggcaa ccggctcctg 2460 atcacgttca gcttcctggg catggacgag gtcgcgacca tccaggcctt cgagtgggtg 2520 aagtcgaacg ccaagatgat cgtgtcgtcg aacaaggtgc tccgcctgat cgacgacatc 2580 atgtcgcacg aggaagagga cgagcgcggc catgtggcca cgggcatcga gtgcttcgtg 2640 aaggagcacg gcctgacccg cgaggaagtg atcgtcgagt tccataagcg gatcgacgac 2700 gcgtggaagg acatcaacga ggagttcatc accccgaaca acctgccgat cgagatcctg 2760 acccgcgtgc tcaacctgac ccggatcggc gacgtggtct acaagtatga cgacggctac 2820 acgcaccccg agaaggccct caaggaccat atcatcagcc tgttcgtgga ccccgtcagc 2880 atctga 2886 <210> 11 <211> 932 <212> PRT <213> Artificial Sequence <220> <223> MBP-NjPAT Aminoacid sequence <400> 11 Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys 1 5 10 15 Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr 20 25 30 Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe 35 40 45 Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala 50 55 60 His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile 65 70 75 80 Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp 85 90 95 Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu 100 105 110 Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys 115 120 125 Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly 130 135 140 Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro 145 150 155 160 Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys 165 170 175 Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly 180 185 190 Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp 195 200 205 Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala 210 215 220 Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys 225 230 235 240 Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser 245 250 255 Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro 260 265 270 Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp 275 280 285 Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala 290 295 300 Leu Lys Ser Tyr Glu Glu Glu Leu Val Lys Asp Pro Arg Ile Ala Ala 305 310 315 320 Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln 325 330 335 Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala 340 345 350 Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Gly 355 360 365 Asp Asp Asp Asp Lys Ile Met Ser Ile Ile Ile Ala Thr Asn Ser Thr 370 375 380 Glu His Pro Ile Phe Arg Pro Leu Ala Asn Phe Pro Pro Ser Leu Trp 385 390 395 400 Gly Asn Leu Phe Thr Ser Phe Ser Met Asp Asn Gln Ala Arg Glu Ile 405 410 415 Tyr Ala Lys Glu His Glu Gly Leu Lys Glu Lys Val Arg Met Met Phe 420 425 430 Leu Asp Thr Thr Asn Tyr Lys Ile Ser Glu Lys Ile Asn Phe Ile Asn 435 440 445 Thr Val Glu Arg Leu Gly Val Ser Tyr His Phe Glu Lys Glu Ile Glu 450 455 460 Glu Leu Leu His Gln Met Phe Asp Ala His Ser Lys His Leu Asp Asp 465 470 475 480 Ile Gln Glu Phe Asp Leu Phe Thr Leu Gly Ile Tyr Phe Arg Ile Leu 485 490 495 Arg Gln His Gly Tyr Lys Ile Ser Cys Asp Val Phe Asn Lys Leu Lys 500 505 510 Asp Ser Asn Gly Glu Phe Lys Asp Glu Leu Lys Asp Asp Val Asn Gly 515 520 525 Met Leu Ser Phe Tyr Glu Ala Thr His Val Arg Thr His Gly Glu Asn 530 535 540 Ile Leu Asp Glu Ala Leu Ile Tyr Thr Lys Ala Gln Leu Glu Ser Met 545 550 555 560 Ala Ala Ala Ser Leu Ser Pro Phe Leu Ala Asn Gln Val Lys His Ala 565 570 575 Leu Met Gln Ala Leu His Lys Gly Ile Pro Arg Ile Glu Ala Arg Asn 580 585 590 Tyr Ile Ser Val Tyr Glu Glu Asp Pro Asn Lys Asn Asp Leu Leu Leu 595 600 605 Arg Phe Ser Lys Ile Asp Phe Asn Leu Val Gln Met Ile His Lys Gln 610 615 620 Glu Leu Cys Asp Thr Phe Arg Trp Trp Lys Asp Leu Glu Phe Glu Ser 625 630 635 640 Lys Leu Ser Phe Ala Arg Asn Arg Val Val Glu Ala Tyr Leu Trp Thr 645 650 655 Leu Ser Ala Tyr Tyr Glu Pro Lys Tyr Ser Ser Ala Arg Ile Ile Leu 660 665 670 Val Lys Leu Met Val Ile Ile Ser Val Thr Asp Asp Thr Tyr Asp Ala 675 680 685 Tyr Gly Thr Leu Asp Glu Leu Gln Leu Phe Thr Asp Ala Ile Gln Arg 690 695 700 Leu Asp Met Ser Ser Ile Asn Gln Leu Pro Asp Tyr Met Lys Thr Ile 705 710 715 720 Tyr Lys Ala Leu Leu Asp Leu Phe Asp Glu Ile Glu Asp Arg Leu Ser 725 730 735 Lys His Glu Thr Asp His Ser Tyr Arg Val Ala Tyr Ala Lys Tyr Val 740 745 750 Tyr Lys Glu Ile Val Arg Cys Tyr Asp Met Glu Tyr Lys Trp Phe Asn 755 760 765 Lys Asn Tyr Val Pro Ala Phe Glu Glu Tyr Met Gln Lys Ala Leu Val 770 775 780 Thr Ser Gly Asn Arg Leu Leu Ile Thr Phe Ser Phe Leu Gly Met Asp 785 790 795 800 Glu Val Ala Thr Ile Gln Ala Phe Glu Trp Val Lys Ser Asn Ala Lys 805 810 815 Met Ile Val Ser Ser Asn Lys Val Leu Arg Leu Ile Asp Asp Ile Met 820 825 830 Ser His Glu Glu Glu Asp Glu Arg Gly His Val Ala Thr Gly Ile Glu 835 840 845 Cys Phe Val Lys Glu His Gly Leu Thr Arg Glu Glu Val Ile Val Glu 850 855 860 Phe His Lys Arg Ile Asp Asp Ala Trp Lys Asp Ile Asn Glu Glu Phe 865 870 875 880 Ile Thr Pro Asn Asn Leu Pro Ile Glu Ile Leu Thr Arg Val Leu Asn 885 890 895 Leu Thr Arg Ile Gly Asp Val Val Tyr Lys Tyr Asp Asp Gly Tyr Thr 900 905 910 His Pro Glu Lys Ala Leu Lys Asp His Ile Ile Ser Leu Phe Val Asp 915 920 925 Pro Val Ser Ile 930 <210> 12 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Fh8_NjPAT_Rv Nucleotide sequence <400> 12 gatcgacatc gacgagagga tcgag 25 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Fh8_NjPAT_Fw Nucleotide sequence <400> 13 ctcgtcgatg tcgatcatca tcgcc 25 <210> 14 <211> 1971 <212> DNA <213> Artificial Sequence <220> <223> SPppa- Fh8-NjPAT Nucleotide sequence <400> 14 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg ccctcggtgc aagaggtgga gaagctgctg 120 catgtgctgg accggaacgg cgacggcaag gtgtcggcgg aggagctgaa ggcgttcgcc 180 gacgactcga agtgcccgct ggactcgaac aagatcaagg cgttcatcaa ggagcatgac 240 aagaacaagg acggcaagct ggacctcaag gagctggtct cgatcctctc gtcgatgtcg 300 atcatcatcg ccaccaacag caccgagcat cccatcttcc gcccgctcgc caacttcccg 360 ccgtcgctct ggggcaacct gttcacctcg ttcagcatgg acaaccaggc gcgcgagatc 420 tacgccaagg agcacgaggg cctcaaggag aaggtccgga tgatgttcct ggacaccacg 480 aactacaaga tctcggagaa gatcaacttc atcaacaccg tcgagcgcct gggcgtgagc 540 tatcacttcg agaaggagat cgaggagctg ctccatcaga tgttcgacgc ccactcgaag 600 catctggacg acatccagga gttcgacctc ttcacgctgg gcatctactt ccgcatcctg 660 cggcagcatg gctataagat ctcgtgcgac gtcttcaaca agctgaagga cagcaacggc 720 gagttcaagg acgagctcaa ggacgacgtc aacggcatgc tgtcgttcta tgaggccacc 780 catgtgcgca cccatggcga gaacatcctc gacgaggcgc tgatctacac gaaggcccag 840 ctggagtcga tggcggccgc ctcgctcagc ccgttcctgg ccaaccaggt gaagcacgcg 900 ctcatgcagg ccctgcataa gggcatcccg cgcatcgagg cgcggaacta catctcggtc 960 tatgaggaag acccgaacaa gaacgacctg ctcctgcgct tcagcaagat cgacttcaac 1020 ctggtgcaga tgatccacaa gcaggagctg tgcgacacct tccggtggtg gaaggacctg 1080 gagttcgagt cgaagctgtc gttcgcccgc aaccgggtgg tggaggccta cctctggacg 1140 ctgtcggcgt actatgagcc gaagtattcg agcgcccgca tcatcctcgt gaagctgatg 1200 gtcatcatct cggtgaccga cgacacgtac gacgcctatg gcaccctgga cgagctccag 1260 ctgttcacgg acgcgatcca gcgcctcgac atgtcgagca tcaaccagct gcccgactac 1320 atgaagacca tctataaggc gctcctggac ctcttcgacg agatcgagga ccgcctgtcg 1380 aagcacgaga cggaccatag ctaccgggtg gcgtatgcca agtacgtcta taaggagatc 1440 gtgcgctgct acgacatgga gtataagtgg ttcaacaaga actacgtccc cgccttcgag 1500 gagtatatgc agaaggccct ggtgacctcg ggcaaccggc tcctgatcac gttcagcttc 1560 ctgggcatgg acgaggtcgc gaccatccag gccttcgagt gggtgaagtc gaacgccaag 1620 atgatcgtgt cgtcgaacaa ggtgctccgc ctgatcgacg acatcatgtc gcacgaggaa 1680 gaggacgagc gcggccatgt ggccacgggc atcgagtgct tcgtgaagga gcacggcctg 1740 acccgcgagg aagtgatcgt cgagttccat aagcggatcg acgacgcgtg gaaggacatc 1800 aacgaggagt tcatcacccc gaacaacctg ccgatcgaga tcctgacccg cgtgctcaac 1860 ctgacccgga tcggcgacgt ggtctacaag tatgacgacg gctacacgca ccccgagaag 1920 gccctcaagg accatatcat cagcctgttc gtggaccccg tcagcatctg a 1971 <210> 15 <211> 627 <212> PRT <213> Artificial Sequence <220> <223> Fh8-NjPAT Aminoacid sequence <400> 15 Met Pro Ser Val Gln Glu Val Glu Lys Leu Leu His Val Leu Asp Arg 1 5 10 15 Asn Gly Asp Gly Lys Val Ser Ala Glu Glu Leu Lys Ala Phe Ala Asp 20 25 30 Asp Ser Lys Cys Pro Leu Asp Ser Asn Lys Ile Lys Ala Phe Ile Lys 35 40 45 Glu His Asp Lys Asn Lys Asp Gly Lys Leu Asp Leu Lys Glu Leu Val 50 55 60 Ser Ile Leu Ser Ser Met Ser Ile Ile Ile Ala Thr Asn Ser Thr Glu 65 70 75 80 His Pro Ile Phe Arg Pro Leu Ala Asn Phe Pro Pro Ser Leu Trp Gly 85 90 95 Asn Leu Phe Thr Ser Phe Ser Met Asp Asn Gln Ala Arg Glu Ile Tyr 100 105 110 Ala Lys Glu His Glu Gly Leu Lys Glu Lys Val Arg Met Met Phe Leu 115 120 125 Asp Thr Thr Asn Tyr Lys Ile Ser Glu Lys Ile Asn Phe Ile Asn Thr 130 135 140 Val Glu Arg Leu Gly Val Ser Tyr His Phe Glu Lys Glu Ile Glu Glu 145 150 155 160 Leu Leu His Gln Met Phe Asp Ala His Ser Lys His Leu Asp Asp Ile 165 170 175 Gln Glu Phe Asp Leu Phe Thr Leu Gly Ile Tyr Phe Arg Ile Leu Arg 180 185 190 Gln His Gly Tyr Lys Ile Ser Cys Asp Val Phe Asn Lys Leu Lys Asp 195 200 205 Ser Asn Gly Glu Phe Lys Asp Glu Leu Lys Asp Asp Val Asn Gly Met 210 215 220 Leu Ser Phe Tyr Glu Ala Thr His Val Arg Thr His Gly Glu Asn Ile 225 230 235 240 Leu Asp Glu Ala Leu Ile Tyr Thr Lys Ala Gln Leu Glu Ser Met Ala 245 250 255 Ala Ala Ser Leu Ser Pro Phe Leu Ala Asn Gln Val Lys His Ala Leu 260 265 270 Met Gln Ala Leu His Lys Gly Ile Pro Arg Ile Glu Ala Arg Asn Tyr 275 280 285 Ile Ser Val Tyr Glu Glu Asp Pro Asn Lys Asn Asp Leu Leu Leu Arg 290 295 300 Phe Ser Lys Ile Asp Phe Asn Leu Val Gln Met Ile His Lys Gln Glu 305 310 315 320 Leu Cys Asp Thr Phe Arg Trp Trp Lys Asp Leu Glu Phe Glu Ser Lys 325 330 335 Leu Ser Phe Ala Arg Asn Arg Val Val Glu Ala Tyr Leu Trp Thr Leu 340 345 350 Ser Ala Tyr Tyr Glu Pro Lys Tyr Ser Ser Ala Arg Ile Ile Leu Val 355 360 365 Lys Leu Met Val Ile Ile Ser Val Thr Asp Asp Thr Tyr Asp Ala Tyr 370 375 380 Gly Thr Leu Asp Glu Leu Gln Leu Phe Thr Asp Ala Ile Gln Arg Leu 385 390 395 400 Asp Met Ser Ser Ile Asn Gln Leu Pro Asp Tyr Met Lys Thr Ile Tyr 405 410 415 Lys Ala Leu Leu Asp Leu Phe Asp Glu Ile Glu Asp Arg Leu Ser Lys 420 425 430 His Glu Thr Asp His Ser Tyr Arg Val Ala Tyr Ala Lys Tyr Val Tyr 435 440 445 Lys Glu Ile Val Arg Cys Tyr Asp Met Glu Tyr Lys Trp Phe Asn Lys 450 455 460 Asn Tyr Val Pro Ala Phe Glu Glu Tyr Met Gln Lys Ala Leu Val Thr 465 470 475 480 Ser Gly Asn Arg Leu Leu Ile Thr Phe Ser Phe Leu Gly Met Asp Glu 485 490 495 Val Ala Thr Ile Gln Ala Phe Glu Trp Val Lys Ser Asn Ala Lys Met 500 505 510 Ile Val Ser Ser Asn Lys Val Leu Arg Leu Ile Asp Asp Ile Met Ser 515 520 525 His Glu Glu Glu Asp Glu Arg Gly His Val Ala Thr Gly Ile Glu Cys 530 535 540 Phe Val Lys Glu His Gly Leu Thr Arg Glu Glu Val Ile Val Glu Phe 545 550 555 560 His Lys Arg Ile Asp Asp Ala Trp Lys Asp Ile Asn Glu Glu Phe Ile 565 570 575 Thr Pro Asn Asn Leu Pro Ile Glu Ile Leu Thr Arg Val Leu Asn Leu 580 585 590 Thr Arg Ile Gly Asp Val Val Tyr Lys Tyr Asp Asp Gly Tyr Thr His 595 600 605 Pro Glu Lys Ala Leu Lys Asp His Ile Ile Ser Leu Phe Val Asp Pro 610 615 620 Val Ser Ile 625 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> SUMO_NjPAT_Rv Nucleotide sequence <400> 16 gatcgacatg ccgatctgct cgcg 24 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SUMO_NjPAT_Fw Nucleotide sequence <400> 17 gatcggcatg tcgatcatca tcgcc 25 <210> 18 <211> 2055 <212> DNA <213> Artificial Sequence <220> <223> SPppa-SUMO-NjPAT Nucleotide sequence <400> 18 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg tcggacagcg aggtgaacca ggaagccaag 120 cccgaggtga agcccgaggt gaagccggag acccacatca acctgaaggt gtcggacggc 180 tcgtcggaga tcttcttcaa gatcaagaag accacgcccc tgcgccgcct catggaggcc 240 ttcgccaagc gccagggcaa ggagatggac tcgctgcgct tcctctacga cggcatccgc 300 atccaggcgg accagacgcc ggaggacctc gacatggagg acaacgacat catcgaggcg 360 catcgcgagc agatcggcat gtcgatcatc atcgccacca acagcaccga gcatcccatc 420 ttccgcccgc tcgccaactt cccgccgtcg ctctggggca acctgttcac ctcgttcagc 480 atggacaacc aggcgcgcga gatctacgcc aaggagcacg agggcctcaa ggagaaggtc 540 cggatgatgt tcctggacac cacgaactac aagatctcgg agaagatcaa cttcatcaac 600 accgtcgagc gcctgggcgt gagctatcac ttcgagaagg agatcgagga gctgctccat 660 cagatgttcg acgcccactc gaagcatctg gacgacatcc aggagttcga cctcttcacg 720 ctgggcatct acttccgcat cctgcggcag catggctata agatctcgtg cgacgtcttc 780 aacaagctga aggacagcaa cggcgagttc aaggacgagc tcaaggacga cgtcaacggc 840 atgctgtcgt tctatgaggc cacccatgtg cgcacccatg gcgagaacat cctcgacgag 900 gcgctgatct acacgaaggc ccagctggag tcgatggcgg ccgcctcgct cagcccgttc 960 ctggccaacc aggtgaagca cgcgctcatg caggccctgc ataagggcat cccgcgcatc 1020 gaggcgcgga actacatctc ggtctatgag gaagacccga acaagaacga cctgctcctg 1080 cgcttcagca agatcgactt caacctggtg cagatgatcc acaagcagga gctgtgcgac 1140 accttccggt ggtggaagga cctggagttc gagtcgaagc tgtcgttcgc ccgcaaccgg 1200 gtggtggagg cctacctctg gacgctgtcg gcgtactatg agccgaagta ttcgagcgcc 1260 cgcatcatcc tcgtgaagct gatggtcatc atctcggtga ccgacgacac gtacgacgcc 1320 tatggcaccc tggacgagct ccagctgttc acggacgcga tccagcgcct cgacatgtcg 1380 agcatcaacc agctgcccga ctacatgaag accatctata aggcgctcct ggacctcttc 1440 gacgagatcg aggaccgcct gtcgaagcac gagacggacc atagctaccg ggtggcgtat 1500 gccaagtacg tctataagga gatcgtgcgc tgctacgaca tggagtataa gtggttcaac 1560 aagaactacg tccccgcctt cgaggagtat atgcagaagg ccctggtgac ctcgggcaac 1620 cggctcctga tcacgttcag cttcctgggc atggacgagg tcgcgaccat ccaggccttc 1680 gagtgggtga agtcgaacgc caagatgatc gtgtcgtcga acaaggtgct ccgcctgatc 1740 gacgacatca tgtcgcacga ggaagaggac gagcgcggcc atgtggccac gggcatcgag 1800 tgcttcgtga aggagcacgg cctgacccgc gaggaagtga tcgtcgagtt ccataagcgg 1860 atcgacgacg cgtggaagga catcaacgag gagttcatca ccccgaacaa cctgccgatc 1920 gagatcctga cccgcgtgct caacctgacc cggatcggcg acgtggtcta caagtatgac 1980 gacggctaca cgcaccccga gaaggccctc aaggaccata tcatcagcct gttcgtggac 2040 cccgtcagca tctga 2055 <210> 19 <211> 655 <212> PRT <213> Artificial Sequence <220> <223> SUMO-NjPAT Aminoacid sequence <400> 19 Met Ser Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro 1 5 10 15 Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser 20 25 30 Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu 35 40 45 Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Arg 50 55 60 Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu Asp 65 70 75 80 Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile 85 90 95 Gly Met Ser Ile Ile Ile Ala Thr Asn Ser Thr Glu His Pro Ile Phe 100 105 110 Arg Pro Leu Ala Asn Phe Pro Pro Ser Leu Trp Gly Asn Leu Phe Thr 115 120 125 Ser Phe Ser Met Asp Asn Gln Ala Arg Glu Ile Tyr Ala Lys Glu His 130 135 140 Glu Gly Leu Lys Glu Lys Val Arg Met Met Phe Leu Asp Thr Thr Asn 145 150 155 160 Tyr Lys Ile Ser Glu Lys Ile Asn Phe Ile Asn Thr Val Glu Arg Leu 165 170 175 Gly Val Ser Tyr His Phe Glu Lys Glu Ile Glu Glu Leu Leu His Gln 180 185 190 Met Phe Asp Ala His Ser Lys His Leu Asp Asp Ile Gln Glu Phe Asp 195 200 205 Leu Phe Thr Leu Gly Ile Tyr Phe Arg Ile Leu Arg Gln His Gly Tyr 210 215 220 Lys Ile Ser Cys Asp Val Phe Asn Lys Leu Lys Asp Ser Asn Gly Glu 225 230 235 240 Phe Lys Asp Glu Leu Lys Asp Asp Val Asn Gly Met Leu Ser Phe Tyr 245 250 255 Glu Ala Thr His Val Arg Thr His Gly Glu Asn Ile Leu Asp Glu Ala 260 265 270 Leu Ile Tyr Thr Lys Ala Gln Leu Glu Ser Met Ala Ala Ala Ser Leu 275 280 285 Ser Pro Phe Leu Ala Asn Gln Val Lys His Ala Leu Met Gln Ala Leu 290 295 300 His Lys Gly Ile Pro Arg Ile Glu Ala Arg Asn Tyr Ile Ser Val Tyr 305 310 315 320 Glu Glu Asp Pro Asn Lys Asn Asp Leu Leu Leu Arg Phe Ser Lys Ile 325 330 335 Asp Phe Asn Leu Val Gln Met Ile His Lys Gln Glu Leu Cys Asp Thr 340 345 350 Phe Arg Trp Trp Lys Asp Leu Glu Phe Glu Ser Lys Leu Ser Phe Ala 355 360 365 Arg Asn Arg Val Val Glu Ala Tyr Leu Trp Thr Leu Ser Ala Tyr Tyr 370 375 380 Glu Pro Lys Tyr Ser Ser Ala Arg Ile Ile Leu Val Lys Leu Met Val 385 390 395 400 Ile Ile Ser Val Thr Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Leu Asp 405 410 415 Glu Leu Gln Leu Phe Thr Asp Ala Ile Gln Arg Leu Asp Met Ser Ser 420 425 430 Ile Asn Gln Leu Pro Asp Tyr Met Lys Thr Ile Tyr Lys Ala Leu Leu 435 440 445 Asp Leu Phe Asp Glu Ile Glu Asp Arg Leu Ser Lys His Glu Thr Asp 450 455 460 His Ser Tyr Arg Val Ala Tyr Ala Lys Tyr Val Tyr Lys Glu Ile Val 465 470 475 480 Arg Cys Tyr Asp Met Glu Tyr Lys Trp Phe Asn Lys Asn Tyr Val Pro 485 490 495 Ala Phe Glu Glu Tyr Met Gln Lys Ala Leu Val Thr Ser Gly Asn Arg 500 505 510 Leu Leu Ile Thr Phe Ser Phe Leu Gly Met Asp Glu Val Ala Thr Ile 515 520 525 Gln Ala Phe Glu Trp Val Lys Ser Asn Ala Lys Met Ile Val Ser Ser 530 535 540 Asn Lys Val Leu Arg Leu Ile Asp Asp Ile Met Ser His Glu Glu Glu 545 550 555 560 Asp Glu Arg Gly His Val Ala Thr Gly Ile Glu Cys Phe Val Lys Glu 565 570 575 His Gly Leu Thr Arg Glu Glu Val Ile Val Glu Phe His Lys Arg Ile 580 585 590 Asp Asp Ala Trp Lys Asp Ile Asn Glu Glu Phe Ile Thr Pro Asn Asn 595 600 605 Leu Pro Ile Glu Ile Leu Thr Arg Val Leu Asn Leu Thr Arg Ile Gly 610 615 620 Asp Val Val Tyr Lys Tyr Asp Asp Gly Tyr Thr His Pro Glu Lys Ala 625 630 635 640 Leu Lys Asp His Ile Ile Ser Leu Phe Val Asp Pro Val Ser Ile 645 650 655 <210> 20 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> NusA_NjPAT_Rv Nucleotide sequence <400> 20 tgatcgacat cgcctcgtcg ccgaac 26 <210> 21 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> NusA_NjPAT_Fw Nucleotide sequence <400> 21 cgaggcgatg tcgatcatca tcgcc 25 <210> 22 <211> 3249 <212> DNA <213> Artificial Sequence <220> <223> SPppa-NusA-NjPAT Nucleotide sequence <400> 22 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg aacaaggaga tcctcgcggt ggtggaggcg 120 gtgtcgaacg agaaggcgct gccccgcgag aagatcttcg aggccctgga gtcggccctg 180 gccaccgcga ccaagaagaa gtacgagcag gagatcgacg tgcgcgtgca gatcgaccgc 240 aagtcgggcg acttcgacac gttccgccgc tggctcgtgg tggacgaggt gacccagccc 300 acgaaggaga tcaccctgga ggcggcccgc tatgaggacg agtcgctgaa cctcggcgac 360 tatgtggagg accagatcga gtcggtgacc ttcgaccgca tcaccacgca gacggcgaag 420 caggtgatcg tgcagaaggt gcgcgaggcc gagcgcgcca tggtggtgga ccagttccgc 480 gagcacgagg gcgagatcat caccggcgtg gtgaagaagg tgaaccgcga caacatctcg 540 ctggacctgg gcaacaacgc ggaggccgtg atcctgcgcg aggacatgct cccgcgcgag 600 aacttccgcc cgggcgaccg cgtgcgcggc gtgctctatt cggtgcgccc cgaggcccgt 660 ggcgcccagc tgttcgtgac ccgctcgaag ccggagatgc tgatcgagct cttccgcatc 720 gaggtgcccg agatcggcga ggaagtgatc gagatcaagg cggccgcccg cgacccgggc 780 tcgcgcgcga agatcgccgt gaagaccaac gacaagcgca tcgaccccgt gggcgcctgc 840 gtgggcatgc gtggcgcccg cgtgcaggcc gtgtcgaccg agctcggcgg cgagcgcatc 900 gacatcgtgc tgtgggacga caacccggcg cagttcgtga tcaacgccat ggccccggcg 960 gacgtggcct cgatcgtggt ggacgaggac aagcatacca tggacatcgc cgtggaggcg 1020 ggcaacctgg cccaggccat cggccgcaac ggccagaacg tgcgcctggc ctcgcagctc 1080 tcgggctggg agctgaacgt gatgacggtg gacgacctgc aggccaagca tcaggccgag 1140 gcccatgccg ccatcgacac cttcacgaag tacctcgaca tcgacgagga cttcgcgacc 1200 gtgctcgtgg aggaaggctt ctcgacgctg gaggagctcg cctatgtgcc gatgaaggag 1260 ctgctcgaga tcgagggcct ggacgagccg acggtggagg cgctccgcga gcgcgccaag 1320 aacgccctgg ccaccatcgc ccaggcccag gaagagtcgc tgggcgacaa caagccggcc 1380 gacgacctgc tcaacctgga gggcgtggac cgcgacctgg ccttcaagct cgccgcccgc 1440 ggcgtgtgca cgctcgagga cctggccgag cagggcatcg acgacctggc cgacatcgag 1500 ggcctcaccg acgagaaggc cggcgccctg atcatggccg cccgcaacat ctgctggttc 1560 ggcgacgagg cgatgtcgat catcatcgcc accaacagca ccgagcatcc catcttccgc 1620 ccgctcgcca acttcccgcc gtcgctctgg ggcaacctgt tcacctcgtt cagcatggac 1680 aaccaggcgc gcgagatcta cgccaaggag cacgagggcc tcaaggagaa ggtccggatg 1740 atgttcctgg acaccacgaa ctacaagatc tcggagaaga tcaacttcat caacaccgtc 1800 gagcgcctgg gcgtgagcta tcacttcgag aaggagatcg aggagctgct ccatcagatg 1860 ttcgacgccc actcgaagca tctggacgac atccaggagt tcgacctctt cacgctgggc 1920 atctacttcc gcatcctgcg gcagcatggc tataagatct cgtgcgacgt cttcaacaag 1980 ctgaaggaca gcaacggcga gttcaaggac gagctcaagg acgacgtcaa cggcatgctg 2040 tcgttctatg aggccaccca tgtgcgcacc catggcgaga acatcctcga cgaggcgctg 2100 atctacacga aggcccagct ggagtcgatg gcggccgcct cgctcagccc gttcctggcc 2160 aaccaggtga agcacgcgct catgcaggcc ctgcataagg gcatcccgcg catcgaggcg 2220 cggaactaca tctcggtcta tgaggaagac ccgaacaaga acgacctgct cctgcgcttc 2280 agcaagatcg acttcaacct ggtgcagatg atccacaagc aggagctgtg cgacaccttc 2340 cggtggtgga aggacctgga gttcgagtcg aagctgtcgt tcgcccgcaa ccgggtggtg 2400 gaggcctacc tctggacgct gtcggcgtac tatgagccga agtattcgag cgcccgcatc 2460 atcctcgtga agctgatggt catcatctcg gtgaccgacg acacgtacga cgcctatggc 2520 accctggacg agctccagct gttcacggac gcgatccagc gcctcgacat gtcgagcatc 2580 aaccagctgc ccgactacat gaagaccatc tataaggcgc tcctggacct cttcgacgag 2640 atcgaggacc gcctgtcgaa gcacgagacg gaccatagct accgggtggc gtatgccaag 2700 tacgtctata aggagatcgt gcgctgctac gacatggagt ataagtggtt caacaagaac 2760 tacgtccccg ccttcgagga gtatatgcag aaggccctgg tgacctcggg caaccggctc 2820 ctgatcacgt tcagcttcct gggcatggac gaggtcgcga ccatccaggc cttcgagtgg 2880 gtgaagtcga acgccaagat gatcgtgtcg tcgaacaagg tgctccgcct gatcgacgac 2940 atcatgtcgc acgaggaaga ggacgagcgc ggccatgtgg ccacgggcat cgagtgcttc 3000 gtgaaggagc acggcctgac ccgcgaggaa gtgatcgtcg agttccataa gcggatcgac 3060 gacgcgtgga aggacatcaa cgaggagttc atcaccccga acaacctgcc gatcgagatc 3120 ctgacccgcg tgctcaacct gacccggatc ggcgacgtgg tctacaagta tgacgacggc 3180 tacacgcacc ccgagaaggc cctcaaggac catatcatca gcctgttcgt ggaccccgtc 3240 agcatctga 3249 <210> 23 <211> 1053 <212> PRT <213> Artificial Sequence <220> <223> NusA-NjPAT Aminoacid sequence <400> 23 Met Asn Lys Glu Ile Leu Ala Val Val Glu Ala Val Ser Asn Glu Lys 1 5 10 15 Ala Leu Pro Arg Glu Lys Ile Phe Glu Ala Leu Glu Ser Ala Leu Ala 20 25 30 Thr Ala Thr Lys Lys Lys Tyr Glu Gln Glu Ile Asp Val Arg Val Gln 35 40 45 Ile Asp Arg Lys Ser Gly Asp Phe Asp Thr Phe Arg Arg Trp Leu Val 50 55 60 Val Asp Glu Val Thr Gln Pro Thr Lys Glu Ile Thr Leu Glu Ala Ala 65 70 75 80 Arg Tyr Glu Asp Glu Ser Leu Asn Leu Gly Asp Tyr Val Glu Asp Gln 85 90 95 Ile Glu Ser Val Thr Phe Asp Arg Ile Thr Thr Gln Thr Ala Lys Gln 100 105 110 Val Ile Val Gln Lys Val Arg Glu Ala Glu Arg Ala Met Val Val Asp 115 120 125 Gln Phe Arg Glu His Glu Gly Glu Ile Ile Thr Gly Val Val Lys Lys 130 135 140 Val Asn Arg Asp Asn Ile Ser Leu Asp Leu Gly Asn Asn Ala Glu Ala 145 150 155 160 Val Ile Leu Arg Glu Asp Met Leu Pro Arg Glu Asn Phe Arg Pro Gly 165 170 175 Asp Arg Val Arg Gly Val Leu Tyr Ser Val Arg Pro Glu Ala Arg Gly 180 185 190 Ala Gln Leu Phe Val Thr Arg Ser Lys Pro Glu Met Leu Ile Glu Leu 195 200 205 Phe Arg Ile Glu Val Pro Glu Ile Gly Glu Glu Val Ile Glu Ile Lys 210 215 220 Ala Ala Ala Arg Asp Pro Gly Ser Arg Ala Lys Ile Ala Val Lys Thr 225 230 235 240 Asn Asp Lys Arg Ile Asp Pro Val Gly Ala Cys Val Gly Met Arg Gly 245 250 255 Ala Arg Val Gln Ala Val Ser Thr Glu Leu Gly Gly Glu Arg Ile Asp 260 265 270 Ile Val Leu Trp Asp Asp Asn Pro Ala Gln Phe Val Ile Asn Ala Met 275 280 285 Ala Pro Ala Asp Val Ala Ser Ile Val Val Asp Glu Asp Lys His Thr 290 295 300 Met Asp Ile Ala Val Glu Ala Gly Asn Leu Ala Gln Ala Ile Gly Arg 305 310 315 320 Asn Gly Gln Asn Val Arg Leu Ala Ser Gln Leu Ser Gly Trp Glu Leu 325 330 335 Asn Val Met Thr Val Asp Asp Leu Gln Ala Lys His Gln Ala Glu Ala 340 345 350 His Ala Ala Ile Asp Thr Phe Thr Lys Tyr Leu Asp Ile Asp Glu Asp 355 360 365 Phe Ala Thr Val Leu Val Glu Glu Gly Phe Ser Thr Leu Glu Glu Leu 370 375 380 Ala Tyr Val Pro Met Lys Glu Leu Leu Glu Ile Glu Gly Leu Asp Glu 385 390 395 400 Pro Thr Val Glu Ala Leu Arg Glu Arg Ala Lys Asn Ala Leu Ala Thr 405 410 415 Ile Ala Gln Ala Gln Glu Glu Ser Leu Gly Asp Asn Lys Pro Ala Asp 420 425 430 Asp Leu Leu Asn Leu Glu Gly Val Asp Arg Asp Leu Ala Phe Lys Leu 435 440 445 Ala Ala Arg Gly Val Cys Thr Leu Glu Asp Leu Ala Glu Gln Gly Ile 450 455 460 Asp Asp Leu Ala Asp Ile Glu Gly Leu Thr Asp Glu Lys Ala Gly Ala 465 470 475 480 Leu Ile Met Ala Ala Arg Asn Ile Cys Trp Phe Gly Asp Glu Ala Met 485 490 495 Ser Ile Ile Ile Ala Thr Asn Ser Thr Glu His Pro Ile Phe Arg Pro 500 505 510 Leu Ala Asn Phe Pro Pro Ser Leu Trp Gly Asn Leu Phe Thr Ser Phe 515 520 525 Ser Met Asp Asn Gln Ala Arg Glu Ile Tyr Ala Lys Glu His Glu Gly 530 535 540 Leu Lys Glu Lys Val Arg Met Met Phe Leu Asp Thr Thr Asn Tyr Lys 545 550 555 560 Ile Ser Glu Lys Ile Asn Phe Ile Asn Thr Val Glu Arg Leu Gly Val 565 570 575 Ser Tyr His Phe Glu Lys Glu Ile Glu Glu Leu Leu His Gln Met Phe 580 585 590 Asp Ala His Ser Lys His Leu Asp Asp Ile Gln Glu Phe Asp Leu Phe 595 600 605 Thr Leu Gly Ile Tyr Phe Arg Ile Leu Arg Gln His Gly Tyr Lys Ile 610 615 620 Ser Cys Asp Val Phe Asn Lys Leu Lys Asp Ser Asn Gly Glu Phe Lys 625 630 635 640 Asp Glu Leu Lys Asp Asp Val Asn Gly Met Leu Ser Phe Tyr Glu Ala 645 650 655 Thr His Val Arg Thr His Gly Glu Asn Ile Leu Asp Glu Ala Leu Ile 660 665 670 Tyr Thr Lys Ala Gln Leu Glu Ser Met Ala Ala Ala Ser Leu Ser Pro 675 680 685 Phe Leu Ala Asn Gln Val Lys His Ala Leu Met Gln Ala Leu His Lys 690 695 700 Gly Ile Pro Arg Ile Glu Ala Arg Asn Tyr Ile Ser Val Tyr Glu Glu 705 710 715 720 Asp Pro Asn Lys Asn Asp Leu Leu Leu Arg Phe Ser Lys Ile Asp Phe 725 730 735 Asn Leu Val Gln Met Ile His Lys Gln Glu Leu Cys Asp Thr Phe Arg 740 745 750 Trp Trp Lys Asp Leu Glu Phe Glu Ser Lys Leu Ser Phe Ala Arg Asn 755 760 765 Arg Val Val Glu Ala Tyr Leu Trp Thr Leu Ser Ala Tyr Tyr Glu Pro 770 775 780 Lys Tyr Ser Ser Ala Arg Ile Ile Leu Val Lys Leu Met Val Ile Ile 785 790 795 800 Ser Val Thr Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Leu Asp Glu Leu 805 810 815 Gln Leu Phe Thr Asp Ala Ile Gln Arg Leu Asp Met Ser Ser Ile Asn 820 825 830 Gln Leu Pro Asp Tyr Met Lys Thr Ile Tyr Lys Ala Leu Leu Asp Leu 835 840 845 Phe Asp Glu Ile Glu Asp Arg Leu Ser Lys His Glu Thr Asp His Ser 850 855 860 Tyr Arg Val Ala Tyr Ala Lys Tyr Val Tyr Lys Glu Ile Val Arg Cys 865 870 875 880 Tyr Asp Met Glu Tyr Lys Trp Phe Asn Lys Asn Tyr Val Pro Ala Phe 885 890 895 Glu Glu Tyr Met Gln Lys Ala Leu Val Thr Ser Gly Asn Arg Leu Leu 900 905 910 Ile Thr Phe Ser Phe Leu Gly Met Asp Glu Val Ala Thr Ile Gln Ala 915 920 925 Phe Glu Trp Val Lys Ser Asn Ala Lys Met Ile Val Ser Ser Asn Lys 930 935 940 Val Leu Arg Leu Ile Asp Asp Ile Met Ser His Glu Glu Glu Asp Glu 945 950 955 960 Arg Gly His Val Ala Thr Gly Ile Glu Cys Phe Val Lys Glu His Gly 965 970 975 Leu Thr Arg Glu Glu Val Ile Val Glu Phe His Lys Arg Ile Asp Asp 980 985 990 Ala Trp Lys Asp Ile Asn Glu Glu Phe Ile Thr Pro Asn Asn Leu Pro 995 1000 1005 Ile Glu Ile Leu Thr Arg Val Leu Asn Leu Thr Arg Ile Gly Asp Val 1010 1015 1020 Val Tyr Lys Tyr Asp Asp Gly Tyr Thr His Pro Glu Lys Ala Leu Lys 1025 1030 1035 1040 Asp His Ile Ile Ser Leu Phe Val Asp Pro Val Ser Ile 1045 1050 <210> 24 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> RsTRX_NjPAT_Rv Nucleotide sequence <400> 24 tgatcgacat gagcgccgag gcgatc 26 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> RsTRX_NjPAT_Fw Nucleotide sequence <400> 25 ggcgctcatg tcgatcatca tcgcc 25 <210> 26 <211> 2082 <212> DNA <213> Artificial Sequence <220> <223> SPppa-RsTRX-NjPAT Nucleotide sequence <400> 26 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg tccaccgttc ccgtgacgga cgccaccttc 120 gacaccgagg tgcgcaagtc cgacgtgccc gtcgtcgtcg atttctgggc cgaatggtgc 180 ggcccctgcc ggcagatcgg cccggcgctc gaggagctct cgaaggaata tgccggcaag 240 gtgaagatcg tgaaggtcaa tgtcgacgag aaccccgaga gcccggcgat gctgggcgtt 300 cgcggcatcc cggcgctgtt cctgttcaag aacggtcagg tcgtgtcgaa caaggtcggc 360 gctgcgccga aggccgcgct ggccacctgg atcgcctcgg cgctcatgtc gatcatcatc 420 gccaccaaca gcaccgagca tcccatcttc cgcccgctcg ccaacttccc gccgtcgctc 480 tggggcaacc tgttcacctc gttcagcatg gacaaccagg cgcgcgagat ctacgccaag 540 gagcacgagg gcctcaagga gaaggtccgg atgatgttcc tggacaccac gaactacaag 600 atctcggaga agatcaactt catcaacacc gtcgagcgcc tgggcgtgag ctatcacttc 660 gagaaggaga tcgaggagct gctccatcag atgttcgacg cccactcgaa gcatctggac 720 gacatccagg agttcgacct cttcacgctg ggcatctact tccgcatcct gcggcagcat 780 ggctataaga tctcgtgcga cgtcttcaac aagctgaagg acagcaacgg cgagttcaag 840 gacgagctca aggacgacgt caacggcatg ctgtcgttct atgaggccac ccatgtgcgc 900 acccatggcg agaacatcct cgacgaggcg ctgatctaca cgaaggccca gctggagtcg 960 atggcggccg cctcgctcag cccgttcctg gccaaccagg tgaagcacgc gctcatgcag 1020 gccctgcata agggcatccc gcgcatcgag gcgcggaact acatctcggt ctatgaggaa 1080 gacccgaaca agaacgacct gctcctgcgc ttcagcaaga tcgacttcaa cctggtgcag 1140 atgatccaca agcaggagct gtgcgacacc ttccggtggt ggaaggacct ggagttcgag 1200 tcgaagctgt cgttcgcccg caaccgggtg gtggaggcct acctctggac gctgtcggcg 1260 tactatgagc cgaagtattc gagcgcccgc atcatcctcg tgaagctgat ggtcatcatc 1320 tcggtgaccg acgacacgta cgacgcctat ggcaccctgg acgagctcca gctgttcacg 1380 gacgcgatcc agcgcctcga catgtcgagc atcaaccagc tgcccgacta catgaagacc 1440 atctataagg cgctcctgga cctcttcgac gagatcgagg accgcctgtc gaagcacgag 1500 acggaccata gctaccgggt ggcgtatgcc aagtacgtct ataaggagat cgtgcgctgc 1560 tacgacatgg agtataagtg gttcaacaag aactacgtcc ccgccttcga ggagtatatg 1620 cagaaggccc tggtgacctc gggcaaccgg ctcctgatca cgttcagctt cctgggcatg 1680 gacgaggtcg cgaccatcca ggccttcgag tgggtgaagt cgaacgccaa gatgatcgtg 1740 tcgtcgaaca aggtgctccg cctgatcgac gacatcatgt cgcacgagga agaggacgag 1800 cgcggccatg tggccacggg catcgagtgc ttcgtgaagg agcacggcct gacccgcgag 1860 gaagtgatcg tcgagttcca taagcggatc gacgacgcgt ggaaggacat caacgaggag 1920 ttcatcaccc cgaacaacct gccgatcgag atcctgaccc gcgtgctcaa cctgacccgg 1980 atcggcgacg tggtctacaa gtatgacgac ggctacacgc accccgagaa ggccctcaag 2040 gaccatatca tcagcctgtt cgtggacccc gtcagcatct ga 2082 <210> 27 <211> 664 <212> PRT <213> Artificial Sequence <220> <223> RsTRX-NjPAT Aminoacid sequence <400> 27 Met Ser Thr Val Pro Val Thr Asp Ala Thr Phe Asp Thr Glu Val Arg 1 5 10 15 Lys Ser Asp Val Pro Val Val Val Asp Phe Trp Ala Glu Trp Cys Gly 20 25 30 Pro Cys Arg Gln Ile Gly Pro Ala Leu Glu Glu Leu Ser Lys Glu Tyr 35 40 45 Ala Gly Lys Val Lys Ile Val Lys Val Asn Val Asp Glu Asn Pro Glu 50 55 60 Ser Pro Ala Met Leu Gly Val Arg Gly Ile Pro Ala Leu Phe Leu Phe 65 70 75 80 Lys Asn Gly Gln Val Val Ser Asn Lys Val Gly Ala Ala Pro Lys Ala 85 90 95 Ala Leu Ala Thr Trp Ile Ala Ser Ala Leu Met Ser Ile Ile Ile Ala 100 105 110 Thr Asn Ser Thr Glu His Pro Ile Phe Arg Pro Leu Ala Asn Phe Pro 115 120 125 Pro Ser Leu Trp Gly Asn Leu Phe Thr Ser Phe Ser Met Asp Asn Gln 130 135 140 Ala Arg Glu Ile Tyr Ala Lys Glu His Glu Gly Leu Lys Glu Lys Val 145 150 155 160 Arg Met Met Phe Leu Asp Thr Thr Asn Tyr Lys Ile Ser Glu Lys Ile 165 170 175 Asn Phe Ile Asn Thr Val Glu Arg Leu Gly Val Ser Tyr His Phe Glu 180 185 190 Lys Glu Ile Glu Glu Leu Leu His Gln Met Phe Asp Ala His Ser Lys 195 200 205 His Leu Asp Asp Ile Gln Glu Phe Asp Leu Phe Thr Leu Gly Ile Tyr 210 215 220 Phe Arg Ile Leu Arg Gln His Gly Tyr Lys Ile Ser Cys Asp Val Phe 225 230 235 240 Asn Lys Leu Lys Asp Ser Asn Gly Glu Phe Lys Asp Glu Leu Lys Asp 245 250 255 Asp Val Asn Gly Met Leu Ser Phe Tyr Glu Ala Thr His Val Arg Thr 260 265 270 His Gly Glu Asn Ile Leu Asp Glu Ala Leu Ile Tyr Thr Lys Ala Gln 275 280 285 Leu Glu Ser Met Ala Ala Ala Ser Leu Ser Pro Phe Leu Ala Asn Gln 290 295 300 Val Lys His Ala Leu Met Gln Ala Leu His Lys Gly Ile Pro Arg Ile 305 310 315 320 Glu Ala Arg Asn Tyr Ile Ser Val Tyr Glu Glu Asp Pro Asn Lys Asn 325 330 335 Asp Leu Leu Leu Arg Phe Ser Lys Ile Asp Phe Asn Leu Val Gln Met 340 345 350 Ile His Lys Gln Glu Leu Cys Asp Thr Phe Arg Trp Trp Lys Asp Leu 355 360 365 Glu Phe Glu Ser Lys Leu Ser Phe Ala Arg Asn Arg Val Val Glu Ala 370 375 380 Tyr Leu Trp Thr Leu Ser Ala Tyr Tyr Glu Pro Lys Tyr Ser Ser Ala 385 390 395 400 Arg Ile Ile Leu Val Lys Leu Met Val Ile Ile Ser Val Thr Asp Asp 405 410 415 Thr Tyr Asp Ala Tyr Gly Thr Leu Asp Glu Leu Gln Leu Phe Thr Asp 420 425 430 Ala Ile Gln Arg Leu Asp Met Ser Ser Ile Asn Gln Leu Pro Asp Tyr 435 440 445 Met Lys Thr Ile Tyr Lys Ala Leu Leu Asp Leu Phe Asp Glu Ile Glu 450 455 460 Asp Arg Leu Ser Lys His Glu Thr Asp His Ser Tyr Arg Val Ala Tyr 465 470 475 480 Ala Lys Tyr Val Tyr Lys Glu Ile Val Arg Cys Tyr Asp Met Glu Tyr 485 490 495 Lys Trp Phe Asn Lys Asn Tyr Val Pro Ala Phe Glu Glu Tyr Met Gln 500 505 510 Lys Ala Leu Val Thr Ser Gly Asn Arg Leu Leu Ile Thr Phe Ser Phe 515 520 525 Leu Gly Met Asp Glu Val Ala Thr Ile Gln Ala Phe Glu Trp Val Lys 530 535 540 Ser Asn Ala Lys Met Ile Val Ser Ser Asn Lys Val Leu Arg Leu Ile 545 550 555 560 Asp Asp Ile Met Ser His Glu Glu Glu Asp Glu Arg Gly His Val Ala 565 570 575 Thr Gly Ile Glu Cys Phe Val Lys Glu His Gly Leu Thr Arg Glu Glu 580 585 590 Val Ile Val Glu Phe His Lys Arg Ile Asp Asp Ala Trp Lys Asp Ile 595 600 605 Asn Glu Glu Phe Ile Thr Pro Asn Asn Leu Pro Ile Glu Ile Leu Thr 610 615 620 Arg Val Leu Asn Leu Thr Arg Ile Gly Asp Val Val Tyr Lys Tyr Asp 625 630 635 640 Asp Gly Tyr Thr His Pro Glu Lys Ala Leu Lys Asp His Ile Ile Ser 645 650 655 Leu Phe Val Asp Pro Val Ser Ile 660 <210> 28 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> GST_NjPAT_Rv Nucleotide sequence <400> 28 atcgacatct tgggcggatg g 21 <210> 29 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> GST_NjPAT_Fw Nucleotide sequence <400> 29 gcccaagatg tcgatcatca tcgcc 25 <210> 30 <211> 2418 <212> DNA <213> Artificial Sequence <220> <223> SPppa-GST-NjPAT Nucleotide sequence <400> 30 aaatttattt gctttgtgag cggataacaa ttattagatt caccggcgag ccagcaggaa 60 tttcactcta gatgacagga gggacatatg tcgccgatcc tgggctattg gaagatcaag 120 ggcctcgtgc agcccacccg cctgctcctg gagtacctgg aggagaagta tgaggagcac 180 ctctacgagc gcgacgaggg cgacaagtgg cgcaacaaga agttcgagct cggcctggag 240 ttcccgaacc tgccctacta tatcgacggc gacgtgaagc tcacgcagtc gatggccatc 300 atccgctaca tcgcggacaa gcataacatg ctgggcggct gccccaagga gcgcgcggag 360 atctcgatgc tggagggcgc ggtgctcgac atccgctatg gcgtgtcgcg catcgcctac 420 tcgaaggact tcgagaccct gaaggtggac ttcctctcga agctgccgga gatgctcaag 480 atgttcgagg accgcctgtg ccacaagacc tatctcaacg gcgaccacgt gacgcatccc 540 gacttcatgc tctatgacgc gctggacgtg gtgctctaca tggacccgat gtgcctggac 600 gccttcccca agctcgtgtg cttcaagaag cgcatcgagg cgatcccgca gatcgacaag 660 tatctgaagt cgtcgaagta catcgcctgg cccctccagg gctggcaggc gacgttcggc 720 ggcggcgacc atccgcccaa gatgtcgatc atcatcgcca ccaacagcac cgagcatccc 780 atcttccgcc cgctcgccaa cttcccgccg tcgctctggg gcaacctgtt cacctcgttc 840 agcatggaca accaggcgcg cgagatctac gccaaggagc acgagggcct caaggagaag 900 gtccggatga tgttcctgga caccacgaac tacaagatct cggagaagat caacttcatc 960 aacaccgtcg agcgcctggg cgtgagctat cacttcgaga aggagatcga ggagctgctc 1020 catcagatgt tcgacgccca ctcgaagcat ctggacgaca tccaggagtt cgacctcttc 1080 acgctgggca tctacttccg catcctgcgg cagcatggct ataagatctc gtgcgacgtc 1140 ttcaacaagc tgaaggacag caacggcgag ttcaaggacg agctcaagga cgacgtcaac 1200 ggcatgctgt cgttctatga ggccacccat gtgcgcaccc atggcgagaa catcctcgac 1260 gaggcgctga tctacacgaa ggcccagctg gagtcgatgg cggccgcctc gctcagcccg 1320 ttcctggcca accaggtgaa gcacgcgctc atgcaggccc tgcataaggg catcccgcgc 1380 atcgaggcgc ggaactacat ctcggtctat gaggaagacc cgaacaagaa cgacctgctc 1440 ctgcgcttca gcaagatcga cttcaacctg gtgcagatga tccacaagca ggagctgtgc 1500 gacaccttcc ggtggtggaa ggacctggag ttcgagtcga agctgtcgtt cgcccgcaac 1560 cgggtggtgg aggcctacct ctggacgctg tcggcgtact atgagccgaa gtattcgagc 1620 gcccgcatca tcctcgtgaa gctgatggtc atcatctcgg tgaccgacga cacgtacgac 1680 gcctatggca ccctggacga gctccagctg ttcacggacg cgatccagcg cctcgacatg 1740 tcgagcatca accagctgcc cgactacatg aagaccatct ataaggcgct cctggacctc 1800 ttcgacgaga tcgaggaccg cctgtcgaag cacgagacgg accatagcta ccgggtggcg 1860 tatgccaagt acgtctataa ggagatcgtg cgctgctacg acatggagta taagtggttc 1920 aacaagaact acgtccccgc cttcgaggag tatatgcaga aggccctggt gacctcgggc 1980 aaccggctcc tgatcacgtt cagcttcctg ggcatggacg aggtcgcgac catccaggcc 2040 ttcgagtggg tgaagtcgaa cgccaagatg atcgtgtcgt cgaacaaggt gctccgcctg 2100 atcgacgaca tcatgtcgca cgaggaagag gacgagcgcg gccatgtggc cacgggcatc 2160 gagtgcttcg tgaaggagca cggcctgacc cgcgaggaag tgatcgtcga gttccataag 2220 cggatcgacg acgcgtggaa ggacatcaac gaggagttca tcaccccgaa caacctgccg 2280 atcgagatcc tgacccgcgt gctcaacctg acccggatcg gcgacgtggt ctacaagtat 2340 gacgacggct acacgcaccc cgagaaggcc ctcaaggacc atatcatcag cctgttcgtg 2400 gaccccgtca gcatctga 2418 <210> 31 <211> 776 <212> PRT <213> Artificial Sequence <220> <223> GST-NjPAT Aminoacid sequence <400> 31 Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro 1 5 10 15 Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 20 25 30 Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 35 40 45 Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys 50 55 60 Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn 65 70 75 80 Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu 85 90 95 Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser 100 105 110 Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 115 120 125 Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 130 135 140 Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 145 150 155 160 Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 165 170 175 Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr 180 185 190 Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala 195 200 205 Thr Phe Gly Gly Gly Asp His Pro Pro Lys Met Ser Ile Ile Ile Ala 210 215 220 Thr Asn Ser Thr Glu His Pro Ile Phe Arg Pro Leu Ala Asn Phe Pro 225 230 235 240 Pro Ser Leu Trp Gly Asn Leu Phe Thr Ser Phe Ser Met Asp Asn Gln 245 250 255 Ala Arg Glu Ile Tyr Ala Lys Glu His Glu Gly Leu Lys Glu Lys Val 260 265 270 Arg Met Met Phe Leu Asp Thr Thr Asn Tyr Lys Ile Ser Glu Lys Ile 275 280 285 Asn Phe Ile Asn Thr Val Glu Arg Leu Gly Val Ser Tyr His Phe Glu 290 295 300 Lys Glu Ile Glu Glu Leu Leu His Gln Met Phe Asp Ala His Ser Lys 305 310 315 320 His Leu Asp Asp Ile Gln Glu Phe Asp Leu Phe Thr Leu Gly Ile Tyr 325 330 335 Phe Arg Ile Leu Arg Gln His Gly Tyr Lys Ile Ser Cys Asp Val Phe 340 345 350 Asn Lys Leu Lys Asp Ser Asn Gly Glu Phe Lys Asp Glu Leu Lys Asp 355 360 365 Asp Val Asn Gly Met Leu Ser Phe Tyr Glu Ala Thr His Val Arg Thr 370 375 380 His Gly Glu Asn Ile Leu Asp Glu Ala Leu Ile Tyr Thr Lys Ala Gln 385 390 395 400 Leu Glu Ser Met Ala Ala Ala Ser Leu Ser Pro Phe Leu Ala Asn Gln 405 410 415 Val Lys His Ala Leu Met Gln Ala Leu His Lys Gly Ile Pro Arg Ile 420 425 430 Glu Ala Arg Asn Tyr Ile Ser Val Tyr Glu Glu Asp Pro Asn Lys Asn 435 440 445 Asp Leu Leu Leu Arg Phe Ser Lys Ile Asp Phe Asn Leu Val Gln Met 450 455 460 Ile His Lys Gln Glu Leu Cys Asp Thr Phe Arg Trp Trp Lys Asp Leu 465 470 475 480 Glu Phe Glu Ser Lys Leu Ser Phe Ala Arg Asn Arg Val Val Glu Ala 485 490 495 Tyr Leu Trp Thr Leu Ser Ala Tyr Tyr Glu Pro Lys Tyr Ser Ser Ala 500 505 510 Arg Ile Ile Leu Val Lys Leu Met Val Ile Ile Ser Val Thr Asp Asp 515 520 525 Thr Tyr Asp Ala Tyr Gly Thr Leu Asp Glu Leu Gln Leu Phe Thr Asp 530 535 540 Ala Ile Gln Arg Leu Asp Met Ser Ser Ile Asn Gln Leu Pro Asp Tyr 545 550 555 560 Met Lys Thr Ile Tyr Lys Ala Leu Leu Asp Leu Phe Asp Glu Ile Glu 565 570 575 Asp Arg Leu Ser Lys His Glu Thr Asp His Ser Tyr Arg Val Ala Tyr 580 585 590 Ala Lys Tyr Val Tyr Lys Glu Ile Val Arg Cys Tyr Asp Met Glu Tyr 595 600 605 Lys Trp Phe Asn Lys Asn Tyr Val Pro Ala Phe Glu Glu Tyr Met Gln 610 615 620 Lys Ala Leu Val Thr Ser Gly Asn Arg Leu Leu Ile Thr Phe Ser Phe 625 630 635 640 Leu Gly Met Asp Glu Val Ala Thr Ile Gln Ala Phe Glu Trp Val Lys 645 650 655 Ser Asn Ala Lys Met Ile Val Ser Ser Asn Lys Val Leu Arg Leu Ile 660 665 670 Asp Asp Ile Met Ser His Glu Glu Glu Asp Glu Arg Gly His Val Ala 675 680 685 Thr Gly Ile Glu Cys Phe Val Lys Glu His Gly Leu Thr Arg Glu Glu 690 695 700 Val Ile Val Glu Phe His Lys Arg Ile Asp Asp Ala Trp Lys Asp Ile 705 710 715 720 Asn Glu Glu Phe Ile Thr Pro Asn Asn Leu Pro Ile Glu Ile Leu Thr 725 730 735 Arg Val Leu Asn Leu Thr Arg Ile Gly Asp Val Val Tyr Lys Tyr Asp 740 745 750 Asp Gly Tyr Thr His Pro Glu Lys Ala Leu Lys Asp His Ile Ile Ser 755 760 765 Leu Phe Val Asp Pro Val Ser Ile 770 775

Claims

서열 번호: 4 로 나타낸 아미노산 서열을 포함하는 패추롤 신타아제(patchoulol synthase), 또는 이의 기능적 동족체로서, 상기 동족체는 서열 번호: 4 와 적어도 90% 의 서열 동일성을 갖는 아미노산 서열을 포함하고,
상기 패추롤 신타아제 또는 이의 기능적 동족체는 엘레몰 및 패추롤을 생성하고, 엘레몰 대 패추롤의 비가 1:10 보다 높은, 패추롤 신타아제.
청구항 1 에 있어서, 서열 번호: 4 와 적어도 95%, 또는 적어도 98% 의 서열 동일성을 갖는, 패추롤 신타아제.
청구항 1 에 따른 패추롤 신타아제를 인코딩하는 핵산 서열 또는 이의 상보적 서열을 포함하는 핵산.
청구항 3 에 있어서, 상기 핵산은 서열 번호: 3 또는 서열 번호: 5 로 나타낸 핵산 서열, 또는 서열 번호: 3 또는 서열 번호: 5 로 나타낸 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 98% 의 서열 동일성을 갖는 핵산 서열, 또는 이들 서열 중 어느 것의 상보적 서열을 포함하는, 핵산.
청구항 3 또는 4에 따른 핵산을 포함하는 발현 벡터.
청구항 3 에 따른 이종 핵산 서열을 포함하는 발현 벡터를 포함하는, 유기체 자체 또는 다세포 유기체의 일부일 수 있는 숙주 세포.
청구항 6에 있어서, 상기 숙주 세포는 그램 음성 박테리아의 군, 또는 로도박터(Rhodobacter), 파라코쿠스(Paracoccus) 및 에스케리키아(Escherichia)의 군으로부터 선택된 박테리아 세포인, 숙주 세포.
청구항 6에 있어서, 상기 숙주 세포는 아스퍼길러스(Aspergillus), 블라케슬레아(Blakeslea), 페니실리움(Penicillium), 파피아(Phaffia) (크산토필로마이세스(Xanthophyllomyces)), 피치아(Pichia), 사카로마이세스(Saccharomyces), 및 야로위아(Yarrowia)의 군으로부터 선택된 진균 세포인, 숙주 세포.
트랜스제닉 식물 세포를 포함하는 트랜스제닉 식물로서, 상기 식물은 청구항 6 에 따른 숙주 세포를 포함하고, 여기서 상기 숙주 세포는 니코티아나 종(Nicotiana spp), 솔라눔 종(Solanum spp), 시코룸 인티부스(Cichorum intybus), 락투카 사티바(Lactuca sativa), 멘타 종(Mentha spp), 아르테미시아 아누아(Artemisia annua), 괴경 형성 식물, 유료 작물(oil crop), 액체 배양 식물, 담배 BY2 세포, 피스코미트렐라 파텐스(Physcomitrella patens), 및 나무로부터 선택된 트랜스제닉 식물의 것인, 트랜스제닉 식물.
트랜스제닉 식물 세포를 포함하는 트랜스제닉 식물의 배양물로서, 상기 식물 또는 배양물은 청구항 6 에 따른 숙주 세포를 포함하고, 여기서 상기 숙주 세포는 니코티아나 종(Nicotiana spp), 솔라눔 종(Solanum spp), 시코룸 인티부스(Cichorum intybus), 락투카 사티바(Lactuca sativa), 멘타 종(Mentha spp), 아르테미시아 아누아(Artemisia annua), 괴경 형성 식물, 유료 작물(oil crop), 액체 배양 식물, 담배 BY2 세포, 피스코미트렐라 파텐스(Physcomitrella patens), 및 나무로부터 선택된 트랜스제닉 식물의 것인, 트랜스제닉 식물 배양물.
트랜스제닉 버섯 세포를 포함하는 트랜스제닉 버섯으로서, 상기 버섯은 청구항 6 에 따른 숙주 세포를 포함하며, 여기서 상기 숙주 세포는 스키조필룸(Schizophyllum), 아가리쿠스(Agaricus) 및 플레우로티스(Pleurotis)로부터 선택되는, 트랜스제닉 버섯.
트랜스제닉 버섯 세포를 포함하는 트랜스제닉 버섯의 배양물로서, 상기 버섯 또는 배양물은 청구항 6 에 따른 숙주 세포를 포함하며, 여기서 상기 숙주 세포는 스키조필룸(Schizophyllum), 아가리쿠스(Agaricus) 및 플레우로티스(Pleurotis)로부터 선택되는, 트랜스제닉 버섯 배양물.
청구항 1 에 따른 패추롤 신타아제의 존재 하에 파르네실 디포스페이트를 패추롤 및 엘레몰(elemol) 로 전환시키는 단계를 포함하는, 패추롤 및 엘레몰의 제조 방법.
청구항 13 에 있어서, 상기 패추롤 및 엘레몰은 상기 패추롤 신타아제를 발현시키는, 청구항 6, 7 또는 8 에 따른 숙주 세포, 청구항 9 에 따른 식물, 청구항 10 에 따른 식물 배양물, 청구항 11 에 따른 버섯, 또는 청구항 12 에 따른 버섯 배양물에서 제조되는, 패추롤 및 엘레몰의 제조 방법.
청구항 13 에 있어서, 패추롤 및/또는 엘레몰을 단리하는 단계를 추가로 포함하는, 패추롤 및 엘레몰의 제조 방법.
청구항 1 에 따른 패추롤 신타아제의 존재 하에 파르네실 디포스페이트를 패추롤, 엘레몰(elemol) 및 포고스톨(pogostol)로 전환시키는 단계를 포함하는, 패추롤, 엘레몰 및 포고스톨의 제조 방법.
청구항 16 에 있어서, 상기 패추롤, 엘레몰 및 포고스톨은 상기 패추롤 신타아제를 발현시키는, 청구항 6, 7 또는 8 에 따른 숙주 세포, 청구항 9 에 따른 식물, 청구항 10 에 따른 식물 배양물, 청구항 11 에 따른 버섯, 또는 청구항 12 에 따른 버섯 배양물에서 제조되는, 패추롤, 엘레몰 및 포고스톨의 제조 방법.
청구항 16 에 있어서, 패추롤 및/또는 포고스톨 및/또는 엘레몰을 단리하는 단계를 추가로 포함하는, 패추롤, 엘레몰 및 포고스톨의 제조 방법.
청구항 16 또는 18 에 있어서, 포고스톨 대 패추롤의 비가 1:5 보다 높은, 방법.
청구항 17 에 있어서, 포고스톨 대 패추롤의 비가 1:5 보다 높은, 방법.
청구항 13, 15, 16 또는 18 에 있어서, 엘레몰 대 패추롤의 비가 1:10 보다 높은, 방법.
청구항 14 에 있어서, 엘레몰 대 패추롤의 비가 1:10 보다 높은, 방법.
청구항 17 에 있어서, 엘레몰 대 패추롤의 비가 1:10 보다 높은, 방법.
청구항 16 또는 18 에 있어서, 엘레몰 대 포고스톨의 비가 1:3 이상, 또는 1:2 이상인, 방법.
청구항 17 에 있어서, 엘레몰 대 포고스톨의 비가 1:3 이상, 또는 1:2 이상인, 방법.